您的位置:首頁>新聞 > 創業 >

使用libavcodec將mp3音頻文件解碼為pcm音頻采樣數據【[mp3float @ 0x561c1ec49940] Header missing】

2023-06-25 06:04:09    來源:博客園

一.打開和關閉輸入文件和輸出文件


(資料圖片僅供參考)

想要解決上面提到的問題,我們需要對mp3文件的格式有個大致了解,為了方便講解,我這里畫了個示意圖:

ID3V2包含了作者,作曲,專輯等信息,長度不固定,擴展了 ID3V1 的信息量。
Frame一系列的幀,個數由文件大小和幀長決定
ID3V1包含了作者,作曲,專輯等信息,長度為 128BYTE

由于av_parser_parse2()這個方法的輸入必須是只包含音頻編碼數據的“裸流”,所以,我們在讀取mp3文件的時候,必須跳過ID3V2標簽部分,從Frame開始。所以,我們就必須知道ID3V2標簽的總長度。下面,我畫了個ID3V2標簽頭的示意圖,方便講解。

File ID(3)Version(2)Flags(1)Size(4)

ID3V2標簽頭固定為10byte,其中,Size部分的值是指除ID3V2標簽頭之外數據的總長度。需要注意的是,在實際計算長度的時候,這4個字節的最高位需要舍棄,也就是說,只用到了28bit,即:0xxxxxxx0xxxxxxx0xxxxxxx0xxxxxxx

#define AUDIO_INBUF_SIZE 20480#define AUDIO_REFILL_THRESH 4096static FILE* input_file= nullptr;static FILE* output_file= nullptr;static const AVCodec* codec= nullptr;static AVCodecContext* codec_ctx= nullptr;static AVPacket* pkt= nullptr;static AVFrame* frame= nullptr;static AVCodecParserContext* parser= nullptr;static enum AVCodecID audio_codec_id;void close_input_output_files(){    if(input_file!= nullptr){        fclose(input_file);        input_file= nullptr;    }    if(output_file!= nullptr){        fclose(output_file);        output_file= nullptr;    }}int32_t open_input_output_files(const char* input_name,const char* output_name){    if(strlen(input_name)==0||strlen(output_name)==0){        cout<<"Error:empty input or output file name."<

二.音頻解碼器的初始化以及銷毀

int32_t init_audio_decoder(const char* audio_codec){    if(strcasecmp(audio_codec,"MP3")==0){        audio_codec_id=AV_CODEC_ID_MP3;        cout<<"Select codec id:MP3"<id);    if(!parser){        cerr<<"Error:could not init parser."<

三.解碼循環體

解碼循環體至少需要實現以下三個功能:

1.從輸入源中循環獲取碼流包

2.將當前幀傳入解碼器,獲取輸出的音頻采樣數據

3.輸出解碼獲取的音頻采樣數據到輸出文件

從輸入源中讀取音頻數據到緩存: 

int32_t read_data_to_buf(uint8_t* buf,int32_t size,int32_t& out_size){    int32_t read_size=fread(buf,1,size,input_file);    if(read_size==0){        cerr<<"Error:read_data_to_buf failed."<

解碼循環體:  

int32_t end_of_input_file(){    return feof(input_file);}static int32_t decode_packet(bool flushing){    int32_t result=0;    result= avcodec_send_packet(codec_ctx,flushing? nullptr:pkt);    if(result<0){        cerr<<"Error:avcodec_send_packet failed,result:"<=0){        result= avcodec_receive_frame(codec_ctx,frame);        if(result==AVERROR(EAGAIN)||result==AVERROR_EOF){            return 1;        }        else if(result<0){            cerr<<"Error:avcodec_receive_frame failed."<nb_samples:"<<frame->nb_samples<<",frame->channels:"<<frame->channels<0){            result=av_parser_parse2(parser,codec_ctx,&pkt->data,&pkt->size,data,data_size,AV_NOPTS_VALUE,AV_NOPTS_VALUE,0);            if(result<0){                cerr<<"Error:av_parser_parse2 failed."<size){                cout<<"Parsed packet size:"<size< 0)                    data_size += len;            }        }    }    decode_packet(true);    return 0;}

輸出解碼的音頻采樣數據:  

int32_t write_samples_to_pcm(AVFrame* frame,AVCodecContext* codec_ctx){    int data_size= av_get_bytes_per_sample(codec_ctx->sample_fmt);    if(data_size<0){        cerr<<"Error:failed to calculate data size."<channels;ch++){            fwrite(frame->data[ch]+i*data_size,1,data_size,output_file);        }    }    return 0;}

最終,main函數的實現如下:

int main(){    const char* input_file_name="../input.mp3";    const char* output_file_name="../output.pcm";    const char* codec_name="MP3";    int32_t result= open_input_output_files(input_file_name,output_file_name);    if(result<0){        return result;    }    result=init_audio_decoder(codec_name);    if(result<0){        return result;    }    result=audio_decoding();    if(result<0){        return result;    }    destroy_audio_decoder();    close_input_output_files();    return 0;}

解碼完成后,可以使用ffplay播放output.pcm文件:

ffplay -ar 44100 -ar 2 -f f32le -i output.pcm

關鍵詞:

相關閱讀