# 音频编码 开发者可以调用本模块的Native API接口,完成音频编码,即将音频PCM编码压缩成不同的格式。 接口不限制PCM数据的来源,开发者可以调用麦克风录制获取、也可以导入编辑后的PCM数据,通过音频编码,输出对应格式的码流,最后封装为目标格式文件。 当前支持的编码能力请参考[AVCodec支持的格式](avcodec-support-formats.md#音频编码)。 **适用场景** - 音频录制 通过录制传入PCM,然后编码出对应格式的码流,最后封装成想要的格式。 - 音频编辑 编辑PCM后导出音频文件的场景,需要编码成对应音频格式后再封装成文件。 > **说明:** > > AAC编码器默认采用的VBR可变码率模式,与配置的预期参数可能存在偏差。 ## 开发指导 详细的API说明请参考[API文档](../../reference/apis-avcodec-kit/_audio_codec.md)。 参考以下示例代码,完成音频编码的全流程,包括:创建编码器、设置编码参数(采样率/码率/声道数等)、开始、刷新、重置、销毁资源。 在应用开发过程中,开发者应按一定顺序调用方法,执行对应操作,否则系统可能会抛出异常或生成其他未定义的行为。具体顺序可参考下列开发步骤及对应说明。 如下为音频编码调用关系图: - 虚线表示可选。 - 实线表示必选。 ![Invoking relationship of audio encode stream](figures/audio-codec.png) ### 在 CMake 脚本中链接动态库 ```cmake target_link_libraries(sample PUBLIC libnative_media_codecbase.so) target_link_libraries(sample PUBLIC libnative_media_core.so) target_link_libraries(sample PUBLIC libnative_media_acodec.so) ``` ### 开发步骤 1. 添加头文件。 ```cpp #include #include #include #include #include #include ``` 2. 创建编码器实例对象,OH_AVCodec *为编码器实例指针。 应用可以通过名称或媒体类型创建编码器。 ```cpp // c++标准库命名空间 using namespace std; // 通过 codecname 创建编码器 OH_AVCapability *capability = OH_AVCodec_GetCapability(OH_AVCODEC_MIMETYPE_AUDIO_AAC, true); const char *name = OH_AVCapability_GetName(capability); OH_AVCodec *audioEnc_ = OH_AudioCodec_CreateByName(name); ``` ```cpp // 设置判定是否为编码;设置true表示当前是编码。 bool isEncoder = true; // 通过媒体类型创建编码器 OH_AVCodec *audioEnc_ = OH_AudioCodec_CreateByMime(OH_AVCODEC_MIMETYPE_AUDIO_AAC, isEncoder); ``` ```cpp // 初始化队列 class AEncBufferSignal { public: std::mutex inMutex_; std::mutex outMutex_; std::mutex startMutex_; std::condition_variable inCond_; std::condition_variable outCond_; std::condition_variable startCond_; std::queue inQueue_; std::queue outQueue_; std::queue inBufferQueue_; std::queue outBufferQueue_; }; AEncBufferSignal *signal_; ``` 3. 调用OH_AudioCodec_RegisterCallback()注册回调函数。 注册回调函数指针集合OH_AVCodecCallback,包括: - OH_AVCodecOnError:编码器运行错误。 - OH_AVCodecOnStreamChanged:码流信息变化,如声道变化等。 - OH_AVCodecOnNeedInputBuffer:运行过程中需要新的输入数据,即编码器已准备好,可以输入PCM数据。 - OH_AVCodecOnNewOutputBuffer:运行过程中产生了新的输出数据,即编码完成。 开发者可以通过处理该回调报告的信息,确保编码器正常运转。 ```cpp // OH_AVCodecOnError回调函数的实现 static void OnError(OH_AVCodec *codec, int32_t errorCode, void *userData) { (void)codec; (void)errorCode; (void)userData; } // OH_AVCodecOnStreamChanged回调函数的实现 static void OnOutputFormatChanged(OH_AVCodec *codec, OH_AVFormat *format, void *userData) { (void)codec; (void)format; (void)userData; } // OH_AVCodecOnNeedInputBuffer回调函数的实现 static void OnInputBufferAvailable(OH_AVCodec *codec, uint32_t index, OH_AVBuffer *data, void *userData) { (void)codec; // 编码输入码流送入InputBuffer队列 AEncBufferSignal *signal = static_cast(userData); unique_lock lock(signal->inMutex_); signal->inQueue_.push(index); signal->inBufferQueue_.push(data); signal->inCond_.notify_all(); } // OH_AVCodecOnNewOutputBuffer回调函数的实现 static void OnOutputBufferAvailable(OH_AVCodec *codec, uint32_t index, OH_AVBuffer *data, void *userData) { (void)codec; // 将对应输出buffer的index送入OutputQueue_队列 // 将对应编码完成的数据data送入outBuffer队列 AEncBufferSignal *signal = static_cast(userData); unique_lock lock(signal->outMutex_); signal->outQueue_.push(index); signal->outBufferQueue_.push(data); } signal_ = new AEncBufferSignal(); OH_AVCodecCallback cb_ = {&OnError, &OnOutputFormatChanged, &OnInputBufferAvailable, &OnOutputBufferAvailable}; // 配置异步回调 int32_t ret = OH_AudioCodec_RegisterCallback(audioEnc_, cb_, signal_); if (ret != AV_ERR_OK) { // 异常处理 } ``` 4. 调用OH_AudioCodec_Configure设置编码器。 设置必选项:采样率,码率,以及声道数,声道类型、位深。 可选项:最大输入长度。 flac编码: 需要额外标识兼容性级别(Compliance Level)和采样精度。 各音频编码类型参数范围说明: | 音频编码类型 | 采样率(Hz) | 声道数 | | ----------- | ------------------------------------------------------------------------------- | :----------------: | | AAC | 8000、11025、12000、16000、22050、24000、32000、44100、48000、64000、88200、96000 | 1、2、3、4、5、6、8 | | Flac | 8000、11025、12000、16000、22050、24000、32000、44100、48000、64000、88200、96000 | 1~8 | | MP3 | 8000、11025、12000、16000、22050、24000、32000、44100、48000 | 1~2 | | G711mu | 8000 | 1 | 对于44100Hz采样率、2声道立体声、SAMPLE_S16LE采样格式的PCM音频,以32000bps的码率进行AAC编码的调用流程如下: ```cpp int32_t ret; // 配置音频采样率(必须) constexpr uint32_t DEFAULT_SAMPLERATE = 44100; // 配置音频码率(必须) constexpr uint64_t DEFAULT_BITRATE = 32000; // 配置音频声道数(必须) constexpr uint32_t DEFAULT_CHANNEL_COUNT = 2; // 配置音频声道类型(必须) constexpr OH_AudioChannelLayout CHANNEL_LAYOUT = OH_AudioChannelLayout::CH_LAYOUT_STEREO; // 配置音频位深(必须) constexpr OH_BitsPerSample SAMPLE_FORMAT = OH_BitsPerSample::SAMPLE_S16LE; // 每20ms一帧音频数据 constexpr float TIME_PER_FRAME = 0.02; // 配置最大输入长度, 每帧音频数据的大小(可选) constexpr uint32_t DEFAULT_MAX_INPUT_SIZE = DEFAULT_SAMPLERATE * TIME_PER_FRAME * DEFAULT_CHANNEL_COUNT * sizeof(short); // aac OH_AVFormat *format = OH_AVFormat_Create(); // 写入format OH_AVFormat_SetIntValue(format,OH_MD_KEY_AUD_CHANNEL_COUNT, DEFAULT_CHANNEL_COUNT); OH_AVFormat_SetIntValue(format,OH_MD_KEY_AUD_SAMPLE_RATE, DEFAULT_SAMPLERATE); OH_AVFormat_SetLongValue(format,OH_MD_KEY_BITRATE, DEFAULT_BITRATE); OH_AVFormat_SetIntValue(format, OH_MD_KEY_AUDIO_SAMPLE_FORMAT, SAMPLE_FORMAT); OH_AVFormat_SetLongValue(format,OH_MD_KEY_CHANNEL_LAYOUT, CHANNEL_LAYOUT); OH_AVFormat_SetIntValue(format,OH_MD_KEY_MAX_INPUT_SIZE, DEFAULT_MAX_INPUT_SIZE); // 配置编码器 ret = OH_AudioCodec_Configure(audioEnc_, format); if (ret != AV_ERR_OK) { // 异常处理 } ``` 例FLAC调用流程: ```cpp int32_t ret; // 配置音频采样率(必须) constexpr uint32_t DEFAULT_SAMPLERATE = 44100; // 配置音频码率(必须) constexpr uint64_t DEFAULT_BITRATE = 261000; // 配置音频声道数(必须) constexpr uint32_t DEFAULT_CHANNEL_COUNT = 2; // 配置音频声道类型(必须) constexpr OH_AudioChannelLayout CHANNEL_LAYOUT = OH_AudioChannelLayout::CH_LAYOUT_STEREO; // 配置音频位深(必须) flac 只有SAMPLE_S16LE和SAMPLE_S32LE constexpr OH_BitsPerSample SAMPLE_FORMAT = OH_BitsPerSample::SAMPLE_S32LE; // 配置音频compliance level (默认值0,取值范围-2~2) constexpr int32_t COMPLIANCE_LEVEL = 0; // 配置音频精度(必须) SAMPLE_S16LE和SAMPLE_S24LE和SAMPLE_S32LE constexpr OH_BitsPerSample BITS_PER_CODED_SAMPLE = OH_BitsPerSample::SAMPLE_S24LE; OH_AVFormat *format = OH_AVFormat_Create(); // 写入format OH_AVFormat_SetIntValue(format, OH_MD_KEY_AUD_CHANNEL_COUNT, DEFAULT_CHANNEL_COUNT); OH_AVFormat_SetIntValue(format, OH_MD_KEY_AUD_SAMPLE_RATE, DEFAULT_SAMPLERATE); OH_AVFormat_SetLongValue(format, OH_MD_KEY_BITRATE, DEFAULT_BITRATE); OH_AVFormat_SetIntValue(format, OH_MD_KEY_BITS_PER_CODED_SAMPLE, BITS_PER_CODED_SAMPLE); OH_AVFormat_SetIntValue(format, OH_MD_KEY_AUDIO_SAMPLE_FORMAT, SAMPLE_FORMAT); OH_AVFormat_SetLongValue(format, OH_MD_KEY_CHANNEL_LAYOUT, CHANNEL_LAYOUT); OH_AVFormat_SetLongValue(format, OH_MD_KEY_COMPLIANCE_LEVEL, COMPLIANCE_LEVEL); // 配置编码器 ret = OH_AudioCodec_Configure(audioEnc_, format); if (ret != AV_ERR_OK) { // 异常处理 } ``` 5. 调用OH_AudioCodec_Prepare(),编码器就绪。 ```cpp ret = OH_AudioCodec_Prepare(audioEnc_); if (ret != AV_ERR_OK) { // 异常处理 } ``` 6. 调用OH_AudioCodec_Start()启动编码器,进入运行态。 ```c++ unique_ptr inputFile_ = make_unique(); unique_ptr outFile_ = make_unique(); // 打开待编码二进制文件路径(此处以输入为PCM文件为例) inputFile_->open(inputFilePath.data(), ios::in | ios::binary); // 配置编码文件输出路径(此处以输出为编码码流文件为例) outFile_->open(outputFilePath.data(), ios::out | ios::binary); // 开始编码 ret = OH_AudioCodec_Start(audioEnc_); if (ret != AV_ERR_OK) { // 异常处理 } ``` 7. 调用OH_AudioCodec_PushInputBuffer(),写入待编码器的数据。 aac: 每帧样点数(SAMPLES_PER_FRAME)建议使用20ms的PCM样点数,即采样率*0.02。 flac: 每帧样点数(SAMPLES_PER_FRAME)比较特殊需要,根据如下表格进行设置。 | 采样率 | 样点数 | | :----: | :----: | | 8000 | 576 | | 16000 | 1152 | | 22050 | 2304 | | 24000 | 2304 | | 32000 | 2304 | | 44100 | 4608 | | 48000 | 4608 | | 88200 | 8192 | | 96000 | 8192 | > **说明:** > aac编码的每帧样点数建议使用20ms的PCM样点数,即采样率*0.02。flac编码的样点数建议根据采样率按照表格传入,大于这个值也会返回错误码,如果小于有可能出现编码文件损坏问题。 ```c++ // 每帧样点数 constexpr int32_t SAMPLES_PER_FRAME = DEFAULT_SAMPLERATE * TIME_PER_FRAME; // 声道数,对于amr编码声道数只支持单声道的音频输入 constexpr int32_t DEFAULT_CHANNEL_COUNT = 2; // 每帧输入数据的长度,声道数 * 每帧样点数 * 每个样点的字节数(以采样格式SAMPLE_S16LE为例) constexpr int32_t INPUT_FRAME_BYTES = DEFAULT_CHANNEL_COUNT * SAMPLES_PER_FRAME * sizeof(short); uint32_t index = signal_->inQueue_.front(); auto buffer = signal_->inBufferQueue_.front(); OH_AVCodecBufferAttr attr = {0}; if (!inputFile_->eof()) { inputFile_->read((char *)OH_AVBuffer_GetAddr(buffer), INPUT_FRAME_BYTES); attr.size = INPUT_FRAME_BYTES; attr.flags = AVCODEC_BUFFER_FLAGS_NONE; } else { attr.size = 0; attr.flags = AVCODEC_BUFFER_FLAGS_EOS; } OH_AVBuffer_SetBufferAttr(buffer, &attr); // 送入编码输入队列进行编码, index为对应队列下标 ret = OH_AudioCodec_PushInputBuffer(audioEnc_, index); if (ret != AV_ERR_OK) { // 异常处理 } ``` 在上方案例中,attr.flags代表缓冲区标记的类别。 如果是结束,需要将flags标识成AVCODEC_BUFFER_FLAGS_EOS。 | 枚举值 | 描述 | | -------- | -------- | | AVCODEC_BUFFER_FLAGS_NONE | 表示为普通帧。 | | AVCODEC_BUFFER_FLAGS_EOS | 表示缓冲区是流结束帧。 | | AVCODEC_BUFFER_FLAGS_CODEC_DATA | 表示缓冲区包含编解码特定数据。 | 8. 调用OH_AudioCodec_FreeOutputBuffer(),输出编码格式码流。 ```c++ uint32_t index = signal_->outQueue_.front(); OH_AVBuffer *avBuffer = signal_->outBufferQueue_.front(); // 获取buffer attributes OH_AVCodecBufferAttr attr = {0}; ret = OH_AVBuffer_GetBufferAttr(avBuffer, &attr); if (ret != AV_ERR_OK) { // 异常处理 } // 将编码完成数据data写入到对应输出文件中 outputFile_->write(reinterpret_cast(OH_AVBuffer_GetAddr(avBuffer)), attr.size); // 释放已完成写入的数据 ret = OH_AudioCodec_FreeOutputBuffer(audioEnc_, index); if (ret != AV_ERR_OK) { // 异常处理 } if (attr.flags == AVCODEC_BUFFER_FLAGS_EOS) { // 结束 } ``` 9. (可选)调用OH_AudioCodec_Flush()刷新编码器。 调用OH_AudioCodec_Flush()后,编码器处于Flush状态,会将当前编码队列清空。 此时需要调用OH_AudioCodec_Start()重新开始编码。 使用情况: * 在文件EOS之后,需要调用刷新 * 在执行过程中遇到可继续执行的错误时(即OH_AudioCodec_IsValid 为true)可以调用,然后重新调用OH_AudioCodec_Start ```c++ // 刷新编码器 audioEnc_ ret = OH_AudioCodec_Flush(audioEnc_); if (ret != AV_ERR_OK) { // 异常处理 } // 重新开始编码 ret = OH_AudioCodec_Start(audioEnc_); if (ret != AV_ERR_OK) { // 异常处理 } ``` 10. (可选)调用OH_AudioCodec_Reset()重置编码器。 调用OH_AudioCodec_Reset()后,编码器回到初始化的状态,需要调用OH_AudioCodec_Configure()重新配置,然后调用OH_AudioCodec_Start()重新开始编码。 ```c++ // 重置编码器 audioEnc_ ret = OH_AudioCodec_Reset(audioEnc_); if (ret != AV_ERR_OK) { // 异常处理 } // 重新配置编码器参数 ret = OH_AudioCodec_Configure(audioEnc_, format); if (ret != AV_ERR_OK) { // 异常处理 } ``` 11. 调用OH_AudioCodec_Stop()停止编码器。 ```c++ // 终止编码器 audioEnc_ ret = OH_AudioCodec_Stop(audioEnc_); if (ret != AV_ERR_OK) { // 异常处理 } ``` 12. 调用OH_AudioCodec_Destroy()销毁编码器实例,释放资源。 > **说明:** > 资源不能重复销毁 ```c++ // 调用OH_AudioCodec_Destroy, 注销编码器 ret = OH_AudioCodec_Destroy(audioEnc_); if (ret != AV_ERR_OK) { // 异常处理 } else { audioEnc_ = NULL; // 不可重复destroy } ``` ## 相关实例 针对音频编码,有以下相关实例可供参考: - [音频编码](https://gitee.com/openharmony/multimedia_av_codec/blob/master/test/nativedemo/audio_demo/avcodec_audio_avbuffer_aac_encoder_demo.cpp)