Administrator
发布于 2025-08-29 / 22 阅读
0
0

音频素材合成指南

一、先安装FFmpeg

  1. 下载 FFmpeg:

访问https://github.com/BtbN/FFmpeg-Builds/releases,下载ffmpeg-master-latest-win64-gpl-shared.zip

  1. 安装FFmpeg:

2.1 解压 ZIP 文件D:\ffmpeg-master-latest-win64-gpl-shared(或其他目录)。

2.2 添加 FFmpeg 到 PATH:按 Win + R,输入 sysdm.cpl 打开 系统属性。

2.3 进入 高级 → 环境变量。

2.4 在 系统变量 中找到 Path,点击 编辑。

点击 新建,输D:\ffmpeg-master-latest-win64-gpl-shared\ffmpeg-master-latest-win64-gpl-shared\bin(替换为你的 FFmpeg 路径)。

点击 确定 保存。

  1. 验证是否安装OK

Win + R,输入 cmd 打开 命令行输入界面,执行ffmpeg -version后输出版本号

二、原始音频参数查看

ffprobe -i 爆炸1.wav

ffprobe 是 FFmpeg 工具集的一部分,用于查看多媒体文件(音频、视频)的详细信息,而不会对文件进行任何修改,输出结果如下

关键信息解析:

第一行Input #0, wav, from '爆炸1.wav':

  • Input #0: 表示这是第一个输入文件(ffprobe 可以同时分析多个文件)。

  • wav: 表示文件的容器格式是 WAV。容器就像一个盒子,里面装着实际的音频数据和元数据。

  • from ‘爆炸1.wav’: 指定了被分析的文件名。

第二行Duration: 00:00:01.72, bitrate: 512 kb/s

  • Duration: 00:00:01.72: 音频的总时长。格式是 小时:分钟:秒.毫秒。这里表示音频长度为 1.72秒。

  • bitrate: 512 kb/s: 文件的平均比特率,即每秒数据量。

第三行Stream #0:0: Audio: pcm_s16le ([1][0][0][0] / 0x0001), 32000 Hz, 1 channels, s16, 512 kb/s

这是最重要的一行,描述了容器内的音频流(Stream):

  • Stream #0:0: 表示这是第0个输入文件中的第0个流(WAV文件通常只有一个音频流)。

  • Audio: 表明这是一个音频流。

  • pcm_s16le: 这是音频编解码器(编码格式)。

    • PCM: 脉冲编码调制,是一种无损、未压缩的原始音频格式,音质最好,但文件体积大。

    • s16: 表示采样精度/位深为 16 bit。这决定了动态范围和精度。

    • le: 表示字节序为小端序,这是PC的标准存储方式。

  • 32000 Hz: 这是采样率。表示每秒对声音采样32000次。

  • 1 channels: 表示声道数为 1,即单声道。声道分立体声(两个声道stereo-左和右)和单声道mono。

  • s16: 再次强调采样格式是16位有符号整数。

  • 512 kb/s: 这个流的比特率。这个值是根据 采样率 × 位深 × 声道数 计算出来的:32000 Hz × 16 bit × 1 声道 = 512,000 bps = 512 kb/s。与文件总比特率一致。

三、原视频去除音频

ffmpeg -i Audio_Ori.mp4 -c:v copy -an Audio_NoVoice.mp4

四、视频叠加音频

1. 合成.pcm后缀音频到视频:

ffmpeg -i ../Audio_NoVoice.mp4 -f s16le -ar 16000 -ac 1 -i jubian.pcm -c:v copy -c:a aac Audio_jubian_Test.mp4

2. 合成.wav后缀音频到视频:

ffmpeg -i Audio_NoVoice.mp4 -i 警报器_1.wav -c:v copy -c:a aac -strict experimental Audio_baojin.mp4

3. 截取音频

ffmpeg -i AudioTest.mp4 -ss 00:00:00 -t 00:00:05 -c copy AudioTest_new.mp4


评论