PCM和WAV格式,Linux下使用ffmpeg命令采集音频数据的方法_linux pcm short数组-程序员宅基地

技术标签: linux  音视频开发基础  ffmpeg  

音频采集三要素

1.采样大小(位深):一个采样用多少bit存放,常用的是16bit。
2.采样率:采样频率,8K, 16K, 32K, 44.1K, 48K
3.声道数:单声道,双声道,多声道

码率计算

PCM数据音频流码率=采样率x采样大小x声道数

WAV

WAV为微软公司(Microsoft)开发的一种声音文件格式,它符合RIFF(Resource Interchange File Format)文件规范,用于保存Windows平台的音频信息资源,被Windows平台及其应用程序所广泛支持。WAVE文件通常只是一个具有单个“WAVE”块的RIFF文件,该块由两个子块(”fmt”子数据块和”data”子数据块),格式如下图所示:
在这里插入图片描述
该格式的实质就是在PCM文件的前面加了一个文件头,每个字段的的含义为

typedef struct{
    
	char ChunkID[4];//内容为"RIFF"
	unsigned long ChunkSize;//存储文件的字节数(不包含ChunkID和ChunkSize这8个字节)
	char Format[4];//内容为"WAVE"
}WAVE_HEADER;

typedef struct{
    
	char Subchunk1ID[4];//内容为"fmt"
	unsigned long Subchunk1Size;//存储该子块的字节数(不含前面的Subchunk1ID和Subchunk1Size这8个字节)
	unsigned short AudioFormat;//存储音频文件的编码格式,例如若为PCM则其存储值为1,若为其他非PCM格式的则有一定的压缩。
	unsigned short NumChannels;//通道数,单通道(Mono)值为1,双通道(Stereo)值为2,等等
	unsigned long SampleRate;//采样率,如8k,44.1k等
	unsigned long ByteRate;//每秒存储的bit数,其值=SampleRate * NumChannels * BitsPerSample/8
	unsigned short BlockAlign;//块对齐大小,其值=NumChannels * BitsPerSample/8
	unsigned short BitsPerSample;//每个采样点的bit数,一般为8,16,32等。
}WAVE_FMT;

typedef struct{
    
	char Subchunk2ID[4];//内容为“data”
	unsigned long Subchunk2Size;//内容为接下来的正式的数据部分的字节数,其值=NumSamples * NumChannels * BitsPerSample/8
}WAVE_DATA;

例子:
在这里插入图片描述
C++读取WAV音频文件的头部数据的实现方法

Linux使用ffmpeg命令采集音频

ffmpeg -f alsa -i hw:0,0 xxx.wav

在这里插入图片描述
输出的音频文件为out.wav。

使用ffplay即可播放刚刚采集的声音。

ffplay out.wav

在这里插入图片描述

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/sjp1992/article/details/108559425

智能推荐

CVPR 2020 | 将深度学习算法应用于移动端最新研究汇总-程序员宅基地

文章浏览阅读591次。点击上方“3D视觉工坊”,选择“星标”干货第一时间送达作者:Derrick Mwiti编译:ronghuaiyang导读边缘设备上的机器学习是未来的一大方向。在最近结束的2020年CVP..._深度学习算法部署在相机系统上

关于安装pytorch以及transforms的版本问题_torch 1.13.0对应的transformers-程序员宅基地

文章浏览阅读1.1w次,点赞5次,收藏20次。win10-CUDA10.0: python3.6 + torch1.4 + torchvision0.5.0 + transforms成功安装问题描述:&#8195首先,我刚开始使用的是,python3.5,安装了torch1.1、torchvision0.3.0,然后transforms死活装不上,一直报错。找了很久,终于在某一个角落看到可能是python版本问题,然后屁颠屁颠跑去..._torch 1.13.0对应的transformers

Spring Cloud Gateway--支持https_spring cloud gateway ssl-程序员宅基地

文章浏览阅读4.6k次,点赞2次,收藏6次。https转http其他网址SpringCloud Gateway Https设置 以Http 转发 路由 给后台微服务_jingle_1995的博客-程序员宅基地http转https其他网址Spring Cloud Gateway同时监听HTTP和HTTPS(http自动转发https端口)_jingle_1995的博客-程序员宅基地..._spring cloud gateway ssl

j-dict-select-tag设置默认值-程序员宅基地

文章浏览阅读3.8k次。j-dict-select-tagdictCode 设置默认值后台设置的数据字典。initialValue 设置默认字典值。_j-dict-select-tag设置默认值

Mac环境配置MySQL(详细)_mysql mac-程序员宅基地

文章浏览阅读4.2w次,点赞67次,收藏322次。非常详细_mysql mac

ubuntu 18.04 识别不到有线网卡_ubuntu找不到网卡-程序员宅基地

文章浏览阅读9.9k次,点赞9次,收藏57次。ubuntu 识别不到有线网卡_ubuntu找不到网卡

随便推点

web期末作业设计网页:动漫网站设计——大鱼海棠(12页) HTML+CSS+JavaScript 学生DW网页设计作业成品 动漫网页设计作业 web网页设计与开发 html实训大作业_动态网页设计作业成品-程序员宅基地

文章浏览阅读7k次,点赞71次,收藏120次。网站布局方面:计划采用目前主流的、能兼容各大主流浏览器、显示效果稳定的浮动网页布局结构。网站程序方面:计划采用最新的网页编程语言HTML5+CSS3+JS程序语言完成网站的功能设计。并确保网站代码兼容目前市面上所有的主流浏览器,已达到打开后就能即时看到网站的效果。网站素材方面:计划收集各大平台好看的图片素材,并精挑细选适合网页风格的图片,然后使用PS做出适合网页尺寸的图片。_动态网页设计作业成品

论文简述 | EAO-SLAM:基于集成数据关联的单目半稠密物体级SLAM-程序员宅基地

文章浏览阅读475次。点击上方“3D视觉工坊”,选择“星标”干货第一时间送达1摘要对象级数据关联和姿态估计在语义SLAM中起着重要作用,但由于缺乏鲁棒和精确的算法,这一问题一直没有得到解决.在这项工作中,我们..._半稠密地图

7-zip图标_如何用外观更好的图标替换7-Zip的丑图标-程序员宅基地

文章浏览阅读7.6k次。7-zip图标7-Zip is a fantastic Windows program for advanced file zipping, whether you’re password-protecting your archives or just trying to compress them down even smaller. There’s just one problem: its..._7z 图标

编程游戏:划拳机器人比赛-{ 咱们园子是否应该设立一个算法挑战/编程竞赛的平台? }...-程序员宅基地

文章浏览阅读115次。网友王集鹄组织了一个编程比赛:划拳机器人比赛。类似“Robocode” 的游戏。早先Microsoft就推出过一款名为Terrarium的code game,其实这种游戏已经有相当久的历史了,很多人都将其看成是那些hacker们的游戏。-------比赛相关帖子如下: 【编程游戏】编写一个会划拳的机器人参加擂台赛,规则内详。 http://topic.csdn.net/u/20..._猜拳机器人博弈算法

无涯教程-Dart - isEmpty函数_dart数组.isempty-程序员宅基地

文章浏览阅读29次。如果集合没有元素,则返回true。_dart数组.isempty

LODOP字体不识别 英文字母连起来 引号不正常-程序员宅基地

文章浏览阅读461次。打印超文本的时候,有时候会发现html中设置的css样式显示不正常,字体根本不是设置的字体,这种情况有可能是:1.该操作系统没有安装自己指定的那种字体,那么没有安装自然就不能显示设置的字体。2.该操作系统已经安装了该字体,但是在css样式中指定字体的时候,用的不是字体实名,而是字体别名,因为字体别名属于web领域的行业习惯,不属于国际规范,事实上非常乱,lodop出于性能考虑,所以lodop没有把..._lodop 重叠