ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

【秒懂音视频开发】08_音频录制

2021-03-17 22:35:18  阅读:239  来源: 互联网

标签:dshow ffmpeg 08 ffprobe 音视频 AudioThread ffplay MainWindow 音频


终于要开始进行FFmpeg实战了,一起来感受一下FFmpeg的强大吧。

命令简介

FFmpeg的bin目录中提供了3个命令(可执行程序),可以直接在命令行上使用。

3个命令

ffmpeg

ffmpeg的主要作用:对音视频进行编解码。

# 将MP3文件转成WAV文件
ffmpeg -i xx.mp3 yy.wav

当输入命令ffmpeg时,可以看到ffmpeg命令的使用格式是:

ffmpeg [options] [[infile options] -i infile]... {[outfile options] outfile}...

简化一下,常用格式是:

ffmpeg arg1 arg2 -i arg3 arg4 arg5
  • arg1:全局参数
  • arg2:输入文件参数
  • arg3:输入文件
  • arg4:输出文件参数
  • arg5:输出文件

更多详细用法,可以参考官方文档:ffmpeg-all.html,或者使用以下命令查看:

# 简易版
ffmpeg -h
# 详细版
ffmpeg -h long
# 完整版
ffmpeg -h full

# 或者使用
# ffmpeg -help
# ffmpeg -help long
# ffmpeg -help full

ffprobe

ffprobe的主要作用:查看音视频的参数信息。

# 可以查看MP3文件的采样率、比特率、时长等信息
ffprobe xx.mp3

当输入命令ffprobe时,可以看到ffprobe命令的使用格式是:

ffprobe [OPTIONS] [INPUT_FILE]
# OPTIONS:参数
# INPUT_FILE:输入文件

更多详细用法,可以参考官方文档:ffprobe-all.html,或者使用以下命令查看:

# 简易版
ffprobe -h
# 详细版
ffprobe -h long
# 完整版
ffprobe -h full

# 或者使用
# ffprobe -help
# ffprobe -help long
# ffprobe -help full

ffplay

ffplay的主要作用:播放音视频。

# 播放MP3文件
ffplay xx.mp3

当输入命令ffplay时,可以看到ffplay命令的使用格式是:

ffplay [options] input_file
# options:参数
# input_file:输入文件

更多详细用法,可以参考官方文档:ffplay-all.html,或者使用以下命令查看:

# 简易版
ffplay -h
# 详细版
ffplay -h long
# 完整版
ffplay -h full

# 或者使用
# ffplay -help
# ffplay -help long
# ffplay -help full

hide_bannder

增加-hide_bannder参数可以隐藏一些冗余的描述信息,可以去实践比较以下2条命令的区别:

ffprobe xx.mp3

ffprobe -hide_banner xx.mp3

# ffmpeg、ffprobe、ffplay都适用

通过命令行录音

查看可用设备

使用命令行查看当前平台的可用设备:

ffmpeg -devices

Windows的输出结果如下所示:

  • 列表中有个dshow,全名叫DirectShow,是Windows平台的多媒体系统库
  • 我们可以使用dshow去操作多媒体输入设备(比如录音设备)
Devices:
 D. = Demuxing supported
 .E = Muxing supported
 --
  E caca            caca (color ASCII art) output device
 D  dshow           DirectShow capture
 D  gdigrab         GDI API Windows frame grabber
 D  lavfi           Libavfilter virtual input device
 D  libcdio
  E sdl,sdl2        SDL2 output device
 D  vfwcap          VfW video capture

Mac的输出结果如下所示:

  • 列表中有个avfoundation,是Mac平台的多媒体系统库
  • 我们可以使用avfoundation去操作多媒体输入设备(比如录音设备)
Devices:
 D. = Demuxing supported
 .E = Muxing supported
 --
 D  avfoundation    AVFoundation input device
 D  lavfi           Libavfilter virtual input device
  E sdl,sdl2        SDL2 output device

查看dshow支持的设备

# 查看dshow支持的设备
ffmpeg -list_devices true -f dshow -i dummy

# 或者
# ffmpeg -list_devices true -f dshow -i ''
# ffmpeg -list_devices true -f dshow -i ""
  • -list_devices true
    • 打印出所有的设备
  • -f dshow
    • dshow支持的
  • -i dummy-i ''-i ""
    • 立即退出

我的笔记本外接了一只麦克风。

外接麦克风

因此,命令的执行结果大致如下所示:

DirectShow video devices (some may be both video and audio devices)
  "Integrated Camera"

DirectShow audio devices
  "线路输入 (3- 魅声T800)"
  "麦克风阵列 (Realtek(R) Audio)"
  • dshow支持的视频设备

    • Integrated Camera:笔记本自带的摄像头
  • dshow支持的音频设备

    • 线路输入 (3- 魅声T800):外接的麦克风
    • 麦克风阵列 (Realtek(R) Audio):笔记本自带的麦克风

查看avfoundation支持的设备

在Mac平台,使用的是avfoundation,而不是dshow。

ffmpeg -list_devices true -f avfoudation -i ''	

输出结果如下所示:

AVFoundation video devices:
 [0] FaceTime高清摄像头(内建)
 [1] Capture screen 0
AVFoundation audio devices:
 [0] MS-T800
 [1] Edu Audio Device
 [2] MacBook Pro麦克风

列表中的MS-T800是外接的麦克风。在Mac上,FFmpeg还给每一个视频、音频设备进行了编号,比如MS-T800的编号是0、Mac自带麦克风的编号是2。

指定设备进行录音

# 使用外接的麦克风进行录音,最后生成一个wav文件
ffmpeg -f dshow -i audio="麦克风阵列 (Realtek(R) Audio)" out.wav

# 在Mac上通过编号指定设备
ffmpeg -f avfoundation -i :0 out.wav
# :0表示使用0号音频设备
# 0:2表示使用0号视频设备和2号音频设备
  • 可以使用快捷键Ctrl + C终止录音
  • 我这边的测试结果显示,默认的音频参数是:
    • Windows:44100Hz采样率、16位深度、2声道、1411Kbps比特率
    • Mac:48000Hz采样率、16位深度、2声道、1536Kbps比特率

设置dshow的参数

先通过命令查看一下dshow可以使用的参数,详情可以查看官方文档:dshow参数

# 从ffmpeg -devices命令的结果可以看得出来:dshow属于demuxer,而不是muxer
ffmpeg -h demuxer=dshow

部分输出结果如下所示:

# 采样率
-sample_rate         <int> set audio sample rate (from 0 to INT_MAX)
# 采样大小(位深度)
-sample_size         <int> set audio sample size (from 0 to 16)
# 声道数
-channels            <int> set number of audio channels, such as 1 or 2 (from 0 to INT_MAX)
# 列出特定设备支持的参数
-list_options        <boolean> list available options for specified device (default false)

然后再看看你的设备支持哪些参数。

ffmpeg -list_options true -f dshow -i audio="麦克风阵列 (Realtek(R) Audio)"

输出结果如下所示:

DirectShow audio only device options (from audio devices)
  Pin "Capture" (alternative pin name "Capture")
  min ch=1 bits=8 rate= 11025 max ch=2 bits=16 rate= 44100
  
# 可以看出来:采样率范围是11025~44100Hz

接下来设置录音时的音频参数。

ffmpeg -f dshow -sample_rate 15000 -sample_size 16 -channels 1 -i audio="麦克风阵列 (Realtek(R) Audio)" out.wav

通过编程录音

主要步骤

开发录音功能的主要步骤是:

  • 注册设备
  • 查找输入格式
  • 打开设备
  • 读取数据
  • 释放资源

以后的开发过程中,经常需要查询的资料:官方API文档

AudioThread

录音是个耗时操作,因此最好放到一个子线程中进行。这里创建了一个继承自QThread的线程类,线程一旦启动(start),就会自动调用run函数。

  • AudioThread.h
#include <QThread>

class AudioThread : public QThread
{
    Q_OBJECT
private:
    void run();

public:
    explicit AudioThread(QObject *parent = nullptr);
    ~AudioThread();
};
  • AudioThread.cpp
#include "audiothread.h"
#include <QDebug>
#include <QFile>

extern "C" {
    // 编解码相关API
    #include <libavcodec/avcodec.h>
    // 格式相关API
    #include <libavformat/avformat.h>
    // 工具API(比如错误处理)
    #include <libavutil/avutil.h>
}

AudioThread::AudioThread(QObject *parent) : QThread(parent)
{
    // 在线程结束时自动回收线程的内存
    connect(this, &AudioThread::finished,
            this, &AudioThread::deleteLater);
}

AudioThread::~AudioThread()
{
    // 线程销毁时,正常退出线程
    quit();
    requestInterruption();
    wait();
}

void AudioThread::run()
{
    // 格式名称
    const char *fmtName;
#if defined (Q_OS_WIN)
    fmtName = "dshow";
#else
    fmtName = "avfoundation";
#endif

    // 根据名称找到输入格式对象
    AVInputFormat *fmt = av_find_input_format(fmtName);
    if (fmt == NULL) {
        qDebug() << "找不到输入格式:" << fmtName;
        return;
    }

    // 设备名称
    const char *deviceName;
#if defined (Q_OS_WIN)
    deviceName = "audio=麦克风阵列 (Realtek(R) Audio)";
#else
    deviceName = ":0";
#endif

    // 格式上下文
    AVFormatContext *ctx = NULL;
    // 选项
    AVDictionary *options = NULL;

    // 打开输入流
    int ret = avformat_open_input(&ctx, deviceName, fmt, &options);

    // 如果打开输入流失败
    if (ret < 0) {
        char errbuf[1024] = {0};
        av_strerror(ret, errbuf, sizeof(errbuf));
        qDebug() << "打开输入流失败:" << errbuf;
        return;
    }

    // 定义文件
    QFile file("F:/out.pcm");

    // 删除旧文件
    if (file.exists()) {
        file.remove();
    }

    // 打开文件
    if (!file.open(QIODevice::WriteOnly)){
        qDebug() << "文件打开失败";
        // 关闭输入流
        avformat_close_input(&ctx);
        return;
    }

    // 数据包
    AVPacket pkt;
    while (!isInterruptionRequested()
           && av_read_frame(ctx, &pkt) == 0) {
        // 写入数据
        file.write((char *) pkt.data, pkt.size);
    }

    // 关闭文件
    file.close();

    // 关闭输入流
    avformat_close_input(&ctx);
}

MainWindow

在MainWindow控制开始、结束录音。

  • MainWindow.h
class MainWindow : public QMainWindow
{
    Q_OBJECT

public:
    MainWindow(QWidget *parent = nullptr);
    ~MainWindow();

private slots:
    void on_audioBtn_clicked();

private:
    Ui::MainWindow *ui;
    AudioThread *_audioThread = nullptr;
};
  • MainWindow.cpp
#include "mainwindow.h"
#include "ui_mainwindow.h"
#include <QDebug>
#include "audiothread.h"

extern "C" {
    // 设备相关API
    #include <libavdevice/avdevice.h>
}

MainWindow::MainWindow(QWidget *parent)
    : QMainWindow(parent)
    , ui(new Ui::MainWindow)
{
    ui->setupUi(this);

    // 初始化libavdevice并注册所有输入和输出设备
    avdevice_register_all();
}

MainWindow::~MainWindow()
{
    delete ui;
}

void MainWindow::on_audioBtn_clicked()
{
    // 没有线程
    if (_audioThread == nullptr) {
        // 开启新线程
        _audioThread = new AudioThread(this);
        _audioThread->start();

        // 设置按钮文字
        ui->audioBtn->setText("停止录音");
    } else {
        // 停止录音
        _audioThread->requestInterruption();
        _audioThread = nullptr;

        // 设置按钮文字
        ui->audioBtn->setText("开始录音");
    }
}

播放PCM

ffplay -ar 44100 -ac 2 -f s16le out.pcm

标签:dshow,ffmpeg,08,ffprobe,音视频,AudioThread,ffplay,MainWindow,音频
来源: https://www.cnblogs.com/mjios/p/14540642.html

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有