语音

详解低延时高音质：编解码篇2021-11-09 23:05:19

语音社交已经出现了数十年，而近期的“互动播客”场景让音频互动再次成为业界焦点。如何提供好的音频互动体验？怎么优化音质？如何应对全球传输下的网络挑战？如何在高音质的基础上让声音更悦耳？我们将从今天开始通过「详解低延时高音质」系列内容，从多个层面深入浅出逐一解答这些问题。
有什么佩戴牢固舒适的蓝牙耳机？佩戴感最好的蓝牙耳机推荐2021-11-09 13:58:49

当下，蓝牙耳机市场发展如火如荼，各种品牌的耳机接连出现，各种新式功能不断被开发出来，相信目前大多数消费者都对蓝牙耳机有过大致的了解，但什么样的蓝牙耳机最值得买？哪种蓝牙耳机更适合自己？仍是想要购买蓝牙耳机的消费者们所面临的问题。今天给大家推荐四款蓝牙耳机，每一款都别具特色
电话语音机器人系统可快速搭建部署2021-11-08 17:04:58

随着人工智能的发展越来越成熟，越来越多的人工智能产品相继走进了人们的生产、生活中。在面对行业存在的每天通话量受限、运营成本高、客户资料不完善等问题，电话机器人系统以高效率过滤、准确的数据分析、低成本管理、标准化执行等优势，很好的解决了企业营销与服务难题。与此
WAVENET-语音合成2021-11-07 23:02:00

1 简介本文根据2016年《WAVENET: A GENERATIVE MODEL FOR RAW AUDIO》翻译总结的。用于语音合成的。WAVENET比参数和连接系统表现好。本文由如下贡献： 1）我们显示WaveNets可以生成主观自然的语音，这在text-to-speech (TTS)领域尚未报道过。 2）为了处理语音生成中长范围的时间依
联发科发布 8k 行新 Linux 内核驱动代码2021-11-06 19:33:28

导读联发科于近日发布了一套完整的补丁集，用于启动 MT8192 APU 的电源控制、tinysys 控制器（APU 上的微控制器）和中间件支持。其中总共包含了 8100 多行的新内核代码。根据介绍，联发科的工程师在近几个月来一直在发布一些 Linux 内核驱动代码，用于在 MT8192 SoC 内启动 AI 处理单
小谈音视频质量检测2021-11-04 22:01:51

本人从一位测试的角度出发，基于目前项目中摄像头的直播和语音对讲业务，正寻求音视频的质量测试及一些监控分析手段。工作中发现达到一定的并发程度之后，就会出现延时、卡顿、丢帧、马赛克等问题。所以最近在网上看看专家的直播和专栏，学习一下行业内的好的测试方法。这不，前几天有幸
webRTC中语音降噪模块ANS细节详解(三)2021-11-02 08:33:29

上篇(webRTC中语音降噪模块ANS细节详解(二) )讲了ANS的处理流程和语音在时域和频域的相互转换。本篇开始讲语音降噪的核心部分，首先讲噪声的初始估计以及基于估计出来的噪声算先验信噪比和后验信噪比。 1，初始噪声估计 webRTC中ANS的初始噪声估计用的是分位数噪声估计法（QBNE，Quant
uniapp+nvue实现仿微信App聊天应用 —— 成功实现好友聊天+语音视频通话功能2021-11-01 23:05:00

基于uniapp + nvue实现的uniapp仿微信App聊天应用 txim 实例项目，实现了以下功能。 1: 聊天会话管理 2: 好友列表 3: 文字、语音、视频、表情、位置等聊天消息收发 4: 一对一语音视频在线通话技术实现开发环境：HbuilderX + nodejs 技术框架：uniapp + vue2.x + node-s
实时语音如何过质量关？2021-11-01 21:02:54

大家好，我是 cv 君，涉猎语音一段时间了，今天提笔浅述一下语音的传输前后，质量如何过关，也就是说，怎么评价我们语音的质量，比如麦克风等声音设备等等。我们在语音质量方面，有三种全局上的评价方法：有参考客观评价方法，有参考客观评价方法，主观评价方法。那么我们细分到他的子类，就会有
webRTC中语音降噪模块ANS细节详解(三)2021-11-01 08:34:36

上篇(webRTC中语音降噪模块ANS细节详解(二) )讲了ANS的处理流程和语音在时域和频域的相互转换。本篇开始讲语音降噪的核心部分，首先讲噪声的初始估计以及基于估计出来的噪声算先验信噪比和后验信噪比。 1，初始噪声估计 webRTC中ANS的初始噪声估计用的是分位数噪声估计法（QBNE，Quant
【AI 全栈 SOTA 综述】这些你都不知道，怎么敢说会 AI？【语音识别原理 + 实战】2021-10-25 21:32:30

章目录前言语音识别原理信号处理，声学特征提取识别字符，组成文本声学模型语言模型词汇模型语音声学特征提取：MFCC和LogFBank算法的原理实战一 ASR语音识别模型系统的流程基于HTTP协议的API接口客户端未来实
uniapp+nvue开发之仿微信语音+视频通话功能：实现一对一语音视频在线通话2021-10-24 20:57:59

本篇文章是利用uni-app和nvue实现微信效果功能的第三篇了，今天我们基于uniapp + nvue实现的uniapp仿微信音视频通话插件实例项目，实现了以下功能： 1: 语音通话 2: 视频通话 3: 寻呼状态回馈软件效果：技术实现开发环境：HbuilderX + nodejs技术框架：uniapp + vue2.x
Java语言实现文本转语音2021-10-24 18:02:43

Java语言实现文本转语音 1. 首先需要导入jacob.jar的jar包 jar包下载地址 2.编写测试代码 import com.jacob.activeX.ActiveXComponent; import com.jacob.com.Dispatch; import com.jacob.com.Variant; import java.io.BufferedReader; import java.io.FileReader; impor
学习进度12021-10-23 23:04:02

在本节中，我们回顾了有关视听（AV）融合的最新结果。我们还将讨论一些挑战，并报告解决这些挑战的方法。AV融合中的一个重要问题是模态如何相互作用和相互影响。本节将在AV语音处理（尤其是语音识别）的背景下解决此问题，其中一个问题是模态既相互作用，又有时彼此不同步。有时会出现的另一个问
支持语音打字的小工具，翻译也很在行，咪鼠智能语音鼠标S5B上手2021-10-20 19:34:00

鼠标是我们平时工作学习时，经常要用到的工具，一般鼠标的功能都比较纯粹，不过最近我在用的一款鼠标，却多了不少非常实用的功能。这款叫做咪鼠智能语音鼠标S5B的小工具，除了可以作为鼠标使用之外，还可以借助强大的语音识别功能，实现打字、翻译之类的操作，从而大大提升日常工作学习的效率。
语音识别与 RNN-Transducer 概述2021-10-19 11:00:17

注：本文为一次课程展示所用幻灯片与报告存档。目录背景方法综述RNN-Transducer发展背景模型结构算法实现后记背景语音识别是一项可以使人与人、人与机器更加顺畅地交流的技术。近年来，语音识别相关的若干技术场景以及逐渐地改变了我们的工作和生活方式，如语音输入法、语音消息“转
2021-10-172021-10-17 14:29:58

媒道理高奇：全自动语音厅挂机项目个人语音厅月入过万十分轻松，厅里的兄弟姐妹们大家都很好很玩的开，而且可排麦可陪玩，我不会不缺老板麦位多不会排不上麦，没什么要求要女生男生会说话就可以，而且不用露脸时间自由，只要会聊天不会也会有聊天话术可教，每天最好工作个6-8小时
【语音识别】基于MFCC特征实现说话人语音识别matlab源码2021-10-16 22:58:28

1 模型采用能够反映人对语音的感知特性的Mel频率倒谱系数(MFCC)作为特征参数,以及为避免时间规整问题采用矢量量化技术开发的说话人识别系统.MFCC主要的是模拟人耳的听觉过程,相对于其它参数它对语音波形的变化不敏感,更加稳定,系统取得很好的识别结果,实验表明系统训练和识别
深度学习与人类语言处理学习笔记（一）—— 语音识别（理论篇）2021-10-14 17:01:07

文章目录 1. 语音识别概述1.1 Token的表示1.2 Acoustic Feature 2. 语音识别深度学习模型2.1 Listen，Attend，and Spell（LAS）2.2 CTC2.3 RNN-T2.4 Neural Transducer2.5 MoChA 3. 语音识别传统模型3.1 隐马尔可夫模型3.2 Tandem3.3 DNN-HMM Hybrid 4. Alignment和Language Model
文字转语音前端（google自带的语音合成,文字转声音）2021-10-14 10:02:50

1安装：npm install text2voice 2新建Text2Voice.js把下面的代码拷贝到这个js文件里 function Text2Voice() { this.name = "测试。。。 this.synth = window.speechSynthesi this.msg = new SpeechSynthesisUtterance(); this.msg.text = '你好。。。。。?';
webRTC中语音降噪模块ANS细节详解(一)2021-10-11 08:34:49

ANS(adaptive noise suppression) 是webRTC中音频相关的核心模块之一，为众多公司所使用。从2015年开始，我在几个产品中使用了webRTC的3A(AEC/ANS/AGC)模块。以前仅仅是使用，对其中的算法原理只是初步了解。近半年来，我利用业余时间在看着《语音增强：理论与实践》和《实时语音处理实践指
文字转语音怎么快速转换？分享电脑转换方法2021-10-09 19:02:04

随着短视频的不断发展，如今视频受到大家的关注度是越来越高，很多视频剪辑人员为了达到声画同步的效果，往往会给视频进行后期配音。自己录制的音频可能感情不是那么到位，为了视频的效果，大家一般是怎么将配音片段整理出来的呢？今天，来教大家一招文字转语音的技巧，轻松搞定视频配音。文字转
C# TTS 文字转语音2021-10-09 17:32:03

使用 System.Speech 可以很容易实现TTS。原代码如下： using System; using System.Collections.Generic; using System.ComponentModel; using System.Data; using System.Drawing; using System.Linq; using System.Speech.Synthesis; using System.Text; using System.Windows
技术大咖齐聚爱数智慧人机交互技术论坛 | CNCC20212021-10-09 12:00:13

CNCC2021【人机交互技术的机遇与挑战】技术论坛将于2021年10月28日13:00-16:00在深圳国际会展中心CC105B召开，本次论坛由CCF主办，爱数智慧创始人兼CEO张晴晴担任论坛主席，邀请来自产学研各界技术大咖，就人机交互、智能语音技术的应用、对话式AI技术、语料库建设、多模态语音交互技术
无人地磅自助机开发总结（九）语音播报2021-10-09 10:01:33

1.引用System.Speech.dll 简单使用 SpeechSynthesizer speechSynthesizer = new SpeechSynthesizer(); speechSynthesizer.Speak("欢迎使用"); 2.具体语音播放教程文档 https://www.wpf-tutorial.com/zh/102/%E9%9F%B3%E9%A2%91%E4%B8%8E%E8%A7%86%E9%A2%91/%E8%AF%AD

首页 < 4 5 6 7 8 > 尾页

ICode9

详解低延时高音质：编解码篇2021-11-09 23:05:19

有什么佩戴牢固舒适的蓝牙耳机？佩戴感最好的蓝牙耳机推荐2021-11-09 13:58:49

电话语音机器人系统可快速搭建部署2021-11-08 17:04:58

WAVENET-语音合成2021-11-07 23:02:00

联发科发布 8k 行新 Linux 内核驱动代码2021-11-06 19:33:28

小谈音视频质量检测2021-11-04 22:01:51

webRTC中语音降噪模块ANS细节详解(三)2021-11-02 08:33:29

uniapp+nvue实现仿微信App聊天应用 —— 成功实现好友聊天+语音视频通话功能2021-11-01 23:05:00

实时语音如何过质量关？2021-11-01 21:02:54

webRTC中语音降噪模块ANS细节详解(三)2021-11-01 08:34:36

【AI 全栈 SOTA 综述 】这些你都不知道，怎么敢说会 AI？【语音识别原理 + 实战】2021-10-25 21:32:30

uniapp+nvue开发之仿微信语音+视频通话功能 ：实现一对一语音视频在线通话2021-10-24 20:57:59

Java语言实现文本转语音2021-10-24 18:02:43

学习进度12021-10-23 23:04:02

支持语音打字的小工具，翻译也很在行，咪鼠智能语音鼠标S5B上手2021-10-20 19:34:00

语音识别与 RNN-Transducer 概述2021-10-19 11:00:17

2021-10-172021-10-17 14:29:58

【语音识别】基于MFCC特征实现说话人语音识别matlab源码2021-10-16 22:58:28

深度学习与人类语言处理学习笔记（一）—— 语音识别（理论篇）2021-10-14 17:01:07

文字转语音 前端 （google自带的语音合成,文字转声音）2021-10-14 10:02:50

webRTC中语音降噪模块ANS细节详解(一)2021-10-11 08:34:49

文字转语音怎么快速转换？分享电脑转换方法2021-10-09 19:02:04

C# TTS 文字转语音2021-10-09 17:32:03

技术大咖齐聚爱数智慧人机交互技术论坛 | CNCC20212021-10-09 12:00:13

无人地磅自助机开发总结（九）语音播报2021-10-09 10:01:33

【AI 全栈 SOTA 综述】这些你都不知道，怎么敢说会 AI？【语音识别原理 + 实战】2021-10-25 21:32:30

uniapp+nvue开发之仿微信语音+视频通话功能：实现一对一语音视频在线通话2021-10-24 20:57:59

文字转语音前端（google自带的语音合成,文字转声音）2021-10-14 10:02:50