ICode9

精准搜索请尝试: 精确搜索
  • 2021-2027全球与中国语音生物识别解决方案市场调研及可行性研究报告2021-08-21 16:57:44

    【出版商】广州辰宇信息咨询有限公司 内容摘要 美国是最大的语音生物识别解决方案市场,约占45%的市场份额,其次是欧洲,约占21%的市场份额。主要的生产厂商有Nuance Communications, Synaptics, NICE, Verint Systems, Phonexia, Pindrop, SpeechPro, Sensory, SinoVoice, Daon, Uni

  • 详解ASR语音标注场景下的VAD语音端点检测丨曼孚科技2021-08-17 19:34:24

    20世纪50年代,人类开启了对机器语音识别的探索历程。 60年后的2016年,在深度神经网络技术的帮助下,机器语音识别的准确率第一次达到了与人类相近的水准,智能语音产品进入大规模商业化应用阶段。 目前,语音识别技术已深入日常生活的方方面面,语音助手、智能音箱、智能客服等都是较为典型

  • 【album】语音合成技术2021-08-06 17:00:07

    持续更新中。 基础 语音合成(Text To Speech,TTS),将文字转化为语音的一种技术。 语音合成技术 - 知乎 (zhihu.com) 论文推介:Glow-WaveGAN—学习一种用于高质量语音合成的语音表征 (qq.com) Tacotron/Tacotron2 TACOTRON:端到端的语音合成_左左左左想-CSDN博客 Tacotron&Tacotron2

  • 知识星球如何升级为正式星球 知识星球怎么创建星球2021-08-05 17:32:24

    打开知识星球,然后我们进入到星球界面,再点击创建星球。 知识星球如何升级为正式星球 知识星球怎么创建星球听语音 接着进入到创建界面,我们输入星球名字等信息,再点击下一步。 知识星球如何升级为正式星球 知识星球怎么创建星球听语音 然后我们需要选择星球类型,这里以免费星球为

  • vosk实时语音识别2021-08-03 20:02:34

    vosk介绍以及安装,参考地址:https://blog.csdn.net/qq_35385687/article/details/119209189?spm=1001.2014.3001.5501 文章目录 命令行方式直接转写websoket实现实时转写前端获取pcm实时传输至后台完整项目地址 命令行方式直接转写 #!/usr/bin/env python3 import argp

  • 使用Azero远程语音控制机械臂2021-08-02 19:03:12

    一、框架介绍 这里分为三个部分:控制设备端、服务端、执行部分(机械臂)。 1. 控制设备端:RTOS、Android、Linux、iOS、Windows 等主流系统和平台均已支持。这些设备既可以作为控制端的入口,也可作为被控制的 IoT 设备,这里采用音箱作为语音采集控制设备。 2. 服务端:技能的开发和部署属

  • 李宏毅_Transformer p12021-08-01 12:02:08

    Transformer_P1_Encoder 变形金刚的英文就是Transformer,那Transformer也跟我们之后会,提到的BERT有非常强烈的关係,所以这边有一个BERT探出头来,代表说Transformer跟BERT,是很有关係的 Sequence-to-sequence (Seq2seq) Transformer就是一个,==Sequence-to-sequence==的model,他

  • 语音转文字2021-07-31 18:02:39

    1 安装好搜狗输入法(讯飞输入法)在输入法处,可以点击选择搜狗输入法     2 要想让搜狗输入法记录电脑的声音为文字,必须在电脑右下角的白色喇叭上点右键选【声音】   3  打开【声音】后,选择录制,在立体声混音上点右键选【启用】 (如果不显示立体声混音,请在空白处选择显示禁用

  • 小程序上对接阿里的语音识别2021-07-30 19:32:25

    通过查询阿里官方文档,《实时语音识别》需要通过服务器中转实现,这里希望简单一点,直接客户端搞定,然后确定使用《一句话识别》中的RESTful API的方式。 实现语音识别分以下几个步骤: 1、小程序录音生成临时录音文件(阿里识别要求pcm编码); 音频格式:PCM编码、16bit采样位数、单声道(mono)

  • 招聘语音算法工程师2021-07-30 17:31:29

    岗位名称岗位职责资格条件(专业、年限)语音识别算法工程师1、负责语音识别声学模型的训练。 2、Decoding相关算法的研究和优化1、扎实的C++编程功底 2、211/985本科及以上学历,3年以上工作相关工作经历,计算机、数学类、信息技术类、模式识别等相关专业; 3、熟悉语音识别相关原理,如HM

  • 时光卷轴,往返于研究与开发之间 - 微软亚洲研究院副院长张益肇2021-07-27 09:31:07

    在微软亚洲研究院成立八个月之际,我带着妻儿举家来到北京开始了我研究生涯中的一个转折;2003年,在研究院成立五周年之际,我来到了由研究院孵化出的微软亚洲工程院,在一个全新的环境从事以前在微软未曾涉猎过的产品开发类工作;2008年,在研究院将要迎来它十周年生日的当儿,我又重新

  • 语音深度学习常用的特征:梅尔谱2021-07-23 22:31:26

    Mel spectrogram 梅尔谱 根据我们人类听觉的特性,我们对低频声音比较敏感,对高频声音没那么敏感 所以当声音频率线性增大时,频率越高,我们越难听出差别,因此不用线性谱而是对数谱 Mel谱包含三大特性: 时域-频域信息感知相关的振幅信息感知相关的频域信息 Mel谱的核心就是Mel-scale,

  • 如何在 iPhone 和 iPad 上使用语音备忘录?2021-07-23 17:31:06

    如果您是那种通过录制音频笔记来更好地记住事物的人,那么内置的语音备忘录应用程序是一种快速简便的解决方案。借助这款原生应用,您可以直接使用 iPhone 或 iPad 录制音频,并可以从任何带有 iCloud 的设备进行访问。无论是在学校的讲座、视频的画外音还是对他人的采访,您最好的 iPhone

  • 语义分割 是啥2021-07-22 10:04:17

    根据左图(input)输出右图(output) 语义:语音识别☞语音的意思;图像☞图像的内容,对图片意思的理解(三个人骑着三辆自行车) 分割:分割出图片中的不同对象,对原图中的每个像素都进行标注(粉红色代表人,绿色代表自行车) 应用:卫星遥感影像、无人车、医疗影像

  • 2021-07-212021-07-21 15:04:01

    消防车车载装备管理系统使用实测 近些年来,我国部分地区对于消防车车载装备管理都是采用人工化的管理模式,人工清点装备,人工监测查看相关消防救援装备的质量问题,与消防救援工具的准备完善问题。但是近些时日安徽凌讯网络推出了一套

  • 【语音增强】Coherence-based语音反混响【含Matlab源码 1026期】2021-07-21 13:02:17

    一、简介 对语音信号进行基于相干性的去混响 二、源代码 %DEMO_CDR_DEREVERB % % Demonstration of CDR-based noise and reverberation suppression. %演示CDR-based噪声和混响抑制 % To use this with your own recordings: % 1. Change wave filename % 2. Adapt micropho

  • DPCRN: Dual-Path Convolution Recurrent Network for Single Channel Speech Enhancement---论文翻译2021-07-21 09:29:47

    DPCRN:用于单通道语音增强的双路径卷积递归网络 Xiaohuai Le1;2;3, Hongsheng Chen1;2;3, Kai Chen1;2;3, Jing Lu1;2;31Key Laboratory of Modern Acoustics, Nanjing University, Nanjing 210093, China 2NJU-Horizon Intelligent Audio Lab, Horizon Robotics, Beijing 100

  • [语音识别] wenet2021-07-19 19:33:06

    Paper:   U2: Unified Streaming and Non-streaming Two-pass End-to-end Model for Speech Recognition WeNet: Production First and Production Ready End-to-End Speech Recognition Toolkit, v1. WeNet: Production Oriented Streaming and Non-streaming End-to-E

  • 基于百度AI实现的语音识别搜索文件2021-07-19 18:58:16

    网络安全课设:语音识别搜索文件 通过查询网上的方法,这里采用百度AI的方式来实现。百度语音识别链接:https://ai.baidu.com/tech/speech/asr 自己注册即可使用。 先上效果图: 百度AI需要区分中文和英文,故添加了一个复选框。搜索方式按照课设要求支持模糊搜索和精确搜索。保存路

  • 目前最好的家用投影仪,网友强烈推荐这款10款2021-07-19 15:32:44

    现在家用投影仪的体验已经普及到众多家庭当中,各种牌子投影仪又杂又多,那具体投影仪哪些牌子好呢,今天小编分享2021家用投影仪推荐:目前为止最好用的10大品牌,家用投影仪名单,网友公认额家用投影仪品牌排行前十名,一起来来看都有哪些牌子家用投影仪入榜 NO1.当贝D3X家用智能投影仪 价

  • Qt:声音播放或者语音播放的一些问题2021-07-19 09:32:53

      关于QMediaPlayer 使用时可以在主线程使用,但是在子线程使用或者在单例中并且把此单例类moveToThread到一个线程中 ,初始化要注意。 其他线程通过信号通知播放类的时候要注意。   关于QTextToSpeech 把文字转换成语音的时候,可以在主线程使用,可以在子线程使用,但是当在单例类线

  • 基于混合模型的语音降噪效果提升2021-07-19 08:34:03

    上篇文章(基于混合模型的语音降噪实践)实践了基于混合模型的算法来做语音降噪,有了一定的降噪效果。本篇说说怎么样来提升降噪效果。   算法里会算每个音素的高斯模型参数,也会建一个音素分类的神经网络模型。这些都是依赖于音素对齐的,音素对齐做的越好,每个音素的高斯模型越准确,音素

  • 语音识别中的HMM-GMM模型:从一段语音说起2021-07-18 21:03:48

      首发于图解语音识别 写文章 语音识别中的HMM-GMM模型:从一段语音说起 杨阳阳 想太多   197 人赞同了该文章 虽然现在端到端语音识别模型可以直接对后验概率建模,可以不需要HMM结构了。但实际上目前很多state-of-the-art模型还是以HMM结构为主,

  • 端点检测的双门限法2021-07-18 11:02:28

    端点检测的双门限法 双门限法主要是用短时能量和短时过零率。短时能量用于区分浊音(能量高) 和清音(能量低)短时过零率 zcr 用于区分清音(准确地说是清辅音)和静音,清 辅音 zcr 高,静音的 zcr 低。语音的两端是辅音: 元音:气流呼出口腔时不受到阻碍的音 辅音:气流受到口腔或者鼻腔阻碍的

  • Python speech语音2021-07-14 17:00:31

    在windows平台上利用Python将文本转化为语音输出,用作语音提示,这时就要用到speech模块。该模块的主要功能有:语音识别、将指定文本合成语音以及语音信号输出等。 1. 安装:pip install speech 2. Python3调用speech会报错,修改speech.py line59 修改 import thread 为 import threadi

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有