首页

文章

语音识别开放化开发平台有哪些

发布网友 发布时间:2022-04-20 03:17

我来回答

4个回答

热心网友 时间:2022-04-12 00:19

语音识别开发平台有很多,具体总结如下:(更详细的介绍参见本人的博文:几个常见的语音交互平台的简介和比较)1.商业化的语音交互平台1)微软SpeechAPI微软的SpeechAPI(简称为SAPI)是微软推出的包含语音识别(SR)和语音合成(SS)引擎的应用编程接口(API),在Windows下应用广泛。目前,微软已发布了多个SAPI版本(最新的是SAPI5.4版),这些版本要么作为于SpeechSDK开发包发布,要么直接被包含在windows操作系统中发布。SAPI支持多种语言的识别和朗读,包括英文、中文、日文等。2).IBMviaVoiceIBM是较早开始语音识别方面的研究的机构之一,早在20世纪50年代末期,IBM就开始了语音识别的研究,计算机被设计用来检测特定的语言模式并得出声音和它对应的文字之间的统计相关性。1999年,IBM发布了VoiceType的一个免费版。2003年,IBM授权ScanSoft公司拥有基于ViaVoice的桌面产品的全球独家经销权,随后ScanSoft与Nuance合并,如今viaVoice早已淡出人们的视线,取而代之的是Nuance。3)NuanceNuance通讯是一家*计算机软件技术公司,总部设在美国马萨诸塞州伯灵顿,主要提供语音和图像方面的解决方案和应用。目前的业务集中在服务器和嵌入式语音识别,电话转向系统,自动电话目录服务等。Nuance语音技术除了语音识别技术外,还包扩语音合成、声纹识别等技术。世界语音技术市场,有超过80%的语音识别是采用Nuance识别引擎技术,其名下有超过1000个专利技术,公司研发的语音产品可以支持超过50种语言,在全球拥有超过20亿用户。苹果的iPhone4S的Siri语音识别中就应用了Nuance的语音识别服务。4)科大讯飞科大讯飞作为中国最大的智能语音技术提供商,在智能语音技术领域有着长期的研究积累,并在中文语音合成、语音识别、口语评测等多项技术上拥有国际领先的成果。占有中文语音技术市场60%以上市场份额,语音合成产品市场份额达到70%以上。5)其他其他的影响力较大商用语音交互平台有谷歌的语音搜索(GoogleVoiceSearch),百度和搜狗的语音输入法等等。2.开源的语音交互平台1)CMU-SphinxCMU-Sphinx也简称为Sphinx(狮身人面像),是卡内基-梅隆大学(CarnegieMellonUniversity,CMU)开发的一款开源的语音识别系统,它包括一系列的语音识别器和声学模型训练工具。最早的Sphinx-I由@李开复(Kai-FuLee)于1987年左右开发,使用了固定的HMM模型(含3个大小为256的codebook),它被号称为第一个高性能的连续语音识别系统(在ResourceManagement数据库上准确率达到了90%+)。最新的Sphinx语音识别系统包含如下软件包:Pocketsphinx—recognizerlibrarywritteninC.Sphinxbase—supportlibraryrequiredbyPocketsphinxSphinx4—adjustable,modifiablerecognizerwritteninJavaCMUclmtk—languagemodeltoolsSphinxtrain—acousticmodeltrainingtools这些软件包的可执行文件和源代码在sourceforge上都可以免费下载得到。2)HTKHTK是HiddenMarkovModelToolkit(隐马尔科夫模型工具包)的简称,HTK主要用于语音识别研究,最初是由剑桥大学工程学院(CambridgeUniversityEngineeringDepartment,CUED)的机器智能实验室(前语音视觉及机器人组)于1989年开发的,它被用来构建CUED的大词汇量的语音识别系统。HTK的最新版本是09年发布的3.4.1版,关于HTK的实现原理和各个工具的使用方法可以参看HTK的文档HTKBook。3)JuliusJulius是一个高性能、双通道的大词汇量连续语音识别(largevocabularycontinuesspeechrecognition,LVCSR)的开源项目,适合于广大的研究人员和开发人员。它使用3-gram及上下文相关的HMM,在当前的PC机上能够实现实时的语音识别,单词量达到60k个。4)RWTHASR该工具箱包含最新的自动语音识别技术的算法实现,它由RWTHAachen大学的HumanLanguageTechnologyandPatternRecognitionGroup开发。RWTHASR工具箱包括声学模型的构建、解析器等重要部分,还包括说话人自适应组件、说话人自适应训练组件、非监督训练组件、个性化训练和单词词根处理组件等。5)其他上面提到的开源工具箱主要都是用于语音识别的,其他的开源语音识别项目还有Kaldi、simon、iATROS-speech、SHoUT、ZanzibarOpenIVR等。

热心网友 时间:2022-04-12 01:37

语音识别开发平台有很多,具体总结如下:(更详细的介绍参见本人的博文:几个常见的语音交互平台的简介和比较) 1.商业化的语音交互平台 1)微软Speech API 微软的Speech API(简称为SAPI)是微软推出的包含语音识别(SR)和语音合成(SS)引擎

热心网友 时间:2022-04-12 03:12

下面就给楼主分析一个语音识别的开放化的平台,如下:

第一:打开文字识别软件,关闭提示窗,选择上面的语音识别功能;

第二:通过左上角把需要识别的语音文件添加进去;

第三:点击右边的开始识别按钮,开始进行语音识别。

等一会便会识别成功的,识别成功的语音文字,会显示在右边,然后点击右下角的保存为TXT文档按钮。

希望上面的方法可以帮助到您!

热心网友 时间:2022-04-12 05:03

众所周知,语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。语音识别技术主要包括特征提取技术、模式匹配准则及模型训练技术三个方面。换句话说,就是把语音、声音转化为文字。

而关于这样的语音识别平台,市面上其实有很多,接入方式都大同小异,区别在于其响应时长及识别准确率。标贝科技作为一家聚焦智能语音技术研发与应用公司,自然缺不了语音识别平台的开放化。

标贝开放平台

语音识别产品服务包括:

• 一句话识别,即对时长较短(60秒以内)的语音进行实时转写识别,让机器能够听懂人类的语言;适用于较短的语音交互场景,如语音搜索、语音指令、语音短消息等。

• 长语音识别,即对于不限时长的语音输入进行实时转写,能够根据用户预期进行自动断句和标点符号添加;适用于长时间语音输入场景,例如会议记录、客服电话等。

• 录音文件识别,即对用户录制的语音文件进行非实时的转写处理;适用于大量的用户语音离线转写,对实时性要求不高,例如客服电话语音质检,字幕后期制作等。

八月中国最凉快的地方 八月份哪里最凉快,去哪旅游好?美丽的地方 乱字同韵字是什么意思 华硕笔记本电脑触摸板怎么开笔记本电脑触摸板怎么开启和关闭_百度知 ... 陕西职务侵占案立案准则 结婚后我的恋情维系了十年,怎么做到的? 玉米仁子饭产自哪里 中国期货交易所的交易品种有哪些? 历史要怎么读,有啥诀窍 高中历史诀窍 年终会活动策划方案 深度解析:第一财经回放,探索财经新风向 逆水寒手游庄园怎么邀请好友同住 逆水寒手游 逆水寒不同区可以一起组队吗? 逆水寒手游 逆水寒怎么进入好友世界? 逆水寒手游 逆水寒怎么去别人的庄园? 使用puppeteer实现将htmll转成pdf 内卷时代下的前端技术-使用JavaScript在浏览器中生成PDF文档 【译】将HTML转为PDF的几种实现方案 变形金刚08动画怎么样 变形金刚08动画的问题 变形金刚08动画日语版剧情介绍 高分!换显卡nvidia控制面板被我卸了,重新安装显卡驱动后没了nvidia控... 我的nvidia控制面板被卸载了 怎么找回啊 卸载后 这个画面看着很奇怪_百 ... 李卓彬工作简历 林少明工作简历 广东工业职业技术学院怎么样 郑德涛任职简历 唐新桂个人简历 土地入股的定义 ups快递客服电话24小时 贷款记录在征信保留几年? 安徽徽商城有限公司公司简介 安徽省徽商集团新能源股份有限公司基本情况 安徽省徽商集团有限公司经营理念 2019哈尔滨煤气费怎么有税? 快手删除的作品如何恢复 体育理念体育理念 有关体育的格言和理念 什么是体育理念 万里挑一算彩礼还是见面礼 绿萝扦插多少天后发芽 绿萝扦插多久发芽 扦插绿萝多久发芽 炖牛排骨的做法和配料 网络诈骗定罪标准揭秘 “流水不争先”是什么意思? mc中钻石装备怎么做 为什么我的MC里的钻石块是这样的?我想要那种。是不是版本的问题?如果是... 带“偷儿”的诗句 语音识别软件。可以显示字的。 在线急等 qq语音识别是怎么用 语音识别成文字的软件 如何关闭w10的语音识别?每次开机都显示,麻烦死了。 哈弗H7(银标)如何打开语音识别功能? 语音识别是指什么 英文语音识别(音频转换为文字)软件有哪些好用的? windows语音识别不能用于当前的显示语言怎么办 如何实现简单的语音识别 只要打开手机,呼叫智能语音助手,丰富的信息实时显... QQ聊天中的语音识别怎么用 windows7语音识别的使用语音识别的方法: win10系统,语音识别,显示语音识别不能用于当前显... 手机是怎样来实现语音识别的 Win7如何启用与配置语音识别 微信同声传译怎么实现长时间实时语音识别 公路货物运输合同的公路货物运输合同的范本 承包合同范本,承包合同怎么写? 车辆合作运输协议范本 土石方工程要提供车队资料才签合同的吗 语音识别会给日常生活工作带来哪些改变? 语音识别的最新进展 在来例假的时候,到底能不能运动呢? 语音识别出现错误怎么办 女生例假期间能运动吗 山地车前轴怎么拆卸这种的? 山地车前轮如何拆下来 山地车的前叉怎么拆下来? 山地车前轮快拆怎么拆 山地车前叉怎么拆? 山地车前面的变速器怎么拆下来?(不是换挡指拨) 是不是一般山地自行车都可以拆卸? 怎样拆洗山地车前避震器? 山地车怎么拆花鼓 怎么拆迪卡龙侬山地自行车的前轮? 自行车前避震怎么拆开 如何将自行车的前车把和前叉拆下来 自行车拆装步骤有哪些? 山地自行车油碟前轮的快拆怎么快速安全拆下来? 自行车赛车前变速器怎么拆掉?
声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com