语音技术

语音合成

在线语音合成-科大讯飞

将文字转化为自然流畅的人声，提供100+发音人供您选择，支持多语种、多方言和中英混合，可灵活配置音频参数。

离线语音合成-科大讯飞

将文字信息转化为声音信息，让应用具备离线语音合成的能力。即让机器像人一样开口说话，给开发者的应用配上“嘴巴”

短文本在线合成-百度AI

基于业界领先的深度神经网络技术，提供高度拟人、流畅自然的语音合成服务，让您的应用、设备开口说话，更具个性

语音合成-阿里云

高拟真度、灵活配置的语音合成产品，打通人机交互的闭环，让应用逼真发声。多种音色可供选择，并提供调节语速、语调、音量等功能。

短文本语音合成-云知声

将短文本（ ≤ 500 字符）转换成自然流畅的语音，支持多种音色，并提供调节音量、语速、音高、亮度等功能。适用于智能客服、语音交互、导航播报等场景。

长文本语音合成-云知声

将长文本（≤5万字符）转换成自然流畅的语音，提供更多音色、不同情感的发音人，适用于文学阅读、新闻播报、自媒体配音等场景。合成音可供下载使用。

离线语音合成-百度AI

在无网或弱网环境下，可在手机APP或故事机、机器人等智能硬件设备终端进行语音播报，将文字合成为声音，提供稳定一致、流畅自然的合成体验

语音合成-思必驰

基于深度神经网络技术，为客户提供自然、流畅、高音质的语音合成服务，并支持音色、音量、语速、停顿、分词等自定义调节。

语音合成-有道智云

智能语音合成（text-to-speech，TTS）满足一般语言的文本转换为语音的需求，让您的应用或设备开口说话，让发音更自然和专业，助力提升人机交互体验。

腾讯AI开放平台

腾讯AI开放平台

提供全球领先的语音、图像、NLP等多项人工智能技术，共享AI领域最新的应用场景和解决方案。

好未来AI开放平台

好未来AI开放平台，依托多年教育行业经验与海量行业数据优势，深耕教育领域人工智能技术创新，为广大教育行业伙伴提供领先的AI能力与解决方案，助力教育智能化发展

小米小爱开放平台

小米小爱开放平台

把小米在人工智能领域的技术积累对外输出，我们提供多种能力给开发者，帮助开发者实现更多可能

捷通华声

免费为开发者提供语音合成(TTS)、语音识别(ASR)、手写识别(HWR)、光学字符识别(OCR)、语义理解(NLU)、机器翻译(MT)等全方位智能人机交互能力

华为云AI

华为云AI

华为云为用户提供云服务器,云数据库,云存储,CDN,大数据,云安全等公有云产品和电商,金融,游戏等多种解决方案,7x24小时客服支持,帮助企业轻松上云-华为云

极限元

极限元智能科技在智能语音、计算机视觉、自然语言处理、大数据分析等技术领域有多年技术积累，推出了一些系列云端、桌面端、移动端、嵌入式端的跨平台AI技术解决方案，产品和服务广泛应用在教育、安全、交通、智能硬件、泛娱乐等多个行业。

出门问问AI开放平台

让你的产品能听会说

语音唤醒

语音唤醒-科大讯飞

设备(手机、玩具、家电等)在休眠或锁屏状态下也能检测到用户的声音(设定的语音指令，即唤醒词)，让处于休眠状态下的设备直接进入到等待指令状态，开启语音交互第一步

语音唤醒-百度AI开放平台

支持特定语音指令唤醒，唤醒的同时执行指令操作，轻量级，低功耗，可自定义设置多个唤醒词，为您的应用打造自然流畅的对话

语音唤醒-思必驰

语音唤醒（Voice Wakeuper）是人机对话的第一步。通过在设备或软件中预制唤醒词，将设备在休眠待机的状态中唤醒，进入等待指令的状态

云知声AI开放平台

云知声AI开放平台以智能语音技术为核心，提供语音识别、语音合成、语音分析、语义理解等人工智能服务，为全行业开发者提供一站式人工智能语音交互技术方案。

小米小爱开放平台

小米小爱开放平台

把小米在人工智能领域的技术积累对外输出，我们提供多种能力给开发者，帮助开发者实现更多可能

捷通华声

免费为开发者提供语音合成(TTS)、语音识别(ASR)、手写识别(HWR)、光学字符识别(OCR)、语义理解(NLU)、机器翻译(MT)等全方位智能人机交互能力

语音翻译

讯飞开放平台

为开发者和企业提供智能语音技术、计算机视觉和自然语音处理技术，一站式人机智能语音交互解决方案

语音评测

语音评测-科大讯飞

对中英文的朗读发音进行评分和问题定位。支持字、词、句、篇章等题型，并返回准确度、流畅度、完整度、声韵调型等多维度评分。为各年龄提供不同的打分标准。

中英文口语评测-驰声

中英文口语评测-驰声

驰声是国内知名中英文语音评测技术供应商，在线语音识别引擎发音纠错技术、中英文口语评测、人工智能发音打分技术、AI口语训练技术、口语作业、中高考英语听说考试评分技术等面向儿童、成人、K12学生，维度全，功能多，平台稳，效率高，被誉为中国语言教育产品的智能语音工具包。

口语评测-云知声

基于语音识别和评价技术对发音做客观打分，反馈发音正误和定位问题，有助于语音教学，发音练习，也可测试考生的口语水平。

思必驰提供语音识别，语音合成，语义理解，智能对话，声纹识别服务，开放平台。

好未来AI开放平台

好未来AI开放平台，依托多年教育行业经验与海量行业数据优势，深耕教育领域人工智能技术创新，为广大教育行业伙伴提供领先的AI能力与解决方案，助力教育智能化发展

语音识别

短语音识别_科大讯飞

将短音频（≤60秒）精准识别成文字，除中文普通话和英文外，支持51个语种、24种方言和1个民族语言，实时返回结果，达到边说边返回的效果，可提供公有云接口及私有化部署方案。

短语音识别-百度AI

将60秒以内的语音精准识别为文字，可适用于手机语音输入、智能语音交互、语音指令、语音搜索等短语音交互场景

一句话识别-阿里云

一句话识别可对一分钟以内的语音进行实时识别，适用于较短的语音交互场景，如语音搜索、语音指令、语音短消息等。可集成在各类App、智能家电、智能助手等产品中。

一句话识别-云知声

把语音(≤60秒)转换成对应的文字信息，适用于较短的语音交互场景，如语音搜索、语音输入、语音控制等

语音识别_思必驰

思必驰提供基于云+端混合引擎的连续语音识别，覆盖中文、英文、葡萄牙语等语种，粤、川、沪等方言，以及带方言的普通话。

短语音听写-依图

将时长不超过60秒的语音转写成文字，让您的应用听懂人类语言

长语音识别-依图

将时长不超过5小时的语音转写成文字，让您从音频数据中挖掘更多信息和价值。

录音文件识别-科大讯飞

语音转写可批量将音频文件（5小时以内）转换成文本数据，适用于语音质检、会议访谈等场景，可提供公有云接口及私有化部署方案

录音文件识别-阿里云

录音文件识别-阿里云

对用户上传的录音文件进行识别，上传完之后6小时内完成识别并返回识别文本。可用于呼叫中心语音质检、庭审数据库录入、会议记录总结、医院病历录入等场景。

音频文件转写-百度AI

将批量上传的音频文件识别为文字，12小时内返回识别结果。适合录音质检、会议内容总结、音频内容分析等场景

音频文件转写-云知声

将长段音频文件（5小时以内或文件大小在2G以下）转换成文本数据，商业用户可在6小时之内获得识别文本。适用于会议转写、字幕生成、音频内容分析等场景

实时语音转写-云知声

对长段音频流做实时识别，达到“边说边出文字”的效果，适用于实时会议、直播字幕等场景

腾讯AI开放平台

腾讯AI开放平台

提供全球领先的语音、图像、NLP等多项人工智能技术，共享AI领域最新的应用场景和解决方案。

实时语音识别-科大讯飞

实时语音转写可将不限时长的音频流实时识别为文字，并返回带有时间戳的文字流，新增翻译功能，适用于跨语种会议、国际赛事直播等多言语场景

实时语音识别-百度AI

基于Deep Peak2的端到端建模，将音频流实时识别为文字，并返回每句话的开始和结束时间，适用于长句语音输入、音视频字幕、会议等场景

实时语音识别-阿里云

实时语音识别是对不限时长的音频流做实时识别，达到“边说边出文字”的效果，内置智能断句，可提供每句话开始结束时间。可用于视频实时直播字幕、实时会议记录、实时法庭庭审记录、智能语音助手等场景。

实时语音转写-依图

一边接收音频数据，一边提供转写结果，让您能够实时获取和利用文字信息

好未来AI开放平台

好未来AI开放平台，依托多年教育行业经验与海量行业数据优势，深耕教育领域人工智能技术创新，为广大教育行业伙伴提供领先的AI能力与解决方案，助力教育智能化发展

小米小爱开放平台

小米小爱开放平台

把小米在人工智能领域的技术积累对外输出，我们提供多种能力给开发者，帮助开发者实现更多可能

捷通华声

免费为开发者提供语音合成(TTS)、语音识别(ASR)、手写识别(HWR)、光学字符识别(OCR)、语义理解(NLU)、机器翻译(MT)等全方位智能人机交互能力

一句话识别-华为云

一句话识别-华为云

短语音识别将口述音频转换为文本，通过API调用识别不超过一分钟的不同音频源发来的音频流或音频文件。适用于语音搜索、人机交互等语音交互识别场景。

华为云AI

华为云AI

华为云为用户提供云服务器,云数据库,云存储,CDN,大数据,云安全等公有云产品和电商,金融,游戏等多种解决方案,7x24小时客服支持,帮助企业轻松上云-华为云

短语音识别-有道智云

有道智云提供神经网络翻译、文字识别OCR服务以及行业解决方案，具备在线/离线翻译、在线OCR识别功能。

极限元

极限元智能科技在智能语音、计算机视觉、自然语言处理、大数据分析等技术领域有多年技术积累，推出了一些系列云端、桌面端、移动端、嵌入式端的跨平台AI技术解决方案，产品和服务广泛应用在教育、安全、交通、智能硬件、泛娱乐等多个行业。

出门问问AI开放平台

让你的产品能听会说