语音识别 - AI导航

语音识别

短语音识别_科大讯飞

将短音频（≤60秒）精准识别成文字，除中文普通话和英文外，支持51个语种、24种方言和1个民族语言，实时返回结果，达到边说边返回的效果，可提供公有云接口及私有化部署方案。

短语音识别-百度AI

将60秒以内的语音精准识别为文字，可适用于手机语音输入、智能语音交互、语音指令、语音搜索等短语音交互场景

一句话识别-阿里云

一句话识别可对一分钟以内的语音进行实时识别，适用于较短的语音交互场景，如语音搜索、语音指令、语音短消息等。可集成在各类App、智能家电、智能助手等产品中。

一句话识别-云知声

把语音(≤60秒)转换成对应的文字信息，适用于较短的语音交互场景，如语音搜索、语音输入、语音控制等

语音识别_思必驰

思必驰提供基于云+端混合引擎的连续语音识别，覆盖中文、英文、葡萄牙语等语种，粤、川、沪等方言，以及带方言的普通话。

短语音听写-依图

将时长不超过60秒的语音转写成文字，让您的应用听懂人类语言

长语音识别-依图

将时长不超过5小时的语音转写成文字，让您从音频数据中挖掘更多信息和价值。

录音文件识别-科大讯飞

语音转写可批量将音频文件（5小时以内）转换成文本数据，适用于语音质检、会议访谈等场景，可提供公有云接口及私有化部署方案

录音文件识别-阿里云

录音文件识别-阿里云

对用户上传的录音文件进行识别，上传完之后6小时内完成识别并返回识别文本。可用于呼叫中心语音质检、庭审数据库录入、会议记录总结、医院病历录入等场景。

音频文件转写-百度AI

将批量上传的音频文件识别为文字，12小时内返回识别结果。适合录音质检、会议内容总结、音频内容分析等场景

音频文件转写-云知声

将长段音频文件（5小时以内或文件大小在2G以下）转换成文本数据，商业用户可在6小时之内获得识别文本。适用于会议转写、字幕生成、音频内容分析等场景

实时语音转写-云知声

对长段音频流做实时识别，达到“边说边出文字”的效果，适用于实时会议、直播字幕等场景

腾讯AI开放平台

腾讯AI开放平台

提供全球领先的语音、图像、NLP等多项人工智能技术，共享AI领域最新的应用场景和解决方案。

实时语音识别-科大讯飞

实时语音转写可将不限时长的音频流实时识别为文字，并返回带有时间戳的文字流，新增翻译功能，适用于跨语种会议、国际赛事直播等多言语场景

实时语音识别-百度AI

基于Deep Peak2的端到端建模，将音频流实时识别为文字，并返回每句话的开始和结束时间，适用于长句语音输入、音视频字幕、会议等场景

实时语音识别-阿里云

实时语音识别是对不限时长的音频流做实时识别，达到“边说边出文字”的效果，内置智能断句，可提供每句话开始结束时间。可用于视频实时直播字幕、实时会议记录、实时法庭庭审记录、智能语音助手等场景。

实时语音转写-依图

一边接收音频数据，一边提供转写结果，让您能够实时获取和利用文字信息

好未来AI开放平台

好未来AI开放平台，依托多年教育行业经验与海量行业数据优势，深耕教育领域人工智能技术创新，为广大教育行业伙伴提供领先的AI能力与解决方案，助力教育智能化发展

小米小爱开放平台

小米小爱开放平台

把小米在人工智能领域的技术积累对外输出，我们提供多种能力给开发者，帮助开发者实现更多可能

捷通华声

免费为开发者提供语音合成(TTS)、语音识别(ASR)、手写识别(HWR)、光学字符识别(OCR)、语义理解(NLU)、机器翻译(MT)等全方位智能人机交互能力

一句话识别-华为云

一句话识别-华为云

短语音识别将口述音频转换为文本，通过API调用识别不超过一分钟的不同音频源发来的音频流或音频文件。适用于语音搜索、人机交互等语音交互识别场景。

华为云AI

华为云AI

华为云为用户提供云服务器,云数据库,云存储,CDN,大数据,云安全等公有云产品和电商,金融,游戏等多种解决方案,7x24小时客服支持,帮助企业轻松上云-华为云

短语音识别-有道智云

有道智云提供神经网络翻译、文字识别OCR服务以及行业解决方案，具备在线/离线翻译、在线OCR识别功能。

极限元

极限元智能科技在智能语音、计算机视觉、自然语言处理、大数据分析等技术领域有多年技术积累，推出了一些系列云端、桌面端、移动端、嵌入式端的跨平台AI技术解决方案，产品和服务广泛应用在教育、安全、交通、智能硬件、泛娱乐等多个行业。

出门问问AI开放平台

让你的产品能听会说