短语音识别将口述音频转换为文本,通过API调用识别不超过一分钟的不同音频源发来的音频流或音频文件。适用于语音搜索、人机交互等语音交互识别场景。
将长段音频文件(5小时以内或文件大小在2G以下)转换成文本数据,商业用户可在6小时之内获得识别文本。适用于会议转写、字幕生成、音频内容分析等场景
将短音频(≤60秒)精准识别成文字,除中文普通话和英文外,支持51个语种、24种方言和1个民族语言,实时返回结果,达到边说边返回的效果,可提供公有云接口及私有化部署方案。
思必驰提供基于云+端混合引擎的连续语音识别,覆盖中文、英文、葡萄牙语等语种,粤、川、沪等方言,以及带方言的普通话。
实时语音识别是对不限时长的音频流做实时识别,达到“边说边出文字”的效果,内置智能断句,可提供每句话开始结束时间。可用于视频实时直播字幕、实时会议记录、实时法庭庭审记录、智能语音助手等场景。
提供全球领先的语音、图像、NLP等多项人工智能技术,共享AI领域最新的应用场景和解决方案。
语音转写可批量将音频文件(5小时以内)转换成文本数据,适用于语音质检、会议访谈等场景,可提供公有云接口及私有化部署方案