短语音识别将口述音频转换为文本,通过API调用识别不超过一分钟的不同音频源发来的音频流或音频文件。适用于语音搜索、人机交互等语音交互识别场景。
把小米在人工智能领域的技术积累对外输出,我们提供多种能力给开发者,帮助开发者实现更多可能
将批量上传的音频文件识别为文字,12小时内返回识别结果。适合录音质检、会议内容总结、音频内容分析等场景
将时长不超过5小时的语音转写成文字,让您从音频数据中挖掘更多信息和价值。
将时长不超过60秒的语音转写成文字,让您的应用听懂人类语言
思必驰提供基于云+端混合引擎的连续语音识别,覆盖中文、英文、葡萄牙语等语种,粤、川、沪等方言,以及带方言的普通话。
免费为开发者提供语音合成(TTS)、语音识别(ASR)、手写识别(HWR)、光学字符识别(OCR)、语义理解(NLU)、机器翻译(MT)等全方位智能人机交互能力