短语音识别将口述音频转换为文本,通过API调用识别不超过一分钟的不同音频源发来的音频流或音频文件。适用于语音搜索、人机交互等语音交互识别场景。
对用户上传的录音文件进行识别,上传完之后6小时内完成识别并返回识别文本。可用于呼叫中心语音质检、庭审数据库录入、会议记录总结、医院病历录入等场景。
免费为开发者提供语音合成(TTS)、语音识别(ASR)、手写识别(HWR)、光学字符识别(OCR)、语义理解(NLU)、机器翻译(MT)等全方位智能人机交互能力
基于Deep Peak2的端到端建模,将音频流实时识别为文字,并返回每句话的开始和结束时间,适用于长句语音输入、音视频字幕、会议等场景
一边接收音频数据,一边提供转写结果,让您能够实时获取和利用文字信息
把小米在人工智能领域的技术积累对外输出,我们提供多种能力给开发者,帮助开发者实现更多可能
华为云为用户提供云服务器,云数据库,云存储,CDN,大数据,云安全等公有云产品和电商,金融,游戏等多种解决方案,7x24小时客服支持,帮助企业轻松上云-华为云