让你的产品能听会说
将时长不超过60秒的语音转写成文字,让您的应用听懂人类语言
基于深度神经网络技术,为客户提供自然、流畅、高音质的语音合成服务,并支持音色、音量、语速、停顿、分词等自定义调节。
在线AI写作助理
一句话识别可对一分钟以内的语音进行实时识别,适用于较短的语音交互场景,如语音搜索、语音指令、语音短消息等。 可集成在各类App、智能家电、智能助手等产品中。
对长段音频流做实时识别,达到“边说边出文字”的效果,适用于实时会议、直播字幕等场景
把小米在人工智能领域的技术积累对外输出,我们提供多种能力给开发者,帮助开发者实现更多可能