把语音(≤60秒)转换成对应的文字信息,适用于较短的语音交互场景,如语音搜索、语音输入、语音控制等
将短文本( ≤ 500 字符 )转换成自然流畅的语音,支持多种音色,并提供调节音量、语速、音高、亮度等功能。适用于智能客服、语音交互、导航播报等场景。
将长文本(≤5万字符)转换成自然流畅的语音,提供更多音色、不同情感的发音人,适用于文学阅读、新闻播报、自媒体配音等场景。合成音可供下载使用。
云知声AI开放平台以智能语音技术为核心,提供语音识别、语音合成、语音分析、语义理解等人工智能服务,为全行业开发者提供一站式人工智能语音交互技术方案。
将长段音频文件(5小时以内或文件大小在2G以下)转换成文本数据,商业用户可在6小时之内获得识别文本。适用于会议转写、字幕生成、音频内容分析等场景
对长段音频流做实时识别,达到“边说边出文字”的效果,适用于实时会议、直播字幕等场景