新东方AI开放平台依托新东方在教育行业的海量数据积累,把教育数据优势转化成教育行业的人工智能算法优势,为中国教育提供行业领先的OCR文字识别,语音智能,视觉智能,人脸关键点检测,...
实时语音转写可将不限时长的音频流实时识别为文字,并返回带有时间戳的文字流,新增翻译功能,适用于跨语种会议、国际赛事直播等多言语场景
将时长不超过5小时的语音转写成文字,让您从音频数据中挖掘更多信息和价值。
对用户上传的录音文件进行识别,上传完之后6小时内完成识别并返回识别文本。可用于呼叫中心语音质检、庭审数据库录入、会议记录总结、医院病历录入等场景。
基于Deep Peak2的端到端建模,将音频流实时识别为文字,并返回每句话的开始和结束时间,适用于长句语音输入、音视频字幕、会议等场景
让英语写作更简单
将文字转化为自然流畅的人声,提供100+发音人供您选择,支持多语种、多方言和中英混合,可灵活配置音频参数。