
服务商
科大讯飞作为中国最大的智能语音技术提供商,在智能语音技术领域有着长期的研究积累,并在中文语音合成、语音识别、口语评测等多项技术上拥有国际领先的成果。
科大讯飞是我国唯一以语音技术为产业化方向的“国家863计划成果产业化基地”、“国家规划布局内重点软件企业”、“国家火炬计划重点高新技术企业”、“国家高技术产业化示范工程”,并被信息产业部确定为中文语音交互技术标准工作组组长单位,牵头制定中文语音技术标准。
产品介绍
产品优势

应用场景

常见问题
1、 “语音转写 ”与 “语音听写 ”的区别是?
产品名称 | 支持的音频时长 | 使用场景 |
语音听写 | 一分钟以内 | 人机对话,如输入法、语音搜索 |
语音转写 | 五小时以内 | 更自然地贴近日常的对话、演讲 |
2、 “已录制音频转写”和“实时音频流转写”的区别是?
已录制音频转写:将预先录制完毕的完整音频文件传输至云端,转写服务处理完成后将输出此音频对应的完整文字结果。该流程为异步&非实时;
实时音频流转写:在采集音频的同时,连续上传音频流至云端,转写服务将实时返回文字结果,实现文字和声音的同步展现。
3、语音转写支持什么语言?
答:默认支持中文、英文、中英混合识别;中文包括普通话、天津话、河北话、东北话、甘肃话、山东话、太原话;其他方言/语种需购买套餐或语种授权。目前可支持:
l 方言:广东话、河南话、西南官话(云南话、贵州话、重庆话、四川话)
l 语种:中文、英文、日语、韩语、法语、俄语、越南语、西班牙语
l 民族语言:藏语、维语
4、目前语音转写支持的音频格式为:
已录制音频(5小时内),wav,flac,opus,m4a,mp3,单声道&多声道;采样率:8KHz,16KHz
5、语音转写支不支持并发?
答:支持,要保证同一个appid每秒请求接口次数最大值在20次以下。
相关导航

为开发者和企业提供全球领先的及声学、语义、对话、机器学习、知识表示及推理等多项人工智能技术,通过平台赋能至,客服,商业,市政,医疗等领域、让社会共享AI领域最新的应用场景和解决方案,帮您提升竞争力。

短语音听写-依图
将时长不超过60秒的语音转写成文字,让您的应用听懂人类语言

百度文心一格
AI艺术与创意辅助平台

智慧金融解决方案-云从科技
云从科技致力于成为中国金融业智能化转型的合作伙伴,立足AI、大数据等技术,构建金融核心业务的场景化应用,助力金融行业在客户体验、效率与安全合规等方面的智能化升级。

语音唤醒-思必驰
语音唤醒(Voice Wakeuper)是人机对话的第一步。通过在设备或软件中预制唤醒词,将设备在休眠待机的状态中唤醒,进入等待指令的状态

短语音识别-百度AI
将60秒以内的语音精准识别为文字,可适用于手机语音输入、智能语音交互、语音指令、语音搜索等短语音交互场景

实时语音识别-阿里云
实时语音识别是对不限时长的音频流做实时识别,达到“边说边出文字”的效果,内置智能断句,可提供每句话开始结束时间。可用于视频实时直播字幕、实时会议记录、实时法庭庭审记录、智能语音助手等场景。

中英文口语评测-驰声
驰声是国内知名中英文语音评测技术供应商,在线语音识别引擎发音纠错技术、中英文口语评测、人工智能发音打分技术、AI口语训练技术、口语作业、中高考英语听说考试评分技术等面向儿童、成人、K12学生,维度全,功能多,平台稳,效率高,被誉为中国语言教育产品的智能语音工具包。