
服务商
科大讯飞作为中国最大的智能语音技术提供商,在智能语音技术领域有着长期的研究积累,并在中文语音合成、语音识别、口语评测等多项技术上拥有国际领先的成果。
科大讯飞是我国唯一以语音技术为产业化方向的“国家863计划成果产业化基地”、“国家规划布局内重点软件企业”、“国家火炬计划重点高新技术企业”、“国家高技术产业化示范工程”,并被信息产业部确定为中文语音交互技术标准工作组组长单位,牵头制定中文语音技术标准。
产品介绍
产品优势

应用场景

常见问题
1、 “语音转写 ”与 “语音听写 ”的区别是?
产品名称 | 支持的音频时长 | 使用场景 |
语音听写 | 一分钟以内 | 人机对话,如输入法、语音搜索 |
语音转写 | 五小时以内 | 更自然地贴近日常的对话、演讲 |
2、 “已录制音频转写”和“实时音频流转写”的区别是?
已录制音频转写:将预先录制完毕的完整音频文件传输至云端,转写服务处理完成后将输出此音频对应的完整文字结果。该流程为异步&非实时;
实时音频流转写:在采集音频的同时,连续上传音频流至云端,转写服务将实时返回文字结果,实现文字和声音的同步展现。
3、语音转写支持什么语言?
答:默认支持中文、英文、中英混合识别;中文包括普通话、天津话、河北话、东北话、甘肃话、山东话、太原话;其他方言/语种需购买套餐或语种授权。目前可支持:
l 方言:广东话、河南话、西南官话(云南话、贵州话、重庆话、四川话)
l 语种:中文、英文、日语、韩语、法语、俄语、越南语、西班牙语
l 民族语言:藏语、维语
4、目前语音转写支持的音频格式为:
已录制音频(5小时内),wav,flac,opus,m4a,mp3,单声道&多声道;采样率:8KHz,16KHz
5、语音转写支不支持并发?
答:支持,要保证同一个appid每秒请求接口次数最大值在20次以下。
相关导航

云孚科技致力为客户提供智能信息处理的一站式解决方案,核心产品包括云孚语义中台YFNLP,云孚知识图谱YFKG,云孚对话平台YFBOT,云孚热点事件YFHOT和云孚开源情报YFINT,在事件抽取,脉络,文本挖掘,处理,开源情报等方面优异,系统强大,云孚产品已服务行业数十家头部客户

极限元
极限元智能科技在智能语音、计算机视觉、自然语言处理、大数据分析等技术领域有多年技术积累,推出了一些系列云端、桌面端、移动端、嵌入式端的跨平台AI技术解决方案,产品和服务广泛应用在教育、安全、交通、智能硬件、泛娱乐等多个行业。

海康威视AI开放平台
海康威视AI开放平台是面向行业用户与生态合作伙伴打造的一站式AI模型开发和应用平台。提供数据集管理、数据标注、模型训练、模型管理、应用集成的全流程AI服务,致力于打造AI视觉应用生态。

录音文件识别-阿里云
对用户上传的录音文件进行识别,上传完之后6小时内完成识别并返回识别文本。可用于呼叫中心语音质检、庭审数据库录入、会议记录总结、医院病历录入等场景。

腾讯AI开放平台
提供全球领先的语音、图像、NLP等多项人工智能技术,共享AI领域最新的应用场景和解决方案。

新东方AI开放平台
新东方AI开放平台依托新东方在教育行业的海量数据积累,把教育数据优势转化成教育行业的人工智能算法优势,为中国教育提供行业领先的OCR文字识别,语音智能,视觉智能,人脸关键点检测,人体姿态手势检测,NLP自然语言理解,英语口语评测打分等人工智能算法服务和智慧教育解决方案,助力教育智能化发展. 在智慧教室,双师AI课,AI督课,AI课程视频导演,智能批改,英语口语练习等方面形成了独特的创新解决方案,并公开了大量的智慧教育发明专利,积极引领教育行业的技术创新。新东方人工智能开放平台助力中国教育行业发展普惠,廉价,智能的,自适应的,智能教学工具和教学算法服务,积极应用人工智能技术创造社会价值,为中国的智慧教育和教育+AI产业做出应有贡献. 在图片识别,图片扫描识别,OCR证件识别,试卷手写笔迹擦除,试卷识别,试卷录入,人机会话,中英文翻译,小学口算批改,拼音检测识别,公式检测识别,英文拼写检查,人脸关键点检测,人脸表情识别,英文作文批改打分,语音合成,儿童英语口语测评打分,单词发音测评打分,托福口语测评打分,人脸考勤打卡机,AI数据标注系统,AI模型工厂,AI Devops运维发布体系,算法服务器弹性扩容与监控等各个方面为行业做出了重要贡献.

Outwrite
你的AI写作助手

语音识别_思必驰
思必驰提供基于云+端混合引擎的连续语音识别,覆盖中文、英文、葡萄牙语等语种,粤、川、沪等方言,以及带方言的普通话。