实时语音转写-依图

服务商介绍

依图科技是一家计算机视觉科技公司，为用户提供基于图像理解的信息获取和人机交互的产品，致力于构建机器视觉的未来。

依图实时语音转写产品是一个gRPC API，提供流式语音识别能力，支持中文普通话，并且兼容多种口音。

将时长不超过5小时的语音转写成文字，让您从音频数据中挖掘更多信息和价值。

语音转写可批量将音频文件（5小时以内）转换成文本数据，适用于语音质检、会议访谈等场景，可提供公有云接口及私有化部署方案

让你的产品能听会说

实时语音转写可将不限时长的音频流实时识别为文字，并返回带有时间戳的文字流，新增翻译功能，适用于跨语种会议、国际赛事直播等多言语场景

实时语音识别是对不限时长的音频流做实时识别，达到“边说边出文字”的效果，内置智能断句，可提供每句话开始结束时间。可用于视频实时直播字幕、实时会议记录、实时法庭庭审记录、智能语音助手等场景。

百度AI开放平台提供全球领先的语音、图像、NLP等多项人工智能技术，开放对话式人工智能系统、智能驾驶系统两大行业生态，共享AI领域最新的应用场景和解决方案