江南官网入口

服务中心

海外仓

有道智云实时语音翻译服务全新上线+言语实时翻译!

来源:江南官网入口    发布时间:2023-12-27 06:15:34

  有道智云·AI敞开渠道新上线的实时语音翻译接口,可大规模的运用在会议同传、多语种直播字幕、视频字幕翻译等场景,支撑实时回来辨认效果,到达一边输入音频流,一边取得翻译后的文字内容。

  该技能是经过Websocket API的方法给开发者供给一个通用的接口,敞开给大众运用。Websocket API具有流式传输才能,辨认速度更快,辨认功率更加高。现在可完美支撑英、日、韩、法、西班牙、葡萄牙文等86种言语(含口音)实时精确翻译,针对不一样的区域的口音和方言也可精准辨认,掩盖200多个国家和区域。

  实时语音翻译的逻辑大致上能够分为两步:将实时语音转成文字;再将文字翻译成另一种言语的文字。这是现在干流的技能道路,在实践使用场景中,遭到口音,方言,噪音环境,专业范畴的翻译作用、翻译的实时性等要素阻止,语音翻译技能尚未能到达完美的作用。

  有道语音翻译技能归纳了高精确率、口音噪声鲁棒的高性能语音辨认引擎及在主动翻译和机器学习等多范畴的效果,经过强壮的机器学习,使用海量语料,进行深层网络练习,精确率可达95%,响应速度可达秒级。现在现已成功用于多个产品线,如有道翻译王硬件、有道会议同传体系、有道视频翻译等。

  假使互联网开展的底层逻辑是将全人类更好地衔接在一起,构成一个巨大村落,那么言语或许便是最终一个技能妨碍。当然,实时语音翻译技能作为一项一直在优化的技能,遭到言语的改变等许多要素的影响(如方言、口音、俚语等),体系对辨认和翻译的精确率还需逐步齐备,而有道AI团队一直在推动语音到文本的技能,以便为用户更好的供给更精准的实时语音翻译服务。