文章详情

专注互联网科技,赋能企业数字化发展

DeepL出了实时语音翻译,跨语言开会有救

作者:DeepL出了实时语音翻译,跨语言开会有救

DeepL今天发布了实时语音翻译工具,目标场景是跨语言会议。可以接入Zoom和微软Teams,开会时听众直接听翻译音频,或者看实时字幕,说话的人照常说母语。 🎙️ 我在游戏圈工作那几年,最麻烦的事情之一就是和日本方、韩国方或者欧洲的合作伙伴开会。基本要么提前安排翻译,要么靠双方各自勉强用第二语言,很多信息在这个过程里就丢失了——不是不想说清楚,是表达精确度不够。 DeepL在文字翻译领域一直是质量最好的选项之一,尤其是欧洲语言。这次延伸到语音,他们做的是"语音转文字 → 翻译 → 文字转语音"的串联流程,不是端到端的语音翻译。CEO说他们正在研发跳过中间文字步骤的模型,目前还没有做到。 串联流程有个天然问题:延迟。说话 → 出翻译音频中间的时间差,太长了体验就很糟。DeepL的CEO说他们在延迟和准确率之间做了大量权衡调整。 📱 除了会议,他们还做了几个场景: - 手机/网页面对面对话:两个人互相对着同一设备讲话,翻译给对方 - 群体场景:类似培训和工作坊,参与者扫个二维码就能收到翻译 - 支持自定义词汇:可以训练行业术语和人名识别 开发者API也开放了,可以用来做电话客服系统这类定制场景。 💡 竞争方面,DeepL不是唯一做这块的。同类产品里还有Palabra(Reddit联创背书)专注保留说话人声音的感情色彩,Sanas主攻实时口音转换,Camb.AI主要做影视本地化。 DeepL的差异化在翻译质量。他们做文字翻译已经多年,积累了大量高质量训练数据,特别是对欧洲语言支持很扎实。如果这个优势能迁移到语音翻译上,质量应该有保证。 目前还在早期访问阶段,企业可以申请加入等待列表。对需要跨语言协作的团队,这个方向值得跟一下。 #实时翻译 #DeepL #语音AI #跨语言办公 #AI工具 #远程工作 #科技新闻

返回新闻列表