Hi!请登陆

火山引擎推出“影院级字幕”同传方案

2020-12-15 68 12/15

【TechWeb】12月14日消息,12月12日,日本艺术家村上隆在今日头条、西瓜视频、抖音同步开启首场中国直播,吸引近80万人次在线观看。本场直播中,火山引擎旗下的火山同传产品独家全程提供了实时智能同传字幕。

据悉,在此次村上隆的跨国直播中,火山同传创新性地推出了“影院级字幕”方案,与视频流整合后流畅地输出完整的译文语句,在屏幕上逐句显示。观众可以清楚看到精准的字幕结果,免受字幕跳动带来的视觉干扰。

在村上隆的直播弹幕中,还有个人网友质疑是否真的在直播。火山同传产品经理对此表示:“这种质疑在我们看来,是对我们的肯定。为了实现’影院级字幕’效果,并在直播中保证’音画字同步’,火山同传准备了一套延时字幕方案。”

该方案中,音频被推送到主控端完成机器同传后,人工利用直播的推拉流延时时间,在机器同传的结果上进行内容校对,以保证投屏字幕的强可读性。之后,火山同传的画面延时功能,能够保证校对后的字幕在延时结束后准时送出,与延时后的画面整合并同步推流到观众端,最终呈现出添加了高质量字幕的直播画面。

保证一场专业直播同传字幕质量的关键是定向的技术优化。字节跳动杰出科学家、人工智能实验室总监李磊介绍,在村上隆的直播中,火山翻译团队除了采用前沿的神经网络机器翻译技术进行模型训练外,还针对直播场景引入了领域适应技术,将村上隆以往的访谈和演讲数据用于优化算法,并对口语规范化、专业术语定制都进行了特殊优化处理,确保最终呈现的字幕能够简洁、精准。

据了解,火山同传“影院级字幕”的背后,是火山翻译团队超过40位顶尖科学家、工程师打磨出的机器翻译模型。火山翻译由字节跳动计算机研究科学家、工程师、产品经理、产品运营和语言专家组成的专业团队研发,拥有包括火山同传、火山翻译API、火山翻译Studio、浏览器翻译助手等在内的一系列矩阵产品。

数据显示,火山翻译已支持超过50个语种的全语向互译,应用于办公、娱乐、新闻等各类场景中,每天为来自全球的过亿用户提供优质的翻译体验。

相关推荐