2024年04月23日 星期二
首页>专栏作家 > 正文

作为“玩具”的AI合成主播

2019-02-27 14:46:42

来源:青年记者2019年1月下   作者:易艳刚

摘要:  现阶段的AI合成主播尚未成为新闻生产流程再造的工具,反倒更像是一个新奇的“媒介技术玩具”。

  人工智能先驱皮埃罗?斯加鲁菲曾在《2017未来媒体报告》中预测,人工智能与机器人写作将成为未来媒体十大发展趋势之一。过去一年多,国内外各种写稿机器人、算法推荐新闻、语音机器人等正在证实他的判断,最新的印证则是去年11月7日新华社在第五届世界互联网大会发布的全球首个AI合成主播。

  AI合成主播的核心技术源于搜狗公司,实质是提取新华社真人主播新闻播报视频中的声音、唇形、表情、动作等特征后,运用语音、唇形、表情合成及深度学习等技术联合建模训练,生成的高度仿真的“分身”。它是一套能迅速将文本转为视频的发稿系统,编辑输入中英文文本,就能自动生成AI合成主播视频。

  与以往一些媒体创新的影响力局限于传媒行业不同,AI合成主播的热度明显已经“出圈”,甚至一度成为全民关注的网络大事件。这种轰动效应,源于“搜狗分身”足以以假乱真的突破性技术,但更重要的原因在于,两位虚拟主播成为国家通讯社“特殊员工”,本身就足以成为“智媒时代来临”的一种隐喻。

  AI合成主播的出现,为传媒行业关于人工智能新闻的讨论增添了新话题。高度仿真的人工智能主播是一种新的“补救性媒介”,传统新闻已成为它生产视频的内容来源。它是技术模仿和复制人体的感知模式和认知模式的产物,也是保罗?莱文森提出的媒介演化“人性化趋势”(Anthropotropic)理论的生动体现。

  一种非常可以理解的担忧是:AI合成主播“C位出道”,是否意味着传媒行业“机器换人”的大幕已经开启?毕竟,培养一个主持人的时间成本、培训成本极高,而虚拟主播不仅可以自主学习,不需要工资和五险一金,而且能24小时不间断工作。看上去与真人无异的AI合成主播,是否会成为未来传媒业的主角?

  理论上讲,确实存在这样的可能。但从现实来看,现阶段的AI合成主播尚未成为新闻生产流程再造的工具,反倒更像是一个新奇的“媒介技术玩具”。

  按照保罗?莱文森的观点,技术发展通常要经历三个阶段演进,其辩证逻辑可表述为“玩具—镜子—艺术”,或“前现实—现实—后现实”。处于婴儿期的技术带有明显的玩具属性,公众的乐趣不在于技术的结果,而在于技术本身。只有当技术进入传达现实、与现实互动的第二阶段,才会拓展我们对现实世界的控制。

  AI合成主播目前的功能还很初级,社会各界对它的关注更多是出自对新事物感到好奇的本能。过去两个月里,AI合成主播已被全面嵌入新华社客户端、微信公号、小程序等传播矩阵,以期获得最大程度的曝光。但从互联网指数来看,AI合成主播的关注度直线下降,人们对这个新“玩具”的兴趣似乎正逐渐降低。

  一种可能的解释是,AI合成主播依赖的“搜狗分身”技术,已经导致日本机器人专家森昌弘1969年提出的“恐怖谷效应”(uncanny valley effect)——当机器人外形与人类相似到特定程度时,人们心理上会出现非常微妙的不适感。AI合成主播没有像汤姆猫、初音未来等虚拟角色一样选择安全的卡通形象,而是向跨域“恐怖谷”发起了挑战,但高度仿真与真实之间的差距仍不难被察觉。

  还有一种被国外学者提及的批评是,虚拟主播破坏了传播的仪式感。信息传播有一套程序化、体系化的符号体系,而新闻主播是建构传播仪式的重要符号——主播就连更换发型都需审批。但虚拟画面切断了观众与主播之间的联系,破坏了固有的符号系统和传播仪式,也在一定程度上使人们放弃这个新“玩具”。

  转型期的传媒行业,急需各种顺势而为的创新。不过,我们也不得不重温保罗?莱文森“媒介演进三阶段”理论的另一个论断:“玩具”阶段可能是后续阶段的前提条件,但决不保证后继的技术发展,在缺乏一定的环境条件下,“技术玩具”可能会长期定格在初始阶段。换句话说,AI合成主播能否从功能简单的“玩具”进化为复刻现实的“镜子”,甚至成为一种后现实“艺术”,还有待观察。

  (作者为《新华每日电讯》评论部副主任、清华大学新闻与传播学院博士研究生)

来源:青年记者2019年1月下

编辑:范君