2024年05月04日 星期六
首页>青记微评 > 正文

AI主播与真人主播的播报效果研究

2023-06-21 08:26:24

来源:《青年记者》公众号   作者:刘娜 黎樟浩 吴晔

摘要:本研究采用控制实验法,将相同内容的新闻文稿由AI主播与真人主播分别进行播报并录制,基于传者身份与社会化线索的双重视角,对比被试者观看二者播报视频后的记忆效果。

  研究背景与问题提出

  伴随着第四次工业革命引领的智能化时代的到来,新闻生产开始向智能化转向,智能媒体应用中的虚拟播音主持技术迅速发展。作为媒介表征符号的人工智能主播(artificial intelligence anchor,以下简称“AI主播”)逐渐成为广播电视和网络视听领域所关注和实践的热点。从东方卫视主持天气播报的虚拟主持人“小冰”,到中央广播电视总台推出的“AI王冠”超仿真主播报道全国两会,AI主播为新闻生产实践带来了现象级革新[1]。事实上,AI主播已经经历了三次迭代升级:第一阶段“离身性初探”,以2D或3D动画形象为代表;第二阶段“具身性演变”,以真人形象建模或机器人实体为代表;第三阶段“智能数字具身”,以基于多项智能技术的定制化具身为代表。随着全球AI主播的加速研发与推广,其作为新闻传播领域的媒介新形态正逐渐成为广播电视和网络视听领域所关注和实践的热点,AI主播播报节目的效果受到学界和业界的广泛关注。

  关于AI主播的争论焦点集中在其能否替代人类主播完成新闻播报。AI主播具备快速导入与高效输出的能力,且具备不受时间、空间所限的独特优势,使其既能保证新闻时效性,又能满足受众的信息需求[2]。除此之外,真人主播可能会受到业务水平、文化修养、工作疲劳度等因素影响,表达质量参差不齐[3]。但也有学者对此持相反态度,认为同样一句话有不同表达情感的方式,每种表达都经历了主播“内化理解”的过程[4],而冰冷的AI主播可能有损新闻公信力[5]。从受众视角来看,作为信息的接受者,除了获得必要信息之外,人们更希望听到来自主播独到的理解与看法。

  将新闻信息准确无误地向受众传达是新闻播报节目的重要功能之一。在信息巨量生产与高速传播的当下,新闻内容能够被记忆,说明其传播效果在认知层面具有显著作用[6]。记忆效果是传播效果的一个重要维度。特别是在信息巨量生产与高速传播的当下,新闻内容能够被记忆,说明其传播效果在认知层面的显著性。影响受众记忆的因素主要包括呈现特征、内容特征、受众特征三方面。本文以传播信息的呈现特征为切入点,探究传播主体身份、社会化线索呈现对受众新闻记忆效果的影响。据此,本文提出如下研究问题:

  AI主播和真人主播播报相同的新闻内容时,受众的新闻内容的记忆效果是否存在差异?

  传播主体也被称为信源、传者等,是传播环节的首端。它控制着社会信息的筛选、加工,并通过各类传播媒介对社会信息进行生产、表现和传播。人类活动中任何信息的传递必然包括传播主体身份属性的传递,所谓“身份即传播”[7]。传播主体身份特征具有先在性、客观性和个体性,是影响信息传播的重要因素。不同身份属性的信息发出者,传播相同内容的信息产生的传播效果也不同。AI主播可以理解为一种新的传播主体,以一种虚拟在场的方式替代了真实在场。AI主播的“虚拟”身份为新闻的接受者提供了潜在的交流对象,受众面对AI主播时,融入了对人工智能新闻生产的理解与评价,如信任或质疑。

  研究者将传播主体特征视为影响记忆效果的重要自变量,信息来源的身份是影响受众感知的首要考虑因素[8]。信源不仅会影响说服效果,也会作用于记忆效果。根据多媒体学习认知理论(Cognitive Theory of Multimedia Learning,CTML),个体拥有单独的视觉信息加工通道和听觉信息加工通道,不同表征形式的信息主要在各自对应的通道中得以加工[9]。对AI主播新闻播报的记忆效果测量,若仅从合成语音的听觉信息加工通道来判断,则忽略AI主播在视觉画面呈现上带给受众的感知与影响。据此,本文提出如下研究假设:

  H1:观看视频后,相较于认为主播是AI身份,认为主播是真人身份的受众的新闻记忆效果更好。

  一般来说,社会化线索(social cues)指他人的动作行为所传递的信息,这些信息参与心理加工过程,并对人们的知觉和行为产生影响[10]。社会化线索包括语言线索和非语言线索。在节目传播中,主播呈现的语言符号社会化线索包括播音中声音的音高、语气、语速、节奏、音量等[11];而非语言符号社会化线索包括体态动作、面部特征、眼神互动、空间表达等。社会化线索不仅能够传达出传播者的生物和社会信息,同时也影响着传播效果。

  在人际交流中,人们习惯了接受对方呈现的社会化线索。人机交互(human-computer interaction,HCI)相关研究认为,人们在与计算机的互动中会无意识地根据社会化线索的呈现,运用相应的社交规则与计算机互动[12]。在新闻播报中,社会化线索发挥重要功能,促使人类对主播(包括真人主播和AI主播)产生社会化反应,从而引起态度和行为的变化。研究发现,机器人的社会化线索(如手势)能让被试产生更高的拟人化感知,进而使其产生更强的喜爱感知和接触意向。在记忆效果中,线索加和理论(Cue-Summation Theory)认为,人对信息的记忆和学习与输入信息中可用线索(available cues)的数量成比例关系,线索数量越多,人对信息的记忆效果越好。换言之,用户获得更多维的信息线索,能提升认知和记忆效果。据此,本文提出如下研究假设:

  H2:相较于观看未设置社会化线索视频,观看设置社会化线索视频的受众的新闻记忆效果更好。

  实验设计

  (一)实验材料

  本研究选取AI主播与真人主播播报相同的新闻文本,以此录制视频并作为实验素材。AI主播录制视频标注为视频A,观看视频A的实验组为AI主播组;真人主播录制视频标注为视频B,观看视频B的实验组为真人主播组。

  本研究选取一名省级卫视新闻节目主播,并根据播音创作规律,为真人主播设置社会化线索,进行B类视频录制。同时选取一名在性别、年龄、形象等方面与真人主播相近的AI主播,无社会化线索设置,生成A类视频素材。此外,控制AI主播与真人主播在视频背景画面、主播空间呈现、拍摄景别等境态系统的非语言符号呈现完全一致。被试进入实验页面后,随机跳转视频A或B。为避免心理暗示等干扰,在被试观看实验材料前并未对实验材料中的主播是真人还是AI做出特殊说明。

  本次实验的新闻播报选取通讯播音文体。它是以真实的情感为体验,具体、形象、生动地报道新闻事实的一种播音文本。与消息播音文体相比,描绘性、抒情性更强,更有利于对主播社会化线索的设定。

  (二)实验对象

  本研究通过问卷调查平台“问卷网”选取实验对象并发放实验问卷,共回收300份有效实验问卷,其中AI主播组150份,真人主播组150份。在300个被试中,男性101人(33.7%),女性199人(66.3%);18岁以下为7人(2.3%),18到30岁为208人(69.3%),31到50岁为73人(24.3%),51岁及以上为12人(4%);学历为高中以下到研究生或以上,专科及以下学历者为92人(30.7%),拥有大学本科及以上学历者208人(69.3%)。

  (三)社会化线索设定

  由于目前AI主播相关操作的局限,本实验素材社会化线索的设计均在真人主播录制时进行。为真人主播设计体态系统与声音副语言系统的社会化线索,采用设置社会化线索(真人主播)视频与未设置社会化线索(AI主播)视频对比的方式检验社会化线索的作用。本文设定的社会化线索均以播音文本为依托,以播音表达为依据,符合主播在实际新闻播报中的播音创作规范与需求。

  在播音教学中最常见的两种社会线索包括手势引导和眼神引导[13],秀场主播善于使用服装、道具等社会线索来塑造作为奇观的社会身份[14],视觉系统加工常用的社会线索主要包括注视线索、身体指向信息、人脸表情等。结合本文的研究对象与情境,将社会化线索设定为:手势、重音、停连、眼神、头部动作、语气。以下就其中三类进行详细说明。

  1.社会化线索设置一:手势。心理学和神经科学相关研究发现,手势在传达意义、传递情绪方面具有重要作用[15]。Skipper等研究发现,当被试面对伴有手势的言语时,手势直接促进了语义选择或提取[16]。在新闻播报中,有声语言与相应手势的配合可增强形象的可感性,增加受众感知的伴随性与协同性。在视频B中,“当看到因为冰冻,原羚无法喝到水时,他便把冰砸成一颗颗碎粒给它们吃”。此时,主播的手势随着情感的调动自然抬起,拇指与食指紧捏着,如捏着一颗颗主人公砸碎的冰粒一般。

  2.社会化线索设置二:重音。重音是指为了鲜明突出地表达具体语句目的和具体感情色彩而着重强调的词语或词组。它存在于语句的意位层,关系到语句的清晰度,同时又对语言的生动性起重要作用。Cowles等研究表明,经过重音标记的信息,可以让受众即时识别并在语义加工过程中发生作用,迅速调动其注意网络[17]。在视频B中,“而此时尖木措自己带的口粮,馍馍和矿泉水早已冻成了冰疙瘩”,“馍馍和矿泉水”设置社会化线索,做重音处理。

  3.社会化线索设置三:停连。“停连”是指语流中声音的停顿和连接,对受众快速准确地理解主播传达的内容有直接影响。在视频B中,真人主播在结尾处“增加到了如今的500多只”之后做停连处理,为被试留下对新闻人物经历进行深度感受与思考的时间。

  (四)变量测量

  1.新闻记忆。对于新闻记忆效果,研究者们常用再认、主题回忆、细节回忆等方式进行测量[18]。本实验据此进行记忆问题设置,共设置了11道问题,其中有8处记忆问题在对应文本的播音创作中设置了社会化线索,3处记忆问题在对应文本的播音创作中未设置社会化线索(见表1)。11道题均为单选题,被试答对得1分,答错不得分。

  2.传者身份。在被试观看完整的实验素材后,回答对主播身份判断的问题,1代表完全赞同“刚才视频中的主播是真人主播”,7代表完全赞同“刚才视频中的主播是AI主播”,剔除中立答案4,回答1、2、3的被试说明其判定实验材料中的主播为真人主播,回答5、6、7的被试说明其判定实验材料中的主播为AI主播。据此,可以根据实际观看实验材料和对于传者身份的判断,将被试分为四组(见表2)。

  数据分析

  本研究采用SPSS26.0软件对数据进行统计分析。对AI主播组和真人主播组的新闻记忆效果进行独立样本t检验。结果如表3所示,AI主播组的新闻记忆平均得分(M=6.187) ,显著低于收看真人主播视频的新闻记忆平均得分[M=6.920,Sig.(双侧)<0.05]。整体来看,被试收看真人主播播报的新闻记忆效果优于收看AI主播播报的新闻记忆效果。

  (一)主播身份与记忆效果

  为了排除社会化线索差异所带来的影响,第三组和第四组都收看B视频,社会化线索设置一致。两组在主播身份的认知上存在差异。通过独立样本T检验发现,第四组被试(M=8.10),其新闻记忆效果显著优于第三组[M=6.14,Sig.(双侧)=.000<0.05]。H1得到了证实。

  (二)社会化线索与新闻记忆效果

  为了探索社会化线索造成的差异,在排除主播身份造成的影响后,第二组和第四组的被试均认为新闻视频由真人播报。但由于实验材料不同,第二组没有接收社会化线索刺激,第四组接收了社会化线索刺激。通过独立样本T检验,研究发现第四组被试对新闻记忆的效果(M=8.10)显著优于第二组[M=5.46,Sig.(双侧)<0.05],H2得到证实。

  对每一道设置的记忆问题进行逐一分析发现,在主播表达时未设置任何社会化线索的4、6、9三道问题中,新闻记忆效果均无显著性差异。换言之,在AI主播与真人主播的播报视频均无社会化线索差异的情况下,被试的新闻记忆效果也没有显著差异。对于设置有社会化线索的8道记忆问题中,问题1、7、11三道问题的记忆效果没有显著差异。其中,问题1为再认题,难度较低,正确率都较高。问题7、11为细节题目,在视频中并非具有空间时间、因果关系、事件结果等重要信息,容易被忽视。而在有社会化线索设置的2、3、5、10四道问题中,两组的记忆效果均出现了显著差异。

  综上,对于11道记忆问题的设置中,有社会化线索的题目记忆效果显著优于无社会化线索的题目,均无社会化线索的题目之间记忆效果无差异。换言之,在播报新闻时,真人主播优于AI主播的关键在于社会化线索的设置,当无社会化线索设置时,两者对受众的记忆效果没有显著差异。

  结论与讨论

  首先,本研究证明了社会化线索在新闻记忆效果中起到关键作用

  在细节处理、再认、主题回忆三类题型中,设置社会化线索的视频,其新闻记忆效果均优于未设置社会化线索的视频。为提升AI主播的新闻传播效果,需要加大在社会化线索上的研发与探索力度。当前AI播音的语言呈现和情感认知不足,语句依照固定结构和语法规则机械化运行,尚无法形成语流音变,这就直接导致了语音类社会化线索如重音呈现、停连运用、播报节奏、语气分析等层面的缺失。关于AI主播的副语言社会化线索,需提升面部表情与播报内容的一致性、协调性,特别是眼神的交流感、互动性,以及体态的自如性、动作的丰富性。在新闻播报过程中,符合播音创作规律的配合性动作发挥着对有声语言的补充性甚至替代性等重要作用。

  其次,本研究证明了主播的身份属性在被试新闻记忆效果中起到显著作用

  被试观看真人主播的新闻记忆效果优于AI主播。这可能是由于AI主播这一全新的信息传播技术实践,为被试带来了不同的交互方式与信息接收体验。人们在与外界的交往过程中具有求新求异的需求,新技术往往能够引发人们的好奇、兴奋等情绪。同时,人类所拥有的认知是一个有限的资源池,对信息处理的能力有限,对信息进行编码、储存和检索的能力有限,认知资源自动分配的过程受到媒介呈现信息特征的影响。因此AI主播本身的智能性、新颖性等特征可能使被试获取了更多的认知资源分配,从而内容的关注度降低,最终新闻记忆效果降低。

  最后,本实验只设置了语言与非语言符号作为社会化线索的考察维度,未考虑AI主播的虚拟人格特征、IP形象特点等较为内隐但影响更深入的社会化线索

  对AI主播进行有意识的人物设定与角色塑造可以满足广大受众对AI主播的不同期待与偏好,并赋予其社会化的身份信息与自我期望。AI主播人格化的背后是价值观和审美观的匹配,在新闻反转、舆论失焦、媒介审判、网络暴力等乱象充斥的后真相时代,在热点事件中勇于表达鲜明态度,输出正确价值观与舆论导向,具有鲜明态度的强烈情绪文本更易引发受者产生情感共振,激发情感共鸣,增强受众的黏性,是一种低成本的为AI主播“赋魂”的方式。另外,AI主播可通过以打造兴趣偏好,形成共享性资源参与共享性实践,深度联结形成某种圈层网络与社群信任。鲜明的形象标签与人物设定有利于聚合群体关系的搭建,AI主播作为智能传播中“形象代言人”的媒介表征符号具有“光环效应”,更易形成粉丝圈与互动社区。媒介技术的可供性为AI主播的个性化发展提供了更多的可能性,AI主播通过其个性化魅力吸引受众的注意资源,通过圈层化情感与受众产生共鸣,在互动中建立情感联结,更容易使受众产生信任感与在场感,并增强对AI主播的身份认同和印象效果。

  【本文为国家自然科学基金项目“移动新闻媒体中的用户行为统计规律与建模”(编号:11875005)阶段性成果】

  参考文献:

  [1]於春.传播中的离身与具身:人工智能新闻主播的认知交互[J].国际新闻界,2020,42(05):35-50.

  [2]张婧.AI合成主播:播音主持行业的“危”与“机”[J].视听界,2021(04):111-113.

  [3]赵广远,田力.技与艺的博弈:人工智能语境下主持人职能重构[J].当代电视,2019(10):93-96.

  [4]陈卫华,潘中康.人工智能时代虚拟主持人发展困境及策略研究[J].传媒观察,2021(05):37-41.

  [5]刘丹.智媒传播视域下播音主持的发展路径[J].青年记者,2020(35):90-91.

  [6]喻国明,韩婷.用户在传播认知中记忆效果的测量:研究框架与技术路线[J].出版发行研究,2019(02):56-61.

  [7]靖鸣,杨瑾怡,冯馨瑶.回归起点:传者身份与身份传播——身份传播学的学科建构及其意义[J].当代传播,2022(01):19-26.

  [8]Kang M. Measuring social media credibility: A study on a measure of blog credibility[J]. Institute for Public Relations, 2010, 4(4): 59-68.

  [9]Mayer R E, Moreno R. A split-attention effect in multimedia learning: Evidence for dual processing systems in working memory[J]. Journal of Educational Psychology, 1998, 90: 312-320.

  [10]周吉帆.社会线索在物理事件因果知觉中的作用[D].浙江大学,2012.

  [11]喻国明,王文轩,冯菲,等.合成语音新闻的传播效果评测——关于语速影响的EEG证据[J].国际新闻界,2021,43(02):6-26.

  [12]Reeves B, Nass C. The media equation: how people treat computers, television, and new media like real people and places[J]. Choice Reviews Online, 1997, 34(07).

  [13]田媛,亓栀,黄湘琳,等.社会线索促进在线学习的认知神经机制[J].电化教育研究,2021,42(02):63-69.

  [14]刘锐.计算机中介传播视野下网络视频直播的技术可供性分析[J].新闻与传播评论,2022,75(01):32-46.

  [15]Andric M, Solodkin A, Buccino G, et al. Brain function overlaps when people observe emblems, speech, and grasping[J]. Neuropsychologia, 2013, 51(8): 1619-1629.

  [16]Skipper J I, Goldin-Meadow S, Nusbaum H C, et al. Speech-associated gestures, Broca’s area, and the human mirror system[J]. Brain and Language, 2007, 101(3): 260-277.

  [17]Cowles H W, Walenski M, Kluender R. Linguistic and cognitive prominence in anaphor resolution: topic, contrastive focus and pronouns[J]. Topoi, 2007, 26(1): 3-18.

  [18]蒋忠波.受众的感知、识记和态度改变:数据新闻的传播效果研究——基于一项针对大学生的控制实验分析[J].新闻与传播研究,2018,25(09):5-29+126.

  (刘娜、黎樟浩:北京师范大学新闻传播学院博士研究生;吴晔:北京师范大学计算传播学研究中心教授、博士生导师)

  【文章刊于《青年记者》2023年第6期】

  本文引用格式参考:

  刘娜,黎樟浩,吴晔.AI主播与真人主播的播报效果研究[J].青年记者,2023(06):58-61.

来源:《青年记者》公众号

编辑:小青