2024年04月26日 星期五
首页>新闻思辨 > 正文

关注算法的底层建构对社会结构的影响

2022-05-07 16:02:06

来源:青年记者2022年5月上   作者:陈力丹

摘要:“算法”现在已经从后台走到了前台,从单一走向了融合,明显地影响我们的生活和社会结构了。

  摘  要:在网络研究方面,我们忽略了各种网络传播形态的底层建构,即“算法”;忽略了互联网传播技术本身的发展逻辑,仅对各种表面的传播形态感兴趣,这是造成现在网络研究学术上进展缓慢的原因之一。“算法”现在已经从后台走到了前台,从单一走向了融合,明显地影响我们的生活和社会结构了。

  关键词:聚合的算法;连接的算法;匹配的算法;推荐的算法;对话的算法;仿真的算法

  大约十年前,一位教授送给我一本厚厚的用透明玻璃纸包装的书,内容是关于微博出现的意义、如何使用微博等等,那是他带领学生们努力调研并做了很多统计的成果。我当时很忙顾不上看,现在书仍然被封在玻璃纸里,但我连翻一翻的意愿也没有了,因为微博势衰了。再翻看眼下新闻传播学科期刊的目录,大多数文章仍然在紧跟各种新涌现的网络传播形态,谈论它们的特点和使用。网络传播形态的变化目不暇接,常常几亿人一拥而起地玩一种当红的传播形态,一个比一个会玩。研究它们的“特点”和使用,最多概括得比一般使用者全面些。这样的文章选题,学术价值极其微小。

  互联网媒介建立于一系列硬件设施和软件,即数据和各种算法的基础之上,并依托硬件性能的提升和软件灵活性与复杂性的拓展。在网络研究方面,我们忽略了各种网络传播形态的底层建构,即“算法”,忽略了互联网传播技术本身的发展逻辑,仅对各种表面的传播形态感兴趣,至少没有予以“算法”同步关注,这是造成现在网络研究学术上进展缓慢的原因之一。而“算法”现在已经从后台走到了前台,从单一走向了融合,明显地影响我们的生活和社会结构了。

  “算法”是为解决特定问题而设计的计算程序系统,由数据和运算规则组成,但在嵌入社会系统后,这种数理逻辑层面的规则、程序,会转化为规则性或制度性的存在,深刻影响社会结构与文化,影响每个个体。现在的“算法”不再仅是数据与运算规则,而是在基本单元组合连接下具有特定意向的计算系统整体。它承载了设计者的效果期待、使用者的功能期待、资本或政治的影响期待。算法的运转不仅遵从自我的技术逻辑,同时还向各种价值逻辑妥协。各种社交媒体,尽管形态变化花样繁多,其实不过是几种类型的“算法”形塑着不同形态的网络媒体。算法在给信息传播活动提供技术支撑的同时,也在一定程度上限制了人们的行动范围。尤其是当下,“算法”逸出了数理逻辑和代码的范畴,通过对信息流动方式的规制,直接影响个体生活,进而影响着社会的运转和社会结构本身。

  现在“算法”支持的网络传播形态,已经可以让有一定实力的企业或个人突破专业媒体渠道的垄断,创造自己的线上展示品牌;网站建设的质量开始超越内容的加和,成为网站所有者影响力的引申路径,建构起某种社会标准。同时,其信息排列方式还形塑着人们新的信息消费习惯。例如超链接,它的兴起打破了传统的信息线性叙述方式,在为用户提供多元信息与背景材料的同时,也让用户陷入经常性迷失的困境,因为看似形式上更加自由的“超链接”消费,被框定在指定的范围内;流量、国别的利益壁垒也限制了人们对超链接原初功能的期待。于是,超链接成为站内流量导引的工具。

  中国最早的网站是1995年张树新女士创办的“瀛海威”,1997年全国大网开通之时,我使用的还是1992年花4000元(那时的月工资约千元)购买的286电脑。后来考虑到读高中的女儿的成长,我不惜花费四五千元让她把自己的386电脑先后更换为486、586,缴费登录“瀛海威时空”。这是一个五脏俱全的互联网模式:人们可以在网络咖啡屋与不见面的朋友交谈,到网络论坛中畅所欲言,还可以随时到国际网络上漫步。如今我女儿已经属于当下社会的担当人群,而她线下的许多朋友,都是那时在网上结识的,远超出她当时狭小的生活圈子。这就是社交媒介BBS(论坛)在中国最早的形态,其底层基础是“聚合的算法”和“连接的算法”。它放大了互动功能,将发帖主体拓展到全体注册人员,多对多的圈层传播成为可能。我女儿和她的朋友们,便是中国最早的网络“算法”形塑的第一代人。

  然而,随着算法复杂性的增加,算法的不同组合,形塑了不同形态的社交媒介。“开放”与“封闭”的技术选择嵌入社会后,在不同空间形成不同的传播生态。算法-媒介-人-信息与社会的交互,出现越来越多的差异,规制了用户对不同社交媒介的使用想象。与此同时,算法以隐形设计的方式刺激着人们的情感释放,影响着人们与不同媒介的黏着度。不同网络传播形态对“朋友”的聚集的要求、用户对受众群体想象的偏差,引发网络社交的语境坍塌,个人的表达自由与表达冲动被规制。用户与其他权力主体间不断演出着“逃离-追捕”的游戏。

  本来,“算法”作为平台基础,是不对信息本身进行干预的。但现在不同了,例如以“匹配的算法”为底层基础的搜索引擎,理论上对所有信息进行聚合与检索。但在嵌入社会应用后,鉴于利益与政治的因素,信息的聚合能力受到访问协议的制约。在信息排序与展示层面,因为用户对顶部链接的习惯性消费,“算法”的设置可以造成信息列表的空间位置被赋予不等的价值,算法的排名逻辑也可以人为地将“人气”置于“质量”之上;政治、资本等权力主体也可以改动算法进行价值导引。这种看不见的信息偏向,无形中影响着使用者的认知与价值倾向。用户在这个过程中处于弱势,但也开始从算法中心走向边缘,利用算法逻辑,通过干预“输入”影响“输出”或对比信息的“输入”与“输出”,进行算法映射,利用规则进行排序干预,实现对算法的制度性反抗。

  再如“推荐的算法”,一方面缓解了海量信息与人有限注意力的矛盾,同时也无时无刻不在干预着信息与人的匹配。这种算法制造了人们理想“想象”与现实“实践”的鸿沟。当精准传播理念深入人心之后,这种算法引申为一种文化和规则。例如,2012年今日头条推出了“你关心的,才是头条”的信息传播理念,从此人与信息的匹配不再是专业编辑把关的结果,也不再是基于社交的关系连接,而是基于需要的算法连接。以往基于公共或权威信息价值的排序被解构,曾经被置于边缘或末端的个体需求被提上从未有过的显要位置。算法平台的信息生产,大都遵循商业逻辑,生产者将目标锁定在更具消费力的群体上,没有消费能力的群体有可能被算法隔绝、遗忘。这样的算法系统,对用户隐私也带来巨大挑战。

  智能时代又兴起了“对话的算法”。目前仅表现在基于底层算法支持与限制的人-机对话方面。当交往对象从相同的人类拓展到机器,那么人的态度,算法的表现都形塑着二者的关系互动。我的外孙今年5岁,原来每天都与他的机器人对话,要求讲这个故事听那个歌曲,但很快就厌倦了,因为机器人已经难以回答这个年龄段孩子的所有问题(即这个机器人只能适应很低龄的孩子),更没有情感。算法建立在语料库和模型建构上,对语言的理解是机械的,并不是从人“理解”的角度出发,而是从“计算”的角度出发寻找匹配的最优,而非“语义”优先。机器人适于简单的知识问答和执行任务程序,不可能具备有机的思维。2017年腾讯的两个聊天机器人发生一系列重大错误,即使紧急撤下去进行“再教育”也无能为力,因为聊天是无边际的,再精密的机器人也只能在一定规则的范围内战胜人(例如“深蓝”)。“对话的算法”无论怎样改进,机器理解的缺陷与人类想得到理想答案的动机永远处于矛盾中。为了使用机器人,就得规训人的表达,人服从机器的逻辑才能达到预期的目标。人创造的机器反而控制了人,这个结果叫“异化”。

  以往的“算法”,只涉及信息在同时空或跨越时空的聚合与发散的物理过程。现在出现的“深度合成媒介”,其原理是通过“仿真的算法”,使得信息传播两端的形态发生变换。文本信息以音频或视频形式播发;某种语言输入,通过算法转译同步实现多语言传播。而特别需要注意的是,某种普通话语可以借助另外具有权威性的话语进行传播。信息-人-情境在“仿真的算法”指导下被分离和另行自由组合。在解决当下信息传播技术限制的同时,由于“算法”可以主动介入信息、主体与情境的分离,增加了信息传递过程的符号误读。例如,“算法”可以模仿给定的新闻或其他文章的风格;通过对书写或绘画特征的习得,生成风格类似的作品;可以人脸合成、人脸替换、唇形同步、人脸再现(将面部表情转移到目标人物脸上)和动作迁移;甚至生成几乎完全相同的整个网站或平台。

  根据已有的研究,由深度合成算法生成的内容,被正确识别的概率只有50%。人们难以辨别“伪造”与“真实”。真假判断的认知负担加重,信任体系将崩塌。以往我们说的是“模拟”“仿真”,而现在面临的是:假的可能比真的还真。目前这个技术尚处于开发阶段,急需对其未来发展可能带来的影响做深入探讨。

  社会需要网络研究在中观、宏观层面指出以上问题,并研究这六种“算法”的原理会造成何种相关网络媒介的缺陷,以及网民使用时可能遭遇的风险,特别是后四类“算法”对社会结构的影响,并提出科学、及时的忠告、警告。研究者不要把精力放在当红的传播形态的特点和使用上,这是玩得正嗨的网民都懂的,他们需要的是关于网络传播底层基础的知识和使用时的理性思考。

  【本文为四川大学共建新闻学院专项课题“马克思主义新闻观原典著作和报刊研究”(编号:GJ2020001)成果】

  (作者为四川大学讲席教授,中国人民大学荣誉一级教授,本刊学术顾问)

来源:青年记者2022年5月上

编辑:范君