2024年04月12日 星期五
首页>前沿报告 > 正文

计算传播推动下的传媒新业态

2022-10-25 16:47:12

来源:青年记者2022年10月下   作者:韩博

摘要:  摘 要:近年来,计算传播学研究发展迅速,传媒业界以数据为基础的行业实践不断推陈出新。二者具有鲜明的互动关系,计算传播概念符合业

  摘  要:近年来,计算传播学研究发展迅速,传媒业界以数据为基础的行业实践不断推陈出新。二者具有鲜明的互动关系,计算传播概念符合业界面向大数据时代的发展需求,传媒业界同时又为计算传播学研究提供了新方向。文章首先论述了计算传播与业界需求间的耦合效应。在此基础之上,总结出传媒业界新形态形成的“抓取+分析”模式与“存储+分析”模式,并探析不同模式的特色与逻辑。最终提出,计算传播业界的未来发展路径,传播理念:“用户=数据=资源”,用户体验优先;传播要领:“精准好用”是第一要务;传播实践:依据资源禀赋量体裁衣,为传媒业界融入、实践计算传播理念提供借鉴。

  关键词:计算传播学;传媒产业;传播模式;趋势分析

  计算传播与传媒业界需求的耦合效应

  传播,自古已有之,从语言、文字、影像等不同传播形式,到广播、电视、互联网等众多媒介,皆是为探索世界,传递信息。从传播到计算传播,多了“计算”二字,其意义大不相同。学界多以Lazer等在Science期刊发表“Computational Social Science”作为计算传播研究的起点。从2009年到今天,计算传播学发展不过13年。作为传播学发展的新方向,13年间,计算传播为传播学界带来了什么,很大程度上影响业界发展理念与趋势。反过来,业界发展也对计算传播提出了新需求。回顾计算传播带来的传播学认知新变化,特别是这些变化在哪些方面迎合了业界自身发展需求,能够为我们透析业界新形态变化的动因,解读计算传播发展与业界需求发生耦合效应(Coupling Induction)背后的底层逻辑。

  梳理计算传播的发展,有两篇文章非常值得关注。其一,是Duncan Watts在2007年发表的《二十一世纪的科学》。该文着重强调社会科学的重要性,特别是网络传播互动性与数据对于人类集体行为研究的重要性,认为其能够变革对人类集体行为的认识[1]。其二,是拉泽(Lazer)和彭特兰(Pentland)等人在2009年发表的“Computational Social Science”[2],强调计算对于社会科学的强大功效。纵观两篇“奠基”性质的文章,体现了计算传播的两大要义,前者强调人类解决社会问题的主观能动性,随着技术的进步,现实问题是可设计、可研究的。后者强调以计算机技术为基础的数字技术是发现问题、解决问题的利器。周葆华将前者概括为“传播的计算”,将后者概括为“计算的传播”[3]。将二者综合来看,计算传播是一种新的研究取向与方法[4],其体现出的是人类对于解决社会问题的主观能动性以及对于强大理论工具的探索需求。这一方面突出了传播的主动性与可控性,通过复杂的大数据计算可以分析出通用规律用于更加精准的信息传播;另一方面解决了传播学理论假设的证明问题,让传播学假设有更加扎实的实际数据支撑。这两方面与业界的需求不谋而合。

  一直以来,传媒业界在追寻两个题目的谜底:传播什么能够受到好评?传播给谁能够起到良好效果?如何快速、精准地传递信息,一直是业界的不懈追求。如果从计算传播的实践来看,业界的实际行动要明显早于学界提出计算传播概念。收视率调查是业界计算传播实践的典型代表。1929年,哥伦比亚大学学生克劳迪·罗宾逊发明了受众测量仪,缔造了收视率调查的仪器基础。20世纪30年代,美国开始了第一次收听率调查,1986年中国第一次进行收视率调查。从到达率、收视率等一个个数字出发,业界对节目效果进行分析,对受众爱好进行画像,其目的就是寻找受众爱好,调整播出内容,做到精准传播。业界对于信息的传播效果更为敏感,因为传播效果关系到具体传媒企业、单位的“生死存亡”。虽然业界并没有明确提出计算传播概念,但通过抽样、调查、访谈等方法想要得到的结果与计算传播所指出的发展方向是一致的,发展出数据新闻、计算广告等实践成果。近年来,5G、大数据、云计算、元宇宙等概念兴起,计算传播的核心是数据,新时代传媒业界发展的核心也是数据,海量数据与计算传播理念发生了奇妙的耦合效应。在计算传播理念引领下,围绕对数据的运用,业界出现了不少新形态。其中,“抓取+分析”模式与“存储+分析”模式走出了两条各具特色的发展道路。

  “抓取+分析”模式特色与逻辑

  “抓取+分析”是目前传媒业界较为成熟的发展模式,该模式的特点是企业机构本身并不直接拥有数据,而是通过特定算法对网络空间中的海量数据进行大规模抓取,在分析数据结果的基础之上进行结果展示、分析、推广。从具体形式来看,有“内容推荐”与“趋势分析”两种类型,前者包括搜索领域的页面排名、内容推荐、个性化商品推送三部分,后者集中在网络舆论分析,包括指数、趋势、画像等主要内容。

  (一)内容推荐:数字痕迹指引下的兴趣传播

  目前,中国的互联网普及使用率非常高,网络成为人们生活不可或缺的一部分。截至2022年6月,我国网民人均每周上网时长达到29.5个小时[5]。伴随着疫情等因素的影响,人们的社会生活逐渐向线上转移,网络点餐、在线会议等形式让数字经济逐渐成为社会的主要发展动力,2020年全球数字经济增加值规模达到32.6万亿美元,全球数字经济占GDP比重为43.7%[6]。数字经济的发展带来的直接结果是用户数字痕迹(digital traces)的完整记录。以此为基础,用户的兴趣可以被分析,依据用户兴趣进行内容推荐成为信息传播企业的主要盈利形式。由于内容推荐在业界已经较为成熟,选取最具有代表性的企业——谷歌作为案例展示其基础逻辑。

  内容推荐的核心是找到用户兴趣,推送相关内容。面对逐渐增长的网站数量,如何找到有价值、与搜索目标匹配度高的内容成为人们绕不开的话题。1996年,当时还是斯坦福大学学生的佩奇和布林建立并测试了一款名为Backrub的搜索性质软件,它是Google的前身,根据网站链接的相关性和流行度对站点进行排名。这可以说是内容传播类计算传播实践的初始形态,其目的是传递准确的信息。计算的目标主要为网站本身,包括网页内容、结构、域名等,涉及人参与行为的部分主要是计算“流行度”,即点击量的高低,由此确定什么是用户认为有价值的内容。其核心逻辑很简单:如果有很多人在谈论你,你一定很重要。

  创立内容推荐的基础逻辑后,谷歌开始不断优化算法,优化的具体方法是引入不同维度、领域的数据来作为搜索结果的支撑,并进一步探寻用户需求。2004年左右,谷歌开始将地理数据引入搜索结果,并且将用户使用习惯、浏览习惯用于计算可推荐的内容,形成了基于用户习惯与地理位置的“个性化推荐”机制。从此,谷歌开始通过算法“定义”什么是重要的内容,并通过算法提升推荐内容的质量。2008年,谷歌发布了Vince算法更新,其核心逻辑是:大品牌比小品牌可信。例如,在搜索中检索“移动通信”,中国移动作为大品牌会排在前面。2011年,Panda(熊猫)算法更新,目的是降低以数量取胜但仅提供低质量信息的“内容农场”网站的排名,以点击流(clickstream)、页面内容(page content)和链接概况(link profiles)为判断依据,目前该算法已成为谷歌核心算法的一部分。一年后,谷歌知识图谱(Google Knowledge Graph)上线运营,使用语义检索收集信息,在用户搜索结果的基础上还在搜索结果旁边以信息框的形式对关键词相关信息进行结构化展示,使用户能够对人物关系、组织结构关系等一目了然。目前谷歌知识图谱已增长到包含50亿个实体的5000亿个事实(facts)[7]。众多不同维度数据的加入,提升了谷歌提供搜索结果的准确性。

  智能化推荐是近7年来谷歌的发展方向,其目的是使搜索引擎不光提供文字上相关的直接搜索结果,更尝试让人工智能理解人的搜索意图,根据意图提供更为个性化的搜索结果。2015年,谷歌部署了第一个人工智能系统RankBrain,其主要作用是让机器拥有一定程度的自我归纳学习能力,在单词与概念之间建立联系。如搜索“食物链最底端捕食者是什么”,算法将自我检测网页内容,学习食物链相关概念,归纳总结后给出结果。2018年,神经匹配(neural matching)技术被运用在搜索引擎中,搜索引擎对关键词的理解不局限于词的本义,还包括更为模糊的延伸含义。目前谷歌采用的最新人工智能技术是2021年开始采用的多模态统一模型(Multitask Unified Model),该模型可以跨多种模式(例如文本、图像等)理解信息。如通过照片进行内容搜索,在搜索内容中进一步提出问题得到想要的答案[8]。基于众多的用户浏览数据,谷歌推出了Google AdWords,在搜索结果侧边提供分栏广告。

  在内容推荐领域,算法是核心,推荐结果的准确性是基础,智能化是趋势。

  (二)趋势分析:网络资料抓取上的特点解构

  传媒业界不满足于对于事实的描述,更关注发展趋势与未来。趋势分析是近年来业界发力的重点方向,核心分析对象是网络舆情的发展变化,企业在一定程度上充当了舆情智库角色。近年来,依据不同的算法,趋势分析类企业大量出现,围绕网络舆论,为企业、政府机构、研究院所、事业单位提供用户画像、趋势分析与指数排名等服务,以判断未来趋势。除百度等传统互联网公司所提供的趋势分析外,以“学术智力支持+企业化推广运营”的“学—研”结合式发展形势是趋势分析企业发展出的新形态,其在数据的基础上,增加了学术研判视角,让数据分析更加有方向性与针对性。这里以清博智能为例进行特点解析。

  在学术智力支持方面,主要是关注智库团队建设和产学研结合发展。在智库团队建设方面,以清博研究院为主体,自建研发团队,开发了元宇宙生态引擎、ROS机器人操作系统、高性能伺服驱动器和控制软件系统、运动控制算法、视觉算法、SLAM自主导航定位算法、多语种语音交互等诸多专利、核心技术,开发了清博指数、舆情、管家、开放平台等数据产品。其团队成员来自清华大学、中国科学技术大学等高校,拥有多家部委、地方政务部门、知名高校、中央媒体、500强企业等机构的实践经验。在产学研结合方面,与多所高校建立了产教融合实训基地。目前已与东北师范大学、海南师范大学等建设实习基地。

  在企业化推广运营方面,主要推动舆情分析业务发展,核心是算法建设,清博舆情是其核心产品。清博舆情为政务、企业以及机构提供舆情分析服务。在数据抓取范围方面,围绕主流收视渠道进行数据收集,包括媒体、“两微一端”、抖音、快手等,主要资料收集目的是开展智能语义分析和情感属性分析。在数据收集的基础之上,能够进一步解析表层舆论背后的传播路径,分析其产生过程与机理。在舆论采集技术上,主要是运用网络爬虫技术围绕特定关键词进行资料收集。在成果方面,清博舆情已经生成了分析文本的AI技术,构建出1.5亿个关系知识图谱,覆盖6700万个节点,还发展出包括动态推衍、态势感知等技术。服务包括标准化产品、智库化报告、定制化项目、功能型API和探索化研究五部分。数据的主要来源是网络抓取,并没有自建服务器。由于自动化的数据采集与结论生成,其在舆情业务方面长期与部委、地方政务单位、研究机构、大型企业等超过1500家客户合作,2021年完成21万份研究报告。

  在趋势分析领域,算法依然是核心,算法更新能力是优势保障,专业技术人员的持续加入是动力源泉。

  “存储+分析”模式的特色与逻辑

  “存储+分析”是对“抓取+分析”模式的超越。在该模式中,数据收集行为从被动变为主动,从机构本身上网“爬取”,变为合作单位、行业数据的主动存入。换言之,相较于网络爬取本身,“存储+分析”机构本身拥有了更为翔实的数据,通过将各方面数据导入自身数据库后进行数据分析与结果推广。“抓取+分析”模式的重点在于数据的“找”和“用”,而“存储+分析”则覆盖了数据“存、管、用”全流程,企业不仅关注信息传播本身,更专注数据服务,正在发生从传媒企业向数据企业的转变。人民数据是这类企业的代表,能够展示“存储+分析”的基本特色与逻辑。人民数据成立于2018年,对自身的定位是大数据时代的“国家队”,其核心业务包含“人民云”“人民数据资产服务平台”“研究院”三部分。

  数据的存储与运用功能主要由人民云平台完成,该平台于2022年5月正式上线,围绕打造云平台展开具体业务,其服务范围已超越了舆情分析本身。“云计算、云存储、云数据库、云上网络、云容器管理、云安全”六方面云服务,主要解决数据的高效、安全存储问题。其中云计算主要提供云服务器、边缘计算等服务;云储存包含云硬盘、蓝光存储等服务内容,云数据库提供云原生的MySQL、PostgreSQL两种关系型数据库,低延迟、可靠性较高;云上网络提供贡献宽带、弹性公网IP等服务;云容器管理为容器化的应用提供高效部署、资源调度、服务发现和动态伸缩等一系列完整功能;云安全提供网络态势感知、堡垒机等安全保障措施。六个方面形成了完整的云产业链,并且在此基础之上推出了“多云纳管”,能够在统一的平台上管理多个平台的云资源。数据的运用基于其多行业数据的综合积累,一方面是数据抓取,另一方面是机构间的数据共享合作。在数据抓取方面,人民云拥有图片、文字、语音、AI视频增强、人脸识别等技术,其抓取结果可通过大屏联动等技术进行展示。在数据共享合作方面,由于人民日报的党报属性,人民数据提出了人民云的自身定位——“大数据‘存、管、用’的安全云、自主可控的信创云、国资监管的国资云、开放共赢的行业云”,主打安全、国资背景和开源。其收集行业数据、政府数据的能力非常强,目前已拥有超过1.61亿条企业数据,600亿+条舆情数据,2.1亿条中国高速通行数据,3.5亿条司法数据,3.16亿条行政处罚大数据,2847个区县的卫星数据,65个国家的海关进出口数据,等等(根据人民云官方网站整理)。依据强大的全行业数据,人民云能够根据传播的需求,在收集委托对象数据与需求的基础上结合自身数据积累进行更为精准的计算传播,除舆情信息分析外,目前较为成功的案例还包括党建云、产业链精准招商、慢行交通监管、省级茶产业大脑等。通过对传媒大数据的运用,在传统优势舆情分析的基础上实现了跨界与超越。

  数据作为生产要素的地位已经深入产业界并得到中央认可,两年前发布的《中共中央 国务院关于构建更加完善的要素市场化配置体制机制的意见》中就已经明确了数据作为生产要素的地位。人民数据在数据收集、运用的基础之上更进了一步,向数据市场做出了探索。人民数据资产服务平台主要关注的是数据的确权。数据确权的流程由数据版权联盟、监管机构和平台发起数据治理专家委员会,由中国互联网发展基金会设立数据确权认证中心,最终向政府部门定期汇报数据确权情况。在提出确权申请的过程中,帮助数据所有者进行企业资格认证、数据合规性认证、数据质量测试和数据资产评估。可以说,在整个流程中,人民数据对自身定位较为清晰,人民数据资产服务平台的作用是提供确权申请和服务平台,其目标是做平台而不是做具体数据产权认证本身。目前该平台拥有20PB+数据总量,22个核心应用程序,12个数据服务商和航天信息、中国农业银行、中国工商银行等知名合作伙伴。已经形成的数据资产包括工商数据、税务数据、社保数据三部分,被运用于网络预约出租车行业监管、人民企查、受益所有人等功能中。值得注意的是,人民数据资产服务平台提供的数据确权服务目前是纯公益性质的,但数据确权后的数据交易有很大的盈利空间,未来场景可期。

  人民数据研究院的功能定位为国家级大数据智库平台,与“抓取+分析”模式中的趋势分析类企业较为类似,在这里不再赘述。

  计算传播业界的未来发展路径

  (一)传播理念:“用户=数据=资源”,用户体验优先

  在计算传播理念的引领下,业界已形成了“抓取-分析”模式与“存储-分析”模式的不同发展模式。但不论如何转变,计算传播以数据为核心,配合用户需求,提供有目的的传播这一路径是不变的。在这个过程中,核心是数据,没有数据,计算传播无从谈起。那么,如何获取数据这一计算传播行业中的核心资源就成了计算传播业界未来必须解决的问题。目前来看,数据资源的来源是用户本身,用户是数据的生产者。因此,我们可以画出这样一个等式:“用户=数据=资源”。在等式中,先有用户,带来数据,经过企业转化,最终变为可以变现的商业资源。那么,下一个问题是,如何吸引用户?如何吸引用户使用自身服务增加数据以增大未来企业发展的可能?从目前较为成功的实践案例来看,企业本身对于用户的吸引力就在于其是否能够满足用户的实际信息需求,换句话来讲,提供的计算传播服务好不好用,用得舒服不舒服。在未来的业界计算传播实践中,把用户体验放在第一位,将依然是吸引用户、增加数据资源的优质传播理念与制胜的不二法宝。

  (二)传播要领:“精准好用”是第一要务

  计算传播企业应该意识到,什么是企业发展的第一要务。从谷歌我们看到,虽然其以盈利为目的,但其对于自身搜索内容的准确性保障是较为充分的。通过算法调整等方式,搜索内容与用户需求的匹配是其发展的第一要务。有了这个前提,才能有用户的聚集,进而产生群聚效应。相应地,以用户兴趣为核心的推荐机制才能发挥作用,从而产生后续的服务、商品输出,最终形成良性循环。我国数字经济高速发展,带来了大量的网络用户与丰富的数据资源。在国外企业尚未完全进入国内之前,相关计算传播企业拥有战略机遇期。应着重在计算传播结果的准确性,特别是信息与用户兴趣匹配的准确性上下功夫,提升核心算法的智能化程度与准确率。不能本末倒置,以商业价值代替信息准确性作为内容推荐、趋势排名的判断标准,否则将在未来的全球竞争中处于不利地位。

  (三)传播实践:依据资源禀赋量体裁衣。从目前的业界实践来看,“抓取-分析”模式与“存储-分析”模式依赖的资源禀赋是不同的。前者需要强大的计算、分析能力,后者在此基础上更多出了存储介质、传输介质等数据存储设施建设和官方数据资源汇聚能力的要求。由于我国对于数据安全的保护与特殊的媒体机制,相对而言,私营企业更加适合“抓取-分析”模式,应该提高的是算法精准抓取、快速分析、高效匹配的能力。在此基础之上,吸引合作对象主动进行业务合作,收集合作对象信息,积累自身数据,从而实现存量数据与新增数据的综合分析。大型国资企业更加适合“存储-分析”模式,其在盈利的基础上,更承载了公共信息服务平台、数据安全港等公共责任。在数据汇集,特别是官方数据汇集方面,如海关、工商、交通等方面,国资企业相较于私营企业有明显优势。在数据库建设方面,国资企业有更强的能力进行全国布局并与地方政府深度展开合作。因此,在未来的平台搭建上,私营企业的服务对象应重点着眼于具体的企业、行业,在实践过程中寻找新领域,实现新技术。大型国资企业的服务范围应着眼于业态,甚至在一定程度上助推计算传播生态进步,在计算传播实践中起到国家级平台“引路径、定盘星”的作用。二者相结合,共同促进计算传播业界的良性互动与进步。

  参考文献:

  [1]Watts, D.J. A twenty-first century science[J]. Nature, 445(7127), 2007:489-489.

  [2]Lazer, D., Pentland, A.etc. Social science. Computational social science[J]. Science, 323(5915), 2009:721-723.

  [3]周葆华.“计算”的传播与“传播”的计算[J].新闻与写作,2020(5):1.

  [4]祝建华,黄煜,张昕之.对谈计算传播学:起源、理论、方法、与研究问题[J].传播与社会学刊,2018(44):1-24.

  [5]CNNIC.第50次中国互联网络发展状况统计报告[R].2022-08.

  [6]CNNIC.全球数字经济白皮书——疫情冲击下的复苏新曙光[R].2021-08.

  [7]Google.A reintroduction to our Knowledge Graph and knowledge panels[R]. 2020-05-20.

  [8]Prabhakar Raghavan.How AI is making information more useful[EB/OL].(2021-09-29).https://blog.google/products/search/how-ai-making-information-more-useful/.

  (作者为中国社会科学院新闻与传播研究所助理研究员)

来源:青年记者2022年10月下

编辑:范君