2024年04月20日 星期六
首页>传媒透视 > 正文

澎湃新闻的智能风控探索

2022-05-07 16:48:45

来源:青年记者2022年5月上   作者:黄杨

摘要:作为澎湃新闻在探索媒体融合服务于社会治理上的尝试,“清穹”平台致力服务于网络信息内容生态治理,服务于为筑牢网络安全屏障、抓好网上意识形态安全赋能。

  摘  要:澎湃新闻在不断推进平台化与生态化发展的过程中,对自有内容审核业务进行了深度融合发展和延伸探索,推出了基于“智能+人工+制度”的具有自主知识产权的“清穹”内容风控智能平台,并在互联网内容产业呈现几何级数增长的背景下,作为探索媒体融合服务于社会治理的尝试,开展了地方媒体在风控方面的首个产业化探索。“清穹”团队逐渐确立了需求导向、技术赋能、人工为核、机制保障的运作流程,通过深化自主研发与技术集成不断提升产品能力,拓展适合内容风控领域的“新闻+政务服务商务”的运营模式。

  关键词:澎湃新闻;清穹;媒体融合发展;内容生态治理;内容风控;智能审核

  自2019年以来,澎湃新闻依托自身内容风控经验,推出了基于“智能+人工+制度”的具有自主知识产权的“清穹”内容风控智能平台,开展了地方媒体在风控方面的首个产业化探索。“清穹”以人工智能算法为核心,以知识图谱、决策引擎、自然语言处理、机器深度学习等技术,为客户提供涉政信息审核为特色、涵盖涉黄涉暴恐涉违禁等全场景的内容审核服务,旨在为内容生态领域的平台方、生产方、管理方、从业者等提供完整的内容安全解决方案。这是澎湃新闻在不断推进平台化与生态化发展的过程中,对自有内容审核业务的深度融合发展和延伸探索,亦是在互联网内容产业呈现出几何级数增长的背景下,对第三方内容安全赋能的有效探索。

  作为澎湃新闻在探索媒体融合服务于社会治理上的尝试,“清穹”平台致力服务于网络信息内容生态治理,服务于为筑牢网络安全屏障、抓好网上意识形态安全赋能。“清穹”团队在对内对外的运营与服务中,逐渐探索确立了需求导向、技术赋能、人工为核、机制保障的运作流程,不断强化产品意识,通过深化自主研发与技术集成不断提升风控的专业能力,拓展适合内容风控领域的“新闻+政务服务商务”的运营模式,完善针对各种需求场景的综合解决方案。2020年8月,“清穹”获得了上海市主流媒体发展新媒体专项扶持资金;2021年6月,作为“地方媒体在风控方面的首个产业化案例”,“清穹”获得国家新闻出版署颁发的“2020年中国报业深度融合发展创新案例”证书。

  积极参与文明办网,主流媒体开展内容审核服务迎良机

  党的十八大以来,以习近平同志为核心的党中央高度重视网络文明建设,党的十九届五中全会对加强网络文明建设作出明确部署,中央制定实施《关于加强网络文明建设的意见》,政策与法律法规日益健全,各级主管部门加快建立完善网络综合治理体系,网络生态持续向好。

  但与此同时,不少商业网站、App、公众号、小程序等存在信息内容与审核力量不匹配的问题。在内容生产与审核的全流程中,一方面有一些平台或自媒体无资质违规生产或转载时政类新闻报道与评论;另一方面也有一些平台将内容的审核外包给了并无内容资质或经验的企业机构,导致许多违法、不良内容进入公众视野,破坏网络生态。一些与社会主义核心价值观相违背的错误思潮、低俗文化、落后观念等在网上仍时有传播,干扰网络秩序、污染社会风气,尤其是对青少年的健康成长产生不良影响。[1]第49次《中国互联网络发展状况统计报告》显示,未成年人表示曾在上网过程中遭遇不良信息的比例较 2019 年下降 11.5个百分点,但也达到 34.5%。[2]而只要是有内容发布的场景都可能面临不良内容的侵入,包括图文信息、用户评论、用户头像、昵称、直播弹幕等,甚至出现了大量的违规数据种类和变种。这就要求我们坚持以习近平新时代中国特色社会主义思想统领互联网内容建设,牢牢把握正确的政治方向、舆论导向、价值取向,弘扬主流价值,让健康向上的网络文化充盈网络空间。

  2020年9月,中共中央办公厅、国务院办公厅印发《关于加快推进媒体深度融合发展的意见》,明确提出“支持主流媒体搭建内容审核与安全管理平台,向社会提供第三方服务,提高对全媒体内容导向的把关能力”。

  在上海市委网信办和上海报业集团的指导下,澎湃新闻加强媒体融合顶层设计,积极参与网络空间治理,启动并逐渐加大网络信息内容风控智能平台的能力建设与拓展步伐,旨在确保所监测或服务的平台内容不违背法律、不传播虚假信息、不与主流价值观相悖,进一步落实好网站平台信息内容管理主体责任。面对网络信息内容风控需求持续扩大,以及由此带来的第三方内容审核及评估、岗位培训等需求也急速增加的情况,澎湃新闻积极主动地将互联网新型主流媒体公信力、影响力扩展至更宽阔领域,进一步利用自身优势拓展业务范畴,提升媒体融合发展的整体能力。正如2020年中国报业深度融合创新案例评审专家委员会在“专家点评”中所说:“本案例是贯彻落实中央政策精神,向社会输出主流媒体的内容风控能力和技术能力的有益探索。可以发挥党媒在内容把控方面的核心优势,助力互联网尤其是商业平台信息内容生态良性发展,营造清朗的网络空间。”[3]

  坚持与澎湃新闻一体发展,推进与传统采编要素融合

  澎湃新闻自2014年7月22日上线至今,一直在融合发展的道路上进化。“清穹”智能风控系统就诞生于澎湃新闻打造全链条内容生态服务商的创新实践,并在该战略目标发展框架之下,以先进技术引领驱动融合发展,在内容风控领域逐步迭代和深化,不断推进与澎湃传统采编系统的要素整合与融合。

  澎湃新闻的进化“三部曲”,首先是内生扩张。从上线之前纸质版的《东方早报》,到中国最早整体转型的互联网新型主流媒体澎湃新闻,再到2016年开始从图文报道为主逐步拓展为全媒体,上线视频频道、集成音频播报,新媒体产品门类日益丰富。其次是外生矩阵式拓展,澎湃新闻自2017年起努力突破原有的内容生产和聚合体系,通过打造问政(政务平台)和湃客(全球专业创作者平台),并联合原有的“问吧”(互动社区产品)拓展为“澎湃号”和“澎友圈”,一步步开展平台化的努力。2020年以来,澎湃新闻又通过打造技术输出、版权与素材服务以及内容风控项目等探索生态化发展之路,提出了进一步转型的战略目标:全面提升内容供给力、舆论引领力、行业赋能力、市场竞争力,力争在“十四五”期间成长为具有全球影响力的互联网新型主流媒体平台和全链条内容生态服务商。

  “清穹”智能风控系统就伴随着澎湃新闻平台化的发展而诞生,并随着澎湃新闻打造全链条内容生态服务商的拓展而深化,致力于为互联网内容行业提供基础服务和解决方案。

  一开始,澎湃新闻作为主流新媒体,主要依赖每天发布的原创新闻向受众提供内容服务,当时每天发的新闻不超过1000条,超过一半是原创,这依靠传统的自有采编团队通过三审流程可以内部解决。但随着平台化的发展,澎湃新闻的湃客、政务、媒体号等提供的UGC内容实现了量级的提升,每天发稿量以万计,并在持续增加,这是人工审核无法完成的,由此逐渐产生了对机器审核能力的需求。

  经过大半年的研发,2019年底“清穹”风控系统1.0版本上线试运行,提供以关键词的文字审核为主的审核服务,开始应用于澎湃新闻UGC内容的审核流程,并经过不断增加业务场景的优化迭代,形成了覆盖图片、音频、视频、评论、用户等多种场景的审核能力。

  “清穹”系统在研发过程中,还对澎湃新闻原有的自主开发的采编后台“湃”系统提供无缝嵌入式支持,在推进传统采编资源与现代生产要素有效整合和深度融合方面迈出了新的一步,成为澎湃新闻全媒体内容管理系统的有机组成部分。

  坚持需求导向和问题意识,不断迭代清穹软硬件能力

  在不断适应和满足澎湃新闻自身审核需求的过程中,“清穹”平台的团队也在逐渐走向市场,不断拓展和提升对外提供第三方风控服务的能力。

  “清穹”团队逐渐确立了需求导向、技术赋能、人工为核、机制保障的运作流程。依托于澎湃资新闻资深采编团队对时政和思想文化领域的理解及内容导向的把关能力,不断深化产品的涉政风控体系,结合市场需求,通过构建更丰富场景的SaaS(Software as a Service)和本地化部署服务能力,增强市场竞争意识和产品应用力。通过文字审核与审校合一、图音视频审核和衍生能力的四步能力建设与整合,不断提高操作平台的界面实用性与易用性,提高风险提示与预警的准确性与及时性,实现标准化、智能化与个性化的集中审核管理,不断探索适合内容风控领域的“新闻+政务服务商务”的运营模式,从而不断提升针对不同风控应用场景的服务能力与效率,降低内容风险管理成本。

  其中,“新闻”服务即为主流新闻媒体提供个性化审校服务。“清穹”在原有的图文与音视频审核能力基础上,通过叠加智能校对服务,不断扩充涉政和错敏文字与图片样本,提高对不规范表述的智能化识别纠错与预警能力,进一步提升为媒体信息发布场景提供服务的能力,并正在通过自主研发,将多种不同技术逻辑逐步整合为一次性输出的结果,提升产品在市场上的差异化竞争力。

  “政务”服务即为地方网信办等监管部门和地方党政机构提供个性化服务。“清穹”为部分地方网信办提供了对属地商业网站平台和自媒体开展网络信息内容生态测评的服务,可对网站、App、新媒体号发布的内容开展智能采集与巡检,进行内容安全监测与反馈;为政务网站与新媒体机构提供一站式监测服务,可对网站的站点可用性、政务功能、内容更新、互动回应、敏感信息、错链巡查等考核指标进行监测。

  在“服务商务”方面,“清穹”还单独或作为澎湃新闻技术输出整体解决方案的重要组成部分,为多家新闻媒体和综合性商业平台提供了网络信息内容安全的审核校对、培训和内容风控体系的整体解决能力监测、评估与优化等服务,以提高企业平台系统的信息内容安全治理水平。

  同时,“清穹”也在不断扩大内容风控在不同领域的适用能力,如通过通用解决方案叠加专业领域的政策适配与风控模块,为垂直领域商业机构、平台或企业集团提供其网站或新媒体矩阵信息的专业内容审核与校对;针对近年来日益突出的户外公共显示屏场景的风控需求,在常规的在线内容风控基础上,还可以提供大屏卫士智能终端硬件系统,对不良、敏感内容进行AI实时审核并作出相对应的应急处置,以及可提供图片、音视频版权监测审核服务等。

  与此同时,我们一直坚持,机器审核只是辅助,人工的审核才是核心,审核团队的经验与能力是审核效果和效率的最终决定因素。因此,依托于澎湃新闻多年的时政与思想文化领域的采编和运营经验,一方面,“清穹”风控团队核心运营人员均为澎湃新闻或业内资深从业人员,并不断加大审核团队的政治与业务能力建设,深入学习习近平总书记关于网络强国的重要思想,加大对马克思主义新闻观、网络安全与治理相关法律法规、融媒体发展趋势、内容审核实务等的培训与训练;同时,完善的流程和制度是对审核效果的客观保障,清穹团队不断建立健全审核与培训标准体系,不断优化如关键词架构、机器初审、人工初审与复审、人工质检与召回等审核制度流程,保证每次机器审核“硬迭代”都有相匹配的人工审核“软迭代”相辅相成。

  “开门”强技术,吸引社会力量开拓产学研合作

  对媒体来说,其技术能力相对于市场化的头部商业平台和技术公司来说是弱项。因此,澎湃新闻在发展“清穹”平台的能力上按照《关于加快推进媒体深度融合发展的意见》所提出的,坚持“开门”强技术。

  在“清穹”平台建设的过程中,团队对现有市场的部分云服务商、部分商业媒体的内容风控管理机制与流程,以及部分在线内容风控业务服务商和技术服务提供商的服务体系进行了调研,对其产品矩阵、应用场景、解决方案、功能特点、产品价格等进行了在线体验和比较,针对澎湃新闻自身的需求进行了有针对性的优化、借鉴,并在与不同行业客户沟通的过程中不断进行迭代和个性化调适。

  在坚持核心和基础能力自主研发的基础上,吸引社会力量参与风控项目的技术研发和市场开拓,借用现有的成熟技术不断提高“清穹”的智能化和个性化服务能力,并通过探索加强服务的可视化、结构化、便利化,持续优化风控产品的效能和产品体验。这种尝试也正在反哺澎湃新闻自身的技术创新,在人工智能、搜索和大数据算法等核心技术能力方面缩小与市场化互联网平台的差距,并推动可适用的前瞻性技术研究。

  “清穹”平台目前已采用安全隔离手段独立部署了文字、图像、音频、视频等智能审核模块,能针对涉政和黄暴恐等违规信息进行机器甄别,对外提供SaaS和本地化部署的服务,并通过有丰富经验的审核团队对机器审核结果进行人工复核和质检。

  在面向语音场景的风控方面,2021年3月,澎湃新闻与科大讯飞签署合作协议,在内容审核、人工智能技术、资源、品牌等层面开展全方位、多层次的战略合作,以内容风控技术深入完善、水平提升为双方合作延续,充分发挥各自优势,全力推动互联网内容生态产业链的转型升级。

  在面向前瞻应用的风控方面,2021年7月,澎湃新闻与上海人工智能研究院启动合作,共同设立数字安全与治理实验室,探索人工智能、大数据等新兴技术赋能数字安全与治理的具体路径,推进数字安全、技术治理等相关方向的技术研发与应用落地。

  在面向舆情感知的风控方面,2022年2月,澎湃新闻与上海蜜度达成合作,围绕网络信息内容安全、智能审校、舆情感知等领域深入挖掘人工智能等技术的应用潜能,在创新产品与服务、传播与分析、技术与资本等领域探索全方位合作,致力于为推动网络信息内容生态安全的发展提供更优化的解决方案。

  澎湃新闻与上述公司和机构的合作,通过嫁接融合商业平台、科研院所与技术公司的市场、渠道和技术优势,紧扣内容风控核心领域,以创新的“智媒体”运营场景开发为起点,面向更广泛的行业应用场景,旨在围绕网络信息内容生态建设,不断补齐“清穹”平台在先进技术方面的短板,并通过产学研的合作探索人工智能、大数据等新兴技术赋能数字安全与治理的具体路径,以更加适用管用的技术能力,提升在风控领域的能力和标准化的技术研发与应用落地,提升主流媒体的品牌价值,更好地履行其社会责任。

  参考文献:

  [1]庄荣文.汇聚向上向善力量 加快网络文明建设力[J].旗帜,2022(1).

  [2]第49次《中国互联网络发展状况统计报告》[R].http://www.cnnic.net.cn/hlwfzyj/hlwxzbg/hlwtjbg/202202/P020220407403488048001.pdf,2022-02.

  [3]澎湃清穹内容风控智能平台获评中国报业深度融合发展创新案例[EB/OL].https://www.thepaper.cn/newsDetail_forward_12968083,2021-06.

  (作者为澎湃新闻副总编辑)

来源:青年记者2022年5月上

编辑:范君