曾子明 江新林
关键词:
突发公共卫生事件;
网络舆情;
溯源;
区块链;
智能合约;
IPFS
DOI:10.3969 / j.issn.1008-0821.2023.06.015
〔中图分类号〕G206 〔文献标识码〕A 〔文章编号〕1008-0821 (2023) 06-0149-09
在我国, 突发公共卫生事件是指突然发生, 造成或者可能造成社会公众健康严重损害的重大传染病疫情、群体性不明原因疾病、重大食物和职业中毒及其他严重影响公众健康的事件[1] , 不仅威胁人民群众的生命安全, 也影响国家的社会秩序和经济发展。2020 年, 新冠肺炎疫情在我国全面暴发,形成多个疫情重灾区, 全国累计确诊病例超700 万例, 国家财政减收增支超2 万亿元, 是一场重大的突发公共卫生事件[2] 。在此次疫情治理过程中, 因疫情信息公开不及时和部分网友在网络上散播虚假信息, 负面舆情持续恶性发酵, 使国家政府面临着线下疫情和线上舆情的双重挑战, 给疫情防控和社会治理带来了巨大的麻烦。网络舆情是线下公共卫生事件社会舆论在互联网上的直接映射, 代表着公众对事件的看法, 具有传播速度快、治理难度大等特点。当前, 社交平台多样化、信息跨平台化, 舆情追溯困难重重, 同时, 政府相关监管部门对舆情的研判也存在一定的延缓, 不能及时准确预测网络舆情的发展走向, 给后续事件的处理留下隐患。
缺乏透明度和多个主体间的信息不对称是网络舆情管控的主要挑战。目前, 网络舆情的溯源研究集中在人工智能算法领域, 研究对象多为单一社交平台, 面临着因信息更改或删除导致溯源数据丢失的瓶颈问题, 而且不同平台间数据结构也存在差异,缺乏统一的共享机制, 信息交互成本较高、响应周期较长, 往往错过了舆情管控的最佳时期。随着溯源技术的不断发展, 区块链凭借全局共享、不可篡改、可溯源、安全性高等优势逐渐被应用到网络舆情治理中, 可以快速进行信息定位, 追溯源头, 从根本上遏制谣言和虚假舆情的产生, 为网络舆情溯源提供了新的研究思路。本文基于态势感知理论和区块链技术, 构建了多社交平台网络舆情溯源体系, 试图突破舆情溯源的技术瓶颈, 利用分布式存储系统IPFS 进行舆情大数据存储, 利用智能合约对风险舆情进行监测, 利用内容标识符对源头信息块进行定位, 通过事件ID 和发布时间进行递推,实现舆情的精准溯源, 对提升我国面对突发公共卫生事件的应急处理能力, 具有重要的实践意义。
1研究现状
1.1网络舆情溯源
一直以来, 网络舆情溯源都是各界学者们的研究热点, 目前, 大多数学者都是基于算法的背景进行探讨, 研究对象多为单一社交平台, 溯源体系还不够完善。学者杨潇等[3] 提出一种基于微博用户兴趣的溯源算法, 综合考虑了发文博主、转发人、评论人三方的影响力, 与传统溯源算法相比, 准确率得到了一定的提升。刘荣叁等[4] 在溯源之前,先对舆情事件进行聚类处理, 然后使用Hacker News排序算法进行溯源, 降低了溯源整体的复杂度。米昂[5] 基于微博词语相似度和用户影响力来挖掘舆情的传播源头与途径, 实现舆情的溯源。刘继等[6] 基于贝叶斯网络构建了网络舆情态势评估模型, 并通过实验证明, 模型的拟合程度较高, 评估结果和实际结果基本吻合, 由于模型未加入时间片, 无法预测舆情事件的发展趋势。于凯等[7] 提出一种多中心性分析的舆情信息源点追溯算法, 与单一中心性算法相比, 多中心性算法溯源的准确率更高。还有一部分学者从网络舆情形成的路径等角度进行探讨, 如, 祁凯等[8] 基于系统动力学分析了政务短视频网络舆情的动力演化过程, 得出舆情响应速度和信息透明度对网络舆情引导管控的效果最佳。吕鲲等[9] 分析了网络舆情热点话题形成的路径, 为监管部门有效引导舆情提供了参考。
除了上述所谈及的方法和体系, 知识图谱、事理图谱等技术在网络舆情溯源的应用也十分广泛,利用图谱可以梳理事件的发展脉络和因果关系, 构建完善的溯源体系。张思龙等[10] 提出一种基于知识图谱的网络舆情研判系统, 对知识图谱在系统中的融合路径进行了探讨, 优化了舆情数据获取的准确度和计算智能度。王兰成等[11] 表示, 知识图谱运用于网络舆情管理具有诸多的优势, 可以降低知识库的构建成本和多系统集成的门槛, 提高舆情管理的智能化水平, 由于缺乏自動化构建方法, 推广受到限制。刘雅姝等[12] 基于事理图谱, 从知识驱动的视角揭示了突发事件的演变动因, 为舆情事件的精准治理提供了事实依据。
1.2区块链舆情应用
区块链常应用于金融、医疗和物流等领域, 如Omar I A 等[13] 通过区块链和智能合约技术建立了电子病历共享机制, 解决了传统患者隐私泄露的问题, 保障了医疗机构间数据的共享性。Lee J S 等[14]将区块链用于追踪供应链中的产品, 用智能合约取代传统订单合同, 简化了产品订购流程, 保证了产品的可追溯性。目前, 区块链在网络舆情领域的应用较为缺乏, 多数处于理论可行性阶段。如, 王迪等[15] 提出, 可以将区块链溯源技术应用到公共卫生事件的舆情治理, 并阐述了区块链在事件发生前、中、后3 个时期的具体应用价值。郑佳悦等[16] 通过分析我国目前网络舆情的管控难点, 提出将区块链技术运用至网络舆情监管, 可以保证舆情数据的真实性, 杜绝谣言发布者躲避惩处等现象发生, 给舆情监管带来新的可能。周婕[17] 通过区块链技术构建了大连高效舆情防控平台, 用于预防虚假信息的产生、传播和扩散。袁莉莉等[18] 提出, 利用区块链技术来解决重大突发公共卫生事件中虚假消息泛滥、公益慈善不透明、病毒溯源困难等痛点问题, 助力医疗体系的构建和完善。
综上分析, 舆情溯源的精准性与舆情信息的真实性、完整性密切相关。尽管当前一些传统溯源技术表现良好, 但都无法避免因信息更改或删除导致溯源信息缺失的瓶颈问题。当突发网络舆情在多个平台上发酵时, 信息交互的成本和时间会大大增加,舆情溯源的时效性也随之降低, 仅依靠传统溯源技术还难以实现网络舆情的有效管控。在当今时代背景下, 区块链应用于网络舆情管理已是大势所趋,推动区块链深入舆情领域应用, 有利于解决网络舆情溯源的技术瓶颈问题, 完善突发网络舆情溯源管理体系, 做到舆情信息高效交互、可溯源、防篡改和风险智能预警等, 并以有效的方式预测舆情潜在风险, 为我国网络舆情治理提供新的研究路径。
2基于区块链的网络舆情溯源技术体系架构
2.1区块链应用于舆情管理的技术优势
2.1.1舆情数据公开透明、高效交互
网絡舆情主要是在互联网的社交平台上进行衍生和传播, 由于平台间缺乏统一的信息共享机制,舆情数据互相独立、关联程度不高, 数据交互成本较大, 政府监管部门对突发公共卫生事件网络舆情的管控受到一定限制。在区块链网络中, 由于每个节点相互检测监督, 使信息跨部门、跨领域共享,信用问题也可以得到保障, 其他节点也可以随时进行查阅, 信息交流和传播变得公开透明, 同时政府监管机构可以通过区块链开放的API 接口对舆情数据资源进行访问, 充分发挥了政府调控职能和社会监督功能, 实现舆情信息公开透明、集体维护和公共安全数据多层次、多元化的共享。
2.1.2舆情可溯源、防纂改
舆情信息完整是溯源最基本的条件, 区块链是依据区块生成时间顺序、前后哈希相连的链式数据结构, 由后一区块的头节点指向当前区块的父节点,具体结构如图1 所示。在区块链中, 由SHA256 算法对块内信息进行加密存储, Merkle 树进行归纳验证, 时间戳记录区块的生成时间。区块链独特的哈希加密技术和分布式存储为舆情信息的完整保存和防篡改提供了安全保障, 链式数据结构和时间戳为舆情的溯源提供了技术支撑。
2.1.3舆情大数据存储
区块链不仅可以满足网络舆情溯源的技术需要, 还能与分布式存储系统结合进行扩容, 实现舆情大数据存储。在大数据环境下, 网络舆情信息呈现爆炸式的指数级增长, 若舆情信息都存储在区块链中, 区块链的存储效率将逐渐降低、成本也随之增加。随着存储技术的不断发展, 分布式存储凭借高可靠性、高性能性、高可用性、高扩展性逐渐被应用到大数据存储中, 其中的典型代表为星际文件系统, 英文简称IPFS, 本质上是一种内容可寻址、版本化、点对点超媒体的分布式存储传输协议[19] ,能够将具有相同文件系统的计算设备连接起来, 与区块链技术特性完美契合, 两者共同作为舆情数据存储的媒介, 可以实现舆情数据海量存储和空间资源利用最大化。
2.1.4舆情风险智能预警
突发公共卫生事件网络舆情爆发迅速、传播广泛、不易控制, 需要及时感知舆情、充分理解舆情和准确预测舆情。由于传统上报审批流程繁琐, 网络风险舆情的应急处理具有一定的延时性, 在区块链网络中, 可以充分利用智能合约的高效性、精准性和智能性, 将智能合约用于监测区块链网络中潜在的风险舆情, 对触发设定阈值的风险舆情及时做出响应, 简化审批上报流程, 减少知而不报现象的发生, 实现舆情风险的高效预警。
2.2区块链溯源技术架构
在本文中, 区块链视域下的多平台网络舆情管理是指将多个社交网络平台的应用程序部署在同一区块链上, 共同构建舆情数据共享中心, 舆情信息产生后存储在区块链内, 通过构建分类账本对突发公共卫生事件进行分类管理[15] 。为提高网络舆情溯源的时效性和精准性, 本文基于态势感知理论和区块链技术构建了突发网络舆情溯源技术架构, 在舆情潜伏发展期, 通过人工智能算法对区块链网络中的舆情进行风险研判, 分析舆情的情感倾向、风险等级和发展趋势等, 利用智能合约对舆情进行监控, 将重大风险舆情第一时间上报至监管部门, 并依据实际需要进行溯源处理, 将风险舆情扼杀在萌芽阶段, 不仅降低了负面和虚假舆情爆发的可能性, 也提高了舆情溯源的时效性, 为舆情处理提供了充裕的准备时间。
网络舆情溯源技术架构由风险研判模型和区块链技术框架两部分组成, 其中风险研判模型是基于生命周期理论和态势感知理论, 从舆情质量察觉、舆情态势研判、舆情风险预警、管控应急处理4 个部分对舆情进行分析, 模型如图2 所示。区块链溯源技术框架是基于区块链技术对风险研判模型发现的风险舆情进行溯源, 为政府相关监管部门的应急处理提供决策依据, 两者共同为突发公共卫生事件网络舆情的溯源提供理论基础与技术支撑。
舆情风险研判模型中, 舆情周期依据生命周期理论被划分为潜伏期、发展期、爆发期、衰退期4个阶段, 每个阶段都对应着舆情所处的不同态势,风险研判分为发现、分析、预警、响应4 个处理过程, 每一个过程层层递进, 负责1 个或多个时期的舆情分析。舆情潜伏期和发展期, 主要负责舆情的监测和预警, 通过计算区块链网络内的舆情事件热度等, 提前感知风险舆情, 并及时反馈, 避免舆情恶化发酵至中后期, 其中舆情热度H 被定义为舆情事件话题下的阅读人数r、评论次数c、转发次数re、点赞次数l 在突发公共卫生事件中的总值占比与对应权重乘积之和[20] , 计算公式如式(1):
式(1) 中, r、c、re、l 为某突发公共卫生事件话题下的数值, R、C、RE、L 为当天系统内突发公共卫生事件的累计总值, α、β、γ、δ 为各指标对应权重, 且相加之和为1。
在区块链网络中, 舆情信息主要来源于各类社交平台, 如中短视频类抖音、问答评论类知乎、图文资讯类微博、社交互动类微信等, 对于不同类型的社交平台采取不同的信息处理手段, 对于视频类传播的舆情平台, 通过OCR 视频关键帧识别技术与ASR 音频转文字技术将视频和语音转化为文本内容, 对于文本类传播的舆情平台, 将直接采集文本内容, 然后利用人工智能算法对文本内容进行特征提取、事件聚合、类别分析、情感分析等, 为舆情风险研判提供依据。在预警过程中, 若发现潜在的重大突发公共卫生事件网络舆情, 将及时上报给政府相关监管部门, 并利用区块链技术进行溯源分析。
区块链技术框架由数据来源层、数据存储层、共识网络层等5 个层次构成, 具体技术框架如图3所示。数据存储层主要负责数据的规范存储和结构化管理, 为缓解区块链的存储压力, 本文采用了区块链和IPFS 的双存储机制, 将原始舆情信息存储在IPFS 中, 将信息摘要和IPFS 返还的内容标识符CID 存储在区块链中, 由于相同的信息具有相同的哈希值, IPFS 不会进行重复存储, 同时IPFS 的分布式存储解决了区块链扩容难的问题, 为舆情数据的海量存储奠定了技术基础。
在共识网络层中, 采用P2P 分布式网络进行节点间的信息广播, 利用实用拜占庭容错共识算法(Practical Byzantine Fault Tolerance)或权益证明共识算法(Proof of Stake)进行信息上链, 保障网络中所有节点数据的一致性。合约层主要由算法机制、脚本代码和智能合约等组成, 其中智能合约是一种能够自我执行、自我验证、自我约束的契约, 遵循“If 成立, Then 触发预设条件” 的模式, 自动执行, 无需人为提出申请和干预操作[21] , 可以简化传统舆情上报的审批流程, 为舆情的智能化管理奠定理论基础, 在区块链系统中, 共制定了登陆注册、风险预警、权限核验3 类具有不同功能的智能合约, 分别用于系统中账户注册、风险监控和权限核验。应用层是节点用户对舆情共享中心信息进行的操作应用, 如信息查询、风险监控、权限核验等, 但规定只允许拥有权限的资源访问者, 才能对舆情数据进行获取, 在舆情信息共享的同时也保证了数据的安全性。
3基于区块链的网络舆情智能溯源管理体系构建
为进一步深化区块链应用, 完善网络舆情溯源管理体系, 本文从舆情数据管理、舆情研判预警、网络舆情溯源、舆情风险管控4 个层次进行分析,智能溯源管理体系如图4 所示。
3.1舆情数据管理
在区块链网络中, 突发公共卫生事件相关话題被创建后, 系统会赋予话题一个唯一标识的事件ID, 用于关联不同平台的相似舆情信息, 是平台间信息联系的纽扣。用户在话题下发表信息, 事件ID 将随着用户UID、发布平台、发布时间、信息内容等一同存储在区块链内, 通过事件ID 可以精准汇集网络中所有的相关信息, 分析舆情的演变历程。
为避免数据过多造成区块链膨胀[22] , 本文采用链上和链下IPFS 的双存储机制, 进行舆情数据存储和结构化管理, 数据存储和获取流程如图5 所示, 原始舆情信息经哈希加密以信息摘要的形式存储在区块中, 利用Merkle 树对块内信息进行归纳管理, 而原始完整舆情信息存储在IPFS 中, 并将在IPFS 存储返回的内容标识符CID 一同存储在区块链内, 保障了区块链和IPFS 信息之间的关联性。舆情数据获取时, 节点用户先完成身份权限的核验, 然后通过内容标识符CID 在IPFS 中找到存储节点, 从存储节点中获取源头信息所在的信息集,依据事件ID 和时间实现舆情的溯源。
3.2舆情研判预警
对风险舆情进行早期研判, 可以减少风险舆情的爆发, 避免负面舆情恶性发酵。舆情研判时, 先通过风险研判模型对网络舆情的特征进行提取, 分析舆情的情感倾向(正面、负面、中性)和事件热度, 然后利用风险预警智能合约对风险舆情进行监测预警。目前, 机器学习等人工智能算法在舆情领域已具有较为完善的技术体系, 可以辅助监管部门对舆情做出准确的判断, 但在舆情预警方面, 仍缺乏一定的智能执行性。本文利用区块链智能合约的自动执行性, 制定了由平台、政府监管部门等多主体参与的风险预警智能合约, 实现舆情预警的高效响应。
在智能合约制定之前, 先对突发公共卫生事件网络舆情的风险等级进行划分, 明确合约执行的条件。在本文中, 舆情风险等级由事件热度和涉及层次两者共同决定, 其中事件热度依据式(1) 被分为一级热度、二级热度和三级热度, 层级越低, 就代表着事件热度越高、公众关注度越高, 涉及层次依据影响范围分为小型群众、地方政府和国家社会, 两个层级相互作用, 将风险舆情划分为重大舆情、严重舆情、中等舆情和一般舆情, 其中重大舆情是指一级热度和国家层面的舆情, 如新冠肺炎疫情等相关舆情, 严重舆情是指一级热度和地方政府层面的舆情, 如某市食物中毒等事件舆情。明确网络舆情的风险等级, 有助于政府部门制定合理的应急处理策略, 实现资源利用的最大化。
风险舆情等级划分完成后, 开始制定风险预警智能合约, 智能合约模型如图6 所示。智能合约由监测对象、响应条件、响应规则、合约状态等组成, 其中监测对象为网络中的事件舆情, 响应条件为舆情风险的等级, 如严重舆情和重大舆情, 响应规则为依据舆情风险等级响应对应级别的预警, 如重大舆情对应着一级预警。风险预警智能合约重点监测风险等级中等及以上的舆情, 当事件热度和涉及层次达到合约设定的条件时, 即风险等级达到严重, 合约将依据响应规则自动执行对应的预警方案, 并直接反馈到政府监管部门, 保证了舆情溯源的时效性。
3.3网络舆情溯源
舆情溯源的高效精准, 一方面取决于舆情信息的完整性;
另一方面取决于舆情信息查找的效率,由于区块链和IPFS 都具有不可更改的技术特性,舆情信息保存完整。信息查找主要是通过Merkle树和分布式哈希表DHT(Distributed Hash Table)来实现的, Merkle 树是区块内的哈希二叉树, 负责对块内信息进行归纳管理, 由于哈希加密的过程不可逆, 无法对区块信息进行解密, 通过Merkle 树查找源头信息所在的区块, 获取信息的内容标识符CID, 然后从IPFS 中获取完整信息。分布式哈希表DHT 是一个巨大的文件索引哈希表, 信息索引条目形如<Key, Value>, 其中Key 为IPFS 存储信息时, 返回的内容标识符CID, Value 为存储该信息节点的IP, 负责查找IPFS 内信息源存储节点所在的位置, 当存储节点被找到后, IPFS 就会返回存储节点的“多地址”, 其中包含节点间通信遵循的协议、存储节点IP、访问端口等, 然后检索节点依据“多地址” 直接连接存储节点, 从存储节点获取所需信息。
网络舆情溯源流程如图7 所示, 节点用户先通过权限核验智能合约核验自己的身份, 若未授予数据获取的权限, 则无法进行后续流程;
若核验通过, 区块链将记录此次申请者的访问信息, 并允许用户从区块链中获取事件源头信息的内容标识符CID, 然后检索节点依据用户提交的CID 从分布式哈希表DHT 中进行查询, 获得存储节点的IP 地址, 与存储节点建立连接, 将完整舆情信息返回给节点用户, 依据事件唯一标识ID 和时间对块内信息进行逆向递推, 实现舆情的精准溯源。
除此之外, 还可以利用区块链不可更改的技术特性进行信息比对, 判断信息在传播的过程中是否被篡改或伪造, 以便更好地明确责任归属。在区块链中, 舆情信息经哈希加密后以哈希值的形式存在, 所以可以依据舆情信息哈希值是否一致来判断信息是否完整, 若实际信息计算的哈希值与区块链内的哈希值一致, 表明信息完整, 若哈希值不一致, 表明信息可能遭到了篡改, 通过哈希比对达到了信息比对的目的。
3.4舆情风险管控
对突发公共卫生事件网络舆情进行有效管控是溯源的最终目的。本文结合舆情生命周期和舆情响应顺序, 从监测预警、应急响应、管控反馈3 个层面, 构建了一个由平台、政府监管部门共同参与的风险舆情管控体系, 实现网络舆情的弹性管理。
在风险管控体系中, 社交平台扮演着监测、调节的角色, 负责对区块链网络中的舆情进行风险监测和协助政府监管部门进行舆情处理。在突发公共卫生事件暴发之初, 网络舆情还处于萌芽发展阶段, 平台对相关事件舆情进行实时监测, 关注舆情风险等级变化和公众情感走向, 制定相应的风险预警智能合约, 识别潜在风险舆情, 对于合约预警的潜在风险舆情, 如在突发公共卫生事件中, 散播不实信息和暗讽国家管控政策, 对社会造成了严重影响的舆情, 平台需要在第一时间进行介入处理, 对风险舆情进行报备。
政府监管部门在风险管控中, 扮演着监督、指导的角色, 负责对整体网络舆情环境进行监督和对上报的风险舆情处置进行指导, 制定应急响应方案。由于区块链具有不可更改的技术特性, 舆情信息保存完整, 进行溯源, 获取完整的舆情数据, 对数据进行全局分析, 了解舆情的来源、发展历程、用户特征、平台分布等情况。依据源头信息找到舆情初始发布者, 依据相关法律法规对初始发布者进行追责, 进一步完善网络舆情追责机制;
依据发展历程、用户特征等对舆情带来的社会影响进行评估, 识别潜在风险人群, 制定相应且完善的应急处理方案;
依据平台分布情况对各平台监管提出针对性意见, 完善平台内部舆情的监管机制, 创建文明网络舆情环境。
同时, 跨平台全局共享的性质也为政府辟谣提供了便捷, 监管部门在区块链网络中发布官方辟谣声明后, 节点用户可以随时查阅信息, 并在节点间进行高效传播, 有效消除负面舆情带来的影响。在舆情管控后期, 也要做好社会形象恢复工作, 依据公众反响情况, 认真评估与改进风险应急方案, 提升危机意识, 防止舆情二次反弹, 继续完善突发公共卫生事件历史数据库, 为后续相似突发舆情的处理提供参考。
4结束语
在大数据的环境下, 区块链和分布式存储技术应用于网络舆情管理已是大势所趋。为进一步深化区块链在突发公共卫生事件网络舆情溯源的应用,本文先通过梳理国内外网络舆情溯源的相关文献,发现目前多数研究都是基于传统溯源算法和单一的社交平台, 溯源的时效性不高, 且无法避免因信息更改或删除导致溯源数据丢失的瓶颈问题, 所以本文基于上述问题, 通过态势感知理论和区块链技术, 构建了一个多平台网络舆情溯源管理体系, 利用链上和链下双存储机制, 进行舆情数据的海量存储, 采用智能合约对网络中的风險舆情进行监测预警, 通过默克尔树和内容标识符等实现舆情的精准溯源, 提高了舆情溯源的时效性, 为监管部门制定应急处理策略提供了事实依据, 对我国突发公共卫生事件网络舆情的应急管控具有较强的现实意义。
当然, 本文研究也存在一定的局限, 首先, 区块链在网络舆情领域的应用还处于理论探索阶段,实际落地应用比较缺乏, 文章提出的一些设定如将社交平台应用程序部署到区块链上, 与实际情况存在一定的差距;
其次, 网络舆情的管控需要公众、平台、政府等多主体共同参与, 不同主体对舆情信息有着不同的需求, 单一的公共链、联盟链和私有链难以同时达到去中心化、高效且权威安全这3 个要素[23] , 后续研究将考虑以主权区块链为基础,尊重网络主权与国家主权监管, 构建包含公共链、联盟链和私有链的区块链网络, 进一步对舆情数据资源管理进行细分。