同质相吸:利用社会行为和人口属性推导社交网络结构
2021-07-14 20:38:48
  • 0
  • 4
  • 12

集智俱乐部   原创 ​胡一冰

导语

人们的行为很容易受到社交网络结构的影响,但社交网络本身的结构通常因行为类型而变,从人的行为挖掘社交网络结构并不容易。近日,Science Advances 上发表的一篇文章提出了融合Blau空间和伊辛模型的“kernel-Blau-Ising”建模方法,该方法能在仅有人类行为结果数据的前提下联合推断网络结构和预测人类行为。该研究不仅能够提高人们对行为过程及其与不平等和社会偏好之间联系的理解,还能够提高对未观察到的社会结果的可预测性。

研究领域:网络结构推断,伊辛模型,社交网络


胡一冰 | 作者

邓一雪 | 编辑

论文标题:

Inference and influence of network structure using snapshot social behavior without network data

论文地址:

https://advances.sciencemag.org/content/7/23/eabb8762.full

1. 难以获取基于特定行为的社交网络结构

从领导人投票到对疫苗的态度,人类的行为都有可能取决于社交网络的结构。虽然现在已经存在庞大且高质量的社会科学数据集将个人行为和个人属性连接起来,但是想要直接了解某种行为背后的社交网络却相当困难。主要的原因包括:依赖科技的网络数据难以真实地反映社会行为、现有的数据集仅在有限时间和空间内可用、大规模社交网络数据的安全隐私问题。

虽然获取基于特定行为的社交网络结构具有挑战,但是人口普查为单个节点提供了与社会相关的坐标信息,这或许可以成为研究的突破口。Peter Blau对社交网络结构提出了一个直观而有力的假设,即社会中的每个个体都可以被视为高维空间中的一个点(具有年龄、性别和收入等维度)。在这个空间中,个体之间的联系强度由相同属性驱动,并取决于它们在空间中的相对距离,该空间被称为Blau空间。种种同质性表明,研究者可以考虑个体在社会空间中分离的条件下建立联系。

图1. Ising模型的提出是为了解释铁磁物质的相变,即磁铁在加热到一定临界温度以上会出现磁性消失的现象,而降温到临界温度以下又会表现出磁性。在伊辛模型中,高温会导致箭头(通常表示粒子自旋)随机翻转,而磁力则会让近邻的箭头同向排列。这两股力量的斗争准确捕捉了现实世界中大量系统的特征。

除了关于个人坐标的信息,健康和投票数据集还为研究者提供了个人行为“快照”,该研究利用Blau社交结构几何观和伊辛模型(Ising Model)来推断软随机几何图(SRGG, soft random geometric graph)社会结构模型的核心,该方法称为“kernel-Blau-Ising (KBI) ”方法,通过该方法可以联合推断社交网络结构和人类行为。

【补充】集智百科伊辛模型介绍:

https://wiki.swarma.org/index.php?title=%E4%BC%8A%E8%BE%9B%E6%A8%A1%E5%9E%8B_Ising_Model

【补充】集智俱乐部知乎文章《伊辛模型百年小史:最经典的复杂系统模型,却险些被科学界遗忘》https://zhuanlan.zhihu.com/p/163706800

2. KBI建模方法介绍

KBI方法的主要过程如图2所示。输入数据包括不同地理区域产生的聚合行为和与该地区有关的社会经济属性(如年龄、收入、教育程度等)。图2中子图A表示伦敦地区选民行为热力图,其中红色和蓝色分别代表工党和保守党100%的支持态度,子图B为对应的行为概率分布图。子图C为选举结果下社会经济属性(如年龄和收入)的Blau空间表示。子图D为KBI方法下的Blau空间表示图,例如子图D可说明老年人比年轻人更有可能把选票投给保守党。根据人口在Blau空间的距离和它们同质性偏好依附的社交网络,通过近似贝叶斯方法得到的模型参数可以进一步用来预估选举变化和干预措施如何影响选民行为,干预措施包括如改变收入分配、改变同质吸引趋势等,分别如子图E和F所示。

整个KBI方法中较为重要的几个模块如下:

一、分别建立Blau空间中群体行为和社交网络结构生成模型。对于群体行为的生成模型,个体的行为部分由他们的社会坐标决定(如根据年龄、收入可推断是否接种疫苗),另一部分由他们的邻居节点在网络上的行为决定。对于社交网络结构的生成模型,节点建立联系的概率取决于他们在社会空间中的接近程度。

二、网络模型。若有n个个体,每个个体嵌入在一个k为的Blau空间中,其中向量z_{i}表示该个体在Blau空间中的坐标,代表该人的年龄、收入、住宅坐标等(如图3A)。异质性来源于布劳空间的人口分布,即取决于布劳空间的社会相对距离。研究者基于的连通性核函数(connectivity kernel function),通过软随机几何图来连接每个个体,其中连通性核函数又取决于布劳空间中的距离和核参数。

研究者在邻接矩阵中对个体之间的连接进行了编码,其中如果i和j是连接的,Aij=1,否则为0。Aij有连接性核ρ的伯努利分布可以表示为:

选择将上面连接核作为逻辑sigmoid函数:

dij为Blau空间距离,θ0是一个偏差项,不管Blau空间中的距离如何,它都说明了整体连通性密度。θk是k维Blau维度的连通性系数,它加权了对整体距离的贡献。[θ0, k=(1,...,K)]能衡量Blau空间中的同质性。θk越大,则该维度的同质性越强。

三、行为模型。该研究中的伊辛模型可以产生如下的自旋组态(spin configurations):每个嵌入Blau空间中的个体i可以用一个二元自旋(binary spins)σi=[-1.1]表示,它编码该个体的社会行为(如支持或反对、吸引或不吸烟),整体的自旋组态即可表示为 σ∈[-1,1]N。自旋的方向取决于外部场(EFs,external fields),将外部场建模为Blau空间中每个维度的线性场,由于自旋与外部场的相互作用仅取决于它们的坐标,故自旋总是倾向于与外部场方向一致(如图3C)。

图3. 表示自旋组态(spin configuration)的生成过程平衡了社会和空间场以及网络效应。子图A表示二维Blau空间中自旋的坐标(例如,x和y分别为年龄和收入)。子图B中展示了连通性核参数为XXX提条件下的软随机几何图。子图C表示线性外部场和低热噪声下的自旋组态。子图D中显示了根据B中软随机几何图连接的自旋组态。

3. KBI方法在真实选举中的应用

为了在合成数据之外展示我们的模型和推理方法,我们将其应用于大伦敦的三个选举数据集:伦敦市2012年、2016年市长选举和2016年脱欧公投结果。该研究提出的的KBI模型使用易于解释的参数来比较不同的选举结果,可视化和比较社交网络结构,并进一步估计干预措施。选举结果以汇总结果的形式给出,但仅限于知道特定地区的总结果,而没有个人的投票情况。研究者定义选举区概念,将每个选区的布劳空间坐标定义为每个布劳空间维度中人口普查数据的平均值,这些维度包括教育、年龄、性别、选区质心空间坐标和收入。

图4. 2012年和2016年伦敦市长选举和2016年英国脱欧公投的近似贝叶斯边际后验符合已知的同质偏好和政治偏好

该研究对大伦敦投票数据的结果证实了社交网络关系在距离、年龄、收入和教育方面的存在同质倾向。空间距离始终是三个选民投票社会关系形成的最同质维度,这与前人的研究一致。此外,该研究推断的空间长度尺度与其他人观察到的空间同质性一致。结果发现 2012 年和 2016 年伦敦市长选举推断的网络结构之间存在巨大相似性,但英国脱欧公投的社交网络结构不同。

关于几次投票活动之间的明显差异,脱欧公投(不同于市长选举)显示了教育属性的同质性:所持态度抑制了不同受教育程度人之间的交流。此外,该研究没有推断出在两个市长选举中已观察到的显著年龄或收入同质性。该研究所提出的模型可以成功预测缺失的选举数据。当考虑到连通性核时,相应的干预措施对于市长选举来说是显著的,但是对于欧盟公投来说影响较小。研究认为,这是由于与市长选举活动相比,英国脱欧在布劳空间中的定位不太明确。

图5. 可以通过减少不平等和鼓励社会融合来减少选举态度两极分化。

4. KBI方法总结和展望

该研究提出的BI模型允许仅使用人口行为“快照”数据,而不使用网络数据,来精确地再现人口水平的行为和已知的同质依附倾向。通过有效地推断Blau空间中与行为相关的社交关系,该研究不仅能够提高人们对行为过程及其与不平等和社会偏好之间联系的理解,还能够提高对未观察到的社会结果的可预测性。

鉴于其简单性和可解释性,该研究所提出的KBI模型可以推广至各种各样的行为或态度研究过程。在这些过程中,社交网络间的联系似乎会产生影响,尤其可以关注健康风险行为,如吸烟、饮酒或拒绝接种疫苗等。该研究还认为KBI模型是有相关性的,因为它以简单和可解释的方式明确了社会不平等(从收入到教育不平等)如何与社会偏好相互作用,从而形成社会网络结构,进而人们的社交网络结构和社会倾向再影响我们的行为。

 
最新文章
相关阅读