[论文阅读] LBSN2Vec++: Heterogeneous Hypergraph Embedding for Location-Based Social Networks

introduction

Location-Based Social Network (LBSN) 包括

  • 异构边 (签入超边 check-in hyperedge, 包括用户 行为 时间 空间四个数据域)
  • 同构边 (友谊边 friendships edge, 两个用户之间的友谊关系)

Point of Interest (POI) 代表兴趣地点

friendship prediction 基于现有的社交网络预测两个用户之间的潜在友谊
location prediction 根据用户的历史移动轨迹预测用户在特定环境下的位置
n-uniform hypergraph 所有超边都包含固定数量的n个节点

LBSN2Vec++ (基于图采样的嵌入方法)

首先使用随机游走和停留方案从LBSN异构超图中联合抽取友谊边和签入超边,然后从这些超边中学习节点嵌入。

Random Walk with Stay

基于用户节点在社交领域的友谊对其执行经典的随机漫步,而对于每个遇到的用户节点,它停留在用户节点上,从相应的用户中抽取一组超边(签入)。

节点嵌入学习过程在这两种边缘之间交替进行(即友谊和签入)。

在每个用户节点上生成长度为lr次行走。

在游走过程中,对于每个用户节点ui, 选择它的2k个上下文(每侧有k个上下文节点),从而产生2k对用户节点。

图2显示了一个上下文窗口大小为2的示例。随后,使用随机抽样和替换策略为每个用户节点抽样相同数量(2k)的签入,以确保每个用户抽样的签入和友谊数量完全相同。

从每个签入(u,c,t,l)中学习概率为α,从每个用户节点对(ui,uj)的概率为1− α

总之,对于随机行走中的每个节点vi,预期的学习边总数为2k,包括预期的签入边2kα 个和预期的2k(1− α) 个用户节点对。

超边学习

节点嵌入利用最佳拟合线概念 即最小化数据点与拟合线的垂直距离之和 如图(a)

从形式上讲,一组节点嵌入的最佳拟合线是使每个节点嵌入和最佳拟合线之间的余弦距离之和最小的向量 可通过线性最小二乘法计算 如图(b)

通过迭代最大化超边中的每个节点嵌入与最佳拟合线嵌入之间的余弦相似性来优化n方向节点邻近性

采用负采样技术来最大化每个负采样节点vN与最佳拟合线向量之间的余弦距离

总的目标函数(最大化)

当从一个特定的超边学习时,只需要更新~vi~vN,因为最佳拟合线向量~vb是固定的

在学习过程中, 对于每个签入超边, 首先分别通过两个投影矩阵将相应的用户节点和POI节点转换为活动域中的节点

然后同时保持活动节点、转换后的用户节点与POI节点的三重邻近性(即最大化这个三元组中与最佳拟合的余弦相似度)。

实验部分

数据集

游走参数 (l=80,r=10,k=10) 以0.1的步长调整[0,1]内的参数α,以平衡社交和流动性对所学嵌入的影响

节点嵌入的尺寸d设置为128,负样本数γ设置为10

展望: 分析其他类型的用户移动数据(如交通轨迹和细粒度手机轨迹)时探索图形嵌入的思想。

代码: https://github.com/eXascaleInfolab/LBSN2Vec