[论文阅读] The Emergence of Higher-Order Structure in Scientific and Technological Knowledge Networks

方法

Persistent homology 持久同源性

利用边的权重进行排序,降序添加边构成子图g1, g2, …., gm

同源性提供了知识网络的底层标志复合体所提供的知识的分层表示的结构的全局表征。

持久同源性通过对网络边缘权重的过滤来跟踪该知识结构,并在同现频率的尺度上提供该结构的更细粒度表征。

结果

通过绘制六个主要科学技术领域(化学、计算机、药物、电气、机械和物理)的平均拓扑洞数,概述了这些变化: 高阶结构的增加常常与低阶结构的减少相一致 在20世纪70年代,最常见的洞是一维的,其次是维度0、2和3。

到20世纪90年代末,顺序发生了变化,现在最常见的孔是维度2的洞,其次是维1、3和0。高阶结构和低阶结构之间的这种反向关系很重要,因为它不仅表明发现可能在更高的层次上进行得越来越频繁,而且表明它在更低的层次上做得越来越少,因此使用传统技术可能不太明显。

发现在计算机、物理、电子工程中,代表高阶网络结构的曲线显著升高,同时低维拓扑结构降低。这意味着这些领域近年来的发展,依赖参与者之间紧密的合作和互补。

以成对的方式计算每年每个知识子类别之间的持久性图之间的Wasserstein距离来判断拓扑变化: 虽然个别知识领域在若干年的拓扑相似性方面可能趋同,但知识领域之间拓扑结构的总体差异表明,随着时间的推移,存在显著差异 意味着科学和技术知识的维度正在增加,并且在各个领域的拓扑上变得更加异质。

在科研中的语言学上 更高维度的空洞与更抽象的词相关联 : 在β0下,最具预测性的引理是指通过视觉、声音和触觉容易感知的事物(例如,“曲柄”、“线轴”、“鞋”);令人惊讶的是,该清单包括6种简单机械中的3种(“杠杆”、“轮子”、“滑轮”)。相比之下,在β3下,最强烈关联的名词指的是不太容易感知的事物(例如,“过程”、“属性”、“方法”)。