图极限

图极限

图极限

本条目存在以下问题,请协助改善本条目或在讨论页针对议题发表看法。
此条目也许具备关注度,但需要可靠的来源来加以彰显。(2020年6月27日)请协助补充可靠来源以改善这篇条目此条目包含指南或教学内容。 (2020年6月27日)请借由移除或重写指南段落来改善条目,或在讨论页提出讨论。此条目可参照英语维基百科相应条目来扩充。 (2020年6月27日)若您熟悉来源语言和主题,请协助参考外语维基百科扩充条目。请勿直接提交机械翻译,也不要翻译不可靠、低品质内容。依版权协议,译文需在编辑摘要注明来源,或于讨论页顶部标记{{Translated page}}标签。

图极限(graphon),或称图极限函数(graphon function),是用统计网络分析中,用以描述一类具有顶点可交换性结构的图之结构的二元函数。概念上,图极限函数可以被理解为一个内在结构恒定的随机图,在顶点数趋于无穷时所收敛到的极限(假定其顶点已按恰当的次序排列)。

图极限函数为描述随机图的结构和渐近性质提供了基础工具,对图极限的估计和统计推断,是近年来统计网络分析的前沿课题之一。

定义

在文献中,图极限函数的定义,通常必须和顶点可交换随机图(vertex/node exchangeable random graphon)的模型,以及Aldous-Hoover表示一起陈述。

顶点可交换随机图

“随机图”指的是一个顶点集合为 { 1 , … , n } {\displaystyle \{1,\ldots ,n\}} 0401c38cf1a2e51b30b38f4b93b5285aa77f8fad.svg_ 的图,其边是从某个统计模型中随机生成的。用邻接矩阵(adjacency matrix) A ∈ { 0 , 1 } n × n {\displaystyle A\in \{0,1\}^{n\times n}} c45daa53a7e86039d2a242d0901772ef2730a0a7.svg_ 表示该随机图,则 A {\displaystyle A} 7daff47fa58cdfd29dc333def748ff5fa4c923e3.svg_-1 是一个随机矩阵。

“顶点可交换性”指的是,若任意交换两个下标 i , j {\displaystyle i,j} f4cbf8bbc622154cda8208d6e339495fe16a1f9a.svg_,不会改变 A {\displaystyle A} 7daff47fa58cdfd29dc333def748ff5fa4c923e3.svg_-1 的边际分布。换句话说, A {\displaystyle A} 7daff47fa58cdfd29dc333def748ff5fa4c923e3.svg_-1 具有顶点可交换性质,当且仅当:

A = d A σ , σ {\displaystyle A{\stackrel {d}{=}}A_{\sigma ,\sigma }} 3334b0ebe7c38a08aafcfbd93aebc8275b29ed14.svg_

其中 = d {\displaystyle {\stackrel {d}{=}}} 4ced0ab8f7ab79f1d2086125d560086c04bafdf3.svg_ 表示同分布, σ : { 1 , … , n } → { 1 , … , n } {\displaystyle \sigma :\{1,\ldots ,n\}\to \{1,\ldots ,n\}} d07b0f772cb9761faba78069595c90fbefb2b130.svg_ 是任意一个重排列(permutation),并定义 ( A σ , σ ) i , j = A σ − 1 ( i ) , σ − 1 ( j ) {\displaystyle (A_{\sigma ,\sigma })_{i,j}=A_{\sigma ^{-1}(i),\sigma ^{-1}(j)}} d1b9792515a0ae68de679fe989d3442a675ed13f.svg_.

Aldous-Hoover表示(Aldous-Hoover representation)

Aldous和Hoover在1980年代独立证明了如下结论:任何一个顶点可交换图的生成模型,都对应某个图极限函数 f ( u , v ) : [ 0 , 1 ] 2 → [ 0 , 1 ] {\displaystyle f(u,v):[0,1]^{2}\to [0,1]} d9c6a9c07dbcf6173ca1cec7d1bd3a14e17f4404.svg_,使得图的生成模型等价于如下的随机图生成模型:

[ 0 , 1 ] {\displaystyle [0,1]} 738f7d23bb2d9642bab520020873cccbef49768d.svg_ 上的均匀分布生成 n {\displaystyle n} a601995d55609f2d9f5e233e36fbe9ea26011b3b.svg_-2 个独立同分布的随机变量 X 1 , … , X n ∼ U n i f o r m [ 0 , 1 ] {\displaystyle X_{1},\ldots ,X_{n}\sim \mathrm {Uniform} [0,1]} 993c44dc0c891e6ec4a2b092b1636134f858a248.svg_,它们是图顶点的隐含位置(latent space position) 顶点 ( i , j ) {\displaystyle (i,j)} 8ef21910f980c6fca2b15bee102a7a0d861ed712.svg_ 间有边相连的概率定义为 W i j = f ( X i , X j ) {\displaystyle W_{ij}=f(X_{i},X_{j})} f0d8faf6793623ef0ec44ec816301e4d451cca8b.svg_,这里 W ∈ [ 0 , 1 ] n × n {\displaystyle W\in [0,1]^{n\times n}} b314b3f8f00f3bed2749791a35eadde9eb32f585.svg_ 是该随机图的概率矩阵 从概率矩阵生成邻接矩阵: P ( A i j = 1 | W i j ) = W i j {\displaystyle \mathbb {P} (A_{ij}=1|W_{ij})=W_{ij}} d435eec1eda866181c1a2b38c45ebdbf5c420aef.svg_,并且所有 A i j {\displaystyle A_{ij}} 8272b28f5aae6dbb8d6f829d58bab353b21bde20.svg_ 在给定 W {\displaystyle W} 54a9c4c547f4d6111f81946cad242b18298d70b7.svg_ 的条件下是互相条件独立的。

对上述定义的理解

Aldous-Hoover表示可以描述一切顶点可交换图。也就是说,即使 A {\displaystyle A} 7daff47fa58cdfd29dc333def748ff5fa4c923e3.svg_-1 的生成模型中边之间不是独立的(或给定某个期望矩阵后是条件独立的),只要 A {\displaystyle A} 7daff47fa58cdfd29dc333def748ff5fa4c923e3.svg_-1 整体(考虑整个图所有边的联合分布)具备顶点可交换性质,那么该边不独立的随机图模型,就等价于由某个图极限函数 f {\displaystyle f} 132e57acb643253e7810ee9702d9581f159a1c61.svg_ 诱导的随机图模型,其中边在给定概率矩阵后是条件独立的。但Aldous-Hoover表示并不显式地构造这个 f {\displaystyle f} 132e57acb643253e7810ee9702d9581f159a1c61.svg_,而对应一个边不独立的随机图的 f {\displaystyle f} 132e57acb643253e7810ee9702d9581f159a1c61.svg_ 有可能非常复杂和抽象,并未必具有良好的光滑性。 上述Aldous-Hoover表示所描述的生成模型中, X 1 , … , X n {\displaystyle X_{1},\ldots ,X_{n}} ac794f5521dcce89913085a6d566e7cdb615dbb0.svg_-1 f {\displaystyle f} 132e57acb643253e7810ee9702d9581f159a1c61.svg_ 以及 W {\displaystyle W} 54a9c4c547f4d6111f81946cad242b18298d70b7.svg_ 都是不可见的。唯一能观测到的数据是邻接矩阵 A {\displaystyle A} 7daff47fa58cdfd29dc333def748ff5fa4c923e3.svg_-1. 由于模型参数的可识别性问题, X 1 , … , X n {\displaystyle X_{1},\ldots ,X_{n}} ac794f5521dcce89913085a6d566e7cdb615dbb0.svg_-1 f {\displaystyle f} 132e57acb643253e7810ee9702d9581f159a1c61.svg_ 一般是不唯一的,因而也是无法估计的。实际应用中,唯一能被有意义地估计的参数是 W {\displaystyle W} 54a9c4c547f4d6111f81946cad242b18298d70b7.svg_.此章节需要扩充

离散的随机图向图极限的收敛

此章节需要扩充

例子

随机区块模型(Stochastic Block Model,简称SBM)的图极限(graphon)是一个分块常数函数。具体而言,设一个随机区块模型由 K {\displaystyle K} 2b76fce82a62ed5461908f0dc8f037de4e3686b0.svg_ 个区块构成,成员所占百分比为 π 1 , … , π K {\displaystyle \pi _{1},\ldots ,\pi _{K}} 311551eaad87fe3fcca575b0e823d36a705c4412.svg_ ,满足 π 1 + ⋯ + π K = 1 {\displaystyle \pi _{1}+\cdots +\pi _{K}=1} 39ef05cdef19b02a4276dbd3cb8898a7c0720d69.svg_。又记第 k 1 {\displaystyle k_{1}} 376315fd4983f01dada5ec2f7bebc48455b14a66.svg_ k 2 {\displaystyle k_{2}} c51b4ba57ee596d8435fc4ed76703ca3a2fc444a.svg_ 个区块的成员之间有边相连的概率是 B k 1 , k 2 {\displaystyle B_{k_{1},k_{2}}} c8814f5b34b4008da540ef25a4e7786865f749aa.svg_,则该随机区块模型可以等价地表为从下述图极限函数诱导的网络模型: f ( u , v ) := B k 1 , k 2 {\displaystyle f(u,v):=B_{k_{1},k_{2}}} 69aa484633aff457823b3d402da0f6b923b4b35e.svg_,其中 u ∈ ( π 1 + ⋯ + π k 1 − 1 , π 1 + ⋯ + π k 1 ) , v ∈ ( π 1 + ⋯ + π k 2 − 1 , π 1 + ⋯ + π k 2 ) {\displaystyle u\in (\pi _{1}+\cdots +\pi _{k_{1}-1},\pi _{1}+\cdots +\pi _{k_{1}}),v\in (\pi _{1}+\cdots +\pi _{k_{2}-1},\pi _{1}+\cdots +\pi _{k_{2}})} c741223141a71c72acca8ad42685209168c3adf7.svg_ ,并为方便统一记号,令 π 0 = 0 {\displaystyle \pi _{0}=0} 63bbe5e4964fb2a3501d18128a3298f6c8bb77b1.svg_. 一般而言,该图极限表示不是唯一的,例如随意交换 π 1 , … , π K {\displaystyle \pi _{1},\ldots ,\pi _{K}} 311551eaad87fe3fcca575b0e823d36a705c4412.svg_ 的顺序,上述表述依然成立。Erdos-Renyi图(Erdos-Renyi graph)的图极限是一个常数函数,它是一种特殊的随机区块模型。

图极限的估计方法

此章节需要扩充

参考文献

此章节需要扩充

{\displaystyle } df4dcd61276328f7c7ec5bdc399b6e11114a2c68.svg_

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注