马尔科夫链与MCMC方法

news/2024/5/19 2:33:26 标签: 贝叶斯, MCMC, 马尔可夫链

马尔科夫链概述

  • 基本思想: 过去所有的信息都已经被保存到了现在的状态,基于现在就可以预测未来。
  • Example: 假如每天的天气是一个状态的话,那今天是不是晴天只依赖于昨天的天气,而和前天的天气没有任何关系。当然这么说可能有些武断,但是这样做可以大大简化模型的复杂度。因此马尔科夫链在很多时间序列模型中得到广泛的应用,比如循环神经网络 R N N RNN RNN,隐式马尔科夫模型 H M M HMM HMM等,当然 M C M C MCMC MCMC也需要它。
  • 文字定义: 马尔科夫链为状态空间中经过从一个状态到另一个状态的转换的随机过程,该过程要求具备“无记忆性 ”,即下一状态的概率分布只能由当前状态决定,在时间序列中它前面的事件均与之无关,这种特定类型的“无记忆性”称作马尔科夫性质
  • 数学定义: 假设我们的序列状态是 . . . X t − 2 , X t − 1 , X t , X t + 1 , . . . ...Xt−2,Xt−1,Xt,Xt+1,... ...Xt2,Xt1,Xt,Xt+1,...,那么我们的在时刻 X t + 1 X_{t+1} Xt+1的状态的条件概率仅仅依赖于时刻 X t X_t Xt,即: P ( X t + 1 ∣ . . . X t − 2 , X t − 1 , X t ) = P ( X t + 1 ∣ X t ) P(X_{t+1}|...X_{t−2},X_{t−1},X_t)=P(X_{t+1}|X_t) P(Xt+1∣...Xt2,Xt1,Xt)=P(Xt+1Xt)
  • 既然某一时刻状态转移的概率只依赖于它的前一个状态,那么我们只要能求出系统中任意两个状态之间的转换概率,这个马尔科夫链的模型就定了。这就引出了我们的状态转移矩阵 P P P

状态转移矩阵的性质

  • 状态转移矩阵的定义: P i j = 从状态 i 转移到状态 j 的概率 P_{ij}=从状态i转移到状态j的概率 Pij=从状态i转移到状态j的概率
  • 平稳分布的判定:
    • 平稳分布:设马尔可夫链 X X X有转移概率矩阵 P P P,一个概率分布 π = { π 1 , π 2 , π 3 , . . . , π n } \pi=\{\pi_1,\pi_2,\pi_3,...,\pi_n\} π={π1,π2,π3,...,πn}如果满足 π j = ∑ i = 1 n π i p i j \pi_j=\sum_{i=1}^n\pi_ip_{ij} πj=i=1nπipij,则称 π \pi π为该马尔可夫链的平稳分布
    • 唯一平稳分布的判定: 满足不可约、正常返和非周期的马氏链存在唯一的平稳分布
      • 不可约: 从任意状态出发总可以到达其它状态
      • 正常返: 从某一状态出发,经过有限步转移后又可以回到该状态
      • 非周期: 保证马氏链不会陷入循环
    • 细致平稳条件: 设有马尔可夫链 X X X,状态分布 π = { π 1 , π 2 , π 3 , . . . , π n } \pi=\{\pi_1,\pi_2,\pi_3,...,\pi_n\} π={π1,π2,π3,...,πn},对于任意时刻 t t t 都满足 π i P i j = π j P j i \pi_iP_{ij}=\pi_jP_{ji} πiPij=πjPji,则称状态分布 π \pi π满足马尔科夫链的细致平稳条件,该状态分布 π \pi π就是该马尔科夫链的平稳分布
    • 细致平稳条件是判断平稳分布的充分而非必要条件
  • 然而,随便找一个状态转移矩阵,是无法满足细致平稳条件的,即假设这个随机的状态转移矩阵为 Q Q Q,会有 π i Q i j ≠ π j Q j i \pi_iQ_{ij}\ne\pi_jQ_{ji} πiQij=πjQji。但在 M C M C MCMC MCMC采样方法中对这个问题进行了巧妙的解决。

马氏链的极限定理

  • 马氏链的收敛定理: { X n , n ≥ 0 } \{X_n,n\ge0\} {Xn,n0}为一具有可数状态空间 S S S的马氏链,其状态转移矩阵为 P P P,且它存在唯一平稳分布 π \pi π,则在合适的条件下,当 n → ∞ n\rightarrow\infty n时,无论 X n X_n Xn的初始分布是什么, X n X_n Xn的分布都将收敛到 π \pi π
  • 马氏链的大数定律: { X n , n ≥ 0 } \{X_n,n\ge0\} {Xn,n0}为一具有状态空间 S S S的马氏链,其状态转移矩阵为 P P P,且它存在唯一平稳分布 π \pi π,对任何有界函数 h ( x ) h(x) h(x),当状态空间可数时,有 1 n ∑ i = 0 n − 1 h ( X i ) → ∑ j = 0 n − 1 h ( X j ) π j \frac{1}{n}\sum_{i=0}^{n-1}h(X_i)\rightarrow\sum_{j=0}^{n-1}h(X_j)\pi_j n1i=0n1h(Xi)j=0n1h(Xj)πj当状态空间连续,即不可数时,有 1 n ∑ i = 0 n − 1 h ( X i ) → ∫ S h ( x ) π ( x ) d x \frac{1}{n}\sum_{i=0}^{n-1}h(X_i)\rightarrow\int_Sh(x)\pi(x)dx n1i=0n1h(Xi)Sh(x)π(x)dx这个结论实际上就是在说当 n n n分大时,与马氏链 X n X_n Xn相关的函数 h ( X n ) h(X_n) h(Xn)的均值趋近于它的期望,通过这个结论,我们就可以应用马尔科夫链去近似计算复杂积分了。具体而言,假设我们要计算积分 μ = ∫ S h ( θ ) π ( θ ∣ x ) d θ \mu=\int_Sh(\theta)\pi(\theta|x)d\theta μ=Sh(θ)π(θx)dθ如果后验分布 π ( θ ∣ x ) \pi(\theta|x) π(θx)难以直接抽样,那么我们就可以构造一条马氏链 θ \theta θ,使其状态空间为 S S S且其平稳分布就是 π ( θ ∣ x ) \pi(\theta|x) π(θx),将此马氏链运行一段时间使其收敛于平稳分布后,将产生一系列服从平稳分布的随机样本 θ 0 , θ 1 , θ 2 , . . . , θ n − 1 \theta_0,\theta_1,\theta_2,...,\theta_{n-1} θ0,θ1,θ2,...,θn1,由该定理可得 μ ≈ 1 n ∑ i = 0 n − 1 h ( θ i ) \mu\approx\frac{1}{n}\sum_{i=0}^{n-1}h(\theta_i) μn1i=0n1h(θi)这种计算复杂积分的方法就称为 M C M C MCMC MCMC方法

References

  • https://www.zhihu.com/question/63305712
  • https://zhuanlan.zhihu.com/p/38764470

http://www.niftyadmin.cn/n/396104.html

相关文章

BLIP使用教程

文章目录 准备测试示例一示例二: 结论源代码 原理篇: BLIP2-图像文本预训练论文解读 准备 如果无网络需提前下载相关模型 安装torch、transformers pip install torch trtransformers测试 测试blip基于图片生成文本描述能力(Caption&…

英语学习:g开头

gain 赢得 gallery 画廊 gale 强风 game 游戏,运动,比赛 garage 汽车间(库) garbage 垃圾 garden 花园,果园 gardening 园艺学 garlic 大蒜 garment 衣服 gas 煤气 gate 大门 gather 聚集,采集…

C++11之异常处理

文章目录 一、异常处理的概念二、异常编写的步骤(来自图论教育)三、栈展开和异常捕获四、C11中noexcep关键字 一、异常处理的概念 异常是程序可能检测到的,运行时不正常的情况,如存储空间耗尽,数组越界,被…

JAVA微服务_网关

服务网关 什么是服务网关/API网关 API Gateway(APIGW / API 网关),顾名思义,是系统对外的唯一入口。API网关封装了系统内部架构,为每个客户端提供定制的API。 近几年来移动应用与企业间互联需求的兴起。从以前单一的…

2年测试我迷茫了,软件测试大佬都会哪些技能?我的测试进阶之路...

目录:导读 前言一、Python编程入门到精通二、接口自动化项目实战三、Web自动化项目实战四、App自动化项目实战五、一线大厂简历六、测试开发DevOps体系七、常用自动化测试工具八、JMeter性能测试九、总结(尾部小惊喜) 前言 Python自动化测试&…

区块链基础之共识机制

1.1共识机制 1.1.1核心定义 区块链上的共识机制主要解决由谁来构造区块,以及如何维护区块链统一的问题 1.1.2共识机制分类 1.1.3 共识算法 1.1.3.1 POW(工作量证明) 代表项目:BTC 由于不同的节点接受数据有所区别,为了保证数据一致性&a…

全志V3S嵌入式驱动开发(音频输出和音频录制)

【 声明:版权所有,欢迎转载,请勿用于商业用途。 联系信箱:feixiaoxing 163.com】 之前在芯片公司的时候,基本没有看过音频这一块,只知道有个alsa框架这么个知识点。要驱动音频,需要两部分&#…

MySQL存储引擎概述

前言:MySQL语句执行流程为:SQL语句→查询缓存→解析器→优化器→执行器(执行器会调用执行引擎API);人们把“连接管理、查询缓存、语法解析、查询优化”这些并不涉及真实数据存储的功能划分为MySQL server的功能&#x…