马尔可夫随机场MRF和条件随机场CRF
马尔可夫随机场
概率图模型是一类用图来表达变量相关关系的概率模型
使用无向图的模型称为马尔可夫网(Markov Net)或马尔可夫随机场(Markov Random Field, MRF)
假设有联合概率分布
给定概率分布
全局马尔可夫性:假设
中结点集合 到 必须经过节点集合 ,则给定随机变量子集 时,随机变量子集 和 条件独立,即
根据全局马尔可夫性,可进一步推论无向图
局部马尔可夫性:设
是 的任意一个结点, 是与 邻接的结点的集合, 是除 和 外所有结点的集合,则 也即给定某变量的邻接变量,则其他变量条件独立于该变量
成对马尔可夫性:设
是 的任意两个不直接相连的变量, 是除 外的所有其他变量,则
无向图模型的因子分解
首先给出团和极大团的定义
团:设
是无向图 的结点子集,若 中任意两结点间均有边相连,则称 为团 极大团:若
是无向图 的团,且在 中加入任意其他结点后 不再是团,则称 为极大团
将联合概率分布表示为其无向图中极大团上的随机变量的函数的乘积的操作,称为无向图模型的因子分解,即
其中常数
函数
Hammersley-Clifford定理指出:无向图模型的分布一定可以表示为图上所有最大团上的势函数的乘积
条件随机场
条件随机场(Conditional Random Field, CRF)是一种对条件概率进行建模的马尔可夫随机场
具体来说,给定观测序列
若随机变量
构成一个由无向图 表示的马尔科夫随机场,即 则称
为概率分布 的条件随机场 其中
是除结点 外的所有结点, 是所有与 邻接的结点的集合
虽然图
形式化的说,线性链CRF满足$P(Yi|X,Y_1,…,Y{i-1},Y{i+1},…,Y_n)=P(Y_i|X,Y{i-1},Y_{i+1})$
线性链CRF广泛用于NLP等序列处理,例如词性标注任务中,观测序列
显然线性链CRF上每对相邻的
其中
与HMM相同,CRF也关注观测序列概率计算、参数学习和预测三个问题并有相应的算法
(反正传统方法用的不多了所以算法挖个坑以后再填)