最大似然估计与期望最大化（EM）算法

一、最大似然估计与最大后验概率

1、概率与统计

概率与统计是两个不同的概念。

概率是指：模型参数已知，X未知，p(x1) ... p(xn) 都是对应的xi的概率

统计是指：模型参数未知，X已知，根据观测的现象，求模型的参数

2、似然函数与概率函数

似然是指：模型在不同参数下， p(x1) ... p(xn) 发生的概率

似然估计是指：模型的参数未知，X已知，根据观测现象（X），估计模型参数的过程

3、最大后验概率

最大似然是求参数，让P(X|θ)最大，最大后验概率是让P(X|θ)P(θ)最大，相当于给似然函数加了一个关于θ的权重。

为什么要让 P(X|θ)P(θ) 最大？

想一想我们在干什么？我们是根据一群观测数据X = （x1, x2 ... xn) 估计模型的参数，即求 P(θ₀ | X), 用贝叶斯改一下就是

P(θ₀ | X) = P(X|θ₀) P(θ₀) / P(X) , 对于给定的观测序列X来说P（X）是固定的，所以我们求后验概率P(θ₀ | X)最大就是求P(X|θ₀) P(θ₀)最大

对于

秒客网