似然与概率的通俗理解

时间:2024-01-22 14:47:02

1. 极大似然估计

假设有一枚硬币,我们想确定这枚硬币是否质地均匀。即想知道抛这枚硬币,正反面出现的概率各是多少?于是我们将这枚硬币抛了10次,得到的数据x0是:正正正正正正正。我们想求的正面概率θ是模型参数,而抛硬币模型可以假设服从二项分布。

那么,出现实验结果x0(正正正正正正正)的似然函数是多少呢?

而极大似然估计,顾名思义,就是要最大化这个函数。

 

我们可以画出f(θ)的图像:

从图像中可以观察到,θ=0.7时,函数取值最大。也就是说,我们通过最大化似然函数后,得到了模型参数的值,相应的,正反面出现的概率也就求出了。  

极大似然估计需要保证所有的采样都是独立同分布的。

2. 容易混淆的概念 

  • 极大似然估计就是最大似然估计。
  • 极大似然概率这个名词描述是不准确的,笔者查阅了整个英文互联网,都没有找到  ‘Maximum likelihood probability’这个词。所以,不存在“极大似然概率”这个说法。

3. 最大后验概率  

与极大似然估计相比,使用最大后验概率估计θ时,首先认为θ本身存在一个分布,即θ有先验分布。

还是以判断一枚硬币是否质地均匀为例。假设正面概率θ满足均值为0.5,方差为1的先验分布,即:

那么,将这枚硬币抛了10次,得到的数据x0是:正正正正正正正

因为考虑了先验分布,所以实验结果x0的函数可以表示为:

 因此,我们可以通过最大化这个后验概率函数求得θ,我们可以画出f(θ)的图像:

计算得到θ = 0.696。也就是说,采用最大后验概率计算得到硬币正面朝上的概率为0.696。

4. 似然与概率分别指的什么

似然: 英文单词为likelihood,有道翻译的翻译结果为:十有八九。

概率: 如果我有一枚质地均匀的硬币,那么它出现正面朝上的概率是0.5。

似然: 如果我抛一枚硬币100次,正面朝上52次,那么它十有八九是质地均匀的。

 

再举一个例子加深理解。 假设有人向我挑战一个“有利可图的赌博游戏”。

概率: 帮助我们计算预期的收益和损失(平均值、众数、中值、方差、信息比率、风险值、赌徒破产等等)。

似然: 帮助我们量化是否首先应该相信那些概率。

实际上,似然几乎可以等价于置信度。