多项分布(multinominal distribution)

时间:2022-09-17 16:43:59

简介

更一般性的问题会问:“点数1~6的出现次数分别为(x1,x2,x3,x4,x5,x6)时的概率是多少?其中sum(x1~x6)= n”。这就是一个多项式分布。

定义

二项分布推广至多个(大于2)互斥事件的发生次数,就得到了多项分布。二项分布的典型例子是扔硬币,硬币正面朝上概率为p, 重复扔n次硬币,k次为正面的概率即为一个二项分布概率。(严格定义见二项分布中伯努利实 验定义)把二项扩展为多项就得到了多项分布。比如扔骰子,不同于扔硬币,骰子有6个面对应6个不同的点数,这样单次每个点数朝上的概率都是1/6(对应 p1~p6,它们的值不一定都是1/6,只要和为1且互斥即可,比如一个形状不规则的骰子),重复扔n次,如果问有x次都是点数6朝上的概率就是:
多项分布(multinominal distribution)

。更一般性的问题会问:“点数1~6的出现次数分别为(x1,x2,x3,x4,x5,x6)时的概率是多少?其中sum(x1~x6)= n”。这就是一个多项式分布问题。这时只需用上边公式思想累乘约减就会得到下面图1的概率公式。

某随机实验如果有k个可能结局A1、A2、…、Ak,分别将他们的出现次数记为随机变量X1、X2、…、Xk,它们的概率分布分别是p1,p2,…,pk,那么在n次采样的总结果中,A1出现n1次、A2出现n2次、…、Ak出现nk次的这种事件的出现概率P有下面公式:
多项分布(multinominal distribution)
用另一种形式写为:
多项分布(multinominal distribution)

2公式应用编辑

概率公式

这就是多项分布的概率公式。把它称为多项式分布显然是因为它是一种特殊的多项式展开式的通项。
我们知道,在代数学里当k个变量的和的N次方的展开式(p1+ p2+…+ pk )^N 是一个多项式,其一般项就是前面的公式给出的值。如果这k个变量恰好是可能有的各种结局的出现概率,那么,由于这些概率的合计值对应一个必然事件的概率。而必然事件的概率等于1,于是上面的多项式就变成了 (p1+ p2+…+ pk )^N =1^N=1, 即此时多项式的值等于1。
因为(p1+ p2+…+ pk )^N的值等于1, 我们也就认为它代表了一个必然事件进行了N 次抽样的概率(=1,必然事件)。而当把这个多项式可 以展开成很多项时,这些项的合计值等于1提示我们这些项是一些互不相容的事件(N次抽样得到的)的对应概率, 即多项式展开式的每一项都是一个特殊的事件的出现概率。于是我们把展开式的通项作为A1出现n1次,A2出现n2次,…,Ak出现nk次的这种事件的出现 概率。这样就得到了前面的公式。
如果各个单独事件的出现概率p1,p2,…,pk都相等,即p1=p2=…=pk=p(注意这里是小写的p),注意到p1+p2+…+pk =1,就得到p1= p2 =…=pk =p=1/k。把这个值代入多项式的展开式,就使展开式的各个项的合计值满足下式:
∑[ N!/(n1!n2!…nk!)](1/k)^N=1
即 ∑[ N!/(n1!n2!…nk!)]=k^N
以上求和中遍及各个ni的一切可能取的正整数值,但是要求各个ni的合计值等于N。即 n1+n2+…nk=N.

应用

用于处理一次实验有多个可能的结果的情况。
热力学讨论物质微观状态的可能个数时,经常用另外的思路引出N!/(n1!n2!…nk!)式。并且称它为热力学几率。它是一个比天文数字还大很多的数,把它称为几率(概率) 并不妥当。但是热力学里由于各个微观状态的出现概率相等,这对应我们在前面讨论的p1= p2 =…=pk =p=1/k,于是 [N!/(n1!n2!…nk!)](1/kN) 就真正具有数学上的概率的含义。换句话说,物理学里的热力学几率[N!/(n1!n2!…nk!)]乘上(1/kN)以后就是数学中定义的(具有归一性) 的概率了。

多项分布(multinominal distribution)的更多相关文章

  1. NLP&数据挖掘基础知识

    Basis(基础): SSE(Sum of Squared Error, 平方误差和) SAE(Sum of Absolute Error, 绝对误差和) SRE(Sum of Relative Er ...

  2. 常见的机器学习&数据挖掘知识点

    原文:http://blog.csdn.net/heyongluoyao8/article/details/47840255 常见的机器学习&数据挖掘知识点 转载请说明出处 Basis(基础) ...

  3. 关于Beta分布、二项分布与Dirichlet分布、多项分布的关系

    在机器学习领域中,概率模型是一个常用的利器.用它来对问题进行建模,有几点好处:1)当给定参数分布的假设空间后,可以通过很严格的数学推导,得到模型的似然分布,这样模型可以有很好的概率解释:2)可以利用现 ...

  4. The Dirichlet Distribution 狄利克雷分布 (PRML 2.2.1)

    The Dirichlet Distribution 狄利克雷分布 (PRML 2.2.1) Dirichlet分布可以看做是分布之上的分布.如何理解这句话,我们可以先举个例子:假设我们有一个骰子,其 ...

  5. 伯努利分布、二项分布、Beta分布、多项分布和Dirichlet分布与他们之间的关系,以及在LDA中的应用

    在看LDA的时候,遇到的数学公式分布有些多,因此在这里总结一下思路. 一.伯努利试验.伯努利过程与伯努利分布 先说一下什么是伯努利试验: *伯努利试验中: 伯努利试验(Bernoulli tri ...

  6. 各种分布(distribution)

    正态分布(Normal distribution),又名高斯分布(Gaussian distribution).若随机变量X服从一个数学期望为μ.方差为σ^2(标准差为σ)的正态分布,记为N(μ,σ^ ...

  7. 常见的概率分布类型(二)(Probability Distribution II)

    以下是几种常见的离散型概率分布和连续型概率分布类型: 伯努利分布(Bernoulli Distribution):常称为0-1分布,即它的随机变量只取值0或者1. 伯努利试验是单次随机试验,只有&qu ...

  8. 伯努利分布、二项分布、多项分布、Beta分布、Dirichlet分布

    1. 伯努利分布 伯努利分布(Bernoulli distribution)又名两点分布或0-1分布,介绍伯努利分布前首先需要引入伯努利试验(Bernoulli trial). 伯努利试验是只有两种可 ...

  9. 齐夫定律, Zipf's law,Zipfian distribution

    齐夫定律(英语:Zipf's law,IPA英语发音:/ˈzɪf/)是由哈佛大学的语言学家乔治·金斯利·齐夫(George Kingsley Zipf)于1949年发表的实验定律. 它可以表述为: 在 ...

随机推荐

  1. 说说WeakReference弱引用

    WeakReference弱引用概述 http://www.cnblogs.com/xrq730/p/4836700.html,关于Java的四种引用状态具体请参看此文 Java里一个对象obj被创建 ...

  2. C#实现鸽巢排序

    /// <summary> /// 鸽巢排序 /// 创建一个长度大于等于待排序数组array元素中最大值的标记数组mark, /// 将数组array中元素值个数映射到mark数组中. ...

  3. linux ftp服务

    1 安装ftp服务 [root@localhost ~]# yum install vsftpd 启动:service vsftpd start 查看状态:systemctl |grep vsftpd ...

  4. 安装和使用screen

    安装和使用screen 安装screenyum可以在线安装screenyum install screen 使用screen1.创建screen会话;进入Xshell,运行以下:screen 2.离开 ...

  5. class0513&lpar;html基础加强)

    内容:HTML.CSS 目标:掌握手写HTML实现一般难度的Web页面的能力(如网站注册表单),为ASP.Net学习打基础.坚持手写HTML,可视化设计只是一种自学的手段. 参考书:张孝祥<Ja ...

  6. BI名词解释

    BI名词解释     浏览数Page Views: 网页(含文件及动态网页)被访客浏览的次数.Page View的计算范围包括了所有格式的网页,例如:.htm..html..asp..cfm. asa ...

  7. R︱shiny实现交互式界面布置与搭建(案例讲解&plus;学习笔记)

    要学的东西太多,无笔记不能学~~ 欢迎关注公众号,一起分享学习笔记,记录每一颗"贝壳"~ --------------------------- 看了看往期的博客,这个话题竟然是第 ...

  8. (八)控件介绍,QLable

    Radio单选框 默认互斥,加GroupBox进行分组可以解决这个 checkBox复选 ListWidget TableWIdget:有表头 #include "widget.h&quot ...

  9. Codeforces555 B&period; Case of Fugitive

    Codeforces题号:#310B 出处: Codeforces 主要算法:贪心+优先队列 难度:4.6 思路分析: 这道题乍一看没有思路…… 考虑贪心的做法.首先预处理出每两座相邻的桥之间边界相差 ...

  10. NYOJ 一笔画

    # include<iostream> # include<string> # include<string.h> # include<queue> # ...