提出问题
有\(n\)个互相独立的\(0\)至\(1\)之间等概率生成的随机变量,求从小到大排序后第\(i\)个数的数值期望
一个简化的问题
我们先来求解一个简化的问题:最大值的数值期望是多少?
我们会发现,由于这些变量都是在\(0\)到\(1\)之间等概率生成的,所以一个变量小于等于\(x\)的概率为\(x\)(即\(P(x_0\leq x)=x\)),则这\(n\)个数中最大值为\(x\)的概率为\(x^{n-1}\)(其他\(n-1\)个变量都小于等于\(x\))
再考虑到有\(n\)个数都有可能成为最大值,所以最后答案还要再乘\(\binom n1\)(实际上这个组合数应该放在原式的概率函数\(p(x)\)里的,但为了表达方便,我们将这个组合数提到最外面最后进行计算,后面的运算也是如此)
由于期望的计算公式为
\[E(x)=\sum_{k=1}^{+\infty}x_kp_k\]
套到这题里就是
\[\int_0^1x\cdot x^{n-1}\cdot dx=\int_0^1x^n\cdot dx=\frac 1{n+1}\]
乘上组合数,得到这个简化问题的答案为\(\frac n{n+1}\)
扩展
我们现在求得了最大值(第\(n\)个数)的数值期望为\(\frac n{n+1}\),同理可以计算出最小数(第\(1\)个数)的数值期望为\(\frac 1{n+1}\),大胆猜想第\(i\)个数的数值期望为\(\frac i{n+1}\)
我们下面来证明这个式子
类比上面求最大值的解法,我们可以很容易地列出我们需要的式子
\[\int_0^1x\cdot x^{i-1}\cdot (1-x)^{n-i}\cdot dx=\int_0^1 x^i\cdot (1-x)^{n-i}\cdot dx\]
(第\(i\)个数为\(x\)的概率为前\(i-1\)个数都小于等于\(x\),后\(n-i\)个数都大于等于\(x\),则概率为\(x^{i-1}\cdot (1-x)^{n-i}\))
这个式子在最后还要乘一个\(n\cdot \binom {n-1}{i-1}\)(\(n\)个数都有可能成为第\(i\)个数,还要再选出小于等于\(x\)的\(i-1\)个数)
我们列出了式子,但这个式子并不像\(x^n\)这样好积分;为此,我们需要一些数学工具 妙妙工具
分部积分法
分部积分法由乘法法则推导而得
\[(uv)'=uv'+u'v\]
移项
\[uv'=(uv)'-u'v\]
两边同时积分
\[\int uv'\cdot dx=uv-\int u'v\cdot dx\]
积分
明确目标,我们要求
\[\int_0^1 x^i\cdot (1-x)^{n-i}\cdot dx\]
我们设\(u=(1-x)^{n-i},v=\frac 1{i+1}x^{i+1}\)
则\(u'=-(n-i)(1-x)^{n-i-1},v'=x^i\)
则我们要求的即为
\[\int_0^1uv'\cdot dx=(uv)\big|_0^1-\int_0^1 u'v\cdot dx\]
由于无论\(x\)取\(0\)还是\(1\),\(uv\)都为\(0\),则我们只需要考虑后面的式子即可
\[-\int_0^1 u'v\cdot dx\]
\[=-\int_0^1 -(n-i)(1-x)^{n-i-1}\frac 1{i+1}x^{i+1}\cdot dx\]
\[=\frac {n-i}{i+1}\cdot \int_0^1x^{i+1}(1-x)^{n-i-1}\cdot dx\]
数列
我们发现这个式子和和最初的式子的积分部分很像,可以对比一下:
\[\int_0^1 x^i\cdot (1-x)^{n-i}\cdot dx\]
\[\int_0^1x^{i+1}(1-x)^{n-i-1}\cdot dx\]
发现一个指数上升\(1\),一个下降\(1\),则我们设\(a_i=\int_0^1 x^i\cdot (1-x)^{n-i}\cdot dx\)
则我们可以得到一个有趣的递推式\(a_i=\frac {n-i}{i+1}\cdot a_{i+1}\),而边界条件即为我们一开始证明的式子\(a_n=\frac n{n+1}\)
从而我们可以得到\(a_i\)的通项公式\(a_i=\frac {i!(n-i)!}{(n+1)!}\)
所以我们前面那一长溜的积分式,可以化简为\(\frac {i!(n-i)!}{(n+1)!}\)!(忽略最后一个中文标点)
最后不要忘记我们之前提取出来的\(n\cdot \binom {n-1}{i-1}\)
最终解得的答案为\(\frac {i!(n-i)!}{(n+1)!}\cdot n\cdot \binom {n-1}{i-1}=\frac i{n+1}\)
猜想得证
结论
有\(n\)个互相独立的\(0\)至\(1\)之间等概率生成的随机变量,求从小到大排序后第\(i\)个数的数值期望为\(\frac i{n+1}\)
可以推广,若变量的生成范围为\([l,r]\),则第\(i\)小数的数值期望为\(l+\frac {i\cdot(r-l)}{n+1}\)
最近加了友链的一位同学貌似知道一个比较简单的做法?不过数学之美不恰好体现在各个方法看似不同,实则连通的吗