概率dp小结

时间:2023-03-08 20:26:26

好久之前学过,记得是一次亚洲区的前几天看了看概率dp,然后亚洲区就出了一道概率dp,当时虽然做上了,但是感觉有很多地方没懂,今天起早温习了一下,觉得很多地方茅塞顿开,果然学习的话早上效果最好了。

首先来看一道最基础概率dp

题意是,有一个软件,有s个子系统,会产生n种bug。 
某个程序员一天能发现一个bug,这个bug是这n种bug中的一种,然后发生在某个子系统中。 
问,找到所有的n种bug,且每个子系统都找到bug,这样所要的天数,的期望。

期望,可以分解成多个子期望的加权和,权为子期望发生的概率 
所以: 我首先想到了一个这样的公式dp[x][y] = dp[x][y]*p1+dp[x-1][y-1]*p2+dp[x][y-1]*p3+dp[x-1][y]*p4

dp[x][y]代表已经有x种bug并且有y个系统至少有一个bug的期望值

我们知道他是从自身以及他的前几种状态推导过来,乍一看这个公式应该是对的,但是dp[n][m]会无穷大,因为他的期望是没有停止状态的,也就是题意要求的应该是到达n,m状态时停止。

那么我们又可以从倒推的角度去考虑这个问题,dp[x][y]表示的是已经有x种bug并且有y个系统至少有一种bug的时候还需要多少步能够到达dp[n][m]的状态。

那么公式又变成了这样dp[x][y] = dp[x+1][y+1]*p1+dp[x+1][y]*p2+dp[x][y+1]*p3+dp[x][y]*p4+1

也就是dp[x][y] = dp[x+1][y+1] *(n-x)*(m-y)/n/m+dp[x+1][y]*(n-x)*y/n/m+dp[x][y+1]*x*(m-y)/n/m+dp[x][y]*x*y/n/m+1

将dp[x][y]合并得dp[x][y](1-x*y/n/m) = dp[x+1][y+1] *(n-x)*(m-y)/n/m+dp[x+1][y]*(n-x)*y/n/m+dp[x][y+1]*x*(m-y)/n/m+1

1.poj2096,就是上面的题

#include<stdio.h>
#include<string.h>
#include<iostream>
using namespace std;
double dp[][];
int main(){
int n, m;
scanf("%d%d", &n, &m);
for(int i = ;i <= n+; i++){
for(int k = ; k <= m+; k++){
dp[i][k]= ;
}
}
for(int x = n; x >= ; x--){
for(int y = m; y >=; y--){
if(x == n && y ==m)dp[x][y] = ;
else
dp[x][y]= (+dp[x+][y+] *(n-x)*(m-y)/n/m+dp[x+][y]*(n-x)*y/n/m+dp[x][y+]*x*(m-y)/n/m)/(1.0-1.0*x*y/n/m);
}
}
printf("%.4f\n", dp[][]);
}

2.UVALive 5811

题目大意:有54张牌,一张一张翻,在四种花色都不小于分别给定的四个值时停止,王牌可以当做任意一种花色,但是在翻得时候就要确定,求翻牌数的期望。

公式神马的好推,写的时候稍微费劲了点

#include<iostream>
#include<stdio.h>
#include<string.h>
using namespace std;
double dp[][][][][][];
int main(){
int t;
scanf("%d", &t);
int cas = ;
while(t--){
int a, b, c, d;
scanf("%d%d%d%d", &a, &b, &c, &d);
int aa = ;
if(a > ) aa += -a;
if(b > ) aa += -b;
if(c > ) aa += - c;
if(d > ) aa += - d;
if(aa < -){
printf("Case %d: %.3f\n", cas++, -1.0);//printf("000");
continue;
}
for(int i = ; i >= ; i--){
for(int k = ; k >= ;k --){
for(int j = ; j >= ; j--){
for(int h = ; h >= ; h--){
for(int x = ; x >= ; x--){
for(int y = ; y >= ; y--){
int aa = i, bb = k, cc = j, dd = h;
if(x == ) aa++;
if(x == ) bb ++;
if(x == ) cc++;
if(x == ) dd++;
if(y == ) aa++;
if(y==) bb++;
if(y == ) cc++;
if(y == ) dd++;
int tot = - aa - bb - cc- dd;
if(aa >= a && bb >= b && cc >= c && dd >= d){
dp[i][k][j][h][x][y] = ;continue;
}else if(tot == ){
dp[i][k][j][h][x][y] = ;continue;
}
double uu = ;
int ss = ; //kexuanwangpai
if(!x) ss ++;
if(!y) ss ++;
dp[i][k][j][h][x][y] = ;
if(!x){
uu = min(min(min(dp[i][k][j][h][][y], dp[i][k][j][h][][y]), dp[i][k][j][h][][y]), dp[i][k][j][h][][y]);
//if(i+k+j+h == 52 && x == 0 && y == 0) printf("%.3lf %.3lf-----------\n", uu,ss*1.0/tot*uu);
dp[i][k][j][h][x][y] += ss*1.0/tot*uu;
}
else if(!y){
uu = min(min(min(dp[i][k][j][h][x][],dp[i][k][j][h][x][]),dp[i][k][j][h][x][]), dp[i][k][j][h][x][]);
dp[i][k][j][h][x][y] += ss * 1.0/tot*uu;
}
uu = ;
if(i < ){
uu += dp[i+][k][j][h][x][y]*(-i)/tot;
}
if(k < )
uu +=dp[i][k+][j][h][x][y] * (-k)/tot;
if(j < )
uu += dp[i][k][j+][h][x][y] *( - j)/tot;
if(h < )
uu += dp[i][k][j][h+][x][y] * ( - h)/tot;
dp[i][k][j][h][x][y] += uu;
}
}
}
}
}
}
//printf("%.3lf\n", dp[13][13][13][13][0][0]);
printf("Case %d: %.3f\n", cas++, dp[][][][][][]);
}
}