首页 > 其他分享> 文章详细

扑克牌（期望DP）

2022-08-19 00:33:10 阅读：109 来源： 互联网

标签：期望红桃 int 扑克牌黑桃方块 include 放入 DP

题意

Rainbow 把一副扑克牌（\(54\)张）随机洗开，倒扣着放成一摞。

然后 Admin 从上往下依次翻开每张牌，每翻开一张黑桃、红桃、梅花或者方块，就把它放到对应花色的堆里去。

Rainbow 想问问 Admin，得到\(A\)张黑桃、\(B\)张红桃、\(C\)张梅花、\(D\)张方块需要翻开的牌的张数的期望值是多少？

特殊地，如果翻开的牌是大王或者小王，Admin将会把它作为某种花色的牌放入对应堆中，使得放入之后期望尽可能小。

题目链接：https://www.acwing.com/problem/content/220/

数据范围

\(0 \leq A, B, C, D \leq 15\)

思路

经典的期望DP。我们考虑DP数组的状态，很明显我们需要用四维分别表示摸到的黑桃、红桃、梅花、方块的数量。此外我们还需要用两维分别记录大小王的状态。

因此，我们定义\(f(a, b, c, d, x, y)\)表示目前已经有\(a\)张黑桃，\(b\)张红桃，\(c\)张梅花，\(d\)张方块，大王状态为\(x\)，小王状态为\(y\)的情况下，到达目标状态还需要翻开牌的期望张数。

其中\(x\)和\(y\)的取值有\(4\)种，\(0\)代表放入黑桃，\(1\)代表放入红桃，\(2\)代表放入梅花，\(3\)代表放入方块，\(4\)代表还没摸到。下面考虑转移方程式：

若摸到的牌是黑桃，那么转移到状态\(f(a + 1, b, c, d, x, y)\)，概率为\(p = \frac{13 - a}{54 - a - b - c - d - x \neq 4 - y \neq 4}\)。其他颜色的牌同理。

现在考虑，如果摸到的牌是大王。最优策略就是转移到期望值最小的那个状态，也就是\(\arg max_i f(a, b, c, d, i, y), i = 0, 1, 2, 3\)。小王同理。

记忆化搜索即可。

代码

#include <iostream>
#include <cstring>
#include <algorithm>
#include <cstdio>

using namespace std;

const int M = 15;
const double inf = 1e20;

int A, B, C, D;
double f[M][M][M][M][5][5];

double dfs(int a, int b, int c, int d, int x, int y)
{
    double &v = f[a][b][c][d][x][y];
    if(v >= 0) return v;
    int as = a + (x == 0) + (y == 0);
    int bs = b + (x == 1) + (y == 1);
    int cs = c + (x == 2) + (y == 2);
    int ds = d + (x == 3) + (y == 3);
    if(as >= A && bs >= B && cs >= C && ds >= D) {
        v = 0;
        return v;
    }
    int sum = a + b + c + d + (x != 4) + (y != 4);
    sum = 54 - sum;
    if(sum <= 0) {
        v = inf;
        return v;
    }
    v = 1;
    if(a < 13) v += (13.0 - a) / sum * dfs(a + 1, b, c, d, x, y);
    if(b < 13) v += (13.0 - b) / sum * dfs(a, b + 1, c, d, x, y);
    if(c < 13) v += (13.0 - c) / sum * dfs(a, b, c + 1, d, x, y);
    if(d < 13) v += (13.0 - d) / sum * dfs(a, b, c, d + 1, x, y);
    if(x == 4) {
        double t = inf;
        for(int i = 0; i < 4; i ++) {
            t = min(t, 1.0 / sum * dfs(a, b, c, d, i, y));
        }
        v += t;
    }
    if(y == 4) {
        double t = inf;
        for(int i = 0; i < 4; i ++) {
            t = min(t, 1.0 / sum * dfs(a, b, c, d, x, i));
        }
        v += t;
    }
    return v;
}

int main()
{
    scanf("%d%d%d%d", &A, &B, &C, &D);
    memset(f, -1, sizeof f);
    double ans = dfs(0, 0, 0, 0, 4, 4);
    if(ans > inf / 2) ans = -1;
    printf("%.3f\n", ans);
    return 0;
}

标签：期望,红桃,int,扑克牌,黑桃,方块,include,放入,DP
来源： https://www.cnblogs.com/miraclepbc/p/16600612.html

本站声明： 1. iCode9 技术分享网（下文简称本站）提供的所有内容，仅供技术学习、探讨和分享；
2. 关于本站的所有留言、评论、转载及引用，纯属内容发起人的个人观点，与本站观点和立场无关；
3. 关于本站的所有言论和文字，纯属内容发起人的个人观点，与本站观点和立场无关；
4. 本站文章均是网友提供，不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属；如您发现该文章侵犯了您的权益，可联系我们第一时间进行删除；
5. 本站为非盈利性的个人网站，所有内容不会用来进行牟利，也不会利用任何形式的广告来间接获益，纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

ICode9

扑克牌（期望DP）

题意

数据范围

思路

代码