我们知道, 在某些背包问题中, 我们需要解决一些零和问题, 也即: 物品有正有负且都不是特别大 (\(|w_i| \leq W\)), 我们需要找到一个具有某种性质的子集 \(S\), 满足 \(\sum_S w_i = 0\).

对容量这一维进行 DP 的话, 体积是有可能达到 \(\pm nW\) 量级的, 但如果问题只需要和答案有关的某一个 instance 被 DP 过程命中的话 (更具体地说就是比如问存在性或者某种东西的最优性, 那我们只需要达到最优解的那个方案被统计到), 我们有这样一个想法: 在 DP 之前先把物品随机打乱, 那么我们所需的那个 instance 的前缀和就总是不会很大. 这样一来, 我们就可以将这一维背包的容量缩小.

所以, 我们关心的问题的一般形式是:

\(n\) 个有界的随机变量 \(|X_i| \leq W\), 且 \(\mathbb E[X_1 + \dots + X_n] = 0\), 那么设 \(S_k = X_1 + \dots + X_k\), 此时 \(\max |S_k|\) 的具有怎样的分布?

其实对于一些特殊 (比如 \(X_i\) 都是独立随机的 \(\pm 1\), 各一半概率), 我们可以先通过组合上精确的计数来得到一些估计, 但对于一般情况来说, 概率论的一些方法其实也是差不多优秀的.

由于我们知道, 一些期望为 \(0\) 的独立随机变量之和基本上集中在 \(O(W \sqrt n)\) 的级别, 我们对前面问题的结果肯定是希望得到 \(O(W\sqrt n)\) 的结果. 此外, 我们知道有界随机变量的和不仅期望偏离的不是很大, 它的 concentration 应该也是很好的. 接下来我们严格地论证这一点.

工具

对于概率空间的一个 filtration \(\mathcal F_1 \subset \cdots \mathcal \subset \mathcal F_n\), 我们称一族期望存在的随机变量 \(X_i\in \mathcal F_i\) 满足 \(X_i\leq \mathbb E[X_{i+1}\mid \mathcal F_i]\) 为下鞅 (submartingale), 取等时称为鞅 (martingale). 我们有

Doob 不等式. 对于下鞅, $$\Pr \left[\max_i X_i > C\right] \leq \frac{\mathbb E[\max(X_n, 0)]}{C}.$$

证明: 记随机变量 \(T\) 为第一个 \(X_i >C\) 的位置 \(i\), 我们有

\[\Pr \left[\max_i X_i > C\right]\leq \frac{\mathbb E[X_T]}{C}. \]

设事件 \(E_i = \{T=i\}\), 反复使用下鞅的定义, 得到 \(X_i \leq \mathbb E[X_n \mid \mathcal F_i]\). 注意到 \(E_i\) 是一个 \(\mathcal F_i\) 中的事件, 所以我们有 $$\int_{E_i} X_i ,\mathrm{d}P \leq \int_{E_i} X_n ,\mathrm{d}P. $$
对全体 \(i\) 求和, 得到

\[\int X_T \,\mathrm{d}P \leq \int \max(X_n, 0) \,\mathrm{d}P. \]

然后由 Markov 不等式得证.

Azuma–Hoeffding 不等式. 如果鞅总是满足 \(|X_i – X_{i+1}|\leq 1\), 有

\[\Pr [ X_0 – X_n > \lambda \sqrt n ] \leq e^{-\lambda^2 / 2}. \]

证明: 不妨设 \(X_0 = 0\). 取 \(Y_i = e^{tX_i}\), Jenson 不等式表明 \(Y_i\) 是下鞅, 并且由于

\[\mathbb E[Y_{i+1} \mid \mathcal F_i] \leq Y_i \frac{e^{t}+e^{-t}}{2} \leq e^{t^2/2}, \]

我们有

\[\Pr\left[ X_n > \lambda \sqrt n \right] \leq \frac{e^{nt^2/2}}{e^{t\lambda \sqrt n}}. \]

\(t = \lambda/\sqrt n\), 有 \(\leq e^{-\lambda^2/2}\).

这个不等式具有另一个面貌:

对于一个函数 \(f\colon \{0, 1\}^n \to \mathbb R\) 满足 \(|f(x) – f(y)|\leq \| x – y \|_0\), 对于独立随机变量 \(X_1, \dots, X_n\), 有

\[\Pr [ f – \mathbb E f > \lambda \sqrt n ] \leq e^{-\lambda^2/2}. \]

只需注意到已经确定 \(X_1,\dots, X_{i}\) 的时候, \(f( X)\) 是满足 Azuma–Hoeffding 不等式条件的鞅, 则立刻得到上面的结论.

正文

现在我们有 \(w_1, \dots, w_n \in [-1, 1]\), 然后令随机变量 \(X_i\) 是它们的随机排列. 记 \(Y_i = X_1+\cdots + X_i\).

它们并不独立, 所以我们分成两步进行控制.

第一步: 考虑随机变量 \(X_i’\)\(w_1, \dots, w_n\) 中均匀随机选取的一个数, \(X_i’\) 独立随机. 我们控制对应的 \(Y_i’\).

第二步: 将这样的 \(X_i’\) 转化为合法的 \(X_i\), 并控制对 \(Y_i\) 的影响.

第一步

根据 Doob 不等式以及类似 Azuma–Hoeffding 的缩放过程, 我们可得

\[\Pr\left[\max_i Y_i’ > \lambda \sqrt n\right] \leq e^{-\lambda^2/2}. \]

第二步

我们这里假设 \(w_1,\dots, w_n\) 互不相同, 这本质上对正确性没有影响, 只是说 \(X’\) 在随机选取的时候能辨别同样值的 \(w\) 选了哪个.

我们考虑如下简单的缩放: 如果 \(X_i’\) 是全体 \(X’\) 中第 \(l\sim r\) 大的 (就是说有可能有和它相同的情况), 那么随机将 \(X_i\) 设为 \(w\) 中第 \(l\sim r\) 大中均匀随机的一个.

根据对称性, 易见这样得到的 \(X\) 就是 \(w\) 均匀随机的全排列.

注意到我们总是有

\[|Y_i – Y_i’|\leq \sum |X_i’ – X_i|, \]

所以只需要控制 \(\sum |X_i’ – X_i|\). 不妨设 \(w_1 < w_2 < \cdots < w_n\), 我们有

\[ \begin{aligned} \mathbb E\left[\sum |X_i’ – X_i|\right] &= \sum_i (w_{i+1} – w_i)\mathbb E [|i – \#\{X_i’\leq i\}|]\\ &\leq \sum_i (w_{i+1} – w_i)\left(\mathbb E [|i – \#\{X_i’\leq i\}|^2]\right)^{1/2}\\ &\leq \sum_i (w_{i+1} – w_i) \cdot \frac{\sqrt n}{2}\\ &\leq \sqrt n. \end{aligned} \]

\[f(X’) = \sum |X_i – X_i’|, \]

容易发现 \(f/2\) 满足 Azuma–Hoeffding 的条件, 因此

\[\Pr [ (f/2) – \mathbb E (f/2) > \lambda \sqrt n ] \leq e^{-\lambda^2/2}. \]

因此

\[\Pr[ f > (1 + 2\lambda)\sqrt n ] \leq e^{-\lambda^2 / 2}. \]

控制了每个 \(|Y|\) 的变化量就控制了 \(\max |Y|\) 的变化量, 因此我们有

\[\Pr \left[\max_i Y_i > (1 + 3\lambda)\sqrt n \right] \leq 2e^{-\lambda^2/2}. \]

因此, 我们有

\[\Pr \left[\max_i |Y_i| > (1 + \lambda)\sqrt n \right] \leq 4e^{-\lambda^2/18}. \]

原文地址:http://www.cnblogs.com/Elegia/p/16922216.html

1. 本站所有资源来源于用户上传和网络,如有侵权请邮件联系站长! 2. 分享目的仅供大家学习和交流,请务用于商业用途! 3. 如果你也有好源码或者教程,可以到用户中心发布,分享有积分奖励和额外收入! 4. 本站提供的源码、模板、插件等等其他资源,都不包含技术服务请大家谅解! 5. 如有链接无法下载、失效或广告,请联系管理员处理! 6. 本站资源售价只是赞助,收取费用仅维持本站的日常运营所需! 7. 如遇到加密压缩包,默认解压密码为"gltf",如遇到无法解压的请联系管理员! 8. 因为资源和程序源码均为可复制品,所以不支持任何理由的退款兑现,请斟酌后支付下载 声明:如果标题没有注明"已测试"或者"测试可用"等字样的资源源码均未经过站长测试.特别注意没有标注的源码不保证任何可用性