butch’s blog

メモ置き場。

ベルヌーイ試行のサンプル数と誤差の関係

ベルヌーイ試行のサンプル数$n$と誤差$\epsilon$の関係


\begin{align}
n \simeq O(\epsilon^{-2})
\end{align}

の導出に関するメモです。
導出は以下の資料を参考にしています。

[http://www3.u-toyama.ac.jp/kkarato/2020/statistics/handout/Statistics[B]-2020-19-0703.pdf]

ベルヌーイ分布に従う$X_i$からスタートして次の様に変形していく。


\begin{align}
X_i  &\sim B(1, p) \\
\bar{X} = \sum^N_{I=1}X_i &\sim B(n, p)
\end{align}

$\bar{X}$の期待値は$np$、分散は$np(1-p)$になる。
$n$が十分大きい場合は正規分布に従う。


\begin{align}
\bar{X} &\sim B(np, np(1-p))
\end{align}

標本比率$\hat{p}$を導入する。


\begin{align}
\hat{p}=\frac{\bar{X}}{n} & \sim N(p, \frac{p(1-p)}{n})
\end{align}

サプリングした標本から得られた該当する結果の割合で実測値です。
結果ごとに値が決まるが、上の確率分布に従う確率変数です。
標準化すると、


\begin{align}
Z = \frac{\hat{p} - p}{\sqrt{\frac{p(1-p)}{n}}} \sim N(0, 1)
\end{align}

標準正規分布に対して信頼区間$\alpha$%の時の値を$z_{\alpha}$とすると、


\begin{align}
|Z| \le z_{\alpha} \Leftrightarrow |\hat{p} - p| \le z_{\alpha} \sqrt{\frac{p(1-p)}{n}}
\end{align}

$|\hat{p} - p|$を推定誤差と呼ぶ。
($p$が真の値であり$\hat{p}$が推定される値だから?) この誤差が$\epsilon$以下になる条件は、


\begin{align}
|\hat{p} - p| \le z_{\alpha} \sqrt{\frac{p(1-p)}{n}} \le \epsilon
\end{align}

です。


\begin{align}
z_{\alpha} \sqrt{\frac{p(1-p)}{n}} \le \epsilon
\end{align}

これを整理すると、


\begin{align}
n \ge \biggl( \frac{z_{\alpha}}{\epsilon} \biggr)^2  p(1-p)
\end{align}

となり、$n \simeq O(\epsilon^{-2})$であることが分かる。

量子コンピュータを用いた高速数値積分」における誤差評価

https://www.mizuho-ir.co.jp/publication/giho/pdf/010_01.pdf

上のpdfの式(26)以降の計算についてレビューします。
以下の確率変数$z$が標準正規分布に従うとします。


\begin{align}
z = \frac{\hat{p}-p}{\sqrt{\frac{p(1-p)}{N}}}
\end{align}

これを適当な定数$c_1$の範囲に収めると、


\begin{align}
|\hat{p} - p| \le c_1 \sqrt{\frac{p(1-p)}{N}} = \epsilon_p
\end{align}

今は$p=S(f)^{2}$の関係があるので、


\begin{align}
|\hat{S(f)}^2- S(f)^2| \le c_1 \sqrt{\frac{S(f)^2(1-S(f)^2)}{N}}
\end{align}

上の左辺の絶対値の中に含まれる平方根を除去したいので「誤差の伝播公式」を利用する。

mathwords.net

これは一旦$p$に戻って以下の式に対して、


\begin{align}
|\hat{p} - p| \le c_1 \sqrt{\frac{p(1-p)}{N}}
\end{align}

$S(f)=\sqrt{p}$より、


\begin{align}
|\hat{S(f)} - S(f)| & \le \sqrt{\biggl(\frac{\sqrt{p}}{\partial p}\biggr)^2 \epsilon^2_p}\\
&= \frac{1}{2\sqrt{p}} c_1 \sqrt{\frac{p(1-p)}{N}} \\
&= \frac{c_1}{2}\sqrt{\frac{1-p}{N}} \le \frac{c_1}{2}\sqrt{\frac{1}{N}} 
\end{align}

となり、式(28)が得られる。