「ノイズ」についてより深く理解すると、天体写真の撮影時に非常に有益かつ実用的な知識を芋づる式に理解することができる。例えば以下のような内容である。
・コンポジット(画像の重ね合わせ)を行う効果
・「フラット画像を作る際は非常に多くの枚数をコンポジットする必要がある」と言われる理由
・ダーク減算と天体写真の背景ノイズの関係(減算すると背景ノイズが大きくなることがある)
このシリーズではノイズを具体的に計算し、その理解を深めることを目標にする。まずはその下準備として「ノイズの量」を表す指標である「分散(\(\sigma^2\))」と「標準偏差(\(\sigma\))」について解説する。
まずは長さが分かっている鉛筆を適当なものさしで測定する例を考える。仮に長さが150.0mmの鉛筆に対し、その測定値が150.1mmだったとする。このとき正しい鉛筆の長さに対し、0.1mmの差がでている。この差分(誤差)が生じたのは「ものさしの当て方」「ものさしの目盛を読み取るときのずれ」などが主要な原因であろう。これらは偶発的に発生した誤差であり、再現性はない(再度測定したときも必ず150.1mmと測定されることはない)。以前の記事でも紹介したが、このような「再現性のない誤差」を偶然誤差という。
ここで挙げた例は鉛筆の長さ(「真の値」)が150.0mmであることがあらかじめ分かっていたが、普通何かを測定する場合は「真の値」が分からないことがほとんどである。したがって測定値から「真の値」を推定することになる。そのためにはこの測定値にどのくらいの誤差が含まれているかをあらかじめ把握しておく必要がある。この測定値に含まれる誤差の大きさを表す指標として「分散(\(\sigma^2\))と標準偏差(\(\sigma\))がある。それぞれ順に説明しよう。
先ほどの鉛筆の長さをものさしで連続\(N\)回測定し、その第\(i\)回目の測定値を\(X_i\)とする。つまり\(i\)は\(i=1,2,\dots,N\)となり、何回目の測定かを表す。\(N\)回の測定の平均値を\(\mu\)と書き、\(\mu = \frac{X_1+X_2+\cdots+X_N}{N}\)としたとき、分散\(\sigma^2\)は次で定義される:
$$ \begin{align*} \sigma ^2 = \frac{(X_1-\mu)^2 + (X_2-\mu)^2 + \cdots + (X_N -\mu)^2}{N} \end{align*} \tag{1}$$
標準偏差\(\sigma\)は分散の平方根で定義される:
$$ \begin{align*} \sigma = \frac{\sqrt{(X_1-\mu)^2 + (X_2-\mu)^2 + \cdots + (X_N -\mu)^2}}{\sqrt{N}} \end{align*} \tag{2}$$
文字のままだとイメージがわきにくいので、具体的に3回測定した場合(\(N=3\))で計算してみよう。1回目の測定値が\(X_1 = 150.1\text{mm}\)、2回目が\(X_2 = 150.3\text{mm}\)、3回目が\(X_3 = 149.8\text{mm}\)だったとする。このとき平均値は\(\mu=\frac{150.1+150.3+149.8}{3}=150.067 \sim 150.07\text{mm}\)であり、これから分散\(\sigma^2\)を求めると:
$$ \begin{align*} \sigma ^2 &= \frac{(150.1-150.07)^2 + (150.3-150.07)^2 + (149.8 -150.07)^2}{3}\\ &\sim 0.04223\text{mm}^2 \end{align*} \tag{3}$$
と計算できる。
標準偏差(\(\sigma\))を求めるにはこの平方根を取って:
$$ \begin{align*} \sigma = \sqrt{\sigma ^2} = 0.2055\text{mm} \end{align*} \tag{4}$$
となる。誤差を含む測定値は、測定の平均値と求めた標準偏差\(\sigma=0.2055\sim 0.2\text{mm}\)を使って
$$ 150.1\pm0.2\text{[mm]} $$
と書ける。この意味するところは「真の値が\(149.9~150.3\text{mm}\)の範囲にある」ということだが、真の値(150.0mm)はちゃんと誤差の範囲に含まれている。すなわちこの3回の測定は”悪くない”測定だったと言うことが出来る。なお、この標準偏差は「ノイズ」と「S/N(SN比)」の違いで紹介したS/Nの「N」の正体であり、S/Nの\(N=\sigma\)である。すなわち写真がノイズでザラザラに見えるのは、シグナルSに対して標準偏差\(\sigma\)が大きいからだと言い換えることもできる。
※ここで説明しているのは厳密には「標本平均」「標本分散」「標本の標準偏差」であることに注意。本来ならば有限回の試行回数でものさしの測定精度を見積もるためには「不偏分散」「標準偏差の不偏推定量」を考えるべきだが、ここでは話を簡単にするため「標本分散」「標本の標準偏差」で代用した。
大学院在学中は素粒子物理学を専攻。趣味の天体写真も物理理論に裏付けられた解析方法を行っており、 アマチュア天文家の間で蔓延している都市伝説は一切信じない。赤道儀マニアでアマチュア天文機器にやたら詳しい。 計算機ホログラム(CGH)や干渉計などの高度な物理計算を軽々とこなす。 光学・物理学に関連する原理や数学的理解に関する記事を担当。