標準偏差(SD| standard deviation )とは
こんにちは。デジタルマーケティングカンパニー・オノフのしらやまです。
データ分析や統計学の本に、必ず出てくる「標準偏差」という言葉。聞いたことはあっても、よくわからないという方は多いかと思います。今回は、標準偏差の意味や、実際の活用シーンについて、わかりやすく解説していきます。
標準偏差とは
標準偏差とは、測定値のバラツキの度合いを表すために広く用いられています。
英語ではstandard deviationと表され、単語の頭文字をとってSDと表記されることもあります。
標準偏差が小さいということは全体のバラツキが小さいということ。つまり、測定値の分布が平均値の周りに集まっているということです。
また、逆に標準偏差が大きいということは、平均値から遠く離れている測定値が多くあることを意味します。
標準偏差と分散の違い
標準偏差を知る上で重要なのが「分散」です。
分散とは、対象データの散らばりの度合いを示す指標です。英語ではVarianceと表されます。分散が小さいほどデータの数値が平均値中心に集まっており、分散が大きいほど数値が平均値から離れていることを意味します。「分散」「標準偏差」もデータの広がり具合を表す指標の一つです。
標準偏差と分散は、データセットのばらつきを示す統計量ですが、計算方法や解釈において違いがあります。
計算方法としては以下の違いがあります。
分散(Variance)
データポイントと平均値の差の二乗の平均です。分散が大きいほどデータが散らばっていますが、単位が元のデータと異なります。
標準偏差(Standard Deviation)
分散の平方根です。標準偏差は元のデータと同じ単位を持ち、分散よりも直感的に解釈しやすいです。標準偏差が大きいと、データがより広がっていることを示します。
簡単に言えば、標準偏差は分散を単位について調整したものと考えることができます。
標準偏差の活用シーン
標準偏差は、平均値などでは読み取れなかったデータの特徴も把握できるようになるため、さまざまな場面で活用されています。
品質管理
サイズや重さなど、商品の個体差をどの程度許容するかの予測を立てることができます。標準偏差には、平均値から標準偏差±2にデータの約95%が収まる特徴があります。この特徴を利用して、サイズや重さが平均値から±2以上外れたものを規格外とするなどをして品質を担保します。
売上のばらつき具合を把握する
商品Aと商品Bがあり、Aの販売数の標準偏差は10、Bの標準偏差は100だったとします。AとBの販売数の平均値が同じだった場合、A商品は安定して売れていることがわかります。これを応用すると業績の予想にも活用することができます。
投資のリスク評価
標準偏差は金融商品のリスクを数値化する際にも使われることがあります。
投資信託の場合では、ある一定の年数を設定し、騰落率の平均値を求め、リターンから平均値との差を年ごと求めます。それをさらに2乗して一定期間の年ごとの偏差を合計し、年数で割って平方根を出します。これがリターンとのブレを示す標準偏差となります。標準偏差の値が大きいほど、ばらつきの幅が広く、リスクが大きいとされ、逆に値が小さいほど、ばらつきの幅が狭く、リスクは小さいとされます。
標準偏差はリターンのばらつきを示すため、リスクの尺度として広く受け入れられています。
自分の学力を客観的に判断する
偏差値と呼ばれているもので、平均が異なるテストの点数を同じ指標で比較するために生み出されたものです。偏差値という言葉は、認知度が非常に高いと思いますが、実は標準偏差がベースとなっています。偏差値は平均値が50となり、標準偏差1個分のずれに対して10の値を与えるという形を取ります。
標準偏差の短所
標準偏差には短所もありますので、長所と短所を理解し、他の指標や分析と組み合わせることで、より包括的なリスク評価や分析が可能となります。
標準偏差の短所として、以下が挙げられます。
正規分布が正しいことが大前提となっている
標準偏差は正規分布に基づくものであり、実際の市場の変動性が正規分布に正しく従わない場合、過去のパフォーマンスが将来にどれだけ適用可能かは不確かです。
外れ値の影響を受けやすい
極端な価格変動(外れ値)がある場合、標準偏差は影響を受けやすく、ポートフォリオの実際のリスクを過大または過小に評価する可能性があります。
まとめ
標準偏差は、データのばらつきを示す指標の1つで、その名が示すように標準化されているのが特徴です。そのため、平均が同じ集団のばらつきを同じ土俵で比較できます。
また、在庫管理や品質管理など、さまざまな場面で活用されています。