高校や大学を受験するときに、偏差値が合否の目安になりますよね。
では、偏差値とはいったい何なのでしょうか。偏差値を理解するために必要な正規分布とあわせて紹介していきます。
正規分布とは?
正規分布は、「降ってくる雨粒の大きさの分布」や「動物の身長や体重の分布」など、自然界や社会の中で数多く見ることができる分布です。
下図に示すように、釣り鐘の形に似ていることから「ベル・カーブ」と呼ばれることもあります。
正規分布の見方ですが、縦軸はその値が発生する確率で、横軸は平均を0に置いたときの標準偏差(ばらつき度合い)を表しています。
平均と標準偏差について詳しく知りたい方は、以下のエントリを参照してください。

さて、この正規分布の何がうれしいかというと、データのばらつきが正規分布に従っていれば、平均値と標準偏差から各データが全体のどのあたりに位置づけられているのか一目でわかることです。
たとえば、あるデータが「平均値\(±\)標準偏差\(\times\)1」の範囲に入っていた場合、全体の68%の中にそのデータがあることがわかります。
同様に、「平均値\(±\)標準偏差\(\times\)2」の範囲に入っていれば全体の95%、「平均値\(±\)標準偏差\(\times\)3」の範囲に入っていれば全体の99%に入っていることがわかるんですよね。
クラス全員の身長について、平均値と標準偏差を計算すれば、「平均値\(±\)標準偏差\(\times\)1」の中にクラスの68%の人たちが含まれていることがわかります。
この正規分布の考えをテストに応用したものが偏差値です。
偏差値とは?
偏差値というのは、テストのばらつきが正規分布に従うという前提で、平均値を50、標準偏差を10になるように変換したときの値です。
あるクラスで実施されたテストの分布がどのようなものかは、そのテストの平均値と標準偏差を求めればわかります。
しかし、そのテストで平均値を上回っているからといって、他のクラスで実施されたテストや他の科目のテストでも平均値を上回っているとは言えませんよね。
そこで、他のテストとも比較できるように「標準化」をするわけです。このとき、平均値を50、標準偏差を10になるように変換したものを偏差値と言います。
標準化について詳しく知りたい方は、以下のエントリを参照してください。

偏差値を式で表すと、次のようになります。
$$偏差値=標準化\times 10+50= \frac{各々のデータ-平均値}{標準偏差}\times 10+50$$
さて、先ほど説明したように偏差値は正規分布に従っているという前提なので、「平均値\(±\)標準偏差\(\times\)1」、すなわち偏差値が「50±10」の間にあれば全体の68%に入っていることがわかります。
言い換えると、偏差値40~60の間に68%の人が含まれているわけですから、残りの32%の約半分(=16%)の人は偏差値60よりも高いことがわかります。
つまり、偏差値60とは、上位16%くらいの位置にいることを示しているのです。
同様に、偏差値が「50±20」の間にあれば全体の95%をカバーしているため、偏差値70は、高い方から数えて2.5%(5%の約半分)に位置していることがわかります。
偏差値が高校や大学受験で目安になるのは、上位から何%に位置しているかが一目で判断できるからなんですね。
最後に
今回は、高校や大学を受験するときに目安となる偏差値について紹介してきました。
また、あわせて紹介した正規分布は、自然界や社会の中で数多く見られる分布なので、統計解析にも頻繁に登場します。ぜひ概念を理解しておきましょう。
コメント