データの性質

分析しようとしているデータがどのような性質をもったものか。
その性質を踏まえた分析をしないといけない。
 
性質というのは、どのような変化をするデータなのか、ということ。
 
連続的に変化するもの(重さとか、時間とか)か、非連続的(賛成か反対か)か。
 
非連続のものでも、順序が関係する(かけっこの順位)か、しない(男女)か。

順序が関係しても、その順位間の値の差は等間隔か。
 
連続的に変化するものでも、変化は直線的かどうか。
 
 
観察対象そのものの持つ性質と、それを分析するときにどのような性質のものとして扱うかという違いもあるので注意が必要。 
 
たとえば、「学力」は、性質としては、連続的だと考えられる。が、テストなどで測定すると、得点として表現される。その得点の付け方にもよるが、まあ、連続的なデータを等間隔で繁栄した得点だと想定すれば、連続的なデータであると言えるでしょう。
 
テストの点に基づいて、順位を付けるとなると、その順位は、非連続で、順番がありますが、順番の数字自体がデータの性質を「等間隔」で表しているとは限らないので(ダントツ一位とか)注意が必要ですね。
 
それとか、テストの点に基づいて、500点以上を上級、それ未満を中級と振り分けたら、その上級と中級というのは、非連続になりますね。「上級学習者」と「中級学習者」を比べたら、、、といった場合、「上級」と「中級」の差は、扱い上は非連続ですが、その「級」がしめしているはずの「学力」は、そもそも連続的なもののはずですね。
 

コメントを残す