バイモーダル分布でクラスを教える–持っている場合!

Andrew Robinson

フォロー

9月28日、 2016・6分読み取り

2つのガウス曲線を重ね合わせたバイモーダル分布。 Matlabで生成されます。

彼のブログSmallPond Scienceで、Terry McGlynnは、「バイモーダルグレード分布がある場合、これによって方法が変わりますか?これは素晴らしい質問です。配布がバイモーダルであると思われるクラスを教えてきたので、いくつかのアイデアを投げかけようと思いました。

では、何をしますか?バイモーダル分布とはどういう意味ですか?ベルカーブ、正規分布、またはガウス関数と呼ばれる古典的なユニモーダル分布に戻りましょう(免責事項:私は分光学者なので、ガウスは私のお気に入りの用語です!)

これはシミュレートされた正規分布です。これは50%の平均マークを中心にしています。

正規分布(ベル曲線またはガウス関数)。平均値50%を中心にしています。

最近、恐ろしい成績のインフレにより、これはより高い点にシフトする傾向があります。それはまだ対称的な分布ですが、ハイエンドで切り捨てられています。人々が「曲線への等級付け」について話すとき、これは彼らが意味する曲線です。

同じ分布ですが、平均値が80%。

ここで、バイモーダル分布がある場合、平均スコアの2つの異なる値を使用して、これらの分布の2つを互いに重ね合わせます。 。Matlabシミュレーションは次のようになります。

バイモーダル分布。ツインピーク。チェリーパイ。

この特定の例では、2つのピークの最大値の間に明確な谷があり、これをクラス内の2つの異なる母集団、1つのグループのより高い達成者、高い平均値として解釈できることがわかります。スコア、および相対の2番目のグループeアンダーパフォーマー、平均スコアが低い。

もちろん、これは素晴らしく、シミュレートされた、かなり明確な解釈です。 2つのピークが近づくと、状況は少し乱雑になります。

2つのピークが互いに近づきました。バイモーダル分布としての全体的な形状の解釈があいまいになりました

ここで行ったのは、2つのピークを少し近づけることだけです。ご覧のとおり、全体的な形状は(専門用語を使用するために)ややぼろぼろの混乱になっていますが、正規分布の形状自体からそれほど離れていないため、フィッティングに何時間も費やした分光学者として言えばノイズの多い実験データへの曲線では、この分布を2つのピークに適合させることを正当化するのは難しいでしょう。これは、統計的な変動がある単一の分布である可能性があります。もちろん、有限のクラスサイズと小さなデータセットの現実の世界では、分布がバイモーダルなもののように見える可能性のあるランダムな変動が常にありますが、その主張の統計的正当性はありません。下の図では、シミュレートされたグレード分布はバイモーダル分布のように見えますが、サンプルサイズのため、変動が実際にはユニモーダル分布である可能性があります。実際、実際のクラスで見つかる可能性のある成績分布を調べると、次のようなものが表示される可能性があります。

シミュレートされた成績分布。 2つのピークは、本当に統計的な「ノイズ」によるものですか?

最近、Elizabeth Patisasとその同僚は、多数のコンピュータサイエンスのクラスを分析し、ほとんどの場合、バイモーダル分布の解釈(CSサークルで広く保持されている真実)は、純粋に統計的変動によるものです。

したがって、これまでの話の教訓は、特にクラスの生徒数が限られている場合は、成績分布をバイモーダルとして解釈する際に細心の注意を払うことです。大まかな目安として、解釈を始めるには100人の学生が絶対最小であることをお勧めします。しかし、確かに二峰性の分布が発生する可能性がある場合があります。 Patisas et alによる研究は、年のさまざまな段階でCSコースを受講している比較的均質な学生グループを対象としていることを忘れないでください。彼らの調査結果の妥当性には疑いの余地はありませんが、大規模なクラス、特に非専攻のサービスクラスを教える私たちの多くは、クラスに対してはるかに異質な構成を持っています。私が1年目に教える一般的な入門物理学のクラスの1つには、生物学、生化学、化学、地球科学、神経科学、および新進の医師が含まれています。彼らに共通しているのは、物理学のコースを受講する必要があるということですが、数学と物理学の準備に関して、彼らは非常に異なるスキルと知識のセットを持って私の教室に入ります。そのため、二峰性の分布(または成績曲線の下にさらに多くのピーク)が存在する可能性を受け入れる必要があります。

クラス内のさまざまなグループを確認できますか?各クラスも最大65人の学生からなる研究室グループに分かれているので、大まかなアイデアを得ることができます。現在、これらのグループは、時間割の制約のために、プログラムによってまとめられる傾向があります。一部のグループが他のグループよりも実験室で優れたパフォーマンスを発揮していることは注目に値します。高学年の入学、または競争力のある入学要件のあるプログラムは、多くの場合、他のプログラムよりもはるかに優れた研究室での仕事を生み出します。ですから、多くの学生は確かに同種のグループではなく、むしろいくつかのサブグループに分かれていることがわかります。これらのサブグループは、分布曲線で確認できるほど大きくない可能性があります。上記のすべての例では、わかりやすくするために、小さいグループは大きいグループのちょうど半分のサイズになっています。小さいサブグループがクラスの10%しかない場合、それを理解するのは困難になります。

最初に:分布を分析してパターンを見つけることができますか。次のような質問をするかもしれません:

特定のプログラムの学生は不利な立場にありますか?もしそうなら。なぜですか?

プログラムの学生が有利なのはなぜですか?

ESLの学生にとって言語の問題があるのでしょうか?

文化的な問題があるのでしょうか?障壁はありますか?

これらは必ずしも答えるのが簡単な質問ではありません。また、多くの場合、インストラクターは、作業に必要なデータセットを持っていないか、必要な量の調査を行うための時間やリソースを持っていません。見つけるために。どの学生がどのプログラムに参加しているかの内訳を学習管理システムから取得することは事実上不可能です。個々の学生の背景を確認するのは比較的簡単ですが、すべての学生のためにまとめることは困難です。

私は今物理学と数学のバックグラウンドについて少し知るために、すべての生徒のクラス前調査を必ず実行してください。その結果、私は数学の準備が比較的弱い人のための問題セットとワークシートを開発しました。また、専門用語が徹底的に説明されていること、テストについて質問する場合は、英語を母国語としない人の解釈に役立つ図や絵文字があることを確認するようにしています。以下の例は、私の運動学入門コースからのものです。

学生は「サイ」という言葉に慣れていない可能性があります。写真を追加することは千の言葉の価値があります

これらの方法から、私はスコアの低い生徒のスコアを上に移動しようと取り組んでいます。 、追加のサポートと支援を提供することによって。私はまだ高得点のコホートにいる人々をプッシュして挑戦しなければならないので、一般的な教授法を調整していません。一般的に、私は「弱い学生に追加のリソースを与える」戦略は、学生の関与、達成、およびクラスでの保持の観点から、成功する戦略である必要があります。バイモーダル分布が以前の大学にあったことを確認したクラスであり、学生コホートのように比較することはないため、これがバイモーダル分布を妨げていることを確信できません。さらに、もちろん、私はより経験豊富な教師になり、クラスのすべてのメンバーとコミュニケーションを取り、教える能力が向上したことを願っています。私が言えることは、これらのメソッドが適切に配置されているため、現在のクラスではバイモーダル性が見られないということです。

つまり、要約すると:

存在しない場所でバイモーダル分布を見つけることに注意してください。

クラスに比較的不利なグループがある可能性がある明らかな理由があるかどうかを確認します。

より良い生徒のための教育を損なうことなく、その不利な点を改善するようにしてください。

高い目標を設定してください。

Write a Comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です