項目反応理論は、資格試験などで人の能力を定量的に測定するための理論として紹介されることが多いです。
しかし、試験の理論以外の使い道も、いろいろとありそうな理論です。
項目反応理論では、下のようなグラフが作れます。
表は、このグラフを作る時のデータです。
グラフでは、0と1しかなかったデータが、0から1までの数値のデータになって作られています。
この例は、0が表の上の方に行き、1が表の下の方に行くように並んでいるので、0と1の並び方と、グラフの曲線がだいたい一致しています。
インプットとアウトプットの関係をわかりやすくするために、この例にしていますが、項目反応理論では、表の中でのデータの順番が違っていても、アウトプットは同じです。 これを可能にするために、項目反応理論では、横軸に使う変数を新しく作ります。
ちなみに、データの順番とグラフのカーブを一致させたい場合は、「データの順番」を説明変数にして、変数ごとに ロジスティック回帰分析 をする方法があります。
試験の理論としての使い道を一度忘れて、「項目反応理論とは何か?」という点を、改めて考えます。
そういう考え方をすると、まず、項目反応理論は、0と1の二値データの変数が複数あるデータについて、 それぞれの変数の特徴や類似度を比較するための方法になります。 また、そのようなデータの時に、各サンプルの位置付けを、少ない変数で評価する方法になっています。
項目反応理論は、試験を設計するためのの方法論として、単独で説明されることが一般的です。
しかし、その内容を
多変量解析
の手法と比べて考えてみると、
潜在変数を使う点では
因子分析
と同じですし、
ロジット
を使う点では
ロジスティック回帰分析
と同じです。
(プロビットを使う項目反応理論もあります。)
資格試験は、例えば1年に1回行われます。
100点満点の試験をしていて、Aさんが今年の試験で70点で、昨年の試験で75点だった場合、 解いている問題が違うので、「Aさんの実力が下がった」とは言えないです。
また、順位が25番から30番に変わったとしても、全体の人数や、受験者が違うので、「Aさんの実力が下がった」とは言えないです。
Aさんの実力を測る方法として、一般的によく使われている方法が偏差値です。 標準正規分布は、平均が0で標準偏差が1になりますが、偏差値は平均が50で標準偏差が10になるように元の分布を変換しています。
偏差値を使うと、元の分布のサンプル数、平均値、ばらつきが違っていても、同じ尺度で評価できます。
しかし、自分の偏差値は変わらなくても、全体の能力は下がっていて、自分の能力が下がっている可能性があります。 また、2回の試験で平均値が異なる時に、問題の難しさが異なることと、 受験生の全体的なレベルが異なることの2つの原因が考えられますが、どちらがどのくらい影響しているのかがわからないです。
また、項目反応理論ではない方法として、各問題の正答率で問題の難しさを判断する方法があります。
しかし、例えば、正答率が50%だった場合に、問題を正しく解く能力のある人が50%いたのか、 何も考えずに解いても、50%の確率で正解になる問題なのかはわからないです。
項目反応理論を使うと、 問題の質が評価できるようになります。
例えば、冒頭のグラフの項目が試験の問題だったとします。
このようにして、問題と測りたい能力の関係が評価できるようになります。
また、各受験者が、このグラフの横軸のどこにいるのかで、受験者の能力を評価できるようになります。
項目反応理論を使うと、 例えば、1000問の問題が用意されていて、受験者ごとにそのうちの100問をランダムに選ばれて来て解く仕組みの試験を作れます。
受験者ごとに問題が違っていても、受験者の能力を評価することができます。
上記では、二値を対象としていましたが、段階反応モデルは、3つ以上の順序尺度を対象としています。
項目反応モデル(項目反応理論)が、2値のロジスティック回帰分析に対応しているのと同じように、
段階反応モデルは、順序ロジスティック回帰分析に対応しています。
ひとつの変数の中では、各カテゴリの発生確率の合計が1になる性質を使って、各カテゴリの分布を求めるようになっています。
ちなみに、段階反応モデルと似たような手法は 質的変数のグループを、1つの連続変数に変換 になります。
Rによる項目反応理論 のページがあります。
「項目反応理論 1PLM,2PLM,3PLM,多段階反応モデル」 住政二郎 著 2013
https://www.mizumot.com/method/04-04_Sumi.pdf
モデルの違いについて、文系読者向けにできるだけ丁寧に解説されています。
筆者の知っている中では、一番わかりやすい説明です。
「個性学入門 個性創発の科学」 保前文高・大隅典子 編 朝倉書店 2021
違いを個性の違いとしている話が多いです。
個性の統計モデルとして、
因子分析
、項目反応モデル、ニューラルデコーディングがあります。
「知覚・認知モデル論」 渡辺利夫 著 ナカニシヤ出版 2009
項目反応理論の進め方の解説があります。
二値ではなく、数個の段階がある場合の、段階反応モデルの解説もあります。
「心理学」 子安増生 編著 勁草書房 2016
7ページほどで、古典的テスト理論と、項目反応理論を説明しています。
古典的テスト理論というのは、テストの得点の統計的な扱い方の理論です。
「真の得点」という概念があるので、これを測るために、同じレベルとみなせるテストを用意したりします。
「Pythonでスラスラわかるベイズ推論「超」入門」 赤石雅典 著 講談社 2023
項目反応理論(IRT)に
ベイズ統計
を応用する方法を紹介している章があります。
順路 次は データマイニング