トップページ | ひとつ上のページ | 目次ページ | このサイトについて | English

項目反応理論

項目反応理論は、資格試験などで人の能力を定量的に測定するための理論として紹介されることが多いです。

しかし、試験の理論以外の使い道も、いろいろとありそうな理論です。

項目反応理論の概要

項目反応理論では、下のようなグラフが作れます。表は、このグラフを作る時のデータです。
ltm ltm

グラフでは、0と1しかなかったデータが、0から1までの数値のデータになって作られています。

この例は、0が表の上の方に行き、1が表の下の方に行くように並んでいるので、0と1の並び方と、グラフの曲線がだいたい一致しています。

インプットとアウトプットの関係をわかりやすくするために、この例にしていますが、項目反応理論では、表の中でのデータの順番が違っていても、アウトプットは同じです。これを可能にするために、項目反応理論では、横軸に使う変数を新しく作ります。

ちなみに、データの順番とグラフのカーブを一致させたい場合は、「データの順番」を説明変数にして、変数ごとにロジスティック回帰分析をする方法があります。

多変量解析のひとつとしての位置付け

試験の理論としての使い道を一度忘れて、「項目反応理論とは何か？」という点を、改めて考えます。

そういう考え方をすると、まず、項目反応理論は、０と１の二値データの変数が複数あるデータについて、それぞれの変数の特徴や類似度を比較するための方法になります。また、そのようなデータの時に、各サンプルの位置付けを、少ない変数で評価する方法になっています。

項目反応理論は、試験を設計するためのの方法論として、単独で説明されることが一般的です。しかし、その内容を多変量解析の手法と比べて考えてみると、潜在変数を使う点では因子分析と同じですし、ロジットを使う点ではロジスティック回帰分析と同じです。（プロビットを使う項目反応理論もあります。）
ltm

試験の理論としての項目反応理論

資格試験は、例えば１年に１回行われます。

100点満点の試験をしていて、Aさんが今年の試験で70点で、昨年の試験で75点だった場合、解いている問題が違うので、「Aさんの実力が下がった」とは言えないです。

また、順位が25番から30番に変わったとしても、全体の人数や、受験者が違うので、「Aさんの実力が下がった」とは言えないです。

項目反応理論ではない方法

Aさんの実力を測る方法として、一般的によく使われている方法が偏差値です。標準正規分布は、平均が０で標準偏差が１になりますが、偏差値は平均が50で標準偏差が10になるように元の分布を変換しています。

偏差値を使うと、元の分布のサンプル数、平均値、ばらつきが違っていても、同じ尺度で評価できます。

しかし、自分の偏差値は変わらなくても、全体の能力は下がっていて、自分の能力が下がっている可能性があります。また、２回の試験で平均値が異なる時に、問題の難しさが異なることと、受験生の全体的なレベルが異なることの２つの原因が考えられますが、どちらがどのくらい影響しているのかがわからないです。

また、項目反応理論ではない方法として、各問題の正答率で問題の難しさを判断する方法があります。

しかし、例えば、正答率が50%だった場合に、問題を正しく解く能力のある人が50%いたのか、何も考えずに解いても、50%の確率で正解になる問題なのかはわからないです。

項目反応理論による試験

項目反応理論を使うと、問題の質が評価できるようになります。

例えば、冒頭のグラフの項目が試験の問題だったとします。
ltm

X01：Abilityが0のところで、せり立っているので、全体を半分に分けている問題
X02：傾きが急なので、能力の有無がはっきり出る問題。Abilityが0より大きいので、能力が特に高くないと正解できない問題
X03：全体を半分に分ける点は、X01と似ているが、傾きがなだらかなので、能力の違いに必ずしも合わない問題
X04：能力が高くないと正解できないが、能力が低くても正解できることがある問題
X05：傾きが非常に緩やかなので、能力と無関係というほどではないが、能力の違いがわかりにくい問題

このようにして、問題と測りたい能力の関係が評価できるようになります。

また、各受験者が、このグラフの横軸のどこにいるのかで、受験者の能力を評価できるようになります。

項目反応理論を使うと、例えば、1000問の問題が用意されていて、受験者ごとにそのうちの100問をランダムに選ばれて来て解く仕組みの試験を作れます。

受験者ごとに問題が違っていても、受験者の能力を評価することができます。

段階反応モデル

上記では、二値を対象としていましたが、段階反応モデルは、３つ以上の順序尺度を対象としています。

項目反応モデル（項目反応理論）が、２値のロジスティック回帰分析に対応しているのと同じように、段階反応モデルは、順序ロジスティック回帰分析に対応しています。
ltm

ひとつの変数の中では、各カテゴリの発生確率の合計が１になる性質を使って、各カテゴリの分布を求めるようになっています。
ltm

ちなみに、段階反応モデルと似たような手法は質的変数のグループを、１つの連続変数に変換になります。

ソフトウェア

Rによる項目反応理論のページがあります。

参考文献

「項目反応理論　1PLM，2PLM，3PLM，多段階反応モデル」　住政二郎　著　2013
https://www.mizumot.com/method/04-04_Sumi.pdf
モデルの違いについて、文系読者向けにできるだけ丁寧に解説されています。筆者の知っている中では、一番わかりやすい説明です。

「個性学入門　個性創発の科学」　保前文高・大隅典子　編　朝倉書店　2021
違いを個性の違いとしている話が多いです。
個性の統計モデルとして、因子分析、項目反応モデル、ニューラルデコーディングがあります。

「知覚・認知モデル論」　渡辺利夫　著　ナカニシヤ出版　2009
項目反応理論の進め方の解説があります。
二値ではなく、数個の段階がある場合の、段階反応モデルの解説もあります。

「心理学」　子安増生　編著　勁草書房　2016
７ページほどで、古典的テスト理論と、項目反応理論を説明しています。古典的テスト理論というのは、テストの得点の統計的な扱い方の理論です。「真の得点」という概念があるので、これを測るために、同じレベルとみなせるテストを用意したりします。

「Pythonでスラスラわかるベイズ推論「超」入門」　赤石雅典　著　講談社　2023
項目反応理論（IRT）にベイズ統計を応用する方法を紹介している章があります。

順路次はデータマイニング