Введение
До сих пор мы полагали, что общая оценка человека по психологическому тесту обеспечивает лучшее измерение его способностей или наличия у него какой-либо особенной личностной черты.
* В книге К. Купера эта глава называется «Item response theory» — «Теория ответов на задания», что в переводе на русский язык не имеет научного содержания. Поэтому мы сочли возможным озаглавить эту часть, исходя из смысла излагаемого в ней психодиагностического подхода. (Прим. перев, и науч. ред.)
Нам настолько привычна процедура суммирования количества заданий, на которые получены правильные ответы (или общего подсчета баллов по шкалам Ликерта), и сравнение этих оценок с нормами для интерпретации их значения, что бывает трудно увидеть ошибочность некоторых методов обработки, тестов и способы их усовершенствования.
Проблема, связанная с использованием обшей оценки в качестве показателя способностей, состоит в том, что тот, кто отвечает правильно на четыре легких задания, но оказывается не в состоянии решить все трудные, заканчивает тест с таким же результатом, как и тот, кто (преодолевая скуку?) правильно отвечает на одно легкое задание и на три трудных, что представляется неверным, поскольку общая оценка полностью игнорирует информацию (легко получаемую) о трудности каждого задания теста. Индивидуумы получат высокий балл при наличии легкого теста и низкий балл, если им дадут трудный тест, хотя они обнаруживают одни и те же способности в каждом тесте. Все это и делает необходимым использование норм.
Разумеется, существует немало альтернатив вычислению общей оценки как показателя способностей человека. Если уровни трудности («р-значения», т.е. пропорция индивидуумов, выполняющих задания) известны, можно, конечно, использовать р-значения наиболее трудного задания, на которое был получен правильный ответ (или р-значения самого легкого задания, на которое ответили неправильно), как показатель способностей. В качестве альтернативы можно вычислить среднюю трудность заданий, на которые были даны правильные ответы. Существует множество возможностей, большая часть которых остается неисследованной в литературе.
(а) Определите общий балл и другие три показателя способностей для испытуемого 2.
Задание для самопроверки 16.1
Цель этого упражнения — побудить вас задуматься над тем, каким образом статистические характеристики, иные, нежели общая оценка, могут отразить уровень способностей человека; они включают одну характеристику, базирующуюся на трудности самого сложного задания из решенных, и другую, базирующуюся на самом легком задании, которое не удалось решить. В приведенной таблице показаны ответы двух индивидуумов на девять заданий теста, которые предъявлялись большой выборке людей. Р-значения показывают долю людей, которые ответили на каждое задание правильно.
Задание |
' 1 |
2 3 4 |
5 6 |
789 |
^-значение 0,9 |
0,1 0,4 0,5 |
0,7 0,4 |
0,3 0,8 0,3 |
|
Исп. 1 |
1 |
0 1 0 |
1 0 |
0 1 0 |
Исп.2 |
1 |
000 |
0 0 |
0 1 0 |
Общий показатель |
/ - мин. р-зна- 1 — макс, р-зна-чение правильных чение неправильных |
/ - среднее р-зна-чение правильных |
||
решении |
решении |
решении |
решении |
|
Исп. 1 |
4 ' |
1 - 0,4 = 0,6 |
1 -0,5 = 0,5 |
2,8 1-— = 0,30 4 |
Исп.2 |
9 |
9 |
9 |
9 |
Смотрите также
Задания для повторения
В конце каждой главы приводятся задания для повторения. Это задания двух типов: на выбор одного ответа из нескольких и на написание коротких эссе. Прежде чем выполнять задания, внимательно изучите ...
Виды шкал измерений
Результаты измерении характеристик поведения представляются в виде набора чисел. Мы говорим, что кто-то среагировал через 3,5 секунды, получил 120 баллов за /Q-тест или нашел выход из лабиринта тр ...
Валидность экспериментальных исследований
В главе 4 было введено понятие валидности в применении к измерениям. Этот термин также применяется к эксперименту в целом. Так же как измерение считается валидным, если измеряется именно то, что п ...