Крайне важно убедиться, что задания в каждой шкале хорошо подобраны. В некоторых случаях сделать это несложно. Например, в случае словарного теста просто необходимо подбирать задания из словаря (может быть, исключая те слова, которые встречаются ниже определенного порога частотности, или слова грубые, архаичные, специальные, т.е. профессиональные, термины). Когда это сделано, единственное, что будет влиять на корреляцию между ответами на пару заданий, — степень, с которой каждое из них измеряет скрытую черту (грамотность), — принцип, иногда определяемый как «локальная независимость». Не существует магической формулы для автоматической реализации этого принципа при конструировании тестов. От человека, пишущего задания, зависит гарантия того, что единственной причиной, объясняющей корреляцию ответов на любую пару заданий, является та скрытая черта личности или способностей, которую они оба должны измерять. К сожалению, некоторые подходы к конструированию тестов, например, те, в защиту которых выступают Коста и МакКрей (Costa, McCrae, 1992a), в конечном счете обязательно приведут к появлению большого количества искусственно завышенных корреляций, что даст, в свою очередь, завышенную оценку коэффициента альфа. Купер (Cooper, в печати) приводит некоторые рассуждения по поводу того, как значимость этой проблемы может быть оценена в системе существующих диагностических шкал.

Важно также обеспечить, чтобы выборка испытуемых, чьи тестовые оценки используются для вычисления коэффициента альфа, была репрезентативна группе, в которой будет применяться данный тест. Бессмысленно, установив его величину в размере 0,9 на выборке студентов университета, затем считать, что этот тест будет годиться для использования на общей популяции, поскольку студенты университета — это не случайная выборка: они молоды, академически одаренны, принадлежат к среднему классу, грамотны и умеют вычислять. Еще раз подчеркнем, что не существует количественного способа определить, будет ли тест, имеющий высокое значение коэффициента альфа на одной выборке, так же работать на другой, — это дело здравого смысла. Я бы с большой осторожностью относился к допущению, что личностный тест, который был разработан с участием американских студентов колледжа, будет работать на общей популяции Великобритании (и соответственно, наоборот), но не все разделяют эти опасения. Самое безопасное — вычислять коэффициент альфа во всех случаях использования теста, хотя в качестве предварительного условия обязательным будет тестирование большей выборки испытуемых (Нанелли рекомендует минимум 200 человек).

При использовании должным образом коэффициент альфа очень полезен. Любой тест можно рассматривать как комплекс заданий, выбранных из большого набора вопросов, которые потенциально могли быть заданы. Например, тест на правописание — это выборка слов из словаря. Тест, измеряющий тревогу, — это набор всех (многих!) вопросов, которые можно было бы перечислить с целью измерения множества аспектов тревоги. Тест математических способностей — это выборка из почти бесконечного числа математических заданий, которые только можно было бы написать.

Ранее я использовал понятие «подлинная оценка», но не определил его значение. Подлинное значение черты индивидуума — это оценка, которую он получил бы, если бы ему предъявили каждое возможное задание из полного набора. Если бы вы оценили чью-либо способность правильно писать каждое слово из словаря, -то узнали бы точно, каковы способности этого человека к правописанию, поскольку отсутствовала бы ошибка измерения, обусловленная случайным выбором заданий. Однако в тесте мы берем лишь небольшую выборку заданий из возможного набора и объединяем их вместе. Если (и только если) задания теста формируют репрезентативную выборку по отношению к полному набору заданий, квадратный корень из коэффициента альфа довольно точно оценивает корреляцию между оценкой, полученной испытуемыми при выполнении теста, и их подлинной оценкой (т.е. оценкой, которую они могли бы получить, если бы им были предъявлены все задания до полного исчерпания набора).

Страницы: 1 2 3 4

Смотрите также

Оценка наблюдений
Исследователь, проводящий наблюдения, должен быть готов к возникновению некоторых проблем, в том числе проблемы недостаточного контроля, к появлению внесенного наблюдателем искажения, к проблеме р ...

Использование корреляций
Принимая во внимание подводные камни интерпретации корреляций, а также тот факт, что желаемые выводы о причинах и следствиях могут быть сделаны только на основании настоящих экспериментов с управл ...

Проблемы искажения
Поскольку в психологических исследованиях экспериментаторы, а обычно и испытуемые, — это люди, то есть вероятность появления некоторого «искажения», попытки предугадать, что должно произойти в ход ...