Педагогика и психология высшего образования
Шрифт:
Что касается величин коэффициентов валидности, то они по разным причинам всегда ниже, чем коэффициент надежности. По мнению ведущих психодиагностов, низким признается коэффициент валидности порядка 0,20-0,30, средним - 0,30 - 0,50, высоким - выше 0,60.
Степень соответствия получаемых с помощью диагностического средства эмпирических данных тому конструкту, который описывает предполагаемую (латентную) психологическую переменную, определяется как конструктная валидностъ методики.
Степень соответствия тем заданий (содержания "пунктов" в тесте) сфере диагностируемых психических свойств характеризует содержательную валидностъ методики.
Психодиагностические методики могут быть направлены как на выявление актуального уровня эмпирических составляющих, или "признаков", подводимых под то или иное понятие (диагностируемой латентной переменной),
Текущая валидностъ в узком смысле - это "установление соответствия результатов валидизируемого теста независимому критерию, отражающему состояние исследуемого тестом качества в момент проведения исследования" [Бурлачук Л. Ф., Морозов С. М.
– 1989.
– С. 29]. Этот критерий может быть как внешним, например успешность субъекта в определенном виде деятельности или принадлежность к той или иной группе испытуемых, так и психологическим, но связанным с использованием другой методики.
Прогностическая валидностъ характеризует не степень соответствия на уровне актуально измеряемого психического свойства, а возможность предсказания какой-то другой - второй переменной по показателям или "признакам" выраженности первой, собственно диагностируемой переменной.
Ретроспективная валидностъ определяется на основе критерия, отражающего событие или состояние качества в прошлом. Она также может свидетельствовать о предсказательных возможностях методики.
Надежность - составляющая оценки свойств психодиагностической методики, отражающая степень точности измерения и стабильности результатов с точки зрения контроля разных источников вариативности психологических показателей: вариативности самого измеряемого свойства; вариативности данных в силу множественных соответствий латентного свойства и эмпирических "признаков"; устойчивости самой шкалы в контексте процедурных компонентов методики; возможности получения сходных результатов в другое время или подверженности изменениям со стороны других процессов и свойств (например, противостояния разных пунктов опросника фактору "социальной желательности" ответа).
Известный специалист в области психодиагностики К. М. Гуре-вич предлагает выделять три типа надежности: надежность самого измерительного инструмента, стабильность изучаемого признака и константность, т.е. независимость результатов от личности экспериментатора [Гуревич К.М. 1975.
– С. 162 - 176]. С учетом этого следует различать и показатели, характеризующие тот или иной тип надежности, называя их соответственно коэффициентами надежности, стабильности или константности. В таком порядке следует проводить проверку методик: вначале следует проверить инструмент измерения, затем выявить меру стабильности изучаемого свойства и только после этого перейти к критерию константности.
Качество методики определяется тем, насколько хорошо она составлена, насколько однородна, что свидетельствует о ее направленности на диагностику одного и того же свойства, признака. Для проверки надежности инструмента по показателю однородности (или гомогенности), как правило, используют метод "расщепления". Для этого все задания психодиагностического инструмента делятся на четные и нечетные (по нумерации), отдельно обрабатываются, а затем подсчитываются коэффициенты корреляции между этими рядами. Об однородности методики свидетельствует отсутствие существенной разницы в успешности решения выделенных частей, что выражается в достаточно высоких коэффициентах корреляции - не ниже 0,75 - 0,85. Чем выше эта величина, тем однороднее методика, тем выше ее надежность. Существуют специальные способы увеличения надежности разрабатываемого метода [Анастази А.
– 1982].
Для проверки стабильности изучаемого признака используется метод, получивший название "т е с т - р е т е с т", который заключается в проведении повторного психодиагностического испытания той же выборки испытуемых через определенный промежуток времени, вычислении коэффициента корреляции между результатами первого и второго испытания. Этот коэффициент и представляет собой показатель стабильности исследуемого признака. Как правило, повторное обследование проводится через несколько месяцев (но не более полугода). Нельзя проводить повторное испытание слишком быстро после первого, поскольку есть опасность, что испытуемые будут воспроизводить свои ответы по памяти. Однако этот срок не может быть слишком большим, поскольку в этом случае возможно изменение, развитие самой исследуемой функции. Коэффициент стабильности
Коэффициент константности определяется путем корреляции результатов двух психодиагностических испытаний, проведенных на одной и той же выборке испытуемых с соблюдением идентичности условий, морозными экспериментаторами. Он должен быть не ниже 0,80.
Таким образом, качество любой психодиагностической методики зависит от степени ее стандартизованности, надежности и валидности. При разработке любой диагностической методики ее авторы должны проводить соответствующую проверку и сообщать в руководстве к ее применению полученные результаты.
Не следует путать уровень психометрического обоснования психодиагностической методики и вид, или метрику, построенной психологической шкалы, отражающей уровень результатов измерения. Качественные данные, соответствующие описательным или - в лучшем случае классификационным параметрам представления диагностируемых психических свойств, не обязательно будут свидетельствовать о меньшей надежности методики, чем в случае получения количественных показателей. Качественные характеристики позволят отнести испытуемых - как обследуемых субъектов или классифицируемых "объектов" - к той или иной группе; условием является, однако, возможность полного охвата в этих предполагаемых группах всех признаков классификации. Количественные характеристики позволят не только сопоставлять людей между собой уже по их принадлежности к разным группам (или классам признаков), но и установить порядок их расположения друг за другом с точки зрения выраженности диагностируемого признака (порядковая шкала) или осуществить сравнения, на сколько единиц или во сколько раз тот или иной признак более или менее выражен у одного субъекта по сравнению с другим, что позволяют определить шкала интервалов и шкала отношений (см. п. 6.6).
Контрольные вопрос и задания
1. Назовите различные виды теоретической и прагматической валидно-сти тестов.
2. Перечислите основные виды надежности высокоформализованных психодиагностических процедур и методы их измерения.
3. От каких факторов зависят валидность и надежность психодиагностических методик?
6.6. КОРРЕЛЯЦИОННЫЙ ПОДХОД КАК ОСНОВА ПСИХОДИАГНОСТИЧЕСКИХ ИЗМЕРЕНИЙ
Психодиагностические средства, разработка которых основывается на использовании психометрических процедур оценки надежности и валидности, обычно предполагают их подкрепленность проверкой статистических гипотез о связях между выборочными значениями переменных. То есть в основе их разработки лежит корреляционный подход, предполагающий исследовательские схемы сопоставления групп лиц, отличающихся по тому или иному внешнему критерию (возраст, пол, профессиональная принадлежность, образовательный ценз), или сопоставления различных показателей, полученных для одних и тех же лиц разными методическими средствами или в разное время (при повторном тестировании, по схеме "до - после" осуществления какого-то воздействия и т.д.).
Мерами связи являются коэффициенты ковариации и корреляции. Статистические гипотезы формулируются как гипотезы об отсутствии связи между выборочными значениями переменных, о равенстве коэффициентов какой-то величине (например, нулю, что не равнозначно понятию нулевой корреляции) или между собой.
При проверке корреляционных гипотез открытым остается вопрос о том, какая из двух переменных влияет на другую (или ее детерминирует). Именно это обстоятельство ограничивает возможности прогноза, т. е. обоснованного предсказания значений величин на одной психологической шкале по данным измерения других (переменных). Например, можно выявить положительную связь между показателями теста, измеряющего умственный возраст, и академической успеваемостью. Обе переменные как бы равноправны в этой ковариации, т. е. отклонения от среднего (как выборочного показателя меры центральной тенденции) в двух рядах показателей сопутствуют по величине друг другу. Это наглядно представляют в виде вытянутого облака точек на диаграмме рассеивания. В ней оси X и У обозначают величины, соответствующие двум психологическим переменным, а каждая точка представляет конкретного субъекта, характеризующегося одновременно двумя показателями (уровнем умственного развития и академической успеваемостью). Но содержательно разными являются задачи: прогнозировать успеваемость по показателю психологического теста и прогнозировать возможную величину умственного развития, зная показатель успеваемости. Решение каждой из этих задач предполагает, что исследователем принимается решение о направленности связи, т. е. о том, какой показатель является определяющим.