чем объясняются особенности психологического измерения

Особенности измерения в психологии

ОТ АВТОРА

Любой современный психолог независимо от того, является ли он психологом-практиком или занимается теоретическими изысканиями, должен в совершенстве владеть математическими методами и приемами. Эти методы необходимы, во-первых, для адекватного планирования эксперимента и прогнозирования ожидаемых результатов, во-вторых, для статистической обработки результатов психологического исследования, наконец, в-третьих, для разработки и построения математических моделей, касающихся различных психических явлений, процессов и состояний.

Как известно, основным методом психологического исследования (если не брать во внимание чисто экспериментальные области психологии) традиционно является метод наблюдения. Несмотря на некоторые положительные стороны этого метода, наблюдение всегда является в значительной степени субъективным. Интерпретация полученных данных, как правило, несет на себе отпечаток личности психолога, его опыта, интуиции и т. д. В то же время во многих случаях возникает проблема стандартизации результатов исследования и их более или менее однозначной трактовки. В этом смысле математика представляет собой универсальный, предельно формализованный язык, однозначно описывающий различные свойства, признаки, изменения и пр., в том числе и результаты психологического исследования.

В свое время великий Ньютон вслед за Галилеем провозгласил, что «природа говорит с человеком на языке математики». Более развернуто эту мысль в начале XIX века выразил немецкий философ и психолог Гербарт, который писал так: «Всякая теория, которая желает быть согласованной с опытом, прежде всего должна быть продолжена до тех пор, пока не примет количественных определений, которые являются в опыте или лежат в его основании. Не достигнув этого пункта, она висит в воздухе, подвергаясь всякому ветру сомнения и будучи не способной вступить в связь с другими, уже окрепшими воззрениями».

Предлагаемое учебное пособие ставит своей задачей помочь психологу овладеть начальными знаниями, необходимыми для применения математических методов в психологии. При этом автор попытался свести к минимуму освещение теоретических вопросов, которые подробно излагаются в соответствующих учебниках по теории вероятностей и математической статистике. Основная же задача пособия – дать психологу рабочий инструмент для решения конкретных научно-исследовательских и прикладных задач. Несмотря на то, что книга написана, как надеется автор, достаточно простым языком, знакомство с ней подразумевает определенный уровень знаний в области теории вероятностей и математической статистики.

Большинство глав учебного пособия сопровождаются перечнем задач по рассматриваемой теме. Автор выражает искреннюю благодарность своему глубокоуважаемому коллеге Алексею Васильевичу Зайцеву за помощь в разработке ряда задач. В конце книги приводится минимум справочных статистических таблиц, необходимых для математической интерпретации и адекватных выводов по каждой из рассматриваемых задач.

Автор будет весьма признателен за критические замечания, советы и пожелания, которые, несомненно, помогут в дальнейшей работе над книгой в плане ее совершенствования.

Раздел 1.
ПРОБЛЕМА ИЗМЕРЕНИЯ В ПСИХОЛОГИИ

Начальным этапом математической обработки результатов любого (в том числе и психологического) исследования, является измерение. Другими словами, изучаемый признак (свойство, черта, характеристика) должен быть измерен, т. е. выражен в той или иной количественной (численной) форме. Численное выражение признака может быть различным – от представления его в бинарной системе (1 – наличие признака, 0 – отсутствие признака) до весьма точных количественных значений (например, максимальная амплитуда альфа-ритма электроэнцефалограммы для данного испытуемого составляет 95 микровольт).

Одной из достаточно сложных в психологии является задача математической формализации выраженности исследуемого признака, т. е. перевода ее в количественное выражение. Об этом пойдет речь далее в соответствующих главах. В данной же главе мы попытаемся дать общие сведения об измерении вообще и об особенностях измерения психологических свойств (признаков, черт, характеристик) в частности.

Понятие об измерении

Существует целый ряд определений термина измерение. Так, измерение иногда трактуют как познавательный процесс, включающий исследование количественных характеристик материальных объектов с помощью соответствующих измерительных приборов. Такая формулировка вполне подходит для физического измерения, но не всегда годится для измерения психологических величин. Чаще всего процедуры психологического измерения подразумевают наличие не измерительных приборов, а совокупности заданий, вопросов, утверждений и т. д. Тем не менее, в некоторых областях психологической науки (психофизика, психофизиология и др.) предусматривается использование и приборных (аппаратурных) методов измерения.

Другое определение термина: измерение есть присваивание чисел определенным объектам, свойствам, признакам, событиям или изменениям в соответствии с определенными правилами. Это определение больше подходит к измерению в психологии, хотя справедливости ради необходимо отметить, что не все психологические величины можно выразить числом – некоторые из них выражаются качественными определениями, названиями, символами и пр.

Наконец, измерение можно определить как построение шкал посредством изоморфного отражения эмпирической системы с отношениями в численной системе с отношениями. Другими словами, это определение фактически ставит знак равенства между измерением и шкалированием. В первом приближении это так, хотя в некоторых случаях понятие шкалирование шире понятия измерение и включает в себя упорядочение не только численных (количественных), но и качественных характеристик.

Любой вид измерения предполагает наличие вполне определенных единиц измерения. Единица измерения – это та «измерительная палочка» (по выражению С. Стивенса), которая является своеобразным эталоном для осуществления тех или иных измерительных операций. В физике и других естественнонаучных дисциплинах используют основные и производные единицы измерения. Основных единиц измерения относительно немного: в Международной системе единиц (СИ) это килограмм (кг) – единица массы, метр (м) – единица расстояния, секунда (с) – единица времени, градус Кельвина (°К) – единица температуры, ампер (А) – единица силы тока, кандела (кд) – единица силы света и моль – единица количества вещества. Все остальные единицы (скорость, плотность, освещенность, давление и др.) являются производными и выводятся из основных единиц измерения.

Кроме общепринятых (международных) единиц измерения, иногда применяются и традиционные (национальные) единицы (фунты, унции, дюймы, ярды, футы и пр.), использование которых в научных исследованиях весьма ограниченно.

Наряду с десятичной системой счисления, которая является наиболее распространенной, некоторые единицы вычисляются в шестидесятиричной системе, ведущей свое начало из Ассирии и Вавилона. В этой системе вычисляются интервалы времени (часы, минуты), а также угловые меры (угловые градусы, минуты и секунды). Несмотря на некоторые неудобства, возникающие при переводе единиц измерения из шестидесятиричной системы в десятичную, вавилонско-ассирийская система настолько прочно вошла в наше сознание, что менять ее на сегодняшний день, по-видимому, не имеет смысла.

Физические единицы измерения используются в психологических исследованиях далеко не всегда. В ряде случаев, например, в психофизике, представляется разумным, чтобы субъект оценивал какие-либо величины или находил степень различия между ними в общепринятых единицах (например, промежутки времени в минутах и секундах, длину линий – в сантиметрах, расстояние до объекта – в метрах и т. д.). Общепринятые единицы измерения используются и в психофизиологии. Так, время сенсомоторных реакций и время опознания образов принято измерять в секундах или миллисекундах, амплитуду вызванных потенциалов – в микровольтах, частоту ритмов электроэнцефалограммы выражают числом колебаний в секунду и т. д. Тем не менее, чаще всего психологи в своих измерениях пользуются условными единицами («сырыми» баллами, стенами и т. д.). Так, при использовании большинства тестов-опросников в качестве единицы измерения выступают ответы «да» или «нет». Исследуемое же свойство вычисляется на основе соотношения этих ответов (их суммы, разности и т. п.). При выполнении «интеллектуальных» тестов в качестве единицы измерения выступает решение каждой отдельной задачи (выполнение отдельного задания), а исследуемый признак (коэффициент интеллекта и пр.) определяется по числу выполненных заданий.

Особенности измерения в психологии

Впервые в более или менее современном виде мысль о принципиальной возможности измерения психических явлений, процессов и состояний высказал известный немецкий философ Густав Теодор Фехнер (1801–1887). В своем фундаментальном труде «Элементы психофизики» он писал так: «. трудно возразить против того, что духовное вообще подчинено количественным отношениям. Ведь можно говорить не только о большей или меньшей силе ощущения, но и о разной силе влечений, о том, что существует большая или меньшая степень внимания, живости воспоминаний или образов фантазии, ясности сознания в целом, а также интенсивности отдельных мыслей. Таким образом, высшее духовное не в меньшей степени, чем чувственное. может быть охарактеризовано количественно» (Fechner, 1966).

Несмотря на длительную полемику по поводу возможности количественного описания психических явлений, процессов и состояний, которая развернулась после выхода в свет книги Фехнера, на сегодняшний день трудно представить психологическую науку без измерения. Психофизика, психофизиология, психометрика, психодиагностика – вот далеко не полный перечень психологических дисциплин, в которых измерение является необходимейшим инструментом.

Иногда говорят, что измерение психических величин, зачастую основанное на субъективных отчетах испытуемых, не внушает доверия только потому, что оно субъективно. Не вдаваясь в философскую сторону проблемы, можно сказать, что психологические измерения так же надежны и валидны, как и измерения физические, но обладают своими особенностями. Основные свойства психологического измерения – это его многофакторность и вариативность.

Многофакторность измерения в психологии состоит в том, что на психологические величины оказывает влияние множество различных факторов, одни из которых (релевантные) непосредственно связаны с измеряемым признаком, другие (иррелевантные) не связаны с ним или связаны косвенно. Влияние всех иррелевантных факторов учесть невозможно. Однако чем большее их число будет учтено, тем более действенна данная методика, более валидна та или иная математическая модель, более точен тот или иной психологический прогноз.

Существует наиболее оптимальный, на наш взгляд, способ преодоления трудностей, связанных с многофакторностью психологических измерений. Так, если на измеряемый психологический признак оказывает действие большое число разнообразных факторов, то априорно принимается точка зрения, что все эти многообразные и разнонаправленные факторы в конечном счете уравновешивают друг друга, и исследуемый признак варьирует случайным образом. Известно, что на принципе случайности основана целая область математической науки – теория вероятностей. Поэтому неудивительно, что многие из математических методов, используемых в психологии, основаны именно на вероятностной теории. Кроме того, существуют специальные методы и приемы, позволяющие определить, изменяется ли исследуемый признак случайным образом или неслучайно. Если психологическое свойство (признак) – случайная величина, то к нему применимы основные статистические критерии; если признак изменяется неслучайно, следует выявить и по возможности устранить (или минимизировать) тот фактор, который вносит систематическую ошибку. Если же это не представляется возможным, следует использовать так называемые непараметрические методы статистической обработки полученных результатов.

Вариабельность (вариативность) психологических измерений состоит в том, что психологические величины (признаки, переменные) зачастую принимают значения, весьма отличающиеся друг от друга. Поэтому, наряду с мерами центральной тенденции (мода, медиана, среднее значение), в психологии всегда приходится учитывать и вариабельность (изменчивость) измеряемого признака. Доказано, что вариабельность переменных сама по себе является весьма информативным показателем. Разработано большое количество статистических методов, основанных именно на анализе вариабельности – дисперсионный, корреляционный, факторный анализ и др. Другими словами, вариабельность психологических признаков из противника превратилась в союзника, и на ее основе представилось возможным решать достаточно сложные статистические задачи.

В различных областях и разделах психологии измерение имеет свою специфику. Так, психофизические измерения предусматривают, как правило, использование двух шкал: первая – это шкала физических единиц (сила света, звука, пространственные, временные параметры сигнала и т. д.), вторая – субъективная (шкала суждений, оценок и пр.), которая может быть выражена в терминах номинальной, порядковой, интервальной шкалы или шкалы отношений (см. подраздел 1.3). В случаях неметрического шкалирования исследователь, как правило, оперирует только субъективными шкалами.

Двойственная метрика предполагается и в психофизиологических исследованиях. Физиологические процессы в организме человека измеряются специальными приборами и выражаются в общепринятых физических единицах – секундах, герцах, микро- и милливольтах и т. д. В то же время психические процессы, сопутствующие физиологическим изменениям в организме, измеряются в терминах субъективного самоотчета испытуемых.

Особое место занимают измерения в психодиагностике, поскольку они включают в себя, с одной стороны, систему субъективных отчетов или невербальных операций субъекта, с другой – систему условных приемов и методов оценки психологических показателей.

В заключение следует еще раз подчеркнуть, что, несмотря на вариативность и многофакторность психологических величин, измерение в психологии является неотъемлемым этапом исследования, позволяющим с определенной степенью точности и надежности описывать разнообразные психические явления, процессы и состояния.

Шкалы измерений

Шкала в широком понимании этого слова представляет собой упорядоченную совокупность данных. Другими словами, если в психологическом эксперименте (наблюдении, опросе и т. д.) мы получаем какие-либо результаты (данные) и определенным образом упорядочиваем их, то мы конструируем шкалу.

В самом общем смысле различают четыре типа шкал измерений: номинальную, порядковую, интервальную и шкалу отношений.

Номинальная (номинативная) шкала, или шкала наименований состоит в присваивании какому-либо свойству или признаку определенного обозначения или символа (численного, буквенного и др.). По сути, это – классификация свойств, группирование объектов, объединение их в классы при условии, что объекты, принадлежащие к одному классу, идентичны (аналогичны) или, по меньшей мере, сходны друг с другом в отношении какого-либо признака или свойства, тогда как объекты, различающиеся по этому признаку, попадают в разные классы.

1) классификация вкусовых качеств:

А – сладкое, В – горькое, С – кислое, D – соленое;

2) цвета видимого спектра: А – красный, В – зеленый, С – синий и пр.;

3) распределение людей по типам темперамента:

А – холерики, В – сангвиники, С – флегматики, D – меланхолики.

1) места, занятые студентами (школьниками) в соревновании (олимпиаде и пр.);

2) ранг (место) студента по среднему баллу успеваемости;

3) в психодиагностике (например, тест Спилбергера):

утверждение: Я спокоен, собран, хладнокровен

оценка: 1 (никогда) 2 (иногда) 3 (часто) 4 (всегда).

Допустимая операция – реверсия шкалы. В случае количественных обозначений не допускается никаких перестановок внутри ранжированного ряда. Допустимая статистика: медиана, проценты, ранговая корреляция по Спирмену, Кендаллу и т. д.

Интервальная шкала (шкала интервалов) предполагает разбиение диапазона (расстояния) между двумя крайними (реперными) точками на определенное число равных интервалов (градаций, категорий).

а) температурная шкала Цельсия;

б) шкала уровня субъективного контроля по Роттеру:

Абсолютно Не знаю Совершенно

не согласен (не уверен) согласен

На интервальной шкале нет естественной точки отсчета: нуль условен, он не указывает на отсутствие измеряемого свойства. Шкала допускает операции нахождения разности, суммы и среднего значения и не изменяется при преобразовании xx + a (сложение или вычитание). Эти свойства шкалы позволяют количественно сравнивать между собой различия между парами признаков, например: А – В > C – D. Тем не менее, шкала не допускает нахождение отношений величин признака (т. е. во сколько раз одна величина больше или меньше другой). Это можно проиллюстрировать следующим примером. Допустим, вчера температура воздуха была +5, а сегодня +10 градусов по шкале Цельсия. Мы можем констатировать, что сегодня на 5 градусов теплее, чем вчера, но вряд ли можем сказать, что сегодня потеплело в два раза (если выразить те же температуры, например, в градусах Фаренгейта, то мы получим, соответственно, +41 и +50 градусов).

Необходимо отметить, что подавляющее большинство шкал, рассматриваемых в психодиагностике, являются порядковыми или интервальными шкалами.

Большинство измерительных шкал физических характеристик (пространство, время, масса, объем, скорость и пр.), используемых, в частности, в психофизике, являются шкалами отношений. Шкалы отношений используются также и в психофизиологии, где отсчет различных физиологических характеристик также ведется от естественного нуля.

Оперирование различными математическими методами предполагает изначальное определение типа шкалы исследуемого признака. Если тип шкалы определен неверно, то исследователь может выбрать неадекватный метод статистической обработки и прийти в результате к неверным выводам. Более подробно об этом будет сказано в соответствующих разделах.

Раздел 2.
ОСНОВНЫЕ СТАТИСТИЧЕСКИЕ ПОНЯТИЯ

Источник

Специфика измерений в психологии, их возможности и трудности, условия их валидности

1. Общее понятие об измерениях в психологии2. Методологические подходы к измерениям в психологии. Сложности измерений в психологии3. Валидность измерений и пути её обеспеченияЛитература

1. Общее понятие об измерениях в психологии

В психологии под измерением понимают выявление количественных характеристик изучаемых психических явлений. Измерение в психологии вводится на рубеже ХIХ-ХХ вв. как следствие общего для всех экспериментальных наук стремления к использованию математических методов. В широком смысле измерение – это особая процедура, посредством которой числа (или по крайней мере порядковые величины) приписываются вещам по определённым правилам. Сами правила состоят в установлении соответствия между некоторыми свойствами чисел и некоторыми свойствами вещей. Возможностью данного соответствия и обосновывается возможность измерения в психологии. Измерение исходит из предположения, что всё, что существует, каким-либо образом проявляется или на что-нибудь действует. Многообразие психических явлений и факторов развития в психологии принято называть переменными, поскольку они отличаются различными величинами у отдельных индивидов или в разное время. Общая задача измерений состоит в том, чтобы определить так называемую мощность одного показателя по сравнению с другим, измеряя его «вес». С точки зрения измерений следует различать три его аспекта:

а) количество или диапазон переменной (число правильных ответов, диапазон интересов и др.);

б) частота некоторого проявления – соответственно, чем оно чаще выявляется, тем выше значение свойства;

в) интенсивность, величина или сила проявления.

В психологии существует два основных направления измерений – психофизическое и психометрическое.

Психофизическое направление – это одно из направлений общей психологии, создание которого связано с именем Г.Т, Фехнера. Специфика психофизики состоит в том, что многообразие наблюдаемых форм поведения и психических состояний объясняется здесь прежде всего различиями вызывающих их физических ситуаций. Наиболее развиты психофизические исследования сенсорных процессов. При этом выделяются два круга проблем: измерение порога ощущений и построение психофизических шкал. Применение современных средств описания работы испытуемого позволяет учитывать наряду с величиной чувствительности сенсорной системы также и особенности внутренней активности, в частности избираемые критерии принятия решения.

Психометрическое направление связано, в основном, с разработкой и использованием различного рода тестов. Тесты применяются для стандартизированного измерения индивидуальных различий. Существуют три основные сферы тестирования:

а) образование – в связи с увеличением продолжительности обучения и усложнением учебных программ;

б) профессиональная подготовка и отбор – в связи с увеличением темпа роста и усложнение производства;

в) психологическое консультирование – в связи с ускорением социодинамических процессов.

Тестирование позволяет с известной вероятностью определить актуальный уровень развития у индивида необходимых навыков, знаний, личностных характеристик и т.д. Процесс тестирования может быть разделён на три этапа:

1) выбор теста (определяется целью тестирования и степенью достоверности и надёжности теста);

2) его проведение (определяется инструкцией к тесту);

3) интерпретация результатов (определяется системой теоретических допущений относительно предмета тестирования).

На всех трёх этапах тестирования необходимо участие квалифицированного психолога.

Большинство социальных и психологических объектов не могут быть строго фиксированы относительно места и времени своего существования и поэтому не поддаются прямому измерению. Поэтому возникает вопрос о специфике числовой системы, которая могла бы соотноситься с эмпирическими данным такого рода. В психологии используется метод моделирования реальных процессов с помощью числовых систем, который получил название шкалирования (от англ. scaling – определение масштаба, единицы измерения).

В психологии шкалирование является одним из основных методов математического анализа изучаемого явления, а также способом организации эмпирических данных, получаемых с помощью наблюдения, изучения документов, анкетного опроса, экспериментов, тестирования. Различные методы шкалирования представляют собой особые приёмы трансформации качественных характеристик в некоторую количественную переменную.

В психологии различные шкалы используются для изучения различных характеристик социально-психологических явлений. Первоначально были выделены четыре типа числовых систем, которые определяют соответственно четыре уровня (или шкалы) измерения: шкала наименований (номинальная), порядка (ординальная), интервалов (интервальная), отношений (пропорциональная).

Их разделение осуществимо на основе тех математических преобразований, которые допускаются каждой шкалой.

Различные уровни измерения какого-либо качества можно проиллюстрировать простым примером. Если подразделить людей только на удовлетворённых и неудовлетворённых своей работой, то тем самым получают номинальную шкалу удовлетворённости работой. Если можно установить также степень удовлетворённости, то строится ординальная шкала. Если фиксируется, насколько и во сколько раз удовлетворённость одних больше удовлетворённости других, то можно получить интервальную и пропорциональную шкалы удовлетворённости работой. Шкалы различаются не только своими математическими свойствами, но разными способами сбора информации. В каждой шкале применяют строго определённые методы анализа данных. В зависимости от типа задач, решаемых с помощью шкалирования, строят либо шкалы оценок, либо шкалы для измерения социальных установок.

Психология 35

Шкала оценок представляет собой методический приём, позволяющий распределить совокупность изучаемых объектов по степени выраженности общего для них свойства. Такое распределение основывается на субъективных оценках данного свойства, усреднённых по группе экспертов. В психологии шкалы оценок стали применяться одними из первых. Простейшим примером такой шкалы является обычная школьная система баллов. Шкала оценок имеет от пяти до одиннадцати интервалов, которые могут быть обозначены числами либо сформулированы вербально (словесно).

Считается, что психологические возможности человека не позволяют ему производить классификацию объектов более чем по 11-13 позициям. Возможность построения шкалы оценок базируется на предположении, что каждый эксперт способен непосредственно давать количественные оценки изучаемым объектам. К основным процедурам шкалирования с помощью шкалы оценок относится парное сравнение объектов, отнесение их к категориям и др.

Шкала установок представляет приём, позволяющий сравнивать индивидов по величине, интенсивности и устойчивости их отношения к изучаемому явлению. В психологии шкала установок применяется в качестве одного из главных средств анализа, так как объектом измерения являются здесь прежде всего личные качества людей. Построение шкалы установок связано с подбором таких суждений, которые выражают весь спектр возможных отношений субъекта к определённому социально-психологическому явлению. По шкале оценок каждое суждение оценивается группой экспертов и получает усреднённый балл. В шкалу установок входят те суждения, которые имеют наиболее высокую оценку; обычно из 300 суждений в готовую шкалу установок входят не более 25. С этими суждениями знакомят лиц, чьи установки предполагается изучить; соответственно по тому, какие суждения выбирает индивид, ему присваивается суммарный балл, который и является его баллом по данной установке.

2. Методологические подходы к измерениям в психологии. Сложности измерений в психологии

Систематизация психологических знаний о личности может быть условно разделена на две исторические фазы: клинико-психологическую и экспериментальную.

Клинико-психологическая фаза является фазой организованных наблюдений и вербальных теорий. Она возникла как стремление лечить и корригировать отклоняющиеся формы поведения. Эта фаза оставила в наследство много известных имён (таких как Адлер, Бехтерев, Блейхер, Жанэ, Корсаков, Крепелин, Кречмер, Лазурский, Фрейд, Юнг и др.) и множество самобытных теорий. Будучи научными по своим целям, эти теории достигли популярности, не имея обоснованности. В них отсутствует экспериментальная основа, имеющаяся в других науках. Эксперимент используется в клиническо-психологической фазе исследования лишь незначительно. Измерение здесь заменено наблюдением, сбор данных – отбором показательных случаев, статистическая обработка – содержательной интерпретацией.

Шкалы измерения переменных

Однако такая бедность экспериментальной процедуры позволяет манипулировать большим числом объясняющих переменных. Важно, что сторонники клинического метода стараются свести в единую систему все переменные, необходимые для формирования понятий о личности, без которых невозможно прийти к установлению реальных закономерностей.

Экспериментальная фаза возникла как реакция на вербальный характер клинико-психологического метода исследования. Эта фаза количественного и экспериментального исследования личности с самого начала чётко разделилась на два течения: двумерное и многомерное. Оба подхода позволяют изучать взаимосвязи между переменными, но разными способами.

Двумерный эксперимент является по существу слепым перенесением в психологию метода исследования, принятого в физических науках. Он предполагает выделение зависимой и независимой переменных с помощью экспериментального контроля либо с помощью иных процедур.

В многомерном же эксперименте одновременно статистически учитываются все измеряемые факторы, взятые во всей их жизненной полноте.

Сторонники двумерного экспериментального метода считают, что выделение двух переменных необходимо для изучения психического феномена в чистом виде. По их мнению, при таком подходе устраняются искажающие влияния одновременно происходящих процессов, однако упускается из виду тот факт, что изучаемый психический процесс никогда не протекает изолированно. Поведение сложно и определяется множеством внутренних и внешних факторов. По этой причине пытаться сформировать две группы лиц, идентичных во всех отношениях, кроме одного, и поставить их в одинаковые условия невозможно даже в лабораторных условиях. Поэтом вместо устранения искажающих эффектов разумнее изучить их самих. Этот принцип и положен в основу многомерных методов исследования. Многомерный эксперимент требует измерения множества сопутствующих признаков, независимость которых заранее не известна. Анализ связей между изучаемыми признаками позволяет выявить небольшое число скрытых структурных факторов, от которых зависят наблюдаемые вариации измеряемых переменных. Такой подход базируется на априорных соображениях, что исходные признаки – это только поверхностные индикаторы, косвенно отражающие скрытые от прямого наблюдения черты личности, знание которых позволит просто и понятно описать индивидуальное поведение. Поскольку скрытых черт значительно меньше, чем поверхностных, то даже полное описание личности остаётся экономным и удобным для практического использования.

Таким образом, многомерный подход к исследованию личности может рассматриваться как синтез двух фаз развития личностных исследований. Он позволяет объединить достоинства целостного подхода, свойственного клиническому методу с достоинствами метрического подхода, присущего двумерному эксперименту. В силу этих особенностей многомерный подход успешно применяется в тех областях, где человеческое поведение рассматривается в естественных условиях. Того, чего невозможно достичь прямой манипуляцией зависимых и независимых переменных, можно добиться с помощью более сложного статистического анализа всего множества существующих переменных. Главным достоинством многомерного подхода является его эффективность в исследовании реальных ситуаций без риска их искажений или загрязнений побочными влияниями, возникающими при создании искусственных экспериментальных условий.

К сожалению, несмотря на очевидные преимущества многомерного эксперимента, психологи ещё недостаточно осознают его потенциальные возможности. Это происходит по двум причинам: во-первых, из-за неспособности вырваться из привычных стереотипов о правилах проведения исследования, во-вторых из-за отсутствия серьёзных публикаций по теории многомерных исследований.

Однако с началом измерения в психологии возникла бурная и беспорядочная активность. Вероятно, в ряде случаев она была связана со стремлением некоторых психологов к оригинальности, к измерению чего-либо такого, что не измерял никто. Однако, большая часть этой хаотической активности объясняется отсутствием обобщённых личностных переменных. Это приводило к тому, что многие исследования оказывались до такой степени новыми, что не имели никакой связи с предыдущем развитием психологической науки.

3. Валидность измерений и пути её обеспечения

Главная проблема теории психологических исследований заключается в том, как по измеренным результатам определить истинные результаты. Существуют два основных определения истинных результатов тестирования, которые имеют значение для психометрии: специфические и обобщённые (генерализированные).

Под специфическим истинным результатом измерения понимается точный результат, полученный с помощью конкретного теста. Это понятие близко к понятиям действительно точных (или «выровненных») оценок, используемых при измерении физических величин. Здесь истинность результатов понимается с точки зрения точности метода измерения. Для характеристики специфической истинности результатов тестирования разработано понятие надёжности. Оно характеризует соотношение наблюдаемого результата и его действительной величины.

Генерализованный (обобщённый) истинный результат – это термин, используемый для характеристики действительного уровня скрытых, ненаблюдаемых качеств или свойств. Скрытое от внешнего наблюдения свойство не может быть измерено только с помощью одного какого-либо исследования. В практики для этой цели используется батарея с конечным числом разных тестов, направленных на измерение одного скрытого свойства, уровень которого требуется определить. Каждый из испытуемых тестов лишь частично покрывает исследуемое свойство.

Для характеристики способности исследования измерять действительный уровень психического свойства или качества используется понятие валидности.

Валидность (от англ. valid – пригодный) психологического исследования показывает, в какой мере оно измеряет те качества (свойства, характеристики, способности и т.п.) для оценки которых оно изначально было предназначено. Инвалидные, т.е. не обладающие валидностью тесты не пригодны для практического использования.

А) конструктная валидность теста

Валидность и надёжность – связанные понятия. Их соотношение может быть проиллюстрировано следующим примером. Допустим, имеются два стрелка А и В. Стрелок А выбивает 90 очков из 100, а стрелок В – только 70. Соответственно, надёжность стрелка А равна 0,90, а стрелка В – 0,70. Однако стрелок А всегда стреляет по чужим мишеням, поэтому на соревнованиях его результаты не засчитываются. Второй стрелок всегда правильно выбирает мишени. Поэтому валидность стрелка А нулевая, а стрелка В – 0,70, то есть численно равна надёжности. Если стрелок А станет правильно выбирать мишени, то его валидность тоже будет равна его надёжности. Если же он будет продолжать иногда путать мишени, то часть результатов не будет зачтена и валидность стрелка А будет ниже надёжности. В настоящем примере аналогом надёжности является точность, меткость стрелка, а аналогом валидности – тоже точность стрельбы, но не по любой, а по строго определённой «своей» мишени. Поэтому надёжный стрелок может стать валидным, не только сменив мишень, но и сменив команду. В истории известны случаи, когда тесты, признанные инвалидными для измерения одних свойств, оказались валидными для других. Значит, надёжность является необходимым условием валидности. Ненадёжное психологическое исследование не может быть валидным, и, наоборот, валидное исследование всегда надёжно. Надёжность исследования не может быть меньше его валидности; в свою очередь валидность не может превышать надёжности.

В современной психометрии выделяют три основные вида валидности: 1) содержательная (логическая); 2) эмпирическая; 3) концептуальная.

Содержательная валидность (content validation).

Её часто называют «логической валидностью» или «валидностью по определению». Содержательная валидность означает, что исследование является валидным по мнению специалистов.

Содержательную валидность следует отличать от очевидной, лицевой, внешней валидности (face validity).

Очевидная валидность – это валидность с точки зрения испытуемого. Она означает то впечатление о предмете измерения, которое формируется у испытуемого при знакомстве с инструкцией и материалом теста. Очевидная валидность играет важную роль в процессе тестирования, поскольку именно она в первую очередь определяет отношение испытуемых к обследованию. В.А. Аванесов приводит пример отказа от выполнения теста испытуемыми из-за отсутствия у теста очевидной валидности. Во время одного социологического опроса моряков рыболовного флота он столкнулся с случаем отказа заполнять анкету под предлогом того, что анкета составлена «не для моряков», в ней нет вопросов, относящихся к морякам, «на морские темы». Если бы опросник содержал «морские термины», то он казался бы «своим» и вызывал бы больше доверия у испытуемых. Именно в силу этого обстоятельства очевидную валидность иногда называют также доверительной валидностью.

Очевидная внешняя валидность может находиться в разных отношениях с содержательной валидностью. В одних случаях содержательная и внешняя валидность совпадают, в других внешняя валидность используется для маскировки содержательной валидности. С этой целью содержанию заданий и инструкции придаётся специальная форма, маскирующая истинную цель исследования. Тем самым предупреждается возникновение установочного поведения при тестировании. Это один из основных тактических приёмов, используемых при создании объективных тестов.

К вопросу о валидности теста Люшера

В отличие от очевидной валидности содержательная валидность всегда связана с оценкой отношения содержания тестового материала к истинной, а не мнимой цели измерения. Для определения содержательной валидности используются экспертные методы. Как и во всякой экспертизе, необходимо решить следующие вопросы: отобрать компетентных экспертов, сформировать экспертную группу, организовать процедуру экспертизы и т.п. Специфичным является объект экспертизы – содержание психологического исследования. Эксперты должны оценить содержание заданий теста по их соответствию психическому свойству, объявляемому в качестве содержания валидизируемого теста. С этой целью экспертам предъявляются спецификации к тесту и список заданий. Если конкретное задание полностью соответствует спецификации, то эксперт обозначает его как соответствующее содержанию теста. В противном случае он бракует задание и письменно обосновывает свою оценку. Если несколько экспертов бракуют одни и те же задания, они признаются несоответствующими спецификации теста. Если между экспертами существует расхождение в оценке заданий, их анонимно знакомят с письменными объяснениями экспертов, забраковавших задания, после этого экспертиза повторяется.

Экспертный критерий предполагает использование экспертных оценок для независимого измерения свойств личности. Хотя экспертному методу измерения особенностей личности в последнее время уделяется значительное внимание, тем не менее применение экспертных оценок для валидизации тестов не имеет достаточно разработанных унифицированных процедур, позволяющих получить достоверную и устойчивую информацию.

В связи с низкой надёжностью и трудностями организации экспертиз экспертные критерии валидности используются редко, преимущественно в случаях, когда невозможно или чрезвычайно затруднительно использовать в качестве внешнего критерия валидности обычные количественные методы измерения. На практике значительно больше распространены экспериментальные критерии. В этих случаях в качестве критерия валидности используются результаты одновременного и независимого тестирования испытуемых другим тестом, предположительно измеряющим то же свойство личности, что и валидизируемый тест. Коэффициент корреляции между результатами двух измерений называется эмпирической взаимной валидностью. Его величина зависит как от степени совпадения содержания измерения, так и от надёжности тестов. Поэтому максимальные коэффициенты эмпирической взаимной валидности имеют параллельные тесты.

Валидность теста

Эмпирическая валидность теста – это всегда валидность по отношению к конкретному критерию. Поэтому процесс конструирования теста часто сопровождается поиском подходящего критерия. Если к моменту проверки валидности такого экспериментального критерия не оказывается, в качестве него используются характеристики реального поведения, которые на основе существующих психологических теорий предполагаются связанными с измеряемым свойством. Например, в качестве жизненных критериев для тестов интеллекта используют показатели успешности обучения, экстравертированности – успешность административной деятельности, тревожности – частота заболеваний неврозом и т.п. Однако успешность обучения, поведения и деятельности редко зависит только от одного-единственного свойства психики. Реальное поведение человека множественно детерминированно, то есть зависит не от одного, а от целого комплекса психических свойств. Поэтому использование жизненных критериев для валидизации тестов имеет смысл только в отношении многомерных тестов.

Концептуальная валидность (construct validity).

Она устанавливается путём доказательства правильности теоретических концепций, положенных в основу теста. Обращение к концептуальной валидности необходимо в тех случаях, когда результаты тестовых измерений используются не просто для предсказания поведения, а как основа выводов о том, в какой степени испытуемые обладают некоторой определённой психологической характеристикой. Причём измеряемая психологическая характеристика не может быть отождествлена с какой-либо наблюдаемой особенностью поведения, а представляет собой теоретическую концепцию. Примерами таких концепций являются интеллект, черты личности, мотивы, установки и т.д. Концептуальная валидность имеет значение также при разработке принципиально новых тестов, для которых не определены внешние критерии валидности.

По существу проверка концептуальной валидности теста проходит через три основных этапа:

1. Определяется некоторая теоретическая концепция, которая предположительно объясняет выполнение валидизируемого теста.

2. Из теоретической концепции выводятся одна или несколько гипотез, связанных с валидизируемым тестом.

3. Выдвинутые гипотезы подвергаются эмпирической проверке.

Если эмпирические данные подтверждают гипотезу, то тем самым подтверждается психологическая концепция, положенная в основу теста, и способность теста служить инструментом измерения этой концепции. Чем убедительнее эмпирическое подтверждение, тем определённее можно говорить о валидности теста по отношению к психологической концепции, положенной в его основу.

Литература

1. Аванесов В.С. Тесты в социологическом исследовании. – М., 1982. 2. Ананьев Б.Г. Человек как предмет познания. – Л., 1968. 3. Ковалёв А.Г. Психология личности. – М., 1965. 4. Мельников В.М., Ямпольский Л.Т. Введение в экспериментальную психологию. – М., 1985. 5. Психологический словарь / под ред. А.В. Петровского, М.Г. Ярошевского. – М., 1990.

Примеры похожих учебных работ

Критерии валидности, применяемые к качественным исследованиям.

Психодиагностические методы исследования личности

Биографический метод исследования личности

Полит психология тесты ответы

Математические методы в психологии тест с ответами

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *