Внутренняя и внешняя валидность эксперимента. Внутренняя валидность

Одно из наиболее распространенных определений валидности связывает это понятие с ответом на вопрос, насколько хорошо процедура исследования позволяет изучить тот предмет, для изучения которого она применяется, или же насколько хорошо выводы исследования обоснованы процедурами получения и обработки данных.

Валидность высока в том случае, когда независимая и зависимая переменные наилучшим образом операционализированы, точно измерены, никакие побочные переменные не влияют на зависимую переменную, все измерения правильно обработаны статистически, а выводы сделаны с учетом всех дополнительных переменных. Низкая валидность означает, что полученные результаты не содержат никакой информации о том, что хотел изучать исследователь, а если и содержат информацию, то о чем-то другом.

В качестве шуточного примера надежного, но абсолютно инвалидного исследования можно привести анекдот про таракана. Исследователь предполагает, что у таракана уши находятся на ногах. Если посадить таракана на стол и хлопнуть в ладоши, таракан убежит. Если оторвать таракану лапку, посадить на стол и хлопнуть в ладоши, таракан тоже будет убегать, но медленнее. По логике исследователя, это происходит потому, что таракан стал хуже слышать. Если оторвать таракану две лапки, он будет убегать еще медленнее, видимо, потому что еще хуже стал слышать. Если оторвать все лапки, то таракан вообще не убежит, но той же логике - потому что не слышит хлопков. Такой "эксперимент" абсолютно надежен - он будет воспроизводиться в 100% случаев, любыми экспериментаторами на любых членистоногих и не только членистоногих животных. Но он абсолютно не валиден, так как исследователь не имел права делать выводы про слух таракана, в то время как реально воздействовал на его двигательные органы.

Понятие валидности применяется не только к эксперименту, но и к любой исследовательской процедуре. Например, случается так, что, заполнив психологический тест, люди недоумевают: получившийся результат совсем не соответствует их представлениям о себе. Тогда они обращаются к вопросам теста и сами задаются вопросом о том, действительно ли, например, такие действия, как "схожу с ума", "говорю сам с собой", "бегаю или хожу пешком", "дразню кого-нибудь", помогают преодолеть стресс? Действительно ли, если они не делают всего этого, это значит, что они не умеют преодолевать свой стресс и не справляются с ним? Такие вопросы выражают сомнение в валидности теста.

В зависимости от нарушения, допущенного исследователем при получении или оценке данных и, соответственно, при формулировании выводов, выделяются разные виды валидности. Некоторые нарушения приводят к тому, что из данных невозможно сделать никаких выводов про гипотезу - ни подтверждающих, ни опровергающих ее. Другие нарушения лишь накладывают ограничения на эти выводы или области и способы их применения.

Далее мы будем обсуждать четыре вида валидности: внутреннюю, внешнюю, конструктную и статистическую. Мы обсудим также угрозы, связанные с их нарушением, рекомендации по их избеганию и особенности выводов из исследования при угрозе каждому виду валидности.

Внутренняя валидность

Внутренняя валидность отражает то, насколько результаты измерения зависимой переменной обусловлены изменением независимой переменной, а не каким-нибудь другим неконтролируемым фактором. Такой неконтролируемый фактор, как уже отмечалось выше, называется побочной переменной.

Таким образом, чем больше побочных переменных продумал и постарался избежать исследователь, тем выше внутренняя валидность, т.е. тем выше доверие к выводам исследования о причинах изменения зависимой переменной. При неподтверждении гипотезы валидного эксперимента (подтверждении контргипотезы) исследователь может быть вполне уверен,

что проверяемая в его исследовании независимая переменная не влияет на зависимую.

Например, в психологических исследованиях в психиатрической клинике очень часто побочной переменной, угрожающей внутренней валидности, являются лекарства, которые принимают пациенты. Скажем, исследователь хочет выяснить, влияет ли заболевание шизофренией на продуктивность внимания. Для этого он набирает три группы для сравнения: здоровых людей, пациентов с небольшим стажем заболевания и пациентов с многолетним стажем. Таким образом, его независимая переменная - это стаж заболевания шизофренией, имеющая три уровня: нулевой стаж, маленький и многолетний. Зависимая переменная - эго успешность прохождения теста на внимание.

Для того чтобы доказать, что заболевание шизофренией влияет на продуктивность внимания. исследователь должен показать, что три группы сильно отличаются по результатам теста на внимание. Допустим, результаты исследования покажут, что это так: здоровые люди выполняют тест наиболее успешно, пациенты с маленьким стажем - существенно менее успешно, а пациенты с большим стажем заболевания - еще менее успешно. Значит ли это, что заболевание шизофренией сказывается на том, как работает внимание? Не обязательно. Возможно, не заболевание провоцирует ухудшение внимания испытуемых, а лекарства, которые они принимают. Здоровые испытуемые хорошо выполняют тест не потому, что они здоровые, а потому что не принимают психотропные препараты. Пациенты с маленьким стажем заболевания выполняют тест хуже не потому, что больны, а потому что принимают такие препараты, но они выполняют этот тест лучше, чем пациенты с многолетним стажем, потому что принимают более слабые препараты и в меньшей дозировке.

В итоге исследователь не знает точную причину ухудшения внимания испытуемых: заболевание шизофренией или действие лекарств. Оба фактора с равной вероятностью могут быть такой причиной, так как действуют одновременно и одинаково.

В данном примере влияние лекарств является побочной переменной, не проконтролированной исследователем. Исследователь не может сделать никаких выводов о своей гипотезе. Он не может утверждать, что гипотеза о влиянии заболевания шизофренией на продуктивность внимания подтвердилась, так как, возможно, влияет не заболевание шизофренией, а лекарства, принимаемые при этом заболевании. Но он также не может утверждать, что гипотеза не подтвердилась, и заболевание шизофренией никак не сказывается на продуктивности внимания, потому что возможно, что лекарства все-таки не причем, а на продуктивность внимания влияет именно заболевание.

Поскольку выводы о гипотезе в данном исследовании сделать невозможно, ценность полученных в нем результатов стремится к нулю но причине низкой внутренней валидности проведенного эксперимента, которая явилась следствием систематического смешения эффектов переменной, рассматриваемой в качестве независимой (стаж болезни), и побочной переменной (влияния лекарств).

Побочные переменные особенно неприятны тем, что часто заранее невозможно спрогнозировать, какая особенность испытуемых или какое обстоятельство могут повлиять на зависимую переменную вместо независимой или вместе с ней. Исследователь может даже не знать о присутствии такого обстоятельства. Поэтому невозможно разработать систему мер, соблюдение которых гарантировало бы защиту от побочных переменных.

Для повышения внутренней валидности исследования прежде всего можно сделать две вещи. Во-первых, нужно подробно изучить литературу по теме исследования для того, чтобы выявить факторы, которые могут повлиять на зависимую переменную наряду с независимой. Во-вторых, необходимо проконтролировать известные и наиболее часто встречающиеся угрозы внутренней валидности. Вслед за Кэмпбеллом обычно выделяют семь угроз внутренней валидности, которые представляют собой различные источники побочных влияний на зависимую переменную. Рассмотрим их чуть более подробно.

Влияние истории (фона). Напомним, что общая структура эксперимента обязательно включает в себя предварительный замер зависимой переменной, воздействие на замеряемую переменную со стороны независимой переменной и заключительный замер. Большая проблема, которая возникает при этом у исследователя, состоит в том, чтобы устранить любые побочные воздействия на зависимую переменную между двумя замерами, кроме воздействия независимой переменной. Такие воздействия и называются влиянием истории или влиянием фона. Испытуемых нельзя изолировать от окружающего мира на период исследования, они подвергаются множеству воздействий, о значительной части которых исследователь даже не подозревает. И если одно или несколько из этих событий повлияют на состояние зависимой переменной, то внутренняя валидность исследования будет нарушена, поскольку изменение будет вызвано не независимой переменной, а побочной.

Поскольку устранить все воздействия на испытуемых невозможно, для контроля влияния истории исследователи используют контрольную группу испытуемых. Испытуемые контрольной группы подвергаются тем же замерам (предварительному и заключительному), что и испытуемые экспериментальной группы, но не получают воздействия независимой переменной.

Таким образом, исследователь сначала оценивает, возник ли ожидаемый эффект в экспериментальной группе - различаются ли результаты предварительного и заключительного замеров. Если результаты различаются, значит, некоторое событие повлияло на зависимую переменную между этими замерами. После этого исследователь сравнивает результаты экспериментальной и контрольной группы. Если эти результаты различаются, то за это различие ответственна независимая переменная, так как предполагается, что любые другие факторы влияли на обе группы, а независимая переменная - только на испытуемых экспериментальной группы. В том случае, если причиной изменения зависимой переменной стало некое неконтролируемое событие, то изменения между первым и вторым замером в экспериментальной и контрольной группе существенно различаться не будут.

Например, исследователя интересует, влияет ли хорошее настроение на способность решать задачи. Он фиксирует выраженность разных эмоций у испытуемых, например с помощью опросника "Самочувствие. Активность. Настроение", и просит решить несколько задач, потом показывает им смешной видеосюжет про животных, затем снова измеряет эмоции испытуемых и снова просит решить задачи. Результаты показывают, что испытуемые лучше решают задачи после просмотра видео. Но на качество решения задач могло повлиять нс только видео, но и любые другие факторы тренировка, звуки разговоров из коридора, желание показать себя с лучшей стороны. Поэтому исследователю необходимо набрать контрольную группу, которая будет решать те же задачи, слышать тот же шум из коридора, стремиться к положительной оценке и точно так же прервется на некоторое время, соответствующее длительности видеосюжета, но не будет просматривать его. Только если при прочих равных условиях испытуемые экспериментальной группы покажут лучший прирост в решении задач, исследователь имеет право сделать вывод о том, что его гипотеза подтвердилась. Если же результаты экспериментальной и контрольной группы не будут значительно различаться, значит, к изменениям в качестве решения задач привело не хорошее настроение, а какие-то другие факторы.

Сходное влияние оказывает естественное развитие человека, которое иначе называют эффектом взросления. Если эксперимент достаточно продолжителен или приходится па такие моменты жизни человека, когда созревание протекает быстрее, то исследователь имеет все основания сомневаться, по какой причине изменилась зависимая переменная: в результате воздействия независимой переменной или в результате естественного развития и созревания изучаемой психической функции.

В отличие от эффекта истории, побочной переменной в данном случае является не какое-то конкретное событие, повлиявшее на зависимую переменную, а изменения испытуемых, обусловленные течением времени. Так, например, в возрастной психологии известны периоды быстрых и достаточно глобальных изменений личности и психики, получившие название кризисов; в детском возрасте изменений больше, чем во взрослом.

Аналогичным образом действуют некоторые обстоятельства, такие как приспособление к новым условиям. Например, учащиеся в первые месяцы обучения в любом учебном заведении, работник, недавно принятый на новое место работы, пациент, попавший в больницу, призывник в армии адаптируются к новому месту, режиму, правилам поведения. Трудности, которые они испытывают поначалу, со временем сходят на нет, и трудно назвать конкретное событие, которое к этому приводит. Просто человек изменился, приладился к новым обстоятельствам и правилам.

К факторам взросления Кэмпбелл относит также менее глобальные изменения, такие как изменение физического состояния вследствие усталости, голода, пресыщения осуществляемой деятельностью и т.п. Подобно взрослению, эти факторы сказываются на работоспособности в целом, па функционировании всех психологических процессов, и достаточно сложно установить момент начала их влияния, поскольку у всех людей усталость, голод и т.и. возникают с разной скоростью, и сами люди, будучи занятыми экспериментальным заданием, могут заметить их не сразу.

Эффект взросления нарушает внутреннюю валидность, так как неизвестно, экспериментальное воздействие или изменение самих испытуемых за время эксперимента повлияло на зависимую переменную. Разрешить вопрос о том, какой из этих факторов оказался решающим, снова помогает . Например, оценка программы психологической адаптации на рабочем месте предполагает, что мы замеряем уровень психической напряженности и стресса у людей, только что поступивших на работу в ту или иную организацию. После этого с половиной из них работаем но программе адаптации, а половина адаптируется сама, без помощи психолога. Если по окончании программы обе группы покажут одинаковое снижение уровня психической напряженности и стресса, значит, программа не работает, а снижение негативных переживаний связано с эффектом взросления. Только если экспериментальная группа, работавшая по специальной программе, покажет более сильное снижение негативных переживаний, эту заслугу можно приписать эффективности программы.

Эффект тестирования - это влияние факта участия в исследовании на результаты исследования. Часто люди хотят показать себя с лучшей стороны, и, если, например, им сообщают, что изучается их обучаемость, они мобилизуются и стараются выполнить все задания как можно лучше. Поэтому в эксперименте они действуют так эффективно, как никогда не действуют в повседневной жизни.

Особенно часто эффект тестирования возникает в ситуациях контроля и оценки: при приеме на работу, психологическом отборе персонала, оценке эффективности работы сотрудников, сравнении их по каким-либо психологическим качествам, важным для той сферы, в которой они работают, при психологической экспертизе в клинике, в суде и т.п. Как следствие, перед исследователем встает вопрос о том, почему испытуемые показали определенные результаты: потому что экспериментальное воздействие столь эффективно или потому что испытуемые старались показать себя с лучшей стороны?

Другим источником эффекта тестирования является использование исследователем необычных процедур и заданий. Так, к опросникам, анкетам, интервью, тестам потенциальные испытуемые уже привыкли, они сталкиваются с ними на страницах журналов, на общественных мероприятиях, в Интернете, видят по телевизору. Если же исследователь использует более сложные процедуры, дает необычные задания, то сам факт выполнения такого задания или серии заданий может привести к изменению зависимой переменной. Примерами таких заданий могут быть просьба выполнить привычное действие непривычным способом или составить фигуру человека из ограниченного набора простых геометрических форм, решить хитрую задачу, не похожую па те, которые испытуемый когда-либо решал и т.п. В этом случае зависимая переменная изменится не в результате экспериментального воздействия, а по причине необычности предварительного и заключительного тестирования или необычности самих способов воздействия, и любое другое настолько же необычное воздействие приведет к такому же эффекту.

Использование контрольной группы для устранения этого эффекта не всегда помогает. Предварительное и заключительное тестирование проводятся в обеих группах, и данный факт может привести к тому, что результаты в контрольной группе изменятся так же, как и в экспериментальной, под действием эффекта тестирования. Но если этот эффект сопровождает экспериментальное воздействие, то в контрольной группе оно отсутствует, и испытуемые экспериментальной группы сталкиваются с двумя неразделимыми воздействиями, одно из которых - само экспериментальное воздействие, а второе - непривычность, новизна методики воздействия. В этом случае контрольная группа не поможет против эффекта тестирования.

Способом борьбы с эффектом тестирования является предварительная тренировка испытуемых. Им дают множество заданий, похожих на те, которые впоследствии будут использованы в исследовании, для того чтобы люди привыкли к ним, набрались опыта в обращении с ними, чтобы исчез эффект новизны или страх, неуверенность перед заданиями, с помощью которых их будут оценивать. Такая тренировка позволит уравнять всех испытуемых по опыту обращения с материалами исследования и в случае использования нового незнакомого инструментария позволит устранить влияние умелости и скорости обучения испытуемых.

Однако этот способ борьбы не позволяет оценить наличие или отсутствие эффекта тестирования, а также его силу. Для того чтобы определить, влияет ли данный эффект в ходе исследования и насколько сильно его влияние (нужно его устранять или им можно пренебречь), исследование строится в соответствии с планом Соломона, названного так по имени американского исследователя Р. Соломона. Этот план предполагает использование четырех групп испытуемых - двух экспериментальных (ЭГ1 и ЭГ2) и двух контрольных (КГ1 и КГ2) (табл. 11.1).

Таблица 11.1

План Соломона

Использование этого плана позволяет оценить эффективность экспериментального воздействия при наличии предварительного тестирования и при его отсутствии, поскольку эффект тестирования одинаково проявляется в экспериментальной и контрольной группах , а влияние независимой переменной проявляется только в экспериментальной гругге.

Эффект инструментария. Влияние инструментария (тех процедур, конкретных методик и материалов, которые использует исследователь в работе с испытуемыми) представляет собой особенно болезненную проблему в психологических исследованиях. Поэтому проблемам исследования, связанным с влиянием инструментария, уделяется много внимания при планировании исследования. Выше уже обсуждались проблемы, связанные с влиянием новизны и необычности методик исследования па внутреннюю валидность. Обсуждению специфических искажений результатов исследования, связанных с влиянием инструментария, посвящено особое понятие - "конструктная валидность", речь о которой пойдет впереди.

Также проблемы инструментария образуют важный вопрос при обсуждении надежности исследования, но не надо путать надежность и этот вид валидности. Методика может быть очень надежной в том смысле, что она при воспроизведении дает очень согласованные результаты, однако измерять на самом деле не то, что по замыслу исследователя она должна измерять, если внутренняя валидность низка, в частности, вследствие эффекта инструментария.

Эффект инструментария и его влияние па уровень внутренней валидности исследования проявляются, когда инструментарий недостаточно точен и допускает различие толкований одних и тех же или сходных результатов, если этот инструментарий меняется, дорабатывается, калибруется в процессе проведения исследования или дает разные результаты в зависимости от конкретных условий измерения. В этом случае побочной переменной, угрожающей внутренней валидности, являются флуктуации измерения. Исследователь не может сделать окончательный вывод о том, почему изменилась зависимая переменная - в результате экспериментального воздействия или в результате погрешности инструментария, который периодически давал различающиеся данные.

Например, если в исследовании факторов, влияющих на представления о социальной справедливости, исследователь менял вопросы опросника, диапазон или вид шкал оценки, добавлял и убирал варианты ответов, то пет ничего странного в том, что результаты предварительного и заключительного измерения будут различаться. Если исследователь по-разному дает инструкцию испытуемым, даже не меняя се сути, изменяет способ представления одних и тех же заданий, дает дополнительные комментарии при одном измерении и не дает их при другом - все это может привести к различиям в данных, вызванных не экспериментальным воздействием, а влиянием неточности инструментария.

Для борьбы с эффектом инструментария рекомендуется в первую очередь использовать надежные, хорошо себя зарекомендовавшие психологические методики и процедуры. Также важен размер выборки испытуемых: чем больше выборка, тем меньше влияние каждой отдельной ошибки на конечный результат. Когда инструментарий новый, следует как можно строже формализовать процедуру исследования: заранее сформулировать инструкцию испытуемым, информацию о целях и задачах исследования, четко сформулировать все действия, которые требуются от испытуемого, чтобы ни на шаг не отклоняться от процедуры. Следует заранее продумать несколько уклончивых ответов на вопросы испытуемых, наподобие "действуйте, как вам кажется правильным, здесь нет правильных или неправильных реакций", "какая формулировка (действие) лично вам ближе, то и пишите (так и делайте)" и т.п., чтобы испытуемые не различались по количеству информации об исследовании. Эти действия напрямую нацелены на снижение количества флуктуаций измерения, являющихся источником эффекта инструментария.

Регрессия к среднему, или статистическая регрессия в соответствии с определением Ф. Гальтона - эго эффект возврата системы к среднему состоянию. Влияние эффекта регрессии можно показать на следующем примере.

Представим двух студентов, один из которых в течение всего семестра готовился к семинарам, отвечал на все вопросы и получал высокие оценки, а второй ничего не учил и работал вполсилы. Когда пришло время итогового экзамена, первый студент простудился, заболел и вследствие этого сдал на тройку, а второй студент хорошенько посидел за книгами всю ночь и получил пятерку.

Обе эти оценки отражают отклонение от средней успеваемости каждого студента. Будут ли эти оценки адекватно отражать знания обоих студентов? Конечно, нет, так как первый студент, который учился в течение всего семестра и получал пятерки, доказал свои высокие знания и, попади он на экзамен на другой день или через неделю, в здоровом состоянии, обязательно получил бы пятерку. Второй студент, который выучил материал за ночь, столь же быстро его и забудет, и уже через неделю шансов на повторное получение высокого балла у него не будет. Эффект регрессии возникнет уже при повторной оценке знаний студентов, в которой каждый из них получит оценку, более близкую к его обычной (средней) успеваемости: отличник - более высокую, троечник - более низкую.

Такая же проблема возникает, если отбирать для исследования группы испытуемых с крайними показателями (очень высокими или очень низкими) по результатам однократного измерения. Например, если исследователь считает, что творческие способности испытуемых могут быть усилены с помощью занятий по мозаике, он должен измерить творческие способности у своих испытуемых, отобрать тех, кто продемонстрировал невысокие способности.

Допустим, повторное измерение покажет более высокие результаты но тесту творческих способностей в экспериментальной группе. Возможно, это результат экспериментального воздействия. Но не исключено, что возник эффект регрессии к среднему. Возможно, что испытуемые, отобранные для исследования, при первом замере показали не очень высокие творческие способности, потому что утром не позавтракали, приболели, всю ночь танцевали в клубе, поссорились с близкими, получили шокирующее известие и т.д. На самом деле эти люди имеют гораздо более высокие творческие способности, и, если бы не конкретные обстоятельства, они показали бы их в тесте. При повторном исследовании эти обстоятельства уже не влияли на испытуемых, и они продемонстрировали обычный для себя уровень творческих способностей. При этом результаты повторного измерения не повысились под влиянием независимой переменной (позитивных переживаний испытуемых), а вернулись к нормальному среднему результату, обычному для данных испытуемых.

Повторимся, что опасность регрессии к среднему особенно велика в том случае, когда для исследования отбираются испытуемые с крайней выраженностью исследуемого качества на основе однократного измерения. Если при этом будет набрана эквивалентная контрольная группа, то она покажет такое же изменение зависимой переменной, как и в экспериментальной группе, обусловленное регрессией к среднему. Неэквивалентная контрольная группа влияние регрессии к среднему не покажет (в приведенном выше примере неэквивалентной будет группа, собранная из испытуемых не только с низким, по и со средним и высоким уровнем творческих способностей).

Снизить вероятность возникновения регрессии можно, если отбирать испытуемых на основе многократного измерения исследуемого качества - например, на основе среднего уровня творческой способности но результатам выполнения нескольких эквивалентных субтестов в разные моменты времени. Это сложно и трудоемко, но в некоторых случаях, например, при оценке школьной успеваемости или если испытуемые участвуют в психологическом монторинге, многократные измерения их успеваемости и качеств, подвергаемых мониторингу, имеются в достаточном количестве до начала исследования.

Наконец, в тех случаях, когда уровень зависимой переменной был ниже среднего до экспериментального воздействия и стал выше после (а также наоборот был выше среднего, а после воздействия стал ниже), влияние статистической регрессии можно исключить, так как эффект регрессии к среднему не предполагает перехода за средние значения.

Эффект отбора испытуемых предполагает, что на изменение зависимой переменной может повлиять не только экспериментальное воздействие, но и специфические особенности выборки испытуемых. Этот эффект возникает, когда в экспериментальную и контрольную группы по не зависящим от исследователя причинам попали испытуемые, отличающиеся по определенным качествам.

Например, преподаватель хочет провести исследование на своих студентах и обещает за это поставить дополнительные баллы. Он делает объявление об этом в начале семестра, до проведения всех контрольных работ. Раньше всех на это приглашение откликнутся наиболее тревожные студенты, которые хотят подстраховаться на случай неудачи, недобора баллов на контрольной, а также наиболее мотивированные студенты, которым интересно самим испробовать на себе методы работы психолога. Позже, ближе к середине семестра, подтянутся те студенты, которые поняли, что предмет для них сложноват, что есть риск не набрать баллов на желаемую оценку. Самыми последними примут участие студенты, уже попробовавшие написать контрольную и понявшие, что без дополнительных баллов они не сдадут предмет.

Если преподаватель соберет всех студентов, пришедших первыми, в экспериментальную группу, а всех пришедших последними - в контрольную, то получит даже две побочные переменные. Испытуемые экспериментальной группы будут отличаться от контрольной не только наличием экспериментального воздействия, но и более высокой тревожностью и мотивацией участия в эксперименте. Поэтому исследователь не сможет сделать однозначного вывода, из-за чего изменилась зависимая переменная - в результате экспериментального воздействия или в результате различий в мотивации испытуемых.

Эффект отбора влияет не только сам по себе, часто он вступает во взаимодействие с другими эффектами. Так что если сама неэквивалентность групп не является побочной переменной, то в качестве последней может выступить взаимодействие отбора с другими эффектами. Взаимодействие отбора и эффекта взросления происходит, если в одну группу отбираются люди, которые быстрее или медленнее развиваются, утомляются, начинают испытывать голод и т.д., чем испытуемые другой группы. Допустим, участвовать в эксперименте преподавателя по формированию вторичного стресса в результате просмотра теленовостей первыми вызвались более тревожные студенты, а в контрольную группу были отобраны спокойные студенты. Тревожные студенты быстрее попадут под влияние вторичного стресса, но не потому что воздействие исследователя так эффективно, а потому что быстрее впадают в панику при встрече со стессором, чем спокойные студенты. Иначе говоря, не воздействие исследователя (просмотр теленовостей), а отбор испытуемых вкупе с эффектом взросления приводит к изменению зависимой переменной.

Взаимодействие эффекта отбора с эффектом истории может проявиться в том, что одно и то же событие окажет разное влияние на испытуемых разных групп. Например, исследователя интересует, влияет ли молчаливое присутствие преподавателя на успешность решения задач. Допустим, случайным образом в экспериментальную группу отобрались поклонники рок-музыки, а в контрольную - любители классики, т.е. произошел отбор испытуемых, который сам по себе не повлиял бы на исход эксперимента. Во время проведения эксперимента с улицы до испытуемых донеслись несколько тактов мелодии в стиле рок (случайное событие, которое по-разному скажется на членах двух групп). Это приведет к позитивным впечатлениям в экспериментальной группе и отсутствию таковых в контрольной. В результате нельзя будет сделать однозначный вывод о том, что именно повлияло па изменение качества решения - присутствие (отсутствие) преподавателя или позитивные впечатления, вызванные случайным событием (т.е. совместное действие эффектов отбора и истории).

Точно так же эффект отбора может вступать во взаимодействие с эффектом тестирования, если в одну группу отберутся испытуемые, более подверженные страху оценки и имеющие меньший опыт участия в психологических исследованиях, чем в другую. Эффект отбора и эффект инструментария могут привести к нарушению валидности, если в одну из групп отберутся испытуемые, па которых инструментарий дает меньше сбоев, а в другую - более сложные, критично настроенные или маргинальные испытуемые, на которых инструментарий дает больше сбоев.

Как возникает и как решается проблема неэквивалентности групп, лежащая в основе эффекта отбора, подробнее рассматривается в следующей главе при обсуждении межсубъектных экспериментальных планов. Здесь подчеркнем очевидное: чтобы проконтролировать нарушения внутренней валидности исследования из-за проблемы отбора и последующих проблем взаимодействия отбора и других эффектов, необходимо максимально уравнять экспериментальную и контрольную группы.

Эффект истощения (отсева) представляет собой такую угрозу внутренней валидности, когда испытуемые но каким-то причинам прекращают участие в исследовании между предварительным и заключительным тестированием. В результате перед исследователем встает вопрос: действительно ли изменение зависимой переменной от первого замера ко второму обусловлено действием независимой переменной, или результаты второго замера изменились, потому что часть людей выбыла, а оставшиеся обладают какими-то неизвестными исследователю общими психологическими особенностями, которые и повлияли на результат.

Ситуация, когда испытуемым не понравилось предварительное тестирование, они обиделись, разочаровались и ушли до завершения эксперимента, случается достаточно редко. Но если между предварительным и заключительным тестированием проходит достаточно времени для того, чтобы испытуемому и исследователю потребовалось встретиться несколько раз, то угроза эффекта истощения возрастает многократно.

Для того чтобы возник эффект истощения, не обязательно проводить продолжительные исследования, когда тех же самых испытуемых требуется разыскать через несколько месяцев. Простое опросное исследование на младших школьниках невозможно провести за один раз, если методики требуют от испытуемого усидчивости и внимания на протяжении более 40 мин. Для проведения всех методик исследователю придется встретиться со школьниками несколько раз. И в этом случае всегда возникает некоторое количество детей, которые заболели и по другим причинам не пришли в школу (произошло истощение выборки).

Дети, которые пройдут все методики такого исследования, отличаются, по крайней мере, лучшей посещаемостью школы по сравнению с теми, кто отсеялся. Лучшая посещаемость может быть связана с состоянием здоровья, более высокой мотивацией к учебе, лучшими отношениями с одноклассниками и т.д. Все это и есть возможные побочные переменные, которые возникают в результате отсева, смешиваются с экспериментальным воздействием и приводят к изменению зависимой переменной, в результате чего исследователь оказывается не в состоянии определить истинные причины ее изменения.

Контрольная группа могла бы помочь против эффекта истощения, если бы у исследователя были гарантии, что выбывание испытуемых происходит одинаково и равномерно, т.е. в экспериментальной и контрольной группах остаются психологически одинаковые испытуемые, а все остальные выбывают в обеих группах с одинаковой скоростью. Но, разумеется, таких гарантий нет. В разных группах выбывают разные люди и в разном количестве, и поэтому контрольная группа слабо спасает от эффекта истощения. Другой возможный способ борьбы - исключение из выборки результатов тех испытуемых, которые участвовали в первичном тестировании и не участвовали во втором. Но в этом случае к эффекту истощения добавится еще и эффект отбора испытуемых: исследователь сам в прямом смысле отберет из своих испытуемых только тех, кто по каким-то причинам прошел все исследование от начала до конца.

Очевидно, бороться с эффектом истощения сложно, так как если испытуемые не желают продолжать участие в исследовании, принуждать их к этому было бы как минимум неэтично. Можно снизить риск отсева, создавая дополнительную мотивацию для участия в исследовании. Такой мотивацией не обязательно является оплата; это может быть то, как исследователь представит важность результатов исследования, его конкретную пользу для людей вообще и испытуемых лично, затронет любопытство испытуемых к каким-то аспектам исследования и т.д. Главное, чтобы исследователь мотивировал испытуемых одинаково, чтобы различия в мотивации не выступили в качестве побочной переменной.

Также превентивной мерой отсева будет создание условий, чтобы испытуемому было удобно явиться на повторное исследование. Например, вероятность прихода па повторное исследование будет выше, если испытуемому не нужно специально ехать в лабораторию, если исследование проводится на месте его регулярного присутствия.

Таковы угрозы внутренней валидности. Их достаточно много, и разные способы построения исследования (экспериментальные планы) подвержены им в большей или меньшей степени. При планировании исследования автор обязательно должен учесть и проконтролировать влияние всех этих угроз, чтобы исследование не было напрасным, а по его результатам было возможно сделать надежные содержательные выводы о причинах исследуемых явлений. В табл. 11.2 кратко представлены все обсуждавшиеся выше угрозы внутренней валидности, характер их влияния, особенности исследования, повышающие вероятность их появления, и действия по их контролю.

Таблица 11.2

Угрозы внутренней валидности, особенности исследовательской процедуры, повышающие риск этих угроз, и способы их предотвращения

Особенности исследовательской процедуры, способствующие появлению аффекта

Способы контроля

Случайные, непрокон- тролированные воздействия на испытуемых между предварительным и заключительным тестированием

В любой процедуре возможно влияние этого эффекта

Использование контрольной группы

взросления

Общие изменения в личности испытуемых, не связанные с конкретным событием, между предварительным и заключительным тестированием

Молодой возраст испытуемых, смена условий их жизни, требующая быстрой адаптации, скорость смены функциональных состояний (усталость, голод и т.п.)

Использование контрольной группы

тестирова

Непривычность испытуемых к участию в исследованиях, желание показать себя с лучшей стороны, боязнь проявить свои недостатки

Использование методик, провоцирующих социально одобряемое поведение, исследование в ситуации оценки или конкуренции испытуемых (аттестация, экспертиза и т.п.)

Использование плана Соломона. Введение тренировочной серии

инструмен

Погрешности, неточности любых методик, используемых в исследовании

Процедуры исследования с новым, прежде не опробованным инструментарием или способами его использования

Использование надежного, психометрически выверенного инструментария.

Максимальная формализация процедуры исследования

Окончание табл. 11.2

Угроза внутренней валидности (побочная переменная)

Особенности исследовательской процедуры, способствующие появлению эффекта

Способы контроля

Регрессия к среднему

Ошибки в оценке психологических способностей и качеств при отборе испытуемых на основе однократного тестирования

Группы испытуемых отбираются на основе крайних показателей

Использование эквивалентной контрольной группы. Оценка изменений зависимой переменной относительно среднего

испытуемых

Неучтенные психологические различия между испытуемыми экспериментальной и контрольной группы

Все исследования, в которых распределение испытуемых по группам зависит не от исследователя, а от неконтролируемых обстоятельств

Использование всех возможных процедур уравнивания групп (см. главу "Типы экспериментальных планов")

истощения

Психологические различия между первоначальной выборкой (участвовавшей в предварительном тестировании) и пришедшей на заключительное тестирование

Все достаточно продолжительные исследования, в которых исследователь вынужден встречаться с испытуемыми неоднократно

Меры по предотвращению отсева испытуемых (мотивация, удобное место и время проведения и т.п.)

Внутренняя валидност ь связана с вопросом, действительно ли именно это эксперименталь­ное воздействие привело к изменениям в данном эксперименте?

Внутренняя валидност ь касается отношений между зависимыми переменными и независимыми переменными . Эта валидность связана с особым процедурами, которые позволяют определить, насколько выводы, сделанные в данном исследовании, достоверны. После того, как установлено существование зависимости между переменной X и переменной Y, необходимо решить, какая из переменных является причиной, а какая следствием, то есть определить направление данной взаимосвязи. Если Y наблюдается после X, то можно сказать, что X является причиной Y.

Однако может оказаться, что отношение зависимости между X и Y вызвано третьей переменной С. Для установления внутренней валидности необходимо рассмотреть все возможности влияния третьей переменной С на переменные X и Y и исключить их. Считается, что исследование обладает внутренней валидностью, если доказано, что существует зависимость причинно-следственного типа между зависимымипеременными и независимыми переменными .

Внешняя валидность относится к возможно­сти обобщения вывода на популяци и, ситуации, другие независимые переменные.

Эти два критерия являются важными, хотя часто они на­ходятся в противоречии друг с другом в том смысле, что увеличение валидност и одного типа может угрожать валидности другого типа. Идеалом является выбор таких экспериментальных планов, кото­рые обеспечивают оба типа валидности. Это особенно важно для психолого-педагогических исследований, где весьма желательным является распространение данных на практические ситуации, определенного характера.

Есть восемь различных клас­сов внешних переменных, относящихся к внутренней валидности. Если эти переменные не контролируются в экспериментальном плане, то они могут дать эффекты, которые смешиваются с эффектом экспериментального воздействия. Эти переменные представляют влияние:

1) фона - конкретных событий, которые про­исходят между первым и вторым измерением наря­ду с экспериментальным воздействием;

2) естественного развития - изменений испытуем ых, являющихся следствием течения вре­мени (не связанных с конкретными событиями), например взросление , усиление голода, усталости и т. п.;

3) эффекта тестирования - влияния выпол­нения заданий, применяемых для измерения, на резуль­таты повторного испытания;

4) инструментальной погрешности , нестабильности измерительного инструмента, при которой изменения в калибровке инструмента или изме­нения, характеризующие наблюдателя или оценочные показатели, могут вызвать изменения в результатах из­мерения;

5) статистической регрессии , имеющей место тогда, когда группы отбираются на основе крайних показателей и оценок;

6) отбора испытуемых - неэквивалент­ности групп по составу, вызывающей появление систе­матической ошибки в результатах;

7) отсева в ходе эксперимента - неравномерности выбывания испытуем ых из сравниваемых групп;

8) взаимодействий фактора отбор а с естественным развитием и др., которые в ряде квазиэкспериментальных планов с несколькими группами ошибочно принимаются за эффект эксперимен­тальной переменной.

К факторам, ставящим под угрозу внешнюю валидност ь, или репрезентативность эксперимента , относятся:

1) реактивный эффект , или эффект взаимодействия тестирования,- возможное уменьшение или увеличе­ние восприимчивости испытуем ых к экспериментальному воздействию под влиянием предва­рительного тестирования. Результаты лиц, прошедших предварительное тестирование , будут нерепрезентатив­ны по отношению к тем, кто не подвергался предвари­тельному тестированию, то есть тем, из кого состоит генеральная совокупность, из которых были отобраны испытуемые;

2) эффекты взаимодействия фактора отбор а и экс­периментального воздействия ;

3) условия организации эксперимента , вызывающие реакцию испытуем ых на эксперимент, которая не поз­воляет распространить полученные данные о влиянии экспериментальной переменной на лиц, подвергающихся такому же воздействию в неэкспериментальных усло­виях;

4) взаимная интерференция экспериментальных воздействий , нередко возникающая, когда одни и те же испытуемые подвергаются нескольким воздействиям, поскольку влияние более ранних воздействий, как пра­вило, не исчезает.

(См.: Хрестоматия. Кэмпбелл Д. Модели экспериментов в социальной психологии и прикладных исследованиях. М. Прогресс, 1980.)

Конец работы -

Эта тема принадлежит разделу:

Методы исследования в психологии

Раздел методы исследования в психологии.. тема современная методология научного познания.. методология научного познания постулат активного субъекта..

Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ:

Что будем делать с полученным материалом:

Если этот материал оказался полезным ля Вас, Вы можете сохранить его на свою страничку в социальных сетях:

Все темы данного раздела:

Основные постулаты современной теории познания
Традиционно в рамках психологической проблематики выделяются две наиболее общие темы: - исследование мотивационных процессов (мотивационно-потребностная сфера деятельности; в терминологии

Розовые очки
Предположим, все люди стали носить розовые очки, которые пропускают только розовый цвет. Соответственно, и сам мир уже не сможет описываться ими ни в каких других цветах, кроме розового. Правда, по

Зарождение понятий «идиографический» и «номотетический»
Чтобы представить себе основные рамки, в которых развивалась «классическая» наука (проявившая себя, прежде всего, в связи с научной революцией Нового времени), рассмотрим несколько эпизодов развити

Проблема мерок в психологии
Чтобы увидеть возможность такого разведения понятий, стоит обратиться – в самом общем виде – к марксисткой философии, на которой строятся культурно-историческая психология Л.С. Выготс

Каменный топор
Для того чтобы познать свойства предметов, надо попытаться на них воздействовать и зафиксировать, что в результате этого воздействия с ними происходит. Отправной точкой подобного анализа вещей прир

Зарождение интроспекции
Основные закономерности самонаблюдения были сформулированы в рамках субъективной, или интроспективной (от лат. introspecto - смотрю внутрь), психологии

Виды интроспекции
В процессе развития интроспекционистской психологии, в частности, были разработаны такие виды интроспекции, как: - аналитическая интроспекция; - систематическая интроспекция;

Сущность наблюдения
Другой базовый метод психологии – наблюдение. Психология, как и любая другая объективная наука, собственно и начинается с наблюдения, т.е. с непосредственного восприятия действитель

Вехи развития метода наблюдения в психологии
Метод наблюдения часто применялся в период зарождения экспериментальной психологии, наиболее активно - в рамках возрастной психологии. При этом многие ученые, наблюдавшие за развитием своих детей,

Основные параметры наблюдения
Метод наблюдения, который используется, в основном, в генетической психологии (возрастной психологии и зоопсихологии), в отличие от экспериментального метода, не предполагает манипуляцию независ

Общая процедура наблюдения
Общая процедура наблюдения складывается из следующих процессов (см. [Ядов В.А. Социологическое исследование: методология, программа, методы. М.: Наука, 1987, с. 110-166]): - определение за

Объект наблюдения
Объект наблюдения определяется в контексте исследовательской программы и зависит от гипотез, эмпирических индикаторов выделенных понятий, стратегий исследования в целом. План

Типы выборок
Существуют различные типы выборок, используемых при наблюдениях. Неструктурированная выборка – это такая выборка, в которой не накладываются никакие ограничения на

Виды наблюдения
Классификация наблюдений производится по различным основаниям. Еще в 1982 г. Байли предложил классификацию различных типов наблюдения на основании двух критериев: - степени структ

Простое, или бесструктурное, наблюдение
При отсутствии четких гипотез, применяют неконтролируемое наблюдение. Его цель - обеспечить выдвижение гипотез для более строгого описания наблюдаемого объекта. Здесь

Контролируемое, или структурное, наблюдение
Впервые метод контролируемого наблюдения использовал американский социальный психолог Р. Бейлз в 1950 г. для изучения последовательных фаз групповой деятельности. Составле

Естественное наблюдение
При естественном наблюденииизучается поведение людей (или животных) в естественных для них условиях. Наблюдение в естественных условиях предполагает проведение исследования таким о

Невключенное и включенное наблюдение
По позиции исследователя наблюдения, проводимого с целью описания поведения, можно различать невключенное наблюдение (или этологическое (см. рис. 30)) и включенное наблюдение (или этнографич

Невключенное наблюдение
Невключенное наблюдениепроводятся в естественных условиях путем подробного и объективного описания происходящего. Такое наблюдение проходит без наблюдателя – обычно он прячется и н

Включенное наблюдение
При включенном наблюдении исследователь является участником происходящего и пытается добиться приема в группу. Члены группы знают, что за ними ведется наблюдение. Наблюдател

Отсутствие контроля
При наблюдении, как правило, нет контроля над ситуацией, когда наблюдатель имеет возможность на нее воздействовать. Поэтому основанные на наблюдениях выводы должны делаться с большой осторожностью.

Влияние наблюдателя
Существенная проблема наблюдений - искажения, вносимые наблюдателем. Под этим подразумевается наличие предвзятого мнения об объекте, наблюдение через призму этого мнения. Искажение может поя

Место наблюдения среди других методов сбора данных
Наблюдение - исследовательский метод, представляющий собой выявление определенных характеристик того или иного процесса, имеющий целью определение его инвариантных признаков, без активного включени

Вербальные и невербальные компоненты коммуникации
Наиболее важной и разработанной областью психологического наблюдения является наблюдение за внешними, телесными проявлениями эмоциональных процессов. Современный подход к анализу экспресси

Экспрессивные проявления эмоциональных реакций и состояний
В наблюдении за поведением, как уже говорилось, особую роль играют эмоциональные маркеры. Иногда эмоциональные реакции (аффекты) бывают бурными и внезапными, возникая почти сразу после дей

Идентификация мимического выражения
Исследование мимического выражения эмоций началось еще в XIX в. Еще в 1859 г. немецкий анатом Пидерит сформулировал положение, согласно которому мимическое выражение можно охарактеризовать при помо

Универсальное и уникальное в лицевой экспрессии
Когда исследователю приходится долго общаться с человеком, то определяется, что такое-то выражение лица означает у него раздражение, тогда как другое - восторг: помимо общего языка эмоций, необходи

Комплексное наблюдение жестов и поз
При осуществлении наблюдения важно интерпретировать жесты и позы в их единстве, в контексте целостного невербального сообщения. Так, человеку, испытывающему тревогу, свойс

Особенности наблюдения в психотерапевтической беседе
В рамках психотерапевтической беседы закономерно открывается возможность для включенного наблюдения. Для того чтобы оказывать позитивное воздействие на клиента при проведении психотерапевт

Взаимодействие между вербальным сообщением и невербальными коммуникациями
Взаимодействие между источником сообщения и уровнем осознавания описывается в шести категориях невербального поведения. Это: - выделение, - фасилитация, - изображение,

Сущность метода анализа документов
Часто для проверки гипотез исследования используется ранее зафиксированная информация, например в виде текстов. При этом исследования документов часто являются частью более крупных исследова

Виды документов в рамках метода исследований документов
По способу фиксирования информации различают: рукописные и печатные документы; записи на кино- или фотопленке, на магнитной ленте. С точки зрения целевого назначения выделяются материалы,

Контроль надежности при анализе документов
Достоверность информации из личных документов определяется множеством факторов. Это - проверка подлинности документа, анализ мотивов, побуждений, условий его составления, целевой установки автора,

Оценка метода исследований документов
Анализ документов - важный метод сбора информации в психологическом исследовании, служащий прежде всего для выдвижения гипотез и общего определения темы, а также на стадии работы по тому или

Качественный и количественный подход к анализу документов
Качественный анализ документов - необходимый этап в анализе документов. В некоторых случаях на нем исследование и заканчивается, не переходя к количественному этапу. В как

Сущность контент-анализа
Рассмотрим более подробно количественный подход к анализу документов, т.к. именно он позволяет получить наиболее надежные данные. Часто в исследованиях документов требуется не прост

Основные элементы контент-анализа
Контент-анализ начинается с выявления смысловых единиц, в качестве которых могут использоваться: понятия, темы, имена и т.п. Понятия, выраженные в словах и отдельных терминах (част

Процедуры подсчета при контент-анализе
В общем виде процедуры подсчета при контент-анализе аналогичны стандартным приемам классификации по выделенным группировкам, ранжирования и шкального измерения. Например, при изучении тематики газе

Надежность процедуры контент-анализа
Надежность информации, получаемой контент-анализом, обеспечивается следующими способами. Обоснование полноты объема выделяемых смысловых единиц. Первоначальн

Сущность опроса
Метод опроса основывается на простой идее: если надо узнать, что думают люди на определенную тему, следует просто спросить их об этом. Опрос - это структурированный сборник вопросо

Интервью
Интервью - беседа, проводимая по определенному плану, предполагающая прямой контакт интервьюера (опрашивающего) с респондентом (опрашиваемым; от лат. responsare - отвечать).

Виды интервью
Имеется множество разновидностей интервью. По содержанию беседы различают: - так называемые документальные интервью (изучение событий прошлого, уточнение фактов), - интервью мнени

Телефонный опрос
Данный тип опроса основан на отборе номеров телефонов и обзванивании людей. Очевидным преимуществом телефонного опроса является более низкий объем затрат на его проведение по сравне

Письменный опрос
Письменный опрос, или анкетирование (от фр. anquete – список вопросов) - метод исследования, основанный на получении от респондентов ответов (как правило письменных, но также возмо

Виды анкет
Анкетные опросы классифицируются, прежде всего, по содержанию и конструкции задаваемых вопросов. Анкеты различаются по формулировкам вопросов. Так, вопросы могут быть открытыми или закрыты

Опрос по почте
Опрос по почте отличают от очного анкетирования на месте: - в первом случае ожидается возвращение опросного листа (например, по заранее оплаченному почтовому отправлению),

Общая оценка возможностей метода опроса
При изучении субъективных состояний людей, мотивации, мнений и отношений к событиям метод опросов имеет существенные преимущества перед другими методами сбора эмпирических данных. Так,

Выборка
Чтобы результаты опроса были валидными, выборка должна отражать особенности популяции, т. е. должна быть репрезентативной. В методе опроса адекватность сделанных выводов напрямую зави

Разработка вопросов для респондентов
Надежность данных существенно зависит не только от содержания планируемой информации, но, конечно, и от конструкции самого вопроса, целесообразность которой диктуется конкретной задачей и ус

Лексика опроса
В массовых опросах слишком трудный и, значит, малопонятный для респондентов язык - недопустим. Но подлаживание под стилистику определенной группы аудитории также приносит мало пользы (см. [Ядов В.А

Лексика опроса экспертов
Если проводится экспертный опрос, то в качестве опрашиваемых выступают специалисты. Для экспертных опросов тщательным образом отбирают только тех, кто заслуживает статуса компетентного лица в данно


Вопросы на мотивацию, оценки и мнения представляют наиболее сложную часть процедуры опроса. При составлении вопросов анкеты следует руководствоваться следующими соображениями: 1. Особенно

Проведение анкетного опроса
Анкета заполняется опрашиваемым самостоятельно, поэтому ее конструкция и все комментарии должны быть предельно ясны для респондента. Основные принципы построения анкеты состоят в следующем

Пилотажное исследование
Любой исследовательский инструмент проходит проверку на его обоснованность. Для этого используется пилотажное исследование. В обычном "пилотаже" исследова

Экспертный опрос
Опрос специалистов - особая разновидность метода опроса. Такие опросы не анонимны, исключают "ловушки", так как предполагают активное сотрудничество опрашиваемого в выяснении поставленных

Особенности интервьюирования
Идеальное интервью напоминает оживленную и непринужденную беседу двух равно заинтересованных в ней людей. Но интервьюер помнит, что в данной ситуации он выступает как профессиональный

Сущность фокус-групп
В рамках социальной психологии и психологии личности в последнее время особенное распространение получил метод фокус-групп, который может рассматриваться как форма беседы (см. [Дмитриева Е.

Этапы проведения фокус-групп
Проведение фокус-групп предполагает три этапа: - на первом, подготовительном, этапе определяется цель, объект и предмет исследования, проводится подготовка исследовательской команды

Подготовка исследовательской команды
На первом этапе проводится обучение исследовательской команды. Такая команда состоит из: - исследователя, ведущего фокус-группы (модератора), - стенографистов,

Определение числа и размера фокус-групп
На число участников проведения фокус-группы влияет несколько факторов: 1. Так как получаемые с помощью фокус-группы данные носят описательный характер и не представляют сведе

Выбор темы
Исходя из пределов психологической вовлеченности в дискуссию, участники фокус-группы проявляют к ней интерес в течение не более чем полутора, максимум двух часов, а в более длительном обсужд

Написание плана для фокус-группы
Если проведение фокус-группы происходит по заранее написанному план, то такая группа обозначается формализованной фокус-группой. План начинается с формулировки прив

Типология вопросов
Существуют различные классификации вопросов в фокус-группе: по степени важности, формализованности, очередности появления в дискуссии и т.д. По степени важности выделяются следующие

Роль ведущего в фокус-группе
В ходе полевого исследования большое значение приобретает роль ведущего фокус-группы. Им может быть исследователь, организующий работу и интерпретирующий результаты, а также специально пригл

Форма проведения и организация фокус-групп
Фокус-группа начинается со знакомства, представления ведущего, исследовательской команды, участников, описания цели исследования и продолжительности работы. В ходе знакомства респондент обыч

Сущность метода беседы
В отличие от опросов, проводимых с помощью интервью или опроса, беседа, которая также реализуется на основе вербальных взаимоотношений между людьми, ориентирована, прежде всего, на личность

Виды беседы
Наибольшее распространение получили: - клиническая беседа, или клиническое интервью, организованная вокруг болезненных переживаний пациента (см. ри

Умение слушать активно
Для эффективного взаимодействия с испытуемым или клиентом психотерапевтического сеанса психологу чрезвычайно важно уметь «слушать активно». Умение «слушать активно» предполагает сле

Вехи развития метода беседы в психоанализе
В основе использования беседы, как метода психологического исследования, лежат богатые традиция развития рациональной терапии в психиатрии. Особую роль в развитии метода убеждения, как одн

Суть структурного интервью
Проведение беседы в рамках психотерапии и психоанализа имеет ряд особенностей. Одна из техник носит название структурного интервью [Кернберг О. Структурное интервью // Журна

Начальная фаза структурного интервью
Психотерапевтическая беседа начинается с того, что клиенту предлагают кратко рассказать о: - причинах, заставивших его обратиться к психотерапевту, - ожиданиях в отношении психоте

Основная фаза структурного интервью
Главным предметом структурного интервью является исследование патологических черт характера, что важно не только для того, чтобы оценить тип характера, но и для оценки степени тяжести этих н

Заключительная фаза структурного интервью
Закончив исследование невротических симптомов и патологических черт характера, оценив основные механизмы защиты, чувства реальности и ключевые симптомы психозов или органических нарушений, психотер

Шкалирование в экспериментальной психологии
Как уже было сказано, естественнонаучная методологическая установка в психологии проявляется, прежде всего, в двух ориентирах. Во-первых, - в надежном выявлении тех или иных психологических феномен

Основы психофизики
Впервые проблема порога ощущений была поставлена И.Гербартом (1776 - 1841) (см. рис. 38), немецкий философом, психологом и педагогом, основоположником эмпириче

Многомерное шкалирование
Психологу в настоящее время доступно то, что ранее считалось прерогативой лишь идеографического подхода. Речь идет о применении математических процедур, с помощью которых могут обрабатываться, напр

Использование измерительных инструментов в психологии
Беседа и наблюдение, как правило, осуществляется непосредственно, без использования каких-либо специальных средств фиксации и классификации выявляемых психологических феноменов. Но, в отличие от ни

Сцинтиграфия головного мозга
Физическая сущность: метод основан на способности специальных радиоактивных химических веществ концентрироваться в патологически измененной ткани в большем количестве, чем в нормал

Однофотонная эмиссионная компьютерная томография
Физическая сущность: метод основан на послойной визуализации распределения специальных радиоактивных химических веществ (церетек) в головном мозгу. Данные вещества вводятся

Позитронно-эмиссионная томография
Физическая сущность: метод основан на регистрации чрезвычайно малых концентраций ультракороткоживущих радионуклидов, которыми помечаются мозговые структуры, чей метаболизм исследуе

Некоторые данные, иллюстрирующие возможности компьютерной томографии
1. Исследован мозг пациентов, страдающих тяжёлой формой депрессии. Зафиксировано повышение метаболизма участков мозга, ответственных за производство стрессовых гормонов. После приёма пациентами пре

Сущность психологической диагностики
Психологическая диагностика, или психологическое тестирование (от англ. test - испытание, исследование), представляет собой научную дисциплину о методах классификации индивидов по присущих и

Задачи психологического тестирования
В рамках классической теории тестирования сформулированы базовые процедуры оценки качества разработанного психодиагностического инструмента. Основными характеристиками эффективных личностных опросн

Виды психологического диагноза
На основании различий в степени понимания внутренних закономерностей того или иного психологического признака выделяют следующие виды психологического диагноза: - симптоматический, или эмп

Использование шкал в психологической диагностике
В основе классической теории тестирования лежит понятие субъективного шкалирования, что подразумевает применение количественных показателей для определения количественной выраженности тех или иных

Систематика психологических тестов
Тест (от англ. test - испытание, исследование) - экспериментального средство исследования, которое представляет собой стандартизированную процедуру психологического измерения на ос

Личностные опросники
Личностные опросники - группа психодиагностических методик, предназначенных для определения степени выраженности у индивида определенных личностных особенностей. Они характеризуются наличием набора

Планирование этапов разработки личностного опросника
Конструирование личностного опросника предполагает прохождение ряда этапов. Это следующие этапы: 1. Теоретический анализ, на основании которого строится психологический конструкт, как теор

Разработка психологического конструкта
Методологические подходы в психодиагностике личности в значительной мере предопределяют, какие аспекты эмпирических проявлений личности необходимо задействовать в создаваемых личностных опросниках

Разработка психологического конструкта на основе теоретического анализа
Данный путь является наиболее распространенным и в настоящее время признан обязательным при разработке любых личностных опросников. Сначала изучается специальная литература, касающаяся сод

Разработка психологического конструкта на основе корреляционных исследований
Использование статистики, в том числе на основе выявления различных корреляционных связей, является обязательным при конструировании любых тестов. То, что статистические процедуры и, в первую очере

Разработка психологического конструкта на основе критерия
Совершенно другой подход, чем при факторном анализе, реализуется при построении личностного опросника при использовании внешнего критерия. Наиболее отработана стратегия определения внешних критерие

Операционализация психологического конструкта
После того, как оказался решенным решить вопрос о содержательном наполнении конструируемого опросника, намечается план проверки закладываемого в личностный опросник конструкта. Как

Выбор основной области локализации самооценочных суждений
На основе описаний, взятых из психологической литературы, на основе ранее проведенных эмпирических исследований, на основе оценок экспертов и т.д. должна быть получена вербализация тех или иных пси

Правила формулирования пунктов личностного опросника
При формулировании заданий личностного опросника можно следовать следующим правилам. 1. В большинстве случаев необходимо, по возможности, избегать проникновения испытуемых в суть то

Выбор шкалы ответов на пункты опросника
Отдельной задачей конструирования личностного опросника выступает формулирование содержательных ответов на его пункты и выбор соответствующей шкалы ответов. Всего существует два типа опрос

Экспертиза психологического конструкта
После того, как все пункты личностного опросника оказались сформулированы и составленный список всех пунктов выстроен по порядку, может быть проведена экспертиза опросника, которая выступает отдель

Методы анализа интерпретаций опросника испытуемым
Первая группа таких методов предполагает дополнительные вопросы испытуемому. От него требуется сказать, как он понимает конкретный пункт и формулируют на него ответ, т.е. отрефлексировать пр

Нормативная и пилотажная выборки
Одним из наиболее важных решений при конструировании опросника является вопрос в выборке испытуемых, которые проводятся через процедуру психологической диагностики. Как прави

Нормативная выборка
В статистике различают выборку (группу, которая реально подверглась тестированию) и популяцию (более широкую группу, но имеющую тот же состав, что и выборка, на которую могут быть пер

Пилотажная выборка
Пилотажное исследование - пробное предварительное исследование, проводимое, как правило, на небольшой выборке, служащее уточнению адекватности использования тех или иных исследователь

Оценка итогового балла отдельной шкалы
Дискриминативность теста - психометрическая характеристика теста, представляющая собой его способность устанавливать различия между испытуемыми. Чем более высокий уровень имеет дискри

Оценка отдельного пункта шкалы: уровень трудности
Одним из основных решений, которые принимаются при конструировании личностных опросников, является решение о эффективности использования конкретного пункта опросника. Это зависит как от ег

Оценка уровня трудности пункта при дихотомической шкале ответов
Если речь идет о дихотомической шкале ответов на пункты опросника, то по каждому из этих пунктов может быть получено два числа: процент ответивших «да» на данный пункт (или давших другой аналогичны

Оценка уровня трудности пункта при шкале ответов Лайкерта
Обычно для пунктов личностного опросника используется шкала ответов Лайкерта. Поэтому может быть получено распределение ответов на конкретный пункт опросника следующего типа: «очень часто» =

Надежность тестирования
Надежность теста - психометрическая характеристика теста, представляющая собой воспроизводимость результатов измерения в аналогичных условиях. Она показывает, в какой степени индивиду

Объем и состав выборки
Поскольку стандартная погрешность коэффициента корреляции, служащего для оценки надежности, связана с объемом выборки, на которой она получена, то должны использоваться достаточно бол

Методы определения надежности опросника
Существует два основных метода определения надежности опросника. На основании однократного тестирования может быть определена внутренняя согласованность, которая рассчитывается по формуле

Внутренняя согласованность
В рамках традиционной психометрии тест называется надежным, если он является внутренне согласованным. Внутренняя согласованность – это степень однородности состава заданий с точки зрения измеряемог

Вычисление показателя внутренней согласованности для каждого пункта опросника
Внутренняя согласованность может определяться корреляцией между итоговым баллом по шкале опросника и каждого отдельного ее пункта. На основании расчетов внутренней согласованности всех пун

Вычисление показателя внутренней согласованности для каждого пункта опросника при факторном анализе
При использовании факторного анализа при конструировании опросника существует своя специфика в определении надежности по критерию внутренней согласованности. Так, для получения показателя

Вычисление показателя внутренней согласованности для всей шкалы
Когда вопрос о сильно и слабо коррелирующих со итоговой шкалой пунктах уже решен, т.е. стало понятно, какие пункты работают на шкалу, а какие нет, рассчитывается показатель внутренней согласованнос

Ретестовая надежность
Ретестовая надежность представляет собой согласованность результатов, полученных одним и тем же индивидом при повторном тестировании тем же самым тестом (или его эквивалентной формой).

Расчет ретестовой надежности
При расчете ретестовой надежности определяется коэффициент корреляции между результатами по всему опроснику, полученными на одних и тех же испытуемых, но в разное время (r

Надежность параллельных форм
Подвидом ретестовой надежности является надежность параллельных форм. При этом предполагается тестирование с определенным временным интервалом одной и той же выборки с п

Валидность тестирования
Валидность (происходит от англ. valid - имеющий силу) теста - психометрическая характеристика, представляющая собой действительную способность теста измерять тот психологический конструкт, д

Очевидная валидность
Очевидная валидность не является в собственном смысле психометрическим показателем теста, она характеризует лишь впечатление о тесте, как о чем-то понятном, «прозрачном». Это - способность т

Содержательная валидность
Содержательная валидность свойственна тестам, которые полноценно моделируют ту или иную деятельность, прежде всего в ее предметном аспекте. Т.е. в самом содержании теста отражены ключевые ст

Критериальная валидность
Критериальная валидность определяется с единственной, крайне важной для практики, целью: оценить индивидуальную прогностичность теста. Для этого результаты выполнения теста сопоставляются с

Расчет критериальной валидности
Наилучшим и самым простым способом определения критериальной валидности является вычисление дихотомической корреляции (есть признак – нет признака) между итоговом баллом по шкале и принадлеж

Критериальная валидность отдельных пунктов опросника
Критериальная валидность может рассчитываться не только в отношении всей шкалы опросника, но и в отношении каждого ее пункта. При этом, если личностный опросник создается только на

Прогностическая валидность
Особым видом критериальной валидности является прогностическая валидность, которая может быть получена при сравнении тестовых оценок с внешним (прагматическим) критерием, который испо

Конструктивная валидность
Конструктивная валидность, обоснованная в 1955 г. Л.Кронбахом, дает информацию о степени способности к измерению тестом такой черты, которая была выделена теор

Конкурентная валидность
Конкурентная валидность оценивается по корреляции результатов данного теста с результатами других аналогичных тестов, валидность которых установлена ранее. Эта процедура имеет смысл в

Экспертная эмпирическая валидиность
Особое значение имеет эмпирическая валидность, основанная на сравнении итоговых баллов по шкале опросника с оценками испытуемых экспертами. Эмпирическое значение коэффициента

Расчет валидности тестирования
Количественно валидность теста может выражаться через корреляции результатов, полученных с его помощью, с другими показателями, например, с прагматическим критерием, в частности, с успешност

Основные положения факторного анализа
В основе факторного анализа лежит гипотеза о том, что непосредственно наблюдаемые переменные (например, признаки поведения) лишь косвенно отражают сущность изучаемого явления. По

Методы факторного анализа
Существует два основных метода факторного анализа: в одном из них выделяются коррелированные факторы (облическое решение, использованное, например Р.Б.Кеттелом для ст

Требования при проведении факторного анализа
1. Выборка должна быть представительной, чтобы оценки коэффициентов парной корреляции матрицы были надежными. Так, объем выборки при факторном анализе должен быть не менее 100 испытуем

Нормализация показателей
Для того, чтобы личностным опросником можно было пользоваться практически, т.е. делать на основании его заполнения произвольно взятым испытуемым прогноз его поведения в новых ситуация

Линейные и нелинейные преобразования сырых значений шкалы
Стандартные показатели могут быть получены как линейным, так и нелинейным преобразованием первичных показателей. Линейные преобразования получаются вычитанием из первичного показателя константы и д

Требования к личностному опроснику
При подготовке к публикации личностного опросника необходимо выполнить ряд требований. 1. Должны быть однозначно сформулированы предмет, область и цели применения теста. Предмет, как диагн

Описание личностного опросника
Структура описания психодиагностической методики для публикации имеет следующий вид: 1. Предмет и целевая популяция: - общественная значимость (социальная потребност

Сущность эксперимента в психологии
Суть экспериментального метода заключается в том, что экспериментатор намеренно создает и контролируемым образом изменяет условия, в которых действует изучаемый испытуемый, ставит перед ним

Ограничения экспериментального метода
В целом, эксперимент - часть исследования, в которой исследователь осуществляет манипулирование переменными, и наблюдает эффекты производимые этим воздействием на другие переменные. Экспер

Виды естественного эксперимента в различных исследовательских областях
Одним из вариантов естественного эксперимента является психолого-педагогический эксперимент, или экспериментальное обучение, где изучение психических особенностей школьника, подлеж

Проведение экспериментов
Экспериментальный метод имеет особые преимущества, отличающие его от других методов исследования. Прежде всего, это - возможность экспериментатора манипулировать одной или несколькими переменными,

Вероятностная выборка
Эта стратегия используется, если поставлена задача узнать что-либо конкретное об определенной группе людей. Группа в целом называется популяцией,а любая из ее подгрупп назыв

Ход эксперимента
Экспериментальное исследование в целом характеризуется тремя фазами. В первой фазе имеется пред-тест: одна или две переменные измеряются до применения экспериментального в

Экспериментальные планы
В экспериментальном исследовании может быть одна или более независимых переменных. Если имеется только одна независимая переменная, то эта переменная должна иметь, по

Виды валидности
Эксперименты являются средством проверки гипотез о причинности. По традиции предполагается, что существуют три необходимых условия для утверждения с определенной долей уверенности о том, что

Достоверность экспериментальных данных
Процесс измерения является тем более достоверным, чем слабее влияние случайных факторов и чем более постоянные результаты он дает. При создании методов, предназначенных для измерения переменных хар

Валидность
Оценивается, измеряется ли рассматриваемая характеристика или, напротив, измерение отражает влияние других факторов. Валидность инструмента измерений оценивается в зависимости от степени соо

Валидность исследования
Валидность исследования относится к установлению точности выводов исследования и подчеркивает относительный характер истины, которой возможно достичь в психологии. В любом научном исследован

Валидность статистических выводов
Этот тип валидности соответствует проверке статистической значимости зависимости между двумя переменными. Такие выводы всегда являются вероятностными. При этом можно совершит

Валидность процедур
Третий тип валидности – это валидность процедур, которые позволяют варьировать и измерять переменные. Даже необходимость определить в операциональных терминах концептуальные переменные, знач

Различают несколько основных методов контроля
Одним из наиболее часто используемых методов контроля является проведение эксперимента с группой испытуемых, которые не подвержены влиянию исследуемой переменной и которые сравниваются с исп

Квазиэкспериментальные схемы
Сам термин «квазиэкспериментальная схема» был введен в 1966 г. Кэмпбеллом и Стэнли. Под квазиэкспериментальными схемами понимаются схемы, в которых не применяется метод случ

Предэкспериментальные схемы
Предэкспериментальные схемы исследования так же, как и квазиэкспериментальные, не предусматривают случайного отбора испытуемых в экспериментальные группы. Это - схема

Корреляционный метод
С помощью корреляционного метода изучается отношение между двумя переменными, не опосредованное вмешательством исследователя. Таким образом, отсутствуют какие-либо манипуляции переменными, изучаетс

Методологические подходы к анализу личности в различных психологических школах
Личность в психологии рассматривается как относительно устойчивая система установок и поведения индивида, которая характеризуется, прежде всего, особенностями включенности данного индивида в социал

Интроспективный подход
Еще 1734 г. Х.Вольф дал следующую дефиницию: «Личность - то, что сохраняет воспоминания о самом себе и воспринимает себя, как одного и того же и раньше, и теперь». Эт

Психодинамический подход
Совершенно другая модель личности, важная в контексте обсуждаемой проблемы психодиагностики, была разработана в глубинной психологии, прежде всего в психоанализе (З.Фрейд

Поведенческий подход
Собственно интроспективный и психодинамический подходы существенно сближаются друг и другом, если обращать внимание на ту роль, которая в них приписывается интроспекции. Наоборот, в модели л

Физиологический подход
Особым направлением, по своим истокам достаточно тесно связанным с бихевиоризмом, является биологическая, или физиологическая, психология (см. рис. 76). Здесь также в основу анализа личности кладут

Гуманистический подход
В рамках гуманистической психологии, где личность рассматривается, преимущественно, как принимающая ответственные решения в конкретных ситуациях своей жизни, чаще всего делается заключение о том, ч

Деятельностный подход
В марксистской психологии личность определяется как результат исторического развития индивида, которое осуществляется, прежде всего, в рамках совместной трудовой деятельности (А.Валло

Интеграция методологических подходов к анализу личности
В настоящее время существуют все предпосылки для того, чтобы в анализе личности использовать все достижения психологии, полученные вне зависимости от исходной методологии. Так, безусловно необходим

  • - См. Валидность...

    Большая психологическая энциклопедия

  • - В. в. относится к степени уверенности, с к-рой можно судить о предполагаемой каузальной связи между переменными...

    Психологическая энциклопедия

  • - - соответствие теста целям диагностики...

    Педагогический терминологический словарь

  • - англ. validity; нем. Validitat/Gulltigkeit. Обоснованность и адекватность исследовательских инструментов...

    Энциклопедия социологии

  • - англ. validity, empirical; нем. Validitat, empirische. Степень соответствия переменных и индикаторов эмпирическим данным...

    Энциклопедия социологии

  • - англ. validity, logical; нем. Validitat, logische. Степень взаимосвязи и взаимной выводимости переменных и индикаторов...

    Энциклопедия социологии

  • - от фр. valide в статистике - законность и достоверность исходной информации, надежность методики сбора, получения данных, в том числе и для экономических исследований...

    Словарь бизнес терминов

  • - Степень соответствия переменных и индикаторов эмпирическим данным...

    Словарь бизнес терминов

  • - Вид теоретической валидности, выражающийся в корреляции...

    Словарь бизнес терминов

  • Большой экономический словарь

  • - применительно к исходной статистической информации, используемой в экономических исследованиях: надежность информации, отсутствие в ней ошибок из-за неточности выбранной методики сбора данных...

    Экономический словарь

  • - вал"...

    Русский орфографический словарь

  • - вали́дность ж. Отсутствие ошибок, связанных с определением исходных посылок при разработке методики исследований; надежность информации...

    Толковый словарь Ефремовой

  • - ВАЛИДНОСТЬ и, ж. validité f. <лат. validus. Действительность, законность, весомость, обоснованность; обладание юридической силой. Комлев 1992. || Способность образовать связную знаковую систему...

    Исторический словарь галлицизмов русского языка

  • - 1) весомость, обоснованность; 2) действительность, законность; обладание юридической силой...

    Словарь иностранных слов русского языка

  • - ...

    Словарь синонимов

"Внутренняя валидность" в книгах

4. Правдивость и валидность

Из книги Способы создания миров автора Автор неизвестен

Валидность (Validité)

Из книги Философский словарь автора Конт-Спонвиль Андре

Валидность (Validit?) Употребляемый в логике синоним истины, точнее говоря, ее формальный эквивалент. Вывод считается валидным (верным), если представляет собой переход от истинного к истинному (от истинности посылок к истинности заключения) или остается верным независимо от

НАДЕЖНОСТЬ И ВАЛИДНОСТЬ

Из книги Психология автора Робинсон Дейв

НАДЕЖНОСТЬ И ВАЛИДНОСТЬ Родители Эми обеспокоены тем, что она читает не так хорошо, как складывает и вычитает числа. После обсуждения этого вопроса с ее учителем они решили показать Эми психологу. Психолог предложил девочке пройти тесты, которые должны выяснить ее

Валидность или достоверность

Из книги автора

Валидность или достоверность важнейший критерий качества измерений, обозначающий, что метод, методика или тест измеряет то, для чего он предназначен, т. е. меру соответствия использованного инструментария и полученных результатов поставленным задачам. Данный критерий

Валидность

Из книги Разгони свой сайт автора Мациевский Николай

Валидность Получившийся таким образом CSS-файл абсолютно валиден (так как все mhtml-вставки происходят в комментариях). Каждое CSS-объявление валидно с точки зрения CSS 2.1, и те небольшие приемы, которые позволяют эффективно сжать данные для всех браузеров, не отражаются на

3. Факторная валидность

автора Лучинин Алексей Сергеевич

3. Факторная валидность Факторная валидность. Прямое отношение к характеристике конструктной валидности имеет факторный анализ, позволяющий строго статистически проанализировать структуру связей показателей исследуемого теста с другими известными и латентными

4. Дифференциальная валидность

Из книги Психодиагностика: конспект лекций автора Лучинин Алексей Сергеевич

4. Дифференциальная валидность Дифференциальная валидность – вид конструктной валидности, рассматривающей внутренние взаимоотношения между психологическими факторами, диагностируемыми с помощью психодиагностической методики. Содержание дифференциальной

2. Очевидная валидность

Из книги Психодиагностика: конспект лекций автора Лучинин Алексей Сергеевич

2. Очевидная валидность Очевидная валидность – представление о тесте, сфере его применения, результативности и прогностической ценности, которое возникает у испытуемого или другого лица, не располагающего специальными сведениями о характере использования и целях

24. Факторная валидность

автора Лучинин Алексей Сергеевич

24. Факторная валидность Факторная валидность. Прямое отношение к характеристике конструктной валидности имеет факторный анализ, позволяющий строго статистически проанализировать структуру связей показателей исследуемого теста с другими известными и латентными

25. Дифференциальная валидность. Валидность по возрастной дифференциации

Из книги Психодиагностика автора Лучинин Алексей Сергеевич

25. Дифференциальная валидность. Валидность по возрастной дифференциации Дифференциальная валидность – вид конструктной валидности, рассматривающей внутренние взаимоотношения между психологическими факторами, диагностируемыми с помощью психодиагностической

26. Критериальная валидность

Из книги Психодиагностика автора Лучинин Алексей Сергеевич

26. Критериальная валидность Критериальная валидность – комплекс характеристик, включающий текущую и прогностическую валидности методики и отражающий соответствие диагноза и прогноза определенному кругу критериев измеряемого явления. В качестве критерия

29. Прогностическая валидность

Из книги Психодиагностика автора Лучинин Алексей Сергеевич

29. Прогностическая валидность Прогностическая валидность – информация о том, с какой степенью точности и обоснованности методика (тест) позволяет судить о диагностируемом психологическом качестве спустя определенное время после измерения. Прогностическая валидность

Валидность

автора Миллер Скотт

Валидность В каждом исследовании есть переменные и отношения между ними. Поэтому, когда мы хотим описать исследование, центральным является конструкт переменных: какого вида различия изучаются и какими способами? Если мы хотим выйти за рамки описания и перейти к оценке

Валидность

Из книги Психология развития [Методы исследования] автора Миллер Скотт

Валидность При оценке валидности теста ставится следующий вопрос: измеряет ли тест то, что, как предполагается, он должен измерять? Если это, к примеру, IQ-тест, действительно он измеряет различия в уровне интеллекта или различия показателей испытуемых обусловлены чем-то

Валидность

Из книги Интеллект успеха автора Стернберг Роберт

Валидность Первую важную информацию такого рода, которая будет постоянно обсуждаться в данной книге, часто называют «критерием валидности». Вопрос здесь состоит в том, насколько результаты тестирования измеряют то, что они должны измерять в соответствии со своим

(internal validity) В. в. относится к степени уверенности, с к-рой можно судить о предполагаемой каузальной связи между переменными. Эксперимент обладает В. в. в той мере, в какой наблюдаемые эффекты можно отнести к влиянию независимых переменных, а не к.-л. др. посторонних факторов. Приписывание причинной обусловленности обычно предполагает, что две переменные - причина и следствие - будут сопряженно изменяться, однако прежде чем делать вывод о В. в., необходимо продемонстрировать, что А действительно вызывает Б (т. е. что возникновение одного лишь А приводит к Б). Можно, напр., ошибочно посчитать, что обучение решению перцептивно-моторных задач в домашних условиях а) приводит к повышению успеваемости детей в школе, б) тогда как в действительности такой желаемый рез-тат обусловлен не столько самим перцептивно-моторным обучением, в) сколько родительской заботой и вниманием. Психол. эксперименты особенно подвержены вводящим в заблуждение и непредусмотренным эффектам побочных переменных, поскольку эти эксперименты крайне редко можно реализовать в таких идеально чистых условиях, какие создаются в физ. лабораториях. Поэтому преимущественной заботой исследователей в психологии становится планирование экспериментов т. о., чтобы получаемые в них положительные рез-ты позволяли делать выводы о существовании причинно-следственных связей. В. в. отличают от внешней валидности, относящейся к возможности распространения рез-тов за пределы того специфического контекста, в к-ром была установлена В. в. Напр., если бы в тщательно контролируемых условиях удалось доказать, что переполненность клеток, в к-рых содержатся лабораторные животные, приводит к агрессивному поведению у белых крыс (В. в.), были бы у нас основания для распространения этого вывода на людей, проживающих в гетто (внешняя валидность)? В. в. следует отличать от конструктной валидности, к-рая является теорет. объяснением предполагаемой причинно-следственной связи. В большинстве случаев, однако, когда существуют все разумные основания считать В. в. установленной, исследователю хочется сформулировать концептуальную основу или конструкт для объяснения этих связей. Кроме того, В. в. не следует смешивать с внутренней согласованностью - термином из области тестирования, относящимся к интеркорреляциям внутри нек-рого набора заданий. При установлении В. в. необходимо убедиться в существовании определенной последовательности событий. Очевидно, если существует связь между А и Б, и А всегда предшествует Б, логично предположить, что А вызывает Б, а не наоборот. Помимо орг-ции максимально возможного контроля над условиями окружения и эксперим. ситуации проводящие исслед. психологи занимаются отбором испытуемых такими способами, к-рые исключают систематические ошибки при распределении их в эксперим. и контрольные группы. Они тж прибегают к тщательно разраб. эксперим. планам (учитывающим ковариацию и включающим уравновешивание) для осуществления статистических способов контроля над влиянием переменных, с тем чтобы можно было делать обоснованные суждения о причинных связях. Далее в сокращенной форме приводится проведенный Куком и Кэмпбеллом анализ проблем, возникающих при проведении квазиэксперим. или полевых исслед. в психологии, каждая из к-рых представляет собой потенциальную угрозу для В. в. Конкретные события, к-рые происходят между первым и вторым измерениями, могут изменять реакции испытуемого. Напр., если в исслед. проверяется влияние нового лекарственного препарата на уменьшение тревоги, а в период между измерениями над данной местностью пронесся торнадо, то на рез-ты измерения уровня тревоги может серьезно повлиять страх, вызванный этой катастрофой. Кроме того, изменения, естественно происходящие с течением времени и связанные с развитием испытуемых, тж могут вызывать последствия, к-рые загрязняют эксперимент (т. е. улучшения в перцептивно-моторных умениях у детей м. б., скорее, следствием простого взросления, нежели обучения). В исслед., предполагающем повторные тестирования, многократное применение того же самого инструмента могут приводить к кумулятивному эффекту, к-рый загрязняет исследуемое воздействие (напр., улучшение в оценках IQ в рез-те "обогащения" среды может стать следствием знакомства с данным интеллектуальным тестом). Механические или сделанные чел. изменения в инструментах, используемых для измерений, могут вызывать иные, нежели исследуемое воздействие, эффекты. Со временем механическая пружина может утратить свою эластичность или исследователь может изменить свою ориентацию. Пренебрежение феноменом статистической регрессии (тенденции высоких и низких оценок при повторном тестировании изменяться в сторону области средних значений) может привести к получению чрезмерно положительной и вводящей в заблуждение оценке взаимосвязи и, как следствие, к ошибочным выводам в отношении причинной обусловленности. Непреднамеренная ошибка в процессе отбора испытуемых для контрольной и/или эксперим. группы может вызывать рез-ты, связанные с этим неучтенным, но неслучайным распределением отдельных испытуемых. В этом случае различия между группами, обусловленные скорее отбором испытуемых, нежели самими исследуемыми воздействиями, могут приводить к ошибочным выводам. Любое выбывание испытуемых в ходе проведения эксперимента (сознательный уход, болезнь или даже смерть) может искажать рез-ты эксперимента, если такая убыль выходит за пределы случайного отсева. Неопределенность в отношении того, является ли А причиной или рез-том Б, неизбежно сказывается на В. в. Играет ли футбольная команда лучше из-за присутствия на трибунах большего числа болельщиков или, наоборот, большее число болельщиков собралось на игру потому, что эта команда стала играть лучше? Случайная и нежелательная коммуникация между группами, принимающими участие в исслед., разрушает эксперим. наивность испытуемых и может формировать установки и ожидания, не связанные с целями данного исслед. В свою очередь, эксперимент сам может вызывать компенсаторное соперничество, чувство обиды, возмущение и деморализацию у отдельных испытуемых и/или их групп - состояния, к-рые не имеют отношения к целям эксперимента и могут искажать его рез-ты. Поскольку экспериментаторы работаю не в вакууме, иногда случается, что по административным или соц. причинам группы получают компенсаторное воздействие, к-рое приводит к уравниванию эффектов и работает против достижения валидных рез-тов. Напр., предоставление хотя бы минимальной терапии контрольной группе пациентов, к-рые вообще не должны были получать никакой терапии, м. б. оправданным с т. зр. гуманности, но, без сомнения, наносит ущерб цели такого эксперимента. Не существует способов проведения совершенного эксперимента (т. е. такого, в к-ром достигается настолько полный контроль, что было бы невозможно отнести полученный рез-т или взаимосвязь к категории артефактов). Кроме того, обычно сам контекст психол. экспериментов делает их чрезвычайно подверженными интерпретационной двусмысленности и получению ошибочных выводов. Однако глубокие познания в этой области и внимание к тем многочисленным ловушкам, к-рые подстерегают психолога при проведении квазиэксперим. исслед., могут ему помочь планировать эксперименты, позволяющие с большей вероятностью получать истинные выводы в отношении В. в. См. также Доверительные границы, Экспериментальные планы, Проверка гипотезы, Каноны Милля, Вероятность, Статистическая значимость Э. Э. Вагнер

Другие новости по теме.

Внешняя и внутренняя валидность.

Боровкова Виктория И-01

ВАЛИДНОСТЬ (validity)-достоверность (или степень достоверности) вывода, которую обеспечивают результаты реального эксперимента по сравнению с результатами безупречного эксперимента. “В.”-центральное понятие словаря экспериментатора: оно объединяет основные цели исследования с идеальными эталонами их достижения и реальными процедурами проведения экспериментах

Глобальной целью любого экспериментального исследования является обобщение полученных результатов и вывода об экспериментальной гипотезе. Однако полное достижение этой цели возможно лишь в мысленном, безупречном эксперименте, невыполнимом на практике. Реальный эксперимент в той или иной мере репрезентирует (представляет) безупречный, и чем лучше эта репрезентативность, тем выше В. эксперимента. Таким образом, повышение В., т. е. планирование проведения эксперимента в соответствии с его безупречным образцом, является конкретной задачей исследователя, успешность решения которой зависит, во-первых, от характера, реальных условий и, во-вторых, от адекватности выбора средств. Так, источники нарушения В., (прежде всего, ненадежность и смешение) отдаляют реальный эксперимент от безупречного, а способы их контроля, позволяют приблизиться к нему, т. е. обеспечить высокую В. для обобщения экспериментальных результатов. В. полученных данных можно оценить статистически: например, В. теста (в корреляционном исследовании) определяется степенью корреляции результатов его.выполнения с изучаемым видом деятельности испытуемых.

В соответствии с различными типами безупречного эксперимента различают внутреннюю и внешнюю В.:

- внутренняя В. - достоверность выводов, которую обеспечивают результаты реального эксперимента по сравнению с результатами идеального бесконечного экспериментов. Повышение внутренней В. связано с устранением результатов действия побочных переменных и с усреднением их изменчивости и нестабильности. Внутренняя В. - первое и необходимое требование к экспериментальным выводам: эксперимент, не обладающий внутренней В., названы автором просто неудачным.

При обладающем внутренней валидностью исследовании исследователь уверен, что результаты, полученные измерением зависимой переменой, непосредственно связаны с независимой переменной, а не с каким-нибудь другим неконтролируемым фактором.

Однако, фактически, в науке (особенно в психологии) невозможно со стопроцентной уверенностью утверждать, что внутренняя валидность соблюдена. Например, невозможно изучить какой-то психический процесс отдельно от психики в целом. Поэтому всегда при любом психологическом эксперименте учёный может лишь максимально (но не абсолютно) удалить или минимизировать разнообразные факторы, угрожающие внутренней валидности.

Пример нарушения внутренней валидности

Допустим, мы хотим проверить лекарство, от которого люди будут становиться выше. Допустим, для своих исследований мы отбираем в качестве испытуемых 13-летних подростков, измеряем их рост, и даём им лекарство. Два года спустя мы возвращаемся к теперь уже 15-летним детям и фиксируем их текущий рост. Несомненно то, что они стали выше, но без сомнения и то, что мы не можем сделать из этого вывод, что эффект роста был вызван лекарством, так как мы не учли в своём теоретическом эксперименте естественных процессов взросления. Здесь внутренняя валидность нарушена следующим образом: мы не учли побочного для нашего исследования влияния других (в данном случае - очевидных) факторов, тогда как надо было их учитывать.

- внешняя В . - достоверность выводов, которую обеспечивают результаты реального эксперимента по сравнению с результатами эксперимента полного соответствия. Повышение внешней В. обеспечивается достижением соответствия уровней дополнительных переменных в эксперименте уровням этих переменных в изучаемой реальности. Эксперимент, не обладающий внешней В., является неверным, не соответствующим поставленной гипотезе (но, быть может, пригодным для проверки, другой гипотезы).

Внешняя валидность определяет то, в какой мере результаты, полученные в эксперименте, могут соответствовать тому типу жизненной ситуации, которая была исследована, и то, насколько возможно обобщить эти результаты на все подобные жизненные ситуации. Например, критику психологов-экспериментаторов в том, что о студентах-второкурсниках и белых крысах они знают очень много, а обо всём остальном - очень мало, можно рассматривать как критику внешней валидности.

Как и в отношении любой другой валидности, о внешней валидности в исследовании, вероятно, невозможно сказать, что она абсолютно соблюдена, можно указать только на её нарушение. Абсолютным соблюдение внешней валидности считалось бы тогда, когда результаты исследования можно обобщить на любые популяции при любых условиях и в любое время, поэтому учёные говорят не о соблюдении либо несоблюдении внешней валидности, а о степени её соблюдения.

Критерии внешней валидности

Чтобы исследование обладало наивысшей степенью валидности, должна существовать возможность генерализации его результатов на:

Другие популяции,

Другие условия,

Другое время.

Пример нарушения внешней валидности

Исследование Лоренса Колберга, посвящённое изучению нравственного развития детей, было подвергнуто критике за низкую степень внешней валидности. В 1963 году Колберг предложил мальчикам-подросткам разрешить различные коротко сформулированные дилеммы. На основании полученных ответов он разработал теорию о шести стадиях морального развития.

Критика внешней валидности этого исследования в частности состояла в том, что учёный не учитывал половых различий в особенностях мышления способах принятия моральных решений и, следовательно, неправомерно обобщил свою модель на представителей обоих полов.

Колберг также исходил из предпосылки о том, что существуют некие «универсальные принципы справедливости и соблюдения прав личности», однако он не учёл межкультурных различий, следовательно, выводы, которые он сделал, не могут восприниматься как универсальные.

Соблюдение внешней валидности

Чтобы увеличить степень внешней валидности, в исследованиях могут не ограничиваться лишь экспериментальным методом, но также использовать и другие - например, наблюдение, межкультурные исследования и т. д.

При современном научном подходе в психологии соблюдение внешней валидности в исследованиях играет ведущую роль, так как наиболее ценным считается создание общих теорий, моделей и алгоритмов, применимых к психике в целом, независимо от контекста, - то есть моделей, обладающих крайне широкими предсказательными возможностями; поэтому исследования, результаты, которых можно применить только к какой-то определённой ограниченной ситуации, обладают нисходящей ценностью.

Следует отметить, что любую переменную (фактор), отличную от независимой, также оказывающую влияние на зависимую переменную, автор называет просто “ other ” - другая. При переводе для обозначения таких переменных используются два разных термина: “побочная” - применительно к переменной, нарушающей внутреннюю В., и “дополнительная” - переменная, уровень которой входит в экспериментальную гипотезу и должен быть адекватно представлен с целью достижения внешней В. Иногда одни и те же факторы могут выступать в эксперименте и как побочные (нарушающие внутреннюю В.), и как дополнительные (влияющие на внешнюю В.). Устранение и унификация побочных факторов, повышающая внутреннюю В., может приводить к несоответствию уровней дополнительных переменных, что снижает внешнюю В. (см. Соответствие).

Операциональная В.-разновидность внешней В. для лабораторного эксперимента; соответствие (или степень соответствия) применяемых методических процедур тем теоретическим понятиям, которые входят в экспериментальную гипотезу.

Угрозы внутренней валидности

«Угрозы внутренней валидности» - выражение, относящееся к плану исслед., к-рое интерпретаторы данных используют для описания ряда вопросов, возникающих в связи с возможными неточностями при интерпретации причинно-следственных связей между изучаемыми переменными. Некоторые из этих угроз уже упоминались, в частности, при описании квазиэкспериментов. Выражение регрессия к среднему показателю используется для описания эффекта неточного измерения текущего и будущих наблюдений, и она представляет собой серьезную угрозу для внутренней валидности плана психол. исслед.

Другой угрозой является естественное развитие, поскольку испытуемые подвержены естественным процессам созревания и развития с течением времени независимо от манипуляций, которые совершает над ними исследователь. Эта последняя гипотеза, в частности, объясняет необходимость использования в исслед. контрольных групп, позволяющих осуществлять сравнения с естественно развивающимися испытуемыми.

Еще одной угрозой является отсев. Систематическое сокращение количественного состава групп вследствие выбывания, неявок, переезда людей в другой город, незаполненных критериальных опросников, и т. д. может делать менее заметной в результатах исслед. роль тех оставшихся участников, к-рые оказываются в меньшей степени подвержены эксперим. воздействию. А ведь чем более заметны улучшения по критерию, тем лучше выглядит эффективность самого изучаемого воздействия.

Угроза отбора возникает на этапе формирования исслед. состава групп участников. Систематический отбор или пассивный отбор (собственное желание) участников для изучаемого воздействия или условия может приводить к возникновению различий среди некоторых групп перед началом исслед. Эти группы будут по-прежнему отличаться от других и после реализации воздействия - даже когда они сами не подвергались воздействию. Поэтому, для достижения высокой внутренней валидности (причинно-следственных) утверждений в отношении взаимосвязей переменных, необходима формулировка и проверка альтернативной гипотезы о том, какими могли бы быть эти эффекты в отсутствие такого воздействия или условия.

Фон относится к тем изменениям контекста проводящегося исслед., которые могут смешиваться с самими изучаемыми воздействиями. Подобное смешение делает невозможным отнесение изменений в испытуемых на счет исследуемого воздействия или внешних изменений.

Инструментальная погрешность являются угрозой внутренней валидности, почти исключительно присущей психологии, поскольку она возникает в результате происходящих со временем изменений стандартов наблюдателя или условий наблюдения. Эти изменения вызывают различия в оценках. Проблема состоит в том, что подобные расхождения в стандартах измерения могут приводить к ошибочным оценкам тех изменений, которые являются следствием изучаемых воздействий.

Эффект тестирования являются примером другой, почти исключительно присущей психологии, угрозы внутренней валидности. Она связана с эффектом улучшения показателей испытуемых просто в результате предыдущего прохождения теста.

Нестабильность, как было указано выше, вытекает из попыток интерпретировать происходящие непосредственно после эксперимента воздействия или спустя к.-л. время естественные изменения испытуемых и измерений.

Существуют также четыре аффективных угрозы внутренней валидности: подражание, компенсаторное соперничество, компенсаторное уравнивание, и деморализация. Они также присущи исключительно психол. науке, поскольку возникают в результате эмоциональных изменений у испытуемых и проводящего измерения персонала как формы адаптации к тому факту, что они не попали в число «избранных» участников исследования, получающих и осуществляющих эксперимент

Внешняя валидность и метаанализ

Наконец, существует понятие внешней валидности - суммы характеристик исследований, к-рая позволяет осуществлять обобщение или распространение получаемых в исследованиях (как результат высокой внутренней валидности) причинно-следственных утверждений на сходные категории людей, воздействий и критериев за пределами данного исследования.

Метаанализ. Внешняя валидность результатов исследования, существенно усиливается, когда объединяется и обобщается целый ряд исследований одной и той же воздействующей переменной. Такая процедура называется метаанализом. В метаанализе определяются величина эффекта, оказываемого эксперимента, воздействием и основными условиями исследования на критериальные переменные. Последние выбираются в зависимости от теоретических интересов проводящего метаанализ исследователя. Т. о., если основной анализ предполагает сравнение связей всех пар переменных, то набор интересующих метааналитика связей является набором из переменных-условий и критериальных переменных, который позволяет судить о величине эффекта изучаемого воздействия на эти критериальные переменные. Величина эффекта для каждого исследования определяется простым делением разности между средними показателями по критериальной переменной в эксперименты группах и контрольной группе на меру изменчивости индивидуальных показателей в этих группах. В результате такого анализа можно продемонстрировать, что целый ряд изучавшихся переменных условий не оказывают влияния на набор критериев, что позволяет исследователям обобщать результаты своих исследований, не оглядываясь на эти, как было установлено в ходе метаанализа, посторонние условия.

Наконец, можно определить степень влияния каждой переменной-воздействия и их различных сочетаний на критерии. Это представляет особый интерес для прикладных областей, где важно знать не только о том, что одна переменная влияет на другую, но и насколько велико такое влияние.