Оперантное обусловливание
Оперантное обусловливание
тип научения, который предполагает рост вероятности появления какой-либо реакции вследствие подкрепления. Естественнонаучной базой теории стала концепция условных рефлексов И. П. Павлова (ассоциативно-рефлекторная теория). Свое обоснование явление оперантного обусловливания (Б. Скиннер) получило в рамках поведенческой психологии (бихевиоризма) в продолжение развития теории классического обусловливания.
Подкреплением называется эффект, который порождается воздействием стимула, вызывающего ту или иную реакцию, в связи с чем сам стимул обозначается как подкрепляющий. Если подкрепляется какое-либо действие, то оно фиксируется и затем воспроизводится с большей легкостью и постоянством. Например, проявление оперантного обусловливания у животных фиксируется в следующем: животное свободно передвигается и «оперирует» в окружающей среде до тех пор, пока случайно не наталкивается на то действие, которое позволяет ему добраться до пищи. Именно это действие впоследствии становится более вероятным, так как приводит к благоприятным последствиям. Таким образом, поведение регулируется подкрепляющими стимулами (например, получение пищи), которые следуют за данным вариантом поведения.
Подкрепление может ставить своей целью увеличение вероятности реакции: либо усиливая, либо ослабляя (сводя к минимуму) поведение. В том случае, если увеличение вероятной реакции происходит, когда стимул добавляется к ситуации, его обозначают как позитивный. В том случае, когда усиление воздействия достигается за счет удаления стимула из ситуации, его обозначают как негативный. По мнению Б. Ф. Скиннера (автора данной идеи), такое оперантное поведение играет большую роль в жизни людей (чем респондентное, классическое обусловливание). Человеческая деятельность не является рефлекторной, она зависит от того, какой опыт есть у человека в отношении того, что следует за тем или иным действием: поощрение или наказание, выгода или потеря (рис. 5). Вознаграждение (выгода) и облегчение (избегание напряжения) способны усилить поведение. Кара (воздействие с помощью аверсивных/неприятных стимулов) и наказание (утрата, потеря чего-либо) способны ослабить поведение. Считается, что в отличие от наказания, воздействие аверсивных стимулов более продуктивно при необходимости ослабления (модификации) нежелательного поведения. К аверсивным (от лат. Aversatio – отвращение) стимулам относятся любого рода воздействия, вызывающие у человека неприязнь, отвращение, крайне неприятные, болезненные ощущения. В качестве аверсивного стимула могут выступать: а) физические наказания; б) лекарственные препараты, вызывающие головную боль, тошноту, рвоту; в) весьма чувствительное, хотя и не представляющее опасности для здоровья и жизни воздействие (внезапный громкий шум, ожог, удар электрическим током и т. п.). В педагогической психологии и педагогике отношение к аверсивным стимулам далеко не однозначное, что определяется этическими соображениями, не допускающими применения принуждения и насилия над человеком.
Рис. 5. Взаимосвязь стимулов и поведенческих реакций.
В образовании в учебной ситуации в качестве:
? вознаграждения могут использоваться похвала, отметки, возвышение (рейтинг) и т. д.;
? облегчения — избегание в учебной деятельности гнева, насмешки, неудачи, например за счет замены публичного выступления на письменный доклад, если учащийся стесняется;
? кары – воздействия, которое вызывает либо болезненные (физические наказания), либо неприятные ощущения (например, усталость, когда при несделанной или плохо сделанной работе необходимо переделать, сделать дополнительно, сделать в два или три раза больше);
? наказания — штраф, лишение чего-либо (например, запрет на игру в компьютер в течение недели или отказ от покупки обещанного подарка).
Можно выделить несколько условий эффективного формирования методом подкрепления.
1. Система подкреплений не должна быть противоречивой. Например, ребенок капризничает и требует конфету. Мама раздражается и, как правило, не дает. Однако иногда она сдается и уступает, подкрепляя тем самым его капризы. Ребенок получает сигнал, что если хныкать достаточно долго, то мама может уступить.
2. Подкрепления должны быть ориентированы на потребности субъекта. Люди, умеющие делать подарки и всегда знающие, что подарить своим близким, неизменно пользуются большим на них влиянием.
3. Подкрепление должно быть своевременным и отмечать любой малейший прогресс. Если вы учитесь играть в теннис и пытаетесь выработать определенный удар, то вовремя сказанное слово тренера очень сильно влияет на освоение навыка. Другой пример: родители, наказывая за плохую учебу, отбирают у сына возможность пользоваться компьютером. Через некоторое время в его оценках появляются не одни «двойки», а «тройки» и даже одна «четверка». Родители решают, что, пока не будет стойких четверок, никаких послаблений сыну не видать. Через некоторое время оценки мальчика становятся прежними. Неподкрепленное усилие тут же сходит на нет.
4. Позитивные подкрепления должны преобладать над наказаниями.
Данный текст является ознакомительным фрагментом.