Оперантное научение в психологии

Эксперименты ученого

Теория Скиннера подробно изложена в одном из его основных трудов, который носит название «Поведение организмов». В нем ученый излагает принципы так называемого оперантного обусловливания. Проще всего понять эти принципы, рассмотрев один из наиболее типичных экспериментов ученого. Вес крысы снижали до 80-90 % от обычного. Она помещается в особое устройство, которое носит название скиннеровского ящика. В нем предоставлена возможность совершать только те действия, которые наблюдающий экспериментатор может видеть и контролировать.

У ящика имеется отверстие, через которое животному подается пища. Чтобы получить питание, крыса должна нажать на рычаг. Данное нажимание в теории Скиннера называется оперантной реакцией. Как крысе удается нажать на этот рычаг — посредством лапы, носа, а может быть, хвоста, — не имеет никакого значения. Оператная реакция в эксперименте остается той же, так как она вызывает лишь одно следствие: крыса получает еду. Поощряя животное пищей за определенное число нажиманий, исследователь формирует устойчивые способы реагирования у животного.

Исследования Б. Скиннера в рамках бихевиоризма

Беррес Скиннер — американский психолог, писатель, продолжатель идей Дж. Уотсона, который разработал теорию оперантного научения.

Он считал, что человеческий организм — это «черный ящик». Все, что наполняет этот ящик (эмоции, мотивы, влечения),  нельзя объективно измерить, поэтому их следует исключить из сферы эмпирического наблюдения. А вот поведение можно объективно измерить, собственно, этим Скиннер и занимался.

Он не принял идею о личности, которая направляет или стимулирует поведение. Скиннер считал, что поведение порождается не силами, которые находятся внутри человека (например, чертами, потребностями, мыслями, чувствами), а силами, которые лежат вне человека. Это значит, что поведение человека регулируется не изнутри, а снаружи (окружающей средой). Изучение личности по Скиннеру — это нахождение своеобразного характера взаимоотношений между поведением организма и результатами этого поведения, которые и подкрепляют его в последствии. Этот подход фокусируется на прогнозировании и контроле наблюдаемого поведения.

Б. Скиннер, также как и Дж. Уотсон, интересовался таким явлением как научение. Он даже разработал концепцию оперантного научения, которая базировалась на законе эффекта, который был открыт Э. Торндайком.

Оперантное научение — это метод обучения, который включает в себя систему поощрений и наказаний с целью усилить или прекратить определенный тип поведения. При этом организм ассоциирует свое поведение с последующим результатом. Такое научение направлено ​​на подкрепление контролируемого индивидом поведения.

Например, человек пытается научить собаку выполнять команду. Когда собака успешно справляется (т.е. выполняет команду), она получает поощрение (похвалу, лакомство). Когда собака не справляется с заданием, она не получает поощрение. В итоге, у собаки устанавливается связь между определенным поведением и возможностью получить награду.Подобным образом, можно и отучить собаку, например, делать «свои дела» на ковер. Только использовать придется систему наказаний (например, отругать пса). Получается своеобразный метод «кнута и пряника».По этому поводу советую прочитать интереснейшую книгу Карен Прайор, которая называется «Не рычите на собаку! Книга о дрессировке людей, животных и самого себя «.

Скиннер проводил эксперименты над голодными животными (крысы, голуби), которых помещал в ящик, который получил название «ящик Скиннера». Ящик был пуст, внутри находился лишь выступающий рычаг, под которым стояла тарелка для еды. Оставленная одна в ящике, крыса передвигается и исследует его. В какой-то момент, крыса обнаруживает рычаг и нажимает на него.После установления фонового уровня (частота, с которой крыса вначале нажимает на рычаг) экспериментатор запускает в действие кассету с пищей, расположенную снаружи ящика. Когда крыса нажимает на рычаг, небольшой шарик пищи выпадает в тарелку. Крыса съедает его и вскоре снова нажимает на рычаг.Пища подкрепляет нажатие на рычаг, и частота нажатий растет. Если кассету с пищей отсоединить, так что при нажатии на рычаг пища больше не подается, частота нажатий будет уменьшаться. 

Таким образом, Скиннер заметил, что оперантно обусловленная реакция при неподкреплении угасает точно так же, как и классически обусловленная реакция. Исследователь может установить критерий дифференцировки, подавая пищу только тогда, когда крыса нажимает на рычаг при горящей лампочке, и тем самым вырабатывая условную реакцию у крысы путем избирательного подкрепления. Свет тут служит стимулом, который контролирует реакцию.

Скиннер также добавляет положения о двух видах поведения: респондентное и оперантное поведение.Респондентное поведение — это  характерная реакция, вызываемая известным стимулом; стимул, при этом, всегда предшествует реакции. В качестве примера можно привести сужение или расширение зрачка в ответ на световую стимуляцию, подергивание колена при ударе молоточком по коленному сухожилию и дрожь при холоде.Оперантное поведение — это произвольные приобретенные реакции, для которых не существует стимула, поддающегося распознаванию. Вызванное оперантным научением такое поведение определяется событиями, которые следуют за реакцией. Т.е. за поведением идет следствие, и природа этого следствия изменяет тенденцию организма повторять данное поведение в будущем.Например, катание на роликах, игра на гитаре, написание собственного имени – это образцы оперантной реакции (или операнты), контролируемые результатами, следующими за соответствующим поведением.

Трехмерное непредвиденное обстоятельство

Это основная модель оперантного кондиционирования, состоящая из трех компонентов: различительного стимула, реакции и подкрепляющего стимула.

Различительным стимулом будет тот, который указывает субъекту на наличие подкрепления, указывая на то, что если он будет выполнять определенное поведение, он сможет получить указанное подкрепление. Например, если на коробке Скиннера загорается свет, это означает, что при нажатии на рычаг будет получена еда.

Напротив, у нас есть дельта-стимул или стимулы, которые указывают на то, что поведение не приведет к получению какого-либо подкрепления.

Ответом будет поведение, которое будет выполнять субъект, выполнение которого приведет или не приведет к получению подкрепляющего стимула. Подкрепляющий стимул отвечает за излучение поведения, поскольку благодаря его появлению вероятность выброса ответа в будущем будет увеличиваться или уменьшаться.

Какие виды армирования есть?

Условные или усиливающие стимулы, как положительные, так и отрицательные, могут использоваться с целью исправления или изменения поведения человека. эти они очень полезны как в психологической терапии, так и в школьной обстановке, семья или даже работа.

Скиннер различает два типа усилителей: положительные и отрицательные..

1. Положительные усилители

Положительными подкреплениями являются все те последствия, которые появляются после поведения и которые человек считает удовлетворительными или полезными. С помощью этих положительных или удовлетворительных подкрепителей цель состоит в том, чтобы повысить уровень ответа человека, то есть увеличить вероятность выполнения или повторения действия..

Это означает, что действия, которые будут усилены, будут с большей вероятностью повторяться, так как вознаграждения, призы или награды, воспринимаемые как положительные, сопровождаются человеком, который выполняет действие.

Очень важно подчеркнуть, что для того, чтобы эта ассоциация была эффективной, необходимо убедиться, что человек рассматривает положительное подкрепление как таковое. То есть, что вы находите это действительно привлекательным

То, что человек может считать призом, не обязательно должно быть для другого. Например, ребенок, которому едва дают конфеты, может воспринимать их как приз, более важный, чем другой, к которому он привык. поэтому, Надо будет знать особенности и отличия человека Итак, чтобы иметь возможность указать, что будет идеальным стимулом, который служит положительным подкреплением.

В свою очередь, эти положительные усилители можно классифицировать по следующим категориям:

  • Первичные или внутренние усилителиЭто поведение, которое само по себе вызывает удовлетворение. Например, есть, если вы голодны.
  • Вторичные усилителиОни даны через обучение и являются внешними по отношению к человеку. Они могут быть материальными, такими как деньги или социальные, такие как признание.

3. Отрицательные усилители

Вопреки распространенному мнению, отрицательные подкрепления не заключаются в назначении наказания или отвращения к человеку; но наоборот. Использование отрицательных усилителей направлено на увеличение скорости отклика устранение тех последствий, которые оно считает отрицательными.

Например, ребенок, который учится на определенный тест и получает хорошую оценку. В этом случае родители освобождают его от выполнения домашней работы или любой неприятной деятельности..

Как мы видим, в отличие от положительного подкрепления, в этом случае появление отрицательного или отвращающего стимула устраняется, так что определенное поведение усиливается. Однако то, что у них общего, — это стимулы, которые также должны быть адаптированы к вкусам человека..

Статья по теме: «Что такое позитивное или негативное подкрепление в психологии?»

Теория социального научения бандуры. Бандура Альберт

Эффективность человеческого поведения: социальные корни, социальные последствия

Вот он подлинный бихевиоризм. «Теория социального научения» — это первый перевод на русский язык трудов известного ученого Альберта Бандуры, и первая же, основополагающая теория, систематически излагающая его взгляды на поведение человека. Дальнейшая работа в данном направлении привела его к более общим умозаключениям, постулированным в социально-когнитивной теории, которая существенно отличается от классического обусловливания по Павлову и от оперантного научения Скиннера.

Господствовавшие ранее в психологии точки зрения сводили объяснение поведения либо к личностным факторам, либо к ситуационным, исключая из поля зрения когнитивные структуры и процессы. Но человек не является абсолютно свободным от собственной природы. Наиболее важным оставался вопрос о том, является ли связь между ситуационным побуждением и последующим поведением примой (так, например, в теории научения Скиннера, которого часто критикуют за механистичность), или опосредована разного рода когнитивными процессами: оценкой актуальной ситуации, антиципацией событий и оценкой их последствий. Конечно, сложно наблюдать когнитивное переменные, можно лишь косвенно заключить об их существовании по отдельным признакам.

Бандура создал обоснованную теорию, в противовес-точке зрения, в которой индивидуум рассматривался как пассивный ответчик на внешние стимулы или жертва неосознанных побуждений. Автор показывает, что поведение объясняется в терминах непрерывной реципрокной интерактивности, в которой личностные, ситуационные и поведенческие факторы взаимодействуют между собой как взаимозависимые детерминанты. В рамках этого подхода наиважнейшую роль играют символические, косвенные и саморегуляционные процессы.

С самого начала своей научной деятельности Альберт Бандура уделял особое внимание огромной роли символического моделирования в формировании и распространении новых форм поведения и социальных отношений. С развитием коммуникационных технологий, символическое окружение играет все возрастающую роль в распространении идей, ценностей и стилей поведения

С позиций социального научения моделирование влияет на научение главным образом через информативную функцию\Если бы люди руководствовались в повседневной жизни только методом проб и ошибок, то научение было бы очень трудоемким, не говоря уж рискованным процессом. Но, в большинстве случаев, наблюдая за другими, мы обучаемся на примерах пусть даже приблизительных, и поэтому избегаем многих ошибок. V Наиболее спорным вопросом в научении через наблюдение является вопрос о роли подкрепления. Предполагается, что последствия автоматически подкрепляют поведение, без участия когнитивных структур. Однако в процессе изучения ученые пришли к заключению, что когда научение происходит неосознанно, то оно крайне замедленно во времени и малоэффективно. Чаще всего подкрепление переживается непосредственно или опосредовано. Однако, кроме прямого и косвенного подкрепления, люди свое собственное поведение регулируют посредством самоподкрепления. Самоподкрепление осуществляется в том случае, если люди придерживаются высокого уровня исполнения и вознаграждают или наказывают себя за достижения и неудачи. Люди способны осуществлять некоторый когнитивный контроль над своим собственным поведением, мотивацией и окружающей их средой. В контексте самоподкрепления Альберт Бандура вводит термин саморегуляция и показывает, как человеческое поведение мотивируется и регулируется внутренними стандартами и самооценочными реакциями.

Самоэффективность занимает центральное место в размышлениях Бандуры. Когда люди осознают собственную эффективность в специфической ситуации, они начинают прилагать больше усилий, дольше могут противостоять препятствиям, выдерживают враждебные обстоятельства и неприятные переживания. Высокая самоэффективность, связанная с ожиданием успеха, обычно приводит к хорошему результату и повышает таким образом самоуважение. И, напротив, низкая самоэффективность приводит к неудаче и снижению самоуважения. Человек постоянно пытается контролировать непредсказуемые ситуации и таким образом пытается осуществлять контроль над разнообразными аспектами бытия.

Бандура считает поведение достаточно целенаправленной активностью, а эффективность намерений в регулируемом поведении определяется частично тем, насколько далеко цели устремлены в будущее.

Чубарь Н. Н.

Определение оперантной обусловленности

Оперантная обусловленность — это форма обучения, которая состоит из связать стимул с ответом для того, чтобы ответ происходил более или менее. То есть поведение происходит, и после поведения есть следствие, то, что происходит позже. Тогда есть два варианта: то, что следствие является положительным или отрицательным.

  1. Если следствие считается положительный это поведение будет иметь более вероятно, что произойдет в будущем, потому что поведение связано с хорошим событием, которое произошло после.
  2. Если, наоборот, следствие отрицательный поведение будет иметь менее вероятно, что произойдет в будущем, так как поведение связано с плохим событием. Эта связь между поведением и последствиями приводит к технике модификации поведения, которая служит для повторения поведения или нет. Существуют разные типы оперантного кондиционирования..

Типы оперантного кондиционирования

  • положительное подкрепление: когда хорошее поведение происходит после поведения, оно будет приводить к увеличению присутствия поведения.
  • отрицательное подкрепление: когда после поведения не происходит или плохое событие, которое уже происходит, не происходит, что также увеличит присутствие поведения.
  • упущение: когда хорошее поведение не происходит после поведения, присутствие поведения будет уменьшаться.
  • наказание: когда после поведения происходит плохое событие, которое также уменьшает присутствие поведения.

Инструментальное кондиционирование Тондрика

Как мы уже отмечали ранее, Буррх Фредерик Скиннер является наиболее важным автором оперантной обусловленности, к которой позже Эдвард Торндайк назвал термин инструментальное кондиционирование. Концептуальное различие основано больше на имени, чем на характере обучения.

Типы поведения

Для развития подходов к пониманию поведения человекаФредерик Скиннер вводит в свою теорию два типа поведения организма: респондентное и оперантное поведение.

Респондентное поведение

Респондентное действие – реакция, которая вызвана стимулом. Организм автоматически реагирует на некоторые стимулы, например, сужение зрачка при ярком освещении, повышение температуры при борьбе с возбудителем болезни и проч.

Респондентное поведение полностью совпадает с исследованиями Павлова. Известно, что слюноотделение собаки усиливалось при звуковом сигнале. Человек может реагировать сходным образом на звон посуды, на открытие бутылки шампанского и др.

Рефлексы используются в рекламном бизнесе. Создание ассоциации картинки с товаром помогает увеличить лояльность покупателя к продукту.

Респондентное поведение делится на два вида:

  1. Условно рефлекторное, привитое извне.
  2. Безусловно рефлекторное, формы поведения, заложенные в организм.

В «Поведении организмов» ученый выводит положение о двух формах поведения, которые возникают в процессе обучения. Первая форма – респондентная, совпавшая с опытами Ивана Павлова, или рефлекторная, вызывается условным или безусловным стимулом. Можно сказать, что респондентное поведение – невольное, автоматически совершаемое. Вторая форма – оперантная, которая, в противоположность респондентной, является формой добровольного действия. 

Оперантное поведение

По Скиннеру, оперантное поведение отличается от рефлекторной реакции и является целенаправленным и произвольным.

Важно заметить, что вкладывает Фредерик Скиннер в понятие целенаправленности. В теории оперантного обусловливания целенаправленность не используется как определение цели или намерения

По мнению Скиннера, внутренние параметры (т.е. цели) создают условия для возникновения ложных предположений, которые не связаны с воздействием среды на человека

В теории оперантного обусловливания целенаправленность не используется как определение цели или намерения. По мнению Скиннера, внутренние параметры (т.е. цели) создают условия для возникновения ложных предположений, которые не связаны с воздействием среды на человека.

Именно влияние внешних факторов на поведение формирует целенаправленность. Организм реагирует на что-то, затем формируется подкрепление.

Оперантное поведение может формироваться в ходе работы нескольких людей. Например, при выступлении оратор, улыбаясь, заставляет слушателей отреагировать улыбкой, затем формируется доверительное отношение к услышанной информации. Реакция опережает подкрепление.

В самостоятельном формировании привычек также используется оперантная форма поведения. Самодисциплина подразумевает манипулирование внешними событиями вокруг индивида. Оперантный самоконтроль состоит из двух взаимосвязанных событий:

  1. Изменение окружающей среды и вероятности повторения реакции, например, контроль гнева через уход.
  2. Формирование среды, где есть стимулы, которые помогают увеличить вероятность повторения определенного действия. Примером такой среды может быть удобная мебель на рабочем месте для увеличения работоспособности.

Данные, полученные в ходе экспериментов над животными и изложенные в труде «Поведение организмов», позволили Берресу Скиннеру сформировать особый вариант программированного обучения. Научение должно быть ограничено набором внешних факторов среды и подкрепления поведения.

Скиннер создает крайне автоматизированное объяснение поведению человека, которое сводится к комбинации реакций и подкреплений различных уровней сложности. Внутренний мир человека, его сознание осознанно игнорируются исследователеми происходят из реакций личности на внешнюю среду.

Скиннер стираетгрань между человеком и животным, делая реакцию и научение этой реакции главной причиной любого действия человека.

Список использованных источников:
  • 1. Schacter, Daniel Psychology Second Edition. USA: Worth Publishers ISBN 978-1-4292-3719-2 2011, p. 17.
  • 2. B. F. Skinner. About Behaviorism ISBN 0-394-71618-31974, pp.18-20.
  • 3. Slater, Lauren. Opening Skinner’sBox: Great Psychological Experiments of the Twentieth Century. NewYork: W.W. Norton, 2004, p.6.
  • 4. B. F. Skinner. About Behaviorism ISBN 0-394-71618-31974, р. 225.
  • 5. B. F. Skinner. About Behaviorism ISBN 0-394-71618-31974, p. 69.

Редактор: Редактор: Чекардина Елизавета Юрьевна

  • Писать или не писать? – вот в чем вопрос https://psychosearch.ru/7reasonstowrite
  • Как стать партнером журнала ПсихоПоиск? https://psychosearch.ru/onas
  • Несколько способов поддержать ПсихоПоиск https://psychosearch.ru/donate

Ящик Скиннера

Согласно концепции оперантного поведения, обусловливание может использоваться для контроля над поведением окружающихи для самоконтроля. Для регулирования личного поведения необходимо положительное подкрепление для действия.

Эксперимент Берреса Скиннера

  1. Голодная крыса помещалась в специальный короб. Нажимая на рычаг, животное получало еду. Со временем подопытная крыса осознала (положительный результат), что нажатие рычага позволяет достать лакомство. Данный навык закрепился.
  2. Крыса снова помещалась в ящик, но нажатие рычага сопровождалось подачей тока. Каждый разряд тока создавал неприятное ощущение в памяти животного (негативное подкрепление). Ток, проводимый через лапки, заставлял выработанную форму поведения сойти на нет – наказание.
  3. Последняя фаза эксперимента: крыса помещается в ящик. При нажатии рычага крыса не получала разряд током, но и еду не получала. Животное не получало позитивного или негативного подкрепления, поэтому навык затухал.

Опыты Берреса Скиннера позволили изучить процесс обучения организмов и способы его контроля.

В 1960-е годы американские государственные психиатрические клиники начали применять результаты эксперимента для работы с людьми, больными шизофренией, расстройством личности.

Предпосылки оперантного поведения

В психологии Скиннера главный акцент сделан на то, что свой выбор человек совершает под воздействием каких-либо событий в прошлом. Скиннер утверждал: окружающие факторы приводят нас к определенному решению и поступкам. Центральный источник нашего поведения – не люди сами по себе (их чувства, разум, планы или цели), а их ответная реакция на влияние со стороны окружения. Чтобы понять, почему мы поступаем именно так, а не иначе, согласно Скиннеру, нужно знать обстоятельства, которые стимулируют нас к действиям.

Именно поэтому окружающий мир формирует из нас тех, кем мы являемся: наши действия зависят от знания, что хорошо, а что плохо, и, хотя мы верим, что это наше внутреннее решение, именно внешняя среда сформировала наше понимание, что такое хорошо, а что плохо. Люди – это результат адаптации каждого человека к внешней среде, в которой он родился.

Согласно философии Скиннера, нет необходимости тратить так много энергии на моральное развитие индивида, ведь «черты характера» – это аккумуляция реакций на определенные внешние условия окружения. Поэтому результат будет намного лучше, если мы будем больше сил и внимания уделять исследованиям внешней среды и условий, от которых и зависит индивид. Таким образом, если мы создадим лучшие окружающие условия, мы получим лучших индивидов.

В экспериментальной психологии принято выделять два процесса, ответственных за выработку и закрепление форм реакции на любые потребности:

  • обучение – акцент сделан на форме обучения обучающего;
  • учение, научение – здесь важны условия обучения, которые включают три разных способа воздействия на организм (человека или животного): реактивное поведение, когнитивное научение и оперантное поведение (или научение в результате оперантного обусловливания).

Сегодня теория оперантного поведения – это, пожалуй, самый известный вклад Скиннера в развитие экспериментальной психологии. Скиннер утверждал, что люди – это не больше, чем думающие машины, которые могут изменять свои действия.

Последовательное и пропорциональное подкрепление

Но голубь не может научиться игре в пинг-понг, если экспериментатор не будет формировать у него данное поведение путем дискриминационного научения. Это означает что отдельные действия голубя подкрепляются ученым последовательно, избирательно. В теории Б. Ф. Скиннера подкрепление может быть или распределенным случайно, происходя через определенные временные промежутки, или происходить в определенных пропорциях. Поощрение, распределенное случайно в виде периодических денежных выигрышей, провоцирует у людей развитие игровой зависимости. Поощрение, которое происходит через определенные интервалы времени — зарплата — способствует тому, что человек остается на определенной службе.

Пропорциональное поощрение в теории Скиннера представляет собой настолько мощное подкрепление, что животные в его экспериментах практически загоняли себя до смерти, пытаясь заработать побольше вкусной пищи. В отличие от подкрепления поведения, наказание является отрицательным подкреплением. С помощью наказания невозможно научить новой поведенческой модели. Оно только заставляет субъекта постоянно избегать известных операций, за которыми следует наказание.

Программы подкрепления Скиннера

Как обсуждалось в начале статьи, помимо теоретизирования о поведении человека, Скиннер стремился воплотить эти теории в жизнь , Для этого он разработал серию конкретных программ армирования, наиболее выдающимися из которых являются программы непрерывного и прерывистого усиления (интервальное усиление и усиление по причине).

1. Непрерывное усиление

В непрерывном усилении человек постоянно вознагражден за действие или поведение , Основным преимуществом является то, что партнерство формируется быстро и эффективно; однако, как только подкрепление устранено, поведение также быстро исчезает.

2. Прерывистое усиление

В этих случаях в определенных случаях усиливается только поведение человека , Эта программа в свою очередь подразделяется на две категории: интервальное усиление (фиксированное или переменное) или коэффициентное усиление (фиксированное или переменное)

При усилении интервала поведение усиливается после ранее установленного периода времени (фиксированный) или случайного периода времени (переменный). В то время как в подкрепление разума человек должен выполнить определенное количество поведений, прежде чем оно будет усилено. Как и при усилении интервала, это количество ответов может быть предварительно согласовано (фиксировано) или не согласовано (случайно).

Рейтинг
( Пока оценок нет )
Editor
Editor/ автор статьи

Давно интересуюсь темой. Мне нравится писать о том, в чём разбираюсь.

Понравилась статья? Поделиться с друзьями:
Мake-up course
Добавить комментарий

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!: