Теория оперантного научения скиннера принцип подкрепления. Теория оперантного обусловливания берреса скиннера

Введение

Основной постулат теории научения состоит в том, что почти всякое поведение усваивается в результате научения. Например, любая психопатология понимается как усвоение неадаптивного поведения или как неудача при усвоении адаптивного поведения. Вместо того чтобы говорить о психотерапии, сторонники теорий научения говорят о модификации поведения и о поведенческой терапии. Нужно модифицировать или изменять конкретные действия, вместо того чтобы разрешать внутренние конфликты, лежащие в основе этих действий, или реорганизовывать личность. Так как большинство видов проблемного поведения было когда-то усвоено, от них можно отказаться или как-то их изменить, используя специальные процедуры, основанные на законах обучения.

Еще более существенной чертой этих подходов является ориентация на объективность и научную строгость, на проверяемость гипотез и экспериментальный контроль переменных.

Сторонники теории научения манипулируют параметрами внешней среды и наблюдают последствия этих манипуляций в поведении. Теории научения иногда называют психологией S-R (стимула - реакции ).

Научение - (обучение, учение) - процесс приобретения субъектом новых способов осуществления поведения и деятельности, их фиксации и/или модификации. Изменение психологических структур, которое происходит в результате этого процесса, обеспечивает возможность дальнейшего совершенствования деятельности.

Теории научения в психологии исходят из двух основных положений:

- Всякое поведение усваивается в процессе научения.
- В целях соблюдения научной строгости при проверке гипотез необходимо соблюдать принцип объективности данных. В качестве переменных, которыми можно манипулировать, выбираются внешние причины (пищевое вознаграждение), в отличие от "внутренних" переменных в психодинамическом направлении (инстинкты, защитные механизмы, Я-концепция), которыми манипулировать нельзя.

К закономерностям научения относятся:

- Закон готовности: чем сильнее потребность, тем успешнее научение.
- Закон эффекта: поведение, которое приводит к полезному действию, вызывает снижение потребности и поэтому будет повторяться.
- Закон упражнения: при прочих равных условиях повторение определенного действия облегчает совершение поведения и приводит к более быстрому выполнению и снижению вероятности ошибок.
- Закон недавности: лучше заучивается тот материал, который предъявляется в конце серии. Этот закон противоречит эффекту первичности - тенденции к лучшему заучиванию материала, который предъявляется в начале процесса научения. Противоречие устраняется при формулировке закона "эффект края". U-образная зависимость степени заученности материала от его места в процессе научения отражает этот эффект и называется "позиционной кривой".
- Закон соответствия: существует пропорциональное отношение между вероятностью ответа и вероятностью подкрепления.

Существуют три основные теории научения:

- теория классического обусловливания И.П. Павлова;
- теория оперантного обусловливания Б.Ф. Скиннера;
- теория социального научения А. Бандуры.

Теория классического обусловливания берет свое начало с учения И.П. Павлова (1849-1936) об образовании условных рефлексов. Иван Петрович Павлов (1849-1936) был русским физиологом, который в ходе своих исследований процесса пищеварения разработал метод изучения поведения и принципы научения, оказавшие глубокое воздействие на всю психологическую науку.

В конце XIX - начале XX в. Павлов занимался исследованием секреции желудочного сока у собак. В ходе этих экспериментов он, среди прочего, вкладывал некоторое количество корма в пасть собаки и измерял, сколько слюны выделяется в результате. Случайно он обратил внимание на то, что после нескольких таких опытов собака начинает выделять слюну на определенные стимулы еще до того, как пища попадает ей в рот. Слюноотделение "происходило в ответ на такие сигналы, как появление миски с едой или появление человека, который обычно приносил пищу. Другими словами, стимулы, которые первоначально не приводили к данной реакции (так называемые нейтральные стимулы), затем могли вызывать слюноотделение из-за того, что ассоциировались с кормом, который автоматически заставлял собаку выделять слюну. Это наблюдение натолкнуло Павлова на идею проведения выдающихся исследований, в результате которых был открыт процесс, получивший название процесса выработки классического условного рефлекса, или процесса классического обусловливания.

Принципы классического обусловливания. И.П. Павлов первым открыл, что респондентное поведение может быть классически обусловленным. Суть процесса классического обусловливания состоит в том что изначально нейтральный стимул начинает вызывать реакцию благодаря своей ассоциативной связи со стимулом, который автоматически (безусловно) порождает такую же или очень похожую реакцию.

Иначе говоря, еда, в случае с собакой, рассматривается как безусловный стимул (БС), а слюноотделение - как безусловная реакция или безусловный рефлекс (БР). Это происходит потому, что слюноотделение - автоматическая, рефлекторная реакция на пищу. Нейтральный стимул - например, звонок - не вызовет слюноотделения. Однако если в ряде опытов непосредственно перед предложением пищи звонит звонок, то его звук сам по себе, без следующего за ним появления пищи может вызвать реакцию слюноотделения. В этом случае речь идет о процессе обусловливания, так как слюноотделения происходит вслед за звонком без предъявления пищи. В этом смысле звонок можно отнести к условным стимулам (УС) а слюно отделение - к условным реакциям, или условным рефлексам (УР).

На основании вышеизложенного можно сказать, что основная схема условного рефлекса И.П. Павлова S - > R, где S - стимул R реакция Из данной схемы видно, что основной путь управления ведением - это управление предъявлением стимулов, вызывающий определенную реакцию, внешним окружением, контроль над ним Организуя определенным образом окружение, вырабатывая условные рефлексы, можно формировать определенное поведение у человека.

Элементами классического обусловливания при этом являются - безусловный стимул (БС), безусловная реакция (БР), условный стимул (УС) и условная реакция (УР).

И.П. Павлов показал, что формирование условного рефлекса подчиняется ряду требований:

- важнейшим из них является смежность (совпадение по времени индифферентного и безусловного раздражителей, с некоторым опережением индифферентного раздражителя);
- не менее важным условием является повторение (многократное сочетание индифферентного и безусловного раздражителей).

Несмотря на то, что вначале Павлов проводил экперименты на животных, другие исследователи начали изучать основные процессы классического обусловливания на людях.

Теория оперантного обусловливания связана с именами Эдварда Ли Торндайка (E. L. Thorndike) и Берреса Скиннера (B. F. Skinner). В отличие от принципа классического обусловливания (S->R), они разработали принцип оперантного обусловливания (R->S), согласно которому поведение контролируется его результатами и последствиями. Основной путь воздействия на поведение, исходя из этой формулы, - влияние на его результаты.

теория научение условный рефлекс

Как уже и говорилось ранее, респондентное поведение - это версия Б.Ф. Скиннера павловского представления о поведении, которое он называл обусловливанием типа S, чтобы подчеркнуть важность стимула, который появляется до реакции и выявляет ее. Однако Скиннер полагал, что в целом поведение животных и человека нельзя объяснять в терминах классического обусловливания. Скиннер делал акцент на поведении, не связанном с какими-либо известными стимулами. Он утверждал, что в основном на ваше поведение воздействуют стимульные события, которые наступят после него, а именно - его последствия. Так как этот тип поведения предполагает, что организм активно воздействует на окружение с целью изменить события каким-то образом, Скиннер определил его как оперантное поведение. Он также называл его обусловливание типа Я., чтобы подчеркнуть воздействие реакции на будущее поведение.

Итак, ключевая структурная единица бихевиористского подхода в целом и скиннеровского подхода в особенности - это реакция. Реакции можно ранжировать от простых рефлекторных реакций (например, слюноотделение на пищу, вздрагивание на громкий звук) до сложного паттерна поведения (например, решение математической задачи, скрытые формы агрессии).

Реакция - это внешняя, наблюдаемая часть поведения, которую можно связать с событиями окружающей среды. Сущность процесса научения - это установление связей (ассоциаций) реакций с событиями внешней среды.

В своем подходе к научению Скиннер проводил различие между реакциями, которые вызываются четко определенными стимулами (например, мигательный рефлекс в ответ на дуновение воздуха), и реакциями, которые нельзя связать ни с одним стимулом. Эти реакции второго типа порождаются самим организмом и называются операн-тами. Скиннер считал, что стимулы среды не принуждают организм вести себя определенным образом и не побуждают его действовать. Исходная причина поведения находится в самом организме.

Оперантное поведение (вызванное оперантным научением) определяется событиями, которые следуют за реакцией. То есть за поведением идет следствие, и природа этого следствия изменяет тенденцию организма повторять данное поведение в будущем. Например, катание на роликовой доске, игра на фортепиано, метание дротиков и написание собственного имени - это образцы оперантной реакции, или операнты, контролируемые результатами, следующими за соответствующим поведением. Это произвольные приобретенные реакции, для которых не существует стимула, поддающегося распознаванию. Скиннер понимал, что бессмысленно рассуждать о происхождении оперантного поведения, так как нам неизвестны стимул или внутренняя причина, ответственная за его появление. Оно происходит спонтанно.

Если последствия благоприятны для организма, тогда вероятность повторения операнта в будущем усиливается. Когда это происходит, говорят, что последствия подкрепляются, и оперантные реакции, полученные в результате подкрепления (в смысле высокой вероятности его появления), обусловились. Сила позитивного подкрепляющего стимула таким образом определяется в соответствии с его воздействием на последующую частоту реакций, которые непосредственно предшествовали ему.

И напротив, если последствия реакции не благоприятны и не подкреплены, тогда вероятность получить оперант уменьшается. Скиннер полагал, что, следовательно, оперантное поведение контролируется негативными последствиями. По определению, негативные, или аверсивные последствия, ослабляют поведение, порождающее их, и усиливают поведение, устраняющее их.

Оперантное научение можно представить как процесс обучения, основанный на связи раздражитель-реакция-подкрепление, в рамках которой поведение формируется и поддерживается в силу тех или иных его последствий.

Примером оперантного поведения служит ситуация, встречающаяся почти в каждой семье, где есть маленькие дети, а именно - оперантное научение поведению плача. Как только маленькие дети испытывают боль, они плачут, и немедленная реакция родителей - выразить внимание и дать другие позитивные подкрепления. Так как внимание является подкрепляющим фактором для ребенка, реакция плача становится естественно обусловленной. Однако плач может возникать и тогда, когда боли нет. Хотя большинство родителей утверждают, что они могут различать плач от расстройства и плач, вызванный желанием внимания, все же многие родители упорно подкрепляют последний.

В 1969 году Альберт Бандура (1925) - канадский психолог выдвинул свою теорию личности, названную теорией социального обучения.

А. Бандура критиковал радикальный бихевиоризм, который отрицал детерминанты поведения человека, возникающие из внутренних когнитивных процессов. Для Бандуры индивиды не являются ни автономными системами, ни простыми механическими передатчиками, оживляющими влияния окружения - они обладают высшими способностями, которые позволяют им предсказывать появление событий и создавать средства для осуществления контроля над тем, что влияет на их повседневную жизнь. Учитывая, что традиционные теории поведения могли быть неверными, это давало скорее неполное, чем неточное объяснение поведению человека.

С точки зрения А. Бандуры, люди не управляются интрапсихическими силами и не реагируют на окружение. Причины функционирования человека нужно понимать в терминах непрерывного взаимодействия поведения, познавательной сферы и окружения. Данный подход к анализу причин поведения, который Бандура обозначил как взаимный детерминизм, подразумевает, что факторы предрасположенности и ситуационные факторы являются взаимозависимыми причинами поведения.

Функционирование человека рассматривается как продукт взаимодействия поведения, личностных факторов и влияния окружения.

Проще говоря, внутренние детерминанты поведения, такие как вера и ожидание, и внешние детерминанты, такие как поощрение и наказание, являются частью системы взаимодействующих влияний, которые действуют не только на поведение, но также на различные части системы.

Разработанная Бандурой модель-триада взаимного детерминизма показывает, что хотя на поведение влияет окружение, оно также частично является продуктом деятельности человека, то есть люди могут оказывать какое-то влияние на собственное поведение. Например, грубое поведение человека на званом вечере может привести к тому, что действия присутствующих рядом людей будут, скорее, наказанием, а не поощрением для него. Во всяком случае, поведение изменяет окружение. Бандура также утверждал, что благодаря своей необычайной способности использовать символы люди могут думать, творить и планировать, то есть они способны к познавательным процессам, которые постоянно проявляются через открытые действия.

Каждая из трех переменных в модели взаимного детерминизма способна влиять на другую переменную. В зависимости от силы каждой из переменных доминирует то одна, то другая, то третья. Иногда наиболее сильны влияния внешнего окружения, иногда доминируют внутренние силы, а иногда ожидание, вера, цели и намерения формируют и направляют поведение. В конечном итоге, однако, Бандура полагает, что по причине двойной направленности взаимодействия между открытым поведением и окружающими обстоятельствами люди являются и продуктом, и производителем своего окружения. Таким образом, социально-когнитивная теория описывает модель взаимной причинности, в которой познавательные, аффективные и другие личностные факторы и события окружения работают как взаимозависимые детерминанты.

Предвиденные последствия. Исследователи научения делают акцент на подкреплении как на необходимом условии для приобретения, сохранения и модификации поведения. Так, Скиннер утверждал, что внешнее подкрепление обязательно для научения.

А. Бандура, хотя и признает важность внешнего подкрепления, но не рассматривает его как единственный способ, при помощи которого приобретается, сохраняется или изменяется наше поведение. Люди могут учиться наблюдая или читая, или слыша о поведении других людей. В результате предыдущего опыта люди могут ожидать, что определенное поведение будет иметь последствия, которые они ценят, другое - произведет нежелательный результат, а третье - окажется малоэффективным. Наше поведение, следовательно, регулируется в значительной мере предвиденными последствиями. В каждом случае мы имеем возможность заранее вообразить последствия неадекватной подготовки к действию и принимаем необходимые меры предосторожности. Посредством нашей способности представлять действительный исход символически будущие последствия можно перевести в сиюминутные побудительные факторы, которые влияют на поведение во многом так же, как и потенциальные последствия. Наши высшие психические процессы дают нам способность предвидения.

В центре социально-когнитивной теории лежит положение о том, что новые формы поведения можно приобрести в отсутствие внешнего подкрепления. Бандура отмечает, что многое в поведении, которое мы демонстрируем, приобретается посредством примера: МЫ просто наблюдаем, что делают другие, а затем повторяем их действия. Этот акцент на научении через наблюдение или через пример, а не на прямом подкреплении, является наиболее характерной чертой теории Бандуры.

Саморегуляция и познание в поведении. Другой характерной чертой социально-когнитивной теории является то, что важную роль она отдает уникальной способности человека к саморегуляции. Устраивая свое непосредственное окружение, обеспечивая когнитивную поддержку и осознавая последствия своих собственных действий, люди способны оказывать некоторое влияние на свое поведение. Разумеется, функции саморегуляции создаются и не так уж редко поддерживаются влиянием окружения. Таким образом, они имеют внешнее происхождение, однако не следует преуменьшать тот факт, что однажды установившись, внутренние влияния частично регулируют то, какие действия выполняет человек. Далее, Бандура утверждает, что высшие интеллектуальные способности, например способность оперировать символами, дают нам мощное средство воздействия на наше окружение. Посредством вербальных и образных репрезентаций мы производим и сохраняем опыт таким образом, что он служит ориентиром для будущего поведения. Наша способность формировать образы желаемых будущих результатов выливается в бихевиоральные стратегии, направленные на то, чтобы вести нас к отдаленным целям. Используя способность к оперированию символами, мы можем решать проблемы, не обращаясь к методу проб и ошибок, можем, таким образом, предвидеть вероятные последствия различных действий и соответственно изменять наше поведение.

Заключение

Термином научение обозначают относительно постоянное изменение поведенческого потенциала в результате практики или приобретенного опыта. В этом определении содержатся три ключевые элемента:

1) совершившееся изменение обычно отличается устойчивостью и длительностью;
2) изменение претерпевает не само поведение, а потенциальные возможности для его осуществления (субъект может научиться чему-то не изменяющему его поведение в течение долгого времени или не влияющему на него вообще никогда);
3) научение требует приобретения некоторого опыта (так, оно не происходит просто в результате взросления и роста).

Отталкиваясь от работ Павлова и Торндайка, ранние представители "теории научения", господствовавшей в психологической науке Соединенных Штатов Америки практически всю первую половину XX века, направляли свои изыскания на инструментальное поведение. Они исследовали те его виды, которые влекли за собой последствия. Изучению подвергалось, например, поведение крысы, перемещающейся по лабиринту для нахождения выхода и получения пищи. При этом измеряли такие величины, как количество времени, требующееся крысе для достижения цели в ходе каждой из повторяющихся попыток. Аналогично исследованию Торндайка, процедура состояла в том, что крыса помещалась в начало лабиринта, а затем производилась оценка ее продвижения к выходу. Главным анализируемым показателем было количество попыток, требующихся крысе для того, чтобы она, наконец, смогла пройти весь лабиринт, не совершая ошибок (таких, как попадание в тупиковые коридоры).

Представители теории научения несколько отошли от строгого бихевиоризма. Они использовали такие понятия, как научение, мотивация, движущие силы, побуждения, психическое торможение, которые обозначали невидимое поведение. По утверждению выдающегося теоретика научения Кларка Халла (1884-1952), эти понятия являются научными настолько, насколько их можно определить в терминах наблюдаемых операций (см. Hull, 1943). Например, операциональное определение наличия голода или "потребности в насыщении" можно выдвинуть исходя из количества часов пищевой депривации, испытываемой крысой перед экспериментом, или из снижения веса тела крысы относительно нормального. В свою очередь, операциональное определение научения можно дать в терминах прогрессирующего снижения от попытки к попытке количества времени, необходимого крысе для достижения выхода из лабиринта (или кошке для освобождения из проблемного ящика). Теперь теоретики могли задаться такими требующими исследования вопросами, как: "Происходит ли обучение быстрее, если усиливается мотив удовлетворения пищевой потребности"? Оказывается, происходит, но лишь до определенного момента. После этого момента у крысы просто не остается сил, чтобы пройти лабиринт.

Исследователи научения изобретали формулы для научения и поведения посредством усреднения поведения большого числа отдельных испытуемых и постепенно выводили общие "законы" научения. Одним из них является классическая кривая научения, распространяющаяся на многие типы поведения человека, которая показана. Так, научение некоторому навыку, например игре на музыкальном инструменте, характеризуется быстрым улучшением мастерства на начальных этапах, но затем темпы улучшения все более и более замедляются. Предположим, что ребенок учится играть на гитаре. Сначала он быстро развивает гибкость и послушность пальцев, навыки перебора струн и выставления аккордов; но если ему и суждено стать виртуозом, то это потребует немало лет практики. Кривая научения довольно хорошо подходит для иллюстрации возникновения многих сложных навыков человека, несмотря на то, что ее создали на основании наблюдений за улучшением прохождения лабиринта крысами с течением времени.

Некоторые другие закономерности, выявленные представителями классической теории научения, также распространяются на поведение человека. Однако существует и большой ряд тех из них, которые не подлежат такому переносу. От поиска универсальных для всех видов животных принципов обучения, по большей части, отказались в пользу видоспецифических принципов.

Отдельную линию в развитии бихевиоризма представляет система взглядов Б. Скиннера. Беррес Фредерик Скиннер (1904-1990) выдвинул теорию оперантного бихевиоризма .

Основываясь на экспериментальных исследованиях и теоретическом анализе поведения животных, он сформулировал положение о трех видах поведения: безусловно-рефлекторном , условно-рефлекторном и оперантном . Последнее и составляет специфику учения Б. Скиннера.

Первые два вида вызываются стимулами (S) и называются респондентным , отвечающим поведением. Это реакции обусловливания типа S. Они составляют определенную часть репертуара поведения, но ими одними не обеспечивается адаптация к реальной среде обитания. Реально процесс приспособления строится на основе активных проб - воздействий организма на окружающий мир. Некоторые из них случайно могут приводить к полезному результату, который в силу этого закрепляется. Часть из таких реакций (R), не вызываемых стимулом, а выделяемых («испускаемых») организмом, оказывается правильными и подкрепляются. Их Скиннер и назвал оперантными. Это реакции типа R.

Оперантное поведение предполагает, что организм активно воздействует на окружение и в зависимости от результатов этих активных действий они закрепляются или отвергаются. По Скиннеру, именно эти реакции - преобладающие в адаптации животного: они являются формой произвольного поведения. Катание на роликовой доске, игра на фортепиано, обучение письму - это все примеры оперантных действий человека, контролируемых их последствиями. Если последние благоприятны для организма, тогда вероятность повторения оперантной реакции усиливается.

Проанализировав поведение, Скиннер сформулировал свою теорию научения. Главным средством формирования нового поведения выступает подкрепление. Вся процедура научения у животных получила название «последовательного наведения на нужную реакцию».

Скиннер выделяет четыре режима подкрепления:

Режим подкрепления с постоянным соотношением, когда уровень положительного подкрепления зависит от количества правильно выполненных действий. (Например, работнику платят пропорционально количеству произведенной продукции, т. е. чем чаще возникает правильная реакция организма, тем больше подкреплений он получает.)
Режим подкрепления с постоянным интервалом, когда организм получает подкрепление после того, как пройдет строго фиксированное время с момента предыдущего подкрепления. (Например, работнику платят зарплату через каждый месяц или у студента сессия через каждые четыре месяца, при этом скорость реагирования ухудшается сразу после получения подкрепления - ведь следующая зарплата или сессия будет еще не скоро.)
Режим подкрепления с вариативным соотношением. (Например, выигрыш-подкрепление в азартной игре бывает непредсказуем, непостоянен, человек не знает, когда и каким будет следующее подкрепление, но всякий раз надеется на выигрыш - такой режим значимо воздействует на поведение человека.)
Режим подкрепления с вариативным интервалом. (Через неопределенные интервалы времени человек получает подкрепления или знания студента контролируют с помощью «неожиданных контрольных» через случайные промежутки времени, что побуждает соблюдать более высокий уровень прилежания и реагирования в отличие от подкрепления с «постоянным интервалом».)

Скиннер выделял «первичные подкрепления» (пища, вода, физический комфорт, секс) и вторичные, или условные (деньги, внимание, хорошие оценки, привязанность и т. п.). Вторичные подкрепления генерализуются, объединяются со многими первичными: например, деньги являются средством для получения множества удовольствий. Еще более сильным генерализованным условным подкреплением является социальное одобрение: ради его получения со стороны родителей, окружающих человек стремится хорошо себя вести, соблюдать социальные нормы, прилежно учиться, делать карьеру, красиво выглядеть и т. п.

Ученый полагал, что условные подкрепляющие стимулы очень важны в контроле поведения человека, а аверсивные (болевые или неприятные) стимулы, наказание - это наиболее общий метод контроля над поведением. Скиннер выделял позитивные и негативные подкрепления, а также позитивные и негативные наказания (табл. 5.2).

Таблица 5.2.

Скиннер боролся против того, чтобы использовать наказание для контроля над поведением, потому что это вызывает отрицательные эмоциональные и социальные побочные эффекты (страх, тревогу, антисоциальные действия, ложь, потерю самоуважения и уверенности). Кроме того, оно всего лишь на время подавляет нежелательное поведение, которое вновь проявится, если уменьшится вероятность наказания.

Вместо аверсивного контроля Скиннер рекомендует позитивное подкрепление как наиболее эффективный метод для устранения нежелательных и поощрения желательных реакций. «Метод успешного приближения или формирования поведения» заключается в положительном подкреплении тех действий, которые наиболее близки к ожидаемому оперантному поведению. К этому приближаются шаг за шагом: одна реакция закрепляется, а затем заменяется другой, более близкой к предпочтительной (так формируют речь, трудовые навыки и т. п.).

Данные, полученные при изучении поведения животных, Скиннер перенес на поведение людей, что привело к биологизаторской трактовке. Так, возник скиннеровский вариант программированного обучения. Его принципиальная ограниченность состоит в сведении обучения к набору внешних актов поведения и подкреплению правильных из них. При этом игнорируется внутренняя познавательная деятельность человека, следовательно, нет обучения как сознательного процесса. Вслед за установкой уотсоновского бихевиоризма Скиннер исключает внутренний мир человека, его сознание из поведения и производит бихевиоризацию психики. Мышление, память, мотивы и тому подобные психические процессы он описывает в терминах реакции и подкрепления, а человека - как реактивное существо, подвергающееся воздействиям внешних обстоятельств.

Биологизация мира людей, характерная для бихевиоризма в целом, принципиально не проводящего различий между человеком и животным, достигает у Скиннера своих пределов. Культурные явления оказываются в его трактовке «хитроумно придуманными подкреплениями».

Для разрешения социальных проблем современного общества Б. Скиннер выдвинул задачу создания технологии поведения , которая призвана осуществлять контроль одних людей над другими. Поскольку намерения, желания, самосознание человека не принимаются во внимание, управление поведением не связано с сознанием. Таким средством выступает контроль за режимом подкреплений, позволяющий манипулировать людьми. Для наибольшей эффективности необходимо учитывать, какое подкрепление наиболее важно, значимо, ценно в данный момент (закон субъективной ценности подкрепления ), а затем предоставлять такое субъективно ценное подкрепление в случае правильного поведения человека или угрожать его лишением в случае неправильного поведения. Подобный механизм и позволит управлять поведением.

Скиннер сформулировал закон оперантного обусловливания:

«поведение живых существ полностью определяется последствиями, к которым оно приводит. В зависимости от того, будут ли эти последствия приятными, безразличными или неприятными, живой организм проявит тенденцию повторять данный поведенческий акт, не придавать ему никакого значения или же избегать его повторения в дальнейшем».

Человек способен предвидеть возможные последствия своего поведения и избегать тех действий и ситуаций, которые приведут к негативным для него последствиям. Он субъективно оценивает вероятность их наступления: чем больше возможность негативных последствий, тем сильнее это влияет на поведение человека (закон субъективной оценки вероятности последствий ). Эта субъективная оценка может не совпадать с объективной вероятностью последствий, но на поведение влияет именно она. Поэтому один из способов воздействовать на поведение человека - «нагнетание обстановки», «запугивание», «преувеличение вероятности негативных последствий». Если человеку кажется, что последняя, вытекающая из какой-либо его реакции, незначительна, он готов «рискнуть» и прибегнуть к данному действию.

Психологические понятия - научение, обучение, учение описывают широкий круг явлений, связанных с приобретением опыта, знаний, навыков, умений в процессе активного взаимоотношения субъекта с предметным и социальным миром - в поведении, деятельности, общении.

Когда речь идет о научении, то исследователь имеет в виду такие аспекты этого процесса как:

Постепенность изменения;

Роль упражнения;

Специфику научения по сравнению с врожденными особенностями индивида.

Обычно термины обучение и учение обозначают процесс приобретения индивидуального опыта, а термин "научение" описывает и сам процесс, и его результат.
Итак, научение (обучение, учение) - процесс приобретения субъектом новых способов осуществления поведения и деятельности, их фиксации и/или модификации. Изменение психологических структур, которое происходит в результате этого процесса, обеспечивает возможность дальнейшего совершенствования деятельности.
Известны классические концепции научения. Это, например, учение И.П. Павлова (1849-1936) об образовании условных рефлексов. В результате одного или нескольких предъявлений индифферентного разграничителя (условного стимула) и следующего за ним безусловного стимула (пищи), который вызывает безусловную, врожденную реакцию (слюноотделение), индифферентный раздражитель сам начинает вызывать реакцию. В процессе установления временной связи безусловный стимул выполняет функцию подкрепления, условный - сигнальное значение, а рефлекс способствует адаптации организма к меняющимся условиям среды.
Впервые закономерности научения, установленные экспериментальными методами, были установлены в рамках бихевиоризма. Эти закономерности, или "законы обучения", сформулированы Э. Торндайком и дополнены, а также модифицированы К. Халлом, Э. Толменом и Э. Газри.

Ими являются:

Закон готовности: чем сильнее потребность, тем успешнее научение. Закон выводится на основе установления связи между потребностью и научением.

Закон эффекта: поведение, которое приводит к полезному действию, вызывает снижение потребности и поэтому будет повторяться.

Закон упражнения: при прочих равных условиях повторение определенного действия облегчает совершение поведения и приводит к более быстрому выполнению и снижению вероятности ошибок. Позже Торндайк показал, что не всегда упражнение, повторение способствует упрощению навыка, хотя при моторном научении это фактор является очень важным, способствуя модификации поведения.

Закон недавности: лучше заучивается тот материал, который предъявляется в конце серии. Этот закон противоречит эффекту первичности - тенденции к лучшему заучиванию материала, который предъявляется в начале процесса научения. Противоречие устраняется при формулировке закона "эффект края". U-образная зависимость степени заученности материала от его места в процессе научения отражает этот эффект и называется "позиционной кривой".

Закон соответствия: существует пропорциональное отношение между вероятностью ответа и вероятностью подкрепления.

Теперь обратимся к теориям научения в психологии личности.
Теории исходят из двух положений:

1. Всякое поведение усваивается в процессе научения.

2. В целях соблюдения научной строгости при проверке гипотез необходимо соблюдать принцип объективности данных. В качестве переменных, которыми можно манипулировать, выбираются внешние причины (пищевое вознаграждение), в отличие от "внутренних" переменных в психодинамическом направлении (инстинкты, защитные механизмы, Я-концепция), которыми манипулировать нельзя.

В теориях научения (И.П. Павлов) приспособление рассматривается как аналог развития человека. Оно может осуществляется разными путями, например посредством классического обусловливания по Павлову.

При этом были исследованы важные феномены:

Генерализация - условная реакция на первоначально нейтральный стимул распространяется и на другие стимулы, похожие на условный раздражитель (страх, возникший на конкретную собаку, затем распространяется на всех собак).

Дифференцировка - специфичная реакция на похожие стимулы, которые различаются по степени подкрепления (например, дифференцировка реакций на круг и эллипс).

Угашение - разрушение связи между условным стимулом и реакцией, если он не сопровождается подкреплением.

Типичный эксперимент заключался в том, что собаку закрепляли ремнями, ограничивая ее движение, затем включали свет. Через 30 секунд, после того как зажигался свет, в рот собаки клали немного пищи, что вызывало слюноотделение. Сочетание включения света и пищи повторяли несколько раз. Через какое-то время свет, изначально выступавший индифферентным раздражителем, сам по себе начинал вызывать реакцию слюноотделения.
Аналогичным образом можно выработать условные оборонительные реакции на первоначально нейтральные стимулы. В первых исследованиях по оборонительному обусловливанию на собаку надевали специальную упряжь, чтобы удерживать ее в станке, а к лапе прикрепляли электроды. Подача электрического тока (безусловный раздражитель) на лапу вызывала отдергивание лапы (безусловный рефлекс), которое было рефлекторной реакцией животного. Если непосредственно перед ударом током несколько раз звонил звонок, то постепенно звук сам по себе был способен вызывать оборонительный рефлекс отдергивания лапы.
По терминологии И.П. Павлова, пища (или удар током) были безусловными раздражителями, а свет (или звук) - условным. Слюноотделение (или отдергивание лапы) при появлении пищи (или ударе током) были названо безусловным рефлексом, а слюноотделение на включение света (или отдергивание лапы на звук) - условным. Реакции, которые изучал Павлов, стали называть ответными, или респондентными, поскольку они автоматически возникали вслед за известными стимулами (пищей, ударом тока). Ведущим в модели И.П. Павлова является стимул, манипуляция которым приводит к возникновению новых форм поведения.
Итак, классическое обусловливание - это процесс, открытый И.П. Павловым, благодаря которому первоначально нейтральный стимул начинает вызывать реакцию из-за своей ассоциативной связи со стимулом, автоматически порождающим ту же самую или похожую реакцию.
Теория, разработанная Б.Ф. Скиннером (1904-1990), носит название теории оперантного обусловливания. Он говорил, что ученый, как и всякий другой организм, является продуктом уникальной истории. Поприще, которое он выберет для себя в качестве предпочтительного, частично будет зависеть от его личной биографии.
Интерес к формированию и модификации поведения возник у Скиннера после знакомства с работой И.П. Павлова "Условные рефлексы" и статьей (критической по своей направленности) Бертрана Рассела. Статьи последнего не только не оттолкнули от павловских идей, но, наоборот, усилили их влияние.
Скиннер ставил перед собой цель объяснить механизмы научения у человека и животных (крыс и голубей) на основе ограниченного набора базовых принципов. Основная идея состояла в том, чтобы управлять средой, контролировать ее, получая при этом упорядоченные изменения. Он говорил: "Проконтролируйте условия (среду), и вам откроется порядок".

Определение оперантного обусловливания

Процедура обучения получила название - "оперантное обусловливание". Она заключалась в стремлении экспериментатора установить связь между стимулом (S) и реакцией (R) посредством подкрепления - поощрения или наказания. В схеме стимул-реакция (S-R) ключевой для Скиннера была именно реакция. Реакции рассматривались с точки зрения простоты-сложности. Простая - слюноотделение, отдергивание руки; сложная - решение математической задачи, агрессивное поведение.
Оперантное обусловливание - это процесс, посредством которого характеристики реакции детерминируются последствиями этой реакции.
Далее, Скиннер различал (1) реакции, которые вызываются определенными стимулами (отдергивание руки от горячего предмета) - в этом случае связь стимула и реакции безусловна; и (2) реакции, которые непосредственно не связаны со стимулом. Последние реакции продуцируются самим организмом и называются оперантами. Скиннер считал, что сами по себе стимулы не принуждают индивида реагировать на них. Исходная причина лежит в самом организме. В любом случае поведение происходит без воздействия какого-то специального побуждающего стимула. Осуществление оперантного поведения заложено в биологической природе организма. Научение рассматривалось Скиннером как процесс. Ни один (особенно сложный) оперант не возникает сразу. Процесс представляет собой поощрение оперантного поведения животного. Поощрение или наказание - это подкрепление, или стимул, который следует за реакцией и увеличивает вероятность ее появления. Когда голубь тычет клювом в диск (или крыса нажимает лапой на рычаг) - это оперантное поведение, при котором, если оно сопровождается подкреплением, увеличивается вероятность его повторения. "Оперантное обусловливание формирует поведение так же, как скульптор лепит фигуру из глины. Хотя в какой-то момент скульптор, казалось бы, создает совершенно новый объект, мы всегда можем вернуться назад, в начало процесса, к первоначальной недифференцированной болванке и выделить сколь угодно маленькие шаги, или последовательные этапы, следуя которым можно дойти до нужной кондиции. Ни в какой отдельно взятый момент не может появиться ничего такого, что очень сильно отличалось бы от того, что ему предшествовало… Оперант - это не то, что появляется в поведении уже полностью в готовом виде. Это результат непрерывного процесса формирования" (цит. по: Первин Л., Джон О. Психология личности. Теория и исследования. М., 2000. С.350).

Принципы оперантного обусловливания

Подкрепление является одним из принципов обусловливания. Уже с младенческого возраста, согласно Скиннеру, поведение людей можно регулировать с помощью подкрепляющих стимулов. Существуют два разных вида подкрепления. Некоторые, например еда или устранение боли, называются первичными подкреплениями, т.к. они обладают естественной подкрепляющей силой. Другие подкрепляющие стимулы (улыбка, внимание взрослого, одобрение, похвала) являются обусловленными подкреплениями. Они становятся таковыми в результате частого сочетания с первичными подкреплениями.
Оперантное обусловливание опирается в основном на положительное подкрепление, т.е. на такие последствия реакций, которые их поддерживают или усиливают, например, пища, денежное вознаграждение, похвала. Тем не менее Скиннер подчеркивает важность негативного подкрепления, которое приводит к угасанию реакции. Такими подкрепляющими стимулами могут быть физическое наказание, моральное воздействие, психологическое давление. При наказании неприятный стимул следует за реакцией, уменьшая вероятность того, что реакция появится вновь. Скиннер с сожалением замечал, что наказание - "это самая распространенная техника контроля над поведением, применяемая в современном мире. Схема всем известна: если мужчина ведет себя не так, как вам нравится, ударьте его кулаком, если ребенок плохо себя ведет, отшлепайте его, если люди в другой стране плохо себя ведут, сбросьте на них бомбу" (цит. по: Крэйн У. Секреты формирования личности. СПб.: Прайм-Еврознак, 2002. С. 241).
Кроме подкрепления, принципом обусловливания является его незамедлительность. Было обнаружено, что в начальной стадии эксперимента можно довести реакцию до наивысшего уровня только в том случае, если подкреплять ее немедленно. Иначе реакция, начавшая было формироваться, быстро угаснет.
При оперантном, так же как и при респондентном, обусловливании наблюдается генерализация стимулов. Генерализация - это возникшая в процессе обусловливания ассоциативная связь реакции со стимулами, похожими на те, на которые первоначально был выработан условный рефлекс. Примерами генерализации являются - страх перед всеми собаками, который сформировался вследствие нападения какой-то одной собаки, положительная реакция ребенка (улыбка, произнесение слова "папа", движение на встречу и проч.) на всех мужчин, похожих на его отца.
Формирование реакции представляет собой процесс. Реакция не возникает сразу и вдруг, она оформляется постепенно, по мере осуществления ряда подкреплений. Последовательное подкрепление - это выработка сложных действий с помощью подкрепления действий, которые постепенно все больше становятся похожими на ту окончательную форму поведения, которую предполагалось сформировать. Сплошное поведение формируется в процессе подкрепления отдельных элементов поведения, которые в совокупности складываются в сложные действия. Т.е. серия первоначально усвоенных действий в конечной форме воспринимается как целостное поведение.
Сам процесс поддерживается так называемым режимом подкрепления. Режим подкрепления - процент и интервал подкрепления реакций. Для исследования режимов подкреплений Скиннер изобрел ящик Скиннера (Skinner box), благодаря которому он наблюдал за поведением животных. Схематически это выглядит так:
S1 - R - S2,
где S1 - рычаг;
R - нажатие на рычаг;
S2 - пища (подкрепление).
Поведение контролируется при помощи изменения условий среды (или подкрепления). Их, например, можно давать (1) через определенный промежуток времени, независимо от числа реакций; (2) через определенное число реакций (нажатие на рычаг) и др.

Режимы подкрепления

Были выделены такие режимы подкрепления: непрерывное подкрепление - предъявление подкрепления каждый раз, когда субъект дает желаемую реакцию; прерывистое, или частичное, подкрепление.
Для более строгой классификации режимов подкрепления было выделено два параметра - временное подкрепление и пропорциональное подкрепление. В первом случае подкрепляют только тогда, когда истек срок, в течение которого необходимо было выполнить соответствующую деятельность, во втором подкрепляют за объем той работы (количество действий), которая должна была быть произведена.

На основе двух параметров были описаны четыре режима подкрепления:

1. Режим подкрепления с постоянным соотношением. Подкрепление осуществляется в соответствии с установленным количеством (объемом) реакций. Примером такого режима может быть оплата труда за определенный, постоянный объем работ. Например, оплата труда переводчику за количество переведенных знаков, или машинистке за количество напечатанного материала.

2. Режим подкрепления с постоянным интервалом. Подкрепление производится только тогда, когда твердо установленный, фиксированный временной интервал истек. Например, ежемесячная, понедельная, почасовая оплата, отдых после жестко установленного времени физической или умственной работы.

3. Режим подкрепления с вариативным соотношением. В этом режиме организм подкрепляется на основе какого-то в среднем предопределенного числа реакций. Так, покупка лотерейных билетов может быть примером работы такого режима подкрепления. В данном случае покупка билета означает, что с какой-то вероятностью может выпасть выигрыш. Вероятность возрастает, если покупается не один, а несколько билетов. Однако результат в принципе мало предсказуем и непостоянен, и человеку редко удается вернуть вложенные в покупку билетов деньги. Тем не менее неопределенность результата и ожидание большого выигрыша приводят к очень медленному затуханию реакции и угасанию поведения.

4. Режим подкрепления с вариативным интервалом. Индивид получает подкрепление после того, как проходит неопределенный интервал. Подобно режиму подкрепления с постоянным интервалом, в этом случае подкрепление зависит от времени. Интервал времени произволен. Короткие интервалы, как правило, порождают высокую скорость реагирования, а длинные - низкую. Такой режим применяется в учебном процессе, когда оценка уровня достижений производится нерегулярно.

Скиннер говорил об индивидуальности подкреплений, о вариативности развития того или иного навыка у разных людей, а также у разных животных. Более того, само подкрепление носит уникальный характер, т.к. уверенно нельзя сказать, что у данного человека или животного может выступать в качестве подкрепления.

Рост и развитие личности

По мере того, как ребенок развивается, его реакции усваиваются и остаются под контролем подкрепляющих воздействий со стороны окружающей среды. В виде подкрепляющих воздействий выступают - пища, похвала, эмоциональная поддержка и др. Эта же идея излагается Скиннером в книге "Вербальное поведение" (1957). Он считает, что овладение речью происходит по общим законам оперантного обусловливания. Ребенок получает подкрепление при произнесении определенных звуков. Подкреплением служит не пища или вода, а одобрение и поддержка взрослых.
С критическими замечаниями в адрес концепции Скиннера выступил в 1959 г. известный американский лингвист Н. Хомский. Он отрицал особую роль подкрепления в ходе овладения речью и критиковал Скиннера за пренебрежение синтаксическими правилами, которые играют роль в осознании человеком языковых конструкций. Он считал, что обучение правилам не требует особого учебного процесса, а совершается благодаря врожденному, специфическому речевому механизму, который называется "механизмом овладения речью". Таким образом, овладение речью происходит не в результате научения, а посредством естественного развития.

Психопатология

С точки зрения психологии научения нет необходимости искать объяснение симптомов болезни в скрытых глубинных причинах. Патология, согласно бихевиоризму, не недуг, а либо (1) результат неусвоенной реакции, либо (2) усвоенная неадаптивная реакция.

(1) Неусвоенная реакция или поведенческий дефицит возникает в результате отсутствия подкрепления при формировании необходимых навыков и умений. Депрессия также рассматривается как результат отсутствия подкрепления для формирования или даже поддержания необходимых реакций.

(2) Неадаптивная реакция - результат усвоения действия, неприемлемого для общества, не соответствующего нормам поведения. Такое поведение возникает как следствие подкрепления нежелательной реакции, либо в результате случайного совпадения реакции и подкрепления.

Изменение поведения также построено на принципах оперантного обусловливания, на системе модификации поведения и сопряженных с ним подкреплений.
А. Изменение поведения может происходить вследствие самоконтроля.

Самоконтроль включает в себя две взаимозависимые реакции:

1. Контролирующая реакция, которая воздействует на среду, изменяя вероятность возникновения вторичных реакций ("уход" чтобы не выразить "гнев"; удаление пищи, чтобы отвыкнуть от переедания).

2. Контролирующая реакция, направленная на наличие в ситуации стимулов, которые могут сделать желательное поведение более вероятным (наличие стола для осуществления учебного процесса).

Б. Изменение поведения может происходить и вследствие осуществления поведенческого консультирования. Во многом этот тип консультирования базируется на принципах научения.
Вольпе (Wolpe) определяет терапию поведения как терапию обусловливания, подразумевающую использование сформулированных в процессе экспериментирования принципов научения с целью изменения неадекватного поведения. Неадекватные привычки ослабляются и устраняются; адаптивные привычки, напротив, вводятся и усиливаются.

Цели консультирования:

1) Изменение неадекватного поведения.

2) Научение принятию решения.

3) Предотвращение проблем путем антиципации результатов поведения.

4) Устранение дефицита в поведенческом репертуаре.

Этапы консультирования:

1) Поведенческая оценка, сбор информации о приобретенных действиях.

2) Процедуры релаксации (мышечная, вербальная и т.д.).

3) Систематическая десенсибилизация - связь расслабления с образом, вызывающим тревогу.

4) Тренинг ассертивности

5) Процедуры подкрепления.

Достоинства и недостатки теорий научения

Достоинства:

1. Стремление к строгой проверке гипотез, эксперименту, контролю дополнительных переменных.

2. Признание роли ситуативных переменных, параметров среды и их систематическое изучение.

3. Прагматический подход к терапии позволил создать важные процедуры для изменения поведения.

Недостатки:

1. Редукционизм - сведение принципов поведения, полученных на животных, к анализу поведения человека.

2. Низкая внешняя валидность вызвана проведением экспериментов в лабораторных условиях, результаты которых трудно перенести в естественные условия.

3. Игнорирование когнитивных процессов при анализе S-R связей.

4. Большой разрыв между теорией и практикой.

5. Поведенческая теория не дает стабильных результатов.

Теория оперантного обусловливания (Торндак)

Оперантно-инструментальное научение

Согласно этой теории, большинство форм человеческого поведения произвольны, т.е. оперантны; они становятся более или менее вероятными в зависимости от последствий - благоприятных или неблагоприятных. В соответствии с этой идеей и было сформулировано определение.

Оперантное (инструментальное) научение - вид научения, в котором правильная реакция или изменение поведения подкрепляется и становится более вероятным.

Этот вид научения экспериментально изучали и описали американские психологи Э. Торндайк и Б. Скиннер. Эти учёные внесли в схему научения необходимость подкрепления результатов упражнений.

В основе концепции оперантного научения лежит схема «ситуация - реакция - подкрепление».

Психолог и педагог Э. Торндайк ввёл в схему научения в качестве первого звена проблемную ситуацию, выход из которой сопровождался пробами и ошибками, приводящими к случайному успеху.

Эдуард Ли Торндайк (1874-1949) -- американский психолог и педагог. Проводил исследования поведения животных в «проблемных ящиках». Автор теории научения путем проб и ошибок с описанием так называемой «кривой научения». Сформулировал ряд известных законов научения.

Э. Торндайк проводил эксперимент с голодными кошками, находящимися в проблемных клетках. Помещённое в клетку животное могло выйти из него и получить подкормку, лишь приведя в действие специальное устройство, - нажав на пружину, потянув за петлю и т.п. Животные совершали множество движений, бросались в разные стороны, царапали ящик и т.п., пока одно из движений случайно не оказывалось удачным. С каждым новым успехом у кошки все чаще наблюдаются реакции, ведущие к цели, и все реже - бесполезные.

Рис. 12.

психоаналитический теория оперантный ребенок

«Пробы, ошибки и случайный успех» - такова была формула для всех типов поведения как животных, так и человека. Торндайк высказал предположение, что этот процесс определяется 3 законами поведения:

1)законом готовности - для образования навыка в организме должно иметься состояние, толкающее к активности (например, голод);

2)законом упражнения - чем чаще какое-нибудь действие совершается, тем чаще это действие будет выбираться впоследствии;

3)законом эффекта - чаще повторяется то действие, которое дает положительныйэффект («награждается»).

Касаясь проблем школьного обучения и воспитания, Э. Торндайк определяет «искусство обучения как искусство создавать и задерживать стимулы с тем, чтобы вызвать или предотвратить те или другие реакции» . При этом стимулами могут быть слова, обращенные к ребенку, взгляд, фраза, которую он прочтет и т.д., а ответными реакциями - новые мысли, чувства, действия ученика, его состояние. Можно рассмотреть это положение на примере развития учебных интересов.

Ребенок, благодаря собственному опыту, имеет разнообразные интересы. Задача учителя - увидеть среди них «хорошие» и, исходя из них, развивать интересы, необходимые для обучения. Направляя интересы ребенка в нужное русло, учитель использует три пути. Первый путь - связать выполняемую работу с чем-то важным для ученика, доставляющим ему удовлетворение, например, с положением (статусом) среди сверстников. Второй - использовать механизм подражания: учитель сам интересующийся своим учебным предметом, заинтересует и класс, в котором преподает. Третий - сообщать ребенку такую информацию, которая рано или поздно вызовет интерес к предмету.

Другой известный учёный-бихевиорист Б. Скиннер выявил особую роль подкрепления правильной реакции, что предполагает «конструирование» выхода из ситуации и обязательность правильного ответа (в этом заключалось одно из оснований программированного обучения). Согласно законам оперантного научения поведение определяется событиями, которые последуют за ним. Если последствия благоприятны, то вероятность повторения поведения в будущем усиливается. Если последствия неблагоприятны и не подкреплены, то вероятность поведения уменьшается. Поведению, которое не приводит к должному эффекту, не научаются. Вы скоро перестанете улыбаться человеку, который в ответ не улыбается. Происходит научение плачу в семье, где есть маленькие дети. Плач становится средством воздействия на взрослых людей.

В основе этой теории также как и в павловской лежит механизм установления связей (ассоциаций). В основе оперантного научения также лежат механизмы условных рефлексов. Однако это - условные рефлексы иного типа, чем классические. Скиннер назвал такие рефлексы оперантными или инструментальными. Их особенность в том, что активность сначала порождается не сигналом извне, а потребностью изнутри. Активность эта носит хаотический случайный характер. В ходе её с условными сигналами связываются не только врожденные ответы, а любые случайные действия, которые получили награду. В классическом условном рефлексе животное как бы пассивно ждет, что с ним сделают, в оперантном рефлексе - животное само активно ищет правильное действие и когда его находит, то оно его усваивает.

Техника выработки «оперантных реакций» была применена последователями Скиннера при обучении детей, их воспитании, при лечении невротиков. Во время второй мировой войны Скиннер работал над проектом использования голубей для управления стрельбой по самолётам.

Посетив однажды урок арифметики в колледже, где занималась его дочь, Б. Скиннер ужаснулся, сколь мало используются данные психологии. В целях улучшения преподавания он изобрёл серию обучающих машин и разработал концепцию программированного обучения. Он надеялся, основываясь на теории оперантных реакций, создать программу «изготовления» людей для нового общества.

Оперантное научение в работах Э. Торндайка. Экспериментальное исследование условий приобретения действительно нового поведения, а также динамики научения находилось в центре внимания американского психолога Э. Торндайка. В работах Торндайка изучались преимущественно закономерности решения проб. Экспериментальное исследование условий приобретения действительно нового поведения, а также динамики научения находилось в центре внимания американского психолога Э. Торндайка. В работах Торндайка изучались преимущественно закономерности решения проблемных ситуаций животными. Животное (кошка, собака, обезьяна) должно было самостоятельно найти выход из специально сконструированного «проблемного ящика» или из лабиринта. Позже в качестве испытуемых в аналогичных опытах участвовали и маленькие дети.

При анализе такого сложного спонтанного поведения, каким представляется поиск способа решения лабиринтной задачи или отпирания дверцы (в отличие от ответного, респондентного), трудно выделить стимул, вызывающий определенную реакцию. По данным Торндайка, первоначально животные совершали множество хаотичных движений - проб и лишь случайно производили нужные, которые приводили к успеху. При последующих попытках выйти из этого же ящика наблюдалось уменьшение числа ошибок и сокращение количества затраченного времени. Тип научения, когда испытуемый, как правило, неосознанно пробует разные варианты поведения, оперетты (от англ. operate -- действовать), из которых «отбирается» наиболее подходящий, наиболее адаптивный, получил название оперантного обусловливания.

Метод «проб и ошибок» в решении интеллектуальных задач стал рассматриваться как общая закономерность, характеризующая поведение и животных, и человека.

Торндайк сформулировал четыре основных закона научения.

1. Закон повторения (упражнения). Чем чаще повторяется связь между стимулом и реакцией, тем быстрее она закрепляется и тем она прочнее.

2. Закон эффекта (подкрепления). При выучивании реакций закрепляются те из них, которые сопровождаются подкреплением (положительным или отрицательным).

3. Закон готовности. Состояние субъекта (испытываемые им чувства голода, жажды) небезразлично для выработки новых реакций.

4. Закон ассоциативного сдвига (смежности во времени). Нейтральный стимул, связанный по ассоциации со значимым, тоже начинает вызывать нужное поведение.

Торндайком были выделены также дополнительные условия успешности научения ребенка -- легкость различения стимула и реакции и осознание связи между ними.

Оперантное научение происходит при большей активности организма, оно контролируется (определяется) его результатами, последствиями. Общая тенденция такова, что если действия привели к позитивному результату, к успеху, то они будут закреплены и повторены.

Лабиринт в опытах Торндайка служил упрощенной моделью окружающей среды. Лабиринтная методика действительно в какой-то мере моделирует отношения организма и среды, но очень узко, односторонне, ограниченно; и переносить закономерности, открытые в рамках этой модели, на социальное поведение человека в сложно организованном обществе чрезвычайно трудно.

Оперантный бихевиоризм Б. Ф. Скиннера был подчинен главной задаче – предсказывать и контролировать поведение конкретных индивидов.

Основные положения теории Б. Ф. Скиннера:

Поведение можно достоверно определить, предсказать и проконтролировать условиями окружения. Понять поведение, значит, проконтролировать его и наоборот.

Не принял идею о личности или самости, которая стимулирует и направляет поведение.

Делал упор на интенсивном анализе характерных особенностей прошлого опыта человека и уникальных врожденных способностей.

Изучение личности включает в себя нахождение своеобразного характера взаимоотношений между поведением организма и результатами, подкрепляющими его.

Считал, что люди зависимы от прошлого опыта.

Б. Ф. Скиннер рассматривал организм человека как «черный ящик». Поведение является только функцией его последствий или правомерных отношений «S – R». Он рассматривал личность только как набор форм реакций, которые характерны для данного поведения. Личность индивида состоит из относительно сложных, но, тем не менее, независимо приобретенных реакций. Чтобы понять поведение, нужно только понять опыт прошлого научения человека.

В системе Б. Ф. Скиннера поведение состоит из специфических элементов – оперантных реакций . Он признавал два основных типа поведения:

респондентное как ответ на знакомый стимул,

оперантное , определяемое и контролируемое результатом, следующим за ним.

Оперантное обусловливание, по Б. Ф. Скиннеру, обозначает особый путь образования условных рефлексов, заключающийся в подкреплении спонтанно возникающей у субъекта реакции, а не стимула (в отличие от «классического» павловского пути). Подкрепление – ключевая концепция системы автора. Подкрепляющие стимулы можно разделить на стимулы первичные и вторичные. Первичные – сами по себе обладают подкрепляющими свойствами (например, пища, вода, комфорт). Вторичные стимулы (например, деньги, внимание, одобрение и пр.) – событие или объект, которые приобретают свойство осуществлять подкрепление посредством тесной ассоциации с первичным подкреплением.

Б. Ф. Скиннер не считал необходимым рассматривать внутренние силы или мотивационные состояния человека в качестве причинного фактора поведения, а сосредотачивался на взаимоотношениях между определенными явлениями окружения и открытым поведением. Он придерживался мнения, что личность - это не что иное, как определенные формы поведения, которые приобретаются посредством оперантного научения.