Основные теории научения [Реферат №3880]

Введение

Основной постулат теории научения состоит в том, что почти всякое поведение усваивается в результате научения. Например, любая психопатология понимается как усвоение неадаптивного поведения или как неудача при усвоении адаптивного поведения. Вместо того чтобы говорить о психотерапии, сторонники теорий научения говорят о модификации поведения и о поведенческой терапии. Нужно модифицировать или изменять конкретные действия, вместо того чтобы разрешать внутренние конфликты, лежащие в основе этих действий, или реорганизовывать личность. Так как большинство видов проблемного поведения было когда-то усвоено, от них можно отказаться или как-то их изменить, используя специальные процедуры, основанные на законах обучения.

До сегодняшнего дня нет единой теории научения , хотя многие общие законы научения широко признаны и эмпирически подтверждены различными исследователями. В рамках теории научения выделяют три основных направления: Павловское учение, классический бихевиоризм, необихевиоризм.

Термин «теория научения» применяется преимущественно к психологии поведения. В отличии от педагогических понятий обучения, образования и воспитания теория научения охватывает широкий круг процессов формирования индивидуального опыта, таких как привыкание, запечатление, образование простейших условных рефлексов, сложных двигательных и речевых навыков, реакции сенсорного различия и т.д.

Частичное подкрепление.

Инструментальное научение с использованием поощрения – например, приучение крысы в ящике Скиннера нажимать на рычаг ради получения пищи или похвала ребенку, когда он говорит «спасибо» и «пожалуйста», – предполагает несколько видов зависимости между поведением и поощрением. Самый обычный вид зависимости – постоянное подкрепление, при котором награда выдается за каждую правильную реакцию. Другой вариант – частичное подкрепление, предлагающее поощрение только при некоторых правильных реакциях, скажем в каждом третьем случае желаемого поведения, или в каждом десятом, или при его первом проявлении каждый час или каждый день. Воздействие частичного подкрепления важно и представляет большой интерес. При частичном подкреплении для освоения желаемого поведения требуется больше времени, но результаты оказываются гораздо более стойкими. Сохранение эффекта особенно заметно, когда поощрение прекращается; такая процедура называется «угасанием». Поведение, освоенное при частичном подкреплении, сохраняется надолго, а освоенное при постоянном подкреплении быстро прекращается.

Понятие «научение»

Прежде чем перейти к теории научения, рассмотрим понятие «научение».

Имеется несколько понятий, относящихся к приобретению человеком жизненного опыта в виде знаний, умений, навыков, способностей. Это – учение, научение, обучение.

Наиболее общим понятием является научение. Интуитивно каждый из нас представляет, что такое научение. О научении говорят в том случае, когда человек стал знать или уметь то, чего не знал или не умел раньше. Эти новые знания, умения, навыки могут быть следствием деятельности направленной на их приобретение, или выступать как побочный эффект поведения реализующего цели, не связанные с данными знаниями и умениями.

Научение – это приобретение индивидуального опыта. Широкий класс психических процессов, обеспечивающих формирование новых, приспособительных реакций.

В зарубежной психологии понятие научение часто употребляется как эквивалент «учения». В отечественной психологии, по крайне мере в советский период ее развития, принято использовать его применительно к животным. Однако в последнее время ряд ученых И.А. Зимняя, В.Н. Дружинин, Ю.М. Орлов и другие используют этот термин и применительно к человеку.

Виды научения у человека:

Импринтинг;
Оперантное научение;
Условно – рефлекторное научение;
Викарное научение;
Вербальное научение.

Кодирование информации в памяти.

Многие виды обучения включают три важнейших элемента: звук, смысл и зрительный образ. Например, необходимо образовать ассоциацию между словами «собака» и «стол». Обучение путем кодирования звука требует все новых и новых повторений этих слов, вслушивания в то, как они звучат вместе, и запоминания ощущений, возникающих при их повторении. Этот акустический метод, называемый механическим запоминанием, иногда необходим, но значительно уступает кодированию по смыслу. Осмысленное усвоение ассоциации между словами «собака» и «стол» включает мысль о собаке, мысль о столе и установление какой-то связи между ними, например утверждения, что собака никогда не работает за столом. Смысловое кодирование – наиболее важный фактор успешного школьного образования. Длительная усердная работа, использующая механическое запоминание, не дает тех результатов, какие достигаются в ходе намного меньшего числа занятий, в которых основное внимание уделяется смыслу урока. Иногда же наиболее результативным оказывается третий метод – метод формирования зрительных образов. В случае с «собакой» и «столом» процедура должна заключаться в создании реалистического мысленного образа, в котором важную роль играют и собака, и стол, например образа старинного письменного стола, на котором стоит пресс-папье с ручкой в виде охотничьей собаки. Чем более живым окажется образ, тем легче впоследствии вспомнить связь между этими двумя объектами. Конечно, в некоторых случаях, особенно если дело касается абстрактных понятий типа «несчастье» и «энергия», нет простого способа визуального представления и приходится полагаться только на смысловое кодирование. Таким образом, эффективное обучение обеспечивают не только время и усилия, затраченные на практику; большое значение имеет также сам характер практики.

Теории научения: закономерности и положения

Теории научения в психологии исходят из двух основных положений:

Всякое поведение усваивается в процессе научения.

В целях соблюдения научной строгости при проверке гипотез необходимо соблюдать принцип объективности данных. В качестве переменных, которыми можно манипулировать, выбираются внешние причины (пищевое вознаграждение), в отличие от «внутренних» переменных в психодинамическом направлении (инстинкты, защитные механизмы, Я-концепция), которыми манипулировать нельзя.

К закономерностям научения относятся:

Закон готовности: чем сильнее потребность, тем успешнее научение.

Закон эффекта: поведение, которое приводит к полезному действию, вызывает снижение потребности и поэтому будет повторяться.

Закон упражнения: при прочих равных условиях повторение определенного действия облегчает совершение поведения и приводит к более быстрому выполнению и снижению вероятности ошибок.

Закон недавности: лучше заучивается тот материал, который предъявляется в конце серии. Этот закон противоречит эффекту первичности — тенденции к лучшему заучиванию материала, который предъявляется в начале процесса научения. Противоречие устраняется при формулировке закона «эффект края». U-образная зависимость степени заученности материала от его места в процессе научения отражает этот эффект и называется «позиционной кривой».

Закон соответствия: существует пропорциональное отношение между вероятностью ответа и вероятностью подкрепления.

Существуют три основные теории научения:

теория классического обусловливания И.П. Павлова;
теория оперантного обусловливания Б.Ф. Скиннера;
теория социального научения А. Бандуры.

Теория классического обусловливания И.П. Павлова

Вид классического обусловливания тесно связан с именем И. П. Павлова, который внес основополагающий вклад в теорию классических условных рефлексов, ставшую базой для развития поведенческой психотерапии.

Основная схема условного рефлекса — S—R, где S — стимул, R — реакция (поведение). В классической павловской схеме реакции возникают только в ответ на воздействие какого-либо стимула, безусловного или условного раздражителя. Павлов впервые ответил на вопрос, каким образом нейтральный стимул может вызвать ту же реакцию, что и безусловный рефлекс, протекающий автоматически, на врожденной основе, и не зависящий от предшествующего опыта индивида. Или, иными словами, как нейтральный раздражитель становится условным раздражителем. Формирование условного рефлекса происходит при наличии:

смежности, совпадения во времени индифферентного и безусловного раздражителей, с некоторым опережением индифферентного раздражителя;
повторения, многократного сочетания индифферентного и безусловного раздражителей.

Экспериментатор воздействует на организм условным раздражителем (звонком) и подкрепляет его безусловным (пищей), то есть безусловный стимул используется для вызывания безусловной реакции (выделения слюны) в присутствии поначалу нейтрального стимула (звонка). После ряда повторений реакция (выделение слюны) ассоциируется с этим новым стимулом (звонком), иными словами, между ними устанавливается такая связь, что прежде нейтральный безусловный стимул (звонок) вызывает условную реакцию (выделение слюны). Результатом или продуктом научения по такой схеме является респондентное поведение — поведение, вызванное определенным стимулом (S). Подача подкрепления в данном случае связана со стимулом (S), поэтому данный тип научения, в процессе которого образуется связь между стимулами, обозначается как научение типа S.

Прекрасный пример классического обусловливания — эксперимент Дж. Уотсона. В 1918 году Дж. Уотсон начал лабораторные эксперименты с детьми, которые продемонстрировали, что опыт научения в детстве имеет длительный эффект. В одном из опытов он, сначала показав, что девятимесячный мальчик Альберт не боится белой крысы, кролика и других белых объектов, затем ударял по стальному бруску рядом с головой Альберта каждый раз, когда появлялась белая крыса. После нескольких ударов Альберт при виде крысы начал вздрагивать, плакать и пытался отползти. Подобным же образом он реагировал, когда Дж. Уотсон показывал ему другие белые объекты. Здесь Дж. Уотсон использовал классическое обусловливание: сочетая громкий звук (безусловный стимул) с предъявлением крысы (условный стимул), он вызывал новую реакцию — условную реакцию страха — на прежде нейтральное животное.

Данный опыт демонстрирует также феномен, открытый И. П. Павловым и называемый «генерализацией стимулов». Суть его состоит в том, что если развилась условная реакция, то ее будут вызывать также стимулы, похожие на условный: ребенка можно приучить бояться того, что прежде, представлялось безобидным, и этот страх будет распространяться на похожие объекты. Маленький Альберт стал испытывать страх по отношению ко всем меховым игрушкам. Из своих опытов Уотсон сделал вывод, что дети могут научаться практически всему, в том числе фобическим симптомам (Александров А. А., 1997).

Можно назвать еще два феномена, связанных с именем Павлова и используемых в поведенческой психотерапии. Во-первых, такой феномен, как различение стимулов, или стимульная дискриминация, благодаря которому люди научаются различать похожие стимулы. Плач ребенка становится условным стимулом для матери: она просыпается от глубокого сна при малейшем волнении ребенка, но может глубоко спать, когда плачет чужой ребенок. Во-вторых, это угасание — постепенное исчезновение условной реакции в результате устранения связи между условным и безусловным стимулами. Угасание связано с тем, что условный стимул продолжает вызывать условную реакцию только в том случае, если хотя бы периодически появляется безусловный стимул. Если же условный стимул хотя бы иногда не подкрепляется безусловным, то сила условной реакции начинает уменьшаться.

Организация практики.

При освоении навыка, как и во многих других ситуациях, полезно делать частые перерывы для отдыха, а не практиковаться непрерывно. То же количество занятий приведет к более эффективному научению, если они распределены во времени, а не сконцентрированы в единый блок, как это делается при т.н. массированном обучении. Занятия, проводимые частично утром и частично вечером, обеспечивают большее различие в условиях обучения, чем занятия только утром или только вечером. Однако часть процесса обучения заключается в том, чтобы обучаемый мог вспомнить сохраненную памятью информацию, и такому вспоминанию способствует воссоздание ситуации, в которой что-то было выучено. Например, результаты тестирования оказываются лучше, если оно проводится не в специальном экзаменационном классе, а в том же помещении, где происходило обучение. См. также

НЕЙРОПСИХОЛОГИЯ; ПАМЯТЬ; ПСИХОЛОГИЯ; ПРИВЫЧКА.

Теория оперантного обусловливания Б.Ф. Скиннера

Теория оперантного обусловливания связана с именами Эдварда Ли Торндайка (E.L. Thorndike) и Берреса Скиннера (B.F. Skinner). В отличие от принципа классического обусловливания (S->R), они разработали принцип оперантного обусловливания (R->S), согласно которому поведение контролируется его результатами и последствиями. Основной путь воздействия на поведение, исходя из этой формулы, — влияние на его результаты.

Как уже и говорилось ранее, респондентное поведение — это версия Б.Ф. Скиннера павловского представления о поведении, которое он называл обусловливанием типа S, чтобы подчеркнуть важность стимула, который появляется до реакции и выявляет ее. Однако Скиннер полагал, что в целом поведение животных и человека нельзя объяснять в терминах классического обусловливания. Скиннер делал акцент на поведении, не связанном с какими-либо известными стимулами. Он утверждал, что в основном на ваше поведение воздействуют стимульные события, которые наступят после него, а именно — его последствия. Так как этот тип поведения предполагает, что организм активно воздействует на окружение с целью изменить события каким-то образом, Скиннер определил его как оперантное поведение. Он также называл его обусловливание типа Я., чтобы подчеркнуть воздействие реакции на будущее поведение.

Итак, ключевая структурная единица бихевиористского подхода в целом и скиннеровского подхода в особенности — это реакция. Реакции можно ранжировать от простых рефлекторных реакций (например, слюноотделение на пищу, вздрагивание на громкий звук) до сложного паттерна поведения (например, решение математической задачи, скрытые формы агрессии).

Реакция — это внешняя, наблюдаемая часть поведения, которую можно связать с событиями окружающей среды. Сущность процесса научения — это установление связей (ассоциаций) реакций с событиями внешней среды.

В своем подходе к научению Скиннер проводил различие между реакциями, которые вызываются четко определенными стимулами (например, мигательный рефлекс в ответ на дуновение воздуха), и реакциями, которые нельзя связать ни с одним стимулом. Эти реакции второго типа порождаются самим организмом и называются операн-тами. Скиннер считал, что стимулы среды не принуждают организм вести себя определенным образом и не побуждают его действовать. Исходная причина поведения находится в самом организме.

Оперантное поведение (вызванное оперантным научением) определяется событиями, которые следуют за реакцией. То есть за поведением идет следствие, и природа этого следствия изменяет тенденцию организма повторять данное поведение в будущем. Например, катание на роликовой доске, игра на фортепиано, метание дротиков и написание собственного имени — это образцы оперант-ной реакции, или операнты, контролируемые результатами, следующими за соответствующим поведением. Это произвольные приобретенные реакции, для которых не существует стимула, поддающегося распознаванию. Скиннер понимал, что бессмысленно рассуждать о происхождении оперантного поведения, так как нам неизвестны стимул или внутренняя причина, ответственная за его появление. Оно происходит спонтанно.

Если последствия благоприятны для организма, тогда вероятность повторения операнта в будущем усиливается. Когда это происходит, говорят, что последствия подкрепляются, и оперантные реакции, полученные в результате подкрепления (в смысле высокой вероятности его появления), обусловились. Сила позитивного подкрепляющего стимула таким образом определяется в соответствии с его воздействием на последующую частоту реакций, которые непосредственно предшествовали ему.

И напротив, если последствия реакции не благоприятны и не подкреплены, тогда вероятность получить оперант уменьшается. Скиннер полагал, что, следовательно, оперантное поведение контролируется негативными последствиями. По определению, негативные, или аверсивные последствия, ослабляют поведение, порождающее их, и усиливают поведение, устраняющее их.

Оперантноенаучение можно представить как процесс обучения, основанный на связи раздражитель-реакция-подкрепление, в рамках которой поведение формируется и поддерживается в силу тех или иных его последствий.

Вторичное подкрепление.

В ходе ассоциативного научения некоторые сигналы, которые изначально не имели никакой ценности или не говорили об опасности, соединяются в сознании с событиями, обладающими ценностью или связанными с опасностью. Если это происходит, сигналы или события, ранее носившие нейтральный характер, начинают сами действовать как поощрение или наказание; такой процесс носит название вторичного подкрепления. Классический пример вторичного подкрепления – деньги. Животные в ящике Скиннера готовы нажимать на рычаг, чтобы завладеть специальными жетонами, обмениваемыми на пищу, или добиться того, что начнет звонить звонок, со звуком которого они приучены отождествлять появление еды. Научение, приводящее к избеганию, иллюстрирует вариант вторичного подкрепления через наказание. Животное выполняет определенные действия при появлении сигнала, который, хотя сам и не является неприятным, постоянно сопровождает какое-то неприятное событие. Например, собака, которую часто бьют, съеживается и обращается в бегство, стоит ее хозяину поднять руку, хотя в самой по себе поднятой руке ничего опасного нет. При использовании для контроля за поведением положительного и отрицательного вторичного подкрепления нет необходимости в частом фактическом поощрении или наказании. Так, когда животных дрессируют по методу последовательных приближений, подкреплением при каждой попытке обычно служит лишь щелкающий звук, который до этого регулярно сопровождал появление пищи.

Теория социального научения А. Бандуры

А. Бандура критиковал радикальный бихевиоризм, который отрицал детерминанты поведения человека, возникающие из внутренних когнитивных процессов. Для Бандуры индивиды не являются ни автономными системами, ни простыми механическими передатчиками, оживляющими влияния окружения — они обладают высшими способностями, которые позволяют им предсказывать появление событий и создавать средства для осуществления контроля над тем, что влияет на их повседневную жизнь. Учитывая, что традиционные теории поведения могли быть неверными, это давало скорее неполное, чем неточное объяснение поведению человека.

С точки зрения А. Бандуры, люди не управляются интрапсихическими силами и не реагируют на окружение. Причины функционирования человека нужно понимать в терминах непрерывного взаимодействия поведения, познавательной сферы и окружения. Данный подход к анализу причин поведения, который Бандура обозначил как взаимный детерминизм, подразумевает, что факторы предрасположенности и ситуационные факторы являются взаимозависимыми причинами поведения.

Функционирование человека рассматривается как продукт взаимодействия поведения, личностных факторов и влияния окружения.

Проще говоря, внутренние детерминанты поведения, такие как вера и ожидание, и внешние детерминанты, такие как поощрение и наказание, являются частью системы взаимодействующих влияний, которые действуют не только на поведение, но также на различные части системы.

Разработанная Бандурой модель-триада взаимного детерминизма показывает, что хотя на поведение влияет окружение, оно также частично является продуктом деятельности человека, то есть люди могут оказывать какое-то влияние на собственное поведение. Например, грубое поведение человека на званом вечере может привести к тому, что действия присутствующих рядом людей будут, скорее, наказанием, а не поощрением для него. Во всяком случае, поведение изменяет окружение. Бандура также утверждал, что благодаря своей необычайной способности использовать символы люди могут думать, творить и планировать, то есть они способны к познавательным процессам, которые постоянно проявляются через открытые действия.

Каждая из трех переменных в модели взаимного детерминизма способна влиять на другую переменную. В зависимости от силы каждой из переменных доминирует то одна, то другая, то третья. Иногда наиболее сильны влияния внешнего окружения, иногда доминируют внутренние силы, а иногда ожидание, вера, цели и намерения формируют и направляют поведение. В конечном итоге, однако, Бандура полагает, что по причине двойной направленности взаимодействия между открытым поведением и окружающими обстоятельствами люди являются и продуктом, и производителем своего окружения. Таким образом, социально-когнитивная теория описывает модель взаимной причинности, в которой познавательные, аффективные и другие личностные факторы и события окружения работают как взаимозависимые детерминанты.

Предвиденные последствия. Исследователи научения делают акцент на подкреплении как на необходимом условии для приобретения, сохранения и модификации поведения. Так, Скиннер утверждал, что внешнее подкрепление обязательно для научения.

А. Бандура, хотя и признает важность внешнего подкрепления, но не рассматривает его как единственный способ, при помощи которого приобретается, сохраняется или изменяется наше поведение. Люди могут учиться наблюдая или читая, или слыша о поведении других людей. В результате предыдущего опыта люди могут ожидать, что определенное поведение будет иметь последствия, которые они ценят, другое — произведет нежелательный результат, а третье — окажется малоэффективным. Наше поведение, следовательно, регулируется в значительной мере предвиденными последствиями. В каждом случае мы имеем возможность заранее вообразить последствия неадекватной подготовки к действию и принимаем необходимые меры предосторожности. Посредством нашей способности представлять действительный исход символически будущие последствия можно перевести в сиюминутные побудительные факторы, которые влияют на поведение во многом так же, как и потенциальные последствия. Наши высшие психические процессы дают нам способность предвидения.

В центре социально-когнитивной теории лежит положение о том, что новые формы поведения можно приобрести в отсутствие внешнего подкрепления. Бандура отмечает, что многое в поведении, которое мы демонстрируем, приобретается посредством примера: МЫ просто наблюдаем, что делают другие, а затем повторяем их действия. Этот акцент на научении через наблюдение или через пример, а не на прямом подкреплении, является наиболее характерной чертой теории Бандуры.

Саморегуляция и познание в поведении. Другой характерной чертой социально-когнитивной теории является то, что важную роль она отдает уникальной способности человека к саморегуляции. Устраивая свое непосредственное окружение, обеспечивая когнитивную поддержку и осознавая последствия своих собственных действий, люди способны оказывать некоторое влияние на свое поведение. Разумеется, функции саморегуляции создаются и не так уж редко поддерживаются влиянием окружения. Таким образом, они имеют внешнее происхождение, однако не следует преуменьшать тот факт, что однажды установившись, внутренние влияния частично регулируют то, какие действия выполняет человек. Далее, Бандура утверждает, что высшие интеллектуальные способности, например, способность оперировать символами, дают нам мощное средство воздействия на наше окружение. Посредством вербальных и образных репрезентаций мы производим и сохраняем опыт таким образом, что он служит ориентиром для будущего поведения. Наша способность формировать образы желаемых будущих результатов выливается в бихевиоральные стратегии, направленные на то, чтобы вести нас к отдаленным целям. Используя способность к оперированию символами, мы можем решать проблемы, не обращаясь к методу проб и ошибок, можем, таким образом, предвидеть вероятные последствия различных действий и соответственно изменять наше поведение.

Гипотетико-дедуктивный метод

Поскольку Халл тяготел к точным наукам, он стремился создать универсальный научный метод и для психологии. Он хотел решить проблему крайнего субъективизма науки и считал, что большое количество подходов лишь усложняют ситуацию: каждая из концепций безуспешно старается стать всеобъемлющей, применимой к любой проблеме психологии. Методики диагностики также не внушали исследователю доверия [5]. В своей работе «Математико-дедуктивная теория механистического научения» Халл описал методы научного познания, которые с его точки зрения были наиболее объективными:

Наблюдение;
Контролируемое наблюдение;
Экспериментальная проверка гипотезы;
Гипотетико-дедуктивный метод. [2]

Если три из этих методов уже были известны в психологии, то четвертый был нововведением Халла. Под гипотетико-дедуктивным методом понимался метод проверки гипотез по строго определенному плану:

Исследователь определяет систему первичных аксиом по исследуемой проблеме (аксиома часто включает в себя использование формул и неких переменных, необходимых ученому для лучшего структурирования исходной информации);
Первичные аксиомы берутся за основу для составления гипотезы/теоремы, которую необходимо проверить;
Ученый проводит экспериментальную проверку гипотезы/теоремы. Далее возможны два варианта развития событий: эксперимент либо успешен, либо признан неудачным в ходе эмпирической проверки;
Если эксперимент считается успешным (в случае подтверждения первоначальных гипотез и прогнозов), то гипотеза сохраняется. Если эксперимент не был успешным (прогнозы не подтвердились эмпирически), то гипотезу переформулируют или отбрасывают совсем. [6]

Кларк Л. Халл считал, что по мере внимательного изучения и экспериментальной проверки сохранившиеся проверенные гипотезы сами по себе превратятся в набор первичных принципов, которые будут согласовываться с результатами экспериментальной проверки новых гипотез. Такой принцип, по его мнению, должен привести к обновлению, совершенствованию психологии и, наконец, к ее подлинно научной унификации. В сущности, исследователь придерживался стремления, характерного для бихевиоризма и необихевиоризма в целом – способствовать большей научности психологии в противовес бездоказательности. Халл хотел создать свою объективную методологическую систему, которая будет способна «предугадывать как поведение крысы в лабиринте, так и поведение человека под влиянием повседневных условий» [7, с. 515].

Гипотетико-дедуктивный подход был применен самим Халлом к построению его концепции научения.