Э. Ч
Промежуточные переменные 5 возникают во время течения процесса или являются промежуточным результатом расчетных операций. В принципе они могут быть рассчитаны заранее, если известны возмущающие воздействия и устанавливаемые переменные. Если некоторые из промежуточных переменных должны находиться на верхнем или нижнем пределе, то их вносят в список параметров, характеризующих процесс.
Промежуточные переменные могут быть представлены в неограниченном количестве, но каждая прежде, чем она будет использована, должна быть выражена как функция устанавливаемых переменных и возмущающих воздействий. В добавление к потоку, температуре, давлению и другим рабочим условиям на отдельных стадиях процесса перечень промежуточных переменных может включать выход или степень превращения, используемые для расчета производительности и - прибыли от операции; рассчитанные концентрации и соотношения реагентов; среднюю производительность каждого из агрегатов (нужно для распределения подвоза сырья) и множество других вспомогательных параметров.
Промежуточные переменные G и Р представлены в инверсном виде. Они, как будет сказано ниже, могут использоваться пр:: формировании параллельных переносов между отдельными секциями 564ИПЗ при построении многоразрядных АЛУ.
Более предпочтительно использовать промежуточные переменные: скалярный и векторный потенциалы.
Здесь введены две промежуточные переменные i и /, которые имеют область действия только внутри этого блока. Исходные данные заданы в виде глобальных величин л, т, х, а результат присвоен глобальной переменной у. Эти глобальные величины должны быть описаны в одном из внешних блоков, в состав которых входит данный блок.
Очевидно, что промежуточные переменные А и В следует разместить в регистрах, которым дадим имена РА и РВ соответственно.
Через К обозначены контролируемые промежуточные переменные, через f - неконтролируемые.
Язык CUPL позволяет определить промежуточные переменные, которые могут быть использованы в выражениях позднее. В этом случае удобно определить очевидные переменные от zero до next через возможные отображения цифры в терминах сегментных входов. Это просто большие термы произведений (И) от входных сегментных переменных, которые вы можете прочесть из изображений цифр на рис. 8.76. Окончательно каждый двоичный выходной бит записывается как сумма (ИЛИ) цифровых переменных, при которых этот бит устанавливается. Мы используем уровни отрицательной логики, потому что 16L8 представляет матрицу И-ИЛИ-НЕ. Этим заканчивается логическая спецификация для языка.
Теперь выразим в этих формулах промежуточные переменные / д, q (t) и As через исходные функции.
В ВМ-функциях и процедурах-функциях могут использоваться входные, выходные и промежуточные переменные.
Он вводит в процесс изучения человеческого поведения промежуточные переменные психологического характера, выражающие ненаблюдаемые элементы механизма мотивации этого поведения. Однако сторонники данного подхода уклоняются от анализа самого процесса интерпретации, ограничиваясь регистрацией внешних воздействий на психику и внешних поведенческих ее ответов на эти воздействия. Основными методами изучения поведения представители этого подхода считают наблюдение и эксперимент, с помощью которого можно преднамеренно вызвать поведенческую реакцию людей и зафиксировать ее характеристики.
(intervening variable) П. п. - это ненаблюдаемая связь между двумя наблюдаемыми переменными. Во мн. наших допущениях о причинах челов. поведения постулируются промежуточные психол. переменные, выполняющие роль связующего звена между стимулом и реакцией. Рассмотрим пример. Представьте себе двух мальчиков на игровой площадке. Джордж толкает Сэма, после чего Сэм толкает Джорджа. На первый взгляд кажется, что в ответной реакции Сэма (в том, что он толкнул Джорджа), роль стимула сыграло то, что Джордж его толкнул. Однако, чтобы понять причинную связь, мы должны допустить существование П. п. Сэма толкнули (это - стимул), и он думает: "Ага, Джордж толкнул меня, значит, я вправе дать сдачи" (П. п.), и толкает Джорджа (реакция). Введение П. п. позволяет нам понять, почему разные люди по-разному реагируют на один и тот же стимул. Напр. Уильям убегает, когда Джордж пытается толкнуть его, а Дэвид в аналогичной ситуации смеется. Возможно, П. п. для Уильяма яв-ся его мысль: "Джордж сильнее меня. Если я не убегу, он снова меня толкнет". Смех же Дэвида, возможно, связан с тем, что он объясняет поведение Джорджа его чрезмерной шаловливостью или неуклюжестью. П. п. нельзя увидеть. Мы видим только 2 вещи: стимул (толчок Джорджа) и реакцию (ответный толчок, бегство или смех). Психотерапевты работают со своими клиентами, пытаясь понять П. п., приводящие к неадаптивным реакциям. Психоаналитики могут искать П. п., связанные с опытом, приобретенным в раннем детстве. Когнитивные терапевты могут помогать людям заменять неприемлемые П. п. (негативные когниции) более адаптивными П. п. (напр. позитивными когнициями). Так, клиента, боящегося темноты, можно обучить переопределять темноту как сулящую отдых и расслабление. Психологи объясняют последовательность челов. поведения, постулируя такие П. п., как черты личности или способности, к-рые яв-ся относительно устойчивыми характеристиками людей. Можно принять, что Сэм драчлив, Уильям имеет низкую самооценку, а у Дэвида хорошее чувство юмора. Интерпретация реакции зависит от использованной П. п. Представьте себе такую ситуацию: ребенок провалился на экзамене. Можно предположить, что П. п. яв-ся компетентность, мотивация усердно учиться или поддержка любящих родителей. Какая из этих трех переменных - способности, мотивация или поддержка родителей - обусловила провал на экзамене? Помощь терапевта ребенку в достижении успеха зависит от того, как будет интерпретирована П. п. Следует ли переводить ребенка на класс ниже, нужна ли ему какая-то более серьезная мотивация или дело не в ребенке, и терапевт должен работать с родителями? Если П. п. выбрана неверно, терапия может оказаться неэффективной. Для оценки П. п. психологи используют интервью и тесты. В психол. теориях в качестве П. п. постулируются сила Эго, локус контроля и когнитивный диссонанс. Эти ненаблюдаемые переменные яв-ся связующим звеном между стимулами и реакциями. Правильный выбор П. п. позволяет лучше понять и точнее прогнозировать поведение. РЭТ А. Эллиса основана на концепции изменяемости когнитивных П. п. См. также Индивидуальные различия, Рационально-эмотивная поведенческая терапия М. Эллин
Под давлением отмеченных выше трех проблем - памяти, мотивации и познания, большинство создателей теорий научения дополнили скиннеровский экспериментальнй анализ средовых и поведенческих переменных промежуточными переменными. Промежуточные переменные является теоретическими конструктами, значение которых определяется через их связи с разнообразными средовыми переменными, чьи общие эффекты они призваны суммировать.
Теория ожидания Толмена
Торндайк, под влиянием предпосылки Дарвина о непрерывности эволюции биологических видов, начал переход к менее менталистской психологии. Джон Б. Уотсон завершил его полным отказом от менталистских понятий. Действуя в русле нового мышления, Толмен заменил прежние умозрительные менталистские понятия логически определяемыми промежуточными переменными.
Что касается предмета нашего обсуждения (подкрепления), здесь Толмен не последовал примеру Торндайка. Торндайк рассматривал последствия реагирования как имеющие чрезвычайное значение для усиления ассоциативной связи между стимулом и реакцией. Он называл это законом эффекта, явившегося предтечей современной теории подкрепления. Толмен полагал, что последствия реакции оказывают воздействия не на научение как таковое, а лишь на внешнее выражение лежащих в основе научения процессов. Потребность в разграничении научения и исполнения возникла в ходе попыток дать интерпретацию результатов экспериментов по латентному научению. По мере развития теории, название введенной Толменом промежуточной переменной, отражающей научение, неоднократно менялось, но наиболее подходящим названием, вероятно, могло бы быть ожидание. Ожидание зависело исключительно от временной последовательности - или смежности - событий в окружающей среде, а не от последствий реагирования.
Физиологическая теория Павлова
Для Павлова, как и для Толмена, необходимым и достаточным условием научения являлась смежность событий. Эти события физиологически представлены процессами, протекающими в тех областях коры головного мозга, которые активируются индифферентным и безусловным раздражителями. Эволюционные последствия выученной реакции Павловым признавались, но не проверялись в экспериментальных условиях, поэтому их роль в научении осталась невыясненной.
Молекулярная теория Газри
Подобно Толмену и Павлову, и в отличие от Торндайка, Эдвин Р. Газри считал смежность достаточным условием для научения. Однако, совпадающие во времени события не определялась столь широкими (т. е., молярными) событиями в среде, как утверждал Толмен. Каждое молярное средовое событие, по мнению Газри, состоит из множества молекулярных стимульных элементов, которые он называл сигналами. Каждое молярное поведение, которое Газри называл «действием», в свою очередь состоит из множества молекулярных реакций, или «движений». Если сигнал сочетается по времени с движением, это движение становится полностью обусловленным этим сигналом. Научение поведенческому действию развивается медленно лишь потому, что большинство действий требует научения многим составляющим их движениям в присутствии многих специфических сигналов.
Теория редукции драйва Халла
Использование промежуточных переменных в теории научения достигло своего наиболее широкого развития в работах Кларка Л. Халла. Халл осуществил попытку разработать общую интерпретацию поведенческих изменений, возникающих в результате обеих, классической и оперантной, процедур. Как сопряженность стимула и реакции, так и редукция драйва вошли в качестве необходимых компонентов в халловское понятие подкрепления.
Выполнение условий научения влияет на образование промежуточной переменной - привычки. Привычка определялась Халлом как теоретический конструкт, суммирующий общий эффект воздействия ряда ситуационных переменных на ряд поведенческих переменных. Связи между ситуационными переменными и промежуточной переменной (привычкой), и далее - между привычкой и поведением выражались в форме алгебраических уравнений. Несмотря на употребление при формулировках некоторых из своих промежуточных переменных физиологических терминов, экспериментального исследования и теория Халла были связаны исключительно с поведенческим уровнем анализа. Кеннет У. Спенс, сотрудник Халла, внесший значительный вклад в разработку его теории, отличался особенной тщательностью в определении промежуточных переменных в чисто логических терминах.
Б. Ф. Скиннер. Оперантное поведение. Закон приобретения Поощрение с фиксированной частотой и с фиксированным интервалом.
Эдвард Чейс Толмен (1886-1959)
Система Толмена - целенаправленный бихевиоризм, сочетающий в себе объективное исследование поведения с учетом целенаправленности или ориентации на достижение определенной цели.
Один из ранних последователей бихевиоризма, Эдвард Толмен изучал инженерное дело в Массачусетском технологическом институте. Он переключился на психологию и под руководством Эдвина Холта начал работать в Гарварде, где получил звание доктора философии в 1915 году. Летом 1912 года Толмен учился в Германии вместе со специалистом по гештальт-психологии Куртом Коффкой. На последнем курсе аспирантуры, изучая традиционную, в духе Титченера, структурную психологию, Толмен познакомился с бихевиоризмом Уотсона. Будучи уже аспирантом, Толмен подвергал сомнению научную полезность интроспекции. В своей автобиографии, написанной в 1952 году, он писал, что бихевиоризм Уотсона стал для него «мощным стимулом и опорой».
Основные положения учения Толмена представлены в его работе «Целенаправленное поведение у животных и человека» (1932). Его система целенаправленнго бихевиоризма может на первый взгляд показаться любопытной смесью двух противоречащих друг другу понятий: цель и поведение. Приписывание некоей цели организму подразумевает привлечение понятия сознания - то есть менталистической концепции, которой не находится места в психологии поведения. Тем не менее Толмен совершенно определенно дал понять, что по своей методологии и по предмету исследования он остается последовательным бихевиористом. Он не побуждал психологов принять концепцию сознания. Подобно Уотсону, он отвергал интроспекцию и не интересовался никакими подразумеваемыми внутренними переживаниями организмов, которые были недоступны для объективного наблюдения.
Целенаправленность поведения, писал Толмен, можно определить в терминах объективного бихевиоризма, без ссылок на интроспекцию или предположений о том, что организм «чувствует» в связи с тем или иным переживанием. Для него было совершенно очевидно, что любое поведение направлено на достижение определенной цели. Например, кошка старается выбраться из «проблемного ящика», крыса осваивается в лабиринте, а ребенок учится играть на фортепиано.
Как говорил сам Толмен, поведение «пахнет целью». Любое поведение направлено на достижение некоторой цели, на освоение некоторых средств. Крыса неоднократно и настойчиво проходит лабиринт, всякий раз делая все меньше ошибок, чтобы быстрее добраться до выхода. Иначе говоря, крыса учится, и сам факт обучения - для крысы или для человека - является объективным поведенческим свидетельством наличия цели. Толмен имеет дело только с реакциями организмов. Все его измерения проводились в терминах изменений в ответном поведении, как функции научения. И эти измерения предоставляют объективную информацию.
Бихевиоризм Уотсона с большой легкостью подвергал критике приписывание какой-либо цели любому виду поведения, поскольку целенаправленность поведения подразумевает допущение о наличии сознания. Толмен отвечал на это, что для него нет разницы, обладает организм сознанием или не обладает. Переживания сознания, связанные с целенаправленным поведением, если они даже и имеют место, не оказывают никакого влияния на поведенческие реакции организма. Толмен занимался исключительно явно выраженными реакциями.
Как бихевиорист, Толмен считал, что инициирующее причинное поведение и окончательное результирующее поведение должны быть объективно наблюдаемыми и пригодными для описания в терминах операций. Он предположил, что причины поведения включают пять основных независимых переменных: стимулы окружающей среды, психологические побуждения, наследственность, предшествующее обучение и возраст. Поведение является функцией всех этих переменных, что выражается математическим уравнением.
Между этими наблюдаемыми независимыми переменными и результирующим ответным поведением (зависимой наблюдаемой переменной) Толмен ввел набор ненаблюдаемых факторов, которые назвал промежуточными переменными. Эти промежуточные переменные фактически являются детерминантой поведения. Они представляют собой те внутренние процессы, которые связывают стимулирующую ситуацию с наблюдаемой реакцией. Формула бихевиоризма S-R (стимул-реакция) теперь должна читаться как S-О-R. Промежуточными переменными является все, что связано с О, то есть с организмом, и формирует данную поведенческую реакцию на данное раздражение.
Поскольку эти промежуточные переменные не подлежат объективному наблюдению, то они не представляют никакой практической пользы для психологии, если только их не удается связать с экспериментальными (независимыми) переменными и с поведенческими (зависимыми) переменными.
Классическим примером промежуточной переменной является голод, который невозможно увидеть у подопытного человека или животного. И тем не менее, голод можно вполне объективно и точно увязать с экспериментальными переменными - например, с длительностью того отрезка времени, на протяжении которого организм не получал пищу. Кроме того, его можно увязать и с объективной реакцией или с переменной поведения - например, с количеством съеденной пищи или со скоростью ее поглощения. Таким образом, ненаблюдаемый фактор вмешательства - голод - может получить точную эмпирическую оценку и следовательно становится доступным для количественного измерения и экспериментальных манипуляций.
Путем определения независимых и зависимых переменных, каковыми являются наблюдаемые события, Толмен получил возможность составить операциональные описания ненаблюдаемых, внутренних состояний. Сначала он называл свой подход «оперантным бихевиоризмом», прежде чем выбрать термин «промежуточные переменные».
Промежуточные переменные - ненаблюдаемые и предполагаемые факторы организма, фактически являющиеся детерминантой поведения.
Промежуточные переменные оказались весьма полезными для разработки теории поведения, постольку они были эмпирически связаны с экспериментальными и поведенческими переменными. Однако для того, чтобы сделать этот подход всеобъемлющим, потребовался такой громадный объем работы, что Толмен в конце концов оставил всякую надежду «составить полное описание хотя бы одной промежуточной переменной»
Теория научения. Научение играло важнейшую роль в целенаправленном бихевиоризме Толмена. Он отвергал закон эффекта Торндайка, утверждая, что вознаграждение или поощрение оказывает слабое воздействие на научение. Взамен этого Толмен предложил когнитивную теорию научения, предполагая, что повторяющееся выполнение одного и того же задания усиливает создаваемые связи между факторами окружающей среды и ожиданиями организма. Таким путем организм познает окружающий его мир. Толмен называл эти создаваемые научением связи гештальт-знакам и, которые вырабатываются в ходе многократного выполнения какого-либо действия.
Крыса бегает по лабиринту, исследуя иногда правильные, а иногда неправильные ходы или даже тупики. Наконец крыса находит еду. При последующих прохождениях лабиринта цель (поиск пищи) придает поведению крысы целенаправленность. С каждой точкой разветвления связываются некоторые ожидания. Крыса приходит к пониманию того, что определенные признаки, ассоциирующиеся с точкой разветвления, наводят или не наводят на то место, где находится пища.
Если ожидания крысы оправдываются и она действительно находит пищу, то знак гештальта (то есть признак, ассоциирующийся с некоторой точкой выбора) получает подкрепление. Таким образом животное вырабатывает целую сеть гештальт-знаков по всем точкам выбора в лабиринте. Толмен назвал это когнитивной картой. Эта схема представляет собой то, что выучило животное: а именно когнитивную карту лабиринта, а вовсе не набор некоторых моторных навыков. В некотором смысле крыса обретает всеобъемлющее знание своего лабиринта или иной окружающей ее среды. В ее мозге вырабатывается что-то вроде полевой карты, которая позволяет ей перемещаться от точки к точке, не ограничиваясь фиксированным набором заученных телодвижений:
Был использован лабиринт крестообразной формы. Крысы одной группы всегда находили пищу на одном и том же месте, даже если для того, чтобы добраться до пищи, им при разных точках входа приходилось иногда поворачивать не направо, а налево. Моторные реакции отличались, но пища оставалась на том же самом месте.
Крысы второй группы должны были всегда повторять одни и те же движения, но пища всякий раз находилась в другом месте. Например, начиная путь с одного конца крестообразного лабиринта, крысы находили пищу, только повернув в точке выбора направо; если же крысы входили в лабиринт с противоположной стороны, то для того, чтобы найти пищу, им все равно надо было повернуть направо.
Результаты эксперимента показали, что крысы из первой группы, то есть те, которые изучили место действия, ориентировались гораздо лучше, чем крысы из второй группы, которые заучивали реакции. Толмен пришел к выводу, что аналогичное явление наблюдается и у тех людей, которые хорошо знают свои окрестности или город. Они могут пройти из одной точки в другую различными маршрутами, поскольку в их мозге сформирована когнитивная карта местности.
Другой эксперимент исследовал латентное научение - то есть такое научение, которое невозможно наблюдать в то время, когда оно фактически происходит. Голодную крысу поместили в лабиринт и предоставили ей возможность свободно бродить по нему. Сначала в лабиринте не было никакой пищи. Сможет ли крыса обучиться чему-либо при отсутствии подкрепления? После нескольких неподкрепленных попыток крысе дали возможность найти пищу. После этого скорость прохождения крысой лабиринта резко возросла, что показало наличие некоторого научения в период отсутствия подкрепления. Показатели этой крысы очень быстро достигли такого же уровня, что и у крыс, получавших подкрепление при каждой попытке.
Латентное научение - научение, которое не поддается наблюдению в то время, когда оно происходит.
Б. Ф. Скиннер (1904-1990)
Самой влиятельной фигурой в психологии в течение нескольких десятилетий являлся Б. Ф. Скиннер. Скиннер успешно закончил колледж со степенью по английскому языку, правом принадлежности к обществу «Фи Бета Каппа» и стремлением стать писателем. Прочитав об экспериментах Уотсона и Павлова по формированию условных рефлексов, Скиннер круто повернулся от литературных аспектов человеческого поведения к научным. В 1928 году он поступил в аспирантуру Гарвардского университета по психологии - несмотря на то, что до этого ни разу не прослушал курса психологии. Через три года он получил ученую степень доктора философии. По завершении научной работы, после защиты докторской диссертации, он преподавал в университете штата Миннесота (1936-1945) и университете штата Индиана (1945-1974), после чего вернулся в Гарвард.
Тема его диссертации относится к положению, которому Скиннер неуклонно следовал в течение всей своей карьеры. Он предположил, что рефлекс представляет собой корреляцию между стимулом и реакцией, и ничего более. В его книге 1938 года «Поведение организмов» описываются основные положения этой системы.
Оперантное поведение возникает без воздействия каких-либо внешних наблюдаемых раздражителей. Реакция организма кажется спонтанной в том смысле, что внешне она никак не связана с каким-либо наблюдаемым раздражителем.
Классическая экспериментальная демонстрация заключалась в нажатии на рычаг в скиннеровском ящике. В этом эксперименте крыса, лишенная пищи, помещалась в ящик и получала полную возможность исследовать его. В ходе исследований она неизбежно должна была задеть рычажок, который приводил в действие механизм, выдвигающий полочку с пищей. После получения нескольких порций пищи, которые должны были служить подкреплением, у крысы довольно быстро формировался условный рефлекс. Обратите внимание, что поведение крысы (нажатие на рычаг) оказывает воздействие на окружающую среду и является инструментом приобретения пищи. Зависимая переменная в этом эксперименте проста и понятна: это скорость реакции.
Различием между респондентным и оперантным поведением является то, что оперантное поведение воздействует на окружающую организм среду, в то время как респондентное поведение этого не делает. Подопытная собака в лаборатории Павлова, закованная в сбрую, не может сделать ничего иного, как только реагировать (например, пускать слюну), когда экспериментатор предлагает ей какие-либо стимулы. Собака сама по себе ничего не может сделать, чтобы достать стимул (пищу).
Оперантное поведение крысы в коробке Скиннера, напротив, является инструментальным в том смысле, что крыса достигает своего стимула (пищи). Когда крыса нажимает на рычаг, она получает пищу; а если не нажимает на рычаг, то не получает пищи. Таким образом крыса воздействует на окружающую среду.
Скиннер считал, что оперантное поведение характерно для повседневного научения. Поскольку поведение, как правило, носит оперантный характер, то наиболее эффективным подходом к науке о поведении является изучение обусловливания и угасания оперантного поведения.
На основании этого эксперимента Скиннер сформулировал свой закон приобретения, который гласит, что сила оперантного поведения возрастает, если поведение сопровождается подкрепляющим стимулом. Несмотря на то, что для формирования быстрой реакции нажатия на рычажок требуется практика, ключевым параметром все-таки является подкрепление. Практика сама по себе ничего не дает: она только предоставляет возможность возникновения дополнительного подкрепления.
Закон приобретения Скиннера отличается от положений о научении у Торндайка и у Халла. Скиннер вообще не касался таких последствий подкрепления, как боль-приятное ощущение или удовольствие-неудовлетворение, как это делал Торндайк. Скиннер так же не пытался интерпретировать подкрепление в терминах снижения воздействия
В «скиннеровском ящике» поведение крысы при каждом нажатии на рычаг получало подкрепление. То есть всякий раз, выполнив правильное действие, крыса получала пищу. Скиннер отмечал, что хотя в реальной жизни подкрепление далеко не всегда бывает последовательным или непрерывным, тем не менее, научение все-таки происходит и поведение сохраняется, даже если подкрепление было случайным или редким.
Как-то раз в субботу вечером Скиннер обнаружил, что у него почти закончился запас корма. В то время (тридцатые годы) еще нельзя было купить корм у специальных компаний по снабжению исследовательских лабораторий; экспериментатор должен был делать шарики вручную, что являлось достаточно длительным и трудоемким процессом.
Вместо того, чтобы потратить свои выходные на изготовление кормовых шариков, Скиннер задал себе вопрос: что произойдет, если он будет давать подкрепление своим крысам один раз в минуту, независимо от того, какое будет количество ответных реакций? При таком подходе ему потребуется намного меньше корма, и на выходные дни должно хватить. Скиннер решил провести длительную серию экспериментов, чтобы проверить различные варианты системы подкреплений.
В одном таком исследовании Скиннер сравнил частоту реакции у животных, которые получали подкрепление при каждой реакции, с частотой реакций тех животных, которые получали подкрепление только по истечении некоторого интервала времени. Последнее условие получило название схемы подкрепления с фиксированным интервалом. Подкрепление могло выдаваться, например, один раз в минуту или каждые четыре минуты. Важным моментом в данном случае является то, что подопытное животное получало подкрепление только по истечении определенного отрезка времени. Исследование Скиннера показало, что чем короче интервал между подкреплениями, тем чаще животное проявляет обусловленную реакцию. И наоборот, по мере того, как увеличивается интервал между подкреплениями, частота реакции снижается.
Частота подкрепления также оказывает влияние на угасание условной реакции. Проявление условной реакции угасает с большей скоростью, если имело место непрерывное подкрепление, которое затем резко было прекращено, чем в том случае, когда подкрепление выдавалось с перерывами. Некоторые голуби демонстрировали до десяти тысяч реакций без подкрепления, если исходно у них был сформирован условный рефлекс на основе периодичного, прерывистого подкрепления.
Скиннер исследовал также схему подкрепления с фиксированной частотой. В этом случае подкрепление выдается не по истечении определенного отрезка времени, а после выполнения определенного количества условных реакций. Само поведение животного определяет, насколько часто будет выдаваться подкрепление. Например, требуется совершить десять или двадцать обусловленных ответных реакций, чтобы получить новое подкрепление. Животные, получающие поощрение по схеме с фиксированной частотой, реагируют намного интенсивнее, чем те, которые получают подкрепление по схеме с фиксированным интервалом. Ведь очевидно, что высокая частота реагирования при схеме с фиксированным интервалом не приводит к получению дополнительного подкрепления; животное может нажать на рычаг пять раз или пятьдесят, но подкрепление появится только тогда, когда истечет заданный отрезок времени.
Те звуки, которые человеческий организм производит в процессе речи, утверждал Скиннер, также являются формой поведения, а именно - вербальным поведением. Они представляют собой реакции, которые могут подкрепляться другими звуками речи или жестами точно так же, как нажатие крысой рычага подкрепляется получением пищи.
Для вербального поведения требуются два взаимодействующих человека -говорящий и слушающий. Говорящий определенным образом реагирует - это значит, что он произносит звук. Слушатель может управлять последующим поведением говорящего путем выражения подкрепления, отсутствия подкрепления или наказания - в зависимости от того, что было сказано.
Например, если всякий раз, как говорящий употребляет то или иное слово, слушатель улыбается, то он тем самым увеличивает вероятность того, что говорящий снова употребит это слово. Если слушатель реагирует на слово тем, что хмурит брови или отпускает язвительные замечания, то он тем самым увеличивает вероятность того, что говорящий в будущем будет избегать употребления этого слова.
Примеры такого процесса можно наблюдать в поведении родителей, когда их дети учатся говорить. Недопустимые слова или выражения, неправильное применение слов, плохое произношение вызывают реакцию, в корне отличающуюся от той, которой встречают вежливые
Формула бихевиоризма была четкой и однозначной: «стимул-реакция».
Между тем, в кругу бихевиористов появились выдающиеся психологи, поставившие этот постулат под сомнение. Первым из них был профессор университета Беркли (Калифорния), американец Эдвард Толмен (1886-1959), согласно которому формула поведения должна состоять не из двух, а из трех членов, и поэтому выглядеть следующим образом: стимул (независимая переменная) - промежуточные переменные - зависимая переменная (реакция).
Среднее звено (промежуточные переменные) - не что иное, как недоступные прямому наблюдению психические моменты: ожидания, установки, знания.
Следуя бихевиористской традиции, Толмен ставил опыты над крысами, ищущими выход из лабиринта. Главный же вывод из этих опытов свелся к тому, что, опираясь на строго контролируемое экспериментатором и объективно им наблюдаемое поведение животных, можно достоверно установить, что этим поведением управляют не те стимулы, которые действуют на них в данный момент, а особые внутренние регуляторы. Поведение предваряют своего рода ожидания, гипотезы, познавательные (когнитивные) «карты». Эти «карты» животное строит само. Они и ориентируют его в лабиринте. По ним оно, будучи запущено в лабиринт, узнает, «что ведет к чему». Положение о том, что психические образы служат регулятором действия, было обосновано гештальттеорией. Учтя ее уроки, Толмен разработал собственную теорию, названную когнитивным бихевиоризмом.
Толмен свои идеи изложил в книгах «Целевое поведение у животных и человека», «Когнитивные карты у крыс и человека». Экспериментальную работу вел в основном на животных (белых крысах), считая, что законы поведения являются общими для всех живых существ, а наиболее четко и досконально могут быть прослежены на элементарных уровнях поведения.
Результаты опытов Толмена, изложенные в его основной работе «Целенаправленное поведение у животных и человека» (1932), заставили критически переосмыслить краеугольную схему бихевиоризма S R («стимул - реакция»).
Сама по себе идея целенаправленного поведения противоречила программным установкам основателя бихевиоризма Уотсона. Для бихевиористов классического толка целенаправленность поведения подразумевает допущение о наличии сознания.
На это Толмен заявлял, что для него не имеет значения, обладает организм сознанием или нет. Как и подобает бихевиористу, он сосредоточил внимание на внешних, наблюдаемых реакциях. Он предположил, что причины поведения включают пять основных независимых переменных: стимулы окружающей среды, психологические побуждения, наследственность, предшествующее обучение и возраст. Поведение является функцией всех этих переменных, что может быть выражено математическим уравнением.
Между наблюдаемыми независимыми переменными и результирующим поведением Толмен ввел набор ненаблюдаемых факторов, которые назвал промежуточными переменными. Эти промежуточные переменные фактически являются детерминантами поведения. Они представляют собой те внутренние процессы, которые связывают стимулирующую ситуацию с наблюдаемой реакцией.
Однако, оставаясь на позициях бихевиоризма, Толмен отдавал себе отчет: поскольку промежуточные переменные не подлежат объективному наблюдению, то они не представляют никакой практической пользы для психологии, если только их не удается увязать с экспериментальными (независимыми) и поведенческими (зависимыми) переменными.
Классическим примером промежуточной переменной является голод, который невозможно увидеть у подопытного существа (будь то животное или человек). И тем не менее голод можно вполне объективно и точно увязать с экспериментальными переменными, например с длительностью того отрезка времени, на протяжении которого организм не получал пищу.
Кроме того, его можно увязать с объективной реакцией или с переменной поведения, - например, с количеством съеденной пищи или со скоростью ее поглощения. Таким образом, данный фактор становится доступным для количественного измерения и экспериментальных манипуляций.
В теории промежуточные переменные оказались весьма полезной конструкцией. Однако практическое воплощение такого подхода потребовало такой громадной работы, что Толмен в конце концов оставил всякую надежду «составить полное описание хотя бы одной промежуточной переменной».
Полученные в опытах результаты заставили Толмена отказаться и от принципиального для всей поведенческой доктрины закона эффекта, открытого Торндайком. По его мнению, подкрепление оказывает на научение довольно слабый эффект.
Толмен предложил собственную когнитивную теорию научения, полагая, что повторяющееся выполнение одного и того же задания усиливает возникающие связи между факторами окружающей среды и ожиданиями организма. Таким путем организм познает окружающий его мир. Такие создаваемые научением связи Толмен назвал гештальт-знаками.
Историки науки высказывают смелое предположение, что отец бихевиоризма Джон Уотсон страдал специфическим расстройством - ан-идеизмом, то есть был начисто лишен воображения, что заставляло его все наблюдаемые феномены трактовать сугубо буквально.
Толмену в творческом воображении не откажешь, однако и он свои теоретические рассуждения строил на объективно наблюдаемых феноменах. Что же такого он увидел в своих экспериментах, что заставило его выйти за рамки представлений Уотсона?
Вот крыса бегает по лабиринту, беспорядочно пробуя то удачные (можно двигаться дальше), то неудачные (тупик) ходы. Наконец она находит еду. При последующих прохождениях лабиринта поиск пищи придает поведению крысы целенаправленность.
С каждым разветвлением ходов связываются некоторые ожидания. Крыса приходит к «пониманию» того, что определенные признаки, ассоциирующиеся с развилкой, наводят или не наводят на то место, где находится вожделенная пища.
Если ожидания крысы оправдываются и она действительно находит пищу, то гештальт-знак (то есть признак, ассоциирующийся с некоторой точкой выбора) получает подкрепление. Таким образом животное вырабатывает целую сеть гештальт-знаков по всем точкам выбора в лабиринте. Толмен назвал это когнитивной картой.
Эта схема представляет собой то, что выучило животное, а не просто набор некоторых моторных навыков. В известном смысле, крыса приобретает всеобъемлющее знание своего лабиринта, в иных условиях - иной окружающей ее среды. В ее мозге вырабатывается нечто вроде полевой карты, позволяющей перемещаться в нужном направлении, не ограничиваясь фиксированным набором заученных телодвижений.
В классическом эксперименте, описанном во многих учебниках, представления Толмена нашли наглядное и убедительное подтверждение. Лабиринт, использованный в этом опыте, был крестообразной формы. Крысы одной группы всегда находили пищу в одном и том же месте, даже если для того, чтобы до нее добраться, им при разных точках входа в лабиринт приходилось иногда поворачивать не направо, а налево. Моторные реакции при этом, понятно, отличались, но когнитивная карта оставалась прежней.
Крысы второй группы были поставлены в такие условия, что им каждый раз нужно было повторять одни и те же движения, но пища при этом всякий раз находилась на новом месте.
Например, начиная путь с одного конца лабиринта, крыса находила пищу, только повернув на определенной развилке направо; если же крысу запускали с противоположной стороны, то для того, чтобы добраться до пищи, ей все равно нужно было повернуть направо.
Эксперимент показал, что крысы первой группы - те, кто «изучали» и «усваивали» общую схему ситуации, ориентировались гораздо лучше, чем крысы второй группы, которые воспроизводили заученные реакции.
Толмен предположил, что у человека имеет место нечто похожее. Человек, которому удалось хорошо сориентироваться в какой-то местности, легко может пройти из одной точки в другую разными маршрутами, в том числе и незнакомыми.
Другой эксперимент исследовал латентное научение, то есть такое, которое невозможно наблюдать в то время, когда оно фактически происходит.
Голодную крысу помещали в лабиринт и давали ей возможность свободно бродить по нему. Некоторое время никакой пищи крыса не получала, то есть подкрепления не происходило. Толмена интересовало, имеет ли место какое-либо научение в такой неподкрепляемой ситуации.
Наконец, после нескольких неподкрепленных проб крысе давали возможность найти пищу. После этого скорость прохождения лабиринта резко возрастала, что показало наличие некоторого научения в период отсутствия подкрепления. Показатели этой крысы очень быстро достигали того же уровня, что и у крыс, получавших подкрепление при каждой попытке.
Было бы неправильно воспринимать Толмена как «крысиного наставника», далекого от человеческих проблем. Его статья с показательным названием «Когнитивные карты у крыс и у человека» (доступная и в переводе на русский язык) стала не только собранием доказательств против схемы S ® R, но и страстным призывом уменьшить уровень царящих в обществе фрустрации, ненависти и нетерпимости, порожденных узкими когнитивными картами.
Ввиду того что этот классический текст рискует так и остаться за пределами круга интересов наших психологов, позволим себе обширную и, кажется, очень важную цитату. Отметив, какой деструктивный характер зачастую носит человеческое поведение, Толмен заканчивает свою статью такими словами:
«Что мы можем сделать с этим? Мой ответ состоит в том, чтобы проповедовать силы разума, то есть широкие когнитивные карты. Учителя могут сделать детей разумными (то есть образовать у них широкие карты), если они позаботятся о том, чтобы ни один ребенок не был избыточно мотивирован или слишком раздражен. Тогда дети смогут научиться смотреть вокруг, научатся видеть, что часто существуют обходные и более осторожные пути к нашим целям, научатся понимать, что все люди взаимно связаны друг с другом.
Давайте постараемся не становиться сверхэмоциональными, не быть избыточно мотивированными в такой степени, чтобы у нас могли сложиться только узкие карты. Каждый из нас должен ставить себя в достаточно комфортные условия, чтобы быть в состоянии развивать широкие карты, быть способным научиться жить в соответствии с принципом реальности, а не в соответствии со слишком узким и непосредственным принципом удовольствия.