Я "
говорилкой" такие вещи читаю: в пути, или во время домашних дел.
Вот, фрагменты из этой книжки:
Режимы подкрепления.
Бытует неправильный взгляд, что если вы начали вырабатывать поведение с помощью положительного подкрепления, то должны продолжать его применение на протяжении всей дельнейшей жизни субъекта, если этого не будет, то поведение исчезнет. Это неверно: постоянное подкрепление необходимо только на стадиях обучения. Вы можете несколько раз вознаградить годовалого ребенка за пользование горшком, но как только поведение заучено, предмет обучения сам о себе позаботится. Мы даем или должны давать начинающему множество подкреплений - обучение ребенка езде на велосипеде идет под настоящий поток: "Правильно, крепче держи руль, у тебя получилось, хорошо!" Но вы будете выглядеть довольно глупо (а ребенок решит, что вы сошли с ума), если вы будете продолжать хвалить его после того как навык установился. Для того чтобы поддерживать уже выученное поведение на определенном уровне надежности, не только не надо подкреплять его все время, а даже, наоборот, следует прекратить регулярные подкрепления и перейти на эпизодическое использование подкрепления, подаваемого в случайном и не предсказуемом порядке. Это и есть то, что психологи называют вариабельным режимом подкрепления.
Вариабельный режим гораздо более эффективен для поддержания поведения, чем постоянный, предсказуемый. Один психолог объяснил это мне так: если у вас машина новая и всегда хорошо заводилась, а однажды, когда вы сели в нее, повернули ключ, она не завелась, то вы, может быть, и попробуете завести ее еще несколько раз, но скоро решите, что что-нибудь не в порядке, и позвоните в гараж. Поведение, состоящее в поворачивании ключа, при отсутствии ожидаемого немедленного подкрепления быстро угаснет. С другой стороны, если у вас вместо машины старая консервная банка, которая еще ни разу не заводилась с первой попытки, и каждый раз требуется целая вечность для того, чтобы привести ее в движение, вы можете продолжать попытки ее завести в течение получаса; ваше поведение по поворачиванию ключа происходит в низковероятностном режиме подкрепления и поэтому сильнейшим образом поддерживается. Если давать дельфину рыбку за каждый прыжок, то скоро прыжки станут невысокими, небрежными, лишь бы отделаться. Если теперь перестать давать рыбу, дельфин тут же перестает прыгать. Но, если после того как животное научилось прыгать за рыбку, начать подкреплять первый прыжок, затем третий и так далее наугад, поведение будет поддерживаться на более высоком уровне: не получив подкрепления, животное станет прыгать чаще, стараясь угадать счастливый номер, и прыжки могут даже усилиться. В свою очередь это позволит подкреплять выборочно наиболее сильные прыжки, - то есть посредством вариативного режима совершенствовать деятельность. Но даже некоторые профессиональные дрессировщики не могут правильно использовать вариативный режим положительного подкрепления; многим эта концепция представляется особенно трудной, не укладывающейся в голове. Нам понято, что нет нужды продолжать наказывать за неправильное поведение, если оно прекратилось, но почему бы не вознаграждать постоянно за правильное поведение.
Действенность вариатавного подкрепления лежит в основе всех азартных игр. Если каждый раз, опустив в автомат 5 центов, будете получать десять, то скоро вы потеряете к этому интерес. Да, вы будете делать деньги, но какой это нудный способ! Людям нравится играть с автоматом именно потому, что невозможно предугадать заранее, то ли ничего не получишь, то ли какую-то мелочь, то ли сразу кучу денег, и когда именно будет это подкрепление (это может быть только один самый первый раз). Почему одни люди втягиваются в азартную игру, а другие могут поиграть и бросить, это уже другой вопрос, но для тех, кто попался на крючок, этим крючком стал вариативный режим положительного подкрепления. Чем длительнее интервалы между подкреплениями в вариативном режиме, тем сильнее он стимулирует поведение. Однако режимы с длительными интервалами работают против вас, когда вы пытаетесь угасить поведение. Если поведение не подкреплять совсем, то скоро появится тенденция к его угасанию; но если оно все-таки время от времени подкрепляется - неважно сколь эпизодично - одна сигарета, одна рюмка, одна поблажка ворчуну или нытику - и поведение вместо того, чтобы угасать, может быть значительно усилено режимом с длительными интервалами между подкреплениями. Всем встречались люди, которые непонятным образом привязаны к супругам или любовникам, которые с ними плохо обращаются. Мы привыкли думать, что так бывает только с женщинами - она чувствует влечение к тому, кто груб, невнимателен, эгоистичен и даже жесток, она его все равно любит, - но это случается и с мужчинами. Каждый знает людей, которые после развода или другого рода утраты находят другого человека, в точности похожего на предыдущего.
Являются ли эти люди вечными жертвами по каким-либо глубоким психологическим причинам? Возможно. Но, может быть, они - жертвы режима с длительными интервалами между подкреплениями? Если вы вступили в связь с очаровательным, обаятельным, интересным в с-суальном плане, веселым и внимательным человеком, а затем он становится все более несговорчивым, даже обидчивым, но все же время от времени проявляет свои хорошие качества, вы станете жить ради этих все более редких моментов, когда вы получаете это прекрасное подкрепление: полное очарования, обаяния, привлекательности и веселья внимание. И парадоксально с точки зрения здравого смысла, но закономерно с точки зрения теории обучения, что чем реже и непредсказуемей становятся такие моменты, тем сильнее становится их подкрепляющий эффект, и тем дольше ваша линия поведения будет сохраняться. Кроме того, легко понять, почему человек, однажды оказавшийся в таких отношениях, часто ищет их повторения: ему может казаться, что во взаимоотношениях с нормальным человеком, который сдержан и доброжелателен большую часть времени, не хватает остроты того редкого, страстно желаемого и потому вдвойне действенного подкрепления.
Посмотрите на ситуацию с точки зрения человека, управляющего поведением: «Я могу держать ее (его) в безоговорочном подчинении, так, чтобы она (он) делала все, что я захочу, ради моего удобства и спокойствия, до тех пор пока я даю ей (ему) все, что она (он) хочет... изредка». Это один из способов, которыми сутенеры держат в повиновении своих девочек. Конечно, это крепкие путы, но однажды жертва осознает, что сила "очарования" по крайней мере отчасти зависит от режима подкрепления, и спокойно уйдет от этого типа отношений и поищет что-то другое.
--
Прежде всего тренер должен уяснить, что точность времени подачи подкрепления превыше всего.
Испытуемый должен уяснить, что при этой форме обучения мозг - не помощник. Совершенно безразлично, что вы об этом думаете; если вы просто передвигаетесь, коллекционируя свистки (условные подкрепляющие сигналы), ваше тело поймет, что делать, без вашей помощи. Это поистине мучительный опыт для ярких интеллектуальных людей. У них имеется тенденция замирать, услышав свисток, и пытаться анализировать, что они делали.
То, что они этого не знают, и то, что их незнание ничего не значит, их шокирует.
Однажды мы с моей коллегой Шери Диш обучали психолога Рональда Шустермана ходить по комнате заложив руки за спину в течение примерно минуты - довольно длительный период без подкрепления, но он был очень прилежен до тех пор, пока собравшиеся не пришли к мнению о том, что мы полностью сформировали поведение, и не разразились аплодисментами (что является подкреплением для тренера и почти всегда возникает спонтанно). Рон, который во время своих исследований много работал с обучением животных и который опрометчиво считал, что его самого нельзя "выдрессировать", не подозревал, что его сцепленные за спиной руки являются сформированным поведением, а не просто надпороговым выражением мышления.
Считалось, что словесная коммуникация наиболее важна и что обучение не может произойти без использования языка или по крайней мере некоего вербального осмысливания. Опыт невербального обучения особенно полезен для тех, кто использует массу словесных инструкций в своей профессиональной деятельности: учителей, терапевтов, инспекторов. Побывав "животным", вы сможете проникнуться симпатией, даже сочувствием к любому субъекту, который осуществляет формируемое вами поведение, но не отдает себе отчета, что от него ожидается, и поэтому легко впадает в ошибки. Вы сможете быть терпеливыми по отношению к животному (или ребенку, или больному), которое срывается и впадет в ярость, когда то, что он считал правильным действием, оказывается неподходящим, и это непредвиденное осложнение у человеческих существ может вызвать слезы.
--
Подкрепление может быть словесное, тактильное или любое другое, которое, как вам кажется, скорее всего найдет отклик или будет благосклонно принято вашим соседом. Люди не глупы, они изменяют свое поведение, чтобы получить подкрепление. Даже если раскидывание грязных вещей является своеобразным актом агрессии в отношении вас ("Собери мою одежду, пижон!"), используя положительное подкрепление, вы можете получить устойчивый и зримый процесс в сторону, которую вы считаете приемлемым уровнем аккуратности.
Однако в использовании процесса формирования существуют две ловушки.
Первая состоит в том, что легче заметить ошибки, чем улучшение, и поэтому для таких вербальных существ, каковыми являемся мы, гораздо проще негодовать, когда критерий не достигнут, чем давать подкрепление, когда он достигнут. И это может свести на нет прогресс.
Вторая опасность состоит в том, что если вы предполагаете сформировать чье-либо поведение, то очень заманчиво поболтать об этом. А такие разговоры - могут все разрушить:
• Если вы говорите: "Ты получишь награду" - за то, что положил белье в корзину, не куришь марихуану, тратишь меньше денег или за что-либо другое, — вы лишь совершаете
подкуп или даете обещание, а не истинное подкрепление;
• При обучении, идущем по вашему плану, человек может иногда ему противиться и нарочно поступать не так как нужно. Чтобы добиться результатов, надо осуществлять формирование поведения, а не говорить о нем.
• А если вам удалось сформировать чье-либо поведение, то в дальнейшем также лучше этим не хвастаться. Некоторые этого совершенно не понимают и постоянно подчеркивают свою роль (например, это проявляется в опеке), а это лучший способ нажить себе в лице субъекта врага на всю жизнь...
• Кроме того, если вы помогли кому-то улучшить какой-либо навык или избавиться от плохой привычки, меняя в качестве подкрепления собственное поведение, на кого падает основная тяжесть работы? На субъекта. Умные родители никогда не раззванивают повсюду о том благе, которое они совершили, воспитывая своих, детей. Во-первых, мы все знаем, что эта работа никогда не кончается, а во-вторых, дети заслуживают похвалы - хотя бы за то, что выдерживают все педагогические ошибки, которые мы совершаем.
• Так как формирование поведения людей может или даже должно происходить в несловесной форме, то некоторые воспринимают это как своего рода злонамеренные манипуляции. Мне кажется, что это не от недопонимания. Причина того, что формирование должно быть невербальным, состоит в том, что мы имеем дело с поведением, а не с идеями, и не только с чьим-нибудь поведением, но и со своим собственным.
• Однако поскольку вы можете формировать поведение людей без того, чтобы то, что вы делаете, доходило до их сознания, и поскольку, не имея формального согласия на то, чтобы быть обученным, как это бывает при уроках игры в теннис, вы едва ли не обязаны формировать людское поведение на невербальном уровне, то не возникает ли возможность заставлять людей совершать ужасные вещи?
Конечно, да, особенно если вы в качестве отрицательного подкрепления используете такие резко неприятные стимулы, которые вызывают истинный страх и даже ужас. В лабораторных условиях психологи обнаружили феномен названный "выученная беспомощность". Если животное обучено избегать неприятного стимула, такого как удар электрического тока, при помощи нажима на рычаг или перемещения в другую часть клетки, где нет абсолютно никаких способов избежать удара тока, оно постепенно прекращает все попытки отделаться от неприятности. Оно становится полностью податливым и пассивным, и может даже лежать и получать наказания даже тогда, когда снова появляется путь к свободе. Аналогом этого феномена у людей возможно является "промывание мозгов". Если человек подвергается строгой изоляции и неизбывному страху или боли, и если неприятные стимулы в последующем используются в качестве отрицательного подкрепления, то в тех случаях, когда человек может избегнуть или прекратить их действие, изменив поведение, - ну, тогда... животные обычно погибают, а люди оказываются более стойкими, и некоторые начинают делать все что угодно, чтоб избежать отрицательного подкрепления.
Фотографии заложницы, держащей автомат при ограблении банка, тому доказательство. Но так как захватившим ее в плен не понадобилось никакой книги о том, как этого добиться, то не лучше ли каждому из нас в качестве защиты от таких происшествий понимать, как действуют законы формирования поведения?
--
Стимулы в качестве подкрепления: поведенческие цепи.
Как только стимул становится условным сигналом, происходит интересная вещь: он превращается в подкрепление. Вспомните звонок на перемену в школе. Звонок на перемену является сигналом, условным сигналом, означающим: "Вы свободны, идите и играйте". А кроме того, он воспринимается как подкрепление - дети рады, когда слышат его, и если бы они смогли сделать что-либо, чтоб заставить его прозвенеть скорее, они бы это сделали. Теперь представьте себе звонок на перемену, который не звонит, если в классе нет тишины. Ко времени перемены у вас будет очень тихий класс.
Условный стимул - предвестник подкрепления, и поэтому он становится желаемым событием. Желаемое событие - это само по себе уже подкрепление, а потому вы с успехом можете подкреплять поведение, давая условный стимул другого поведения. Например, я вознаграждаю кошку лакомством, когда она подходит ко мне по команде - она этому научается и выполняет это. Теперь, если я буду говорить: "Ко мне" и вознаграждать ее за реакцию всякий раз как увижу ее - на камине, то скоро окажется, что кошка, стремясь получить лакомство, будет забираться на камин. Как вы помните, с точки зрения кошки, она обучает меня давать ей лакомство. Для этого она нашла способ заставлять меня произносить: "Ко мне". Теперь допустим, что я обучаю ее вспрыгивать на камин, когда я жестом показываю на него, подкрепляя правильные ответы либо пищей, либо командой "Ко мне". Затем я буду жестом указывать на камин всякий раз, когда: а) я знаю, что кошка голодна и б) когда она случайно перевернется через спину...
Я выработала цепное поведение.