Квантовая Магия, том 1, вып. 3, стр. 3211-3219, 2004 Условный рефлекс и квантово-подобное поведение. В.О. Леонтьев к.ф.м.н., Одесса, lerych@paco.net (Получена 7 сентября 2004; опубликована 15 сентября
2004) Основной
целью статьи является построение формальной модели условного рефлекса и
доказательство нарушения формулы Байеса при его выработке. Также кратко
рассмотрен психологический аналог двухщелевого эксперимента. Введение В настоящий момент известно два экспериментальных свидетельства не выполнения в психологии законов классической (Колмогоровской) теории вероятностей. В [3, стр.412] говорится о нарушении формулы Байеса, в [4] о нарушении формулы полной вероятности в психологическом эксперименте. Но, по-видимому, этого не достаточно для того, чтобы уверенно утверждать неприменимость теории вероятностей в психологии. Нужны дальнейшие эксперименты. В этой статье будет описана схема эксперимента по проверке выполнения формулы Байеса в психологии, который, не требует каких-то специальных средств и знаний и, в принципе, его может произвести любой желающий. В [2] построена модель психических процессов, которая объясняет описанные нарушения. Суть модели состоит в том, что область внутреннего внимания человека или животного (см. [2]) может случайным образом блуждать по когнитивной (мысленной) карте окружающей реальности. В модели предполагается, что вероятность попадания какого-либо объекта когнитивной карты в область внутреннего внимания зависит от силы эмоции, связанной с этим объектом. Если когнитивная карта ситуации представляет из себя план окружающей местности (т.е. множество на плоскости), то математически эмоцию можно описывать комплексным числом. Модуль этого числа описывает силу эмоции, аргумент описывает направления движения, в котором эта эмоция толкает двигаться. Таким образом, на плоскости оказывается определенной комплекснозначная функция, модуль которой определяет вероятность попадания данной точки плоскости в некоторое подмножество плоскости, которое является областью внутреннего внимания. Волновую функцию в психологии можно понимать как функцию, описывающую вероятностное распределение области внимания по когнитивной карте окружающей реальности. В ситуации, когда нужно выбрать один из двух вариантов поведения (ответить на дихотомический вопрос, подразумевающий только ответы «да» или «нет») когнитивная карта будет состоять из двух точек. В [2] рассматривается линейная нормированная зависимость вероятности ответа от эмоции, связанной с этим ответом. Исходя из такой зависимости, выводится экспериментально полученный т.н. закон соответствия. Этот факт можно рассматривать как косвенное подтверждение линейной зависимости. Однако, не доказано, что закон соответствия не может быть выведен из какой-либо другой зависимости. В этой статье предполагается произвольная зависимость вероятности от силы эмоции. Доказывается, что законы теории вероятностей (формула Байеса) будут нарушаться при любой зависимости вероятности от силы эмоций. Это дает возможность утверждать, что если управление поведением некоторого технического устройства сконструировать в соответствии с описанной моделью, то при любой запрограммированной зависимости вероятности от ценности объекта (описываемой силой эмоции) формула Байеса будет нарушаться. В [5] поведение, нарушающее законы теории вероятностей называется квантово-подобным. Высказывается предположение, что на квантово-подобное поведение способны только высокоразвитые животные, и что, например, насекомые уже не способны на такое поведение. В этой статье будет доказано, что любое существо (или механизм), обладающее условным рефлексом (УР) способно на квантово-подобное поведение. Условный
рефлекс. Примеры поведения в процессе выработки УР хорошо известны. Например, если собаке предъявлять безусловный раздражитель (т.е. объект, удовлетворяющий какую-то потребность, пищу, например) одновременно с условным, объективно безразличным раздражителем (звонком), то через несколько повторений собака может начать реагировать только на звонок, как на пищу. А.Н. Леонтьев [1] описывал возникновение психики у простейших животных как появление способности реагировать не только на жизненно важные воздействия, но и на другую информацию. В качестве примера он приводил эксперимент, в котором в воду помещались микроорганизмы способные реагировать на свет и на тепло. Тепло было для них жизненно важным фактором, а свет безразличным. Когда одну половину сосуда нагревали, то микроорганизмы концентрировались в нагретой части. Если же половина сосуда освещалась, то концентрация микроорганизмов не менялась и оставалось равной в светлой и в темной частях. Если же освещение совмещали с нагревом, то через несколько повторений микроорганизмы начинали концентрироваться в освещенной части сосуда, даже если она не нагревалась. Этот эксперимент можно интерпретировать как возникновение УР на освещение как на условный раздражитель. Если согласиться с А.Н. Леонтьевым, то психика возникает с появлением условного рефлекса. Нас сейчас не будет интересовать физиологический и психологический механизм этого явления. Построим лишь формальную модель поведения при возникновении УР. Сначала опишем абстрактную схему его выработки. Животное подвергается воздействию одновременно двух стимулов, один из которых для животного важен (безусловный), а другой безразличен (условный). Через несколько повторений животное реагирует на ранее безразличный стимул как на безусловный. Опишем подобную ситуацию в терминах дихотомических вопросов или раздваивающегося лабиринта. Предположим, что животное движется по лабиринту, который раздваивается на два одинаковых рукава на каждом шаге см. Рис.1. На каждом шаге животное должно принять решение, куда ему двигаться направо или налево. Каждый выбор будет моделироваться случайной величиной, принимающей два значения: +1 (направо) и –1 (налево) с некоторыми вероятностями. Если экспериментатор хочет выработать УР на правый рукав, то в правом рукаве после каждого раздвоения он расположит безусловный стимул (корм). Причем, на каждом шаге ценность корма может различаться по величине или по привлекательности для животного. Все левые рукава будут пустыми.
Рис.1. Пусть до выбора рукава животное не может узнать о наличии или отсутствии в нем корма и узнает об этом только после выбора и вхождения в рукав. Предположим, что в начале лабиринта последовательно выпускают достаточно большую группу животных. О выработке УР в данной ситуации будем судить по частоте выбора правого рукава после нескольких повторений. Условным (безразличным) стимулом будет правый рукав. Безусловным стимулом будет корм в правых рукавах. На первом шаге, когда животное еще не имеет опыта прохождения лабиринта, будем считать вероятность выбора правого рукава равной ½. Будем говорить, что через несколько повторений эксперимента, т.е. через прохождение нескольких рукавов был выработан УР, если вероятность выбора правого рукава (и доля количества животных его выбравших) стала больше ½. Чем больше эта вероятность, тем успешнее прошла выработка УР. Известно, что некоторые животные могут вырабатывать УР после одного предъявления стимулов, а некоторые животные, вообще, его не могут выработать в определенных ситуациях. Т.е., видимо, эти животные различаются некоторыми психическими параметрами. Для человека подобный эксперимент можно реализовать, задавая вопросы с формально безразличными ответами «да» и «нет». Если, например, материально простимулировать максимальное количество «правильных» ответов, и на каждый ответ «да» говорить «правильно», а на каждый ответ «нет» говорить «не правильно», то должен выработаться УР на ответ «да». В таком эксперименте определим УР как увеличение вероятности выбора подкрепляемого варианта ответа. Безусловный стимул отличается от условного тем, что представляет для животного некоторую «ценность», т.е. удовлетворяет некоторую его потребность. В психологии существуют представления, в соответствии с которыми «ценность» объекта в психике отражается с помощью эмоций. Чем более «ценен» объект, тем большая положительная эмоция к нему возникает. Чем более «вреден» объект, тем большая отрицательная эмоция возникает к нему. Сила эмоции (и его «ценность») не являются величиной абсолютной даже для одного и того же животного. Она зависит еще и от состояния животного в данный момент. Например, пищевая единица вызовет большую положительную эмоцию у голодного животного, чем у сытого. У объевшегося животного корм может вызвать даже отрицательную эмоцию. Начальное состояние в [2] описывалось начальной эмоцией v, на которую накладывалась эмоциональная оценка стимула. Если эмоциональная оценка стимула в нейтральном состоянии равна u, то оценка этого же стимула в состоянии v равна v+u. Например, состояние голода повышает возбуждение нервной системы и увеличивает суммарное возбуждение как реакцию на пищевой стимул. Состояние сытости приводит к сонливости, тормозит возбуждение нервной системы и снижает суммарную реакцию (эмоцию) на пищевой стимул. Возможность суммирования воздействия и состояния будем считать допустимым лишь при сравнительно небольших v и u. Если эти величины слишком большие, то зависимость перестает быть линейной и даже монотонно возрастающей. В психологии это называется эффектом переактивации. Но сейчас будем говорить только о малой области линейности зависимости силы эмоции от величины внешнего воздействия. В [2] аксиоматизировалась линейная нормированная зависимость вероятности выбора варианта решения от силы эмоции, оценивающей этот вариант. Хотя из этой аксиомы был выведен закон соответствия, непонятно можно ли считать этот факт его доказательством. Поэтому сейчас рассмотрим произвольную зависимость вероятности от силы эмоции. Если вариант +1 вызывает эмоцию v1, вариант –1 вызывает эмоцию v2, и начальное состояние равно v, то вероятность выбора варианта +1 обозначим р(v+v1, v+v2). Будем рассматривать р как достаточно произвольную функцию двух переменных. Покажем, что при произвольной функции р при выработке УР будет нарушаться теория вероятностей. Теорема (об условном рефлексе). Поведение при выработке УР в раздваивающемся лабиринте нарушает формулу Байеса. Док-во. Рассмотрим выработку УР у большой группы животных при двух предъявлениях стимулов. При первом вхождении в лабиринт вероятность выбора рукавов равна 0.5. Если начальное состояние равно v, то т.к. оба рукава еще безразличны, суммарный отклик на каждый из них равен v, т.е. р(v,v)=0.5. Те животные, которые выбрали левый рукав не получили подкрепления (корма) и их состояние не изменилось. Те, которые свернули направо, получили корм. Пусть ценность этого подкрепления оценивается эмоцией равной е. Предположим, что получение корма сразу связалось в психике с правым рукавом лабиринта. В терминах модели из [2] это означает, что область внутреннего внимания достаточно широка и в нее попадает одновременно и корм и правый рукав. Но при этом область внутреннего внимания не слишком широка и в нее не попадает одновременно левый рукав, правый рукав и корм. Это дает основание применять модель вероятностного эмоционального принятия решения. После первого прохождения правого рукава к нему возникла суммарная эмоция v+e. Эмоция к левому рукаву осталась равной начальному состоянию v. При втором вхождении в раздвоение лабиринта те животные, которые на первом шаге выбрали правый рукав выберут его второй раз с вероятностью р(v,v+e). Те животные, которые на первом шаге выбрали левый рукав, выберут правый с вероятностью 0.5. На втором шаге в правые рукава поместим подкрепление, вызывающее эмоцию силой g. У тех животных, которые два раза выбрали правый рукав возникнет к нему суммарная эмоция v+e+g и третий раз они выберут правый рукав с вероятностью р(v,v+e+g). Доля животных три раза подряд выбравших правый рукав будет равна ½ р(v,v+e) р(v,v+e+g). Рассмотрим три случайных величины f0, fe, fg принимающих значения +1 и –1 и описывающих выбор рукавов при первом, втором и третьем вхождении в раздвоение лабиринта. Вопрос заключается в том, можно ли эти величины определить на одном вероятностном пространстве. Если можно, то выполняются Колмогоровские аксиомы и теория вероятностей применима. Этот вопрос эквивалентен вопросу о существовании совместного распределения этих трех величин. Именно в таком виде он формулируется в квантовой механике. Например, совместного распределения координаты и импульса не существует. Если совместное распределение нескольких величин существует, то оно не должно зависеть от порядка измерения этих величин. Предположим, что совместное распределение этих трех величин существует. Тогда, в частности, можно говорить о множестве элементарных событий, соответствующем трем подряд вхождениям в правый рукав, которое обозначим Аeg+++. Его вероятность равна Р(Аeg+++)
= ½ р(v,v+e) р(v,v+e+g). Теперь изменим порядок измерения величин fe и fg. Это означает, что нужно поменять порядок предъявления стимулов е и g. После первого вхождения будем предъявлять стимул g, после второго вхождения в раздвоение стимул е. Тогда Р(Аge+++)
= ½ р(v,v+g) р(v,v+g+e). Предположим сначала, что весь ансамбль животных был в одном начальном состоянии v. Тогда должно быть Р(Аeg+++) = Р(Аge+++). Откуда р(v,v+e) = р(v,v+g). Т.к. это равенство должно выполняться при любых достаточно малых е и g, то функция р есть константа по второй переменной, что противоречит здравому смыслу (в рамках сделанных предположений) т.к. увеличение эмоции к правому рукаву при неизменной эмоции к левому рукаву влечет увеличение вероятности его выбора и функция р должна быть строго монотонной по второй переменной. Итак, совместное распределение величин f0, fe, fg зависит от порядка их измерения, т.е. не существует единого вероятностного пространства, на котором они определены. Это эквивалентно нарушению формулы Байеса. Обозначим Р(fe=1) и Р(fg=1) вероятности множеств (гипотетического) вероятностного пространства, на которых fe=1 и fg=1, соответственно. Тогда формула Байеса утверждает, что Р(fg
=1|fe =1) Р(fe =1) = Р(fe =1|fg =1) Р(fg =1). Если измерять сначала fе, а потом fg, то Р(fe
=1) = р(v,v+e), Р(fg
=1|fe =1) = р(v,v+e+g). Если измерять сначала fg, а потом fе, то Р(fg
=1) = р(v,v+g), Р(fe
=1|fg =1) = р(v,v+g+e). Нарушение формулы Байеса доказано при начальном состоянии v. Однако, непонятно можно ли в реальном эксперименте получить чистое начальное состояние. Рассмотрим смешанное начальное состояние ансамбля животных. Пусть доля животных имеющих начальное состояние от v до v+dv равна dF(v).Тогда Р(Аeg+++) = ½ ∫р(v,v+e) р(v,v+e+g)dF(v). Из формулы Байеса ∫р(v,v+e+g)( р(v,v+e) – р(v,v+g))dF(v) = 0. Если предполагать строгую монотонность функции р по второй переменной, то разность в скобках будет иметь один и тот же знак при всех v. Если сделать некоторые предположения о непрерывности функций р или F, то это равенство не может выполняться ни при каких вероятностных распределениях F. Т.е. формула Байеса будет нарушаться и при смешанных состояниях. Выше УР был формально определен как увеличение вероятности выбора условного стимула после предъявления его в сочетании с безусловным. Если согласиться с моделью эмоционального вероятностного принятия решения, то механизм УР легко объясняется с ее помощью. Такой механизм легко реализовать технически или программно в некотором техническом устройстве, которое, например, предназначено для поиска некоторых полезных (для человека) объектов. Если степень полезности объекта быстро определить не удается, то имеет смысл искать связь наличия полезных свойств с некоторыми второстепенными бесполезными, но легко обнаружимыми свойствами. Т.е. наделить этот механизм способностью к выработке УР. Механизмы, в которые закладываются принципы функционирования, взятые из живой природы, называются аниматами. Таким образом, анимат, обладающий способностью определять у объектов наличие нескольких свойств как полезных, так и бесполезных, может быть наделен условным рефлексом. При этом, какой бы не была количественная связь увеличения вероятности со степенью полезности (определяющая скорость выработки УР) теорема об условном рефлексе утверждает, что поведение ансамбля таких аниматов будет квантово-подобным. Схема эксперимента по проверке формулы Байеса. Для того, чтобы экспериментально проверить возможность отсутствия совместного распределения, можно попытаться задать достаточно большой аудитории два вопроса. А. Допустимо ли обманывать близких людей? В. Допустимо ли обмануть близкого смертельно больного человека и скрыть от него диагноз? Предполагается, что на вопрос А большинство ответит «нет», а на вопрос В «да». Если вопросы задавать одной группе в порядке А-В, то в среднем после ответа на А к ответу «нет» возникнет некоторая положительная эмоция. Если сразу после этого задать вопрос В, то эта эмоция не успеет угаснуть и исказит ответы на вопрос В. В другой группе эти вопросы нужно задать в обратном порядке В-А. Тогда положительная эмоция к ответу «да» на вопрос В исказит ответ на вопрос А. Можно ожидать, что величины ААВ++ , ААВ+–, ААВ–+ , ААВ— будут отличаться от величин АВА++ , АВА+– , АВА–+ , А ВА— , соответственно. Если на эти вопросы отвечать, руководствуясь исключительно логикой и правилами общественной морали, то порядок вопросов не будет играть роли. Порядок вопросов может стать существенным, если человек при ответе руководствуется эмоциями. Люди могут очень сильно различаться по степени использования логики и эмоций при ответах. Поэтому такой эксперимент должен быть более эффективен, если его проводить с группами эмоциональных людей. В среднем, женщины более эмоциональны, чем мужчины. В технических и, тем более, физико-математических ВУЗах обучаются студенты, в среднем, более руководствующиеся логикой, чем эмоциями. Поэтому, можно ожидать, что этот эксперимент будет более эффективен в студенческих группах гуманитарных ВУЗов, большинство из которых женщины. Двухщелевой эксперимент. В [6] описан психологический аналог двухщелевого эксперимента. Испытуемый управляет точкой на мониторе компьютера, которую может провести через две щели в условном горизонтальном экране. После прохождения через щель точка попадает в пространство, в котором случайно появлялись «грибы» т.е. объекты, столкновение с которыми фиксировалось. Грибы были видимы до начала эксперимента, и невидимы для испытуемого в процессе эксперимента. За столкновения начислялись очки, т.е. грибы представляли для него определенную ценность. Фиксировалась горизонтальная координата столкновения, и строилось распределение числа столкновений по координате. Был зафиксирован волнообразный характер распределения, аналогичный двухщелевому распределению в физике. Причем, если разделить результаты для женщин и мужчин, то у женщин волновой характер распределения проявляется намного отчетливей, а у мужчин, в среднем, пропадает. В однощелевом эксперименте не получалось максимума распределения напротив щели, в отличие от физической картины. Напротив щели возникал локальный минимум распределения. Эти результаты можно попытаться понять с помощью модели эмоционального регулирования поведения [2]. Грибы представляют некоторую ценность для испытуемых, т.е. вызывают положительные эмоции. Когнитивная карта ситуации представляет из себя монитор компьютера, т.е. прямоугольник на плоскости, по которому случайным и неизвестным для испытуемого образом распределены грибы. Будем считать, что область внутреннего внимания сконцентрирована на управляемой точке и случайно блуждает по когнитивной карте. Чтобы получить значение волновой функции в произвольной точке А когнитивной карты нужно из этой точки провести вектор в направлении каждого гриба. Этот вектор изображает эмоцию, возникающую к грибу. Модуль вектора равен силе эмоции. Направление вектора указывает направление движения, в котором эта эмоция толкает двигаться, т.е. к грибу. Сила эмоции убывает с удалением от гриба. Сумма всех эмоций, как сумма всех векторов, дает суммарную эмоцию в т. А. Если этот вектор записать в виде комплексного числа, то после нормировки это будет значением волновой функции. Аргумент этого комплексного числа имеет конкретный смысл, в отличие от физики, и задает направление психологической силы. Если согласиться с аксиомами из [2], то случайное блуждание области внутреннего внимания, т.е. управляемой точки будет описываться указанной волновой функцией. Модуль этой функции определяет вероятность нахождения управляемой точки в данной области монитора. Вероятность столкновения с грибом в достаточно малой области равна произведению вероятности нахождения там гриба на вероятность нахождения там управляемой точки. Поэтому результаты эксперимента зависят не только от психических процессов испытуемых, но и от вероятностных характеристик распределения грибов на мониторе. Если рассмотреть предельный случай, то, варьируя распределение грибов можно получить любое распределение столкновений. В [6] не сообщается о характеристиках распределения грибов, поэтому результаты эксперимента могут оказаться артефактом, определяемым не психическими процессами, а этим распределением. Однако при непреднамеренном распределении грибов естественно ожидать, что их распределение будет близко к равномерному. В этом случае результаты эксперимента определяются только психическими процессами и минимум напротив щели в однощелевом эксперименте можно попытаться объяснить следующим образом. Распределение грибов на мониторе, демонстрируемое до эксперимента, представляет из себя случайную сетку с некоторым средним шагом h. Эта сетка запоминается испытуемым, и ее узлы являются центрами притяжения (как ценности). В принципе, могут найтись вертикальные линии, в которых горизонтальные составляющие всех «сил», т.е. векторов притяжения к грибам уравновешиваются. В таких точках волновая функция равна нулю и вероятность нахождения управляемой точки в этих областях мала. Следовательно, и вероятность столкновения в этих областях будет малой. Если испытуемый после начала эксперимента и исчезновения из видимости грибов мысленно располагает сетку симметрично относительно щели, то это объяснит локальный минимум напротив щели. Это объяснение близко к ситуации буриданова осла, на которого действую две противоположные равные силы (эмоции). Рис.2. Возможная мысленная схема (когнитивная карта)
расположения грибов на мониторе после начала однощелевого эксперимента. Грибы
располагаются симметрично относительно вертикальной пунктирной линии, проходящей
через щель. Пунктирные стрелки в т.А изображают психологические силы (эмоции)
притяжения к грибам. Сплошная стрелка изображает их сумму. Этот вектор,
записанный в виде комплексного числа после нормировки дает значение волновой
функции в т.А. На оси симметрии модуль волновой функции в каждом
горизонтальном сечении имеет минимум, что объясняет минимум распределения
столкновений на линии щели. Упрощенно все это можно выразить следующим образом. Испытуемый знает, что грибы случайно блуждают по монитору, поэтому у него нет оснований считать, что они концентрируются справа или слева от щели. Мысленная картина их распределения, возможно, будет симметрична относительно щели. «Силы» (эмоции), толкающие его двигаться в горизонтальном направлении могут уравновешиваться на линии щели, и он старается сразу же увести управляемую точку с этой линии, а, если и возвращается, то лишь мимоходом и не задерживается на ней. Поэтому и столкновений на этой линии будет мало. Эти представления легко проверить в эксперименте, если фиксировать не только столкновения, но и распределение положения управляемой точки на мониторе. Для применимости описанной модели эмоционального регулирования поведения нужно, чтобы испытуемый руководствовался эмоциями, а не интеллектом. Известно, что, в среднем, женщины более эмоциональны, а мужчины более логичны. Это может объяснить наличие минимума в однощелевом эксперименте у женщин, и его отсутствие у мужчин. Описанный эксперимент не является точной копией физического эксперимента, поэтому нельзя ожидать от него точного повторения физических результатов даже в случае полного совпадения физических и психических процессов. Если ставить целью не повторение физического эксперимента, а проверку описания случайного блуждания области внутреннего внимания с помощью волновой функции, то эксперимент можно упростить. Управляемая точка может блуждать не на плоскости, а на отрезке, что упростит формальное описание. Грибы можно, вообще, убрать и эксперимент заканчивать через фиксированное время. А для стимуляции испытуемых сообщать им какие-то условные результаты их деятельности. Этим будут исключены возможные артефакты. Нужно отметить, что случайное блуждание животных подробно исследуется в биологии (см. литературу в [7]). Например, известен экспериментальный факт, что в свободном пространстве животное удаляется от начальной точки, в среднем, быстрее, чем при броуновском движении. Этот факт называется аномальной диффузией. Имеется в виду, что показатель степени в зависимости среднего удаления от начальной точки от времени больше ½. Это явление также качественно можно объяснить с помощью эмоционального регулирования поведения. Животное запоминает уже исследованные области пространства и т.к. в них нет ничего ценного, исследовательская эмоция интереса к новому влечет животное, в среднем, чаще двигаться в неисследованные области пространства, и тем самым, удаляться от начальной точки. При броуновском движении направление движения на каждом шаге не зависит от предыдущего, что снижает скорость удаления по сравнению с животными. Литература
|