Оптимальное поведение системы. Поведение

Общая схема принятия решений. Виды и параметры экономических задач оптимизации и управления

Любая задача по принятию решений характеризуется наличием некоторого количества лиц, которые имеют определенные возможности и преследуют определенные цели. Поэтому чтобы построить модель принятия решений необходимо ответить на вопросы:

· кто принимает решения;

· каковы цели принятия решения;

· в чем состоит принятие решения;

· определить круг вариантов;

· при каких условиях принимается решение.

Для того чтобы построить модель, нужно ввести некоторые обозначения.

N – это множество всех сторон, принимающих решение. N=(1; n) , т.е. имеется n участников. Каждый участник называется лицом, принимающим решение (физическое лицо, юридическое лицо).

Допустим, множество всех допустимых решений предварительно изучено и описано в виде неравенства (математически).

Если обозначить через х 1 , х 2 ,…,х n представленные альтернативы, то процесс принятия решения сводится к следующему: каждое лицо выбирает конкретный элемент из всего множества решений, т. е. .

В результате набор х 1 , х 2 ,…,х n можно назвать определенной ситуацией.

Для оценки вектора с точки зрения преследуемых целей строится функция , которая называется целевой функцией, которая ставит в соответствие каждой ситуации числовые значения (оценки) . Например, доходы фирм в ситуации либо затраты тех же фирм в данной ситуации.

Исходя из вышесказанного, цель i -ого лица, принимающего решение можно сформулировать так: выбрать такое , чтобы в ситуации х число будет либо максимальным, либо минимальным.

Однако влияние на данную ситуацию других сторон усложняет процесс, т.е. происходит пересечение интересов отдельных лиц. Возникает конфликтность, которая выражается в том, что функция помимо х i зависит еще и от x j , . Поэтому в моделях принятия решений с несколькими участниками их цели приходится формализовать иначе, чем максимизация (минимизация) значений функции .

Таким образом, общая схема задачи по принятию решений может быть сформулирована следующим образом:

Это совокупность всех характеристик (условий), при которых приходится принимать решение.

Если в формуле (*) N состоит только из одного элемента, а все условия и предпосылки исходной реальной задачи можно описать в виде множества допустимых решений, то получаем структуру оптимизационной или экстремальной задачи:

Данная схема используется лицом, принимающим решение, как планирующая и с помощью нее можно описать две экстремальные задачи:

Если в данной задаче учитывается фактор времени, то называется задачей оптимального управления.


Если у лица, принимающего решение, существует несколько целей, то уравнение (*) будет иметь вид . В данном случае функции определены на одном и том же множестве Х. Такие задачи называют задачами многокритериальной оптимизации.

Существуют задачи по принятию решений, которые получили название исходя из своего назначения: системы массового обслуживания, задачи сетевого и календарного планирования, теория надежности и т. д.

Если элементы модели (*) не зависят от времени, т. е. процесс принятия решения является мгновенным, то задача называется статической, в противном случае – динамической.

Если элементы (*) не содержат случайных величин, то задача является детерминированные, в противном случае – стохастические.

Примеры задач:

1. Задача оптимального раскроя

Фирма изготавливает изделия из нескольких деталей (p) . Причем в одно изделие эти детали входят в количествах . С этой целью производится раскрой m партий. В i -ой партии имеется b i единиц материала. Каждую единицу материала можно раскроить n способами. При этом получается a ijn количество деталей. Требуется составить план раскроя, чтобы получить максимальное число изделий.

2. Транспортная задача

Имеется n поставщиков и m потребителей одного и того же продукта. Известен выпуск продукции у каждого поставщика и потребности в ней каждого потребителя, а также затраты на перевозки продукции от поставщика к потребителю. Требуется построить план перевозок с минимальными транспортными расходами с учетом пожеланий поставщиков и спроса потребителей.

3. Задача о назначении на работу

Имеется n работ и n исполнителей. Стоимость выполнения работы i исполнителем j равна c ij . Нужно распределить исполнителей на работы, чтобы минимизировать оплату труда.

4. Задача о распределении вложений

Имеется n проектов. Причем для j -ого проекта известен ожидаемый эффект от реализации d и необходимая величина капиталовложений g j . Общий объем капиталовложений нее может превышать заданной величины b . Требуется определить, какие проекты необходимо реализовать, чтобы суммарный эффект был наибольшим.

5. Задача о размещении производства

Планируется выпуск m видов продукции, которые могут производиться на n предприятиях. Издержки производства, сбыта единицы продукции, плановый объем годового производства и плановая стоимость единицы продукции каждого вида известны. Требуется из n предприятий выбрать такие m , каждое из которых будет производить один вид продукции.

В задачах принятия решений под принципом оптимальности понимается совокупность правил, при помощи которых лицо, принимающее решение, определяет свои действия, причем таким образом, чтобы максимально обеспечить достижение определенной цели. Такое решение называется оптимальным.

Конечная цель исследования любой задачи – это нахождение оптимального решения для всех лиц, их принимающих.

Принцип оптимальности выбирается без учета конкретных условий принятия решений (количество участников, целей, возможностей, характер столкновения интересов).

Формализация оптимального поведения – это один из сложных этапов математического моделирования.

Разработка любого принципа оптимальности оправдана, если отвечает следующим требованиям:

2. Существование оптимального решения при различных дополнительных предположениях.

3. Возможность выявления отличительных признаков оптимальных решений для их обнаружения (необходимость и достаточность оптимальности).

4. Наличие методов вычисления оптимального решения (точного или приблизительного).

В теории принятия решений разработано большое количество формальных принципов оптимального поведения:

1. Принцип максимизации (минимизации) применяется в основном в задачах математического программирования, рассчитанных на нахождение оптимальных минимума или максимума.

2. Принцип свертки критериев применяется в основном в задачах при оптимизации многих критериев одним координирующим центром (задача многокритериальной оптимизации).

Для каждого из критериев или целевых функций экспертным путем назначаются веса или числа , причем каждое из них положительное и их сумма равна 1. Каждое показывает важность или значимость своего критерия . Принимаемое решение должно максимизировать или минимизировать свертку критериев, причем решение х выбирается из множества Х.

3. Принцип лексикографического предпочтения. Сначала критерий оптимальности ранжируется по важности и составляется в виде набора целевых функций . Некоторое решение х предпочтительнее решения , если выполняется одно из условий:

Содержится n+1 уравнений. n+1 – когда все совпадают: .

4. Принцип минимакса применяется при столкновении интересов противоборствующих сторон, т. е. в условиях конфликта. Каждое лицо, принимающее решение, для каждой своей стратегии рассчитывает гарантированный результат. Затем окончательно выбирает ту стратегию, для которой этот результат будет наибольшим. Такое действие не дает максимального выигрыша, однако является единственно разумным принципом в условиях конфликта. В частности исключается всякий риск.

5. Принцип равновесия по Нэшу является обобщением принципа минимакса, когда во взаимодействии участвует много сторон, каждая из которых преследует свою цель, но прямого противостояния нет. Если количество лиц, принимающих решение, равно n , то набор выбранных ситуаций х 1 , х 2 ,…,х n называется равновесным, если одностороннее отклонение любого лица от этой ситуации, то может привести лишь к уменьшению его выигрыша. В ситуации равновесия участники не получают максимального выигрыша, но они даются придерживаться данной ситуации.

6. Принцип оптимальности по Парето предполагает в качестве оптимальных те ситуации, в которых улучшение выигрыша отдельного участника невозможно без ухудшения выигрышей других участников. Данный принцип предъявляет более слабые требования к понятию оптимальности, чем принцип равновесия по Нэшу, поэтому парето-оптимальные ситуации существуют почти всегда.

7. Принцип недоминирующих исходов является представителем многих принципов оптимальности в задачах коллективного принятия решений. Это приводит к понятию ядра решений. В данном случае все участники объединяются и совместными согласованными действиями максимизируют общий выигрыш. Принцип недоминируемости – один из принципов справедливого дележа между участниками общего выигрыша. Возникает ситуация, когда один из участников не может аргументировано возразить против предлагаемого способа дележа.

8. Принцип устойчивости (угрозы и контругрозы). Каждая команда участников выдвигает свое предложение с определенными условиями. Если это условия не будут выполнены, то последуют определенные санкции. Оптимальным является решение, когда против всякой угрозы находится контругроза со стороны другой команды.

9. Арбитражные схемы, основанные на положении конфликта и на решении его с помощью арбитражного судьи. Оптимальное решение строится при помощи системы аксиом, включающих в себя несколько принципов оптимальности.

10. Принцип крайнего пессимизма или критерий Вальда. По этому принципу игра с природой или принятие решения в условиях неопределенности ведется как с разумным агрессивным противником, делающим все для того, чтобы помещать достигнуть определенного успеха.

11. Принцип минимаксимального риска является пессимистическим по своей природе, но при выборе оптимальной стратегии ориентируется не на выигрыш, а на риск, т. е. риск определяется как разность между максимальным выигрышем и реальным выигрышем. Оптимальной считается величина минимального выигрыша.

12. Принцип пессимизма-оптимизма или критерий Гурвица. Принцип использует максимальное взвешенное среднее между крайним оптимизмом и крайним пессимизмом. Варианты выбираются из субъективных соображений, исходя из опасности ситуации.

Концепция динамической устойчивости заключается в следующем. Так как все изложенные принципы сформулированы относительно статистических задач, поэтому применение их в динамических задачах сопровождается осложнениями, т. к. любой принцип оптимальности, выбранный в начальном состоянии, оставался оптимальным до конца динамического процесса. Такое свойство называется динамической устойчивостью и может рассматриваться как принцип реализуемости статистических принципов оптимального поведения в динамических моделях принятия решений.

Организационная деятельность. Альтернативные парадигмы организационного процесса.

Все многообразие подходов к организационной деятельности можно представить в виде двух альтернативных парадигм (табл. 5.1). Приведенные парадигмы отражают два принципиально разных подхода к организационной деятельности. Первый можно условно назвать подходом принуждения, когда для создания и поддержания необходимо прикладывать усилия. Как только эти усилия прекращаются, система возвращается к исходному состоянию. Можно конструировать сколь угодно много искусственных организационных схем, но они будут непрочными и неэффективными. История знает немало таких примеров: колхозы, совнархозы, производственные объединения и т.д.

Таблица 5.1

Альтернативные парадигмы организационного процесса

Второй подход ориентирован на естественные процессы организации, развивающийся достаточно долго, чтобы дать место и волеизъявлению человека. Цели человека, выпадающие из диапазона естественного развития (например, создание колхозов), обречены на провал, какие бы ресурсы ни привлекались для их достижения. Вместе с тем здесь нет фатализма – человек с его целеполагающей и волевой деятельностью не исключается из процесса развития, надо лишь выполнить условие: пространство целей человека должно совпадать с диапазоном направлений естественного (возможного в принципе) развития. Ориентацию на естественное развитие можно найти и в исследованиях А. Смита, который утверждал, что для социально-экономического развития общества необходимы мир, легкие налоги и терпимость в управлении, а все остальное сделает естественный ход вещей.

Система управления - кибернетический подход. Принципы управления: принцип разомкнутого управления; принцип разомкнутого управления с компенсацией возмущений; принцип замкнутого управления; принцип однократного управления.

Организация как процесс организовывания – одна из основных функций управления. Под функцией управления понимают совокупность повторяющихся управленческих действий, объединенных единством содержания. Поскольку организация (как процесс) служит функцией управления, любое управление представляет собой организационную деятельность, хотя и не сводится только к ней.

Управление – особым образом ориентированное воздействие на систему, обеспечивающее придание ей требуемых свойств или состояний. Одним из атрибутов состояния является структура.

Организовать – значит, прежде всего создать (или изменить) структуру.

При различиях в подходах к построению систем управления существуют общие закономерности, разработанные в кибернетике. С позиций кибернетического подхода система управления представляет собой целостную совокупность субъекта управления (управляющая система), объекта управления (управляемая система), а также прямых и обратных связей между ними. Предполагается также, что система управления взаимодействует с внешней средой.

Базовым классификационным признаком построения систем управления, определяющим вид системы и ее потенциальные возможности, способ организации контура управления. Согласно последнему выделяют несколько принципов организации контура управления.

Принцип разомкнутого (программного) управления. В основе этого принципа лежит идея автономного воздействия на систему независимо от условий ее работы. Очевидно, что область практического применения этого принципа предполагает достоверность знания состояния среды и системы на всем интервале ее функционирования. Тогда можно предопределить реакцию системы на рассчитанное воздействие, которое заранее программируется в виде функции (рис. 5.1).

Рис. 5.1. Принцип разомкнутого управления

Если данное воздействие отлично от предполагаемого, немедленно последуют отклонения в характере изменения выходных координат, т.е. система окажется незащищенной от возмущений в исходном смысле этого слова. Поэтому подобный принцип используется при уверенности в достоверности сведений об условиях работы системы. Например, для организационных систем подобная уверенность допустима при высокой исполнительской дисциплине, когда отданное распоряжение не нуждается в последующем контроле. Иногда такое управление называют директивным. Несомненным достоинством такой схемы управления является простота организации управления.

Принцип разомкнутого управления с компенсацией возмущений. Содержание подхода состоит в стремлении ликвидировать ограниченность первой схемы, т.е. нерегулируемое воздействие возмущений на функционирование системы. Возможность компенсации возмущений, а значит, ликвидация недостоверности априорной информации базируется на доступности возмущений измерениям (рис. 5.2).


Рис. 5.2. Принцип компенсационного управления

Измерение возмущений позволяет определить компенсирующее управление, парирующее последствия возмущений. Обычно наряду с корректирующим управлением система подвергается программному воздействию. Однако на практике далеко не всегда удается зафиксировать информацию о внешних возмущениях, не говоря уже о контроле отклонений параметров системы или неожиданных структурных изменениях. При наличии информации о возмущениях принцип их компенсации путем введения компенсирующего управления представляет практический интерес.

Принцип замкнутого управления. Рассмотренные выше принципы относятся к классу разомкнутых контуров управления: величина управления не зависит от поведения объекта, а представляет собой функцию времени или возмущения. Класс замкнутых контуров управления образуют системы с отрицательной обратной связью, воплощающие базовый принцип кибернетики.

В таких системах заранее программируется не входное воздействие, а требуемое состояние системы, т.е. следствие воздействия на объект, в том числе управления. Следовательно, возможна ситуация, когда возмущение позитивно воздействует на динамику системы, если приближает ее состояние к желаемому. Для реализации принципа априорно находится программный закон изменения состояния системы во времени Спр(t), а задача системы формулируется как обеспечение приближения действительного состояния к желаемому (рис. 5.3). Решение этой задачи достигается определением разности между желаемым состоянием и действительным:

∆С(t) = Спр(t) – С(t).


Рис 5. 3 Принцип замкнутого управления

Данная разность используется для управления, призванного свести к минимуму обнаруженное рассогласование. Тем самым обеспечивается приближение регулируемой координаты к программной функции независимо от причин, вызвавших появление разности, будь то возмущения различного происхождения или ошибки регулирования. Качество управления сказывается на характере переходного процесса и установившейся ошибке – несовпадении программного и действительного конечного состояния.

В зависимости от входного сигнала в теории управления различают:

■ системы программного регулирования (рассматриваемый случай);

■ системы стабилизации, когда cпр(t) = 0;

■ системы слежения, когда входной сигнал априорно неизвестен.

Эта детализация никак не сказывается на реализации принципа, но вносит специфику в технику построения системы.

Широкое распространение этого принципа в естественных и искусственных системах объясняется продуктивностью организации контура: задача управления эффективно решается на концептуальном уровне благодаря введению отрицательной обратной связи.

Рассмотрен случай программирования изменения во времени состояния системы Спр(t),что означает предварительный расчет траектории в пространстве состояний. Но из поля зрения выпал вопрос, как это сделать. Ответ лимитируется двумя требованиями к траектории, которая должна:

1) проходить через цель;

2) удовлетворять экстремуму критерия качества, т.е. быть оптимальной.

В формализованных динамических системах для отыскания подобной траектории привлекается аппарат вариационного исчисления или его современные модификации: принцип максимума Л. Понтрягина или динамическое программирование Р. Беллмана. В том случае, когда задача сводится к поиску неизвестных параметров (коэффициентов) системы, для ее решения привлекаются методы математического программирования – требуется отыскать экстремум функции качества (показателя) в пространстве параметров. Для решения плохо формализуемых проблем остается уповать на эвристические решения, основанные на футурологических прогнозах, или на результаты имитационного математического моделирования. Точность подобных решений оценить сложно.

Возвратимся к задаче программирования. Если существует способ расчета программной траектории для формализованных задач, то естественно потребовать от системы управления, чтобы она довольствовалась целеуказанием, а программное изменение состояния системы находила непосредственно в процессе управления (терминальное управление). Такая организация системы, конечно, усложнит алгоритм управления, но позволит свести к минимуму исходную информацию, а значит, сделает управление более оперативным. Подобная задача в 1960-х гг. была теоретически решена профессором Е. Горбатовым для управления движением баллистических ракет и космических аппаратов.

В отношении постановки и решения задачи оптимального управления следует учитывать следующее принципиальное обстоятельство.

Выбрать оптимальное поведение системы можно, только если достоверно известны поведение изучаемого объекта на всем интервале управления и условия, в которых происходит движение.

Оптимальные решения могут быть получены и при выполнении других, дополнительных допущений, но дело как раз в том, что каждый случай следует оговорить особо, решение будет справедливо “с точностью до условий”.

Проиллюстрируем сформулированное положение на примере поведения бегуна, стремящегося достичь высокого результата. Если речь идет о короткой дистанции (100, 200 м), то подготовленный спортсмен ставит целью обеспечить максимальную скорость в каждый момент времени. При беге на более длинные дистанции успех определяется его умением правильно распределять силы на трассе, а для этого он должен отчетливо представлять свои возможности, рельеф маршрута и особенности соперников. В условиях ограниченных ресурсов ни о какой максимальной скорости в каждый момент не может идти и речи.

Вполне очевидно, что приведенное ограничение выполняется только в рамках детерминированной постановки задачи, т.е. когда априорно все достоверно известно. Такие условия оказываются чрезмерными для реальных задач: прокрустово ложе детерминизма не соответствует действительным условиям функционирования системы. Априорность нашего знания чрезвычайно сомнительна как в отношении самой системы, так и среды и ее взаимодействия с тем или иным объектом. Достоверность априорных сведений тем меньше, чем сложнее система, что не добавляет оптимизма исследователям, проводящим процедуру синтеза.

Подобная неопределенность привела к появлению целого направления в теории управления, базирующегося на учете стохастических условий существования системы. Самые конструктивные результаты были получены при разработке принципов адаптивных и самонастраивающихся систем.

Оптимизация управления. Адаптивные и самонастраивающиеся, системы.

Адаптивные системы позволяют справляться с неопределенностью путем получения дополнительной информации о состоянии объекта и его взаимодействии со средой в процессе управления с последующей перестройкой структуры системы и изменением ее параметров при отклонении условий работы от априорно известных (рис. 5.4). При этом, как правило, цель трансформаций состоит в приближении характеристик системы к априорным, использовавшимся при синтезе управления. Таким образом, адаптация ориентирована на сохранение гомеостаза системы в условиях возмущений.


Рис. 5.4. Адаптивная система

Одной из сложнейших конструктивных составляющих этой задачи является получение сведений о состоянии среды, без чего затруднительно проводить адаптацию.

Примером успешного получения информации о состоянии среды может служить изобретение трубки Пито, которой снабжены практически все летательные аппараты. Трубка позволяет измерить скоростной напор – важнейшую характеристику, от которой зависят непосредственно все аэродинамические силы. Результаты измерения используются для настройки автопилота. Аналогичную роль в социальных системах играют социологические опросы, позволяющие корректировать решения внутри- и внешнеполитических проблем.

Эффективным приемом изучения динамики объекта управления является метод дуального управления, некогда предложенный А. Фельдбаумом. Суть его состоит в том, что на объект наряду с командами управления подаются специальные тестирующие сигналы, реакция на которые заранее установлена для априорной модели. По отклонению реакции объекта от эталонной судят о взаимодействии модели с внешней средой.

Подобный прием использовался в русской контрразведке во время Первой мировой войны для выявления шпиона. Выделялся круг сотрудников, подозреваемых в предательстве, и каждому из этого круга “доверялась” важная, но ложная информация, имеющая уникальный характер. Наблюдалась реакция противника, по которой и идентифицировался изменник.

От адаптивных систем отличают класс самонастраивающихся систем. Последние в процессе адаптации настраиваются. Однако на принятом уровне общности структура самонастраивающейся системы аналогична структуре адаптивной системы (см. рис. 5.4).

Относительно процессов адаптации и самонастройки можно отметить, что их возможность в конкретных случаях в основном определяется назначением системы и ее техническим воплощением. Подобная теория систем изобилует иллюстрациями, но, как представляется, не содержит обобщающих достижений.

Другой путь преодоления недостаточности априорных данных о процессе управления заключается в совмещении процесса управления с процедурой его синтеза. Традиционно алгоритм управления есть результат синтеза, базирующийся на допущении детерминированного описания модели движения. Но очевидно, что отклонения в движении принятой модели сказываются на точности достижения цели и на качестве процессов, т.е. приводят к отклонению от экстремума критерия. Отсюда следует, что строить управление нужно как терминальное, рассчитывая траекторию в реальном времени и обновляя сведения о модели объекта и условиях движения. Конечно, и в данном случае необходимо экстраполировать условия движения на весь оставшийся интервал управления, но по мере приближения к цели точность экстраполяции возрастает, а значит, повышается качество управления.

В этом видна аналогия с действиями правительства, которое не в состоянии выполнять плановые задания, например бюджетные. Условия функционирования экономики меняются нерасчетным образом, с нарушением прогнозов, поэтому приходится постоянно корректировать намеченный план в стремлении достичь итоговых показателей, в частности, производить секвестр. Отклонения от априорных предположений могут быть столь велики, что имеющимися ресурсами и принимаемыми мерами управления уже нельзя обеспечить выполнение цели. Тогда приходится “приближать” цель, размещая ее внутри новой области достижимости. Отметим, что описанная схема справедлива только для устойчивой системы. Низкое качество организации управления может привести к дестабилизации и, как следствие, к разрушению всей системы.

Остановимся еще на одном принципе управления, лежащем в основе развитой теории исследования операций.

Принцип однократного управления. Широкий круг практически значимых задач предполагает необходимость осуществить однократный акт управления, а именно – принять некоторое решение, последствия которого сказываются длительное время. Разумеется, и традиционное управление можно интерпретировать как последовательность разовых решений. Здесь мы вновь сталкиваемся с проблемой дискретности и непрерывности, граница между которыми так же размыта, как и между статическими и динамическими системами. Однако различие все-таки существует: в классической теории управления исходят из того, что воздействие на систему есть процесс, функция времени или параметров состояния, а не однократная процедура.

Другой отличительной особенностью исследования операций является то, что эта наука оперирует с управлениями – константами, параметрами системы. Тогда если в динамических задачах в качестве критерия используется математическая конструкция – функционал, оценивающий движение системы, то в исследовании операций критерий имеет вид функции, заданной на множества исследуемых параметров системы.

Область практических задач, охватываемая исследованием операций, весьма обширна и включает мероприятия по распределению ресурсов, выбору маршрутов, составлению планов, управлению запасами, очередями в задачах массового обслуживания и др. При решении соответствующих задач привлекается изложенная выше методология их описания с учетом категорий модели, состояния, цели, критерия, управления. Так же формулируется и решается проблема оптимизации, состоящая в нахождении экстремума критериальной функции в пространстве параметров. Задачи решаются как в детерминированной, так и в стохастической постановках.

Поскольку процедура оперирования с константами существенно проще, чем действия с функциями, теория исследования операций оказалась более продвинутой, нежели общая теория систем и, в частности, теория управления динамическими системами. Исследование операций предлагает больший арсенал математических средств, порой весьма утонченных, для решения широкого круга практически значимых задач. Вся совокупность математических методов, обслуживающих исследование операций, получила название математического программирования. Так, в рамках исследования операций развивается теория принятия решений – чрезвычайно актуальное направление.

Теория принятия решений, по сути, рассматривает процедуру оптимизации условий детального описания векторного критерия и особенности установления его экстремального значения. Так, для постановки задачи характерен критерий, состоящий из нескольких составляющих, т.е. многокритериальная задача.

Чтобы подчеркнуть субъективизм критерия и процесса принятия решения, в рассмотрение вводится лицо, принимающее решение (ЛИР), обладающее индивидуальным взглядом на проблему. При изучении решений формальными методами это проявляется через систему предпочтений при оценке той или иной составляющей критерия.

Как правило, для принятия решения ЛПР получает несколько вариантов действий, каждый из которых подвергается оценке. Такой подход максимально приближен к реальным условиям действий ответственного субъекта в организационной системе при выборе одного из вариантов, подготовленных аппаратом. За каждым из них стоит проработка (аналитическая, имитационное математическое моделирование) возможного хода развития событий с анализом конечных результатов – сценарий. Для удобства принятия ответственных решений организуются ситуационные комнаты, оборудованные наглядными средствами отображения сценариев на дисплеях или экранах. Для этого привлекаются специалисты (операционалисты), владеющие не только математическими методами анализа ситуаций и подготовки принятия решений, но и предметной областью.

Понятно, что результатом применения к объекту теории исследования операций, в частности, и теории принятия решений, является некоторый оптимальный план действий. Следовательно, на вход некоторого блока, “начиненного” оптимизационным алгоритмом и построенного с применением соответствующего метода математического программирования модели ситуации, подается информация: начальное состояние, цель, критерий качества, перечень варьируемых параметров, ограничения. (Модель системы используется при построении алгоритма.) Выход блока и есть искомый план. С точки зрения кибернетики такое построение классифицируется как разомкнутый контур управления, поскольку выходная информация не влияет на входной сигнал.

В принципе, рассмотренный подход можно применить и для случая замкнутого управления. Для этого необходимо организовать итерационный процесс во времени: после реализации плана ввести новое состояние системы в качестве начального условия и повторить цикл. Если позволяет задача, можно сократить плановый период за счет приближения цели к начальному состоянию системы. Тогда просматривается аналогия предлагаемых действий с рассмотренной выше итерационной процедурой терминального управления, также базирующейся на периодическом обновлении исходной информации. Более того, динамическую задачу, оперирующую с процессами, можно свести к аппроксимации функций функциональными рядами. При этом варьируемыми переменными будут уже параметры таких рядов, а значит, применим аппарат теории исследования операций. (Подобное осуществлено в теории вероятностей, когда случайные процессы описываются каноническим разложением.)

Изложенная методология начала находить применение в теории искусственного интеллекта при синтезе ситуационного управления.

Следует указать на опасность, связанную с практическим применением теории принятия решений недостаточно компетентными в теории систем лицами. Так, часто в организационных системах (государственных учреждениях, фирмах, финансовых организациях) принятие решения абсолютизируют и сводят к оперированию многочисленными показателями и оптимальному осуществлению разового управленческого акта. При этом из поля зрения упускают последствия произведенного действия для системы, забывают, что управляют не критерием, а системой, не учитывая многостадийность замкнутого процесса – от системы к ее состоянию, далее через показатели к решению и вновь к системе. Конечно, на этом долгом пути делается множество ошибок, объективных и субъективных, которых уже достаточно для серьезного отклонения от плановых результатов.

Под принципом оптимальности понимается та совокупность правил, при помощи которых ЛПР определяет свое действие (решение, альтернативу, стратегию, управленческое решение), наилучшим образом способствующее достижению поставленной им цели. Принцип оптимальности выбирается исходя из учета конкретных условий принятия решения: количества участников, их возможностей и целей, характера столкновения интересов (антагонизм, неантагонизм, кооперация и т.п.).

В моделях принятия решения, особенно в теории игр, разработано большое число формальных принципов оптимального поведения. Мы здесь остановимся лишь на некоторых из них.

Принцип максимизации (минимизации). Такой принцип применяется, в основном, в задачах математического программирования (см. (2) - (4)).

Принцип свертки критериев. Применяется при "оптимизации"" многих критериев одним координирующим центром (задача многокритериальной оптимизации (5)).Для каждого из критериев (целевых функций)

f 1 (u),...,f n (u)

экспертным путем назначаются "веса" (числа)

причем α i показывает "важность или значимость" критерияf. Далее решениеx* из множества допустимых решений Х выбирается так, чтобы максимизировать (или минимизировать) свертку критериев:

Принцип лексикографического предпочтения. Это еще один принцип оптимальности в задачах многокритериальной оптимизации. Сначала критерии ранжируются по "важности". Пусть такая ранжировка составлена:

f 1 (x),f 2 (x),...,f n (x)

Решение х*Х "лучше" решения хХ в смысле лексикографического предпочтения, если выполнено одно изn+1 условий:

    f 1 (x*)>f 1 (x);

    f 1 (x*)=f 1 (x), f 2 (x*)>f 2 (x);

    f 1 (x*)=f 1 (x), f 2 (x*)=f 2 (x), f 3 (x*)>f 3 (x);

………………

    f i (x*)=f i (x) для i=1,…,n-1, f n (x*)>f n (x);

n+1) f i (x*)=f i (x) для i=1,…,n.

Принцип минимакса. Применяется при столкновении интересов двух противоборствующих сторон (антагонистический конфликт). Каждое ЛПР сначала для каждой своей стратегии (альтернативы) вычисляет "гарантированный" результат, затем окончательно выбирает ту стратегию, для которой этот результат наибольший по сравнению с другими его стратегиями. Такое действие не дает ЛПР "максимальный выигрыш", однако является единственным разумным принципом оптимальности в условиях антагонистического конфликта. В частности, исключен всякий риск.

Принцип равновесия. Это обобщение принципа минимакса, когда во взаимодействии участвуют много сторон, преследующих каждыйсвою цель (прямого противостояния нет). Пусть число ЛПР (участников неантагонистического конфликта) естьn. Набор выбранных стратегий (ситуация)x 1 *,x 2 *,…,x n * называется равновесным, если одностороннее отклонение любого ЛПР от этой ситуации может привести разве лишь к уменьшению его же "выигрыша". В ситуации равновесия участники не получают «максимального» выигрыша, но они вынуждены придерживаться ее.

Принцип оптимальности по Парето. Данный принцип предполагает в качестве оптимальных те ситуации (наборы стратегий х 1 ,…,x n), в которых улучшение «выигрыша» отдельного участника невозможно без ухудшения «выигрышей» остальных участников. Этот принцип предъявляет слабые требования к понятию оптимальности, чем принцип равновесия. Поэтому Парето-оптимальные ситуации существуют почти всегда.

Принцип недоминируемых исходов . Этот принцип является представителем многих принципов оптимальности в кооперативных играх (коллективное принятие решений) и приводит к понятию "ядра" решений. Все участники объединяются и совместными согласованными действиями максимизируют «общий выигрыш». Принцип недоминируемости -один из принципов ""справедливого"" дележа между участниками. Это та ситуация, когда ни один из участников не может аргументировано возразить против предлагаемого дележа (элемента "ядра"). Существуют и другие принципы «оптимального» дележа общего суммарного выигрыша.

Принципы устойчивости (угрозы и контругрозы). Идея всех принципов устойчивости на основе угроз и контругроз заключается в следующем. Каждая коалиция участников выдвигает свое предложение, сопровождая его реальной угрозой: если предложение не будет принято остальными участниками, то будут предприняты такие действия, которые ухудшают положение остальных участни­ков и не ухудшают (возможно улучшают) положение угрожающей коалиции. Оптимальным считается то решение, в условиях которого против всякой угрозы любой коалиции найдется контругроза со стороны какой-то коалиции.

Арбитражные схемы. Экономические конфликты наводят на мысль об "общественном арбитре". Нежелательно, чтобы столкновения интересов переходили, например, воткрытые угрозы и контругрозы. Должны существовать социальные механизмы, которые позволяли бы учитывать предпочтения и стратегические возможности каждого участника и обеспечили бы "справедливое" решение конфликта. Такой предварительный механизм, будь то отдельное лицо или система голосования, называется арбитром. В теории игр оптимальное, в смысле арбитражной схемы, решение строится при помощи системы аксиом, включающих такие понятия, как статус-кво, оптимальность по Парето, линейность альтернатив, независимость от "рангов" и т.д.

Рассмотрим далее вопросы оптимального принятия решения в условиях неопределенности. Для выработки оптимального поведения ЛПР такую ситуацию полезно моделировать, как антагонистическую игру двух лиц, где в качестве противника ЛПР рассматривается природа. Последняя наделяется всеми мыслимыми в данных условиях возможностями.

В "играх с природой" существуют свои специфические (хотя и напоминающие принцип минимакса) принципы оптимального выбора решения.

Принцип крайнего пессимизма (критерий Вальда). Согласно этому принципу игра с природой (принятие решения в условиях неопределенности) ведется как игра с разумным, агрессивным противником, делающим все для того, чтобы помешать нам достигнуть успеха. Оптимальной считается стратегия ЛПР, при которой гарантируется выигрыш, не меньший, чем "разрешенный природой".

Принцип минимаксного риска (критерий Сэвиджа). Этот принцип также пессимистический, но при выборе оптимальной стратегии советует ориентироваться не на "выигрыш", а на риск. Риск определяется как разность между максимальным выигрышем ЛПР (при условии полной информации о состоянии природы) и реальным выигрышем (при незнании состояния природы). В качестве оптимальной выбирается та стратегия, при которой величина риска минимальна.

Принцип пессимизма - оптимизма (критерии Гурвица). Этот критерий рекомендует при выборе решения не руководствоваться ни крайним пессимизмом («всегда рассчитывай на худшее!»),ни крайним оптимизмом ("авось кривая вывезет!").Согласно этому критерию максимизируется взвешенное среднее между выигрышами крайнего пессимизма и крайнего оптимизма. Причем «вес» выбирается из субъективных соображений об опасности ситуаций.

Концепция динамической устойчивости. Все изложенные выше принципы оптимальности сформулированы относительно статических задач принятия решения. Попытка применения их в динамических задачах может сопровождаться всевозможными осложнениями.

Главное -это особенности динамических процессов. Нужно, чтобы тот или иной принцип оптимальности, выбранный в начальном состоянии процесса (в начальный момент времени), оставался оптимальным в любом текущем состоянии (в любой момент времени) до конца динамического процесса. Этот принцип называется динамической устойчивостью.

Поведение. Закон оптимального поведения  


Часть III. Закон оптимального поведения 135  

Часть III. ЗАКОН ОПТИМАЛЬНОГО ПОВЕДЕНИЯ  

Закон оптимального поведения  

Итак, можно констатировать открытие Закона оптимального поведения, того самого Закона, который и отражает общее начало, присущее поведению любого человека.  

Из Закона оптимального поведения явствует, что человек не способен идти против самого себя, т.е. против своих интересов.  

Казалось бы, человек должен жить в полной гармонии с внешним миром - природой и обществом. Но это далеко не так. По всей видимости, существует некая причина дисгармонии, выявить которую нам и предстоит, учитывая, что поведение людей, являясь следствием их мышления, подчинено объективному Закону - Закону оптимального поведения.  

Иначе и быть не может, ведь поведение людей подчинено Закону оптимального поведения, и управлять им только и возможно посредством введения различных условий.  

Во-первых, очевидно, что регулирующие условия, в рамки которых помещены рядовые работники, не определяют для них всех без исключения благоприятных последствий в случае их хорошей работы и неблагоприятных - в случае плохой, т.е. вносят неопределенность в сферу трудовых отношений . Работники, подчиняясь Закону оптимального поведения, идут по пути наименьшего сопротивления и избирают тот тип поведения, который является для них оптимальным в данный момент, т.е. позволяет им избежать тех неблагоприятных последствий, которые каким-либо образом все же определены существующими условиями . Но несмотря на такое своего рода частичное удовлетворение своих интересов, работники не способны избрать тот тип поведения, который ждет от них администрация, ведь их поведение подчинено не намерениям, не требованиям администрации, а Закону. Безусловно, работники способны дать значительно больше, нежели дают при существующих условиях , и, как правило, прекрасно осознают это. Вся критика работников в адрес администрации есть не что иное, как выражение с их стороны требования дополнить регулирующие условия для наиболее полного удовлетворения своих интересов при производительном труде . Фактически работники неосознанно стремятся к определенности в трудовых отношениях , т.е. к тому, чтобы все благоприятные и неблагоприятные для них последствия от тех или иных их действий были всегда ясны.  

Более того, посредством введения каких-либо регулирующих условий можно в той или иной мере - в зависимости от степени полноты данных условий - управлять человеческим поведением . Фактически, так и происходит во всех сферах общественной жизни, ведь Закон оптимального поведения является всеобщим для человеческого общества.  

Отныне нам известно главное свойство, присущее любому человеку, а значит, и любому работнику организации, - всегда поступать оптимально, с наибольшей выгодой для себя с учетом всех последствий, определяемых регулирующими условиями. Мы также знаем Закон оптимального поведения, который не в силах изменить. Нам остается только одно целенаправленно изменить регулирующие условия, изменить так, чтобы человек естественным образом - именно благодаря своему главному свойству - всегда поступал рационально, с наибольшей пользой для организации. Только в этом случае человек становится качественным трудовым ресурсом , целиком поддающимся управлению. Как объекту управления ему будет выгодно то, что управление всегда направлено на рациональное использование всех имеющихся в наличии ресурсов.  

С другой стороны, эти же люди, будучи подчинены Закону оптимального поведения и совершив поступок, вызвавший в конечном счете их раскаяние, безусловно, столкнулись с серией неблагоприятных последствий - отрицательной реакцией внешней среды . Их оптимальное поведение оказалось неразумным (нерациональным) по отношению к ней.  

Действительно, коль скоро любой человек объективно подчинен Закону оптимального поведения, можно однозначно констатировать, что ни один человек не будет поступать с пользой для внешней среды , пока это не будет приводить его к получению пользы для себя, пока рациональное по отношению к внешней среде не станет для него оптимальным.  

Если всегда R - 1, т.е. начальная степень внутренней рациональности обусловлена действием Закона оптимального поведения, то та или иная фактическая степень общей рациональности (R внешней среде, человек, ежедневно,  

Поведение работника формируется под влиянием Закона оптимального поведения.  

В соответствии с Законом оптимального поведения интеллект каждого индивида неутомимо стоит на страже его собственных интересов. В момент ущемления этих интересов весь его интеллектуальный потенциал объективно направляется на их защиту. И если интересы двух субъектов трудовых отношений - предпринимателя и наемного работника - противоречат друг другу , конструктивную и производительную работу в такой ситуации организовать просто невозможно, да и немыслимо.  

Каждый человек индивидуален, но, независимо от тех или иных черт своего характера, любой всегда склонен оправдывать свои поступки. Если что-то не ладится, человек, как правило, считает свою неудачу следствием ошибочных действий окружающих его людей. И в этом он по-своему прав, ведь его поведение всегда строится с учетом его собственных интересов - оно всегда подчинено Закону оптимального поведения.  

На первый взгляд предложенная ситуация парадоксальна. Совершенно непонятно, кто в действительности прав, а кто виноват. Закон оптимального поведения оправдывает всех.  

Таким образом, ввиду отсутствия критериальных условий проявление Закона оптимального поведения становится негативным, "разрушающим" каждый оправдывает - причем, как ему кажется, вполне обоснованно - только себя и обвиняет -так же обоснованно - других. Нерациональное по отношению к другим в этом случае является оптимальным.  

Причину верно подмеченной Паркинсоном закономерности позволяет понять опять же знание Закона оптимального поведения.  

Итак, только наличие критериальных условий позволяет избежать негативного проявления Закона оптимального поведения, и именно наличие этих условий приводит к тому, что Закон начинает "производить свою созидательную работу" во всех без исключения сферах общественных отношений , где такие условия введены.  

Для того чтобы более наглядно представить себе негативное проявление Закона оптимального поведения в сфере трудовых отношений , рассмотрим отрицательные последствия, порожденные силой этого Закона, на примере самых животрепещущих проблем, существующих сегодня в этой сфере.  

Поведение, которое кажется явно адаптивным, или хорошо спланированным, может быть либо результатом использования животным простейших эмпирических правил поведения, либо представлять собой когнитивное, или намеренное, поведение (см. разд. 26.7). Например, ребенок может пересечь улицу в соответствии со строгими правилами уличного движения. Если ребенка хорошо обучили, то его поведение при переходе дороги будет автоматизированным. Взрослый же человек, который не обучался этим правилам, например иностранец, будет обдумывать, как перейти улицу, оценивать скорость и характер движения приближающегося транспорта и т. д. Внешняя картина поведения ребенка и взрослого при переходе через улицу может быть практически неотличимой, но в одном случае это поведение осуществляется на основе простейших эмпирических правил, а в другом - на основе познавания.

Можно обеспечить оптимальность поведения посредством простого набора правил. Пример такого рода мы находим в работе Грина (Green, 1983), проанализировавшего правила остановки, которые должны обеспечивать оптимальность пищедобывательного поведения. В своей работе Грин предположил, что животные-жертвы распределены по различным участкам земли, которые различаются по качеству, и на лучших из них хищники гораздо быстрее ловят свою добычу. В разных условиях среды распределение участков по качеству будет различным. Предполагается, что хищник в состоянии различать типы кормных участков, только оценивая свой успех на каждом из них. Хищник не возвращается на тот участок, где он уже побывал, и систематически обследует каждый участок до тех пор, пока не решит оставить его и перебраться на другой.

Оптимальную стратегию пищедобывания можно охарактеризовать правилом остановки, которое определяет, когда именно хищнику следует оставить данный участок. В любое время хищник может решить, уйти или остаться на данном участке, чтобы продолжать поиски жертвы. Грин показывает, что наилучшее правило остановки - это то, в основу которого положено количество добычи как функция времени, потраченного на обследование данного участка. Альтернативные правила остановки включают в себя: наивную стратегию, при которой хищник полагается на знание средней вероятности обнаружения жертвы на каждом участке; всеведущую стратегию, при которой хищник может оценить качество каждого участка, не обследуя его, и таким путем может избежать бедных добычей участков, и, наконец, стратегию учета мгновенной скорости пищедобывания. При этой стратегии хищник покидает участок охоты, когда эта скорость падает ниже критического уровня. Наилучшая стратегия, по Грину, подразумевает оценку качества участка по мере его обследования. Эта стратегия продуктивнее, чем наивная стратегия и стратегия учета мгновенной скорости пищедобыва-


ния. Она также более продуктивна, чем всеведущая стратегия, потому что предъявляет меньше требований к способности отдельного животного производить расчеты. Стратегию Грина можно представить в виде простого правила: оставаться на участке столько времени, пока больше половины обследованных мест приносит добычу, в противном случае - уходить. Эта стратегия может быть осуществлена посредством простого механизма.

Модели Грина (Green, 1980; 1983) и Вааге (Waage, 1979) дают сходные результаты. Однако при этом важно помнить, что у Грина это функциональная модель, которая точно определяет, что именно животному следует делать, чтобы достигнуть наилучшего результата. Модель Вааге механистическая, и она построена на основе представлений о непосредственных причинах возникновения поведения.

Один из методов, с помощью которого можно определить, следует ли животное в выборе своего решения тем или иным фиксированным правилам, состоит в том, чтобы каким-то образом избирательно вмешиваться в его поведение. Например, при исследовании поведения роющих ос (Ammophila campestris) Берендс (Baerends, 1941) обнаружил, что перед тем, как отложить яйцо, самка роет норку, убивает или парализует гусеницу бабочки, несет ее к норке, откладывает на гусеницу яйцо и прячет ее в норке. Эту процедуру самка осы повторяет затем при откладывании второго и каждого последующего яйца. Тем временем созревает первое яйцо, и личинка начинает пожирать гусеницу. Теперь оса возвращается к первой норке и добавляет в нее новых гусениц. После этого в зависимости от обстоятельств она может приступить к изготовлению новой норки или будет снабжать гусеницами вторую норку. Таким образом самка осы может обслуживать до пяти гнезд одновременно (рис. 25.16).

Берендс обнаружил, что осы каждое утро проверяют все норки, прежде чем отправиться в свои «охотничьи угодья». Забирая гусениц из норки, Берендс мог заставить осу приносить больше пищи, чем обычно; добавляя гусениц, он мог заставить ее приносить меньше пищи. Однако он мог таким образом управлять поведением осы только в том случае, если производил изменения в гнезде перед первым ежедневным посещением норки осой. Если же такие изменения совершались в течение дня после этого момента, они не вызывали никакого эффекта. По-видимому, самка осы руководствуется какими-то простыми правилами. Существует стандартный порядок действий, необходимых для откладывания яйца, который предусматривает рытье норки и заготовку гусеницы. Кроме того, имеется стандартный распорядок проверки ранним утром всех норок, в ходе которого обычно устанавливается, в какое гнездо в течение дня необходимо принести пищу. И наконец, существует стандартный порядок прекращения этой деятельности, в соответствии с которым оса закрывает гнездовую норку, когда в ней окажется достаточное число гусениц. Хотя она и способна при посещении гнезда оценить количество запасенной в нем пищи, она не всегда использует эту способность. Более того, каждая из стандартных последовательностей действий, будучи начата, продолжается до полного завершения. Так, например, оса будет приносить и прино-


Рис. 25.16. Диаграмма гнездового поведения роющей осы (Ammophila). (По Baerends, 1941.)

сить в гнездо гусениц, если их систематически каждый раз удалять из гнезда, как только оса их принесет. Этот пример показывает, что сложное поведение может быть запрограммировано в виде набора жестких правил. Оса ведет себя наподобие автомата, хотя у нее и есть некоторые стандартные программы поведения, позволяющие ей выходить из затруднительного положения, например удалять из норки какие-то препятствия.

Как мы уже видели ранее, прерывание поведения животного при определенных обстоятельствах маскирует поведение, которое должно было бы проявиться, если бы не было этого перерыва. Такая ситуация разделения времени предполагает, что животное следует определенным правилам, которые определяют организацию и приоритетность поведенческих актов в общей картине поведения. Рассмотрим конкретный пример. Когда голодная горлица (Streptopelia) ест, либо выбирая зерна из кучи, либо получая пищу в камере Скиннера, в ее поведении можно наблюдать типичные паузы длительностью в несколько минут (см. рис. 25.11). Что будет делать горлица во время этих пауз, зависит от обстоятельств. Если птица имеет доступ к воде, она будет пить. В противном случае она может чистить перья или просто неподвижно стоять. В экспериментальных условиях было показано, что на время возникновения этих пауз никакого влияния не оказывает манипулирование мотивационными факторами вторичного приоритета, например изменением уровня жажды. В одном из экспериментов голодным горлицам к каждому крылу прикрепили по канцелярской скрепке. Во время еды горлицы не обращали на скрепки никакого внимания, тогда как во время пауз они пытались от них отделаться. Однако наличие канцелярских скрепок не оказывало влияния на характер пищевого поведения и не меняло временного распределения пауз (McFarland, 1970b). Создается впечатление, что в пищевом поведении горлицы как бы запрограммированы на строго определенное время паузы и что правила, которые регулируют пищевое поведение горлиц, не находятся под каким бы то ни было влиянием со стороны других мотивационных факторов, например жажды или стремления чистить перья, если только эти тенденции не станут сильнее, чем пищевая. Это типичный случай явления разделения времени.


Рис. 25.17. Граница между состояниями животного, в которых доминируют голод и жажда.

Если каким-то путем прервать пищевое поведение голодной горлицы, то обычно после перерыва она продолжит это поведение. Но если прервать процесс питья воды, то, как правило, он будет маскироваться, если перерыв будет достаточно большим (McFarland, Lloyd, 1973). В экспериментальной ситуации с инструментальным поведением, где горлицы для получения пищи и воды должны клевать светящиеся клавиши, прерывания текущей деятельности можно добиться простым выключением подсветки клавиши. Птицы быстро научатся прекращать клевание, когда эти клавиши не светятся. В условиях свободного пищевого и питьевого поведения прерывания поведения можно достигнуть, если экспериментальную комнату примерно на минуту погрузить в темноту. При сравнении оказалось, что эти два типа прерывания деятельности горлиц оказывают одинаковый эффект (Larkin, McFarland, 1978).

Разделение времени при пищевом и питьевом поведении горлиц послужило объектом многочисленных экспериментов, целью которых было обнаружить правила, на основе которых птица принимает решение, есть ей или пить. Результаты показывают, что, во-первых, в экспериментах может доминировать либо питьевая, либо пищевая деятельность (McFarland, Lloyd, 1973; McFarland, 1974). Во-вторых, линия, отражающая границу (рис. 25.17) между доминированием голода и доминированием жажды, не меняет своего положения ни при повторных опытах, ни при различных начальных уровнях голода и жажды животного, ни при изменении результатов пищевого и питьевого поведения (Sibly, McCleery, 1976). Однако если в ходе эксперимента изменять мотивационное состояние птицы, то может показаться, что произойдет поворот графика, отражающего границу между доминирующими состояниями (рис. 25.18). Теоретический анализ этой ситуации показывает, что никакого реального изменения в положении границы доминирующих состояний не происходит. Это кажущееся изменение обусловлено используемой экспериментатором системой координат, потому что мотивационное состояние животного обычно изображается в двух измерениях, тогда как здесь необходимо учитывать и другие измерения (McFarland, Sibly, 1975). Величина этого кажущегося поворота границы доминирующих состояний оказалась полезным показателем для измерения силы мотивационных факторов, таких, как величины привлекательности пищевого и питьевого подкреплений (Sibly, 1975), эффективность внешних стимулов, которые сиг-


нализируют о доступности пищи и воды (McFarland, Sibly, 1975; Beardsley, 1983), и затраты (оцениваемые самой птицей) на смену пищевого поведения на питьевое и наоборот (Larkin, McFarland, 1978). В целом создается впечатление, что и внутренние, и внешние факторы оказывают какое-то влияние на. тенденции пищевого и питьевого поведения и что эти тенденции конкурируют за доминирование (McFarland, 1974). Заняв доминирующее положение, победившая система периодически предоставляет время для осуществления другой (субдоминантной) деятельности. Почему поведение организовано именно таким образом, остается загадкой.

Вполне возможно, что в пищевом поведении горлиц паузы представляют собой часть стратегии поведения, направленной на обнаружение хищников. Находясь в стае, отдельные птицы имеют возможность тратить больше времени на добывание пищи и меньше - на то, чтобы следить, не появится ли хищник (Barnard, 1980; Bertram, 1980; Elgar, Catterall, 1981). Лендрем (Lendrem, 1983) обнаружил, что горлицы, питаясь в одиночку, тратят около 25% времени из двухминутного периода пищевого поведения на то, что оглядываются по сторонам, а когда рядом есть другие птицы - около 20%. Однако эта разница была гораздо более выраженной, если горлицы незадолго до этого видели поблизости хищника (хорька). В этой ситуации одинокие горлицы тратят около половины времени на то, чтобы осматриваться вокруг, тогда как в присутствии двух других птиц у них уходит на это только 25% времени. Время, затрачиваемое не на добывание пищи, уменьшалось еще больше, когда число птиц в стае возрастало. По мере увеличения размера стаи горлицы получали пищу быстрее, в то же время общая скорость добывания пищи снижалась, если они недавно видели хищника. Как показывает детальный анализ пищевого поведения горлиц, в ситуациях риска у них снижается скорость добывания пищи, тогда как паузы между приемами пищи увеличиваются. Таким образом, они питаются медленнее, когда находятся одни в незнакомом окружении и вскоре после того, как видели хищника. Особенно увеличивается при этом период времени после каждого клевка, когда горлица стоит с поднятой головой; возможно, что это повышает способность птицы заметить хищников.

Скорость добывания пищи снижается также и в том случае, когда горлицам приходится отличать пригодную пищу от непригодной. Добавляя хлорид лития к пище горлиц в сочетании с определенными условиями кормления, можно научить этих птиц, как и многих других животных, избегать пшеничных зерен, окрашенных в определенный цвет (Lendrem, McFarland, 1985). Наученные птицы ведут себя таким образом, как если бы зерна этого цвета были ядовитыми. Например, одни птицы избегают желтых зерен, а другие - красных. Когда таким горлицам дают смесь красных и желтых зерен, им приходится различать эти два типа зерен, чтобы избежать зерен того цвета, к которому у них образовалось отвращение. Птицы, которые добывают пищу из смеси «ядовитых» и безвредных зерен, питаются медленнее, чем птицы, которым дается смесь из «неядовитых» зерен различного цвета (Lendrem, McFarland, 1985).


Если горлица питается медленнее обычного, поскольку ей приходится отличать безвредные зерна от ядовитых, то можно думать, что у нее ослаблена способность обнаруживать хищников, поскольку она обращает больше внимания на пищу. На самом же деле скорость реагирования горлиц на пролетающую над их головой модель ястреба повышается, если горлицам дают смесь ядовитых и безвредных зерен (Lendrem, McFarland, 1985). Птицы, которым предварительно показали хищника (и которые поэтому клюют зерна с пониженной скоростью), быстрее реагируют на модель ястреба, чем птицы, которым приходится отличать безвредную пищу от ядовитой. Таким образом, создается впечатление, что более медленное питание, какой бы причиной оно не вызывалось, увеличивает способность птицы обнаруживать хищников. Эти данные согласуются с представлением о том, что высокая скорость добывания пищи (или другого поведения) связана с большими затратами.

Что же произойдет, если мы еще усложним задачу по различению зерен, положив их на таком фоне, где они будут плохо различимы? Как и следовало ожидать, произойдет дальнейшее снижение скорости пищевого поведения (рис. 25.19). Отчасти это может быть связано с тем, что птицы должны обращать больше внимания на добывание пищи, но это может быть и проявлением активной тактики, направленной на то, чтобы не терять бдительности. Горлицы, которые выбирают безвредные зерна из смеси с ядовитыми на таком фоне, где они плохо различимы, быстрее замечают модель ястреба, чем птицы, выбирающие хорошо различимые зерна (рис. 25.20) (Lendrem, McFarland, 1985). Однако птицы, которые выбирают подходящие зерна в условиях низкой их различимости, совершают больше ошибок (едят больше ядовитых зерен) и реже делают паузы в пищевом поведении, чем птицы, питающиеся хорошо различимыми зернами. Таким образом, совершенно очевидно, что существует определенный баланс между требованиями бдительности и требованиями пищедобывания.

В заключение следует сказать, что, по всей вероятности, горлицы, которые по-

Рис. 25.19. Скорость поглощения пищи горлицами, которым была предложена смесь «ядовитых» и безвредных зерен, в условиях, когда зерна этих двух типов трудно (низкая различимость) или легко (высокая различимость) отличить друг от друга. (Lendrem, McFarland, 1985.)

Рис. 25.20. Латентные периоды реакции на модель ястреба у горлиц, которые питаются в условиях низкой и высокой различимости пищи (рис. 25.19). Обратите внимание на то, что горлицы в условиях низкой различимости зерен хотя и питаются медленнее, зато быстрее реагируют на потенциального хищника. Эти результаты позволяют предположить, что пониженная скорость поглощения пищи при поедании плохо различимого зерна обусловлена не тем, что для различения зерен птица должна сосредоточить на этом все внимание, а скорее тем. что эта ситуация более опасна (вследствие повышенной вероятности проглотить «ядовитое» зерно), и поэтому горлицы обращают больше внимания на окружающую обстановку, в целом. (По Lendrem, McFarland, 1985.)


едают пищу быстро, имеют меньше шансов заметить хищников. Когда горлицы настороженны, т. е. когда они находятся в незнакомой обстановке, или в одиночестве, или в ситуации, где они недавно видели хищника, горлицы поедают пищу медленнее. Однако у горлиц существует целый ряд различных способов, с помощью которых они могут снизить общую скорость поедания пищи. Например, они имеют возможность чаще делать паузы, удлинять их или уменьшать скорость собственно поедания пищи. Эти способы могут увеличить шансы заметить хищника. Есть некоторые указания на то, что эти различные методы компенсируют друг друга (Lendrem, McFarland, 1985). Вполне возможно,

что горлицы полагаются на то, что смогут обнаружить необычное движение во время подъема головы после каждого клевка, а паузы делают, чтобы время от времени оглядеться вокруг. Не исключено, что, делая паузы в клевании, птица может потратить некоторое время на чистку перьев или питье, - это пример феномена, называемого разделением времени. В настоящее время мы не обладаем достаточными знаниями о зрении птиц, чтобы подтвердить эти гипотезы. Мы также не знаем, используют ли птицы какой-то сложный набор правил принятия решений или же их поведение регулируется посредством когнитивных процессов.

ДЛЯ ЗАПОМИНАНИЯ

1. Животные могут принимать решения на основе простых эмпирических правил, которые помогают им приспособиться к конкретным особенностям окружающей среды.

2. Если при манипулировании второй по приоритету активностью изменяется распределение во времени переключений животного с одной деятельности на другую, то можно сделать вывод, что эти переключения обусловлены конкуренцией мотиваций. Если же это распределение не меняется, то такие переключения вызваны растормаживанием.

3. В том случае, когда момент начала и продолжительность проявления какой-то деятельности регулируются другой деятельностью, можно говорить, что поведение организовано в режиме разделения времени.

4. Принятие оптимального решения животным реализуется в последовательности поведенческих актов, которая максимизирует некоторый показатель приспособленности организма при существующих условиях. Любое нарушение взаимного соответствия между животным и его средой обитания будет приводить к тому, что такая максимальная приспособленность будет редко достигаться. Однако животные могут использовать такие правила принятия решения, что их поведение будет близким к оптимальному.

Krebs J. R., McCleery R. //., 1984. Optimisation in behavioural ecology. In: Krebs J. R., Davies N. B. (eds), Behavioural Ecology, 2nd edn, Oxford, Blackwell Scientific Publications.