Ролята и значението на рефлексивните игри. Рефлексивни бизнес игри

MAOU "Белоярско средно училище № 1"

Играта

« магически ключ"

MAOU "Белоярско средно училище № 1"

Играта

„Говори или действай“

MAOU "Белоярско средно училище № 1"

Играта

"Чиста дъска"

Играта "Вълшебен ключ"

Цели:

тийм-билдинг.

Целевата аудитория: ученици 7-11 клас, учители, родители.

Формиран UUD:

Съдържание

Трябва да вземете обикновен ключ и да го завържете към края на много дълго въже. Децата стоят в кръг и се редуват да прекарват ключа с въже през горната част на дрехите (започва през врата на якето и се изважда през дъното). Така всички те са свързани един с друг. Домакинът дава инструкции, които всички трябва да следват едновременно - скок, клякане, тропане и т.н. След като настроението на участниците забележимо се подобри, е необходимо да се отпуснете един по един. След това можете да закачите ключа на видно място в класната стая, с надпис „ключът, който ни отвори един към друг“.

Играта се играе най-добре преди почивка или след монотонна работа, тъй като играта предизвиква емоционален подем.

Клубна игра на блъф

Цели:

формаинжобщи интелектуални умения;

повишаване на творческата и търсеща активност на децата.

Целевата аудитория: ученици от 1-11 клас.

Формиран UUD: предмет, личен.

Съдържание

Може да се извършва на различни етапи от урока или часовете извънкласни дейности. За играта трябва да подготвите въпроси, които започват с думите "Вярвате ли ...?"
Примери за въпроси по история:
1. Вярвате ли, че славяните, когато отсякоха дърво, го помолиха за прошка и го „хранеха“, оставяйки храна на пъновете? +
2. Вярвате ли, че в древността славяните са имали обичай: враговете готвят и ядат каша заедно, за да сключат мир, без това мирният договор би бил невалиден? +
3. Вярвате ли, че Владимир Мономах е внук на киевския княз и испанската кралица? -
Въпросите се подготвят от самия учител или се инструктират за това от учениците.

Играта "Чиста дъска"

Цели:

създаване на комфортна среда за разкриване на умствените способности на децата;

организация на умствената дейност, формиране на творческо мислене;

способност за общуване и взаимодействие в екип, зачитане на мнението на другите.

Целевата аудитория: ученици от 1-11 клас.

Формиран UUD: когнитивна, личностна, комуникативна.

Съдържание

Въз основа на материала на изучаваната тема учителят съставя и окачва въпроси на дъската, които могат да бъдат изразени както в обичайната форма, така и в чертеж, диаграма, фрагмент от карта и т.н. При изучаване на нов материал (разказ на учителя, презентация, гледане на видеоклип, съобщение на ученик и др.), Учениците участват в играта, отговаряйки на поставените въпроси. Ако учениците отговорят правилно на въпроса, той се премахва от дъската. Целта на тази игра е да имате чиста дъска до края на урока.

Задачите и въпросите трябва да се съставят, като се вземат предвид възрастовите характеристики.

Игра "Говори или действай"

(разновидност на "бутилка")

Цели:

премахване на емоционалното напрежение;

формиране и развитие на комуникативни умения: способност за общуване и взаимодействие в екип, зачитане на мнението на другите;

тийм-билдинг.

Целевата аудитория: ученици 7-11, учители, родители.

Формиран UUD: личен, комуникативен.

Съдържание

Децата седят в кръг, в средата се поставя бутилка. Чрез теглене на жребий се избира първият участник, който завърта бутилката. Той задава всякакви въпроси на посочения от гърлото на бутилката. Той трябва да отговори вярно на въпроса или да изпълни задачата, дадена от първия участник. Интересът е, че участникът не знае нито въпроса, нито задачата. Първо трябва да кажете: „говорете или действайте“. Ако участникът, след като е чул въпроса, не иска да отговори, тогава му се дават две задачи или той напуска (не се препоръчва).

Задачите и въпросите трябва да бъдат съставени, като се вземат предвид възрастовите характеристики и целите на урока.

MAOU "Белоярско средно училище № 1"

Играта

"Вълна"

MAOU "Белоярско средно училище № 1"

Играта

"Тайна"

MAOU "Белоярско средно училище № 1"

Играта

«
Кутия за опит»

MAOU "Белоярско средно училище № 1"

Играта

«
Предай го наоколо"

Играта "Тайна"

Цели:

формиране на желание за общуване с връстници;

преодоляване на срамежливостта;

намерете различни начини да постигнете целта си.

Целевата аудитория: младша училищна възраст.

Формиран UUD: личен, комуникативен.

Фасилитаторът раздава малки предмети на всички участници: копче, брошка, малка играчка и др. Това е тайна. Участниците се разделят по двойки. Те трябва да се убедят един друг да разкрият своята "тайна". Децата трябва да измислят възможно най-много начини за убеждаване (отгатване; правене на комплименти; обещаване на лакомства; невярване, че има нещо в юмрука и т.н.).

Ако възникнат трудности, самият фасилитатор може да помогне да се измислят начини за убеждаване.

Игра с вълни

Цели:

научете се да се концентрирате;

управлявайте поведението си.

Целева аудитория: m младша училищна възраст.

Формиран UUD: личен, комуникативен.

Децата са поканени да изобразят морето, което в зависимост от времето може да бъде много различно. Домакинът дава команда "Спокойно!". Всички деца замръзват. При команда "Махай!" Децата се подреждат и се държат за ръце. Домакинът показва силата на вълната, а децата клякат и се изправят с интервал от 1-2 секунди, без да пускат ръцете си. Играта завършва с командата "Спокойно!".

За да подобрите емоционалното въздействие, можете първо да говорите за морски художници, да покажете репродукции на картини на Айвазовски.

Игра "Предай наоколо"

Цели:

допринасят за формирането на приятелски екип;

научете се да действате съгласувано;

развиват координацията на движенията и въображението.

Целевата аудитория: младша училищна възраст.

Формиран UUD: лично,

Децата седят в кръг. Учителят подава въображаем предмет в кръг: горещ картоф, леден къс, жаба, песъчинка и др. Обектът трябва да премине целия кръг и да се върне при водача, без да се променя (картофът не трябва да се охлажда, ледът трябва да се стопи, песъчинката трябва да се загуби, жабата трябва да скочи). Участниците в играта емоционално вземат и подават посочения предмет.

С по-големи деца можете да играете, без да назовавате предмета.

Отражение

Как се почувствах, когато получих въображаем предмет?

Играта "Кутия с преживявания"

Цели:

отстраняване на психологическия стрес;

развитие на способността да разпознават и формулират своите проблеми.

Целевата аудитория: младша училищна възраст.

Формиран UUD: лични, нормативни.

Домакинът показва малка кутия и казва: „Днес ще съберем всички неприятности, обиди и скърби в тази кутия. Ако нещо ви притеснява, можете да го прошепнете направо в кутията. Ще го пусна наоколо. Тогава ще го запечатам и ще го отнеса, а с него ще оставите чувствата си да изчезнат.. Кутията се предава.

Отражение

Изпитвали ли сте някакви трудности, когато прошепнахте своите оплаквания и скърби в кутията? Който?

MAOU "Белоярско средно училище № 1"

Играта

"Гледна точка"

MAOU "Белоярско средно училище № 1"

Играта

« Комплименти»

MAOU "Белоярско средно училище № 1"

Играта

"компетентност"

MAOU "Белоярско средно училище № 1"

Играта

«
НИЛ"

Играта "Комплименти"

Цели:

повишено чувство на увереност;

емоционално освобождаване.

Целевата аудитория: ученици от 5-6 клас.

Формован UUD: l личен, комуникативен.

Децата, застанали в кръг, хвърлят топката един на друг и се редуват да казват нещо приятно на един от членовете на групата. Името на съседа се произнася в нежна форма и казват какво харесват в него (Например „Лена има красива дълга коса“, „Надюша рисува красиво“, „Димочка е добър приятел, той е много мил“) .

Отражение

1. Как се почувствахте, когато направихте комплимент?

2. Как се почувствахте, когато ви направиха комплимент?

3. Изпитвали ли сте трудности при измислянето на комплименти? Който?

Играта "Гледна точка"

(бизнес игра)

Цели:

саморегулация;

Целевата аудитория:

Формиран UUD:

Участници: опоненти – групи от ученици, които защитават една или друга гледна точка; наблюдатели - учител с няколко помощника. Преди играта учителят предварително обявява темата на спора, предоставя на учениците необходимите знания и факти. Групите обсъждат своите аргументи, възможните контрааргументи на опонентите; влизам в спор. Мониторинговият екип оценява:

Кой беше по-логичен?

Кой е по-емоционално убедителен?

Кой направи грешки (според правилата на диспута)?

Изследователска лаборатория -

"НИЛ",(бизнес игра)

Цели:

развитие на логическо мислене;

поддържане на интерес към темата.

Целевата аудитория:

Формиран UUD: комуникативен,

Водещ - учител или специално обучен ученик; изследователи - групи студенти; приемна комисия - учител с 2-3 ученици. Групите обсъждат предложената задача, подготвят доклад, мини-спектакъл или плакат под формата на решение на задача, избират говорител, който ще представи резултата. Лекторът прави презентация пред класа. Комисията за подбор анализира дали взема (или не) решения. Ако има решение до ключ, учителят може да го каже на класа.

Отражение:

Кое решение ви хареса? Най-успешният ли беше?

(A.Gin. "Техники на педагогическата техника")

Игра "Компетентност"

(бизнес игра)

Цели:

саморегулация;

развитие на умението за работа в група;

Целевата аудитория: ученици от средно и средно образование.

Формиран UUD:

Състезателите са два отбора от ученици. Работодатели - група студенти, които определят победителя (който сякаш е нает). Арбитърът е учител, който решава спорни въпроси. Учителят задава темата, екипите излизат с 5 задачи един за друг по тази тема (типът на задачите се регулира от учителя). Противниците отговарят, ако не се справят, отговарят самите собственици на въпроса. Работодателите оценяват всяка задача по 5-точкова система, всеки отговор по 10-точкова система. Накрая работодателите се съветват и решават кой да бъде нает.

(A.Gin. "Техники на педагогическата техника")

MAOU "Белоярско средно училище № 1"

Играта

"Sinkwine"

MAOU "Белоярско средно училище № 1"

Играта

"Компетентност - 2"

MAOU "Белоярско средно училище № 1"

Играта

"Обратно"

MAOU "Белоярско средно училище № 1"

Играта

"Генератори-критици"

Игра "Компетентност - 2"

(бизнес игра)

Цели:

саморегулация;

развитие на умението за работа в група;

колективизъм;

развитие на логическото мислене.

Целевата аудитория: ученици от средно и средно образование.

Формиран UUD: комуникативна, когнитивна, регулативна.

Темата на играта е известна предварително. Групите подготвят пакет от 5 задачи и ги разменят със съперници в играта. В определеното време отборите решават задачи. На поставените въпроси отговаря този от отбора, когото съперниците изберат. Жури - 3 студента, оценяващи по 5-бална система зададен въпрос, на 10-бална база - отговорите на отборите. Учителят действа като арбитър, следи правилността на играта.

(A.Gin. "Техники на педагогическата техника")

Играта "Sinkwine"

Цели:

саморегулация;

развитие на вниманието;

развитие на логическото мислене.

Целевата аудитория: студенти.

Формиран UUD:

Можете да играете като отбор или по двойки. Cinquain се състои от пет реда. Темата е зададена. На първия ред е написано съществително (ключ) към изучаваната тема, на втория ред - 2 прилагателни, които са свързани с тази дума или отговарят на нея; третият - три глагола, също подходящи за ключова думаотразяване на смисъла на темата; четвъртият ред е основната идея или фраза, изречение за ключовата дума, петият е думата-синоним или асоциацията към ключовата дума. Печели отборът с най-успешен синквин.

Играта "Генератори-критици"

Цели:

развитие на комуникативни умения, способност за работа в група;

развитие на умения за уверено поведение;

саморегулация;

поддържане на интерес към изучаваната тема.

Целевата аудитория: ученици, родители, учители.

Формиран UUD: личностна, комуникативна, когнитивна.

Публиката се дели на 2 групи – генератори и критици. По предложената тема (проблем) генераторите предлагат идеи за решаване на задачата, критиците намират грешки и " слаби места". Журито е учител или 2-3 ученика. По време на играта генераторите и критиците сменят ролите си.

Отражение:

Кои идеи се оказаха най-успешни? Кои са необичайни?

Обратната игра

Цели:

Развитие на вниманието;

Целевата аудитория: студенти.

Формиран UUD: да се

Съдържание

Учителят дава на децата различни команди, децата трябва да изпълняват противоположните на тях. Например командата "Седни!" трябва да станете, при команда „Говори!“ - мълчи и т.н.

Отражение:

Какви команди искахте да изпълнявате? Кои бяха трудни?

(С. Джин "Светът на логиката")

MAOU "Белоярско средно училище № 1"

Играта

"питащ"

MAOU "Белоярско средно училище № 1"

Играта

"верига"

MAOU "Белоярско средно училище № 1"

Играта

"Каква е разликата?"

MAOU "Белоярско средно училище № 1"

Играта

"Птица, риба"

Играта "Верига"

Цели:

Развитие на вниманието;

Намален емоционален стрес;

Целевата аудитория: студенти.

Формиран UUD:

Съдържание

Класът е разделен на групи (можете - двойки). Учителят назовава поредица от думи: „Портокал - носорог - гном - сладолед - миеща мечка ...“ - и кани децата да открият модела на изграждане на следващия ред (всяка следваща дума започва с последната буква на предишната ) и го продължете по-нататък. Печели отборът, който продължи веригата без грешки и паузи.

(С. Джин "Светът на логиката")

Играта "Питач"

Цели:

Развитие на вниманието;

Намален емоционален стрес;

Развитие на речта;

Развитие на способността за работа в група.

Целевата аудитория: ученици от начален етап.

Формиран UUD:

Класът е разделен на групи. Задача: измислете възможно най-много въпроси за сюжетната картина (еднаква за всички групи - картината на дъската). След преброяване на броя на въпросите в групи и обобщаване на резултатите се предлага да се дадат отговори на най-интересните, необичайни въпроси.

Отражение:

Кои въпроси се оказаха най-интересни, необичайни? Кои отговори са най-оригиналните (смешни, необичайни)?

(С. Джин "Светът на логиката")

Играта "Птица, риба"

Цели:

Развитие на вниманието;

Намален емоционален стрес;

Развитие на речта;

Развитие на логическото мислене.

Целевата аудитория: ученици от начален етап.

Формиран UUD: когнитивна, регулативна, личностна.

Децата се редуват да наричат верига една дума наведнъж: първата е името на птицата, втората е риба, третата е отново птици и т.н. Играта може да се проведе в игра на елиминиране: ученик, който повтаря изречена преди това дума или обърка темата на отговора, се елиминира от играта. Можете да играете играта под формата на състезание между отбори.

Отражение:

Как да разграничим тези групи животни? Какви редки птици (риби) са кръстени?

(С. Джин "Светът на логиката")

Игра "Какво е различното?"

(дискусионна игра)

Цели:

Развитие на вниманието;

Развитие на логическо мислене;

Развитие на речта;

Развитие на способността за работа в групи.

Целевата аудитория: студенти.

Формиран UUD: комуникативна, регулативна, личностна, когнитивна.

Можете да играете по двойки, групи или фронтално. Играта протича по схемата: децата предлагат знак за разлика, учителят (в гимназията - противоположният отбор) дава аргумент срещу този знак. Например темата „Каква е разликата между щраус и човек?“. Вариант за обсъждане: Щраусът не говори. — Значи немият човек е щраус? Човекът няма крила. - Значи щраус с подрязани крила е човек?

(С. Джин "Светът на логиката")

MAOU "Белоярско средно училище № 1"

Играта

"Цялото е част"

MAOU "Белоярско средно училище № 1"

Играта

„Предай предмета“

MAOU "Белоярско средно училище № 1"

Играта

"Да и не"

MAOU "Белоярско средно училище № 1"

Играта

«
Разказвач"

Игра "Предай предмета"

Цели:

Развитие на вниманието;

Намален емоционален стрес;

Развитие на речта;

Развитие на логическото мислене.

Целевата аудитория: ученици от начален етап.

Образувано УУД: п регулативен, личен, познавателен.

Децата се изправят и бързо предават предмет от ръка на ръка по веригата, като същевременно наричат един от нейните знаци. Който не можа да отговори или повтори - сяда. Играта продължава докато знаците "свършат".

Отражение:

Назовани ли са всички възможни признаци на субекта?

(С. Джин "Светът на логиката")

Играта "Цялото е част"

Цели:

Развитие на вниманието;

Развитие на скоростта на мислене;

Развитие на логическото мислене.

Целева аудитория: ученици от началните класове.

Образувани UUD: n когнитивна, регулативна, личностна.

Учителят назовава предмета (понятие, явление – в зависимост от възрастта на учениците), децата назовават неговата част. Например, книга е страница, стол е крак, дърво е корен, гръмотевична буря е дъжд и т.н. Можете също така да играете в групи, когато едната група назовава предмета, другата - неговата част и обратно.

Отражение:

Коя двойка беше най-трудно да се направи? Най-лесно?

Играта "Разказвач на приказки"

Цели:

Развитие на вниманието;

Развитие на речта;

Развитие на логическото мислене.

Целева аудитория: ученици от началните класове.

Формиран UUD: когнитивна, регулативна, личностна.

Учителят предлага да разкаже известно стихотворение във „верига“: всеки ученик произнася една дума. В същото време трябва да се опитате да разкажете историята заедно и с еднакво темпо (сякаш има само един разказвач). Играта се играе като състезание между редовете.

Отражение:

Кой отбор се справи най-успешно със задачата?

Игра "Да" и "Не"

Цели:

Развитие на вниманието;

Намален емоционален стрес;

Развитието на саморегулацията.

Целева аудитория: ученици от началните класове.

Формиран UUD: когнитивна, регулативна, личностна.

Учителят задава на учениците въпроси, на които може да се отговори с „да“ или „не“. В същото време съгласието трябва да се изрази с кимване, несъгласието - с глас (след това - обратното). Въпросите трябва да са сравнително прости и отделни. Например „Днес сряда ли е?“, „Слънцето грее ли сега?“ и т.н. Можете да играете нокаут.

Отражение:

Кои въпроси бяха най-интересни?

MAOU "Белоярско средно училище № 1"

Играта

"Каква котка ще бъда?"

MAOU "Белоярско средно училище № 1"

Играта

"Клеу"

MAOU "Белоярско средно училище № 1"

Играта

"Земя, вода, въздух"

MAOU "Белоярско средно училище № 1"

Играта

«
Познайте какво мислите"

Играта "Клеу"

Цели:

развитие на комуникационни умения;

отстраняване на емоционален стрес;

тийм-билдинг.

Целевата аудитория:

Формиран UUD:

Съдържание

Необходимо е да направите комплимент на някого от седящите в кръг и да му прехвърлите топката. Част от конеца остава в ръцете му. Вижте каква ярка, издръжлива паяжина получихме. И сега ще го разгадаем. Започвайки с последния участник в играта, навиваме топката и в същото време казваме думи на благодарност на този, който ви е направил комплимент.

Отражение

Кое е по-приятно (по-трудно) - да правиш комплименти, да ги получаваш или да благодариш?

Играта "Каква котка ще бъда"

Цел :

формирането на творческа активност, съпричастност и чувствителност.

Целевата аудитория: ученици 5-11 клас.

Формиран UUD: личен, комуникативен.

Съдържание

По време на играта децата по най-безопасния начин се запознават с различните компоненти на своята личност и характер, извършва се самоанализ на личността. Инструкция за учениците: „Представете си, че сте станали котка. каква котка си ти След това трябва да анализирате с децата: Има ли прилика между вашия характер и описанието на животното? Какво ви хареса най-много от казаното от котката за себе си? Вашата котка има ли отрицателни страни?

Отражение

Чии разкази ви бяха най-интересни?

Играта "Познай какво е замислено"

Цел: развитие на мисленето: способността за обобщаване, подчертаване на същественото, анализ на свойствата на обектите.

Целевата аудитория: ученици, учители, родители.

Формиран UUD: комуникативен, личен.

Съдържание

Водещият отгатва думата. Участниците задават въпроси, за да отгатнат скритата дума. Водещият може да каже само „да“ и „не“. Забележка: на първия етап се отгатват думи, обозначаващи обекти, след което можете постепенно да преминете към абстрактни понятия.

Въпросите трябва да бъдат проектирани, като се вземат предвид възрастовите характеристики и целите на урока.

Играта "Земя, вода, въздух"

Цел: развитие на рефлексия, творческа дейност.

Целевата аудитория: ученици от 1-5 клас.

Формиран UUD: личен, комуникативен.

Съдържание

Най-добре е да поставите участниците под формата на кръг.

Вариант I.

На децата се обяснява игровото значение на четирите елемента. Ако фасилитаторът каже думата „земя“, тогава момчетата трябва бързо да назоват животните или растенията, които живеят или растат на земята. Ако произнесе думата „вода“, тогава учениците назовават представителите на животинския и растителния свят, които живеят под водата. Ако се каже думата "вятър", тогава учениците се въртят. Ако той произнесе думата "въздух", тогава момчетата назовават онези живи същества, които могат да живеят във въздуха. Отговаря този, който е посочен от водещия или на когото ще бъде дадена играчката. Трябва да отговорите бързо - в рамките на 5 секунди. Отговорите не трябва да се повтарят.

Вариант II.

За всеки елемент е даден монтаж - за изпълнение на определена задача. Например, ако се нарича думата "въздух", учениците трябва да пляскат с ръце като птичи крила; ако думата "земя" - движете се като жаба (заек, слон, мечка и т.н.); ако думата "вода" - изобразява различните движения на плувеца; ако думата "вятър" е да духа като вятъра, да се върти, да се люлее като дървета.

MAOU "Белоярско средно училище № 1"

Играта

« Пожарникари на обучение"

MAOU "Белоярско средно училище № 1"

Играта

« Конец и игла"

MAOU "Белоярско средно училище № 1"

Играта

"Воевода"

MAOU "Белоярско средно училище № 1"

Играта

"Готвачът и котенцата"

Играта "Конец и игла".

Цели:

Формиране на групова сплотеност, способност да координират своите действия с действията на другите участници, да постигат групов успех чрез координирани индивидуални усилия;

Да развие и формира в себе си такива качества като контакт, организираност и спокойствие, логика и изобретателност, бързина на реакция.

Сформиран UUD : комуникативен, личен.

Целевата аудитория: ученици от 1-8 клас.

Съдържание

В играта участва целият клас. Най-доброто мястоза изпълнението му - спортна площадка или спортна зала. Първо, по команда на учителя, се избират „игли“. Желателно е това да са по-малко активни момчета. Тогава те ще могат да бъдат в ролята на лидер, лидер и да разберат, поне в играта, че нещо зависи от тях. След това към "иглите" се закрепват "нишки". Желателно е броят на децата в "нишката" за всяка "игла" да е еднакъв. По команда на водача движението започва. Задачата на участниците е да не се откачат един от друг, в противен случай „конецът“ ще се скъса. Задачата на "иглата" е да не се пресича с други "игли". Посоката на движение е произволна, възможно е да има препятствия по пътя.

Отражение

Изберете по-здрав „конец“ и най-отразителна „игла“.

Игра "Пожарникари на обучение"

Цели:

Да се развие у децата чувство за колективизъм;

Възможност за извършване на движения по сигнал;

Упражнение в катерене и изграждане в колона.

Целева аудитория: често срещан.

Формиран UUD: да се комуникативна, регулативна, личностна.

Съдържание

Децата играчи са построени с лице към гимнастическата стена на разстояние 5-6 стъпки в 3-4 колони. Срещу всяка колона на същата височина е окачена камбана. При сигнал „1, 2, 3 - бягайте“ децата, които стоят първи, тичат към стената, качват се и звънят на звънеца. След това слизат и застават в края на колоната си. Повторете играта 6-8 пъти.

Контрол на спазването на правилата за безопасност по време на играта.

Играта "Готвач и котенца"

Цели:

Упражняване на деца в различни видове ходене или бягане;

Развитие на скоростта на реакция, сръчност;

- способност за фокусиране върху думата.

Целевата аудитория: ученици от 1-5 клас.

Образувано УУД: до комуникативна, регулативна, личностна.

Съдържание

Според римата за броене играчите избират готвач, който пази предметите, лежащи в обръча - „колбаси“. Готвачът обикаля вътре в обръча, шнур - "кухня". Деца - котенца вървят в кръг, изпълнявайки различни видовеходене, тичане, произнасяне на текста:

Путка плаче в коридора

Котенцата имат голяма мъка:

Труден готвач, бедните путки

Не ви позволява да хванете колбаси.

С последната дума "котенца" се втурват в "кухнята", опитвайки се да грабнат наденица. Готвачът се опитва да спре бягащите играчи. Победените играчи излизат от играта.

Играта продължава, докато всички колбаси бъдат откраднати от готвача.

Препоръки

Не можете да влезете в кръг преди време. Готвачът няма право да грабва котенцата, само сол, няма право да излиза извън кръга. Забранено е приемането на 2 или повече артикула едновременно.

Играта "Воевода"

Цели:

- упражняват децата в търкаляне, хвърляне и хващане на топката;

- способността да координирате движението с думата;

- развиват внимание, сръчност.

Целева аудитория: ученици от 1-5 клас.

Формиран UUD: да секомуникативна, регулативна, личностна.

Съдържание

Играчите в кръг търкалят топката от един на друг, казвайки:

- Ябълка се търкаля в кръг на хоро,

- Който го повдигна, този губернатор ...

Детето, което в този момент държи топката, е управителят. Той казва:

- Днес съм губернатор.

- Бягам от хорото.

Тича около кръга, поставя топката на пода между двама играчи. Децата казват в хор:

Едно, две, не грачете

И бягай като огън!

Играчите тичат в кръг в противоположни посоки, опитвайки се да грабнат топката преди своя партньор. Този, който тича първи и грабне топката, я търкаля в кръг. Играта продължава.

Препоръки

Хвърлете или хвърлете топката само на играч наблизо. Не можете да се намесвате в играч, който тича около кръга. Печели този, който първи докосна топката.

MAOU "Белоярско средно училище № 1"

Играта

"Намери и млъкни"

MAOU "Белоярско средно училище № 1"

Играта

"Намирам

къде е скрит"

MAOU "Белоярско средно училище № 1"

Играта

"Вълшебен стол"

MAOU "Белоярско средно училище № 1"

Играта

"Професии"

Игра "Намери къде е скрито"

Цели:

- научете се да се ориентирате в стая или на сайт;

- извършват действия по сигнал.

Целевата аудитория:

Формиран UUD:комуникативен, регулаторен.

Съдържание

Играчите стоят покрай стената. Водещият им показва предмет и казва, че ще го скрие. Домакинът кани играчите да се обърнат към стената. След като се увери, че никой от децата не гледа, той скрива предмета, след което казва: „Време е!“. Децата започват да търсят предмет.

Играта "Намери и мълчи"

Цели:

- научете се да се ориентирате в пространството;

- възпитават издръжливост, изобретателност.

Целевата аудитория:предучилищна и начална училищна възраст.

Формиран UUD:комуникативен, регулаторен.

Съдържание

Домакинът показва на играча обекта и след като затворят очи, той го скрива. След това предлага да потърсиш, но не да го вземеш, а да ти каже на ухо къде е скрит. Който намери първия е лидер в следващата игра.

Игра "Професии"

цели :

развитие на въображението;

развитие на наблюдателност, емпатия, изразителност на движенията.

Целевата аудитория: приученици от 1-5 клас.

Формиран UUD:комуникативен, регулаторен.

Съдържание

Децата, разделени по двойки, показват изразителни движения един на друг, по указания на водещ, весел и тъжен артист, танцьор, диригент, възпитател, портиер, строител, имитиращи движенията, характерни за хората от тази професия.

Препоръки

Едното дете в двойка показва тъжен човек, другото - весел човек и при всяка смяна на ролите децата се сменят според емоционалното си представяне.

Игра с магически стол

цели :

да помогне за повишаване на самочувствието на детето;

помагат за подобряване на отношенията между децата.

Целевата аудитория: приученици от 1-5 клас.

Формиран UUD: да секомуникативен, личен.

Съдържание

Тази игра може да се играе с група деца дълго време. Преди това възрастен трябва да разбере „историята“ на името на всяко дете - неговия произход, какво означава. Освен това е необходимо да се направи корона и "Вълшебен стол" - той трябва да бъде непременно висок. Възрастният провежда кратък въвеждащ разговор за произхода на имената и след това казва, че ще говори за имената на всички деца в групата (групата не трябва да е повече от 5-6 души) и имената на тревожните децата се извикват най-добре по средата на играта. Този, чието име се каже, става крал. В цялата история на името му той седи на трон с корона.

Препоръки

ATВ края на играта можете да поканите децата да измислят различни вариантинеговото име (нежно, нежно). Можете също така да се редувате да кажете нещо хубаво за краля.

MAOU "Белоярско средно училище № 1"

Играта

"Журналисти"

MAOU "Белоярско средно училище № 1"

Играта

„Продължи историята“

MAOU "Белоярско средно училище № 1"

Играта

"Най-добрият астронавт"

MAOU "Белоярско средно училище № 1"

Играта

"Познай кой съм аз?"

Играта „Продължи историята“

цели :

допринася за формирането на култура на поведение, приятелски колективни взаимоотношения;

насърчава децата да фантазират;

развива речта.

Целевата аудитория: начална училищна възраст.

Формиран UUD: да секомуникативен, личен.

Съдържание

Съчиняваме приказка, а след това снимаме филм - продължение на приказката. Предварително разпределяме между децата ролите на сценаристи, режисьор, актьори и др. В процеса на композиране на приказка учениците могат да предложат нови действащи герои, така че развитието на сюжета в повечето случаи зависи пряко от действията, предприети от участниците в играта.

Всеки е свободен да избере своя собствена стратегия на поведение, която само първоначално е имала инсталация за определени ограничения, които определят образа на героя, който ще се играе, и правилата на играта.

Играта "Журналисти"

цели :

формиране на адекватно самочувствие;

развитие на творческа дейност;

свързване на членовете на групата.

Целевата аудитория: ученици 5-11 клас.

Формиран UUD: да секомуникативен, личен.

Съдържание

Избираме главния редактор на списанието, класът е разделен на „отдели“, в които журналистите работят по определена тема.

Наричаме списанието според темата на урока или урока, например „Червената книга на Русия“.

Задачата на студентите – журналисти е да подберат интересен материал по темата, да го обсъдят в групи, да го анализират, след което да „представят материала в броя“. На последния етап - обсъждане на получения дневник, всеки провежда самооценка и самоанализ на своите дейности.

Първоначално учениците трябва да бъдат запознати с правилата, необходими за успешното делово общуване на членовете на всяка група, на която е разделен класът;

така че всяка група включва ученици с различни ниваобучение, като всеки намери занимание според интересите си.

Играта "Познай кой съм аз?"

цели :

развитие на рефлексия и самосъзнание;

креативност, емпатия и чувствителност.

Целевата аудитория: приученици от 1-5 клас.

Формиран UUD: да секомуникативен, личен.

Съдържание

Децата получават задача: да си представят себе си в ролята на някои приказен герой, писател, художник, животно и, като дойде в клас за урок, се движи и говори от негово име. Можете да използвате групови роли (например Червената шапчица и сив вълк). Останалите ученици трябва да познаят кой е станал техен съученик.Чии разкази ви бяха най-интересни? Хареса ли ви задачата?

Препоръки

Необходимо е предварително да се договори дали е възможно да се използват елементи от костюма, декори. След края на играта, анализирайки резултатите от нейното провеждане, е необходимо да се отбележи успешното изпълнение на определена роля, но в никакъв случай не трябва да се правят директни коментари за оценка, в противен случай следващия път детето просто не иска да играе и отказва да участва.

Играта "Най-добрият астронавт"

Цел: играта помага на децата да се научат да оценяват и оценяват работата на своите другари, подкрепя желанието на детето да научи нещо ново.

Целевата аудитория: приученици от 1-5 клас.

Формиран UUD: образователен, къмкомуникативен, личен.

Съдържание

Учителят/водещият рисува 10 ракети с различни номера на дъската. Извикват се наведнъж 11 ученици. Около масата, където са поставени карти с примери, децата вървят, хванати за ръце и рецитират:

„Бързите ракети ни чакат да обиколим планетите. Каквото искаме, до такова ще летим! Но има една тайна в играта: няма място за закъснели.

Веднага след като се каже последната дума, учителят дава на всеки ученик карти с примери, които кодират номера на ракетата, на която ще лети астронавтът. Децата решават примери, като определят номера на своята ракета и записват примера под съответния номер на ракетата.

Препоръки

Може да се използва в различни уроци и класове, като се променят примерите с други видове задачи.

MAOU "Белоярско средно училище № 1"

Да се художествена библиотека от игри

MAOU "Белоярско средно училище № 1"

Играта

"стрелба по мишена"

MAOU "Белоярско средно училище № 1"

Играта

"Зоологическо домино"

MAOU "Белоярско средно училище № 1"

Играта

"Кой съм аз?"

Играта "стрелба по мишена"

Цел : играта помага на децата да се научат да оценяват и оценяват работата на своите другари, подкрепя желанието на детето да научи нещо ново, развива точност.

Целевата аудитория: ученици 2-6 клас.

Формиран UUD: да секомуникативен, личен, регулаторен.

Съдържание

Работа по двойки (взаимна оценка). Всяко дете получава формуляр за работа, на гърба си изписва името си и тегли три реда за оценка. Правилата на играта се показват от учителя с един от учениците на дъската. Дете - стрелецът взема тебешира и го поставя на върха на "пистолета". Учителят-командир командва: „Готов – прицел – огън!“. При думата "plee" стрелецът води линията към целта. Учителят оценява резултата по следния начин: ако стреляте точно, тогава куршумът трябва да лети право и бързо в целта. 2-ри опит. Двойките трябваше да се разберат кой ще стреля пръв.Препоръки

Играта започва и завършва с обаждане. Командирът оценява "стрелбата" по критериите "точност", "скорост", дали куршумът е летял гладко. Командирът поставя оценка върху листовката на стрелеца. Който иска да благодари на своя командир за справедливостта, му стиска ръката.

Компилатори

Бровкина Л.А.,

Григориева Е.А., учител по физика, MAOU "Beloyarsk средно училище № 1"

Ежова Н.А.,

Крюкова Е.М., учител-организатор на MAOU "Белоярско средно училище № 1"

Филимонова M.I., учител по математика, MAOU "Beloyarsk средно училище № 1"

Хамитова А.Г., начален учител MAOU "Белоярско средно училище № 1"

Шнайдер А.В., начален учител MAOU "Белоярско средно училище № 1"

Юрина Л.Н., учител по история и социални науки, MAOU "Белоярска средно училище № 1"

Игра "Кой съм аз?"

Цел: формиране и оценка на нивото на формиране на лична рефлексия, насочена към разбиране от подрастващите на техните мотиви, нужди, стремежи, използване на прилагателни.

Целевата аудитория: приученици 5-8 клас.

Формиран UUD: лични.

Съдържание

1. Подготовка за урока. Всеки ученик получава картинки със символично изображение на неговото настроение – радостно човече, неутрално, тъжно. В предварително подготвена кутия всеки спуска човечеца с настроението, което му отговаря в началото на урока. Учителят отваря кутията и съобщава в какво настроение са дошли повечето деца. Ако настроението е тъжно, разберете какво се е случило. Настройва по положителен начин.2. Даваме комплименти. Всеки ученик прави комплимент на съседа си - изглежда добре, има хубава блуза и т.н.3. Самонаблюдение. Кой съм аз? Всеки пише (въз основа на предварително подготвен списък с думи, които учениците могат да използват – забавен, смел, плах, остроумен, надут, справедлив и др.). Всеки ученик, без да показва лист хартия, отива до дъската, сяда на стол и изслушва мнението на съучениците си за себе си. Колко мача - толкова точки.

Зоологическа игра на домино

Цел: укрепване на знанията на учениците за диви и домашни животни; възпитание на интелигентност и внимание. Целевата аудитория: приученици от 1-5 клас.

Формиран UUD: образователна, комуникативна.

Съдържание правило на играта Първият играч, който остави всичките си карти, е победител. Игралните действия съчетават внимание, способността да не пропускате ход и да поставите картата си навреме.Напредък на играта . На картите са изобразени диви и домашни животни. Субектите бяха разделени на микроекипи (по 4 души). Картите се подреждат с лицето надолу. По-малките ученици бяха помолени да преброят 6 карти. След това учителят напомня правилата на играта: можете да поставите една и съща картина една до друга.Препоръки

Ако желаната картинка не е налична, тогава детето пропуска ход. Ако някой от играчите остане без карти, той се счита за победител в играта. Играта се повтаря, но картите се преместват и се раздават други платнени карти..

Светлоотразителна игра

Светлоотразителна игра- процесът на социално взаимодействие, по време на който всеки от участниците в играта упражнява рефлексивен контрол (авторът на термина е V. A. Lefevre) от други участници, опитвайки се да приложи своята стратегия за управление, за да формира своя собствена версия на социалната реалност (прилагане на проект за социална иновация). В пространството на рефлексивна игра технологиите за социално управление се тестват за ефективност, така че печалбата в такава игра е повишаване на нивото на умение.

Рефлексивната игра като вид социално взаимодействие

Рефлексивната игра се отнася до игри от отворен тип. За разлика от игрите, които протичат по сценарий и по предварително определени правила (като бизнес игри или ролеви игри), рефлексивните игри са процес на социално взаимодействие, в който ролите, правилата и ходовете на сюжета се генерират от участниците направо в хода на действието на играта. В същото време ходът на рефлексивната игра може да се контролира с помощта на индивидуалните личностни характеристики на участниците, конфигурацията на техните бизнес и лични интереси, предпочитания, очаквания, цели, страхове и изкушения.

В рефлексивната игра предимството се дава на този, който е по-добре оборудван с инструменти за управление на хора и социални процеси, този, който е по-сложен в анализирането и изчисляването на ситуации на социално взаимодействие. От всички съществуващи опциирефлексивни игри, като най-известните са ODI (организационно-дейностни игри), които за първи път са използвани за решаване социални задачиГ. П. Щедровицки. Съществуват обаче и други разновидности на рефлексивни игри, разработени от ученици, последователи и дори пламенни противници на G. P. Shchedrovitsky.

Типология на рефлексивните игри

Всяка отразяваща игра има задача или набор от задачикоито трябва да реши от участниците. Според задачите, които се решават в хода на рефлексивните игри, те могат да бъдат разделени на два вида.

Да се първи типвключват рефлексивни игри, чиято основна задача е да създадат условия за индивидуално развитие на участниците. Рефлексивните игри от първия тип могат да се използват за професионално обучение или преквалификация на участници, които не са елементи на нито една социална система. Рефлексивните игри от първия тип могат да се използват за идентифициране и развитие на културни и митологични стереотипи и нагласи, които са характерни за участниците. Те могат да се използват и за формиране на мегамашини (социални системи, съставени от елементи и части на други социални системи) - например по време на политически кампании или общонационални (или междудържавни) проекти, чието изпълнение включва възможностите на голям брой различни социални системи.

Co. втори типвключват рефлексивни игри, чиято основна задача е да генерират социална иновация, която да промени социалната система, чиито елементи са субектите-участници. Такива игри могат да се използват за осъществяване на такива специфични дейности за развитие на социални системи като управленско консултиране.

Проект за отразяваща игра

Рефлексивните игри от първи и втори тип се провеждат под контрола на екип от игрови техници, които осигуряват такъв поток на игровия процес, по време на който се решават задачите, възложени на играта. За провеждане на рефлексивна игра (от първи или втори тип) е необходим екип от игрови техници проект за игра. Проектът е създаден от екип от инженери на игри под ръководството на методолози. (Методологът е мислител, който е в състояние да разработи нови подходи към дизайна на рефлексивни игри, използвайки за това апарата на методологическото мислене (виж методологията на SMD)). Процесът на генериране на игрален проект може да се нарече метаигра, която се извършва от методолози с екип от игрови техници в навечерието на рефлексивна игра. В хода на дизайна на играта екип от техници на играта внимателно разработва диагностична информация (информация за участниците и за социалната система (системи), чиито елементи са субектите-участници), детайлизира темите и значенията, около които дискусията ще бъде изградена в рамките на групите и по време на играта, определянето на най-доброто за решаване на този проблем е начин за разделяне на играчите на групи и изчисляване на динамиката на вътрешногруповото и междугруповото игрово взаимодействие.

Организационна структура на рефлексивната игра

Рефлексивните игри от първия и втория тип могат да продължат само при условие, че твърда организационна структура на играта(разделяне на участниците на групи, на всяка от които е назначен поне един техник на играта, определяне на времевия регламент за игровите събития, определяне на формите на вътрешногрупова и обща игрова комуникация и строг нормиранекомуникация). Структурата на играта е мета-норма, която се поддържа от екипа от техници на играта по отношение на играчите. Играчите имат голяма свобода, но тази свобода е ограничена от ясно определени граници, например: играчите не могат да преминават от група в група, групата не може да превишава времето, определено за доклад по време на общата игрова среща, групата трябва ясно да посочи темата на доклада и да не се отклонявате от него, можете да задавате въпроси за разбиране на доклада, но не можете да ги смесвате с преценки за това, което сте чули в доклада, не можете да задавате въпроси за това, което не е било в доклад и др. Нормите, правилата и елементите на организационната структура на рефлексивната игра могат да варират в зависимост от предпочитанията и методите, използвани от игралния екип и методистите, провеждащи играта.

Рациониране на действията на играчите, саморефлексия и рефлексивно състояние

Има доста норми, които поддържат структурата на играта и екипът от инженери на играта може да ги измисли в хода на действието на играта. Основни нормативни въпроси: „Какво правиш сега?“ или „Какво е значението на твоето действие тук и сега?“ са достатъчно неудобни, за да привлекат вниманието на говорещия или на групата към собствения си мисловен процес, като по този начин ги поставят в позиция на саморефлексия. Когато играчът се научи, докато поддържа авторефлексивна позиция, да поставя цели, да проектира и изпълнява действия и да анализира резултата от предприетите действия, той преминава в рефлексивно състояние и придобива нова степен на интелектуална и творческа свобода, тъй като от рефлексивно състояние той е в състояние да работи със значенията на своите и чужди действия и да извършва рефлексивни управленски действия, чиято ефективност е значително по-висока от тази на действията, извършвани не от рефлексивно състояние.

Има няколко нива на отразяващо състояние („рефлексивни нива“ или „рефлексивни слоеве“). Колкото повече рефлексивни нива може да надгражда даден играч (колкото по-висок е рефлексивният му потенциал), толкова повече възможности той печели при проектирането на социални иновации, при управлението на хора и социални процеси и при изчисляването на социални ситуации. Субект с по-висок рефлексивен потенциал има значително предимство пред субект, чийто рефлексивен потенциал е по-нисък.

По този начин рефлексивната игра по никакъв начин не налага теми или възможности за самоопределение на играчите, но създава за всеки играч уникален шанс да разшири своето мислене и да увеличи своя рефлексивен потенциал.

Литература

С. А. Кутолин"Рефлексивна литература"
С. А. Кутолин„Литературата като осветяване чрез рефлексия“
Лефевр В. А.противоречиви структури. М.: Съветско радио, 1973;
Новиков Д. А., Чхартишвили А. Г. Рефлексивни игри. - М.: Синтег, 2003.
Макаревич В. Н.Игрови практики, методисти: невидимата общност „излиза от подземието.//Социс, 1992, N 7;
Котляревски Ю. Л., Шанцер А. С.Изкуството на моделирането и природата на играта. М., Прогрес, 1992. - 104 с.;
Щедровицки Г.П.Избрани произведения. М., Шк. Култ. полит., 1995.

Вижте също

Връзки

Шохов А. С. Метод на живо моделиране в изследването и консултирането на организации

Фондация Уикимедия. 2010 г.

Вижте какво е "Рефлексивна игра" в други речници:

Игра - вземете валиден промоционален код MIF издателство в Академик или купете печеливша игра с отстъпка при разпродажба в издателство MIF

Бизнес играта е метод за симулиране на вземане на решения от ръководители или специалисти в различни производствени ситуации, извършвани по зададени правила от група хора или лице с компютър в интерактивен режим, при наличие на конфликти ... ... Уикипедия

Игри, (игрова) общност, възникнала първоначално в СССР и сега съществува в Русия и Беларус голяма групаспециалисти, практикуващи използването на игри, игрови методи в различни области на обществения живот: в икономиката, ... ... Wikipedia

- (английска практическа фирма, фиктивна фирма) активна форма на обучение на ученици, студенти и стажанти на практически дейности в предприятието. Учебна компания се създава на базата на училище, основно професионално, средно специално или висше ... ... Wikipedia

Дейности, насочени към подобряване на ефективността на фирми, компании, организации. Съдържание 1 Видове управленско консултиране 1.1 Стратегическо консултиране ... Wikipedia

- "Рефлексивни процеси и управление" международно научно и практическо интердисциплинарно списание. Основатели: Институт по психология на Руската академия на науките и Лепски Владимир Евгениевич, с участието на Института за рефлективни процеси и контрол От 2001 г. са публикувани 2 ... ... Wikipedia

Ако структурата на осъзнаването има крайна сложност, тогава можем да конструираме рефлексивна графика на играта,което ясно показва връзката между действията на агентите (реални и фантомни), участващи в равновесието.

Върховете на този насочен граф са действията r д?+ съответстващи на двойни неидентични структури informed™ /., или компоненти на структурата на осъзнаване в"или просто числото r на реален или фантомен агент, r e Z+.

Между върховете се изчертават дъги по следното правило: до всеки връх x sбяха изтеглени дъги от (П- 1) върхове, съответстващи на структури I mp jд н(/) Ако два върха са свързани с две противоположно насочени дъги, ще изобразим едното ребро с две стрелки.

Подчертаваме, че графиката на рефлексивна игра съответства на системата от уравнения (2.3.1) (т.е. определението за информационно равновесие), докато нейното решение може да не съществува.

Така че графът g,рефлексивна игра G (вижте дефиницията на рефлексивна игра в предишния раздел), чиято информационна структура има крайна сложност, се дефинира, както следва:

- върхове на графа G tсъответстват на реални и фантомни агенти, участващи в рефлексивната игра, тоест по двойки неидентични структури на осъзнаване;
- графични дъги G tотразяват взаимната осведоменост на агентите: ако има път от един агент (истински или фантомен) към друг агент, тогава вторият е адекватно информиран за първия.

Ако във върховете на графа G/представляват представите на съответния агент за състоянието на природата, след това рефлексивната игра G,с крайна структура на осъзнаване / може да се даде като кортеж Г, = (N,(A)), напр N,f(), e , v, G/),където н- много реални агенти, х,- множеството от допустими действия на z"-тия агент, е (-) 0 x X -> 9?" - неговата целева функция, / "д N, G,-рефлексивна графика на играта.

Имайте предвид, че в много случаи е по-удобно (и визуално) да се опише рефлексивна игра по отношение на графиката G/,не дървото на информационната структура.

Помислете за няколко примера за намиране на информационно равновесие.

Примери 2.4.1-2.4.3. Тези примери включват три агента с обективни функции от следната форма:

където Xi> 0, / € N= (1, 2, 3}; в e 0 = (1, 2).

За краткост ще наричаме агента, който смята, че търсенето е ниско (0= 1), песимист, а този, който вярва, че търсенето е високо (0 = 2), е оптимист. Така в примери 2.4.1-2.4.3 ситуациите се различават само поради различни структури на осъзнаване.

Пример 2.4.1. Нека първите двама агенти са оптимисти, а третият песимист, като и тримата са еднакво информирани. След това, в съответствие с твърдение 2.2.5, за всеки ад азидентичностите /st] = /b/st2 = ч, Dz = ч-

В съответствие със свойство 2 от определението за информационно равновесие, Х*.

Може да се види, че всяка структура на осъзнаване е идентична с една от трите, които формират основата: (/b/2, D). Следователно сложността на тази структура на осъзнаване е равна на три, а дълбочината е равна на едно. Графиката на рефлексивната игра е показана на фиг. осем.

Ориз. осем.

Така действията на агентите в ситуация на информационно равновесие ще бъдат както следва: X! = х 2 =1/2, =0.*

Пример 2.4.2. Нека първите двама агенти са оптимисти, а третият е песимист, който смята всички грешни агенти за еднакво информирани песимисти. Първите два агента са еднакво информирани, а за третия агент и двамата са достатъчно информирани.

Ние имаме: I x ~ I 2 , I >h, h > h,1 ~z аз 2~z ч? Графиката на рефлексивната игра е показана на фиг. 9.

Ориз. 9.

Тези условия могат да бъдат записани като следните идентичности, които са валидни за всяко ae I (ние използваме съответните дефиниции и твърдения 2.2.1, 2.2.2 и 2.2.5):

12а = ха, 1а = ха, ха = ха, hla = ха, ха = h, ha2 = здравей, hal = h-

Подобни отношения важат за равновесните действия Х". Левите страни на тези идентичности показват, че всяка структура 1 стрза |c|>2 е идентичен на някаква структура fn |r|

Така сложността на тази структура на осъзнаване е равна на пет, а дълбочината е равна на две.

За намиране на информационното равновесие е необходимо да се реши следната система от уравнения (виж израз (2.3.1)):

Така действията на реалните агенти в ситуация на информационно равновесие ще бъдат както следва: Х) \u003d x 2\u003d 9/20, x 3 * \u003d 1/5.

Пример 2.4.3. Нека и тримата агенти са оптимисти, първият и вторият са взаимно информирани, вторият и третият също са взаимно информирани. Според първия агент, третият смята и тримата за еднакво информирани песимисти; също първият агент, според мнението на третия, смята и тримата за еднакво информирани песимисти.

Имаме: D x D, / 2>

Тези условия могат да бъдат записани като следните идентичности, които са валидни за всяко а е аз(ние използваме съответните дефиниции и твърдения 2.2.1, 2.2.2 и 2.2.5):

Подобни отношения важат за равновесните действия x p.

Левите страни на тези идентичности показват, че всяка структура 1 стрза |oj > 3 е идентичен на някаква структура /„ |m| 1, A, /3, /sz /13, /sv /132? hn,/св-

Така основата се формира от следните по двойки различни структури: (/b />, /3, /зз /в, /lb) - Сложността на тази структура на осъзнаване е равна на шест, а дълбочината е равна на три. Графиката на съответната рефлексивна игра е показана на фиг. десет.

Ориз. десет.

Така действията на реалните агенти в ситуация на информационно равновесие ще бъдат както следва: x, = x 3 =17/35, x 2 * = 12/35.

След като завършихме описанието на графиката на рефлексивна игра, ние продължаваме да изучаваме свойствата на информационното равновесие.

Можете да напишете рецензия за книга и да споделите своя опит. Другите читатели винаги ще се интересуват от мнението ви за книгите, които сте чели. Независимо дали сте харесали книгата или не, ако дадете своите честни и подробни мисли, хората ще намерят нови книги, които са подходящи за тях.

Руска академияНаучен институт по проблеми на управлението. В.А. Трапезникова Д.А. НОВИКОВ, А.Г. CHKHARTISHVILI REFLECTIVE GAMES SINTEG Москва - 2003 UDC 519 BBC 22.18 N 73 Новиков Д.А., Чхартишвили А.Г. Reflexive H 73 игри. М.: Синтег, 2003. - 149 с. ISBN 5-89638-63-1 Монографията е посветена на обсъждането на съвременните подходи към математическото моделиране на отражението. Авторите въвеждат нов клас игрово-теоретични модели - рефлексивни игри, които описват взаимодействието на субекти (агенти), които вземат решения въз основа на йерархия от идеи за съществени параметри, идеи за репрезентации и т.н. Анализът на поведението на фантомни агенти, които съществуват в представянията на други реални или фантомни агенти и свойствата на информационна структура, която отразява взаимното съзнание на реални и фантомни агенти, ни позволява да предложим информационно равновесие като решение на рефлексивна игра , което е обобщение на редица добре известни концепции за равновесие в некооперативните игри. Рефлективните игри позволяват: - да се моделира поведението на рефлективни субекти; - да се изследва зависимостта на печалбите на агентите от ранговете на тяхното отражение; - поставят и решават проблеми на рефлексивния контрол; - еднакво описват много явления, свързани с рефлексията: скрит контрол, контрол на информацията чрез медиите, рефлексия в психологията, произведения на изкуството и др.. Книгата е предназначена за специалисти в областта на математическото моделиране и управление на социално-икономически системи, както и за студенти и докторанти. Рецензенти: д-р на техническите науки, проф. В.Н. Бурков, д-р на техническите науки, проф. А.В. Шчепкин UDC 519 BBC 22.18 N 73 ISBN 5-89638-63-1 Ó D.A. Чхартишвили, 2 2003 СЪДЪРЖАНИЕ ВЪВЕДЕНИЕ ............................................ ...... ............................................ ..... .......... 4 ГЛАВА 1. Информация при вземане на решения .......................... ......... 21 1.1. Индивидуално вземане на решения: модел на рационално поведение......................................... ......................... ......................... ........................ ........................ ..... 21 1.2. Интерактивно вземане на решения: игри и равновесия .................................. 24 1.3. Общи подходи за описване на осъзнаването.................................................. ..... 31 ГЛАВА 2. Стратегическа рефлексия....... ................................ ................. 34 2.1. Стратегическо отражение в игрите за двама души ................................. ... 34 2.2. Отражение в биматрични игри .............................................. ................ ........... 41 2.3. Ограничение на ранга на отражение ............................................ .................................. 57 ГЛАВА 3. Информационно отражение ............ .................. .................... 60 3.1. Информационно отражение в игрите за двама ............................................. ... 60 3.2. Информационна структура на играта ............................................. ................................. 64 3.3. Информационен баланс ................................................. ............................... 71 3.4. Графика на рефлексивна игра ............................................. .................................................. 76 3.5. Редовни структури за информираност ............................................. ............... 82 3.6. Рангът на отражението и информационното равновесие ............................................. ... 91 3.7. Светлоотразително управление ................................................. .................. ....................... 102 ГЛАВА 4. Приложни модели на рефлексивни игри ................................. 102 ............. 106 4.1 . Скрит контрол ................................................. .................. ................................ .. 106 4.2. Масмедиите и управлението на информацията ............................................. ................. ...... 117 4.3. Рефлексията в психологията ............................................. ........................................... 121 4.3.1. Психология на шахматното творчество.............. ................................. 121 4.3.2. Транзакционен анализ ................................................. ............................... 124 4.3.3. Прозорец на Джохари ................................................. .. ................................. 126 4.3.4. Модел на етичен избор ............................................. ................................... 128 4.4. Отражение в художествените произведения................................................. .. 129 ЗАКЛЮЧЕНИЕ ......................................................... ......................................................... 137 ЛИТЕРАТУРА .. ......................................................... ......................................................... ........ 142 3 - Малките лудуват на воля, това е тяхната радост! - Ти не си риба, откъде знаеш каква е нейната радост? „Ти не си аз, откъде знаеш какво знам и какво не знам?“ От една даоистка притча – Въпросът, разбира се, уважаеми архиепископе, е, че вие вярвате в това, в което вярвате, защото сте възпитани по този начин. - Може би така. Но остава фактът, че вие също вярвате, че аз вярвам в това, което вярвам, защото съм възпитан по този начин, поради причината, че вие сте възпитани по този начин. От книгата "Социална психология" на Д. Майерс основни параметри, репрезентации за репрезентации и др. Отражение. Едно от основните свойства на човешкото съществуване е, че наред с естествената („обективна”) реалност съществува нейното отражение в съзнанието. В същото време между естествената реалност и нейния образ в съзнанието (ние ще разглеждаме този образ като част от специална - рефлективна реалност) има неизбежна пропаст, несъответствие. Целенасоченото изследване на този феномен традиционно се свързва с термина „рефлексия“, който във Философския речник е дефиниран по следния начин: „РЕФЛЕКСИЯ (лат. reflexio – връщане назад). Термин, означаващ отражение, както и изследване на когнитивния акт. Терминът "отражение" е въведен от Дж. Лок; в различни философски системи (Дж. Лок, Г. Лайбниц, Д. Хюм, Г. Хегел и др.) имаше различно съдържание. Систематичното описание на рефлексията от гледна точка на психологията започва през 60-те години на XX век (училище 4 на V.A. Lefebvre). Освен това трябва да се отбележи, че има разбиране за отражение в различен смисъл, свързан с рефлекса - "реакцията на тялото на възбуждането на рецепторите". Тази статия използва първата (философска) дефиниция на рефлексията. За да изясним разбирането за същността на рефлексията, нека първо разгледаме ситуацията с един субект. Той има идеи за природната реалност, но може и да осъзнава (отразява, отразява) тези идеи, както и да осъзнава осъзнаването на тези идеи и т.н. Така се формира отразяващата реалност. Рефлексия на субекта относно собствените му представи за реалността, принципите на неговата дейност и др. се нарича авторефлексия или рефлексия от първи вид. Трябва да се отбележи, че в повечето хуманитарни изследвания говорим преди всичко за авторефлексия, която във философията се разбира като процес на индивидуално мислене за това, което се случва в съзнанието му. Отражението от втория вид се извършва по отношение на идеи за реалността, принципите на вземане на решения, авторефлексия и др. други субекти. Нека дадем примери за рефлексия от втория вид, показващи, че в много случаи правилните собствени заключения могат да бъдат направени само ако човек заеме позицията на други субекти и анализира техните възможни разсъждения. Първият пример е класическата игра с мръсни лица, понякога наричана проблемът с мъдреците и шапките или проблемът със съпрузите и неверните съпруги. Ние го описваме по следния начин. „Нека си представим, че Боб и племенницата му Алис са в купето на викторианска карета. Лицата на всички са объркани. Въпреки това никой не се изчервява от срам, въпреки че всеки викториански пътник би се изчервил, знаейки, че другият го вижда мръсен. От това заключаваме, че никой от пътниците не знае, че лицето му е мръсно, въпреки че всеки вижда мръсното лице на неговия спътник. В това време кондукторът поглежда в купето и съобщава, че в купето има мъж с мръсно лице. След това Алис се изчерви. Осъзна, че лицето й е мръсно. Но защо тя разбра това? Не й ли каза Водачът това, което тя вече знаеше? 5 Нека проследим веригата от разсъждения на Алис. Алис: Да предположим, че лицето ми е чисто. Тогава Боб, знаейки, че един от нас е мръсен, трябва да заключи, че е мръсен и да се изчерви. Ако той не се изчерви, тогава моята предпоставка за моето чисто лице е невярна, лицето ми е мръсно и трябва да се изчервя. Диригентът добави към информацията, известна на Алис, информация за знанията на Боб. Дотогава тя не знаеше, че Боб знае, че един от тях е мръсен. Накратко, съобщението на кондуктора превърна знанието, че в купето има мъж с мръсно лице в Общи познания ". Вторият пример от учебника е проблемът с координираната атака; има близки до него проблеми относно оптималния протокол за обмен на информация - Игра с електронна поща и т.н. (вижте рецензии в ). Ситуацията е следната. Две дивизии са разположени на върховете на два хълма, а врагът е разположен в долината. Можете да спечелите само ако и двете дивизии атакуват врага едновременно. Генералът - командирът на първа дивизия - изпраща на генерала - командирът на втора дивизия - пратеник със съобщението: "Атакуваме призори." Тъй като пратеникът може да бъде прихванат от врага, първият генерал трябва да изчака съобщение от втория генерал, че първото съобщение е получено. Но тъй като второто съобщение също може да бъде прихванато от врага, вторият генерал трябва да получи потвърждение от първия генерал, че е получил потвърждение. И така до безкрайност. Задачата е да се определи след какъв брой съобщения (потвърждения) има смисъл генералите да атакуват врага. Изводът е, че при описаните условия координирана атака е невъзможна и изходът е използването на вероятностни модели. Третият класически проблем е "проблемът с двама брокери" (вижте също спекулативни модели в ). Да предположим, че двама борсови брокери имат свои собствени експертни системи, които се използват за подпомагане на вземането на решения. Случва се мрежовият администратор да копира незаконно и двете експертни системи и да продава експертната система на опонента си на всеки брокер. След това администраторът се опитва да продаде на всеки от тях следната информация - "Вашият опонент има вашата експертна система." След това администраторът се опитва 6 да продаде информация - "Опонентът ви знае, че имате неговата експертна система" и т.н. Въпросът е как брокерите трябва да използват информацията, която получават от администратора, и каква информация е релевантна при коя итерация? След като завършихме разглеждането на примери за отражение от втория вид, ще обсъдим в какви ситуации отражението е от съществено значение. Ако единственият отразяващ субект е икономически агент, който се стреми да максимизира своята целева функция, като избира едно от етично приемливите действия, тогава естествената реалност влиза в целевата функция като определен параметър, а резултатите от отразяването (репрезентации за репрезентации и др. ) не са аргументи на целевата функция. Тогава можем да кажем, че авторефлексията „не е необходима“, тъй като не променя действието, избрано от агента. Обърнете внимание, че зависимостта на действията на субекта от рефлексията може да се осъществи в ситуация, в която действията са етически неравностойни, т.е. заедно с утилитарния аспект има деонтологичен (етичен) - вж. Икономическите решения обаче обикновено са етично неутрални, така че нека разгледаме взаимодействието на няколко участници. Ако има няколко субекта (ситуацията на вземане на решение е интерактивна), тогава целевата функция на всеки субект включва действията на други субекти, тоест тези действия са част от естествената реалност (въпреки че самите те, разбира се, се дължат на рефлексивна реалност). В същото време рефлексията (и следователно изследването на отразяващата реалност) става необходима. Нека разгледаме основните подходи за математическо моделиране на ефектите на отражение. Теория на играта. Формалните (математически) модели на човешкото поведение се създават и изучават повече от век и половина (виж прегледа в ) и намират все по-широко приложение както в теорията на управлението, икономиката, психологията, социологията и др., така и при решаването на конкретни приложни проблеми. Най-интензивно развитие се наблюдава от 40-те години на ХХ век – момента, в който се появява теорията на игрите, която обикновено се датира от 1944 г. (излизането на първото издание на книгата на Джон фон Нойман и Оскар Моргенщерн „Теория на игрите и Икономическо поведение“). 7 Под играта в тази работа ще разбираме взаимодействието на страните, чиито интереси не съвпадат (имайте предвид, че е възможно друго разбиране на играта - като „вид непродуктивна дейност, чийто мотив не се крие в нейните резултати, а в самия процес“ – виж също , където концепцията за играта се тълкува много по-широко). Теорията на игрите е клон на приложната математика, който изследва моделите за вземане на решения в условията на конфликт на интереси на страните (играчите), когато всяка страна се стреми да повлияе на развитието на ситуацията в свои интереси. Освен това, терминът "агент" се използва за означаване на вземащия решение (играч). В тази статия разглеждаме некооперативни статични игри в нормална форма, тоест игри, в които агентите избират своите действия веднъж, едновременно и независимо. По този начин основната задача на теорията на игрите е да опише взаимодействието на няколко агенти, чиито интереси не съвпадат, а резултатите от дейността (печалба, полезност и т.н.) на всеки зависят в общия случай от действията на всички. Резултатът от такова описание е прогноза за разумен резултат от играта - така нареченото решение на играта (равновесие). Описанието на играта се състои в задаване на следните параметри: - набор от агенти; - предпочитания на агентите (зависимости на печалбите от действията): предполага се (и това отразява целенасочеността на поведението), че всеки агент е заинтересован от максимизиране на печалбата си; - набори от допустими действия на агенти; - информираност на агентите (информацията, с която разполагат в момента на вземане на решения относно избраните действия); - редът на функциониране (редът на ходовете - последователността на избор на действия). Относително казано, наборът от агенти определя кой ще участва в играта. Предпочитанията отразяват това, което агентите искат, наборите от разрешени действия, какво могат да правят, осведомеността отразява това, което знаят, и реда на действие, когато избират действия. 8 Изброените параметри определят играта, но те не са достатъчни, за да предскажат нейния резултат - решението на играта (или равновесието на играта), тоест набор от действия, които са рационални и стабилни от една гледна точка или друг. Към днешна дата в теорията на игрите няма универсална концепция за равновесие - приемайки определени предположения за принципите на вземане на решения от агентите, можете да получите различни решения. Следователно основната задача на всяко изследване на теорията на игрите (включително и настоящата работа) е изграждането на равновесие. Тъй като рефлексивните игри се определят като такова интерактивно взаимодействие на агенти, в което те вземат решения въз основа на йерархията на техните представяния, осъзнаването на агентите е от съществено значение. Затова се спираме на качественото му обсъждане по-подробно. Ролята на осъзнаването. Общи познания. В теорията на игрите, философията, психологията, разпределените системи и други области на науката (вижте рецензията в ), не само вярванията (вярванията) на агентите относно съществените параметри са от съществено значение, но също така и техните идеи за представянията на други агенти и т.н. . Наборът от тези представяния се нарича йерархия на вярванията и се моделира в тази статия чрез дървото на информационната структура на рефлексивна игра (вижте раздел 3.2). С други думи, в ситуации на интерактивно вземане на решения (моделирани в теорията на игрите), всеки агент трябва да предвиди поведението на опонентите, преди да избере своето действие. За да направи това, той трябва да има определени идеи за визията на играта от противниците. Но опонентите трябва да направят същото, така че несигурността коя игра ще се играе създава безкрайна йерархия от представяния на участниците в играта. Нека дадем пример за йерархия на изгледи. Да предположим, че има два агента - А и Б. Всеки от тях може да има свои собствени нерефлексивни идеи за неопределения параметър q, който по-нататък ще наричаме състояние на природата (състояние на природата, състояние на света). Означаваме тези представяния съответно с qA и qB. Но всеки от агентите, в рамките на процеса на размисъл от първи ранг, може да мисли за идеите на противника. Тези представяния (представяния от втори ред) ще бъдат означени с qAB и qBA, където qAB са представянията на агент A на представянията на агент B, 9 qBA са представянията на агент B на представянията на агент A. Но въпросът не се ограничава до това - всеки от агентите, като част от процеса на по-нататъшно отражение (отражение от втори ранг), може да мисли какви са идеите на опонента за неговите идеи. Ето как се генерират представяния от трети ред, qABA и qBAB. Процесът на генериране на представяния от по-висок порядък може да продължи безкрайно (няма логически ограничения за увеличаване на ранга на отражение). Съвкупността от всички представяния - qA, qB, qAB, qBA, qABA, qBAB и др. - формира йерархия на възгледите. Специален случай на осъзнаване е, когато всички репрезентации, репрезентации за репрезентации и т.н. съвпадат до безкрайност - е общоизвестно. По-правилно, терминът "общоизвестен" е въведен, за да обозначи факт, който отговаря на следните изисквания: 1) той е известен на всички агенти; 2) всички агенти знаят 1; 3) всички агенти знаят 2 и т.н. ad infinitum Формалният модел на общото познание е предложен в и развит в много трудове - вж. Моделите на агентното съзнание - йерархия на репрезентациите и общото знание - в теорията на игрите са посветени всъщност изцяло в тази работа, така че ще дадем примери, илюстриращи ролята на общото знание в други области на науката - философия, психология и др. ( вижте също преглед). От философска гледна точка общото знание беше анализирано в изследването на конвенциите. Помислете за следния пример. В Правилата за движение по пътищата е записано, че всеки участник в движението трябва да спазва тези правила, а също така има право да очаква другите участници в движението да ги спазват. Но другите участници в движението също трябва да са сигурни, че останалите спазват правилата и т.н. до безкрайност. Следователно съгласието за „спазване на правилата за движение“ трябва да е общоизвестно. В психологията съществува понятието дискурс - „(от латински discursus - разсъждение, аргумент) - вербално мислене на човек, опосредствано от минал опит; действа като процес на свързано логическо 10 разсъждение, при което всяка следваща мисъл е обусловена от предишната. Ролята на общите знания за разбирането на дискурса е илюстрирана в следния пример. Двама души излизат от киното. Единият пита другия: "Как ти харесва филма?". За да може вторият човек да разбере въпроса, той трябва да разбере, че го питат за филма, който току-що са гледали заедно. Освен това той трябва да разбере, че първият разбира това. Питащият от своя страна трябва да е сигурен, че вторият ще разбере, че въпросът е за филма, който са гледали и т.н. Тоест, за адекватно взаимодействие (комуникация) "филмът" трябва да е общоизвестен (хората трябва да постигнат съгласие относно използването на езика). Взаимната осведоменост на агентите също е от съществено значение в разпределените изчислителни системи, в изкуствения интелект и други области. В теорията на игрите като правило се приема, че всички1 параметри на играта са общоизвестни, тоест всеки агент знае всички параметри на играта, както и че те са известни на всички агенти и т.н. до безкрайност. Такова предположение съответства на обективно описание на играта и дава възможност да се използва концепцията за равновесие на Наш2 като предвидим резултат от некооперативна игра (т.е. игра, в която преговорите между агентите са невъзможни, за да се създадат коалиции , обмен на информация, съвместни действия, преразпределяне на печалби и др.). По този начин общоприетото предположение предполага, че всички агенти знаят каква игра играят и техните идеи за играта са еднакви. Вместо действието на агента можем да разгледаме нещо по-сложно - неговата стратегия, тоест картографирането на информацията, налична на агента, в набора от разрешените му действия. Примери са: стратегии в многоетапна игра, смесени стратегии, стратегии в метаигрите на Хауърд (вижте също информация) нито една от тях не се възползва от едностранно (т.е. при условие, че другите агенти избират подходящите равновесни компоненти) отклонение от равновесие - вижте правилното определение по-долу. Но дори и в тези случаи правилата на играта са общоизвестни. И накрая, можем да считаме, че играта е избрана на случаен принцип според някакво разпределение, което е общоизвестно - така наречените байесови игри. В общия случай всеки от агентите може да има свои собствени представи за параметрите на играта, всяка от които съответства на някакво субективно описание на играта. В този случай се оказва, че агентите участват в играта, но обективно не знаят коя, или представят играта, която се играе по различни начини - нейните правила, цели, роли и информираност на опонентите и т.н. Няма универсални подходи за изграждане на равновесия с недостатъчни общи познания в теорията на игрите днес. От друга страна, в рамките на „рефлексивната традиция“ на хуманитарните науки, за всеки агент светът около него съдържа (включва) други агенти, а идеите за други агенти се отразяват в процеса на рефлексия (разликите в идеите могат да бъдат поради по-специално неравно съзнание). Въпреки това, досега не са получени формални конструктивни резултати в тази област. Следователно има нужда от разработване и изучаване на математически модели на игри, в които съзнанието на агентите не е общоизвестно и агентите вземат решения въз основа на йерархията на техните представяния. Ние наричаме този клас игри рефлексивни игри (формална дефиниция е дадена в раздел 3.2 на този документ). Трябва да се признае, че терминът "рефлексивни игри" е въведен от V.A. Льофевр през 1965 г. в. Въпреки това, в тази работа, както и в работите на същия автор, има основно качествено обсъждане на ефектите от отражението във взаимодействието на субектите и не е предложена обща концепция за решение за този клас игри. Същата забележка важи и за , в който са разгледани редица частни случаи на осъзнаване на участниците в играта. По този начин изследването на рефлексивните игри и изграждането на единна концепция за равновесие за тях е актуално, което мотивира настоящото изследване. 12 Преди да преминем към представяне на основното съдържание на работата, ще обсъдим на качествено ниво основните подходи, използвани по-долу. Основни подходи и структура на работа. В първата глава „Информация при вземане на решения“, която има предимно обзорен и уводен характер, са представени модели на индивидуално и интерактивно вземане на решения, извършен е анализ на информираността, необходима за прилагането на някои добре известни концепции за равновесие. навън, и известни модели общоизвестни и йерархия на представителствата. Както е дефинирано по-горе, рефлексивна игра е тази, в която съзнанието на агентите не е споделено знание3 и агентите вземат решения въз основа на йерархия на техните представяния. От гледна точка на теорията на игрите и рефлексивните модели за вземане на решения е препоръчително да се разделят стратегическата и информационната рефлексия. Информационното отражение е процесът и резултатът от мисленето на агента за това какви са стойностите на несигурните параметри, какво знаят и мислят неговите опоненти (други агенти) за тези стойности. В същото време самият компонент "игра" отсъства, тъй като агентът не взема никакви решения. Стратегическата рефлексия е процесът и резултатът от мисленето на агента за това какви принципи за вземане на решения използват неговите опоненти (други агенти) в рамките на съзнанието, което той им приписва в резултат на рефлексията на информацията. По този начин информационната рефлексия обикновено се свързва с недостатъчна взаимна осведоменост и нейният резултат се използва при вземане на решения (включително стратегическа рефлексия). Стратегическата рефлексия се осъществява дори при пълно осъзнаване, като се предвижда решението на агента за избраното действие. С други думи, информационната и стратегическата рефлексия могат да се изучават независимо, но в условията на непълна и недостатъчна осведоменост се осъществяват и двете. 3 Ако в разглеждания модел осъзнаването е общоизвестно, тогава всички резултати от изследването на рефлексивните игри се прехвърлят към съответните класически резултати от теорията на игрите - виж по-долу. 13 Стратегическата рефлексия се обсъжда във втората глава на този документ. Оказва се, че ако приемем, че агентът, моделирайки поведението на опонентите си, приписва на тях и себе си определени рангове на рефлексия, тогава първоначалната игра се превръща в нова игра, в която стратегията на агента е да избере ранга на рефлексия. Ако разгледаме процеса на отражение в нова игра, получаваме нова игра и т.н. В същото време, дори ако в оригиналната игра наборът от възможни действия беше краен, то в новата игра наборът от възможни действия - броят на различните рангове на отражение - е безкраен. Следователно основната задача, която трябва да се реши при изследването на стратегическото отражение, е да се определи максимално целесъобразният ранг на отражение. Отговорът на този въпрос беше получен във втората глава за биматрични игри (раздел 2.2) и модели, които отчитат ограниченията на способността на човек да обработва информация (раздел 2.3). Нека дадем пример за стратегическо размишление - "Дузпа" (вж. (Вижте също примерите „Криеница“ и „Разрушаване на миниатюра“ в раздел 2.2). Агентите са ритащият и вратарят. Нека приемем за простота, че играчът има две действия - "да удари левия ъгъл на вратата" и "да удари десния ъгъл на вратата". Вратарят също има две действия - "хвани топката в левия ъгъл" и "хвани топката в десния ъгъл". Ако вратарят познае кой ъгъл бие играчът, тогава той хваща топката. Нека моделираме разсъжденията на агентите. Уведомете вратаря, че този играч обикновено стреля в десния ъгъл. Следователно той трябва да хване топката в десния ъгъл. Но ако вратарят знае, че играчът знае, че вратарят знае как обикновено се държи играчът, тогава вратарят трябва да моделира разсъжденията на играча. Той може да мисли така: „Играчът знае, че знам обичайната му тактика. Така че той очаква да хвана топката в десния ъгъл и да ударя левия ъгъл. В този случай трябва да хвана топката в левия ъгъл. Ако играчът има достатъчна дълбочина на размисъл, тогава той може да познае разсъжденията на вратаря и да се опита да го надхитри, като удари десния ъгъл. Същата верига от разсъждения може да бъде извършена от вратаря и на тази основа да хване топката в десния ъгъл. И играчът, и вратарят могат да увеличат дълбочината на размисъл до безкрайност, като разсъждават взаимно и нито един от тях няма рационални основания да спре на някаква последна стъпка. Следователно в рамките на моделирането на взаимни разсъждения е невъзможно априори да се определи резултатът от разглежданата игра. Самата игра, в която всеки от агентите има две възможни действия, може да бъде заменена с друга игра, в която агентите избират ранговете на отражение, присвоени на противника. Но дори и в тази игра няма разумно решение, тъй като всеки агент може да моделира поведението на противника, като вземе предвид "двойно рефлексивна" игра и т.н. до безкрайност. Единственото нещо, което може да помогне на агентите в разглежданата ситуация, е да се ограничи дълбочината на тяхното отражение, като се има предвид, че започвайки от втория ранг на отражение (поради ограничеността на първоначалния набор от възможни действия), ситуацията започва да се повтаря - като е както на нулево, така и на второ (и като цяло на всяко равномерно) ниво на отражение, играчът ще удари в десния ъгъл. Следователно остава вратарят да познае паритета на нивото на отражение на играча. Максималният ранг на рефлексия, който агентът трябва да има, за да покрие цялото разнообразие от резултати от играта (загубвайки от поглед някои от стратегиите на противника, агентът рискува да намали печалбата си), ще наричаме максимален ранг на целесъобразна рефлексия. Оказва се, че в много случаи този ранг е краен - съответните формални резултати са дадени в раздели 2.2 и 3.6). В примера "Наказание" максималният целесъобразен ранг на отражение на агентите е две. Ако вратарят няма информация къде обикновено удря нападателят, действията на последния са симетрични (левият и десният ъгъл са „еквивалентни“). Въпреки това остават възможности за изкуствено въвеждане на асиметрия, за да се опитате да я използвате за собствени цели. Например, вратарят може да се придвижи към един от ъглите, сякаш кани нападателя да удари другия (и се втурва към този „далечен“ ъгъл). По-сложна стратегия е следната. Играч от отбора на вратаря идва при него и показва къде нападателят ще удари, като го прави така, че нападателят да го види (след което в момента на удара вратарят хваща топката не в ъгъла, който съотборникът му демонстративно показа, но в противоположния) . Имайте предвид, че и двете описани техники са взети "от живота" и се оказаха успешни. Първият се проведе в международния мач на националния отбор на СССР, вторият - във финала на Купата на СССР по футбол при изпълнение на дузпи. 15 Третата глава е посветена на изследването на формалните модели на отразяване на информацията. Тъй като ключовият фактор в рефлексивните игри е осъзнаването на агентите - йерархията на репрезентациите, тогава за нейното формално описание се въвежда концепцията за информационна структура - дърво (в общия случай безкрайно), чиито върхове съответстват на информация (репрезентации) на агенти за съществени параметри, репрезентации на други агенти и др. .d. (вижте примера за йерархия на изгледа по-горе). Концепцията за структурата на осъзнаването (информационната структура) ни позволява да дадем формална дефиниция на някои интуитивно ясни понятия, като: адекватна информираност на един агент за друг, взаимна информираност, еднаква информираност и т.н. Едно от ключовите понятия, използвани в тази работа за анализиране на рефлексивни игри е понятието агент фантом. Нека го обсъдим на качествено ниво (като отложим строгото математическо определение до раздел 3.2). Нека двама агенти, А и Б, взаимодействат в определена ситуация.Напълно естествено е в съзнанието на всеки от тях да има определен образ на другия: А има образ на Б (да го наречем АВ), а Б има изображение на A (да го наречем BA). Тези образи могат да съвпадат с реалността и могат да се различават от нея. С други думи, агент, например A, може или не може да има адекватна представа за B (този факт може да бъде записан като идентичност AB = B). Тук веднага възниква въпросът – може ли принципно да се изпълни тъждеството AB = B, тъй като B е реален агент, а AB е само негов образ? Без да навлизаме в обсъждане на този по същество философски въпрос, отбелязваме следните две обстоятелства. Първо, не говорим за цялостно разбиране на личността в нейната цялост, а за нейното моделиране в тази конкретна ситуация. На обикновеното, всекидневно ниво на човешко общуване ние постоянно се сблъскваме със ситуации както на адекватно, така и на неадекватно възприемане на един човек от друг. Второ, в рамките на формалното (теоретико-игровото) моделиране на човешкото поведение, агентът - участник в ситуация - се описва с относително малък набор от характеристики. И тези характеристики могат да бъдат напълно известни на друг агент в същата степен, в която са известни на изследователя. 16 Нека разгледаме по-подробно случая, когато има разлика между B и AB (тази разлика може да произтича, казано формално, от непълнотата на информацията на A за B или от доверие в невярна информация). Тогава А, когато решава каквото и да е свое действие, има предвид не Б, а представата за него, която има, тоест АВ. Можем да кажем, че субективно А взаимодейства с АВ. Следователно АВ може да се нарече фантомен агент. Тя не съществува в реалността, но присъства в съзнанието на реалния агент А и съответно влияе на действията му, тоест на реалността. Да донесем най-простият пример . Нека А вярва, че той и Б са приятели, а Б, знаейки това, е враг на А (тази ситуация може да се опише с думата „предателство“). Тогава очевидно в ситуацията има фантомен агент АВ, който може да се опише по следния начин: „Б, който е приятел на А”; в действителност няма такъв субект. Обърнете внимание, че в този случай B е адекватно информиран за A, т.е. BA = A. По този начин, в допълнение към реалните агенти, които действително участват в играта, се предлага да се разгледат фантомни агенти, тоест агенти, които съществуват в умовете на реални и други фантомни агенти. Реалните и фантомните агенти, в рамките на своето отражение, придават на фантомните агенти определена информираност, която се отразява в информационната структура. Може да има безкраен брой реални и фантомни агенти, участващи в играта, което означава потенциалната безкрайност на изпълнението на актове на рефлексивно отражение (безкрайната дълбочина на дървото на структурата на осъзнаването). Наистина, дори в най-простата ситуация, безкрайно разширяване на разсъжденията под формата „Знам ...“, „Знам, че знаете ...“, „Знам, че знаете, че знам ...“, „ Знам, че знаете, че знам, че знаете…” и т.н. На практика обаче такава „лоша безкрайност” не се случва, тъй като, започвайки от определен момент, репрезентациите се „стабилизират” и нарастването на ранга на размисъл не дава нищо ново. Така в реални ситуации структурата на осъзнаването има крайна сложност: съответното дърво има краен брой по двойки различни поддървета - 17 ев. С други думи, играта включва краен брой реални и фантомни агенти4. Въвеждането на понятието фантомни агенти дава възможност да се дефинира рефлексивната игра като игра на реални и фантомни агенти, както и да се дефинира информационното равновесие като обобщение на равновесието на Наш за случая на рефлексивна игра, в която предполага се, че всеки агент (реален и фантом), когато изчислява своето субективно равновесие (равновесие в играта, която играе от негова гледна точка), използва съществуващата си йерархия от идеи за обективна и рефлексивна реалност. Удобен инструмент за изследване на информационното равновесие е рефлексивен граф на играта, в който върховете съответстват на реални и фантомни агенти, а всеки връх на агент включва дъги (броят им е с една по-малък от броя на реалните агенти), идващи от върховете на агентите, върху чиито действия изплащането зависи от субективното равновесие.този агент. Графиката на рефлексивна игра може да бъде конструирана без конкретизиране на целевите функции на агентите. В същото време той отразява, ако не количественото съотношение на интересите, то качественото съотношение на осъзнаването на отразяващите агенти и е удобно и изразително средство за описване на ефектите от отражението (виж раздел 3.4). За примера на двама агенти, описани по-горе, графиката на рефлексивната игра има формата: B ¬ A « AB - истинският агент B (предателят) е адекватно информиран за агента A, който взаимодейства с фантомния агент AB (B, който е приятел на А). Нека дадем още един пример за графика, която отразява рефлексивно взаимодействие (въпреки че формално не е графика на рефлексивна игра в смисъла на дефиницията, въведена по-горе). На корицата на тази книга е картина на Е. Бърн-Джоунс „Смъртоносна глава“, написана през 1886-1887 г. въз основа на мита за Персей и Андромеда. В ситуацията участват трима реални агенти: Персей (нека го обозначим с буквата P), Андромеда (A) и горгоната Медуза (M). В допълнение, 4 В ограничаващия случай - когато има общоизвестно - фантомният агент от първо ниво съвпада с реалния си прототип и дървото има единична дълбочина (по-точно всички останали поддървета повтарят дървета от по-високо ниво). 18, има следните "фантомни" агенти: отражението на Персей (OP), отражението на Андромеда (OA) и отражението на Медуза (OM). Графиката е показана на фигура 1. M P A OP OA OM Фиг. 1. Графика на картината на Е. Бърн-Джоунс „Смъртоносна глава“ (виж корицата) 19 Осъзнаването на реални агенти в разглеждания пример е следното: Персей вижда Андромеда; Андромеда не вижда Персей, но вижда неговото отражение, своето отражение и отражението на Медуза Горгона; отражението на Персей вижда отражението на Андромеда; Отражението на Андромеда вижда всички истински агенти. За щастие никой от истинските агенти не вижда самата горгона Медуза. Въвеждането на информационна структура, информационно равновесие и графика на рефлексивна игра, на първо място, позволява да се опишат и анализират различни ситуации на колективно вземане на решения от агенти с различно съзнание от единна методологична позиция и с помощта на единен математически апарат, за изследване на влиянието на ранговете на рефлексия върху печалбите на агентите, за изследване на условията за съществуването и осъществимостта на информационните равновесия и др. По-долу са дадени множество примери за приложени модели. Второ, предложеният модел на рефлексивната игра дава възможност да се изследва влиянието на рефлексивните рангове (дълбочината на информационната структура) върху печалбите на агентите. Резултатите, получени в раздели 2.2, 3.5 и 3.6 от тази статия, показват, че при минимални допускания е възможно да се покаже, че максималният целесъобразен ранг на отражение е ограничен. С други думи, в много случаи неограниченото увеличаване на ранга на отражение е нецелесъобразно от гледна точка на изплащането на агентите. Трето, наличието на модел на рефлексивна игра ни позволява да определим условията за съществуване и свойства на информационното равновесие, както и конструктивно и правилно да формулираме проблема за рефлексивния контрол, който се състои в търсене на такава информационна структура чрез управляващ орган, че реализираното в него информационно равновесие е най-полезно от негова гледна точка. Проблемът за рефлексивното управление е поставен и решен за редица случаи в раздел 3.7. Теоретичните резултати от неговото решение се използват в редица приложни модели, представени в четвърта глава - скрито управление, управление на информацията чрез медиите и др. И накрая, четвърто, езикът на рефлексивните игри (информационни структури, графики на рефлексивен игра и т.н.) е удобен за описване на ефектите от рефлексията както в психологията (което е илюстрирано с примера на шахматна игра, транзакционен анализ, 20 модела на етичен избор и т.н.), така и в произведения на изкуството - виж четвъртата глава от тази работа. След завършване преглед на качеството съдържанието на работата, отбелязваме, че можем да предложим няколко подхода за запознаване с материала на тази книга. Първият е линеен, състоящ се в последователно четене на четирите глави. Втората е предназначена за читателя, който се интересува повече от формалните модели и се състои в прочитане на втора и трета глава и бегло запознаване с примерите в четвърта глава. Третият е насочен към читател, който не иска да се задълбочава в математически тънкости, и се състои в прочитане на увода, четвърта глава и заключението. ГЛАВА 1. ИНФОРМАЦИЯ ПРИ ВЗЕМАНЕ НА РЕШЕНИЯ В първата глава на тази статия представяме модел на индивидуално вземане на решения (раздел 1.1), преглеждаме основните концепции за решаване на некооперативни игри, обсъждаме предположенията, използвани в тези концепции относно осведоменост и взаимна осведоменост на агентите (раздел 1.2) и анализ на познатите модели на осведоменост и общи познания (раздел 1.3). 1.1. ИНДИВИДУАЛНО ВЗЕМАНЕ НА РЕШЕНИЯ: МОДЕЛ НА РАЦИОНАЛНО ПОВЕДЕНИЕ Нека опишем, следвайки модела на вземане на решения от един агент. Нека агентът може да избере някакво действие x от набора X от разрешени действия. В резултат на избора на действие x n X, агентът получава печалба f(x), където f: X ® В1 е реална стойностна целева функция, отразяваща предпочитанията на агента. Нека приемем хипотезата за рационално поведение, която е, че агентът, като взема предвид цялата налична за него информация, избира действия, които са най-предпочитани от гледна точка на стойностите на неговата целева функция (тази хипотеза не е единствената възможна едно - вижте например концепцията за ограничена рационалност). В съответствие с хипотезата за рационално поведение, агентът избира алтернатива от набора от "най-добри" алтернативи. В разглеждания случай това множество е множеството от алтернативи, на които се постига максимумът на целевата функция. Следователно изборът на действие от страна на агент се определя от правилото за индивидуален рационален избор P(f, X) n X, което отделя набор от действия, които са най-предпочитани от гледна точка на агента5: P( f, X) = Arg max f(x). xн X Нека усложним модела, а именно приемаме, че печалбата на агента се определя не само от собствените му действия, но и от стойността на неопределения параметър q н W – състоянието на природата. Тоест, в резултат на избор на действие x н X и реализиране на природно състояние q н W, агентът получава печалба f(q, x), където f: W ´ X ® Â1. Ако печалбата на агента зависи освен от действията му и от неопределен параметър - състоянието на природата, то в общия случай няма еднозначно "най-добро" действие - когато взема решение за избраното действие, агентът трябва да "предскаже" състояние на природата. Затова въвеждаме хипотезата на детерминизма, която се състои в това, че агентът се стреми да елиминира, като вземе предвид цялата налична за него информация, съществуващата несигурност и да взема решения в условията на пълна информация (с други думи, крайният критерий който ръководи агента при вземането на решения, не трябва да съдържа несигурни параметри). Тоест агентът трябва, в съответствие с хипотезата на детерминизма, да елиминира несигурността относно независимите от него параметри (може би чрез въвеждане на определени допускания за техните стойности). В зависимост от информацията I, която агентът има за несигурни параметри, има: - интервална несигурност (когато е известен само наборът W от възможни стойности на несигурни параметри); 5 Когато се използват високи и ниски нива, се приема, че те са достигнати. 22 - вероятностна несигурност (когато в допълнение към набора W от възможни стойности на несигурни параметри е известно тяхното вероятностно разпределение p (q); - размита несигурност (когато в допълнение към набора W от възможни стойности на несигурни параметри е известна функцията на принадлежност на техните стойности). В тази статия разглеждаме най-простия - "точков" - случай, когато агентите имат идеи за конкретно значение на състоянието на природата. В заключението се обсъжда възможността за обобщаване на получените резултати за случай на интервална или вероятностна несигурност. Въвеждаме следното предположение относно процедурите за елиминиране на несигурността, използвани от агента: интервалната несигурност се елиминира чрез изчисляване на максималния гарантиран резултат (MGR), вероятностната е очакваната стойност на целевата функция, размитата е набор от максимални недоминирани алтернативи от целевата функция f(q, x) към целевата функция f(x), която не зависи от несигурните параметри. В съответствие с въведеното предположение, в случай на интервална) неопределеност f (x) = min f(q, x), в случай на вероятностна неопределеност f (x) = q нW ò f (x,q) p(q )dq и др. . W Като елиминираме несигурността, получаваме детерминистичен модел, т.е. правилото за индивидуален рационален избор има формата:) P(f, X, I) = Arg max f (x), xн X 6 Въведените предположения не са само възможните. Използването на други предположения (например хипотезата за използването на MHR може да бъде заменена с хипотезата за оптимизъм или хипотезата за „претеглен оптимизъм-песимизъм“ и др. ) ще доведе до други концепции за решение, но процесът на тяхното получаване ще следва общата схема, приложена по-долу. 23 където I е информацията, използвана от агента при елиминиране на несигурността f Þ f . I Досега разглеждахме индивидуалното вземане на решения. Нека сега разгледаме несигурността на играта, в рамките на която предположенията на агента за набора от възможни стойности на средата на играта (действията на други агенти, избрани от тях в рамките на определени неточни принципи на поведение, известни на агента в процес на разглеждане) са от съществено значение. 1.2. ИНТЕРАКТИВНО ВЗЕМАНЕ НА РЕШЕНИЯ: ИГРИ И РАВНОВЕСИЯ Игрови модел. За да се опише колективното поведение на агентите, не е достатъчно да се определят поотделно техните предпочитания и правилата на индивидуалния рационален избор. Както беше отбелязано по-горе, в случай, че системата има един агент, хипотезата за неговото рационално (индивидуално) поведение предполага, че агентът се държи по такъв начин, че да максимизира стойността на своята целева функция чрез избор на действие. В случай, че има няколко агенти, е необходимо да се вземе предвид тяхното взаимно влияние: в този случай възниква игра - взаимодействие, при което изплащането на всеки агент зависи както от неговите собствени действия, така и от действията на други агенти . Ако по силата на хипотезата за рационално поведение всеки от агентите се стреми да максимизира своята целева функция чрез избор на действие, тогава е ясно, че в случай на няколко агенти индивидуалното рационално действие на всеки от тях зависи от действията на други агенти7. Разгледайте теоретико-игров модел на взаимодействие между n агенти. Всеки агент избира действие xi, принадлежащо към допустимото множество Xi, i н N = (1, 2, …, n) – множеството от агенти. Изборът на действия от агентите се извършва еднократно, едновременно и независимо. 7 В моделите на теорията на игрите се приема, че рационалността на играчите, тоест следването на тяхната хипотеза за рационално поведение, е общоизвестна. Това предположение се приема и в настоящата работа. 24 Печалбата на i-тия агент зависи от собственото му действие xi н Xi, от вектора действия x-i= (x1, x2, …, xi-1, xi+1, …, xn) н Xi= Õ X j противници N\(i) и от естественото състояние8 q н W, и jнN \ (i ) се описва чрез функция за изплащане с реална стойност fi = fi(q, x), където x = (xi, x-i) = (x1, x2, …, xn) Î X" = Õ X j е векторът на действията на всички jÎN агенти , За фиксирана стойност на природното състояние множеството Г = ( N, (Xi)i Î N, (fi(×))i Î N) множества от агенти, множества от техните допустими действия и целеви функции се нарича игра в нормална форма агенти По силата на хипотезата за рационално поведение всеки агент ще се стреми да избере най-добрите действия за него (по отношение на стойността на неговата целева функция) в дадена ситуация. x-i игри н X-i и природни състояния q н W. Следователно принципът на вземане на решение за избраното действие може да бъде записан по следния начин (BR обозначава най-добрия отговор - най-добър отговор): (1) BRi(q, x-i) = Arg max fi(q, xi, x-i), i н N. xi н X i Успоредно с това ще обсъдим осъзнаването, което е необходимо за прилагането на равновесието. Равновесието в доминиращите стратегии. Ако за даден агент наборът (1) не зависи от ситуацията, тогава той съставлява набора от неговите доминиращи стратегии (множеството от доминиращи стратегии на агентите се нарича равновесие в доминиращите стратегии - RDS). Ако всеки от агентите има доминираща стратегия, тогава те могат да вземат решения независимо, тоест могат да избират действия, без да имат никаква информация и без да правят нищо. 25 предположения за ситуацията. За съжаление, RDS не съществува във всички игри. За да могат агентите да реализират равновесие в доминиращите стратегии, ако последното съществува, е достатъчно всеки от тях да знае само своята целева функция и допустимите множества X" и W. всички игри: (2) xiг н Arg max min min fi(q) , xi, x-i), i Î N. xi Î X i x -i Î X -i q ÎW Ако за поне един от агентите наборът (1) зависи от ситуацията (т.е. няма RDS), тогава ситуацията е по-сложна. -2), …, BRn(q, x-n)). Равновесието на Наш в естественото състояние q (по-точно, параметричното равновесие на Наш) е точката x*(q) n X", удовлетворяваща следното условие: (4) x*(q) О BR(q, x*(q)). Вграждането (4) може да се запише и като: " i н N, " yi н Xi fi(q, x*(q)) ³ fi(q, yi, x-* i (q)). Множеството EN(q) от всички точки на формата (4) може да се опише по следния начин: (5) EN(q) = (x О X’ | xi О BRi(q, x-i), i О N). За случая на двама агенти, алтернативен еквивалентен начин за дефиниране на множеството EN(q) е да се определи като набор от двойки точки (x1* (q), x2* (q)), едновременно удовлетворяващи следните условни отношения : (6) x1* (q) n BR1(q, BR2(q, BR1(q, . ..BR2(q, x2* (q))...))), (7) x2* (q) н BR2(q, BR1(q, BR2(q, ...BR1(q, x1*) р))...))). Нека разгледаме каква информация трябва да притежават агентите, за да реализират равновесието на Наш, като едновременно и независимо избират действията си. По дефиниция равновесието на Наш е точката, от която едностранното отклонение е неблагоприятно за който и да е от агентите (при условие, че другите агенти избират съответните 26 компонента на вектора на действие на равновесието на Наш). Ако агентите многократно избират действия, тогава точката на Неш е в определен смисъл (вижте подробности в ) стабилна и може да се счита за осъществима в рамките на знанието, както в случая на RDS, от всеки агент само на неговата собствена обективна функция и допустима множества X" и W ( в същото време обаче е необходимо да се въведат допълнителни допускания относно принципите за вземане на решения от агентите относно избора на действия в зависимост от историята на играта ). и W за реализиране на равновесието на Наш е вече не е достатъчно. Затова въвеждаме следното предположение, което ще считаме за изпълнено в хода на цялото следващо изложение: информацията за играта Г, множеството W и рационалността на агентите е общоизвестна. Съдържателно въведеното предположение означава, че всеки от агентите е рационален, знае множеството от участници в играта, целевите функции и допустимите множества на всички агенти, а също така знае множеството от възможни стойности на природните състояния. Освен това той знае, че другите агенти го знаят и че те знаят, че той го знае и т.н. до безкрайност (виж по-горе). Такава осведоменост може по-специално да бъде постигната чрез публично (т.е. едновременно на всички агенти, събрани заедно) съобщаване на подходяща информация, което гарантира възможно постижение от всички агенти от безкраен ранг на отразяване на информацията. Обърнете внимание, че въведеното предположение не казва нищо за осъзнаването на агентите по отношение на специфичната стойност на природното състояние. Ако значението на състоянието на природата е общоизвестно, то това е достатъчно за прилагане на равновесието на Наш. За да обосновем това твърдение, нека моделираме, използвайки примера на игра с двама играчи, хода на разсъжденията на първия агент (вторият агент спори по напълно подобен начин и неговите разсъждения ще бъдат разглеждани отделно само ако се различават от разсъжденията на първия агент). Той твърди, както следва (виж израз (6)): „Моето действие, по силата на (1), трябва да бъде най-добрият отговор на действието на втория агент в дадено състояние на природата. Следователно, трябва да моделирам неговото поведение , За него (по силата на предположенията, че обективните функции и допустимите множества са общоизвестни) знам, че той ще действа в рамките на (1), тоест ще търси най-добрия отговор на моите действия за дадено състояние на природата (вижте (7)).Той трябва да моделира действията ми и той (отново, по силата на въведените предположения, че обективните функции и допустимите множества са общоизвестни) ще разсъждава по същия начин като мен и т.н. ad infinitum (вижте (6))." В теорията на игрите за такива разсъждения се използва успешна физическа аналогия на отражение в огледала - вижте например. По този начин, за да се приложи равновесието на Наш, е достатъчно всички параметри на играта, както и стойността на състоянието на природата, да бъдат общоизвестни (отслабването на това предположение е разгледано в ). Рефлексивните игри, разглеждани в тази статия, се характеризират с факта, че стойността на състоянието на природата не е общоизвестна и всеки агент обикновено има свои собствени идеи за тази стойност, идеите на други агенти и т.н. субективен баланс. Разгледаните видове равновесие са специални случаи на субективно равновесие, което се дефинира като вектор от действия на агенти, всеки компонент от който е най-добрият отговор на съответния агент към игровата среда, който може да бъде реализиран от неговата субективна гледна точка. Нека разгледаме възможните случаи. Да предположим, че i-тият агент разчита на реализацията на ситуацията) на играта x-Bi ("B" означава вярвания; понякога се използват термините "предположение", "предположение" - предположение) и състояния) на природата q i , тогава той ще избере)) (8 ) xiB Î BRi(q i , x-Bi), i Î N. Векторът xB е точково субективно равновесие. Имайте предвид, че тази дефиниция на "равновесие" не изисква валидността на предположенията на агентите за действията на опонентите, т.е. може да се окаже, че $ i Î N: x-Bi ¹ x-Bi . Оправдано субективно равновесие, т.е. такова, че x-Bi = x-Bi , i Î N, е равновесие на Неш (за това по-специално е достатъчно всички параметри на играта да са общоизвестни и всеки агент на 28 ) конструирането на x-Bi моделира рационалното поведение на противниците). В специалния случай, ако най-добрият отговор на всеки агент не зависи от предположенията за ситуацията, тогава субективното равновесие е равновесие в доминиращите стратегии. В по-общ случай i-тият агент може да разчита на избора на действия от опоненти от множеството X -Bi н X-i и реализирането на състоянието на природата от множеството Wi н Wi н N. Тогава най-добрият отговор ще бъде гарантира субективно равновесие:) (9) xi (X -Bi , Wi) О Arg max minB min) fi(q, xi, x-i), i О N. xi О X i B -i x ОX q ОW i -i - i) = X-i, Wi = W, i н N, тогава xi(X -Bi) = xiг, i н N, тоест гарантиращото субективно равновесие е “класическо” гарантиращо равновесие. Разновидност на гарантиращия субективен баланс е Р-балансът, описан подробно в. В още по-общ случай, като най-добър отговор на i-тия агент, можем да разгледаме вероятностното разпределение pi(xi), където pi(×) Î D(Xi) е множеството от всички възможни разпределения на Xi, което максимизира очакваното изплащане на агента, като се вземат предвид неговите идеи за вероятностите за разпределение mi(x-i) n D(X-i) на действията, избрани от други агенти, и разпределението на вероятностите qi(q) n D(W) на естественото състояние (получаваме байесовия принцип на решение): (10) pi(mi(×), qi(×), ×) = = arg max ò fi (q, xi, x-i) pi (xi) qi (q) mi (x-i) ) dq dx , i Î N. p i ÎD (X i) X ", W По този начин, за да реализират субективно равновесие, агентите трябва да бъдат минимално информирани – всеки от тях трябва да знае своята целева функция fi(×) и допустимите множества W и X “, т.е., за да бъдат обосновани предположенията, доп валидни предположения за взаимната осведоменост на агентите. Най-силното е предположението за общоизвестно, което превръща субективното точково равновесие в равновесие на Неш, а наборът от принципи на вземане на решение на Бейс в равновесие на Байс–Неш. Равновесие на Бейс–Неш. Ако играта има непълна информация (виж ), тогава байесовската игра се описва от следния набор: - набор от N агенти; - набор от K възможни типа агенти, където типът на i-тия агент е ki н Ki, i н N, векторът на типовете k = (k1, k2, …, kn) н K' = Õ K i ; - множеството X' = Õ Xi iОN от допустимите вектори на действията на iОN агентите; - набор от функции на полезност ui: K' ´ X' ® Â1; - представяния mi(×|ki) н D(K-i), i н N, агенти. Равновесието на Байс-Неш в игра с непълна информация се дефинира като набор от стратегии на агенти от вида si: Ki ® Xi, i н N, които максимизират съответните очаквани полезности (11) Ui(ki, si(×), s-i(×)) = ò ui (k, si(ki), s-i(k-i)) mi(k-i| ki) dk-i, i Î N. k -i ÎÕ K j j ¹i В байесовите игри обикновено се приема че представянията (mi(×| ×))i Î N са общоизвестни. За това по-специално е достатъчно те да са последователни, тоест да са получени от всеки от агентите съгласно формулата на Бейс от разпределението m(k) Î D(K’), което е общоизвестно. За байесови игри, в които (mi(×|×))iН N е общоизвестно, понятието за рационализиращи се стратегии Di Н D(Xi), i О N такива, че Di Н BRi(D-i), i О N. В две- индивидуални игри, наборът от рационализируеми стратегии съвпада с набора от стратегии, получени в резултат на итеративно елиминиране на силно доминирани стратегии9. Обобщение на рационализирани стратегии към случая на Максимин 9 Спомнете си, че стратегията на агент се нарича силно доминирана, така че има друга стратегия на агента, която във всяка ситуация осигурява на този агент строго по-голяма печалба. Итеративното елиминиране на строго доминирани стратегии се състои в тяхното последователно (като цяло безкрайно) изключване от набора от разглеждани стратегии на агентите, което води до намиране на „най-слабото“ решение на играта - набора от недоминирани стратегии. 30 (гарантиращо) равновесие се реализира в . Възможно е да се усложнят конструкциите на субективното равновесие чрез въвеждане на забрани за определени комбинации от действия на агенти и т.н. По този начин прилагането на RDS, гарантиращото и субективното равновесие (ако съществуват) изисква всеки агент да има поне информация за своята обективна функция и всички допустими множества, а прилагането на равновесието на Наш, ако съществува, допълнително изисква стойностите на всички основни параметри бяха общоизвестни. Още веднъж отбелязваме, че реализуемостта на равновесието на Неш предполага способността на агентите (и контролния орган - центърът или изследователят на операциите, ако разполагат с необходимата информация) априори и независимо да изчислят равновесието на Неш и незабавно да изберат Равновесни действия по Неш в едноетапна игра (в този случай отделен въпрос е кое от равновесията избират агентите и центърът, ако има няколко равновесия на Неш). Качествено общото знание е необходимо, така че всеки от агентите (и центърът) да може да моделира принципите на вземане на решения на други агенти, включително тези, които вземат предвид неговите собствени принципи на вземане на решения и т.н. Следователно можем да заключим, че концепцията за решаване на играта е тясно свързана с осведомеността на агентите. Концепции за решение като RDS и равновесие на Наш са в известен смисъл ограничаващи случаи - първото изисква минимална информираност, второто изисква безкрайността на ранга на отразяване на информацията на всички агенти. Ето защо по-долу ще опишем други („междинни“) случаи на информираност на агентите – йерархии на представяне – и ще изградим съответните решения на играта. Преди да внедрим тази програма, нека прегледаме известните споделени модели на знания и йерархията на представяне. 1.3. ОБЩИ ПОДХОДИ КЪМ ОПИСАНИЕТО НА ИНФОРМАЦИЯТА В концепциите за равновесие, разгледани в предишния раздел (с възможно изключение на равновесията на Наш и Байс-Неш, в които се предполага наличието на общо знание), няма отражение, тъй като всеки агент прави не се опитвайте да заемете позицията на опонентите. Рефлексията се осъществява, когато агентът има и използва йерархия от представяния, когато взема решения - свои собствени представяния на представителствата на други агенти, техните представяния на неговите представяния и взаимно представяния и т.н. Анализът на идеите за несигурни фактори съответства на информационната рефлексия, а идеите за принципите на вземане на решения - на стратегическата рефлексия. По отношение на субективното равновесие стратегическото отражение съответства на предположенията на агента, че опонентът ще изчисли едно или друго конкретно, например субективно гарантиращо равновесие, а информационното отражение - какви конкретни предположения за ситуацията ще използва опонентът. Нека разгледаме известните към момента10 подхода за описание на йерархията на репрезентациите и общите познания. Както беше отбелязано в, има два подхода за описание на осъзнаването - синтактичен и семантичен (припомняме, че "синтактиката е синтаксисът на знаковите системи, тоест структурата на комбинацията от знаци и правилата за тяхното формиране и трансформация, независимо от техните значения и функции на знаковите системи“, „семантика – изучава знаковите системи като средство за изразяване на смисъл, неин основен предмет е тълкуването на знаци и символни комбинации“). Основите на тези подходи са положени в математическата логика. Със синтактичния подход йерархията на представянията се описва изрично. Ако представянията са дадени чрез вероятностно разпределение, тогава йерархиите на представянията на определено ниво на йерархията съответстват на разпределенията върху продукта на множеството от природни състояния и разпределения, които отразяват представянията на предишни нива. Алтернатива е да се използват „формули“ (в логическия смисъл), т.е. правилата за трансформиране на елементи от оригиналния набор въз основа на използването на логически 10 Трябва да се отбележи, че йерархиите на представяне и общото знание са станали обект на изследване в теорията на игрите съвсем наскоро - пионерска е гореспоменатата книга на Д. Луис (1969) и статия на Р. Ауман (1976). Анализът на хронологията на публикациите (виж библиографията) показва нарастващ интерес към тази проблемна област. 32 операции и оператори от формата "играч i вярва, че вероятността за събитието ... е не по-малка от a" . В същото време знанието се моделира чрез изречения (формули), конструирани в съответствие с определени синтактични правила. В рамките на семантичния подход представянията на агентите се дават чрез вероятностни разпределения върху множеството от природни състояния. След това йерархията на представянията се генерира въз основа само на тези разпределения. В най-простия детерминиран случай знанието е представено от набор W от възможни стойности на несигурен параметър и дялове (Ri)i О N на този набор. Елементът на разделяне Ri, който включва q н W, представлява знанието на i-тия агент, т.е. множеството от стойности на неопределен параметър, които са неразличими от негова гледна точка предвид известния факт q . В . Особено внимание заслужават експерименталните изследвания на репрезентативните йерархии в – вижте прегледа в . Държани кратък преглед показва, че има две крайности. Първата „крайност“ е общото познание (заслугата на Дж. Харшани е, че той сведе цялата информация за агента, която влияе на поведението му, до единствената му характеристика – тип – и изгради равновесие (Байес-Неш) при хипотезата, че вероятностното разпределение на видовете са общоизвестни). Втората „крайност“ е безкрайна йерархия от последователни или непоследователни възгледи. Пример за последното е конструкцията, дадена в , която, от една страна, описва всички възможни байесови игри и всички възможни йерархии на представяния, а от друга страна (поради своята общост) е толкова тромава, че не позволяват конструктивно поставяне и решаване на конкретни проблеми. Повечето изследвания на осъзнаването са посветени на отговора на въпроса: в какви случаи йерархията на представителствата на агентите описва общото знание и/или отразява адекватно информираността на агентите. Зависимостта на решението на играта от крайната йерархия на последователни или непоследователни представяния на агенти (т.е. целият диапазон между двете "крайности", отбелязани по-горе) практически не е изследвана. Изключения са, на първо място, работата, в която равновесията на Bayes-Nash за тристепенни йерархии на непоследователни вероятностни представяния на двама агенти са изградени въз основа на предположението, че представянията на по-ниското ниво на йерархията съвпадат с представянията на предишното ниво – вижте също предположения от типа Pm и съответните равновесия в . Второ, третата глава на тази работа, която описва произволни (крайни или безкрайни, последователни или непоследователни) йерархии на "точкови" представяния, за които се конструира и изучава информационно равновесие - равновесието на рефлексивна игра (възможността и целесъобразността на обобщаването на получените резултати за случая на интервални или вероятностни представяния на агенти се обсъжда в заключението). По този начин както изследването на стратегическата рефлексия (Глава 2 от тази работа), така и изграждането на решение за рефлексивна игра, както и изследването на зависимостта на това равновесие от йерархията на представянията на агентите (Глава 3 от тази работа ), са уместни. ГЛАВА 2. СТРАТЕГИЧЕСКА РЕФЛЕКСИЯ Тази глава изследва модели на теория на игрите на стратегическа рефлексия. В раздел 2.1 ние изучаваме модела на стратегическо отражение в игра за двама души, което в раздел 2.2 ни позволява да решим проблема с максималния целесъобразен ранг на стратегическо отражение в биматрични игри. Раздел 2.3 е посветен на обсъждането на ограничеността на ранга на отражение, генериран от ограничените способности на човек да обработва информация. 2.1. СТРАТЕГИЧЕСКА РЕФЛЕКСИЯ В ИГРИ ЗА ДВАМА ЛИЦА Нека разгледаме последователно, в ред на повишаване на осведомеността, рефлексивните модели за вземане на решения в игрите за двама души. Нулев ранг на отражение. Нека разгледаме проблема с вземането на решение от агент в случай на пълно отсъствие на информация за състоянието на природата (напомняме, че предположението, че целевите функции и допустимите множества са общоизвестни, се счита за изпълнено). От една страна, изглежда разумно да се използва принципът за вземане на решения, основан на максималния гарантиран резултат, според който i-тият агент ще избере гарантираща (според природното състояние и действието на противника) стратегия ( 12) 1 xiг = arg max min min fi(q, xi , x-i). xi н X i q нW x -i н X -i може да изчисли гарантиращата стратегия на противника). Тогава най-добрият отговор е (13) 2 xiг = arg max min fi(q, xi, 1 x-г i). xi н X i q нW Но опонентът на разглеждания агент може да спори по подобен начин. Ако разглежданият агент допуска такава възможност, тогава неговата гарантираща стратегия ще бъде (14) 13) чрез замяна на индекса "i" с "i" и обратно. Веригата за увеличаване на „ранга на отражение“ (предположенията на агента относно ранга на отражение на опонента) може да бъде продължена допълнително (вижте аналогиите в динамичните модели, разгледани в ) чрез рекурсивно определяне (15) x-i i), k = 2, 3, . .., xi Î X i q ÎW g 1 i където x , i = 1, 2, се определят от (12). Наборът от действия от тип (15) ще се нарича набор от рефлексивни гарантиращи стратегии. Нека разгледаме илюстративен пример. Пример 1. Нека целевите функции на агентите имат формата: f1(x1, x2) = x1 – x12 /2x2, f2(x1, x2) = x2 – x22 /2(x1 + d), където d > 0. Като за допустими множества да предположим, че X1 = X2 = , 0< e < 1. Будем считать, что каждая из констант e и 35 d много меньше единицы. Гарантирующие стратегии агентов приведены в таблице 1. Табл. 1. Гарантирующие стратегии агентов в примере 1 k г k x1 1 e 2 e+d 3 e+d 4 e + 2d 5 e + 2d 6 e + 3d 7 e + 3d ... ... x2г e+d e+d e + 2d e + 2d e + 3d e + 3d e + 4d ... k Видно, что, во-первых, значения гарантирующих действий увеличиваются с ростом «ранга рефлексии». Во-вторых, различным «рангам рефлексии» агентов соответствуют в общем случае различные гарантирующие действия (отметим, что равновесием11 Нэша в данном примере является вектор (1; 1)) ·12. Вопрос о том, какое действие следует выбирать агенту, остается открытым. Единственно, можно констатировать, что, обладая информацией только о множестве возможных значений состояния природы, i-ый агент может выбирать одно из действий k xiг, i = 1, 2; k = 1, 2, ..., определяемых выражениями (12) и (15). Доопределить рациональный выбор агента в рассматриваемой модели можно следующим образом. Если агенту неизвестна целевая функция оппонента (что исключено в рамках предположения о том, что целевые функции и допустимые множества являются общим знанием), то единственным его рациональным действием является выбор (12), то есть классический МГР. В рамках введенных предположений агенту известна целевая функция оппонента, а также известно, что оппоненту известен этот факт и т.д. Поэтому с точки зрения агента нерационально использование классического МГР, и ему следует рассчитывать, как минимум, что оппонент будет ис11 В качестве отступления заметим, что, если в рассматриваемом примере целевая 2 функция второго агента имеет вид f2(x1, x2) = x2 + x2 /2x1, то у него существует доминантная стратегия (равная единице), и последовательность гарантирующих стратегий первого агента стабилизируется уже на втором члене: 2 г i x x 2 xiг. Символ «·» здесь и далее обозначает окончание примера или доказательства. 36 = e, = 1/2. Если первый агент может вычислить доминантную стратегию своего оппонента, то представляется рациональным выбор им действия 12 г 1 i пользовать МГР, что приведет к выбору 2 xiг. Но, опять же, в силу того, что целевые функции являются общим знанием, агент может предположить, что такой ход его рассуждений может быть восстановлен оппонентом, что сделает целесообразным выбор 3 xiг и т.д. до бесконечности. Следовательно, с точки зрения агента остается неопределенность относительно «ранга рефлексии» оппонента13. Относительно этого параметра он не имеет никакой информации (если у агента имеются некоторые убеждения по этому поводу, то может реализоваться соответствующее субъективное равновесие), что делает рационално използванегарантиран резултат според „ранга на отражение” на опонента: (16) x'i = arg max min min fi(q, xi, j x-i i). xi н X i j =1, 2,... q нW Обърнете внимание, че, първо, x’i може да се различава от класическата гарантираща стратегия 1 xiг, дефинирана чрез израз (12). Второ, когато се използва стратегия (16), фактът, че опонентът има доминираща стратегия, ще бъде взет предвид от агента (вижте бележката под линия в пример 1). Таблица 2 показва стойностите на целевата функция на първия агент в пример 1 в зависимост от "ранга на отражение" на противника и съответните действия на противника. Може да се види, че при използване на стратегия (16) печалбата на i-тия агент е равна на e + d, което надвишава печалбата e, получена при използване на класическия MHR. Раздел. 2. Печалбите на първия агент в примера + 4d e+d e+d e + 2d e + 2d e + 3d e + 3d e + 4d 13 С други думи, оригиналната игра може да бъде заменена с игра, в която агентите избират своите рангове за отражение. За нова игра могат да се конструират и рефлексивни аналози и т.н. до безкрайност (вижте примери: „Дузпа“ – във въведението, „Криеница“ и „Разрушаване на скъперник“ – в раздел 2.2). Един от възможните начини за справяне с такава "безкрайност" е използването на гарантиран резултат според ранга на отражение на противника. Друг възможен начин, ефективен за крайни игри, е да се определи максимално целесъобразният ранг на рефлексия на агентите – вижте раздел 2.2. 37 По този начин в разглеждания модел може да се счита за рационално използването на стратегии (15) или (16) от агента. Първият ранг на отражение. Да предположим сега, че агентът има определена информация за състоянието на природата, която смята за вярна, и нищо повече не му е известно със сигурност. В рамките на съществуващата несигурност, поради принципа на детерминизма, агент, извършващ стратегическа рефлексия, има две алтернативи – или да приеме, че опонентът му не разполага с информация, или да приеме, че последният разполага със същата информация като себе си14. Ако агентът не въведе никакви предположения относно осъзнаването и принципите на поведение на опонента, тогава той е принуден да приложи принципа на максималния гарантиран резултат (MGR) - без допълнителни (в сравнение с модела на нулевия ранг на отражение, разгледан по-горе) към агента15 е добавена информация за противника – тоест да разчита на най-лошия за него избор на втория агент от множеството стратегии от тип (16). Гаранционната стратегия ще бъде: (17) xi (qi) = arg max min fi(qi, xi, j x-i i). xi н X i j =1, 2,... Забележете, че намирайки се в информационната ситуация, съответстваща на разглеждания модел, изчислявайки (17), агентът счита опонента за намиращ се в информационната ситуация, съответстваща на предходния модел. Този общ принцип - разполагайки с някаква информация, агентът може да счита, че опонентът има или същия, или един по-нисък ранг на рефлексия - ще бъде използван в редица други модели за рефлексивно вземане на решения. Ако първият агент вярва, че опонентът му има същата информация като него (вторият агент може да разсъждава по подобен начин - вижте предположение P1 в ), тогава той изчислява субективната 14 Този принцип (и неговите обобщения) ще се използва широко по-долу при определяне на крайна информация структури - наистина, притежавайки информация Ii, i-тият агент може, в случай на несигурност, да припише на други агенти само осъзнаването, което е в съответствие с Ii. 15 Разбира се, агентът може да предположи, че опонентът разполага с някаква информация, но тъй като тази информация не се появява в модела, ние няма да разглеждаме подобни предположения. 38 равновесие (т.е. „равновесието на Наш“ за съответното субективно* * описание на играта) EN(q1) = ((x11 (q1), x12 (q1))) от следната форма: * * * (18 ) " x1 н X1 f1 (q1, x11 (q1), x12 (q1)) ³ f1(q1, x1, x12 (q1)), * * * " x2 Î X2 f2(q1, x11 (q1), x12 ( q1)) ³ f1( q1, x11 (q1), x2). По същество горните системи от неравенства отразяват изчисляването от първия агент на „своето“ равновесие на Наш и избора на съответната координата на това равновесие. В общия случай агентът и неговият опонент ще изчислят различни равновесия - възможно е съвпадение, ако съзнанието е такова, че xij* (qi) = x*jj (qj), i, j = 1, 2. Така рационалното в моделът на първия ранг на отражение може да се счита за избора на агента или на рефлексивна гарантираща стратегия (17), или на субективно равновесие (18). Субективното равновесие (18), определено от първия агент, може условно да бъде изобразено като графика с два върха x12 x1 us x1 и x12, съответстващи на първия агент и неговите идеи за втория агент16 (виж Фиг. 1. Субективен nok 1). Входящите стрелки в равновесие в модела на първия отразяват тази информация от стратегически ранг, която се използва от отраженията на всеки от агентите за противника. Вторият ранг на отражение. В модела на втория ранг на отражение i-тият агент има информация за идеите на опонента qij за състоянието на природата и за собствените си идеи qii за състоянието на природата (ще приемем, че qi = qii - вижте аксиомата за автоинформация по-долу ). Агентът може да очаква, че опонентът му ще избере гарантираща (в рамките на познаването на qij) стратегия. Тогава най-добрият отговор е 16 Такива агенти, които съществуват в представянията на други агенти, се наричат агенти-фантоми. 39 (19) 2 xiг = arg max fi(qi, xi, x-г i (qij)), xi н X i г -i където x (qi,-i) се определя от (17). В допълнение към гарантиращата стратегия (19), първият агент може да изчисли субективното равновесие * * EN(q1, q12) = ((x11 (q1, q12), x12 (q1, q12))) от следната форма: * * * (q1,q12) , x12 (q1,q12)) ³ f1(q1, x1, x12 (q1,q12)), (20) " x1 н X1 f1(q1, x11 * * * " x2 н X2 f2 (q12, x121 (q1, q12), x12 (q1,q12)) ³ f2(q12, x121 (q1,q12), x2), * * * " x1 н X1 f1(q12, x121 (q1,q12), x12 (q1,q12)) ³ f2(q12, x1, x12 (q1,q12))). (19) или субективно равновесие (20). Имайте предвид, че първите две системи от неравенства в (20) отразяват равновесието на Неш от гледната точка x12 x1 на първия агент, а втората и третата система от неравенства отразяват равновесието на Наш, което вторият агент трябва да определи от гледната точка на първия агент - вж. графика на фигура 3, в която пунктираната линия е кръгла Фиг. 3. Субективният "модел" на втория агент, който първият агент използва при равновесие в модела за вземане на решения RDM2. Анализът на най-простите модели на стратегическа рефлексия на първите няколко ранга показва, че в случай на няколко агенти и тяхната недостатъчна осведоменост, процесите на тяхното вземане на решения могат да се разглеждат независимо - всеки от тях моделира поведението на своите опоненти, т.е. е, той се стреми да изгради свой собствен затворен модел на играта (вижте обсъждането на разликите в субективното и обективното описание на играта в ). При общото познание субективните модели съвпадат. 40 По-горе разгледахме отражението на нулевия, първия и втория ранг. Увеличаването на ранговете на отражение може да се извърши допълнително по аналогия. Съществени във всички модели са предположенията на агента за това какъв ранг на рефлексия има неговият опонент, т.е. всъщност рангът на рефлексия на агента се определя от това какъв ранг на рефлексия той приписва на опонента си. На агента не могат да бъдат предложени априори разумни препоръки, ограничаващи нарастването на ранга на собственото отражение. От тази гледна точка може да се каже, че няма универсална концепция за равновесие за игри със стратегическо отражение. В този случай единственият изход е да се използва или MHR според ранговете на рефлексия на опонента, или субективно равновесие, при което всеки агент въвежда определени допускания за ранга на рефлексия на противника и избира своето действие, което е оптимално в рамките на тези допускания. Затова ще съсредоточим основното си внимание върху изследването на случаите, при които рефлексивният ранг не расте неограничено. Има две причини, поради които степента на отражение може да бъде ограничена. Първо, нецелесъобразно е да се повишава рангът на рефлексия над определен от гледна точка на печалбата на агента (когато по-нататъшното увеличаване на ранга на рефлексия със сигурност не води до увеличаване на печалбата). Второ, способността на човек да обработва информация е ограничена и безкрайният ранг на отражение не е нищо повече от математическа абстракция. Ето защо в следващите раздели на тази глава са представени модели, които отчитат и двете причини - в раздел 2.2, използвайки примера на биматрични игри, се определя максималният целесъобразен ранг на стратегическо отражение, а в раздел 2.3 ролята на на информационните ограничения се изследват. 2.2. ОТРАЖЕНИЕ В БИМАТРИЧНИТЕ ИГРИ Основната идея, развита в този раздел, е, че в биматричните игри17, в които няма равновесие на Наш или в които, като се има предвид съществуващото равновесие на Наш, агентите избират субективни гарантиращи стратегии (вж. 17 Припомнете си, че крайните игри за две лица се наричат биматрични игри. 41 от предишния раздел на този документ), изплащането на всеки от агентите зависи както от неговия ранг на рефлексия, така и от ранга на рефлексия на противника. Освен това е показано, че неограниченото увеличаване на ранга на стратегическо отражение не води до увеличаване на печалбата. Да преминем към формално описание. Да разгледаме биматрична игра18, в която печалбите на първия и втория агент са дадени от матриците A = ||aij|| и B = ||bij|| размери n ´ m, съответно. Означаваме19 I = (1, 2, …, n) – множеството от действия на първия агент (избиране на ред), J = (1, 2, …, m) – множеството от действия на втория агент (избиране на колона). В разглежданата игра гарантиращите стратегии на агентите са както следва: i0 Î Arg max min aij, j0 Î Arg max min bij. iОI jОJ jОJ iОI Нека въведем следните допускания. Нека матриците на изплащане са такива, че всяко действие на всеки агент е най-добрият отговор на някакво действие на опонента и нека в допълнение най-добрият отговор на всяко действие на опонента е уникален (ако има няколко най-добри отговора, тогава ние може да въведе правило, което допълнително определя избора на агента).20 Следователно, когато определяте най-добрите отговори, вместо изразите “i… О Arg max …” и iОI “j… О Arg max …”, можете да използвате, съответно изразите jОJ “i… = arg max …” и “j… = arg max …”. iОI jОJ Нека a0 = max min aij, b0 = max min bij е максималното iОI jОJ jОJ iОI 18 Тъй като матричните игри (антагонистични крайни игри на две лица) са специален случай на биматрични игри, всички резултати, представени в този раздел, са валидни и за матрични игри. 19 Да се надяваме, че използването на едно и също (исторически установено) обозначение за информационната структура и набора от действия на първия агент няма да доведе до объркване. 20 Ако тези допускания бъдат изоставени, тогава всички резултати, получени в този раздел, ще останат валидни, тъй като въведените допускания позволяват да се получи горна оценка за максималния целесъобразен ранг на стратегическо отражение. 42 Нека дефинираме рефлексивна биматрична игра MGkl (матрична игра) като биматрична игра с матрици A и B, в която първият и вторият агент имат рефлексивни рангове, равни съответно на k и l, k, l О А, където А е набор от естествени числа. Нека изясним какво ще се разбира под ранг на отражение (по-точно под ранг на стратегическо отражение) в биматричните игри. В биматрица (и не само биматрица - вижте. ) в игрите изборът на действия от агентите може да се извърши въз основа на познаването на ранговете на рефлексия на противника. Ранговете на отражение се определят както следва. „Един агент има нулев ранг на отражение, ако знае само матрицата на плащанията. Един агент има първи ранг на рефлексия, ако вярва, че опонентите му имат нулев ранг на рефлексия, тоест знаят само матрицата на изплащане. Като цяло, агент с k-ти ранг на рефлексия приема, че опонентите му имат k-1-ви ранг на рефлексия. Той прави необходимите разсъждения за тях при избора на стратегия и избира своята стратегия въз основа на познаване на матрицата на печалбите и екстраполация на действията на опонентите си. Да вземем илюстративен пример. Пример 2 (Криеница) . Първият агент се крие в една от няколко стаи с различно осветление, а другият агент трябва да избере стаята, в която ще го търси. Степените на осветеност са известни и на двата агента. Стратегиите на агентите са както следва. Търсещият, ceteris paribus, предпочита да търси там, където е по-леко (там е по-лесно да се намери). Криейки се ясно, че в по-тъмна стая шансовете да го намерите са по-малки, отколкото в осветена. Увеличаването на ранга на отражение означава, че за агента става ясно, че това е ясно за неговия опонент и т.н. Нека представим рефлексивните рангове на агентите и съответните действия за избор на стаи под формата на таблица 3. Таб. 3. Ранг на рефлексия на агентите и съответните действия за избор на стаи Ранг на рефлексия на агент с изключение на най-светлия Всеки, с изключение на най-тъмния Най-лек Вижда се, че след втория ранг на рефлексия целият набор от разрешени действия е изчерпан , а след третия ранг на размисъл започват да се повтарят стратегиите за избор на стая. Този факт беше илюстрация на факта, че в играта на двама души повишаването на степените на отражение над определена цел не дава нищо ново, въпреки че субективното увеличаване на сложността може да продължи. Несъответствието между ранговете на отразяване на успеха на дейността е следното. Нека криещият се има ранг 0 (скрива се в най-тъмната стая). Ако в същото време търсещият има ранг 1, тогава той винаги печели (търси в най-тъмната стая). Но ако търсачът има 3-ти ранг (търси във всяка стая, с изключение на най-тъмната), тогава той винаги губи от криещия се с 0-ти ранг, защото, както си спомняме, той се крие в тази много тъмна стая, където търсачът, след поредица от отразяващи разсъждения, никога няма да изглежда. Следователно е невъзможно да се каже недвусмислено, че по-високият ранг на отражение е по-добър от по-ниския. Предпочитанието на един или друг ранг се определя от взаимодействието му с рефлексния ранг на противника. · Тъй като в игрите с биматрици се предполага, че всеки агент има някакво убеждение относно ранга на рефлексия на опонента, това позволява използването на понятието за субективна гарантираща стратегия. Нека дефинираме субективни гарантиращи стратегии в биматричната игра MGkl: (21) ik = arg max aijk -1 , jl = arg max bil -1 j , k, l Î À. iнI jнj Така играта MG00 съвпада с оригиналната игра, а "равновесието" в играта MGkl е (aik jl ; bik jl), k, l н └. Отбелязваме два интересни факта. Първо, печалбата на който и да е агент в играта MGkl за k ³ 1, l ³ 1 може да се окаже по-малка от максималната гарантирана печалба (вижте примера „Дрифт на скъперник“ по-долу). Второ, присвояването44 на опонент на ранг на рефлексия с едно по-малко от неговия собствен е противоречиво, тъй като в играта MGkl за k ³ 1, l ³ 1 това означава, че l = k – 1 и k = l – 1 трябва да бъдат изпълнени едновременно, което очевидно е невъзможно. Следователно равновесието в една рефлексивна игра е по същество субективно и априори агентите не знаят каква игра играят (ранговете на рефлексия и на двамата агенти не могат да бъдат общоизвестни, тъй като това би противоречало на самата дефиниция на ранга на рефлексия). Следователно, обещаваща посока за бъдещи изследвания е изследването на отражението на информацията върху ранговете на отражение на агентите в биматричните игри. Вътрешната непоследователност на стратегическото отражение в биматричните игри може да бъде илюстрирана със следната схема: Фигура 4а показва субективно описание на играта MGkl по отношение на графиката на рефлексивната игра от гледна точка на първия агент, Фигура 4b показва субективно описание на същата игра от гледна точка на втория агент. i0 j0 i0 j0 i1 j1 i1 j1 … … ik-2 jk-2 il-2 jl-2 ik-1 jk-1 il-1 jl-1 ik ? Ориз. 4а. Субективно описание на играта MGkl от гледна точка на първия агент? jl Фиг. 4б. Субективно описание на играта MGkl от гледна точка на втория агент 45 Гледайки малко напред (вижте раздел 3.4), отбелязваме, че графиката на рефлексивна игра има свойството, че броят на дъгите, влизащи във всеки от нейните върхове, трябва да бъде с едно по-малко от броя на агентите (т.е. в игри с биматрици е равно на едно). Субективните равновесни действия са показани с удебелен шрифт и водят до „равновесие“ (ik, jl). Действията ik-1 за първия агент и jl-1 за втория не се използват в съответните субективни описания на играта (виж по-долу). въпросителни знаци на фигура 4), тоест всеки от тях се оказва вътрешно отворен. След като завършихме краткото обсъждане на вътрешната непоследователност при определяне на ранга на стратегическо отражение в биматричните игри, нека се върнем към изследването на зависимостта на субективното равновесие и печалбите на агентите от техните рангове на отражение. Означаваме IK = ik , JL = jl , K = 0, 1, 2, …, U U k =0 ,1,...,K l =0 ,1,...,L L = 0, 1, 2, … . Под I¥ и J¥ имаме предвид съответните съюзи за всички рангове на рефлексия от нула до безкрайност. Ако един агент (или и двамата агенти) не знае ранга на рефлексия на опонента, тогава е разумно да се разгледа играта MG¥¥, в която всеки агент изчислява гарантиран резултат от ранга на рефлексия на противника. Въвеждаме гарантиращи стратегии, съответстващи на пълна несигурност относно ранга на рефлексия на опонента: (22) i¥ = arg max min aij, j¥ = arg max min bij. iОI jОJ ¥ jОJ iОI ¥ По подобен начин могат да се дефинират гарантиращи стратегии в рамките на информацията, че рангът на рефлексия на противника не надвишава известна стойност (т.е. първият агент вярва, че рангът на рефлексия на втория не е по-висок от L, а вторият агент смята, че рангът на рефлексия на първия не е по-висок от K ): (23) iL = arg max min aijl , jK = arg max min bik j . iОI lОJ L jОJ kОI K Забележете, че в (23), за разлика от (21), стратегията на всеки от агентите не зависи от собствения му ранг на рефлексия, а се определя от информацията за ранга на рефлексия на противника. Изразите (21)-(23) не изчерпват цялото разнообразие от възможни ситуации, тъй като например първият агент може да предположи, че вторият ще избере j¥ и тогава най-добрият му отговор ще бъде arg max aij¥ и скоро. Освен това, въпреки че само „силните“ агенти са способни да повишат ранга на отражение iÎI, интуитивно е ясно, че с нарастването на този ранг, тоест с удължаването на веригата от разсъждения „Мисля, че той мисли, че аз помислете ..." има опасност "да бъдете прекалено умни". Силен агент с висок ранг на отражение надценява опонента, като се предполага, че той също има висок ранг на отражение. Но, ако рангът на опонента е наистина нисък, това води до загуба от по-слаб противник - вижте примерите "Криеница" и "Разрушаване на скъперник". Следователно е необходимо систематично изследване на съотношението на печалбите на агентите в зависимост от вида игра, която се играе. Представяме резултатите от това проучване. От съществено значение за нашето разглеждане е наличието или отсъствието на равновесие на Наш, както и изборът от агентите (и използването при конструиране на субективни равновесия) на гарантиращи стратегии или действия, които са равновесие на Наш. По този начин са възможни следните четири ситуации. Вариант 1 (равновесието на Неш в чистите стратегии съществува и агентите се ръководят от действията на равновесието на Наш). Нека (i*; j*) са числата на чистите стратегии за равновесие на Наш. Тогава, ако по аналогия с (21) приемем, че в рефлексивна игра всеки агент избира своя най-добър отговор на избора на противника за съответния равновесен компонент, тогава получаваме, че (24) ik = arg max aij* , jl = arg max bi* j , k, l О А. iнI jнJ От (24) по силата на дефиницията на равновесието на Наш следва, че ik = i*, jl = j*, k, l н └, т.е. в рамките на вариант 1 стратегическото отражение е безсмислено21 ( с възможно изключение на случая, когато най-добрите отговори са дефинирани по такъв начин, че агентите избират компоненти от различни равновесия на Наш в случая, когато има няколко от тях). Вариант 2 (равновесието на Неш съществува в чистите стратегии, но агентите избират гарантиращи стратегии (21)). 21 Под безсмислието на стратегическото отражение в биматричните игри имаме предвид случая, когато равновесието в рефлексивна игра с всяка комбинация от ненулеви рефлексивни рангове на агенти съвпада с равновесието в оригиналната игра. 47 Ако гарантиращите стратегии образуват равновесие на Наш (какъвто е случаят в антагонистични игри със седлова точка), тогава попадаме в условията на вариант 1. Следователно стратегическото размишление има смисъл само ако в рамките на вариант 2, Равновесието на Неш не съвпада с равновесието при гарантиращите стратегии ( i0, j0). Вариант 3 (няма равновесие на Неш в чистите стратегии и агентите се ръководят от смесени стратегии на равновесие на Неш22). Ако агентите, когато определят своите най-добри отговори по аналогия с (24), разчитат на опонента, който избира смесени стратегии за равновесие на Неш, тогава е лесно да се покаже, че максималната очаквана печалба на всеки агент ще бъде постигната, когато той също избере съответното равновесие на Неш смесена стратегия. Следователно в рамките на вариант 3 всяко равновесие съвпада с равновесието на Неш при смесени стратегии, тоест стратегическото размишление в този случай е безсмислено. Вариант 4 (няма равновесие на Неш в чистите стратегии и агентите се ръководят от гарантиращи стратегии (21)). В четвъртия вариант анализът на отражението очевидно има смисъл. По този начин, след като разгледахме всичките четири възможни варианта на поведение на агентите, получаваме, че валидността на следното твърдение е обоснована. Твърдение 1. Стратегическото отражение в биматричните игри има смисъл, ако агентите използват субективни гарантиращи стратегии (21), които не са равновесие на Наш. Означаваме (25) Kmin = min (K н └ | IK = I¥), (26) Lmin = min (L н └ | JL = J¥). По същество Kmin и Lmin са минималните рангове на рефлексия на първия и втория агент, при които техните набори от субективни равновесни действия съвпадат с максимално възможните набори от субективни гарантиращи стратегии в разглежданата игра. 22 Спомнете си, че в биматричните игри равновесието на Неш в смесените стратегии винаги съществува. 48 По дефиниция " K, L О └ IK Н IK+1, JL Н JL+1. Следователно " K ³ Kmin IK = I¥, " L ³ Lmin JL = J¥. Ако рефлексивният ранг на първия и втория агент не надвишава съответно K и L, тогава наборите от субективни гарантиращи стратегии на първия и втория агент от гледна точка на противника са равни съответно на IL-1 и JK-1. Така че, увеличаване на рефлексията ранговете могат да доведат до разширяване на набора от субективни гарантиращи стратегии, ако (27) L – 1< Kmin, (28) K – 1 < Lmin. Отметим, что с рассматриваемой точки зрения максимальный целесообразный ранг рефлексии23 первого агента зависит от свойств субъективных гарантирующих стратегий второго агента (см. (28)), и наоборот. С другой стороны, агенту не имеет смысла увеличивать ранг своей рефлексии, если он уже «исчерпал» собственное множество возможных субъективных равновесных действий. С этой точки зрения увеличение рангов рефлексии может приводить к расширению множества субъективных гарантирующих стратегий, если (29) K < Kmin, (30) L < Lmin. Объединяя (28) и (29), а также (27) и (30), получаем, что первому агенту не имеет смысла увеличивать свой ранг рефлексии выше (31) Kmax = min {Kmin, Lmin + 1}, а второму агенту не имеет смысла увеличивать свой ранг рефлексии выше (32) Lmax = min {Lmin, Kmin + 1}. Обозначим (33) Rmax = max {Kmax, Lmax}. Таким образом, доказана справедливость следующего утверждения. 23 Под максимальным целесообразным рангом рефлексии агента будем понимать такое его значение, что увеличение ранга рефлексии выше данного не приводит к появлению новых субъективных (с точки зрения данного агента) равновесий. 49 Утверждение 2. Использование агентами в биматричной игре рангов стратегической рефлексии выше, чем (31) и (32), не имеет смысла24. Утверждение 2 дает возможность в каждом конкретном случае (для конкретной разыгрываемой игры) каждому агенту (и исследователю операций) вычислить максимальные целесообразные ранги стратегической рефлексии обоих агентов. Так как величины (31)-(33) зависят от игры (матриц выигрышей), то получим оценки зависимости этих величин от размерности матриц выигрышей (очевидно, что |I¥| £ |I| = n, |J¥| £ |J| = m, а для игр размерности два справедлива более точная оценка – см. утверждение 3). Для этого введем в рассмотрение граф наилучших ответов. Графом наилучших ответов G = (V, E) назовем конечный двудольный ориентированный граф, в котором множество вершин V = I È J, а дуги проведены от каждой вершины (соответствующей действию одного из агентов) к наилучшему на нее ответу оппонента. Опишем свойства введенного графа: 1. Из каждой вершины множества I выходит дуга в вершину множества J (у второго агента есть наилучший ответ на любое действие первого агента), из каждой вершины множества J выходит дуга в вершину множества I (у первого агента есть наилучший ответ на любое действие второго агента). 2. В каждую вершину множества V входит ровно одна дуга (так как каждое действие каждого агента является наилучшим ответом на какое-либо действие оппонента). 3. Если любой путь дважды прошел через одну и ту же вершину, то по определению наилучших ответов его часть является контуром, и в дальнейшем новых вершин в этом пути не появится. 4. Максимальное число попарно различни дейности на първия агент, съдържащ се в пътя, започващ от върха i0, е равно на min (n; m + 1). 5. Максималният брой по двойки различни действия на втория агент, съдържащ се в пътя, започващ от върха i0, е равен на min (n; m). 24 Тоест, за всеки ранг на отражение, който надхвърля посочените оценки, има ранг на отражение, който удовлетворява посочените оценки и води до същия субективен баланс. 50 6. Максималният брой по двойки различни действия на първия агент, съдържащ се в пътя, започващ от върха j0, е равен на min (n; m). 7. Максималният брой по двойки различни действия на втория агент, съдържащи се в пътя, започващ от върха j0, е min (n + 1; m). Разкритите свойства на графиката на най-добрите отговори позволяват да се получат горни граници за целесъобразните рангове на стратегическо отражение в биматричните игри. Твърдение 3. В 2 ´ 2 игри с биматрици, където няма равновесие на Неш, I¥ = I, J¥ = J. Доказателство. Да разгледаме произволна игра с биматрици 2 ´ 2, в която няма равновесие на Наш. Нека X1 = (x1, x2), X2 = (y1, y2). Нека изчислим гарантиращите стратегии i0 и j0. За определеност задаваме x1 = i0, y1 = j0. Има две взаимно изключващи се опции: j1 = y1 и j1 = y2. Ако j1 = y1, тогава i1= i2 = x2 (в противен случай (x1, y1) е равновесие на Наш). Тогава j2 = j3 = y2 (в противен случай (x2, y1) е равновесие на Наш). Следователно i3 = i4 = x1 (в противен случай (x2, y2) е равновесие на Наш). Тоест в първия случай I¥ = I, J¥ = J. Ако j1 = y2, тогава i2 = x2 (в противен случай (x1, y2) е равновесието на Наш). Тогава j3 = y1 (в противен случай (x2, y2) е равновесие на Наш). Следователно i4 = x1 (в противен случай (x2, y1) е равновесие на Наш). Тоест, във втория случай също I¥ = I, J¥ = J. · Качествено, Твърдение 3 означава, че в 2 ´ 2 биматрична игра, в която няма равновесие на Наш, всеки резултат може да бъде реализиран като субективно равновесие. Обещаваща посока за по-нататъшни приложни изследвания може да се счита за анализ на субективни равновесия в основни обикновени игри на две лица 2 ´ 2 (припомнете си, че има 78 структурно различни обикновени игри, т.е. игри, в които и двата агента, всеки от които има две допустими действия, може стриктно да подреди собствените си ползи от най-доброто към най-лошото). Твърдение 3 предполага, че може би във всички игри с биматрици, в които няма равновесие на Наш, I¥ = I, J¥ = J. където върховете i0 и j0 са защриховани. I¥ I J¥ J 5. Пример за графика на най-добрите отговори в 4 ´ 4 биматрична игра, в която I¥ Ì I, J¥ Ì J J¥, ние изследваме колко бързо (при какви минимални рангове на стратегическо отражение) тези комплекти са „покрити“ ” чрез съответните субективни равновесия. Третото свойство на графиката на най-добрите отговори означава, че в биматрична игра целесъобразното увеличаване на ранга на стратегическо отражение, започвайки от втората стъпка, задължително променя набора от стратегии, които трябва да бъдат субективно гарантирани при рангове на отражение по-малко от или равен на този. Тъй като в биматричните игри наборите от допустими действия са крайни, тогава наборите I¥ и J¥ са крайни, следователно, поради свойства 4-7 на графиката на най-добрите отговори, стойностите Lmin и Kmin също са крайни, това означава, че в биматричните игри неограниченото увеличаване на ранга на отражение е очевидно нецелесъобразно. Отново, поради ограничеността на допустимите набори, количествата (31) и (32), които определят максималните целесъобразни рангове на отражение, могат лесно да бъдат изчислени за всяка конкретна биматрична игра. Но свойствата на графиката на най-добрите отговори позволяват да се получат конкретни оценки отгоре на максималните целесъобразни рангове на рефлексия. 52 В биматрична игра n ´ m, гарантираните оценки25 за стойностите (31)-(33) очевидно ще зависят от размерността на матриците на изплащане, т.е. Kmin = Kmin(n), Lmin = Lmin(m ). Следователно, (34) Kmax(n, m) = min (Kmin(n), Lmin(m) + 1), (35) Lmax(n, m) = min (Lmin(m), Kmin(n) + 1 ). След това изразът (33) ще приеме формата: (36) Rmax(n, m) = max (Kmax(n, m), Lmax(n, m)). От свойства 4-7 на графиката на най-добрите отговори и изрази (34)-(36) следва следното твърдение. Твърдение 4. В биматрични игри n ´ m максималните целесъобразни рангове на стратегическо отражение на първия и втория агент удовлетворяват следните неравенства (37) Kmax(n, m) £ min (n, m + 1), (38) Lmax (n, m) £ min (m, n + 1), (39) Rmax(n, m) £ max (min (n, m + 1), min (m, n + 1)). Следствие 1. В биматрична игра n ´ n, n ³ 2, максималният целесъобразен ранг на стратегическо отражение на всеки агент26 е Rmax(n, n) £ n. За случая на две допустими действия (поради преобладаването му в приложените модели) формулираме отделно следствие. Следствие 2. В биматрична игра 2 ´ 2 максималният целесъобразен ранг на отражение не надвишава две. Още веднъж отбелязваме, че оценките (37)-(39) са горни оценки - съществуването на няколко най-добри отговора на едно и също действие, наличието на равновесие на Наш в оригиналната игра или доминирани стратегии може да доведе до

Руската академия на науките В.А. Трапезникова Д.А. НОВИКОВ, А.Г. CHKHARTISHVILI REFLECTIVE GAMES SINTEG Москва - 2003 UDC 519 BBC 22.18 N 73 Новиков Д.А., Чхартишвили А.Г. Reflexive H 73 игри. М.: Синтег, 2003. - 149 с. ISBN 5-89638-63-1 Монографията е посветена на обсъждането на съвременните подходи към математическото моделиране на отражението. Авторите въвеждат нов клас теоретико-игрови модели – рефлексивни игри, които описват взаимодействието на субекти (агенти), които вземат решения въз основа на йерархия от идеи за съществени параметри, идеи за репрезентации и т.н. Анализът на поведението на фантомни агенти, които съществуват в представянията на други реални или фантомни агенти и свойствата на информационна структура, която отразява взаимното съзнание на реални и фантомни агенти, ни позволява да предложим информационно равновесие като решение на рефлексивна игра , което е обобщение на редица добре известни концепции за равновесие в некооперативните игри. Рефлективните игри позволяват: - да се моделира поведението на рефлективни субекти; - да се изследва зависимостта на печалбите на агентите от ранговете на тяхното отражение; - поставят и решават проблеми на рефлексивния контрол; - еднакво описват много явления, свързани с рефлексията: скрит контрол, контрол на информацията чрез медиите, рефлексия в психологията, произведения на изкуството и др. Книгата е адресирана както до специалисти в областта на математическото моделиране и управление на социално-икономически системи, така и като студенти и специализанти. Рецензенти: д-р на техническите науки, проф. В.Н. Бурков, д-р на техническите науки, проф. А.В. Щепкин УДК 519 ББК 22.18 N 73 ISBN 5-89638-63-1 Чхартишвили, 2003 2 СЪДЪРЖАНИЕ ВЪВЕДЕНИЕ ............................................ ...... ............................................ ..... .......... 4 ГЛАВА 1. Информация при вземане на решения .......................... ......... 21 1.1. Индивидуално вземане на решения: модел на рационално поведение......................................... ......................... ......................... ........................ ........................ ..... 21 1.2. Интерактивно вземане на решения: игри и равновесия .................................. 24 1.3. Общи подходи за описване на осъзнаването.................................................. ..... 31 ГЛАВА 2. Стратегическа рефлексия....... ................................ ................. 34 2.1. Стратегическа рефлексия в игрите за двама души .............................. .................. 34 2.2. Отражение в биматрични игри .............................................. ................ ........... 41 2.3. Ограничение на ранга на отражение ............................................ .................................. 57 ГЛАВА 3. Информационно отражение ............ .................. .................... 60 3.1. Информационно отражение в игрите за двама ............................................. ... 60 3.2. Информационна структура на играта ............................................. ................................. 64 3.3. Информационен баланс ................................................. ............................... 71 3.4. Графика на рефлексивна игра ............................................. .................................................. 76 3.5. Редовни структури за информираност ............................................. ............... 82 3.6. Рангът на отражението и информационното равновесие ............................................. ... 91 3.7. Светлоотразително управление ................................................. .................. ....................... 102 ГЛАВА 4. Приложни модели на рефлексивни игри ................................. 102 ............. 106 4.1 . Скрит контрол ................................................. .................. ................................ .. 106 4.2. Масмедиите и управлението на информацията ............................................. ................. ...... 117 4.3. Рефлексията в психологията ............................................. ........................................... 121 4.3.1. Психология на шахматното творчество............................................. 121 4.3 .2. Транзакционен анализ ................................................. ............................... 124 4.3.3. Прозорец на Джохари ................................................. .. ................................. 126 4.3.4. Модел на етичен избор ............................................. ................................... 128 4.4. Отражение в художествените произведения................................................. .. 129 ЗАКЛЮЧЕНИЕ ......................................................... ......................................................... 137 ЛИТЕРАТУРА .. ......................................................... ......................................................... ........ 142 3 - Малките лудуват на воля, това е тяхната радост! – Ти не си риба, откъде знаеш каква е нейната радост? „Ти не си аз, откъде знаеш какво знам и какво не знам?“ От една даоистка притча – Въпросът, разбира се, уважаеми архиепископе, е, че вие вярвате в това, в което вярвате, защото сте възпитани по този начин. - Може би така. Но остава фактът, че вие също вярвате, че аз вярвам в това, което вярвам, защото съм възпитан по този начин, поради причината, че вие сте възпитани по този начин. От книгата „Социална психология” на Д. Майерс на базата на йерархия от идеи за съществени параметри, идеи за възгледи и др. Отражение. Едно от основните свойства на човешкото съществуване е, че наред с естествената („обективна“) реалност съществува нейното отражение в съзнанието. В същото време между естествената реалност и нейния образ в съзнанието (ние ще разглеждаме този образ като част от специална - рефлективна реалност) има неизбежна пропаст, несъответствие. Целенасоченото изследване на този феномен традиционно се свързва с термина „рефлексия“, който във „Философския речник“ е дефиниран по следния начин: „РЕФЛЕКСИЯ (лат. reflexio – обръщане). Термин, означаващ отражение, както и изследване на познавателен акт. Терминът "отражение" е въведен от Дж. Лок; в различни философски системи (Дж. Лок, Г. Лайбниц, Д. Хюм, Г. Хегел и др.) имаше различно съдържание. Систематичното описание на рефлексията от гледна точка на психологията започва през 60-те години на XX век (училище 4 на V.A. Lefebvre). Освен това трябва да се отбележи, че има разбиране за отражение в различно значение, свързано с рефлекса - „реакцията на тялото към възбуждането на рецепторите“. В тази статия използваме първото (философско) определение за рефлексия. За да изясним разбирането за същността на рефлексията, нека първо разгледаме ситуацията с един субект. Той има представи за природната реалност, но може също така да осъзнава (отразява, отразява) тези идеи, както и да осъзнава осъзнаването на тези идеи и т.н. Така се формира отразяващата реалност. Рефлексия на субекта относно собствените му представи за реалността, принципите на неговата дейност и др. се нарича авторефлексия или рефлексия от първи вид. Трябва да се отбележи, че в повечето хуманитарни изследвания говорим преди всичко за авторефлексия, която във философията се разбира като процес на мислене на индивида за това, което се случва в неговия ум. Рефлексията от втория вид се осъществява по отношение на идеи за реалността, принципи на вземане на решения, саморефлексия и др. други субекти. Нека дадем примери за рефлексия от втория вид, илюстриращи, че в много случаи правилните собствени заключения могат да бъдат направени само ако заемем позицията на други субекти и анализираме техните възможни разсъждения. Първият пример е класическата игра с мръсни лица, понякога наричана проблемът с мъдреците и шапките или проблемът със съпрузите и неверните съпруги. Нека го опишем по-долу. „Нека си представим, че Боб и племенницата му Алис са в купето на викторианска карета. Лицата на всички са объркани. Въпреки това никой не се изчервява от срам, въпреки че всеки викториански пътник би се изчервил, знаейки, че другият го вижда мръсен. От това заключаваме, че никой от пътниците не знае, че лицето му е мръсно, въпреки че всеки вижда мръсното лице на неговия спътник. В това време кондукторът поглежда в купето и съобщава, че в купето има мъж с мръсно лице. След това Алис се изчерви. Осъзна, че лицето й е мръсно. Но защо тя разбра това? Не й ли каза Водачът това, което тя вече знаеше? 5 Нека проследим веригата от разсъждения на Алис. Алис: Да предположим, че лицето ми е чисто. Тогава Боб, знаейки, че един от нас е мръсен, трябва да заключи, че е мръсен и да се изчерви. Ако той не се изчерви, тогава моята предпоставка за моето чисто лице е невярна, лицето ми е мръсно и трябва да се изчервя. Диригентът добави информация за знанията на Боб към информацията, известна на Алис. Дотогава тя не знаеше, че Боб знае, че един от тях е мръсен. Накратко, съобщението на кондуктора превърна знанието, че в купето има човек с мръсно лице, във всеобщо знание. Вторият пример от учебника е проблемът с координираната атака; има близки до него проблеми относно оптималния протокол за обмен на информация - Игра с електронна поща и т.н. (вижте рецензии в ). Ситуацията е следната. Две дивизии са разположени на върховете на два хълма, а врагът е разположен в долината. Можете да спечелите само ако и двете дивизии атакуват врага едновременно. Генералът - командирът на първа дивизия - изпраща на генерала - командирът на втора дивизия - пратеник със съобщението: "Атакуваме призори." Тъй като пратеникът може да бъде прихванат от врага, първият генерал трябва да изчака съобщение от втория генерал, че първото съобщение е получено. Но тъй като второто съобщение също може да бъде прихванато от врага, вторият генерал трябва да получи потвърждение от първия генерал, че е получил потвърждение. И така до безкрайност. Задачата е да се определи след какъв брой съобщения (потвърждения) има смисъл генералите да атакуват врага. Изводът е следният: при описаните условия координирана атака е невъзможна и изходът е използването на вероятностни модели. Третият класически проблем е "проблемът с двама брокери" (вижте също спекулативни модели в ). Да предположим, че двама брокери, които играят на фондовата борса, имат свои собствени експертни системи, които се използват за подпомагане на вземането на решения. Случва се мрежовият администратор да копира незаконно и двете експертни системи и да продава експертната система на опонента си на всеки брокер. След това администраторът се опитва да продаде на всеки от тях следната информация - "Вашият опонент има вашата експертна система." След това администраторът се опитва 6 да продаде информация - "Опонентът ви знае, че имате неговата експертна система" и т.н. Въпросът е как брокерите трябва да използват информацията, която получават от администратора, и каква информация е уместна при коя итерация? След като завършихме разглеждането на примери за рефлексия от втори вид, нека обсъдим ситуациите, в които рефлексията е от съществено значение. Ако единственият рефлексивен субект е икономически агент, който се стреми да максимизира обективната си функция чрез избор на едно от етично приемливите действия, тогава естествената реалност влиза в обективната функция като параметър, а резултатите от рефлексията (репрезентации за репрезентации и т.н.) не са елементи на целевата функция. Тогава можем да кажем, че авторефлексията „не е необходима“, тъй като не променя действието, избрано от агента. Обърнете внимание, че зависимостта на действията на субекта от рефлексията може да се осъществи в ситуация, в която действията са етически неравностойни, тоест наред с утилитарния аспект има деонтологичен (етичен) - вижте. Икономическите решения обаче по правило са етично неутрални, така че нека разгледаме взаимодействието на няколко субекта. Ако има няколко субекта (ситуацията на вземане на решение е интерактивна), тогава целевата функция на всеки субект включва действията на други субекти, тоест тези действия са част от естествената реалност (въпреки че самите те, разбира се, се дължат на рефлексивна реалност). В същото време рефлексията (и следователно изследването на отразяващата реалност) става необходима. Нека разгледаме основните подходи за математическо моделиране на ефектите на отражение. Теория на играта. Формалните (математически) модели на човешкото поведение се създават и изучават повече от век и половина (виж преглед в ) и все повече се използват както в теорията на контрола, икономиката, психологията, социологията и др., така и при решаването на конкретни приложни проблеми.. Най-интензивно развитие се наблюдава от 40-те години на ХХ век – моментът на възникване на теорията на игрите, който обикновено се датира от 1944 г. (първото издание на книгата на Джон фон Нойман и Оскар Моргенщерн „Теория на игрите и икономическо поведение“ "). 7 Под играта в тази работа ще разбираме взаимодействието на страните, чиито интереси не съвпадат (имайте предвид, че е възможно друго разбиране на играта - като „вид непродуктивна дейност, чийто мотив не се крие в нейните резултати, а в самия процес“ – виж също , където концепцията за играта се тълкува много по-широко). Теорията на игрите е клон на приложната математика, който изучава моделите за вземане на решения в условията на несъответствие на интересите на страните (играчите), когато всяка страна се стреми да повлияе на развитието на ситуацията в свой собствен интерес. Освен това, терминът "агент" се използва за означаване на вземащия решение (играч). В тази статия разглеждаме некооперативни статични игри в нормална форма, тоест игри, в които агентите избират своите действия веднъж, едновременно и независимо. По този начин основната задача на теорията на игрите е да опише взаимодействието на няколко агенти, чиито интереси не съвпадат, а резултатите от дейността (печалба, полезност и т.н.) на всеки зависят в общия случай от действията на всички. Резултатът от такова описание е прогноза за разумен резултат от играта - така нареченото решение на играта (равновесие). Описанието на играта се състои в задаване на следните параметри: - набор от агенти; - предпочитания на агентите (зависимости на печалбите от действията): предполага се (и това отразява целенасочеността на поведението), че всеки агент е заинтересован от максимизиране на печалбата си; - набори от допустими действия на агенти; - информираност на агентите (информацията, с която разполагат в момента на вземане на решения относно избраните действия); - редът на функциониране (редът на ходовете - последователността на избор на действия). Относително казано, наборът от агенти определя кой ще участва в играта. Предпочитанията отразяват това, което агентите искат, наборите от позволени действия, какво могат да правят, осведомеността отразява това, което знаят, а редът на действие отразява, когато избират действия. 8 Изброените параметри определят играта, но те не са достатъчни, за да предскажат нейния изход - решението на играта (или равновесието на играта), т.е. набор от действия на агенти, които са рационални и стабилни от една точка на изглед или друг. Към днешна дата в теорията на игрите няма универсална концепция за равновесие – като се приемат определени предположения за принципите на вземане на решения от агентите, могат да се получат различни решения. Следователно основната задача на всяко изследване на теорията на игрите (включително и настоящата работа) е изграждането на равновесие. Тъй като рефлексивните игри се определят като такова интерактивно взаимодействие на агенти, в което те вземат решения въз основа на йерархията на техните представяния, осъзнаването на агентите е от съществено значение. Затова нека се спрем на качественото му обсъждане по-подробно. Ролята на осъзнаването. Общи познания. В теорията на игрите, философията, психологията, разпределените системи и други области на науката (вижте рецензията в ), не само вярванията на агентите относно основните параметри са важни, но и техните вярвания относно вярванията на другите агенти и т.н. Наборът от тези представяния се нарича йерархия от вярвания и се моделира в тази статия чрез дървото на информационната структура на рефлексивна игра (вижте раздел 3.2). С други думи, в ситуации на интерактивно вземане на решения (моделирани в теорията на игрите), всеки агент трябва да предвиди поведението на опонентите, преди да избере своето действие. За да направи това, той трябва да има определени идеи за визията на играта от противниците. Но опонентите трябва да направят същото, така че несигурността коя игра ще се играе създава безкрайна йерархия от представяния на участниците в играта. Нека дадем пример за йерархия на изгледи. Да предположим, че има двама агенти, A и B. Всеки от тях може да има свои собствени нерефлексивни идеи за неопределения параметър q, който ще наричаме състояние на природата (състояние на света). Означаваме тези представяния съответно с qA и qB. Но всеки от агентите в рамките на процеса на размисъл от първи ранг може да мисли за идеите на противника. Тези репрезентации (репрезентации от втори ред) се означават с qAB и qBA, където qAB са репрезентациите на агент A на репрезентациите на агент B, 9 qBA са репрезентациите на агент B на репрезентациите на агент A. втори ранг) може да мисли какви са идеите на опонента за неговия идеите са. Ето как се генерират представяния от трети ред, qABA и qBAB. Процесът на генериране на представяния от по-висок порядък може да продължи безкрайно (няма логически ограничения за увеличаване на ранга на отражение). Съвкупността от всички представяния - qA, qB, qAB, qBA, qABA, qBAB и др. - формира йерархия на възгледите. Специален случай на осъзнаване е, когато всички репрезентации, репрезентации за репрезентации и т.н. съвпадат до безкрайност – е общоизвестно. По-правилно, терминът "общоизвестен" е въведен, за да обозначи факт, който отговаря на следните изисквания: 1) той е известен на всички агенти; 2) всички агенти знаят 1; 3) всички агенти знаят 2 и т.н. ad infinitum Формалният модел на общото познание е предложен в и развит в много трудове - вж. Моделите на осъзнаването на агентите – йерархията на репрезентациите и общите знания – в теорията на игрите всъщност са изцяло посветени на тази работа, така че ще дадем примери, илюстриращи ролята на общите знания в други области на науката – философия, психология и др. (вижте също преглед ). От философска гледна точка общото знание беше анализирано в изследването на конвенциите. Помислете за следния пример. В Правилата за движение по пътищата е записано, че всеки участник в движението трябва да спазва тези правила, а също така има право да очаква другите участници в движението да ги спазват. Но другите участници в движението също трябва да са сигурни, че останалите спазват правилата и т.н. до безкрайност. Следователно съгласието за „спазване на правилата за движение“ трябва да е общоизвестно. В психологията съществува понятието дискурс - „(от латински discursus - разсъждение, аргумент) - вербално мислене на човек, опосредствано от минал опит; действа като процес на свързани логически 10