Ο ρόλος και η σημασία των αντανακλαστικών παιχνιδιών. Αντανακλαστικά επιχειρηματικά παιχνίδια

MAOU "Beloyarsk δευτεροβάθμιο σχολείο No. 1"

Το παιχνίδι

« μαγικό κλειδί"

MAOU "Beloyarsk δευτεροβάθμιο σχολείο No. 1"

Το παιχνίδι

"Μίλα ή Δράσε"

MAOU "Beloyarsk δευτεροβάθμιο σχολείο No. 1"

Το παιχνίδι

"Clean Board"

Παιχνίδι "μαγικό κλειδί"

Στόχοι:

    χτίσιμο ομάδας.

Το κοινό-στόχος: μαθητές 7-11 τάξεων, δάσκαλοι, γονείς.

Σχηματίστηκε UUD:

Περιεχόμενο

Πρέπει να πάρετε ένα συνηθισμένο κλειδί και να το δέσετε στην άκρη ενός πολύ μακρύ σχοινιού. Τα παιδιά στέκονται σε κύκλο και περνούν εναλλάξ το κλειδί με ένα σχοινί από το πάνω μέρος των ρούχων (ξεκινά από το λαιμό του σακακιού και βγαίνει από το κάτω μέρος). Έτσι, είναι όλοι δεμένοι μεταξύ τους. Ο οικοδεσπότης δίνει οδηγίες που όλοι πρέπει να ακολουθούν ταυτόχρονα - άλμα, οκλαδόν, ποδοπάτημα κ.λπ. Αφού βελτιωθεί αισθητά η διάθεση των συμμετεχόντων, είναι απαραίτητο να χαλαρώσετε ένας προς έναν. Μετά από αυτό, μπορείτε να κρεμάσετε το κλειδί σε εμφανές σημείο της τάξης, με την επιγραφή "το κλειδί που μας άνοιξε ο ένας στον άλλο".

Το παιχνίδι παίζεται καλύτερα πριν από ένα διάλειμμα ή μετά από μονότονη εργασία, καθώς το παιχνίδι προκαλεί συναισθηματική έξαρση.

Παιχνίδι Bluff Club

Στόχοι:

    μορφήingγενικές πνευματικές δεξιότητες·

    αύξηση της δημιουργικής δραστηριότητας και της δραστηριότητας αναζήτησης των παιδιών.

Το κοινό-στόχος: μαθητές των τάξεων 1-11.

Σχηματίστηκε UUD: θέμα, προσωπικός.

Περιεχόμενο

Μπορεί να πραγματοποιηθεί σε διαφορετικά στάδια του μαθήματος ή των τάξεων εξωσχολικές δραστηριότητες. Για το παιχνίδι, πρέπει να προετοιμάσετε ερωτήσεις που ξεκινούν με τις λέξεις "Πιστεύετε ...;"
Παραδείγματα ερωτήσεων ιστορίας:
1. Πιστεύεις ότι οι Σλάβοι, όταν έκοψαν ένα δέντρο, του ζήτησαν συγχώρεση και τον «τάισαν» αφήνοντας φαγητό στα κούτσουρα; +
2. Πιστεύετε ότι στην αρχαιότητα οι Σλάβοι είχαν ένα έθιμο: οι εχθροί μαγειρεύουν και τρώνε κουάκερ μαζί για να κάνουν ειρήνη, χωρίς αυτό η συνθήκη ειρήνης θα ήταν άκυρη; +
3. Πιστεύετε ότι ο Vladimir Monomakh ήταν εγγονός του πρίγκιπα του Κιέβου και της Ισπανίδας βασίλισσας; -
Οι ερωτήσεις προετοιμάζονται από τον ίδιο τον δάσκαλο ή δίνονται οδηγίες από τους μαθητές να το κάνουν αυτό.

Παιχνίδι "Clean Board"

Στόχοι:

    δημιουργία ενός άνετου περιβάλλοντος για την αποκάλυψη των νοητικών ικανοτήτων των παιδιών.

    οργάνωση της νοητικής δραστηριότητας, ο σχηματισμός δημιουργικής σκέψης.

    ικανότητα επικοινωνίας και αλληλεπίδρασης σε μια ομάδα, σεβασμό στις απόψεις των άλλων.

Το κοινό-στόχος: μαθητές των τάξεων 1-11.

Σχηματίστηκε UUD: γνωστική, προσωπική, επικοινωνιακή.

Περιεχόμενο

Με βάση το υλικό του θέματος που μελετάται, ο δάσκαλος καταρτίζει και κολλάει στον πίνακα ερωτήσεις που μπορούν να εκφραστούν τόσο με τη συνήθη μορφή όσο και σε σχέδιο, διάγραμμα, κομμάτι χάρτη κ.λπ. Κατά τη μελέτη νέου υλικού (ιστορία του δασκάλου, παρουσίαση, παρακολούθηση βίντεο κλιπ, μήνυμα μαθητή κ.λπ.), οι μαθητές συμμετέχουν στο παιχνίδι απαντώντας στις ερωτήσεις που τίθενται. Εάν οι μαθητές απαντήσουν σωστά στην ερώτηση, αυτή αφαιρείται από τον πίνακα. Ο στόχος αυτού του παιχνιδιού είναι να έχετε έναν καθαρό πίνακα μέχρι το τέλος του μαθήματος.

Οι εργασίες και οι ερωτήσεις πρέπει να γίνονται λαμβάνοντας υπόψη τα ηλικιακά χαρακτηριστικά.

Παιχνίδι "Μίλα ή ενεργώ"

(παραλλαγή του "μπουκάλι")

Στόχοι:

    αφαίρεση συναισθηματικής έντασης.

    σχηματισμός και ανάπτυξη δεξιοτήτων επικοινωνίας: ικανότητα επικοινωνίας και αλληλεπίδρασης σε μια ομάδα, σεβασμός των απόψεων των άλλων.

    χτίσιμο ομάδας.

Το κοινό-στόχος: μαθητές 7-11, δάσκαλοι, γονείς.

Σχηματίστηκε UUD: προσωπική, επικοινωνιακή.

Περιεχόμενο

Τα παιδιά κάθονται σε κύκλο, ένα μπουκάλι τοποθετείται στη μέση. Με κλήρωση επιλέγεται ο πρώτος συμμετέχων, ο οποίος περιστρέφει το μπουκάλι. Κάνει οποιαδήποτε ερώτηση σε αυτόν που δείχνει ο λαιμός του μπουκαλιού. Πρέπει να απαντήσει στην ερώτηση την αλήθεια ή να ολοκληρώσει την εργασία που έδωσε ο πρώτος συμμετέχων. Το ενδιαφέρον είναι ότι ο συμμετέχων δεν γνωρίζει ούτε την ερώτηση ούτε την εργασία. Πρώτα πρέπει να πείτε: "μίλα ή δράσε". Εάν ο συμμετέχων, έχοντας ακούσει την ερώτηση, δεν θέλει να την απαντήσει, τότε του ανατίθενται δύο εργασίες ή φεύγει (δεν συνιστάται).

Οι εργασίες και οι ερωτήσεις πρέπει να γίνονται λαμβάνοντας υπόψη τα ηλικιακά χαρακτηριστικά και τους στόχους του μαθήματος.

MAOU "Beloyarsk δευτεροβάθμιο σχολείο No. 1"

Το παιχνίδι

"Κύμα"

MAOU "Beloyarsk δευτεροβάθμιο σχολείο No. 1"

Το παιχνίδι

"Μυστικό"

MAOU "Beloyarsk δευτεροβάθμιο σχολείο No. 1"

Το παιχνίδι

«
Experience Box»

MAOU "Beloyarsk δευτεροβάθμιο σχολείο No. 1"

Το παιχνίδι

«
περάστε το»

Παιχνίδι "Μυστικό"

Στόχοι:

    να σχηματίσουν μια επιθυμία επικοινωνίας με συνομηλίκους.

    ξεπεράσει τη ντροπαλότητα?

    βρείτε διαφορετικούς τρόπους για να πετύχετε το στόχο σας.

Το κοινό-στόχος: κατώτερη σχολική ηλικία.

Σχηματίστηκε UUD: προσωπική, επικοινωνιακή.

Ο συντονιστής μοιράζει μικρά αντικείμενα σε όλους τους συμμετέχοντες: ένα κουμπί, μια καρφίτσα, ένα μικρό παιχνίδι κ.λπ. Είναι μυστικό. Οι συμμετέχοντες είναι ζευγαρωμένοι. Πρέπει να πείσουν ο ένας τον άλλον να αποκαλύψουν το «μυστικό» τους. Τα παιδιά πρέπει να βρουν όσο το δυνατόν περισσότερους τρόπους για να πείσουν (μαντεύοντας, κομπλιμέντα, υποσχόμενες λιχουδιές, να μην πιστεύουν ότι υπάρχει κάτι στη γροθιά, κ.λπ.).

Εάν προκύψουν δυσκολίες, ο ίδιος ο συντονιστής μπορεί να βοηθήσει να βρει τρόπους να πείσει.

Παιχνίδι κυμάτων

Στόχοι:

    μάθουν να συγκεντρώνονται?

    διαχειριστείτε τη συμπεριφορά σας.

Κοινό-στόχος: m κατώτερη σχολική ηλικία.

Σχηματίστηκε UUD: προσωπική, επικοινωνιακή.

Τα παιδιά καλούνται να απεικονίσουν τη θάλασσα, η οποία, ανάλογα με τον καιρό, μπορεί να είναι πολύ διαφορετική. Ο οικοδεσπότης δίνει την εντολή "Ηρεμία!". Όλα τα παιδιά παγώνουν. Με την εντολή "Κύμα!" Τα παιδιά παρατάσσονται και πιάνονται χέρι χέρι. Ο οικοδεσπότης δείχνει τη δύναμη του κύματος και τα παιδιά κάνουν οκλαδόν και σηκώνονται όρθια με ένα διάστημα 1-2 δευτερολέπτων χωρίς να αφήσουν τα χέρια τους. Το παιχνίδι τελειώνει με την εντολή "Ηρεμία!".

Για να ενισχύσετε τον συναισθηματικό αντίκτυπο, μπορείτε πρώτα να μιλήσετε για ναυτικούς ζωγράφους, να δείξετε αναπαραγωγές των πινάκων του Aivazovsky.

Παιχνίδι "Περάστε γύρω"

Στόχοι:

    συμβάλλουν στο σχηματισμό μιας φιλικής ομάδας·

    μάθουν να ενεργούν σε συνεννόηση?

    ανάπτυξη συντονισμού κινήσεων και φαντασίας.

Το κοινό-στόχος: κατώτερη σχολική ηλικία.

Σχηματίστηκε UUD: προσωπικός,

Τα παιδιά κάθονται σε κύκλο. Ο δάσκαλος περνάει ένα φανταστικό αντικείμενο σε κύκλο: μια καυτή πατάτα, ένα πάγο, έναν βάτραχο, έναν κόκκο άμμου κ.λπ. Το αντικείμενο πρέπει να κάνει όλο τον κύκλο και να επιστρέψει στον οδηγό χωρίς να αλλάξει (η πατάτα δεν πρέπει να κρυώσει, ο πάγος να λιώσει, ο κόκκος της άμμου να χαθεί, ο βάτραχος να πηδήξει). Οι συμμετέχοντες στο παιχνίδι παίρνουν και περνούν συναισθηματικά το ονομαζόμενο αντικείμενο.

Με τα μεγαλύτερα παιδιά, μπορείτε να παίξετε χωρίς να ονομάσετε το θέμα.

Αντανάκλαση

Πώς ένιωσα όταν έλαβα ένα φανταστικό αντικείμενο?

Το παιχνίδι "Box of Experiences"

Στόχοι:

    απομάκρυνση του ψυχολογικού στρες?

    ανάπτυξη της ικανότητας αναγνώρισης και διαμόρφωσης των προβλημάτων τους.

Το κοινό-στόχος: κατώτερη σχολική ηλικία.

Σχηματίστηκε UUD: προσωπική, ρυθμιστική.

Ο οικοδεσπότης δείχνει ένα μικρό κουτί και λέει: «Σήμερα θα μαζέψουμε όλα τα προβλήματα, τις προσβολές και τις λύπες σε αυτό το κουτί. Αν κάτι σας ενοχλεί, μπορείτε να το ψιθυρίσετε απευθείας στο κουτί. Θα το τρέξω. Τότε θα το σφραγίσω και θα το αφαιρέσω και μαζί του θα αφήσω τα συναισθήματά σας να εξαφανιστούν.». Το κουτί περνιέται.

Αντανάκλαση

Έχετε αντιμετωπίσει δυσκολίες όταν ψιθύρισες τα παράπονα και τις λύπες σου στο κουτί; Οι οποίες?

MAOU "Beloyarsk δευτεροβάθμιο σχολείο No. 1"

Το παιχνίδι

"Αποψη"

MAOU "Beloyarsk δευτεροβάθμιο σχολείο No. 1"

Το παιχνίδι

« Φιλοφρονήσεις»

MAOU "Beloyarsk δευτεροβάθμιο σχολείο No. 1"

Το παιχνίδι

"Επάρκεια"

MAOU "Beloyarsk δευτεροβάθμιο σχολείο No. 1"

Το παιχνίδι

«
ΝΕΙΛΟΣ"

Παιχνίδι "Compliments"

Στόχοι:

    αυξημένη αίσθηση εμπιστοσύνης?

    συναισθηματική απελευθέρωση.

Το κοινό-στόχος: μαθητές 5-6 τάξεων.

Μορφοποιημένο UUD: l προσωπική, επικοινωνιακή.

Τα παιδιά, που στέκονται σε κύκλο, ρίχνουν τη μπάλα το ένα στο άλλο και εναλλάξ λέγοντας κάτι ευχάριστο σε ένα από τα μέλη της ομάδας. Το όνομα του γείτονα προφέρεται με στοργική μορφή και λένε αυτό που τους αρέσει γι 'αυτόν (Για παράδειγμα, "Η Λένα έχει όμορφα μακριά μαλλιά", "Η Nadyusha ζωγραφίζει όμορφα", "Ο Dimochka είναι καλός φίλος, είναι πολύ ευγενικός") .

Αντανάκλαση

1. Πώς ένιωσες όταν έκανες κομπλιμέντα;

2. Πώς ένιωσες όταν σου έκαναν κομπλιμέντα;

3. Αντιμετώπισες δυσκολίες στο να κάνεις κομπλιμέντα; Οι οποίες?

Παιχνίδι "Άποψη"

(επαγγελματικό παιχνίδι)

Στόχοι:

    αυτορρύθμιση?

Το κοινό-στόχος:

Σχηματίστηκε UUD:

Συμμετέχοντες: αντίπαλοι - ομάδες μαθητών που υπερασπίζονται τη μία ή την άλλη άποψη. παρατηρητές - ένας δάσκαλος με αρκετούς βοηθούς. Πριν από το παιχνίδι, ο δάσκαλος ανακοινώνει εκ των προτέρων το θέμα της διαμάχης, παρέχει στους μαθητές τις απαραίτητες γνώσεις και γεγονότα. Οι ομάδες συζητούν τα επιχειρήματά τους, πιθανά αντεπιχειρήματα των αντιπάλων. μπείτε σε διαφωνία. Η ομάδα παρακολούθησης αξιολογεί:

    Ποιος ήταν πιο λογικός;

    Ποιος είναι πιο πειστικός συναισθηματικά;

    Ποιος έκανε λάθη (σύμφωνα με τους κανόνες της διαφοράς);

Ερευνητικό εργαστήριο -

"ΝΕΙΛΟΣ",(επαγγελματικό παιχνίδι)

Στόχοι:

    ανάπτυξη της λογικής σκέψης?

    διατήρηση του ενδιαφέροντος για το θέμα.

Το κοινό-στόχος:

Σχηματίστηκε UUD: ομιλητικός,

Κορυφαίος - ένας δάσκαλος ή ένας ειδικά εκπαιδευμένος μαθητής. ερευνητές - ομάδες φοιτητών? εισαγωγική επιτροπή - ένας δάσκαλος με 2-3 μαθητές. Οι ομάδες συζητούν την προτεινόμενη εργασία, ετοιμάζουν μια αναφορά, μια μίνι παράσταση ή μια αφίσα με τη μορφή λύσης εργασίας, επιλέγουν έναν ομιλητή που θα παρουσιάσει το αποτέλεσμα. Ο ομιλητής κάνει μια παρουσίαση μπροστά στην τάξη. Η επιτροπή επιλογής αναλύει εάν λαμβάνει (ή όχι) αποφάσεις. Αν υπάρχει λύση με το κλειδί στο χέρι, ο δάσκαλος μπορεί να το πει στην τάξη.

Αντανάκλαση:

Ποια λύση σας άρεσε; Ήταν το πιο επιτυχημένο;

(A.Gin. «Τεχνικές παιδαγωγικής τεχνικής»)

Παιχνίδι "Ικανότητα"

(επαγγελματικό παιχνίδι)

Στόχοι:

    αυτορρύθμιση?

    ανάπτυξη της ικανότητας για εργασία σε ομάδα ·

Το κοινό-στόχος: μαθητές Γυμνασίου και Λυκείου.

Σχηματίστηκε UUD:

Οι διαγωνιζόμενοι είναι δύο ομάδες μαθητών. Εργοδότες - μια ομάδα φοιτητών που καθορίζει τον νικητή (ο οποίος, όπως λέμε, προσλαμβάνεται). Ένας διαιτητής είναι ένας δάσκαλος που αποφασίζει επίμαχα ζητήματα. Ο δάσκαλος θέτει το θέμα, οι ομάδες βάζουν 5 εργασίες η μία για την άλλη σε αυτό το θέμα (το είδος των εργασιών ρυθμίζεται από τον δάσκαλο). Οι αντίπαλοι απαντούν, αν δεν αντεπεξέλθουν, απαντούν οι ίδιοι οι ιδιοκτήτες της ερώτησης. Οι εργοδότες βαθμολογούν κάθε εργασία σε ένα σύστημα 5 σημείων, κάθε απάντηση σε ένα σύστημα 10 σημείων. Στο τέλος, οι εργοδότες συνεννοούνται και αποφασίζουν ποιος θα προσληφθεί.

(A.Gin. «Τεχνικές παιδαγωγικής τεχνικής»)

MAOU "Beloyarsk δευτεροβάθμιο σχολείο No. 1"

Το παιχνίδι

"Sinkwine"

MAOU "Beloyarsk δευτεροβάθμιο σχολείο No. 1"

Το παιχνίδι

"Ικανότητα - 2"

MAOU "Beloyarsk δευτεροβάθμιο σχολείο No. 1"

Το παιχνίδι

"Αντίστροφα"

MAOU "Beloyarsk δευτεροβάθμιο σχολείο No. 1"

Το παιχνίδι

«Γεννήτριες-κριτικοί»

Παιχνίδι "Competence - 2"

(επαγγελματικό παιχνίδι)

Στόχοι:

    αυτορρύθμιση?

    ανάπτυξη της ικανότητας για εργασία σε ομάδα ·

    κολλεκτιβισμός;

    ανάπτυξη της λογικής σκέψης.

Το κοινό-στόχος: μαθητές Γυμνασίου και Λυκείου.

Σχηματίστηκε UUD: επικοινωνιακός, γνωστικός, ρυθμιστικός.

Το θέμα του παιχνιδιού είναι γνωστό εκ των προτέρων. Οι ομάδες ετοιμάζουν ένα πακέτο 5 εργασιών και τις ανταλλάσσουν με τους αντιπάλους στο παιχνίδι. Στον καθορισμένο χρόνο, οι ομάδες λύνουν εργασίες. Στις ερωτήσεις που τίθενται απαντά αυτός από την ομάδα που επιλέγουν οι αντίπαλοι. Κριτική επιτροπή - 3 μαθητές που αξιολογούν σε σύστημα 5 σημείων ερώτηση που τέθηκε, σε βάση 10 βαθμών - οι απαντήσεις των ομάδων. Ο δάσκαλος ενεργεί ως διαιτητής, παρακολουθεί την ορθότητα του παιχνιδιού.

(A.Gin. «Τεχνικές παιδαγωγικής τεχνικής»)

Παιχνίδι "Sinkwine"

Στόχοι:

    αυτορρύθμιση?

    ανάπτυξη της προσοχής?

    ανάπτυξη της λογικής σκέψης.

Το κοινό-στόχος: Φοιτητές.

Σχηματίστηκε UUD:

Μπορείτε να παίξετε ως ομάδα ή σε ζευγάρια. Το Cinquain αποτελείται από πέντε γραμμές. Το θέμα έχει οριστεί. Στην πρώτη γραμμή, ένα ουσιαστικό (κλειδί) γράφεται στο υπό μελέτη θέμα, στη δεύτερη γραμμή - 2 επίθετα που είτε σχετίζονται με αυτήν τη λέξη είτε ταιριάζουν. το τρίτο - τρία ρήματα, κατάλληλα και για λέξη-κλειδίαντικατοπτρίζει το νόημα του θέματος· η τέταρτη γραμμή είναι η κύρια ιδέα ή φράση, μια πρόταση για τη λέξη-κλειδί, η πέμπτη είναι η συνώνυμη λέξη ή συσχέτιση με τη λέξη-κλειδί. Η ομάδα με το πιο επιτυχημένο syncwine κερδίζει.

Το παιχνίδι "Γεννήτριες-κριτικοί"

Στόχοι:

    ανάπτυξη δεξιοτήτων επικοινωνίας, ικανότητα εργασίας σε ομάδα.

    ανάπτυξη δεξιοτήτων συμπεριφοράς με αυτοπεποίθηση.

    αυτορρύθμιση?

    διατήρηση του ενδιαφέροντος για το θέμα που μελετάται.

Το κοινό-στόχος: μαθητές, γονείς, εκπαιδευτικούς.

Σχηματίστηκε UUD: προσωπική, επικοινωνιακή, γνωστική.

Το κοινό χωρίζεται σε 2 ομάδες - γεννήτριες και κριτικούς. Σχετικά με το προτεινόμενο θέμα (πρόβλημα), οι παραγωγοί προτείνουν ιδέες για την επίλυση της εργασίας, οι κριτικοί βρίσκουν λάθη και " αδύναμα σημεία". Η κριτική επιτροπή είναι ένας δάσκαλος ή 2-3 μαθητές. Κατά τη διάρκεια του παιχνιδιού, γεννήτριες και κριτικοί αλλάζουν ρόλους.

Αντανάκλαση:

Ποιες ιδέες αποδείχθηκαν οι πιο επιτυχημένες; Ποια είναι ασυνήθιστα;

Το αντίθετο παιχνίδι

Στόχοι:

Ανάπτυξη της προσοχής;

Το κοινό-στόχος: Φοιτητές.

Σχηματίστηκε UUD: προς την

Περιεχόμενο

Ο δάσκαλος δίνει στα παιδιά διαφορετικές εντολές, τα παιδιά πρέπει να ακολουθούν το αντίθετο από αυτά. Για παράδειγμα, η εντολή "Καθίστε!" πρέπει να σηκωθείτε, με την εντολή "Μίλα!" - σιωπά, κ.λπ.

Αντανάκλαση:

Ποιες εντολές σας άρεσε να εκτελείτε; Ποια ήταν δύσκολα;

(S. Gin "The World of Logic")

MAOU "Beloyarsk δευτεροβάθμιο σχολείο No. 1"

Το παιχνίδι

"Ερωτών"

MAOU "Beloyarsk δευτεροβάθμιο σχολείο No. 1"

Το παιχνίδι

"Αλυσίδα"

MAOU "Beloyarsk δευτεροβάθμιο σχολείο No. 1"

Το παιχνίδι

"Ποιά είναι η διαφορά?"

MAOU "Beloyarsk δευτεροβάθμιο σχολείο No. 1"

Το παιχνίδι

"Πουλί, ψάρι"

Το παιχνίδι "αλυσίδα"

Στόχοι:

Ανάπτυξη της προσοχής;

Μειωμένο συναισθηματικό στρες.

Το κοινό-στόχος: Φοιτητές.

Σχηματίστηκε UUD:

Περιεχόμενο

Η τάξη χωρίζεται σε ομάδες (μπορείτε - ζευγάρια). Ο δάσκαλος ονομάζει μια σειρά λέξεων: "Πορτοκάλι - ρινόκερος - καλικάντζαρο - παγωτό - ρακούν ..." - και καλεί τα παιδιά να ανακαλύψουν το σχέδιο κατασκευής της επόμενης σειράς (κάθε επόμενη λέξη αρχίζει με το τελευταίο γράμμα της προηγούμενης ) και συνεχίστε το περαιτέρω. Κερδίζει η ομάδα που συνεχίζει την αλυσίδα χωρίς λάθη και παύσεις.

(S. Gin "The World of Logic")

Παιχνίδι "ερωτητής"

Στόχοι:

Ανάπτυξη της προσοχής;

Μειωμένο συναισθηματικό στρες.

Ανάπτυξη του λόγου;

Ανάπτυξη της ικανότητας για εργασία σε ομάδα.

Το κοινό-στόχος: μαθητές δημοτικού.

Σχηματίστηκε UUD:

Η τάξη χωρίζεται σε ομάδες. Εργασία: δημιουργήστε όσο το δυνατόν περισσότερες ερωτήσεις σχετικά με την εικόνα της πλοκής (το ίδιο για όλες τις ομάδες - η εικόνα στον πίνακα). Μετά την καταμέτρηση του αριθμού των ερωτήσεων σε ομάδες και τη σύνοψη των αποτελεσμάτων, προτείνεται να βρεθούν απαντήσεις στις πιο ενδιαφέρουσες, ασυνήθιστες ερωτήσεις.

Αντανάκλαση:

Ποιες ερωτήσεις αποδείχθηκαν οι πιο ενδιαφέρουσες, ασυνήθιστες; Ποιες απαντήσεις είναι οι πιο πρωτότυπες (αστείες, ασυνήθιστες);

(S. Gin "The World of Logic")

Το παιχνίδι "Πουλί, ψάρι"

Στόχοι:

Ανάπτυξη της προσοχής;

Μειωμένο συναισθηματικό στρες.

Ανάπτυξη του λόγου;

Ανάπτυξη λογικής σκέψης.

Το κοινό-στόχος: μαθητές δημοτικού.

Σχηματίστηκε UUD: γνωστικό, ρυθμιστικό, προσωπικό.

Τα παιδιά καλούν εναλλάξ μια αλυσίδα μια λέξη τη φορά: η πρώτη είναι το όνομα του πουλιού, η δεύτερη είναι ψάρι, η τρίτη είναι πάλι πουλιά κ.λπ. Το παιχνίδι μπορεί να λάβει χώρα σε ένα παιχνίδι αποβολής: ένας μαθητής που επαναλαμβάνει μια προηγουμένως ειπωμένη λέξη ή ανακατεύει το θέμα της απάντησης αποβάλλεται από το παιχνίδι. Μπορείτε να παίξετε το παιχνίδι με τη μορφή ανταγωνισμού μεταξύ ομάδων.

Αντανάκλαση:

Πώς διακρίνουμε αυτές τις ομάδες ζώων; Ποια σπάνια πουλιά (ψάρια) ονομάστηκαν;

(S. Gin "The World of Logic")

Παιχνίδι "Τι είναι διαφορετικό;"

(παιχνίδι συζήτησης)

Στόχοι:

Ανάπτυξη της προσοχής;

Ανάπτυξη λογικής σκέψης;

Ανάπτυξη του λόγου;

Ανάπτυξη της ικανότητας για εργασία σε ομάδες.

Το κοινό-στόχος: Φοιτητές.

Σχηματίστηκε UUD: επικοινωνιακή, ρυθμιστική, προσωπική, γνωστική.

Μπορείτε να παίξετε σε ζευγάρια, ομάδες ή μετωπικά. Το παιχνίδι πηγαίνει σύμφωνα με το σχέδιο: τα παιδιά προσφέρουν ένα σημάδι διαφοράς, ο δάσκαλος (στο γυμνάσιο - η αντίθετη ομάδα) δίνει ένα επιχείρημα ενάντια σε αυτό το σημάδι. Για παράδειγμα, το θέμα «Ποια είναι η διαφορά μεταξύ στρουθοκαμήλου και ανθρώπου;». Επιλογή συζήτησης: Η στρουθοκάμηλος δεν μιλάει. «Δηλαδή ο βουβός είναι στρουθοκάμηλος;» Ο άνθρωπος δεν έχει φτερά. - Λοιπόν, μια στρουθοκάμηλος με κομμένα φτερά είναι άντρας;

(S. Gin "The World of Logic")

MAOU "Beloyarsk δευτεροβάθμιο σχολείο No. 1"

Το παιχνίδι

«Το όλο είναι ένα μέρος»

MAOU "Beloyarsk δευτεροβάθμιο σχολείο No. 1"

Το παιχνίδι

"Περάστε το αντικείμενο"

MAOU "Beloyarsk δευτεροβάθμιο σχολείο No. 1"

Το παιχνίδι

"Ναι και ΟΧΙ"

MAOU "Beloyarsk δευτεροβάθμιο σχολείο No. 1"

Το παιχνίδι

«
Αφηγητής"

Παιχνίδι "Περάστε το αντικείμενο"

Στόχοι:

Ανάπτυξη της προσοχής;

Μειωμένο συναισθηματικό στρες.

Ανάπτυξη του λόγου;

Ανάπτυξη λογικής σκέψης.

Το κοινό-στόχος: μαθητές δημοτικού.

Σχηματίστηκε UUD: σελ ρυθμιστικός, προσωπικός, γνωστικός.

Τα παιδιά σηκώνονται όρθια και περνούν γρήγορα ένα αντικείμενο από χέρι σε χέρι κατά μήκος μιας αλυσίδας, ενώ καλούν ένα από τα σημάδια του. Ποιος δεν μπορούσε να απαντήσει ή επανέλαβε - κάθεται. Το παιχνίδι συνεχίζεται μέχρι να «εξαντληθούν» τα σημάδια.

Αντανάκλαση:

Ονομάστηκαν όλα τα πιθανά σημάδια του θέματος;

(S. Gin "The World of Logic")

Το παιχνίδι "Το όλο είναι ένα μέρος"

Στόχοι:

Ανάπτυξη της προσοχής;

Ανάπτυξη της ταχύτητας της σκέψης.

Ανάπτυξη λογικής σκέψης.

Στοχευμένο κοινό: μαθητές των δημοτικών τάξεων.

Σχηματίστηκε UUD: n γνωστικό, ρυθμιστικό, προσωπικό.

Ο δάσκαλος ονομάζει το θέμα (έννοια, φαινόμενο - ανάλογα με την ηλικία των μαθητών), τα παιδιά ονομάζουν το μέρος του. Για παράδειγμα, ένα βιβλίο είναι μια σελίδα, μια καρέκλα είναι ένα πόδι, ένα δέντρο είναι μια ρίζα, μια καταιγίδα είναι η βροχή κ.λπ. Μπορείτε επίσης να παίξετε σε ομάδες, όταν η μία ομάδα ονομάζει το αντικείμενο, η άλλη - το μέρος του και αντίστροφα.

Αντανάκλαση:

Ποιο ζευγάρι ήταν το πιο δύσκολο να γίνει; Το πιο εύκολο;

Παιχνίδι "Παραμηγητής"

Στόχοι:

Ανάπτυξη της προσοχής;

Ανάπτυξη του λόγου;

Ανάπτυξη λογικής σκέψης.

Στοχευμένο κοινό: μαθητές των δημοτικών τάξεων.

Σχηματίστηκε UUD: γνωστικό, ρυθμιστικό, προσωπικό.

Ο δάσκαλος προσφέρεται να πει ένα διάσημο ποίημα σε μια «αλυσίδα»: κάθε μαθητής προφέρει μια λέξη. Ταυτόχρονα, πρέπει να προσπαθήσετε να αφηγηθείτε την ιστορία μαζί και με τον ίδιο ρυθμό (σαν να υπάρχει μόνο ένας αφηγητής). Το παιχνίδι παίζεται ως ανταγωνισμός μεταξύ σειρών.

Αντανάκλαση:

Ποια ομάδα ήταν η πιο επιτυχημένη στην ολοκλήρωση της εργασίας;

Παιχνίδι "Ναι" και "Όχι"

Στόχοι:

Ανάπτυξη της προσοχής;

Μειωμένο συναισθηματικό στρες.

Η ανάπτυξη της αυτορρύθμισης.

Στοχευμένο κοινό: μαθητές των δημοτικών τάξεων.

Σχηματίστηκε UUD: γνωστικό, ρυθμιστικό, προσωπικό.

Ο δάσκαλος θέτει στους μαθητές ερωτήσεις που μπορούν να απαντηθούν «ναι» ή «όχι». Ταυτόχρονα, η συμφωνία πρέπει να εκφράζεται με ένα νεύμα, διαφωνία - με φωνή (μετά - αντίστροφα). Οι ερωτήσεις πρέπει να είναι αρκετά απλές και αποσπασμένες. Για παράδειγμα, "Είναι σήμερα Τετάρτη;", "Λάβει ο ήλιος τώρα;" και τα λοιπά. Μπορείτε να παίξετε νοκ άουτ.

Αντανάκλαση:

Ποιες ερωτήσεις ήταν οι πιο ενδιαφέρουσες;

MAOU "Beloyarsk δευτεροβάθμιο σχολείο No. 1"

Το παιχνίδι

«Τι είδους γάτα θα είμαι;»

MAOU "Beloyarsk δευτεροβάθμιο σχολείο No. 1"

Το παιχνίδι

"Νήμα"

MAOU "Beloyarsk δευτεροβάθμιο σχολείο No. 1"


Το παιχνίδι

«Γη, νερό, αέρας»

MAOU "Beloyarsk δευτεροβάθμιο σχολείο No. 1"

Το παιχνίδι

«
Μαντέψτε τι σκέφτεστε"

Το παιχνίδι "Νήμα"

Στόχοι:

    ανάπτυξη δεξιοτήτων επικοινωνίας·

    αφαίρεση του συναισθηματικού στρες?

    χτίσιμο ομάδας.

Το κοινό-στόχος:

Σχηματίστηκε UUD:

Περιεχόμενο

Είναι απαραίτητο να κάνετε κομπλιμέντα σε κάποιον από αυτούς που κάθονται σε κύκλο και να του πασάρετε την μπάλα. Ένα μέρος του νήματος παραμένει στα χέρια του. Κοιτάξτε τι φωτεινό, ανθεκτικό ιστό αράχνης έχουμε. Και τώρα θα το ξεδιαλύνουμε. Ξεκινώντας από τον τελευταίο συμμετέχοντα στο παιχνίδι, τυλίγουμε την μπάλα και ταυτόχρονα λέμε λόγια ευγνωμοσύνης σε αυτόν που σας έκανε κομπλιμέντα.

Αντανάκλαση

Τι είναι πιο ευχάριστο (πιο δύσκολο) - να δίνεις κομπλιμέντα, να τα λαμβάνεις ή να ευχαριστείς;

Το παιχνίδι "Τι είδους γάτα θα είμαι"

Στόχος :

    ο σχηματισμός δημιουργικής δραστηριότητας, ενσυναίσθησης και ευαισθησίας.

Το κοινό-στόχος: μαθητές 5-11 τάξεων.

Σχηματίστηκε UUD: προσωπική, επικοινωνιακή.

Περιεχόμενο

Κατά τη διάρκεια του παιχνιδιού, τα παιδιά εξοικειώνονται με τον πιο ασφαλή τρόπο με τα διάφορα συστατικά της προσωπικότητας και του χαρακτήρα τους, γίνεται αυτοανάλυση της προσωπικότητας. Οδηγίες για μαθητές: «Φανταστείτε ότι έχετε γίνει γάτα. Τι είδους γάτα είσαι; Στη συνέχεια, πρέπει να αναλύσετε με τα παιδιά: Υπάρχει ομοιότητα μεταξύ του χαρακτήρα σας και της περιγραφής του ζώου; Τι σας άρεσε περισσότερο σε αυτό που είπε η γάτα για τον εαυτό της; Έχει η γάτα σας αρνητικές πλευρές?

Αντανάκλαση

Ποιανού οι ιστορίες ήταν οι πιο ενδιαφέρουσες για εσάς;

Το παιχνίδι "Μάντεψε τι σχεδιάστηκε"

Στόχος: ανάπτυξη της σκέψης: η ικανότητα γενίκευσης, ανάδειξης του ουσιαστικού, ανάλυσης των ιδιοτήτων των αντικειμένων.

Το κοινό-στόχος: μαθητές, καθηγητές, γονείς.

Σχηματίστηκε UUD: επικοινωνιακός, προσωπικός.

Περιεχόμενο

Ο αρχηγός μαντεύει τη λέξη. Οι συμμετέχοντες κάνουν ερωτήσεις για να μαντέψουν την κρυμμένη λέξη. Ο συντονιστής μπορεί να πει μόνο «ναι» και «όχι». Σημείωση: στο πρώτο στάδιο, μαντεύονται λέξεις που δηλώνουν αντικείμενα και, στη συνέχεια, μπορείτε σταδιακά να προχωρήσετε σε αφηρημένες έννοιες.

Οι ερωτήσεις πρέπει να σχεδιάζονται λαμβάνοντας υπόψη τα ηλικιακά χαρακτηριστικά και τους στόχους του μαθήματος.

Παιχνίδι "Γη, νερό, αέρας"

Στόχος: ανάπτυξη προβληματισμού, δημιουργική δραστηριότητα.

Το κοινό-στόχος: μαθητές 1-5 τάξεων.

Σχηματίστηκε UUD: προσωπική, επικοινωνιακή.

Περιεχόμενο

Είναι καλύτερο να τοποθετήσετε τους συμμετέχοντες σε μορφή κύκλου.

Επιλογή Ι.

Η έννοια του παιχνιδιού των τεσσάρων στοιχείων εξηγείται στα παιδιά. Εάν ο συντονιστής λέει τη λέξη "γη", τότε τα παιδιά πρέπει να ονομάσουν γρήγορα τα ζώα ή τα φυτά που ζουν ή αναπτύσσονται στο έδαφος. Αν προφέρει τη λέξη «νερό», τότε οι μαθητές ονομάζουν τους εκπροσώπους του ζωικού και φυτικού κόσμου που ζουν κάτω από το νερό. Αν προφέρεται η λέξη «άνεμος», τότε οι μαθητές γυρίζουν. Εάν προφέρει τη λέξη "αέρας", τότε τα παιδιά ονομάζουν εκείνα τα ζωντανά πλάσματα που μπορούν να ζήσουν στον αέρα. Αυτός που υποδεικνύεται από την παρουσιάστρια ή που θα του δοθεί το παιχνίδι απαντά. Θα πρέπει να απαντήσετε γρήγορα - μέσα σε 5 δευτερόλεπτα. Οι απαντήσεις δεν πρέπει να επαναλαμβάνονται.

Επιλογή II.

Για κάθε στοιχείο, δίνεται μια εγκατάσταση - για την ολοκλήρωση μιας συγκεκριμένης εργασίας. Για παράδειγμα, εάν ονομάζεται η λέξη "αέρας", οι μαθητές θα πρέπει να χτυπούν τα χέρια τους σαν φτερά πουλιών. αν η λέξη "γη" - κινείται σαν βάτραχος (λαγός, ελέφαντας, αρκούδα κ.λπ.) εάν η λέξη "νερό" - απεικονίζει τις διάφορες κινήσεις του κολυμβητή. αν η λέξη "άνεμος" είναι να φυσάει σαν τον άνεμο, να γυρίζεις, να ταλαντεύεσαι σαν δέντρα.

MAOU "Beloyarsk δευτεροβάθμιο σχολείο No. 1"

Το παιχνίδι

« Πυροσβέστες σε εκπαίδευση»

MAOU "Beloyarsk δευτεροβάθμιο σχολείο No. 1"

Το παιχνίδι

« Κλωστή και βελόνα"

MAOU "Beloyarsk δευτεροβάθμιο σχολείο No. 1"

Το παιχνίδι

"Βοεβόδα"

MAOU "Beloyarsk δευτεροβάθμιο σχολείο No. 1"

Το παιχνίδι

"Ο μάγειρας και τα γατάκια"

Το παιχνίδι "Κλωστή και βελόνα".

Στόχοι:

Διαμόρφωση ομαδικής συνοχής, ικανότητα συντονισμού των ενεργειών τους με τις ενέργειες άλλων συμμετεχόντων, για την επίτευξη ομαδικής επιτυχίας μέσω συντονισμένων ατομικών προσπαθειών.

Να αναπτύξει και να διαμορφώσει στον εαυτό του ιδιότητες όπως η επαφή, η οργάνωση και η ψυχραιμία, η λογική και η εφευρετικότητα, η ταχύτητα αντίδρασης.

Σχηματίστηκε UUD : επικοινωνιακός, προσωπικός.

Το κοινό-στόχος: μαθητές 1-8 τάξεων.

Περιεχόμενο

Στο παιχνίδι συμμετέχει όλη η τάξη. Το καλύτερο μέροςγια την υλοποίησή του - ένα αθλητικό γήπεδο ή μια αθλητική αίθουσα. Αρχικά, με εντολή του δασκάλου, επιλέγονται οι «βελόνες». Είναι επιθυμητό ότι αυτοί ήταν λιγότερο δραστήριοι τύποι. Τότε θα μπορούν να είναι σε ρόλο αρχηγού, αρχηγού και να καταλάβουν, τουλάχιστον στο παιχνίδι, ότι κάτι εξαρτάται από αυτούς. Στη συνέχεια, "κλωστές" συνδέονται με τις "βελόνες". Είναι επιθυμητό ο αριθμός των παιδιών στο "νήμα" για κάθε "βελόνα" να είναι ο ίδιος. Με εντολή του αρχηγού ξεκινά το κίνημα. Το καθήκον των συμμετεχόντων είναι να μην αποσυνδέονται ο ένας από τον άλλο, διαφορετικά το "νήμα" θα σπάσει. Το καθήκον της «βελόνας» δεν είναι να διασταυρώνεται με άλλες «βελόνες». Η κατεύθυνση κίνησης είναι αυθαίρετη, μπορεί να υπάρχουν εμπόδια στην πορεία.

Αντανάκλαση

Επιλέξτε μια πιο δυνατή «κλωστή» και την πιο ανακλαστική «βελόνα».

Παιχνίδι "Πυροσβέστες σε εκπαίδευση"

Στόχοι:

Να αναπτύξουν στα παιδιά μια αίσθηση συλλογικότητας.

Ικανότητα εκτέλεσης κινήσεων σε σήμα.

Άσκηση στην αναρρίχηση και στο χτίσιμο σε κολόνα.

Στοχευμένο κοινό: συχνάζω.

Σχηματίστηκε UUD: προς την επικοινωνιακό, ρυθμιστικό, προσωπικό.

Περιεχόμενο

Τα παιδιά παίκτες είναι χτισμένα με θέα στον γυμναστικό τοίχο σε απόσταση 5-6 βημάτων σε 3-4 κολώνες. Ένα κουδούνι είναι κρεμασμένο σε κάθε στήλη στο ίδιο ύψος. Στο σήμα «1, 2, 3 - τρέξτε», τα παιδιά που στέκονται τρέχουν πρώτα στον τοίχο, σκαρφαλώνουν και χτυπούν το κουδούνι. Στη συνέχεια κατεβαίνουν και στέκονται στο τέλος της στήλης τους. Επαναλάβετε το παιχνίδι 6-8 φορές.

Παρακολούθηση της συμμόρφωσης με τους κανονισμούς ασφαλείας κατά τη διάρκεια του παιχνιδιού.

Παιχνίδι "μάγειρας και γατάκια"

Στόχοι:

Άσκηση των παιδιών σε διάφορους τύπους περπάτημα ή τρέξιμο.

Ανάπτυξη ταχύτητας αντίδρασης, επιδεξιότητα.

- ικανότητα εστίασης στη λέξη.

Το κοινό-στόχος: μαθητές 1-5 τάξεων.

Σχηματίστηκε UUD: να επικοινωνιακό, ρυθμιστικό, προσωπικό.

Περιεχόμενο

Σύμφωνα με την ομοιοκαταληξία, οι παίκτες επιλέγουν έναν μάγειρα που φυλάει τα αντικείμενα που βρίσκονται στο τσέρκι - "λουκάνικα". Ο μάγειρας τριγυρνάει μέσα στο τσέρκι, κορδόνι - «κουζίνα». Παιδιά - γατάκια πηγαίνουν σε κύκλο, παίζοντας διαφορετικά είδηπερπάτημα, τρέξιμο, λέγοντας το κείμενο:

Το μουνί που κλαίει στο διάδρομο

Τα γατάκια έχουν μεγάλη θλίψη:

Δύσκολος μάγειρας φτωχοί μουνί

Δεν σε αφήνει να αρπάξεις λουκάνικα.

Με την τελευταία λέξη, «γατάκια» τρέχουν στην «κουζίνα», προσπαθώντας να αρπάξουν ένα λουκάνικο. Ο μάγειρας προσπαθεί να σταματήσει τους παίκτες που τρέχουν. Οι ηττημένοι παίκτες είναι εκτός παιχνιδιού.

Το παιχνίδι συνεχίζεται μέχρι να κλαπούν όλα τα λουκάνικα από τον μάγειρα.

συστάσεις

Δεν μπορείτε να μπείτε σε έναν κύκλο εκ των προτέρων. Ο μάγειρας δεν επιτρέπεται να αρπάξει τα γατάκια, μόνο αλάτι, δεν επιτρέπεται να βγει έξω από τον κύκλο. Απαγορεύεται η λήψη 2 ή περισσότερων αντικειμένων ταυτόχρονα.

Παιχνίδι "Voevoda"

Στόχοι:

- να ασκούν τα παιδιά στην κύλιση, τη ρίψη και το πιάσιμο της μπάλας.

- την ικανότητα συντονισμού της κίνησης με τη λέξη.

- αναπτύξτε την προσοχή, την επιδεξιότητα.

Στοχευμένο κοινό: μαθητές 1-5 τάξεων.

Σχηματίστηκε UUD: προς τηνεπικοινωνιακό, ρυθμιστικό, προσωπικό.

Περιεχόμενο

Οι παίκτες σε κύκλο κυλούν την μπάλα από το ένα στο άλλο, λέγοντας:

- Ένα μήλο κυλά σε κύκλο ενός στρογγυλού χορού,

- Όποιος το ανέβασε, αυτός ο κυβερνήτης ...

Το παιδί που αυτή τη στιγμή έχει την μπάλα είναι ο κυβερνήτης. Αυτος λεει:

- Σήμερα είμαι κυβερνήτης.

- Τρέχω από τον στρογγυλό χορό.

Τρέχει γύρω από τον κύκλο, βάζει την μπάλα στο πάτωμα ανάμεσα σε δύο παίκτες. Τα παιδιά λένε σε χορωδία:

Ένα, δύο, μη λαλήσεις

Και τρέξε σαν φωτιά!

Οι παίκτες τρέχουν σε κύκλο σε αντίθετες κατευθύνσεις, προσπαθώντας να αρπάξουν την μπάλα πριν από τον σύντροφό τους. Αυτός που τρέχει πρώτος και πιάνει την μπάλα, την κυλάει κυκλικά. Το παιχνίδι συνεχίζεται.

συστάσεις

Κυλήστε ή πετάξτε την μπάλα μόνο σε έναν κοντινό παίκτη. Δεν μπορείτε να παρέμβετε σε έναν παίκτη που τρέχει γύρω από τον κύκλο. Αυτός που άγγιξε πρώτος την μπάλα κέρδισε.

MAOU "Beloyarsk δευτεροβάθμιο σχολείο No. 1"

Το παιχνίδι

«Βρες και σκάσε»

MAOU "Beloyarsk δευτεροβάθμιο σχολείο No. 1"

Το παιχνίδι

"Εύρημα

που είναι κρυμμένο"

MAOU "Beloyarsk δευτεροβάθμιο σχολείο No. 1"

Το παιχνίδι

"Μαγική καρέκλα"

MAOU "Beloyarsk δευτεροβάθμιο σχολείο No. 1"

Το παιχνίδι

"επαγγέλματα"

Παιχνίδι "Βρείτε πού είναι κρυμμένο"

Στόχοι:

- μάθουν να πλοηγούνται σε ένα δωμάτιο ή σε έναν ιστότοπο.

- εκτελέστε ενέργειες σε ένα σήμα.

Το κοινό-στόχος:

Σχηματίστηκε UUD:επικοινωνιακός, ρυθμιστικός.

Περιεχόμενο

Οι παίκτες στέκονται κατά μήκος του τοίχου. Ο αρχηγός τους δείχνει ένα αντικείμενο και λέει ότι θα το κρύψει. Ο οικοδεσπότης προσκαλεί τους παίκτες να στραφούν στον τοίχο. Αφού βεβαιώθηκε ότι κανένα από τα παιδιά δεν κοιτάζει, κρύβει το αντικείμενο και μετά λέει: «Ήρθε η ώρα!». Τα παιδιά αρχίζουν να αναζητούν ένα αντικείμενο.

Το παιχνίδι "Βρες και μείνε σιωπηλός"

Στόχοι:

- μάθουν να πλοηγούνται στο διάστημα.

- εκπαιδεύστε την αντοχή, την εφευρετικότητα.

Το κοινό-στόχος:προσχολικής και πρωτοβάθμιας σχολικής ηλικίας.

Σχηματίστηκε UUD:επικοινωνιακός, ρυθμιστικός.

Περιεχόμενο

Ο οικοδεσπότης δείχνει στον παίκτη το αντικείμενο και αφού κλείσουν τα μάτια τους, το κρύβει. Μετά προσφέρεται να ψάξει, αλλά όχι να το πάρει, αλλά να πει στο αυτί σου πού είναι κρυμμένο. Όποιος βρήκε τον πρώτο είναι ο ηγέτης στο επόμενο παιχνίδι.

Παιχνίδι "Επαγγέλματα"

Στόχοι :

    ανάπτυξη της φαντασίας?

    ανάπτυξη παρατηρητικότητας, ενσυναίσθησης, εκφραστικότητας κινήσεων.

Το κοινό-στόχος: στομαθητές 1-5 τάξεων.

Σχηματίστηκε UUD:επικοινωνιακός, ρυθμιστικός.

Περιεχόμενο

Τα παιδιά, χωρισμένα σε ζευγάρια, δείχνουν εκφραστικές κινήσεις μεταξύ τους, σύμφωνα με τις οδηγίες ενός κορυφαίου, χαρούμενου και λυπημένου καλλιτέχνη, χορευτή, μαέστρου, παιδαγωγού, θυρωρού, οικοδόμου, μιμούμενοι τις κινήσεις που χαρακτηρίζουν άτομα αυτού του επαγγέλματος.

συστάσεις

Το ένα παιδί σε ένα ζευγάρι δείχνει ένα λυπημένο άτομο, το άλλο ένα χαρούμενο άτομο και κάθε φορά που αλλάζουν οι ρόλοι, τα παιδιά αλλάζουν ανάλογα με τη συναισθηματική τους παρουσίαση.

Παιχνίδι μαγική καρέκλα

Στόχοι :

    να βοηθήσει στην αύξηση της αυτοεκτίμησης του παιδιού.

    βοηθούν στη βελτίωση των σχέσεων μεταξύ των παιδιών.

Το κοινό-στόχος: στομαθητές 1-5 τάξεων.

Σχηματίστηκε UUD: προς τηνεπικοινωνιακός, προσωπικός.

Περιεχόμενο

Αυτό το παιχνίδι μπορεί να παιχτεί με μια ομάδα παιδιών για μεγάλο χρονικό διάστημα. Προηγουμένως, ένας ενήλικας πρέπει να μάθει την "ιστορία" του ονόματος κάθε παιδιού - την προέλευσή του, τι σημαίνει. Επιπλέον, είναι απαραίτητο να φτιάξετε ένα στέμμα και μια "Μαγική καρέκλα" - πρέπει να είναι απαραίτητα ψηλά. Ο ενήλικας διεξάγει μια σύντομη εισαγωγική συνομιλία σχετικά με την προέλευση των ονομάτων και στη συνέχεια λέει ότι θα μιλήσει για τα ονόματα όλων των παιδιών της ομάδας (η ομάδα δεν πρέπει να είναι περισσότερα από 5-6 άτομα) και τα ονόματα των ανήσυχων Τα παιδιά καλούνται καλύτερα στη μέση του παιχνιδιού. Αυτός που λέγεται το όνομά του γίνεται βασιλιάς. Σε όλη την ιστορία του ονόματός του, κάθεται σε ένα θρόνο φορώντας ένα στέμμα.

συστάσεις

ΣΤΟΣτο τέλος του παιχνιδιού, μπορείτε να προσκαλέσετε τα παιδιά να βρουν διαφορετικές παραλλαγέςτο όνομά του (ευγενικός, στοργικός). Μπορείτε επίσης να λέτε εναλλάξ κάτι ωραίο για τον βασιλιά.

MAOU "Beloyarsk δευτεροβάθμιο σχολείο No. 1"

Το παιχνίδι

"Δημοσιογράφοι"

MAOU "Beloyarsk δευτεροβάθμιο σχολείο No. 1"

Το παιχνίδι

"Συνεχίστε την ιστορία"

MAOU "Beloyarsk δευτεροβάθμιο σχολείο No. 1"

Το παιχνίδι

"Ο καλύτερος αστροναύτης"

MAOU "Beloyarsk δευτεροβάθμιο σχολείο No. 1"

Το παιχνίδι

"Μάντεψε ποιος είμαι;"

Το παιχνίδι "Συνεχίστε την ιστορία"

Στόχοι :

    συμβάλλει στη διαμόρφωση μιας κουλτούρας συμπεριφοράς, φιλικών συλλογικών σχέσεων.

    ενθαρρύνει τα παιδιά να φαντασιώνονται.

    αναπτύσσει την ομιλία.

Το κοινό-στόχος: ηλικία δημοτικού σχολείου.

Σχηματίστηκε UUD: προς τηνεπικοινωνιακός, προσωπικός.

Περιεχόμενο

Συνθέτουμε ένα παραμύθι, και μετά γυρίζουμε μια ταινία - συνέχεια του παραμυθιού. Μοιράζουμε εκ των προτέρων τους ρόλους των σεναριογράφων, του σκηνοθέτη, των ηθοποιών κ.λπ. Στη διαδικασία σύνθεσης ενός παραμυθιού, οι μαθητές μπορούν να προσφέρουν νέους χαρακτήρες ηθοποιών, επομένως η ανάπτυξη της πλοκής στις περισσότερες περιπτώσεις εξαρτάται άμεσα από τις ενέργειες που κάνουν οι συμμετέχοντες στο παιχνίδι.

Ο καθένας είναι ελεύθερος να επιλέξει τη δική του στρατηγική συμπεριφοράς, η οποία μόνο αρχικά είχε εγκατάσταση για ορισμένους περιορισμούς που καθορίζουν την εικόνα του χαρακτήρα που θα παίξει και τους κανόνες του παιχνιδιού.

Το παιχνίδι "Δημοσιογράφοι"

Στόχοι :

    σχηματισμός επαρκούς αυτοεκτίμησης.

    ανάπτυξη δημιουργικής δραστηριότητας ·

    δέσμευση των μελών της ομάδας.

Το κοινό-στόχος: μαθητές 5-11 τάξεων.

Σχηματίστηκε UUD: προς τηνεπικοινωνιακός, προσωπικός.

Περιεχόμενο

Επιλέγουμε τον αρχισυντάκτη του περιοδικού, η τάξη χωρίζεται σε «τμήματα» στα οποία οι δημοσιογράφοι εργάζονται για ένα συγκεκριμένο θέμα.

Ονομάζουμε το περιοδικό σύμφωνα με το θέμα του μαθήματος ή του μαθήματος, για παράδειγμα, "Το Κόκκινο Βιβλίο της Ρωσίας".

Καθήκον των μαθητών - δημοσιογράφων είναι να πάρουν ενδιαφέρον υλικό για το θέμα, να το συζητήσουν σε ομάδες, να το αναλύσουν και στη συνέχεια να «παρουσιάσουν το υλικό στο τεύχος». Στο τελευταίο στάδιο - μια συζήτηση για το περιοδικό που προκύπτει, ο καθένας πραγματοποιεί μια αυτοαξιολόγηση και αυτο-ανάλυση των δραστηριοτήτων του.

Αρχικά, οι μαθητές πρέπει να εξοικειωθούν με τους απαραίτητους κανόνες για την επιτυχία της επιχειρηματικής επικοινωνίας των μελών κάθε ομάδας στην οποία χωρίζεται η τάξη.

ώστε κάθε ομάδα να περιλαμβάνει μαθητές με διαφορετικά επίπεδαεκπαίδευση, και ο καθένας βρήκε μια δραστηριότητα ανάλογα με τα ενδιαφέροντά του.

Το παιχνίδι "Μάντεψε ποιος είμαι;"

Στόχοι :

    ανάπτυξη του προβληματισμού και της αυτογνωσίας.

    δημιουργικότητα, ενσυναίσθηση και ευαισθησία.

Το κοινό-στόχος: στομαθητές 1-5 τάξεων.

Σχηματίστηκε UUD: προς τηνεπικοινωνιακός, προσωπικός.

Περιεχόμενο

Τα παιδιά έχουν το καθήκον: να φανταστούν τον εαυτό τους στο ρόλο κάποιων ήρωας του παραμυθιού, συγγραφέας, καλλιτέχνης, ζώο και, έχοντας έρθει στην τάξη για μάθημα, κινείται και μιλά για λογαριασμό του. Μπορείτε να χρησιμοποιήσετε ομαδικούς ρόλους (για παράδειγμα, Κοκκινοσκουφίτσα και γκρι λύκος). Οι υπόλοιποι μαθητές πρέπει να μαντέψουν ποιος έγινε συμμαθητής τους.Ποιανού οι ιστορίες ήταν οι πιο ενδιαφέρουσες για εσάς; Σας άρεσε η εργασία;

συστάσεις

Είναι απαραίτητο να συμφωνήσετε εκ των προτέρων εάν είναι δυνατή η χρήση στοιχείων της φορεσιάς, του σκηνικού. Μετά το τέλος του παιχνιδιού, αναλύοντας τα αποτελέσματα της διεξαγωγής του, είναι απαραίτητο να σημειωθεί η επιτυχής εκτέλεση ενός συγκεκριμένου ρόλου, αλλά σε καμία περίπτωση δεν πρέπει να γίνονται άμεσα σχόλια αξιολόγησης, διαφορετικά την επόμενη φορά το παιδί απλά δεν θέλει να παίξει και αρνείται να συμμετάσχει.

Το παιχνίδι "Ο καλύτερος αστροναύτης"

Στόχος: το παιχνίδι βοηθά τα παιδιά να μάθουν να αξιολογούν και να εκτιμούν τη δουλειά των συντρόφων τους, υποστηρίζει την επιθυμία του παιδιού να μάθει κάτι νέο.

Το κοινό-στόχος: στομαθητές 1-5 τάξεων.

Σχηματίστηκε UUD: εκπαιδευτικό, ναεπικοινωνιακός, προσωπικός.

Περιεχόμενο

Ο δάσκαλος/συντονιστής σχεδιάζει 10 ρουκέτες με διαφορετικούς αριθμούς στον πίνακα. 11 μαθητές καλούνται ταυτόχρονα. Γύρω από το τραπέζι, όπου απλώνονται κάρτες με παραδείγματα, τα παιδιά περπατούν πιασμένα χέρι χέρι και απαγγέλλουν:

«Γρήγοροι πύραυλοι μας περιμένουν να περπατήσουμε γύρω από τους πλανήτες. Ό,τι θέλουμε, σε τέτοια θα πετάξουμε! Αλλά υπάρχει ένα μυστικό στο παιχνίδι: δεν υπάρχει χώρος για καθυστερημένους.

Μόλις ειπωθεί η τελευταία λέξη, ο δάσκαλος δίνει σε κάθε μαθητή κάρτες με παραδείγματα που κωδικοποιούν τον αριθμό του πυραύλου πάνω στον οποίο θα πετάξει ο αστροναύτης. Τα παιδιά λύνουν παραδείγματα προσδιορίζοντας τον αριθμό του πυραύλου τους και γράφουν το παράδειγμα κάτω από τον αντίστοιχο αριθμό πυραύλου.

συστάσεις

Μπορεί να χρησιμοποιηθεί σε διαφορετικά μαθήματα και τάξεις αλλάζοντας τα παραδείγματα σε άλλους τύπους εργασιών.

MAOU "Beloyarsk δευτεροβάθμιο σχολείο No. 1"

Προς την καλλιτεχνική βιβλιοθήκη παιχνιδιών

MAOU "Beloyarsk δευτεροβάθμιο σχολείο No. 1"

Το παιχνίδι

«Σκοποβολή»

MAOU "Beloyarsk δευτεροβάθμιο σχολείο No. 1"

Το παιχνίδι

"Ζωολογικό ντόμινο"

MAOU "Beloyarsk δευτεροβάθμιο σχολείο No. 1"

Το παιχνίδι

"Ποιός είμαι?"

Το παιχνίδι «Σκοποβολή»

Στόχος : το παιχνίδι βοηθά τα παιδιά να μάθουν να αξιολογούν και να εκτιμούν τη δουλειά των συντρόφων τους, υποστηρίζει την επιθυμία του παιδιού να μάθει κάτι νέο, αναπτύσσει την ακρίβεια.

Το κοινό-στόχος: μαθητές 2-6 τάξεων.

Σχηματίστηκε UUD: προς τηνεπικοινωνιακό, προσωπικό, ρυθμιστικό.

Περιεχόμενο

Εργασία σε ζευγάρια (αμοιβαία αξιολόγηση). Κάθε παιδί λαμβάνει ένα έντυπο για εργασία, γράφει το όνομά του στο πίσω μέρος και σχεδιάζει τρεις γραμμές για αξιολόγηση. Οι κανόνες του παιχνιδιού παρουσιάζονται από τον δάσκαλο με έναν από τους μαθητές στον πίνακα. Παιδί - ο σκοπευτής παίρνει την κιμωλία και τη βάζει στην αιχμή του «πιστολιού». Ο δάσκαλος-διοικητής διατάζει: «Ετοιμάσου – στόχευσε – φωτιά!». Στη λέξη "plee" ο σκοπευτής οδηγεί τη γραμμή στον στόχο. Ο δάσκαλος αξιολογεί το αποτέλεσμα ως εξής: εάν πυροβολείτε με ακρίβεια, τότε η σφαίρα πρέπει να πετάει ευθεία και γρήγορα στον στόχο. 2η προσπάθεια. Τα ζευγάρια έπρεπε να συμφωνήσουν για το ποιος θα σουτάρει πρώτος.συστάσεις

Το παιχνίδι ξεκινά και τελειώνει με μια κλήση. Ο διοικητής αξιολογεί τη «βολή» με τα κριτήρια «ακρίβεια», «ταχύτητα», αν η σφαίρα πέταξε ομαλά. Ο διοικητής βάζει μια αξιολόγηση στο φυλλάδιο του σκοπευτή. Όποιος θέλει να ευχαριστήσει τον διοικητή του για δικαιοσύνη, του σφίγγει το χέρι.

Μεταγλωττιστές

    Brovkina L.A.,

    Grigoryeva E.A., καθηγητής φυσικής, MAOU "Beloyarsk δευτεροβάθμιο σχολείο No. 1"

    Ezhova N.A.,

    Κριούκοβα Ε.Μ., δάσκαλος-διοργανωτής MAOU "Beloyarsk δευτεροβάθμιο σχολείο No. 1"

    Filimonova M.I., καθηγητής μαθηματικών, MAOU "Beloyarsk δευτεροβάθμιο σχολείο No. 1"

    Khamitova A.G., δάσκαλος δημοτικού σχολείου MAOU "Beloyarsk δευτεροβάθμιο σχολείο No. 1"

    Shnaider A.V., δάσκαλος δημοτικού σχολείου MAOU "Beloyarsk δευτεροβάθμιο σχολείο No. 1"

    Yurina L.N., καθηγητής ιστορίας και κοινωνικών σπουδών, MAOU "Beloyarsk δευτεροβάθμιο σχολείο No. 1"

Παιχνίδι "Ποιος είμαι;"

Στόχος: σχηματισμός και αξιολόγηση του επιπέδου σχηματισμού προσωπικού προβληματισμού, με στόχο την κατανόηση από τους εφήβους των κινήτρων, των αναγκών, των φιλοδοξιών τους, της χρήσης επιθέτων.

Το κοινό-στόχος: στομαθητές 5-8 τάξεων.

Σχηματίστηκε UUD: προσωπικός.

Περιεχόμενο

1. Ρύθμιση για το μάθημα. Κάθε μαθητής λαμβάνει εικόνες με μια συμβολική εικόνα της διάθεσής του - ένα χαρούμενο ανθρωπάκι, ουδέτερο, λυπημένο. Σε ένα προπαρασκευασμένο κουτί, όλοι κατεβάζουν το ανθρωπάκι με τη διάθεση που του αντιστοιχεί στην αρχή του μαθήματος. Ο δάσκαλος ανοίγει το κουτί και αναφέρει τη διάθεση με την οποία ήρθαν τα περισσότερα παιδιά. Αν η διάθεση είναι λυπημένη, μάθετε τι συνέβη. Σετ με θετικό τρόπο.2. Κάνουμε κομπλιμέντα. Κάθε μαθητής κάνει κομπλιμέντα στον διπλανό του - φαίνεται καλός, έχει μια ωραία μπλούζα κ.λπ.3. Ενδοσκόπηση. Ποιός είμαι? Όλοι γράφουν (βάσει μιας προπαρασκευασμένης λίστας λέξεων που μπορούν να χρησιμοποιήσουν οι μαθητές - αστείοι, γενναίοι, συνεσταλμένοι, πνευματώδεις, μοχθηροί, δίκαιοι κ.λπ.). Κάθε μαθητής, χωρίς να δείξει το χαρτί του, πηγαίνει στον πίνακα, κάθεται σε μια καρέκλα και ακούει τις απόψεις των συμμαθητών του για τον εαυτό του. Πόσα ματς - τόσοι βαθμοί.

Ζωολογικό παιχνίδι ντόμινο

Στόχος: ενίσχυση της γνώσης των μαθητών για τα άγρια ​​και οικόσιτα ζώα. εκπαίδευση ευφυΐας και προσοχής. Το κοινό-στόχος: στομαθητές 1-5 τάξεων.

Σχηματίστηκε UUD: εκπαιδευτικός, επικοινωνιακός.

Περιεχόμενο κανόνας παιχνιδιού Ο πρώτος παίκτης που θα αφήσει κάτω όλα τα χαρτιά του είναι ο νικητής. Οι ενέργειες του παιχνιδιού συνδυάζουν την προσοχή, την ικανότητα να μην παραλείπετε μια κίνηση και να βάζετε την κάρτα σας στην ώρα σας.Πρόοδος παιχνιδιού . Οι κάρτες απεικονίζουν άγρια ​​και οικόσιτα ζώα. Τα υποκείμενα χωρίστηκαν σε μικροομάδες (4 άτομα η καθεμία). Οι κάρτες είναι απλωμένες με την όψη προς τα κάτω. Οι μικρότεροι μαθητές κλήθηκαν να μετρήσουν 6 κάρτες. Στη συνέχεια, ο δάσκαλος υπενθυμίζει τους κανόνες του παιχνιδιού: μπορείτε μόνο να βάλετε την ίδια εικόνα δίπλα-δίπλα.συστάσεις

Εάν η επιθυμητή εικόνα δεν είναι διαθέσιμη, τότε το παιδί παραλείπει μια στροφή. Εάν ένας από τους παίκτες μείνει χωρίς φύλλα, θεωρείται νικητής του παιχνιδιού. Το παιχνίδι επαναλαμβάνεται, αλλά τα φύλλα μετακινούνται και μοιράζονται άλλα φύλλα καμβά..

Αναστοχαστικό παιχνίδι

Αναστοχαστικό παιχνίδι- η διαδικασία της κοινωνικής αλληλεπίδρασης, κατά την οποία καθένας από τους συμμετέχοντες στο παιχνίδι ασκεί αντανακλαστικό έλεγχο (ο συγγραφέας του όρου είναι ο V. A. Lefevre) από άλλους συμμετέχοντες, προσπαθώντας να εφαρμόσει τη στρατηγική διαχείρισης του για να σχηματίσει τη δική του εκδοχή της κοινωνικής πραγματικότητας (υλοποίηση ένα έργο κοινωνικής καινοτομίας). Στο χώρο ενός αντανακλαστικού παιχνιδιού, οι τεχνολογίες κοινωνικής διαχείρισης δοκιμάζονται για αποτελεσματικότητα, επομένως το κέρδος σε ένα τέτοιο παιχνίδι είναι η αύξηση του επιπέδου δεξιοτήτων.

Το αντανακλαστικό παιχνίδι ως είδος κοινωνικής αλληλεπίδρασης

Το αντανακλαστικό παιχνίδι αναφέρεται σε παιχνίδια ανοιχτού τύπου. Σε αντίθεση με τα παιχνίδια που προχωρούν σύμφωνα με ένα σενάριο και σύμφωνα με προκαθορισμένους κανόνες (όπως επαγγελματικά παιχνίδια ή παιχνίδια ρόλων), τα αντανακλαστικά παιχνίδια είναι μια διαδικασία κοινωνικής αλληλεπίδρασης κατά την οποία οι ρόλοι, οι κανόνες και οι κινήσεις πλοκής δημιουργούνται από τους συμμετέχοντες ακριβώς στο πορεία της δράσης του παιχνιδιού. Ταυτόχρονα, η πορεία του αντανακλαστικού παιχνιδιού μπορεί να ελεγχθεί χρησιμοποιώντας τα ατομικά προσωπικά χαρακτηριστικά των συμμετεχόντων, τη διαμόρφωση των επιχειρηματικών και προσωπικών τους ενδιαφερόντων, τις προτιμήσεις, τις προσδοκίες, τους στόχους, τους φόβους και τους πειρασμούς.

Σε ένα αντανακλαστικό παιχνίδι, το πλεονέκτημα δίνεται σε αυτόν που είναι πιο εξοπλισμένος με τα εργαλεία διαχείρισης ανθρώπων και κοινωνικών διαδικασιών, σε αυτόν που είναι πιο εξελιγμένος στην ανάλυση και τον υπολογισμό καταστάσεων κοινωνικής αλληλεπίδρασης. Από όλους υπάρχουσες επιλογέςαντανακλαστικά παιχνίδια, τα πιο διάσημα είναι τα ODI (παιχνίδια οργανωτικής δραστηριότητας), τα οποία χρησιμοποιήθηκαν για πρώτη φορά για επίλυση κοινωνικά καθήκοντα G. P. Shchedrovitsky. Ωστόσο, υπάρχουν και άλλες ποικιλίες αντανακλαστικών παιχνιδιών που αναπτύχθηκαν από μαθητές, οπαδούς και ακόμη και ένθερμους αντιπάλους του G. P. Shchedrovitsky.

Τυπολογία αντανακλαστικών παιχνιδιών

Κάθε ανακλαστικό παιχνίδι έχει εργασία ή σύνολο εργασιώνπου πρέπει να λύσει από τους συμμετέχοντες. Σύμφωνα με τις εργασίες που επιλύονται κατά τη διάρκεια των αντανακλαστικών παιχνιδιών, μπορούν να χωριστούν σε δύο τύπους.

Προς την πρώτου τύπουπεριλαμβάνουν αντανακλαστικά παιχνίδια, το κύριο καθήκον των οποίων είναι η δημιουργία συνθηκών για την ατομική ανάπτυξη των συμμετεχόντων. Τα αντανακλαστικά παιχνίδια του πρώτου τύπου μπορούν να χρησιμοποιηθούν για επαγγελματική κατάρτιση ή επανεκπαίδευση συμμετεχόντων που δεν αποτελούν στοιχεία κάποιου κοινωνικού συστήματος. Τα αντανακλαστικά παιχνίδια του πρώτου τύπου μπορούν να χρησιμοποιηθούν για τον εντοπισμό και την ανάπτυξη πολιτισμικών και μυθολογικών στερεοτύπων και στάσεων που είναι χαρακτηριστικά των συμμετεχόντων. Μπορούν επίσης να χρησιμοποιηθούν για το σχηματισμό μεγαμηχανών (κοινωνικά συστήματα που αποτελούνται από στοιχεία και μέρη άλλων κοινωνικών συστημάτων) - για παράδειγμα, κατά τη διάρκεια πολιτικών εκστρατειών ή εθνικών (ή διακρατικών) έργων, η υλοποίηση των οποίων περιλαμβάνει τις δυνατότητες μεγάλου αριθμού διαφορετικών κοινωνικά συστήματα.

Co. δεύτερου τύπουπεριλαμβάνουν αντανακλαστικά παιχνίδια, κύριο καθήκον των οποίων είναι η δημιουργία κοινωνικής καινοτομίας που θα αλλάξει το κοινωνικό σύστημα, στοιχεία του οποίου είναι τα υποκείμενα-συμμετέχοντες. Τέτοια παιχνίδια μπορούν να χρησιμοποιηθούν για την υλοποίηση τέτοιων ειδικών δραστηριοτήτων για την ανάπτυξη κοινωνικών συστημάτων όπως η συμβουλευτική διαχείρισης.

Reflective Game Project

Τα αντανακλαστικά παιχνίδια του πρώτου και του δεύτερου τύπου διεξάγονται υπό τον έλεγχο μιας ομάδας τεχνικών παιχνιδιών που διασφαλίζουν μια τέτοια ροή της διαδικασίας του παιχνιδιού, κατά την οποία επιλύονται οι εργασίες που έχουν ανατεθεί στο παιχνίδι. Για τη διεξαγωγή ενός αντανακλαστικού παιχνιδιού (πρώτου ή δεύτερου τύπου), χρειάζεται μια ομάδα τεχνικών παιχνιδιών έργο παιχνιδιού. Το έργο δημιουργείται από μια ομάδα μηχανικών παιχνιδιών υπό την καθοδήγηση μεθοδολόγων. (Μεθοδολόγος είναι ένας στοχαστής που είναι σε θέση να αναπτύξει νέες προσεγγίσεις στο σχεδιασμό αντανακλαστικών παιχνιδιών, χρησιμοποιώντας τη συσκευή μεθοδολογικής σκέψης για αυτό (βλ. μεθοδολογία SMD)). Η διαδικασία δημιουργίας ενός έργου παιχνιδιού μπορεί να ονομαστεί μεταπαιχνίδι, το οποίο πραγματοποιείται από μεθοδολόγους με μια ομάδα τεχνικών παιχνιδιών την παραμονή ενός αντανακλαστικού παιχνιδιού. Κατά τη διάρκεια του σχεδιασμού του παιχνιδιού, μια ομάδα τεχνικών παιχνιδιών επεξεργάζεται προσεκτικά διαγνωστικές πληροφορίες (πληροφορίες για τους συμμετέχοντες και για το κοινωνικό σύστημα (συστήματα), στοιχεία του οποίου είναι τα υποκείμενα-συμμετέχοντες), λεπτομερώς τα θέματα και τα νοήματα γύρω από τα οποία Η συζήτηση θα χτιστεί μέσα στις ομάδες και κατά τη διάρκεια του παιχνιδιού, ο καθορισμός του καλύτερου για την επίλυση αυτού του προβλήματος είναι ένας τρόπος για να χωριστούν οι παίκτες σε ομάδες και να υπολογιστεί η δυναμική της αλληλεπίδρασης μεταξύ των ομάδων και των διαομαδικών παιχνιδιών.

Οργανωτική δομή του αντανακλαστικού παιχνιδιού

Τα αντανακλαστικά παιχνίδια του πρώτου και του δεύτερου τύπου μπορούν να προχωρήσουν μόνο υπό την προϋπόθεση ότι ένα άκαμπτο οργανωτική δομή του παιχνιδιού(διαχωρισμός των συμμετεχόντων σε ομάδες, καθεμία από τις οποίες έχει οριστεί τουλάχιστον ένας τεχνικός παιχνιδιών, καθορισμός των χρονικών ρυθμίσεων για εκδηλώσεις παιχνιδιού, καθορισμός των μορφών ενδοομαδικής και γενικής επικοινωνίας παιχνιδιού και αυστηρή δελτίοεπικοινωνία). Η δομή του παιχνιδιού είναι μια μετα-κανόνα που κρατά η ομάδα των τεχνικών παιχνιδιών σε σχέση με τους παίκτες. Οι παίκτες έχουν μεγάλη ελευθερία, ωστόσο, αυτή η ελευθερία περιορίζεται από σαφώς καθορισμένα όρια, για παράδειγμα: οι παίκτες δεν μπορούν να μετακινηθούν από ομάδα σε ομάδα, η ομάδα δεν μπορεί να υπερβεί τον χρόνο που έχει διατεθεί για την αναφορά κατά τη γενική συνάντηση του παιχνιδιού, η ομάδα πρέπει να αναφέρει ξεκάθαρα το θέμα της αναφοράς και να μην παρεκκλίνουμε από αυτό, μπορείτε να κάνετε ερωτήσεις για κατανόηση της αναφοράς, αλλά δεν μπορείτε να τις ανακατεύετε με κρίσεις για όσα ακούσατε στην έκθεση, δεν μπορείτε να κάνετε ερωτήσεις σχετικά με ό,τι δεν υπήρχε στην έκθεση αναφορά, κ.λπ. Οι κανόνες, οι κανόνες και τα στοιχεία της οργανωτικής δομής του αντανακλαστικού παιχνιδιού μπορεί να διαφέρουν ανάλογα με τις προτιμήσεις και τις μεθόδους που χρησιμοποιούνται από την ομάδα τυχερών παιχνιδιών και τους μεθοδολόγους που διεξάγουν το παιχνίδι.

Εκτίμηση των ενεργειών των παικτών, αυτοστοχασμός και αντανακλαστική κατάσταση

Υπάρχουν πάρα πολλοί κανόνες που κρατούν τη δομή του παιχνιδιού και η ομάδα των μηχανικών παιχνιδιών μπορεί να τα εφεύρει κατά τη διάρκεια της δράσης του παιχνιδιού. Βασικές κανονιστικές ερωτήσεις: «Τι κάνεις τώρα;» ή "Ποιο είναι το νόημα της δράσης σας εδώ και τώρα;" νιώθουν αρκετά άβολα ώστε να επιστήσουν την προσοχή του ομιλητή ή της ομάδας στη δική τους διαδικασία σκέψης, θέτοντάς τους έτσι σε μια αυτο-αντανακλαστική θέση. Όταν ένας παίκτης μαθαίνει, ενώ διατηρεί μια αυτοανακλαστική θέση, να θέτει στόχους, να σχεδιάζει και να εφαρμόζει ενέργειες και να αναλύει το αποτέλεσμα των ενεργειών που γίνονται, περνά σε μια αναστοχαστική κατάσταση και αποκτά έναν νέο βαθμό πνευματικής και δημιουργικής ελευθερίας, αφού από μια αναστοχαστική κατάσταση είναι σε θέση να εργαστεί με τις έννοιες των ενεργειών του και των άλλων ανθρώπων και να πραγματοποιήσει ενέργειες αντανακλαστικής διαχείρισης, η αποτελεσματικότητα των οποίων είναι σημαντικά υψηλότερη από εκείνη των ενεργειών που δεν πραγματοποιούνται από αντανακλαστική κατάσταση.

Υπάρχουν πολλά επίπεδα της ανακλαστικής κατάστασης ("ανακλαστικά επίπεδα" ή "ανακλαστικά επίπεδα"). Όσο περισσότερα αντανακλαστικά επίπεδα μπορεί να αναπτύξει ένας παίκτης (τόσο υψηλότερο είναι το αντανακλαστικό του δυναμικό), τόσο περισσότερες ευκαιρίες αποκτά στο σχεδιασμό κοινωνικών καινοτομιών, στη διαχείριση ανθρώπων και κοινωνικών διαδικασιών και στον υπολογισμό κοινωνικών καταστάσεων. Ένα θέμα με υψηλότερο αντανακλαστικό δυναμικό έχει σημαντικό πλεονέκτημα έναντι ενός θέματος του οποίου το αντανακλαστικό δυναμικό είναι χαμηλότερο.

Έτσι, το αντανακλαστικό παιχνίδι δεν επιβάλλει σε καμία περίπτωση θέματα ή επιλογές αυτοδιάθεσης στους παίκτες, αλλά δημιουργεί σε κάθε παίκτη μια μοναδική ευκαιρία να επεκτείνει τη σκέψη του και να αυξήσει τις αντανακλαστικές του δυνατότητες.

Βιβλιογραφία

  • S.A. Kutolin«Ανακλαστική λογοτεχνία»
  • S.A. Kutolin«Η λογοτεχνία ως φωτισμός με προβληματισμό»
  • Lefevre V. A.αντικρουόμενες δομές. Μ.: Σοβιετικό ραδιόφωνο, 1973;
  • Novikov D. A., Chkhartishvili A. G. Ανακλαστικά παιχνίδια. - Μ.: Sinteg, 2003.
  • Μακάρεβιτς Β. Ν.Πρακτικές παιχνιδιού, μεθοδολόγοι: η αόρατη κοινότητα «βγαίνει από το υπόγειο.//Σώτσης, 1992, N 7;
  • Kotlyarevsky Yu. L., Shantser A. S.Η τέχνη του μόντελινγκ και η φύση του παιχνιδιού. Μ., Πρόοδος, 1992. - 104 σ.;
  • Shchedrovitsky G.P.Επιλεγμένα έργα. Μ., Shk. Λατρεία. Πολιτ., 1995.

δείτε επίσης

Συνδέσεις

  • Shokhov A. S. Μέθοδος ζωντανής μοντελοποίησης στη μελέτη και συμβουλευτική οργανισμών

Ίδρυμα Wikimedia. 2010 .

Δείτε τι είναι το "Ανακλαστικό παιχνίδι" σε άλλα λεξικά:

    Παιχνίδι - αποκτήστε έναν έγκυρο κωδικό προσφοράς εκδοτικός οίκος MIF στο Academician ή αγοράστε ένα κερδοφόρο παιχνίδι με έκπτωση σε έκπτωση στον εκδοτικό οίκο MIF

    Ένα επιχειρηματικό παιχνίδι είναι μια μέθοδος προσομοίωσης της λήψης αποφάσεων από στελέχη ή ειδικούς σε διάφορες καταστάσεις παραγωγής, που πραγματοποιείται σύμφωνα με δεδομένους κανόνες από μια ομάδα ατόμων ή ένα άτομο με υπολογιστή σε διαδραστική λειτουργία, παρουσία συγκρούσεων ... ... Βικιπαίδεια

    Gaming, κοινότητα (gaming) που προέκυψε αρχικά στην ΕΣΣΔ και τώρα υπάρχει στη Ρωσία και τη Λευκορωσία ΜΕΓΑΛΗ ομαδαειδικοί που εξασκούν τη χρήση παιχνιδιών, μεθόδων παιχνιδιού σε διάφορους τομείς της δημόσιας ζωής: στην οικονομία, ... ... Wikipedia

    Ένα επιχειρηματικό παιχνίδι είναι μια μέθοδος προσομοίωσης της λήψης αποφάσεων από στελέχη ή ειδικούς σε διάφορες καταστάσεις παραγωγής, που πραγματοποιείται σύμφωνα με δεδομένους κανόνες από μια ομάδα ανθρώπων ή ένα άτομο με υπολογιστή σε διαδραστική λειτουργία, παρουσία συγκρούσεων ... ... Βικιπαίδεια

    - (Αγγλική εταιρεία πρακτικής άσκησης, πλασματική εταιρεία) μια ενεργή μορφή εκπαίδευσης μαθητών, σπουδαστών και εκπαιδευόμενων πρακτικών δραστηριοτήτων στην επιχείρηση. Μια εταιρεία κατάρτισης δημιουργείται με βάση ένα σχολείο, πρωτοβάθμια επαγγελματική, δευτεροβάθμια εξειδικευμένη ή ανώτερη ... ... Wikipedia

    Δραστηριότητες που στοχεύουν στη βελτίωση της αποτελεσματικότητας επιχειρήσεων, εταιρειών, οργανισμών. Περιεχόμενα 1 Τύποι συμβουλευτικής διαχείρισης 1.1 Στρατηγική συμβουλευτική ... Wikipedia

    - Διεθνές επιστημονικό και πρακτικό διεπιστημονικό περιοδικό «Reflexive processes and management». Ιδρυτές: Ινστιτούτο Ψυχολογίας της Ρωσικής Ακαδημίας Επιστημών και Lepsky Vladimir Evgenievich, με τη συμμετοχή του Ινστιτούτου Ανακλαστικών Διαδικασιών και Ελέγχου Από το 2001, έχουν δημοσιευτεί 2 ... ... Wikipedia

Εάν η δομή της επίγνωσης έχει πεπερασμένη πολυπλοκότητα, τότε μπορούμε να κατασκευάσουμε αντανακλαστικό γράφημα παιχνιδιού,που δείχνει ξεκάθαρα τη σχέση μεταξύ των ενεργειών των παραγόντων (τόσο πραγματικών όσο και φανταστικών) που συμμετέχουν στην ισορροπία.

Οι κορυφές αυτού του κατευθυνόμενου γραφήματος είναι οι ενέργειες r μι?+ που αντιστοιχεί σε ζεύγη μη πανομοιότυπες δομές informed™ /., ή στοιχεία της δομής ευαισθητοποίησης σε"ή απλά τον αριθμό r ενός πραγματικού ή φανταστικού πράκτορα, r e Z+.

Μεταξύ των κορυφών σχεδιάζονται τόξα σύμφωνα με τον ακόλουθο κανόνα: σε κάθε κορυφή x sτα τόξα αντλήθηκαν από - 1) κορυφές που αντιστοιχούν σε δομές I mp jμι Ν(/) Εάν δύο κορυφές συνδέονται με δύο αντίθετα κατευθυνόμενα τόξα, θα απεικονίσουμε μια άκρη με δύο βέλη.

Τονίζουμε ότι η γραφική παράσταση ενός αντανακλαστικού παιχνιδιού αντιστοιχεί στο σύστημα των εξισώσεων (2.3.1) (δηλαδή στον ορισμό της πληροφοριακής ισορροπίας), ενώ η λύση του μπορεί να μην υπάρχει.

Ο Κόμης λοιπόν σολ,αντανακλαστικό παιχνίδι Г (δείτε τον ορισμό ενός αντανακλαστικού παιχνιδιού στην προηγούμενη ενότητα), του οποίου η δομή πληροφοριών έχει πεπερασμένη πολυπλοκότητα, ορίζεται ως εξής:

  • - κορυφές γραφήματος G tαντιστοιχούν σε πραγματικούς και φανταστικούς πράκτορες που συμμετέχουν στο αντανακλαστικό παιχνίδι, δηλαδή σε ζεύγη μη ταυτόσημες δομές επίγνωσης.
  • - τόξα γραφημάτων G tαντικατοπτρίζουν την αμοιβαία επίγνωση των πρακτόρων: εάν υπάρχει μια διαδρομή από έναν πράκτορα (πραγματικό ή φάντασμα) σε έναν άλλο πράκτορα, τότε ο δεύτερος είναι επαρκώς ενημερωμένος για τον πρώτο.

Αν στις κορυφές του γραφήματος ΣΟΛ/αναπαριστούν τις αναπαραστάσεις του αντίστοιχου παράγοντα για την κατάσταση της φύσης και μετά το αντανακλαστικό παιχνίδι ΣΟΛ,με πεπερασμένη δομή συνειδητοποίησης / μπορεί να δοθεί ως πλειάδα Г, = (Ν,(Α)), ε N,f(), e ,v, ΣΟΛ/),όπου Ν- πολλοί πραγματικοί πράκτορες, Χ,- το σύνολο των παραδεκτών ενεργειών του z"-ου πράκτορα, φά(-) 0 x Χ -> 9;» - η αντικειμενική του συνάρτηση, / «ε N, G, -αντανακλαστικό γράφημα παιχνιδιού.

Σημειώστε ότι σε πολλές περιπτώσεις είναι πιο βολικό (και οπτικό) να περιγράψετε ένα αντανακλαστικό παιχνίδι με βάση το γράφημα ΣΟΛ/,όχι το δέντρο δομής πληροφοριών.

Εξετάστε διάφορα παραδείγματα εύρεσης πληροφοριακής ισορροπίας.

Παραδείγματα 2.4.1-2.4.3. Αυτά τα παραδείγματα περιλαμβάνουν τρεις πράκτορες με αντικειμενικές λειτουργίες της ακόλουθης μορφής:

όπου Xi> 0, / € Ν= (1, 2, 3}; σε e 0 = (1, 2).

Για συντομία, θα καλέσουμε τον πράκτορα που πιστεύει ότι η ζήτηση είναι χαμηλή (0= 1), απαισιόδοξος και αυτός που πιστεύει ότι η ζήτηση είναι υψηλή (0 = 2) είναι αισιόδοξος. Έτσι, στα παραδείγματα 2.4.1-2.4.3, οι καταστάσεις διαφέρουν μόνο λόγω διαφορετικών δομών επίγνωσης.

Παράδειγμα 2.4.1. Οι δύο πρώτοι πράκτορες ας είναι αισιόδοξοι και ο τρίτος απαισιόδοξος, και οι τρεις είναι εξίσου ενημερωμένοι. Στη συνέχεια, σύμφωνα με τη Δήλωση 2.2.5, για οποιαδήποτε έναμι Εγώοι ταυτότητες /st] = /b/st2 = η, Dz = h-

Σύμφωνα με την ιδιότητα 2 του ορισμού της ισορροπίας πληροφοριών, Χ*.

Μπορεί να φανεί ότι οποιαδήποτε δομή επίγνωσης είναι πανομοιότυπη με μία από τις τρεις που αποτελούν τη βάση: (/b/2, D). Επομένως, η πολυπλοκότητα αυτής της δομής συνειδητοποίησης είναι ίση με τρία και το βάθος είναι ίσο με ένα. Το γράφημα του αντανακλαστικού παιχνιδιού φαίνεται στο Σχ. οκτώ.

Ρύζι. οκτώ.


Έτσι, οι ενέργειες των πρακτόρων σε μια κατάσταση πληροφοριακής ισορροπίας θα είναι οι εξής: X! = x 2 =1/2, =0.*

Παράδειγμα 2.4.2. Ας είναι οι δύο πρώτοι πράκτορες αισιόδοξοι και ο τρίτος ένας απαισιόδοξος που θεωρεί όλους τους παράγοντες της αμαρτίας εξίσου ενημερωμένους απαισιόδοξους. Οι δύο πρώτοι πράκτορες είναι εξίσου ενημερωμένοι και και οι δύο είναι επαρκώς ενημερωμένοι για τον τρίτο πράκτορα.

Εχουμε: I x ~ I 2 , I >η, η > η,1 ~z Ι 2~z η? Το γράφημα του αντανακλαστικού παιχνιδιού φαίνεται στο Σχ. 9.

Ρύζι. 9.

Αυτές οι συνθήκες μπορούν να γραφτούν ως οι ακόλουθες ταυτότητες, οι οποίες ισχύουν για οποιοδήποτε ae I (χρησιμοποιούμε τους αντίστοιχους ορισμούς και δηλώσεις 2.2.1, 2.2.2 και 2.2.5):

12а = ha, 1а = χα, χα = χα, hla = χα, χα = h, ha2 = γεια, hal = h-

Παρόμοιες σχέσεις ισχύουν για ενέργειες ισορροπίας Χ". Οι αριστερές πλευρές αυτών των ταυτοτήτων δείχνουν ότι οποιαδήποτε δομή 1 σελγια το |c|>2 είναι πανομοιότυπο με κάποια δομή fn |r|

Έτσι, η πολυπλοκότητα αυτής της δομής συνειδητοποίησης είναι ίση με πέντε και το βάθος είναι ίσο με δύο.

Για να βρεθεί η πληροφοριακή ισορροπία, είναι απαραίτητο να λυθεί το ακόλουθο σύστημα εξισώσεων (βλ. έκφραση (2.3.1)):


Έτσι, οι ενέργειες των πραγματικών παραγόντων σε μια κατάσταση πληροφοριακής ισορροπίας θα είναι οι εξής: \u003d x 2\u003d 9/20, x 3 * \u003d 1/5.

Παράδειγμα 2.4.3. Ας είναι και οι τρεις πράκτορες αισιόδοξοι, ο πρώτος και ο δεύτερος αλληλοενημερώνονται, ο δεύτερος και ο τρίτος επίσης αλληλοενημερώνονται. Σύμφωνα με τον πρώτο πράκτορα, ο τρίτος θεωρεί ότι και οι τρεις είναι εξίσου ενημερωμένοι απαισιόδοξοι. επίσης ο πρώτος πράκτορας, κατά τη γνώμη του τρίτου, θεωρεί και τους τρεις εξίσου ενημερωμένους απαισιόδοξους.

Έχουμε: D x D, / 2>

Αυτές οι συνθήκες μπορούν να γραφτούν ως οι ακόλουθες ταυτότητες, οι οποίες ισχύουν για οποιαδήποτε α ε Ι(χρησιμοποιούμε τους αντίστοιχους ορισμούς και δηλώσεις 2.2.1, 2.2.2 και 2.2.5):

Παρόμοιες σχέσεις ισχύουν για ενέργειες ισορροπίας x σελ.

Οι αριστερές πλευρές αυτών των ταυτοτήτων δείχνουν ότι οποιαδήποτε δομή 1 Πγια |oj > 3 είναι πανομοιότυπο με κάποια δομή /„ |m| 1, A, /3, /sz /13, /sv /132? hn,/sv-

Έτσι, η βάση σχηματίζεται από τις ακόλουθες κατά ζεύγη διαφορετικές δομές: (/b />, /3, /зз /в, /lb) - Η πολυπλοκότητα αυτής της δομής συνειδητοποίησης είναι ίση με έξι και το βάθος είναι ίσο με τρία. Το γράφημα του αντίστοιχου αντανακλαστικού παιχνιδιού φαίνεται στο Σχ. δέκα.

Ρύζι. δέκα.

Για να βρεθεί η πληροφοριακή ισορροπία, είναι απαραίτητο να λυθεί το ακόλουθο σύστημα εξισώσεων (βλ. έκφραση (2.3.1)):

Έτσι, οι ενέργειες των πραγματικών πρακτόρων σε μια κατάσταση πληροφοριακής ισορροπίας θα είναι οι εξής: x, = x 3 =17/35, x 2 * = 12/35.

Έχοντας ολοκληρώσει την περιγραφή του γραφήματος ενός αντανακλαστικού παιχνιδιού, συνεχίζουμε να μελετάμε τις ιδιότητες της πληροφοριακής ισορροπίας.

Μπορείτε να γράψετε μια κριτική βιβλίου και να μοιραστείτε τις εμπειρίες σας. Οι άλλοι αναγνώστες θα ενδιαφέρονται πάντα για τη γνώμη σας για τα βιβλία που έχετε διαβάσει. Είτε σας άρεσε το βιβλίο είτε όχι, εάν δώσετε τις ειλικρινείς και λεπτομερείς σκέψεις σας, τότε οι άνθρωποι θα βρουν νέα βιβλία που είναι κατάλληλα για αυτούς.

Ρωσική Ακαδημία Science Institute of Management Problems. V.A. Trapeznikova D.A. NOVIKOV, A.G. CHKHARTISHVILI REFLECTIVE GAMES SINTEG Moscow - 2003 UDC 519 BBC 22.18 N 73 Novikov D.A., Chkhartishvili A.G. Παιχνίδια Reflexive H 73. Μ.: SINTEG, 2003. - 149 σελ. ISBN 5-89638-63-1 Η μονογραφία είναι αφιερωμένη στη συζήτηση των σύγχρονων προσεγγίσεων στη μαθηματική μοντελοποίηση του προβληματισμού. Οι συγγραφείς εισάγουν μια νέα κατηγορία μοντέλων θεωρητικών παιγνίων - αντανακλαστικά παιχνίδια που περιγράφουν την αλληλεπίδραση υποκειμένων (πρακτόρων) που λαμβάνουν αποφάσεις με βάση μια ιεραρχία ιδεών για βασικές παραμέτρους, ιδέες για αναπαραστάσεις κ.λπ. Μια ανάλυση της συμπεριφοράς των παραγόντων φάντασμα που υπάρχουν στις αναπαραστάσεις άλλων πραγματικών ή φανταστικών πρακτόρων και των ιδιοτήτων μιας δομής πληροφοριών που αντικατοπτρίζει την αμοιβαία επίγνωση πραγματικών και φανταστικών πρακτόρων μας επιτρέπει να προτείνουμε μια ισορροπία πληροφοριών ως λύση σε ένα αντανακλαστικό παιχνίδι , που είναι μια γενίκευση μιας σειράς γνωστών εννοιών ισορροπίας σε μη συνεργατικά παιχνίδια. Τα στοχαστικά παιχνίδια καθιστούν δυνατή: - τη μοντελοποίηση της συμπεριφοράς των στοχαστικών θεμάτων. - να μελετήσει την εξάρτηση των αποδοχών των πρακτόρων από τις τάξεις του προβληματισμού τους. - Ρύθμιση και επίλυση προβλημάτων αντανακλαστικού ελέγχου. - περιγράφει ομοιόμορφα πολλά φαινόμενα που σχετίζονται με τον προβληματισμό: κρυφός έλεγχος, έλεγχος πληροφοριών μέσω των μέσων ενημέρωσης, προβληματισμός στην ψυχολογία, έργα τέχνης και άλλα.Το βιβλίο απευθύνεται σε ειδικούς στον τομέα της μαθηματικής μοντελοποίησης και διαχείρισης κοινωνικοοικονομικών συστημάτων, καθώς και σε φοιτητές και μεταπτυχιακούς φοιτητές. Κριτές: Διδάκτωρ Τεχνικών Επιστημών, καθ. V.N. Burkov, Διδάκτωρ Τεχνικών Επιστημών, καθ. A.V. Shchepkin UDC 519 BBC 22.18 N 73 ISBN 5-89638-63-1 Ó D.A. Chkhartishvili, 2 2003 ΠΕΡΙΕΧΟΜΕΝΑ ΕΙΣΑΓΩΓΗ ......................................... .......................................................... ..... .......... 4 ΚΕΦΑΛΑΙΟ 1. Πληροφορίες στη λήψη αποφάσεων .......................... ........ ........... 21 1.1. Ατομική Λήψη Αποφάσεων: Ένα Μοντέλο Ορθολογικής Συμπεριφοράς.......................................... ...................................................... .......................... ................................ ..... 21 1.2. Διαδραστική λήψη αποφάσεων: παιχνίδια και ισορροπίες .............................. 24 1.3. Γενικές προσεγγίσεις για την περιγραφή της επίγνωσης................................................ ..... 31 ΚΕΦΑΛΑΙΟ 2. Στρατηγικός προβληματισμός....... ................................ ................. 34 2.1. Στρατηγικός προβληματισμός σε παιχνίδια δύο ατόμων .......................................... ... 34 2.2. Αντανάκλαση σε παιχνίδια bimatrix .............................................. ................ .......... 41 2.3. Περιορισμός του βαθμού αντανάκλασης .............................................. ................................. 57 ΚΕΦΑΛΑΙΟ 3. Πληροφοριακός προβληματισμός ............ ................................. 60 3.1. Πληροφοριακός προβληματισμός σε παιχνίδια δύο ατόμων .......................................... ... 60 3.2. Δομή πληροφοριών του παιχνιδιού ...................................................... ................. .............. 64 3.3. Ισοζύγιο πληροφοριών ................................................... .............. ................... 71 3.4. Γράφημα ενός αντανακλαστικού παιχνιδιού .............................................. .................................. 76 3.5. Τακτικές δομές ευαισθητοποίησης................................................ ................. 82 3.6. Ο βαθμός του προβληματισμού και της πληροφοριακής ισορροπίας .......................................... ... 91 3.7. Ανακλαστικός έλεγχος ..................................................... .................................. 102 ΚΕΦΑΛΑΙΟ 4. Εφαρμοσμένα μοντέλα αντανακλαστικών παιχνιδιών ................................. 102 ............. 106 4.1 . Κρυφός έλεγχος ..................................................... ................................................................ .. 106 4.2. Διαχείριση Μέσων Μαζικής Ενημέρωσης και Πληροφοριών ............................................ ................. ...... 117 4.3. Αντανάκλαση στην ψυχολογία ..................................................... .................................. 121 4.3.1. Ψυχολογία της σκακιστικής δημιουργικότητας.............. ................................. 121 4.3.2. Ανάλυση συναλλαγών ..................................................... .............. ................. 124 4.3.3. Παράθυρο Johari ................................................ .. ................................. 126 4.3.4. Μοντέλο Ηθικής Επιλογής ..................................................... ................................ 128 4.4. Προβληματισμός σε έργα τέχνης................................................ .. 129 ΣΥΜΠΕΡΑΣΜΑ..... ...................................... ........ ...................................... 137 ΛΟΓΟΤΕΧΝΙΑ .. .......................................................... .......................................................... ........ 142 3 - Τα Minnows γλεντάνε ελεύθερα, αυτή είναι η χαρά τους! - Δεν είσαι ψάρι, πώς ξέρεις ποια είναι η χαρά της; «Δεν είσαι εγώ, πώς ξέρεις τι ξέρω και τι δεν ξέρω;» Από μια ταοϊστική παραβολή - Το θέμα, φυσικά, σεβάσμιε αρχιεπίσκοπε, είναι ότι πιστεύεις σε αυτό που πιστεύεις επειδή ανατράφηκες έτσι. - Ισως. Αλλά το γεγονός παραμένει ότι κι εσύ πιστεύεις ότι πιστεύω αυτό που πιστεύω, γιατί έτσι ανατράφηκα, για τον λόγο ότι έτσι ανατράφηκες κι εσύ. Από το βιβλίο «Κοινωνική Ψυχολογία» του D. Myers ουσιαστικές παράμετροι, αναπαραστάσεις περί αναπαραστάσεων κ.λπ. Αντανάκλαση. Μία από τις θεμελιώδεις ιδιότητες της ανθρώπινης ύπαρξης είναι ότι, μαζί με τη φυσική («αντικειμενική») πραγματικότητα, υπάρχει και η αντανάκλασή της στη συνείδηση. Ταυτόχρονα, μεταξύ της φυσικής πραγματικότητας και της εικόνας της στο μυαλό (θα θεωρήσουμε αυτή την εικόνα ως μέρος μιας ειδικής - ανακλαστικής πραγματικότητας) υπάρχει ένα αναπόφευκτο χάσμα, μια αναντιστοιχία. Η σκόπιμη μελέτη αυτού του φαινομένου συνδέεται παραδοσιακά με τον όρο «αναστοχασμός», ο οποίος ορίζεται στο Φιλοσοφικό Λεξικό ως εξής: «ΑΝΤΑΚΛΗΣΗ (λατ. reflexio – γυρίζοντας πίσω). Ένας όρος που σημαίνει προβληματισμό, καθώς και τη μελέτη της γνωστικής πράξης. Ο όρος «αντανάκλαση» εισήχθη από τον J. Locke. σε διάφορα φιλοσοφικά συστήματα (J. Locke, G. Leibniz, D. Hume, G. Hegel κ.λπ.) είχε διαφορετικό περιεχόμενο. Μια συστηματική περιγραφή του προβληματισμού από την άποψη της ψυχολογίας ξεκίνησε τη δεκαετία του '60 του XX αιώνα (σχολή 4 του V.A. Lefebvre). Επιπλέον, πρέπει να σημειωθεί ότι υπάρχει μια κατανόηση της αντανάκλασης με διαφορετική έννοια που σχετίζεται με το αντανακλαστικό - «την αντίδραση του σώματος στη διέγερση των υποδοχέων». Αυτή η εργασία χρησιμοποιεί τον πρώτο (φιλοσοφικό) ορισμό του προβληματισμού. Για να διευκρινίσουμε την κατανόηση της ουσίας του προβληματισμού, ας εξετάσουμε πρώτα την κατάσταση με ένα θέμα. Έχει ιδέες για τη φυσική πραγματικότητα, αλλά μπορεί επίσης να έχει επίγνωση (αντανακλά, αντανακλά) αυτές τις ιδέες, καθώς και να έχει επίγνωση αυτών των ιδεών κ.λπ. Έτσι διαμορφώνεται η ανακλαστική πραγματικότητα. Αναστοχασμός του θέματος σχετικά με τις δικές του ιδέες για την πραγματικότητα, τις αρχές της δραστηριότητάς του κ.λπ. ονομάζεται αυτόματη αντανάκλαση ή ανάκλαση του πρώτου είδους. Πρέπει να σημειωθεί ότι στις περισσότερες ανθρωπιστικές μελέτες μιλάμε, πρώτα απ 'όλα, για αυτοστοχασμό, που στη φιλοσοφία νοείται ως η διαδικασία του ατόμου να σκέφτεται τι συμβαίνει στο μυαλό του. Ο στοχασμός του δεύτερου είδους λαμβάνει χώρα σχετικά με ιδέες για την πραγματικότητα, τις αρχές της λήψης αποφάσεων, τον αυτόματο προβληματισμό κ.λπ. άλλα θέματα. Ας δώσουμε παραδείγματα προβληματισμού του δεύτερου είδους, δείχνοντας ότι σε πολλές περιπτώσεις τα σωστά συμπεράσματα μπορούν να γίνουν μόνο εάν κάποιος πάρει τη θέση άλλων υποκειμένων και αναλύσει την πιθανή συλλογιστική τους. Το πρώτο παράδειγμα είναι το κλασικό παιχνίδι Dirty Face, που μερικές φορές αναφέρεται ως το πρόβλημα των σοφών και των καπέλων ή το πρόβλημα των συζύγων και των άπιστων συζύγων. Το περιγράφουμε ως εξής. «Ας φανταστούμε ότι ο Μπομπ και η ανιψιά του Άλις βρίσκονται στο διαμέρισμα μιας βικτωριανής άμαξης. Το πρόσωπο όλων είναι μπερδεμένο. Ωστόσο, κανείς δεν κοκκινίζει από ντροπή, αν και οποιοσδήποτε βικτωριανός επιβάτης θα κοκκίνιζε γνωρίζοντας ότι ο άλλος τον βλέπει βρώμικο. Από αυτό συμπεραίνουμε ότι κανείς από τους επιβάτες δεν γνωρίζει ότι το πρόσωπό του είναι βρώμικο, αν και όλοι βλέπουν το βρώμικο πρόσωπο του συντρόφου του. Αυτή τη στιγμή, ο Μαέστρος κοιτάζει μέσα στο διαμέρισμα και ανακοινώνει ότι υπάρχει ένας άντρας με βρώμικο πρόσωπο στο διαμέρισμα. Μετά από αυτό, η Άλις κοκκίνισε. Κατάλαβε ότι το πρόσωπό της ήταν βρώμικο. Αλλά γιατί το κατάλαβε αυτό; Δεν της είπε ο Οδηγός αυτό που ήξερε ήδη; 5 Ας ακολουθήσουμε την αλυσίδα του συλλογισμού της Αλίκης. Αλίκη: Ας υποθέσουμε ότι το πρόσωπό μου είναι καθαρό. Τότε ο Μπομπ, γνωρίζοντας ότι ένας από εμάς είναι βρώμικος, θα πρέπει να συμπεράνει ότι είναι βρώμικος και κοκκινίζει. Αν δεν κοκκινίζει, τότε η υπόθεση μου για το καθαρό μου πρόσωπο είναι ψευδής, το πρόσωπό μου είναι βρώμικο και πρέπει να κοκκινίσω. Ο μαέστρος πρόσθεσε στις πληροφορίες που γνώριζε η Αλίκη πληροφορίες σχετικά με τις γνώσεις του Μπομπ. Μέχρι τότε, δεν ήξερε ότι ο Μπομπ ήξερε ότι ένα από αυτά ήταν βρώμικο. Με λίγα λόγια, το μήνυμα του μαέστρου μετέτρεψε τη γνώση ότι υπήρχε ένας άντρας με βρώμικο πρόσωπο στο διαμέρισμα σε γενικές γνώσεις ". Το δεύτερο παράδειγμα σχολικού βιβλίου είναι το πρόβλημα της συντονισμένης επίθεσης. υπάρχουν προβλήματα σχετικά με το βέλτιστο πρωτόκολλο ανταλλαγής πληροφοριών - Παιχνίδι Ηλεκτρονικού Ταχυδρομείου, κ.λπ. (δείτε κριτικές στο ). Η κατάσταση έχει ως εξής. Δύο μεραρχίες βρίσκονται στις κορυφές δύο λόφων και ο εχθρός βρίσκεται στην κοιλάδα. Μπορείτε να κερδίσετε μόνο εάν και οι δύο μεραρχίες επιτεθούν στον εχθρό ταυτόχρονα. Ο στρατηγός - ο διοικητής της πρώτης μεραρχίας - στέλνει στον στρατηγό - τον διοικητή της δεύτερης μεραρχίας - αγγελιοφόρο με το μήνυμα: «Επιτιθέμεθα τα ξημερώματα». Εφόσον ο αγγελιοφόρος μπορεί να αναχαιτιστεί από τον εχθρό, ο πρώτος στρατηγός πρέπει να περιμένει ένα μήνυμα από τον δεύτερο στρατηγό ότι το πρώτο μήνυμα έχει ληφθεί. Αλλά επειδή το δεύτερο μήνυμα μπορεί επίσης να αναχαιτιστεί από τον εχθρό, ο δεύτερος στρατηγός πρέπει να λάβει επιβεβαίωση από τον πρώτο στρατηγό ότι έλαβε επιβεβαίωση. Και ούτω καθεξής επί άπειρον. Το καθήκον είναι να προσδιοριστεί μετά από ποιον αριθμό μηνυμάτων (επιβεβαιώσεων) έχει νόημα οι στρατηγοί να επιτεθούν στον εχθρό. Το συμπέρασμα είναι ότι υπό τις συνθήκες που περιγράφονται, μια συντονισμένη επίθεση είναι αδύνατη και η διέξοδος είναι η χρήση πιθανοτικών μοντέλων. Το τρίτο κλασικό πρόβλημα είναι το "πρόβλημα δύο μεσιτών" (βλ. επίσης μοντέλα κερδοσκοπίας στο ). Ας υποθέσουμε ότι δύο χρηματιστές έχουν τα δικά τους έμπειρα συστήματα που χρησιμοποιούνται για την υποστήριξη της λήψης αποφάσεων. Συμβαίνει ο διαχειριστής του δικτύου να αντιγράφει παράνομα και τα δύο έμπειρα συστήματα και να πουλά το έμπειρο σύστημα του αντιπάλου του σε κάθε μεσίτη. Μετά από αυτό, ο διαχειριστής προσπαθεί να πουλήσει σε καθένα από αυτά τις ακόλουθες πληροφορίες - "Ο αντίπαλός σας έχει το έμπειρο σύστημά σας." Στη συνέχεια, ο διαχειριστής προσπαθεί 6 για να πουλήσει πληροφορίες - "Ο αντίπαλός σας ξέρει ότι έχετε το έμπειρο σύστημά του" και ούτω καθεξής. Το ερώτημα είναι πώς θα πρέπει οι μεσίτες να χρησιμοποιούν τις πληροφορίες που λαμβάνουν από τον διαχειριστή και ποιες πληροφορίες είναι σχετικές σε ποια επανάληψη; Έχοντας ολοκληρώσει την εξέταση παραδειγμάτων αναστοχασμού του δεύτερου είδους, θα συζητήσουμε σε ποιες καταστάσεις είναι απαραίτητος ο προβληματισμός. Εάν το μόνο ανακλαστικό υποκείμενο είναι ένας οικονομικός παράγοντας που επιδιώκει να μεγιστοποιήσει τη λειτουργία-στόχο του επιλέγοντας μία από τις ηθικά αποδεκτές ενέργειες, τότε η φυσική πραγματικότητα εισέρχεται στη συνάρτηση στόχο ως παράμετρος και τα αποτελέσματα του προβληματισμού (παραστάσεις για αναπαραστάσεις κ.λπ.) δεν είναι ορίσματα της συνάρτησης προορισμού. Τότε μπορούμε να πούμε ότι η αυτόματη αντανάκλαση «δεν χρειάζεται», αφού δεν αλλάζει τη δράση που έχει επιλέξει ο πράκτορας. Σημειώστε ότι η εξάρτηση των ενεργειών του υποκειμένου από τον προβληματισμό μπορεί να λάβει χώρα σε μια κατάσταση όπου οι ενέργειες είναι ηθικά άνισες, δηλαδή, μαζί με την ωφελιμιστική πτυχή, υπάρχει μια δεοντολογική (ηθική) - βλ. Ωστόσο, οι οικονομικές αποφάσεις είναι συνήθως ηθικά ουδέτερες, επομένως ας εξετάσουμε την αλληλεπίδραση πολλών παραγόντων. Εάν υπάρχουν πολλά υποκείμενα (η κατάσταση λήψης αποφάσεων είναι διαδραστική), τότε η λειτουργία στόχος κάθε υποκειμένου περιλαμβάνει τις ενέργειες άλλων υποκειμένων, δηλαδή, αυτές οι ενέργειες αποτελούν μέρος της φυσικής πραγματικότητας (αν και οι ίδιες, φυσικά, οφείλονται σε αντανακλαστική πραγματικότητα). Ταυτόχρονα, ο προβληματισμός (και, κατά συνέπεια, η μελέτη της ανακλαστικής πραγματικότητας) καθίσταται απαραίτητος. Ας εξετάσουμε τις κύριες προσεγγίσεις για τη μαθηματική μοντελοποίηση των επιδράσεων ανάκλασης. Θεωρία παιγνίων. Επίσημα (μαθηματικά) μοντέλα ανθρώπινης συμπεριφοράς έχουν δημιουργηθεί και μελετηθεί για περισσότερο από ενάμιση αιώνα (βλ. ανασκόπηση στο ) και χρησιμοποιούνται όλο και περισσότερο τόσο στη θεωρία διαχείρισης, την οικονομία, την ψυχολογία, την κοινωνιολογία κ.λπ., όσο και στην επίλυση συγκεκριμένων εφαρμογών προβλήματα. Η πιο εντατική ανάπτυξη έχει παρατηρηθεί από τη δεκαετία του '40 του ΧΧ αιώνα - τη στιγμή που εμφανίστηκε η θεωρία των παιχνιδιών, η οποία συνήθως χρονολογείται στο 1944 (η κυκλοφορία της πρώτης έκδοσης του βιβλίου των John von Neumann και Oscar Morgenstern "Game Theory and Οικονομική Συμπεριφορά»). 7 Κάτω από το παιχνίδι σε αυτό το έργο θα κατανοήσουμε την αλληλεπίδραση των μερών των οποίων τα συμφέροντα δεν συμπίπτουν (σημειώστε ότι είναι δυνατή μια άλλη κατανόηση του παιχνιδιού - ως «ένα είδος μη παραγωγικής δραστηριότητας, το κίνητρο της οποίας δεν βρίσκεται στα αποτελέσματά της, αλλά στην ίδια τη διαδικασία" - βλέπε επίσης , όπου η έννοια του παιχνιδιού ερμηνεύεται πολύ ευρύτερα). Η θεωρία παιγνίων είναι ένας κλάδος των εφαρμοσμένων μαθηματικών που διερευνά μοντέλα λήψης αποφάσεων σε συνθήκες συγκρουόμενων συμφερόντων των μερών (παικτών), όταν κάθε μέρος επιδιώκει να επηρεάσει την εξέλιξη της κατάστασης για τα δικά του συμφέροντα. Περαιτέρω, ο όρος "πράκτορας" χρησιμοποιείται για να αναφέρεται στον λήπτη αποφάσεων (παίκτη). Σε αυτή την εργασία, εξετάζουμε τα μη συνεργατικά στατικά παιχνίδια σε κανονική μορφή, δηλαδή παιχνίδια στα οποία οι πράκτορες επιλέγουν τις ενέργειές τους μία φορά, ταυτόχρονα και ανεξάρτητα. Έτσι, το κύριο καθήκον της θεωρίας παιγνίων είναι να περιγράψει την αλληλεπίδραση πολλών πρακτόρων των οποίων τα ενδιαφέροντα δεν συμπίπτουν και τα αποτελέσματα της δραστηριότητας (νίκη, χρησιμότητα, κ.λπ.) καθενός εξαρτώνται στη γενική περίπτωση από τις ενέργειες όλων. Το αποτέλεσμα μιας τέτοιας περιγραφής είναι μια πρόβλεψη μιας λογικής έκβασης του παιχνιδιού - η λεγόμενη λύση του παιχνιδιού (ισορροπία). Η περιγραφή του παιχνιδιού συνίσταται στον καθορισμό των ακόλουθων παραμέτρων: - σύνολο πρακτόρων. - προτιμήσεις των πρακτόρων (εξάρτηση πληρωμών από ενέργειες): θεωρείται (και αυτό αντανακλά τη σκοπιμότητα της συμπεριφοράς) ότι κάθε πράκτορας ενδιαφέρεται να μεγιστοποιήσει την απόδοσή του. - σύνολα παραδεκτών αγωγών εκπροσώπων· - ευαισθητοποίηση των πρακτόρων (οι πληροφορίες που έχουν τη στιγμή της λήψης αποφάσεων σχετικά με τις επιλεγμένες ενέργειες). - η σειρά λειτουργίας (η σειρά των κινήσεων - η σειρά επιλογής των ενεργειών). Σχετικά μιλώντας, το σύνολο των πρακτόρων καθορίζει ποιος συμμετέχει στο παιχνίδι. Οι προτιμήσεις αντικατοπτρίζουν αυτό που θέλουν οι πράκτορες, τα σύνολα επιτρεπόμενων ενεργειών τι μπορούν να κάνουν, η ευαισθητοποίηση αντικατοπτρίζει αυτά που γνωρίζουν και η σειρά λειτουργίας όταν επιλέγουν ενέργειες. 8 Οι αναφερόμενες παράμετροι καθορίζουν το παιχνίδι, αλλά δεν επαρκούν για να προβλέψουν το αποτέλεσμά του - τη λύση του παιχνιδιού (ή την ισορροπία του παιχνιδιού), δηλαδή το σύνολο των ενεργειών που είναι ορθολογικές και σταθερές από μια άποψη ή αλλο. Μέχρι σήμερα, δεν υπάρχει καθολική έννοια της ισορροπίας στη θεωρία παιγνίων - λαμβάνοντας ορισμένες υποθέσεις σχετικά με τις αρχές της λήψης αποφάσεων από τους πράκτορες, μπορείτε να πάρετε διαφορετικές λύσεις. Επομένως, το κύριο καθήκον οποιασδήποτε έρευνας για τη θεωρία παιγνίων (συμπεριλαμβανομένης της παρούσας εργασίας) είναι η κατασκευή μιας ισορροπίας. Δεδομένου ότι τα αντανακλαστικά παιχνίδια ορίζονται ως μια τέτοια διαδραστική αλληλεπίδραση πρακτόρων στην οποία λαμβάνουν αποφάσεις με βάση την ιεραρχία των αναπαραστάσεών τους, η επίγνωση των πρακτόρων είναι απαραίτητη. Ως εκ τούτου, μένουμε στην ποιοτική συζήτησή του αναλυτικότερα. Ο ρόλος της ευαισθητοποίησης. Γενικές γνώσεις. Στη θεωρία παιγνίων, τη φιλοσοφία, την ψυχολογία, τα κατανεμημένα συστήματα και άλλα πεδία της επιστήμης (δείτε την ανασκόπηση στο ), όχι μόνο οι πεποιθήσεις (πιστεύω) των πρακτόρων για βασικές παραμέτρους είναι απαραίτητες, αλλά και οι ιδέες τους για τις αναπαραστάσεις άλλων παραγόντων, κ.λπ. . Το σύνολο αυτών των αναπαραστάσεων ονομάζεται ιεραρχία των πεποιθήσεων και διαμορφώνεται σε αυτό το άρθρο από το δέντρο δομής πληροφοριών ενός αντανακλαστικού παιχνιδιού (βλ. Ενότητα 3.2). Με άλλα λόγια, σε καταστάσεις διαδραστικής λήψης αποφάσεων (μοντελοποιημένες στη θεωρία παιγνίων), κάθε πράκτορας πρέπει να προβλέψει τη συμπεριφορά των αντιπάλων πριν επιλέξει τη δράση του. Για να γίνει αυτό, πρέπει να έχει ορισμένες ιδέες για το όραμα του παιχνιδιού από τους αντιπάλους. Το ίδιο όμως πρέπει να κάνουν και οι αντίπαλοι, οπότε η αβεβαιότητα για το ποιο παιχνίδι θα παιχτεί δημιουργεί μια ατελείωτη ιεραρχία αναπαραστάσεων των συμμετεχόντων στο παιχνίδι. Ας δώσουμε ένα παράδειγμα ιεραρχίας προβολής. Ας υποθέσουμε ότι υπάρχουν δύο παράγοντες - ο Α και ο Β. Καθένας από αυτούς μπορεί να έχει τις δικές του μη αντανακλαστικές ιδέες για την αόριστη παράμετρο q, την οποία θα ονομάσουμε περαιτέρω κατάσταση της φύσης (κατάσταση της φύσης, κατάσταση του κόσμου). Σημειώνουμε αυτές τις αναπαραστάσεις με qA και qB, αντίστοιχα. Αλλά κάθε ένας από τους πράκτορες, στο πλαίσιο της διαδικασίας αντανάκλασης της πρώτης τάξης, μπορεί να σκεφτεί τις ιδέες του αντιπάλου. Αυτές οι αναπαραστάσεις (παραστάσεις δεύτερης τάξης) θα συμβολίζονται με qAB και qBA, όπου qAB είναι οι αναπαραστάσεις του πράκτορα Α των αναπαραστάσεων του πράκτορα Β, 9 qBA είναι οι αναπαραστάσεις του πράκτορα Β των αναπαραστάσεων του πράκτορα Α. Αλλά το θέμα δεν περιορίζεται σε αυτό - καθένας από τους πράκτορες, ως μέρος της διαδικασίας περαιτέρω προβληματισμού (αντανάκλαση της δεύτερης τάξης), μπορεί να σκεφτεί ποιες είναι οι ιδέες του αντιπάλου για τις ιδέες του. Έτσι δημιουργούνται αναπαραστάσεις τρίτης τάξης, qABA και qBAB. Η διαδικασία δημιουργίας αναπαραστάσεων υψηλότερων τάξεων μπορεί να συνεχιστεί επ 'αόριστον (δεν υπάρχουν λογικοί περιορισμοί στην αύξηση του βαθμού ανάκλασης). Το σύνολο όλων των αναπαραστάσεων - qA, qB, qAB, qBA, qABA, qBAB, κ.λπ. - σχηματίζει μια ιεραρχία απόψεων. Ιδιαίτερη περίπτωση ευαισθητοποίησης είναι όταν όλες οι αναπαραστάσεις, αναπαραστάσεις για παραστάσεις κ.λπ. συμπίπτουν στο άπειρο - είναι κοινή γνώση. Πιο σωστά, ο όρος "κοινή γνώση" εισάγεται για να δηλώσει ένα γεγονός που ικανοποιεί τις ακόλουθες απαιτήσεις: 1) είναι γνωστό σε όλους τους πράκτορες. 2) όλοι οι πράκτορες γνωρίζουν το 1. 3) όλοι οι πράκτορες γνωρίζουν το 2 και ούτω καθεξής. ad infinitum Το επίσημο μοντέλο γενικής γνώσης προτάθηκε και αναπτύχθηκε σε πολλά έργα - βλ. Μοντέλα συνειδητοποίησης πράκτορα - ιεραρχία αναπαραστάσεων και γενική γνώση - στη θεωρία παιγνίων είναι αφιερωμένα, στην πραγματικότητα, εξ ολοκλήρου, αυτό το έργο, επομένως θα δώσουμε παραδείγματα που απεικονίζουν τον ρόλο της γενικής γνώσης σε άλλους τομείς της επιστήμης - φιλοσοφία, ψυχολογία κ.λπ. ( βλέπε επίσης κριτική). Από φιλοσοφική άποψη, η κοινή γνώση αναλύθηκε στη μελέτη των συμβάσεων. Εξετάστε το ακόλουθο παράδειγμα. Είναι γραμμένο στους Κανόνες Οδού ότι κάθε χρήστης του δρόμου πρέπει να συμμορφώνεται με αυτούς τους κανόνες και έχει επίσης το δικαίωμα να περιμένει ότι οι άλλοι χρήστες του δρόμου τους τηρούν. Αλλά και άλλοι χρήστες του δρόμου πρέπει επίσης να είναι σίγουροι ότι οι άλλοι ακολουθούν τους κανόνες κ.λπ. στο άπειρο. Ως εκ τούτου, η συμφωνία για «τήρηση των κανόνων κυκλοφορίας» θα πρέπει να είναι κοινή γνώση. Στην ψυχολογία, υπάρχει η έννοια του λόγου - «(από τα λατινικά discursus - συλλογισμός, επιχείρημα) - λεκτική σκέψη ενός ατόμου που διαμεσολαβείται από προηγούμενη εμπειρία. δρα ως μια διαδικασία συνδεδεμένου λογικού 10 συλλογισμού, στην οποία κάθε επόμενη σκέψη εξαρτάται από την προηγούμενη. Ο ρόλος της γενικής γνώσης στην κατανόηση του λόγου επεξηγείται στο ακόλουθο παράδειγμα. Δύο άνθρωποι φεύγουν από τον κινηματογράφο. Ο ένας ρωτάει τον άλλο: «Πώς σου αρέσει η ταινία;». Για να καταλάβει ο δεύτερος την ερώτηση, πρέπει να καταλάβει ότι τον ρωτούν για την ταινία που μόλις είδαν μαζί. Επιπλέον, πρέπει να καταλάβει ότι ο πρώτος το καταλαβαίνει αυτό. Ο ερωτών, με τη σειρά του, πρέπει να είναι σίγουρος ότι ο δεύτερος θα καταλάβει ότι η ερώτηση αφορά την ταινία που παρακολούθησε κ.λπ. Δηλαδή, για επαρκή αλληλεπίδραση (επικοινωνία) η «ταινία» πρέπει να είναι κοινή γνώση (οι άνθρωποι πρέπει να καταλήξουν σε συμφωνία για τη χρήση της γλώσσας). Η αμοιβαία επίγνωση των πρακτόρων είναι επίσης απαραίτητη στα κατανεμημένα υπολογιστικά συστήματα, στην τεχνητή νοημοσύνη και σε άλλους τομείς. Στη θεωρία παιγνίων, κατά κανόνα, θεωρείται ότι όλες οι 1 παράμετροι του παιχνιδιού είναι κοινή γνώση, δηλαδή, κάθε πράκτορας γνωρίζει όλες τις παραμέτρους του παιχνιδιού, καθώς και ότι είναι γνωστό σε όλους τους πράκτορες κ.λπ. στο άπειρο. Μια τέτοια υπόθεση αντιστοιχεί σε μια αντικειμενική περιγραφή του παιχνιδιού και καθιστά δυνατή τη χρήση της έννοιας της ισορροπίας Nash2 ως προβλέψιμη έκβαση ενός μη συνεργατικού παιχνιδιού (δηλαδή, ενός παιχνιδιού στο οποίο οι διαπραγματεύσεις μεταξύ πρακτόρων είναι αδύνατες για τη δημιουργία συνασπισμών , ανταλλαγή πληροφοριών, κοινές δράσεις, αναδιανομή πληρωμών κ.λπ.). Έτσι, η υπόθεση της κοινής γνώσης υποδηλώνει ότι όλοι οι πράκτορες γνωρίζουν ποιο παιχνίδι παίζουν και οι ιδέες τους για το παιχνίδι είναι οι ίδιες. Αντί για τη δράση ενός πράκτορα, μπορούμε να εξετάσουμε κάτι πιο περίπλοκο - τη στρατηγική του, δηλαδή την αντιστοίχιση των πληροφοριών που διαθέτει ο πράκτορας στο σύνολο των επιτρεπόμενων ενεργειών του. Παραδείγματα είναι: στρατηγικές σε ένα παιχνίδι πολλών σταδίων, μικτές στρατηγικές, στρατηγικές στα μεταπαιχνίδια του Howard (δείτε επίσης πληροφορίες) κανένα από αυτά δεν επωφελείται από μονόπλευρη (δηλαδή, υπό την προϋπόθεση ότι οι άλλοι πράκτορες επιλέγουν τα κατάλληλα στοιχεία ισορροπίας) απόκλιση από την ισορροπία - δείτε τον σωστό ορισμό παρακάτω. Ωστόσο, ακόμη και σε αυτές τις περιπτώσεις οι κανόνες του παιχνιδιού είναι κοινή γνώση. Τέλος, μπορούμε να θεωρήσουμε ότι το παιχνίδι επιλέγεται τυχαία σύμφωνα με κάποια κατανομή, η οποία είναι κοινή γνώση - τα λεγόμενα Bayesian παιχνίδια. Στη γενική περίπτωση, ο καθένας από τους πράκτορες μπορεί να έχει τις δικές του ιδέες για τις παραμέτρους του παιχνιδιού, καθεμία από τις οποίες αντιστοιχεί σε κάποια υποκειμενική περιγραφή του παιχνιδιού. Σε αυτήν την περίπτωση, αποδεικνύεται ότι οι πράκτορες συμμετέχουν στο παιχνίδι, αλλά αντικειμενικά δεν γνωρίζουν ποιος ή αντιπροσωπεύουν το παιχνίδι που παίζεται με διαφορετικούς τρόπους - τους κανόνες, τους στόχους, τους ρόλους και την επίγνωση των αντιπάλων κ.λπ. Δεν υπάρχουν καθολικές προσεγγίσεις για την κατασκευή ισορροπιών με ανεπαρκείς γενικές γνώσεις στη θεωρία παιγνίων σήμερα. Από την άλλη πλευρά, στο πλαίσιο της «αντανακλαστικής παράδοσης» των ανθρωπιστικών επιστημών, για κάθε παράγοντα ο κόσμος γύρω του περιέχει (περιλαμβάνει) άλλους παράγοντες και οι ιδέες για άλλους παράγοντες αντανακλώνται στη διαδικασία του προβληματισμού (διαφορές στις ιδέες μπορεί να είναι οφείλεται, ιδίως, στην άνιση συνειδητοποίηση). Ωστόσο, μέχρι στιγμής δεν έχουν επιτευχθεί εποικοδομητικά επίσημα αποτελέσματα σε αυτόν τον τομέα. Επομένως, υπάρχει ανάγκη ανάπτυξης και μελέτης μαθηματικών μοντέλων παιχνιδιών στα οποία η επίγνωση των πρακτόρων δεν είναι κοινή γνώση και οι πράκτορες λαμβάνουν αποφάσεις με βάση την ιεραρχία των αναπαραστάσεών τους. Ονομάζουμε αυτή την κατηγορία παιχνιδιών αντανακλαστικά παιχνίδια (ένας επίσημος ορισμός δίνεται στην Ενότητα 3.2 αυτής της εργασίας). Πρέπει να αναγνωριστεί ότι ο όρος «αντανακλαστικά παιχνίδια» εισήχθη από τον V.A. Lefebvre το 1965 στο . Ωστόσο, σε αυτό το έργο, καθώς και στα έργα του ίδιου συγγραφέα, γίνεται κυρίως μια ποιοτική συζήτηση για τα αποτελέσματα του προβληματισμού στην αλληλεπίδραση των θεμάτων και δεν έχει προταθεί γενική ιδέα λύσης για αυτήν την κατηγορία παιχνιδιών. Η ίδια παρατήρηση ισχύει και για το , στο οποίο εξετάστηκαν ορισμένες ιδιαίτερες περιπτώσεις ευαισθητοποίησης των συμμετεχόντων στο παιχνίδι. Επομένως, η μελέτη των αντανακλαστικών παιχνιδιών και η κατασκευή μιας ενιαίας έννοιας ισορροπίας γι' αυτά είναι σχετική, γεγονός που δίνει κίνητρο στην παρούσα μελέτη. 12 Πριν προχωρήσουμε στην παρουσίαση του κύριου περιεχομένου της εργασίας, θα συζητήσουμε σε ποιοτικό επίπεδο τις κύριες προσεγγίσεις που χρησιμοποιούνται παρακάτω. Βασικές προσεγγίσεις και δομή εργασίας. Στο πρώτο κεφάλαιο «Πληροφορίες στη Λήψη Αποφάσεων», που είναι κυρίως επισκόπησης και εισαγωγικού χαρακτήρα, παρουσιάζονται μοντέλα ατομικής και διαδραστικής λήψης αποφάσεων, γίνεται ανάλυση της συνειδητοποίησης που απαιτείται για την εφαρμογή ορισμένων γνωστών εννοιών ισορροπίας. έξω, και το διάσημα μοντέλα κοινή γνώση και ιεραρχία των αναπαραστάσεων. Όπως ορίστηκε παραπάνω, ένα αντανακλαστικό παιχνίδι είναι ένα παιχνίδι στο οποίο η επίγνωση των πρακτόρων δεν είναι κοινή γνώση3 και οι πράκτορες λαμβάνουν αποφάσεις με βάση μια ιεραρχία των αναπαραστάσεων τους. Από τη σκοπιά της θεωρίας παιγνίων και των μοντέλων λήψης αντανακλαστικών αποφάσεων, είναι σκόπιμο να διαχωριστεί ο στρατηγικός και ο πληροφοριακός προβληματισμός. Ο ενημερωτικός προβληματισμός είναι η διαδικασία και το αποτέλεσμα της σκέψης του πράκτορα σχετικά με το ποιες είναι οι τιμές των αβέβαιων παραμέτρων, τι γνωρίζουν και σκέφτονται οι αντίπαλοί του (άλλοι πράκτορες) για αυτές τις τιμές. Ταυτόχρονα, απουσιάζει το ίδιο το στοιχείο «παιχνίδι», αφού ο ατζέντης δεν παίρνει αποφάσεις. Ο στρατηγικός προβληματισμός είναι η διαδικασία και το αποτέλεσμα της σκέψης του πράκτορα σχετικά με τις αρχές λήψης αποφάσεων που χρησιμοποιούν οι αντίπαλοί του (άλλοι πράκτορες) στο πλαίσιο της επίγνωσης που τους αποδίδει ως αποτέλεσμα του προβληματισμού πληροφοριών. Έτσι, ο ενημερωτικός προβληματισμός συνήθως συνδέεται με ανεπαρκή αμοιβαία επίγνωση και το αποτέλεσμά του χρησιμοποιείται στη λήψη αποφάσεων (συμπεριλαμβανομένου του στρατηγικού προβληματισμού). Ο στρατηγικός προβληματισμός λαμβάνει χώρα ακόμη και στην περίπτωση πλήρους επίγνωσης, αναμένοντας την απόφαση του πράκτορα για την επιλεγμένη ενέργεια. Με άλλα λόγια, οι ενημερωτικοί και στρατηγικοί προβληματισμοί μπορούν να μελετηθούν ανεξάρτητα, αλλά σε συνθήκες ελλιπούς και ανεπαρκούς συνειδητοποίησης λαμβάνουν χώρα και οι δύο. 3 Εάν στο υπό εξέταση μοντέλο, η επίγνωση είναι κοινή γνώση, τότε όλα τα αποτελέσματα της μελέτης των αντανακλαστικών παιχνιδιών μεταφέρονται στα αντίστοιχα κλασικά αποτελέσματα της θεωρίας παιγνίων - βλέπε παρακάτω. 13 Ο στρατηγικός προβληματισμός συζητείται στο δεύτερο κεφάλαιο αυτής της εργασίας. Αποδεικνύεται ότι αν υποθέσουμε ότι ο πράκτορας, διαμορφώνοντας τη συμπεριφορά των αντιπάλων του, αποδίδει σε αυτούς και στον εαυτό του ορισμένες τάξεις αντανακλαστικών, τότε το αρχικό παιχνίδι μετατρέπεται σε ένα νέο παιχνίδι στο οποίο η στρατηγική του πράκτορα είναι να επιλέξει την κατάταξη αντανακλαστικής. Αν σκεφτούμε τη διαδικασία του προβληματισμού σε ένα νέο παιχνίδι, παίρνουμε ένα νέο παιχνίδι, και ούτω καθεξής. Ταυτόχρονα, ακόμα κι αν στο αρχικό παιχνίδι το σύνολο των πιθανών ενεργειών ήταν πεπερασμένο, τότε στο νέο παιχνίδι το σύνολο των πιθανών ενεργειών - ο αριθμός των διαφορετικών βαθμίδων αναστοχασμού - είναι άπειρο. Κατά συνέπεια, το κύριο καθήκον που πρέπει να επιλυθεί στη μελέτη του στρατηγικού προβληματισμού είναι ο καθορισμός της μέγιστης πρόσφορης κατάταξης προβληματισμού. Η απάντηση σε αυτή την ερώτηση ελήφθη στο δεύτερο κεφάλαιο για παιχνίδια bimatrix (Ενότητα 2.2) και μοντέλα που λαμβάνουν υπόψη τους περιορισμούς της ικανότητας ενός ατόμου να επεξεργάζεται πληροφορίες (Ενότητα 2.3). Ας δώσουμε ένα παράδειγμα στρατηγικού προβληματισμού - "Πέναλτι" (βλ. (Βλέπε επίσης τα παραδείγματα "Απόκρυψη και αναζήτηση" και "Κατεδάφιση σε μικροσκοπικό" στην ενότητα 2.2). Οι ατζέντες είναι ο παίκτης και ο τερματοφύλακας. Ας υποθέσουμε για απλότητα ότι ο παίκτης έχει δύο ενέργειες - "να χτυπήσει την αριστερή γωνία του τέρματος" και "να χτυπήσει τη δεξιά γωνία του τέρματος". Ο τερματοφύλακας έχει επίσης δύο ενέργειες - "πιάσε την μπάλα στην αριστερή γωνία" και "πιάσε τη μπάλα στη δεξιά γωνία". Αν ο τερματοφύλακας μαντέψει ποια γωνία χτυπά ο παίκτης, τότε πιάνει την μπάλα. Ας μοντελοποιήσουμε το σκεπτικό των πρακτόρων. Ενημερώστε τον τερματοφύλακα ότι αυτός ο παίκτης συνήθως σουτάρει στη δεξιά γωνία. Επομένως, πρέπει να πιάσει τη μπάλα στη δεξιά γωνία. Αλλά, εάν ο τερματοφύλακας γνωρίζει ότι ο παίκτης ξέρει ότι ο τερματοφύλακας ξέρει πώς συμπεριφέρεται συνήθως ο παίκτης, τότε ο τερματοφύλακας θα πρέπει να διαμορφώσει το σκεπτικό του παίκτη. Μπορεί να σκέφτεται ως εξής: «Ο παίκτης ξέρει ότι γνωρίζω τη συνηθισμένη του τακτική. Περιμένει λοιπόν να πιάσω την μπάλα στη δεξιά γωνία και μπορεί να χτυπήσει στην αριστερή γωνία. Σε αυτή την περίπτωση, πρέπει να πιάσω την μπάλα στην αριστερή γωνία. Εάν ένας παίκτης έχει αρκετό βάθος αντανάκλασης, τότε μπορεί να μαντέψει το σκεπτικό του τερματοφύλακα και να προσπαθήσει να τον ξεγελάσει χτυπώντας στη δεξιά γωνία. Την ίδια αλυσίδα συλλογισμών μπορεί να εκτελέσει ο τερματοφύλακας και, σε αυτή τη βάση, να πιάσει τη μπάλα στη δεξιά γωνία. Τόσο ο παίκτης όσο και ο τερματοφύλακας μπορούν να αυξήσουν το βάθος του στοχασμού στο άπειρο συλλογίζοντας ο ένας τον άλλον και κανένας από τους δύο δεν έχει λογικούς λόγους να σταματήσει σε κάποιο τελικό βήμα. Επομένως, στο πλαίσιο της μοντελοποίησης της αμοιβαίας συλλογιστικής, είναι αδύνατο να καθοριστεί εκ των προτέρων το αποτέλεσμα του υπό εξέταση παιχνιδιού. Το ίδιο το παιχνίδι, στο οποίο καθένας από τους πράκτορες έχει δύο πιθανές ενέργειες, μπορεί να αντικατασταθεί από ένα άλλο παιχνίδι στο οποίο οι πράκτορες επιλέγουν τις τάξεις του προβληματισμού που ανατίθενται στον αντίπαλο. Αλλά ακόμη και σε αυτό το παιχνίδι δεν υπάρχει λογική λύση, αφού κάθε πράκτορας μπορεί να μοντελοποιήσει τη συμπεριφορά του αντιπάλου εξετάζοντας ένα «διπλά αντανακλαστικό» παιχνίδι κ.ο.κ. στο άπειρο. Το μόνο πράγμα που μπορεί να βοηθήσει τους πράκτορες στην υπό εξέταση κατάσταση είναι να περιορίσουν το βάθος της αντανάκλασής τους, σημειώνοντας ότι ξεκινώντας από τη δεύτερη τάξη προβληματισμού (λόγω του πεπερασμένου του αρχικού συνόλου πιθανών ενεργειών), η κατάσταση αρχίζει να επαναλαμβάνεται - όντας τόσο στο μηδέν όσο και στο δεύτερο (και, γενικά, σε οποιοδήποτε ζυγό) επίπεδο ανάκλασης, ο παίκτης θα χτυπήσει στη δεξιά γωνία. Επομένως, μένει στον τερματοφύλακα να μαντέψει την ισοτιμία του επιπέδου αντανάκλασης του παίκτη. Το μέγιστο βαθμό ανάκλασης που πρέπει να έχει ένας πράκτορας για να καλύψει ολόκληρη την ποικιλία των αποτελεσμάτων του παιχνιδιού (χάνοντας από τα μάτια του κάποιες από τις στρατηγικές του αντιπάλου, ο πράκτορας κινδυνεύει να μειώσει την ανταμοιβή του), θα ονομάσουμε τη μέγιστη εύχρηστη κατάταξη ανάκλασης. Αποδεικνύεται ότι σε πολλές περιπτώσεις αυτή η κατάταξη είναι πεπερασμένη - τα αντίστοιχα επίσημα αποτελέσματα δίνονται στις Ενότητες 2.2 και 3.6). Στο παράδειγμα "Πέναλτι", ο μέγιστος εύχρηστος βαθμός του προβληματισμού των πρακτόρων είναι δύο. Εάν ο τερματοφύλακας δεν έχει πληροφορίες για το πού χτυπάει συνήθως ο επιθετικός, οι ενέργειες του τελευταίου είναι συμμετρικές (η αριστερή και η δεξιά γωνία είναι «ισοδύναμες»). Ωστόσο, εξακολουθούν να υπάρχουν ευκαιρίες να εισαγάγετε τεχνητά την ασυμμετρία για να προσπαθήσετε να τη χρησιμοποιήσετε για δικούς σας σκοπούς. Για παράδειγμα, ο τερματοφύλακας μπορεί να κινηθεί προς μια από τις γωνίες, σαν να προσκαλεί τον επιθετικό να χτυπήσει τον άλλο (και ορμάει σε εκείνη τη «μακρινή» γωνία). Μια πιο σύνθετη στρατηγική είναι η εξής. Ένας παίκτης της ομάδας του τερματοφύλακα έρχεται κοντά του και του δείχνει πού πρόκειται να χτυπήσει ο επιθετικός και το κάνει με τέτοιο τρόπο ώστε να το δει ο επιθετικός (μετά από το οποίο, τη στιγμή της πρόσκρουσης, ο τερματοφύλακας πιάνει τη μπάλα όχι μέσα το κόρνερ που του έδειξε προκλητικά ο συμπαίκτης του, αλλά στο αντίθετο) . Σημειώστε ότι και οι δύο τεχνικές που περιγράφονται είναι βγαλμένες "από τη ζωή" και αποδείχθηκαν επιτυχημένες. Το πρώτο έλαβε χώρα στον διεθνή αγώνα της εθνικής ομάδας της ΕΣΣΔ, το δεύτερο - στον τελικό του Κυπέλλου ΕΣΣΔ στο ποδόσφαιρο στη διαδικασία των πέναλτι. 15 Το τρίτο κεφάλαιο είναι αφιερωμένο στη μελέτη επίσημων μοντέλων αναστοχασμού πληροφοριών. Δεδομένου ότι ο βασικός παράγοντας στα αντανακλαστικά παιχνίδια είναι η επίγνωση των πρακτόρων - η ιεραρχία των αναπαραστάσεων, τότε για την επίσημη περιγραφή της, εισάγεται η έννοια μιας δομής πληροφοριών - ένα δέντρο (στη γενική περίπτωση, άπειρο), οι κορυφές του οποίου αντιστοιχούν σε πληροφορίες (παραστάσεις) πρακτόρων για βασικές παραμέτρους, αναπαραστάσεις άλλων πρακτόρων κ.λπ. .δ. (δείτε το παράδειγμα ιεραρχίας προβολής παραπάνω). Η έννοια της δομής της επίγνωσης (δομή πληροφοριών) μας επιτρέπει να δώσουμε έναν επίσημο ορισμό ορισμένων διαισθητικά σαφών εννοιών, όπως: επαρκής επίγνωση ενός πράκτορα για έναν άλλο, αμοιβαία επίγνωση, ίση επίγνωση κ.λπ. Μία από τις βασικές έννοιες που χρησιμοποιούνται στο αυτό το έργο για την ανάλυση των αντανακλαστικών παιχνιδιών είναι η έννοια του πράκτορα φάντασμα. Ας το συζητήσουμε σε ποιοτικό επίπεδο (αναβάλλοντας τον αυστηρό μαθηματικό ορισμό για την Ενότητα 3.2). Αφήστε δύο πράκτορες, ο Α και ο Β, να αλληλεπιδρούν σε μια συγκεκριμένη κατάσταση. Είναι πολύ φυσικό ότι στο μυαλό του καθενός από αυτούς υπάρχει μια συγκεκριμένη εικόνα του άλλου: ο Α έχει μια εικόνα του Β (ας το ονομάσουμε ΑΒ) και ο Β έχει μια εικόνα του Α (ας το πούμε ΒΑ). Αυτές οι εικόνες μπορεί να συμπίπτουν με την πραγματικότητα και μπορεί να διαφέρουν από αυτήν. Με άλλα λόγια, ένας πράκτορας, για παράδειγμα, ο Α, μπορεί να έχει ή να μην έχει επαρκή ιδέα για το Β (αυτό το γεγονός μπορεί να γραφτεί ως ταυτότητα AB = B). Εδώ τίθεται αμέσως το ερώτημα - μπορεί να εκπληρωθεί κατ' αρχήν η ταυτότητα ΑΒ = Β, επειδή ο Β είναι πραγματικός πράκτορας και ο ΑΒ είναι μόνο η εικόνα του; Χωρίς να μπούμε σε συζήτηση αυτού του ουσιαστικά φιλοσοφικού ερωτήματος, σημειώνουμε τις ακόλουθες δύο περιστάσεις. Πρώτον, δεν μιλάμε για πλήρη κατανόηση της προσωπικότητας στο σύνολό της, αλλά για τη μοντελοποίησή της στη συγκεκριμένη κατάσταση. Στο συνηθισμένο, καθημερινό επίπεδο της ανθρώπινης επικοινωνίας, βρισκόμαστε συνεχώς αντιμέτωποι με καταστάσεις επαρκούς και ανεπαρκούς αντίληψης ενός ατόμου από ένα άλλο. Δεύτερον, στο πλαίσιο της επίσημης (θεωρητικής παιγνίου) μοντελοποίησης της ανθρώπινης συμπεριφοράς, ένας πράκτορας - ένας συμμετέχων σε μια κατάσταση - περιγράφεται από ένα σχετικά μικρό σύνολο χαρακτηριστικών. Και αυτά τα χαρακτηριστικά μπορούν να είναι πλήρως γνωστά σε έναν άλλο πράκτορα στον ίδιο βαθμό που είναι γνωστά στον ερευνητή. 16 Ας εξετάσουμε λεπτομερέστερα την περίπτωση που υπάρχει διαφορά μεταξύ Β και ΑΒ (αυτή η διαφορά μπορεί να πηγάζει, μιλώντας επίσημα, από την ελλιπή πληροφόρηση του Α για τον Β ή από την εμπιστοσύνη σε ψευδείς πληροφορίες). Τότε ο Α, όταν αποφασίζει για οποιαδήποτε από τις ενέργειές του, έχει στο μυαλό του όχι τον Β, αλλά την εικόνα του που έχει, δηλαδή τον ΑΒ. Μπορούμε να πούμε ότι υποκειμενικά το Α αλληλεπιδρά με το ΑΒ. Επομένως, το ΑΒ μπορεί να ονομαστεί παράγοντας-φάντασμα. Δεν υπάρχει στην πραγματικότητα, αλλά είναι παρούσα στο μυαλό του πραγματικού παράγοντα Α και, κατά συνέπεια, επηρεάζει τις πράξεις του, δηλαδή την πραγματικότητα. Ας φέρουμε το απλούστερο παράδειγμα . Ας πιστέψει ο Α ότι αυτός και ο Β είναι φίλοι και ο Β, γνωρίζοντας αυτό, είναι ο εχθρός του Α (αυτή η κατάσταση μπορεί να περιγραφεί με τη λέξη "προδοσία"). Στη συνέχεια, προφανώς, υπάρχει ένας πράκτορας-φάντασμα ΑΒ στην κατάσταση, ο οποίος μπορεί να περιγραφεί ως εξής: «Ο Β, ο οποίος είναι φίλος του Α». στην πραγματικότητα, δεν υπάρχει τέτοια οντότητα. Σημειώστε ότι σε αυτή την περίπτωση, ο Β είναι επαρκώς ενημερωμένος για το Α, δηλαδή, ΒΑ = Α. Έτσι, εκτός από τους πραγματικούς πράκτορες που πραγματικά συμμετέχουν στο παιχνίδι, προτείνεται να ληφθούν υπόψη και πράκτορες φάντασμα, δηλαδή πράκτορες που υπάρχουν στο μυαλό. πραγματικών και άλλων παραγόντων φάντασμα. Οι πραγματικοί και οι φανταστικοί πράκτορες, μέσα στο πλαίσιο της αντανάκλασής τους, προικίζουν στους πράκτορες φάντασμα μια συγκεκριμένη επίγνωση, η οποία αντανακλάται στη δομή της πληροφορίας. Μπορεί να υπάρχει ένας άπειρος αριθμός πραγματικών και φανταστικών πρακτόρων που συμμετέχουν στο παιχνίδι, πράγμα που σημαίνει το δυνητικό άπειρο της υλοποίησης πράξεων αντανακλαστικού στοχασμού (το άπειρο βάθος του δέντρου της δομής συνειδητοποίησης). Πράγματι, ακόμη και στην πιο απλή κατάσταση, μια ατελείωτη επέκταση του συλλογισμού της μορφής "Ξέρω ...", "Ξέρω ότι ξέρεις ...", "Ξέρω ότι ξέρεις ότι ξέρω ...", " Ξέρω ότι ξέρεις ότι ξέρω ότι ξέρεις…», κλπ. Ωστόσο, στην πράξη τέτοιο «κακό άπειρο» δεν γίνεται, αφού ξεκινώντας από μια συγκεκριμένη στιγμή, οι αναπαραστάσεις «σταθεροποιούνται» και αυξάνεται η κατάταξη. του προβληματισμού δεν δίνει κάτι νέο. Έτσι, σε πραγματικές καταστάσεις, η δομή της επίγνωσης έχει μια πεπερασμένη πολυπλοκότητα: το αντίστοιχο δέντρο έχει έναν πεπερασμένο αριθμό κατά ζεύγη διακριτών υποδέντρων - 17 ev. Με άλλα λόγια, το παιχνίδι περιλαμβάνει έναν πεπερασμένο αριθμό πραγματικών και φανταστικών πρακτόρων4. Η εισαγωγή της έννοιας των παραγόντων φάντασμα καθιστά δυνατό τον ορισμό ενός αντανακλαστικού παιχνιδιού ως παιχνιδιού πραγματικών και φανταστικών πρακτόρων, καθώς και τον ορισμό μιας πληροφοριακής ισορροπίας ως γενίκευσης της ισορροπίας Nash για την περίπτωση ενός αντανακλαστικού παιχνιδιού, στο οποίο Υποτίθεται ότι κάθε πράκτορας (πραγματικός και φάντασμα) όταν υπολογίζει την υποκειμενική του ισορροπία (ισορροπία στο παιχνίδι που παίζει από τη σκοπιά του) χρησιμοποιεί την υπάρχουσα ιεραρχία των ιδεών του για την αντικειμενική και την αντανακλαστική πραγματικότητα. Ένα βολικό εργαλείο για τη μελέτη της ισορροπίας πληροφοριών είναι ένα αντανακλαστικό γράφημα παιχνιδιού στο οποίο οι κορυφές αντιστοιχούν σε πραγματικούς και φανταστικούς πράκτορες και κάθε κορυφή παράγοντα περιλαμβάνει τόξα (ο αριθμός τους είναι ένα μικρότερος από τον αριθμό των πραγματικών παραγόντων) που προέρχονται από κορυφές πράκτορα, στις ενέργειες των οποίων η ανταμοιβή εξαρτάται από την υποκειμενική ισορροπία.αυτόν τον παράγοντα. Το γράφημα ενός αντανακλαστικού παιχνιδιού μπορεί να κατασκευαστεί χωρίς να συγκεκριμενοποιούνται οι στοχευόμενες λειτουργίες των πρακτόρων. Ταυτόχρονα, αντανακλά, αν όχι την ποσοτική αναλογία των ενδιαφερόντων, τότε την ποιοτική αναλογία επίγνωσης των αντανακλαστικών παραγόντων, και είναι ένα βολικό και εκφραστικό μέσο για την περιγραφή των επιπτώσεων του προβληματισμού (βλ. Ενότητα 3.4). Για το παράδειγμα δύο πρακτόρων που περιγράφονται παραπάνω, το αντανακλαστικό γράφημα παιχνιδιού έχει τη μορφή: B ¬ A « AB - ο πραγματικός πράκτορας B (ο προδότης) είναι επαρκώς ενημερωμένος για τον πράκτορα Α, ο οποίος αλληλεπιδρά με τον πράκτορα φάντασμα ΑΒ (Β, ο οποίος είναι φίλος του Α). Ας δώσουμε ένα ακόμη παράδειγμα γραφήματος που αντικατοπτρίζει μια αντανακλαστική αλληλεπίδραση (αν και τυπικά δεν είναι γράφημα ενός αντανακλαστικού παιχνιδιού με την έννοια του ορισμού που εισήχθη παραπάνω). Στο εξώφυλλο αυτού του βιβλίου υπάρχει ένας πίνακας του E. Burne-Jones «Deadly Head», γραμμένος το 1886-1887. βασισμένο στο μύθο του Περσέα και της Ανδρομέδας. Τρεις πραγματικοί πράκτορες εμπλέκονται στην κατάσταση: ο Περσέας (ας τον χαρακτηρίσουμε με το γράμμα P), η Ανδρομέδα (Α) και η γοργόνα Μέδουσα (Μ). Επιπλέον, 4 Στην περιοριστική περίπτωση - όταν υπάρχει κοινή γνώση - ο παράγοντας-φάντασμα του πρώτου επιπέδου συμπίπτει με το πραγματικό του πρωτότυπο και το δέντρο έχει μοναδιαίο βάθος (ακριβέστερα, όλα τα άλλα υποδέντρα επαναλαμβάνουν δέντρα υψηλότερου επιπέδου). 18, υπάρχουν οι ακόλουθοι «φάντασμα» πράκτορες: η αντανάκλαση του Περσέα (OP), η αντανάκλαση της Ανδρομέδας (ΟΑ) και η αντανάκλαση της Μέδουσας (ΟΜ). Το γράφημα φαίνεται στο σχήμα 1. M P A OP OA OM Εικ. 1. Γράφημα του πίνακα του E. Burne-Jones "Deadly Head" (βλ. εξώφυλλο) 19 Η επίγνωση των πραγματικών παραγόντων στο υπό εξέταση παράδειγμα είναι η εξής: Ο Περσέας βλέπει την Ανδρομέδα. Η Ανδρομέδα δεν βλέπει τον Περσέα, αλλά βλέπει την αντανάκλασή του, τη δική της αντανάκλαση και την αντανάκλαση της Γοργόνας Μέδουσας. Η αντανάκλαση του Περσέα βλέπει την αντανάκλαση της Ανδρομέδας. Η αντανάκλαση της Ανδρομέδας βλέπει όλους τους πραγματικούς πράκτορες. Ευτυχώς, κανένας από τους πραγματικούς πράκτορες δεν βλέπει την ίδια τη γοργόνα Μέδουσα. Η εισαγωγή μιας δομής πληροφοριών, μιας ισορροπίας πληροφοριών και ενός γραφήματος ενός αντανακλαστικού παιχνιδιού, καταρχάς, καθιστά δυνατή την περιγραφή και ανάλυση διαφόρων καταστάσεων συλλογικής λήψης αποφάσεων από παράγοντες με διαφορετική επίγνωση από μια ενοποιημένη μεθοδολογική θέση και με τη βοήθεια ενός ενιαία μαθηματική συσκευή, για τη μελέτη της επιρροής των βαθμολογιών ανακλαστικότητας στις αποδόσεις των πρακτόρων, για τη μελέτη των συνθηκών ύπαρξης και σκοπιμότητας ισορροπιών πληροφοριών κ.λπ. Παρακάτω δίνονται πολυάριθμα παραδείγματα εφαρμοσμένων μοντέλων. Δεύτερον, το προτεινόμενο μοντέλο του αντανακλαστικού παιχνιδιού καθιστά δυνατή τη μελέτη της επιρροής των βαθμών αντανακλάσεων (το βάθος της δομής πληροφοριών) στις αποδόσεις των πρακτόρων. Τα αποτελέσματα που ελήφθησαν στις Ενότητες 2.2, 3.5 και 3.6 αυτού του εγγράφου δείχνουν ότι, κάτω από ελάχιστες υποθέσεις, είναι δυνατό να φανεί ότι η μέγιστη εύχρηστη κατάταξη ανάκλασης είναι περιορισμένη. Με άλλα λόγια, σε πολλές περιπτώσεις μια απεριόριστη αύξηση του βαθμού αντανάκλασης δεν είναι σκόπιμη από την άποψη των κερδών των πρακτόρων. Τρίτον, η παρουσία ενός μοντέλου ενός αντανακλαστικού παιχνιδιού μας επιτρέπει να προσδιορίσουμε τις συνθήκες για την ύπαρξη και τις ιδιότητες της ισορροπίας πληροφοριών, καθώς και να διατυπώσουμε εποικοδομητικά και σωστά το πρόβλημα του αντανακλαστικού ελέγχου, το οποίο συνίσταται στην αναζήτηση μιας τέτοιας δομής πληροφοριών από την όργανο διοίκησης ότι η ισορροπία πληροφοριών που επιτυγχάνεται σε αυτό είναι πιο επωφελής από τη σκοπιά του. Το πρόβλημα του αντανακλαστικού ελέγχου τίθεται και επιλύεται για μια σειρά περιπτώσεων στην Ενότητα 3.7. Τα θεωρητικά αποτελέσματα της επίλυσής του χρησιμοποιούνται σε μια σειρά από εφαρμοσμένα μοντέλα που παρουσιάζονται στο τέταρτο κεφάλαιο - κρυφός έλεγχος, έλεγχος πληροφοριών μέσω των μέσων, κ.λπ. Και, τέλος, τέταρτον, η γλώσσα των αντανακλαστικών παιχνιδιών (δομές πληροφοριών, γραφήματα ενός αντανακλαστικού παιχνίδι, κ.λπ.) είναι βολικό για την περιγραφή των επιπτώσεων του στοχασμού τόσο στην ψυχολογία (η οποία απεικονίζεται από το παράδειγμα μιας παρτίδας σκακιού, ανάλυση συναλλαγών, 20 μοντέλα ηθικής επιλογής κ.λπ.), όσο και σε έργα τέχνης - βλέπε το τέταρτο κεφάλαιο αυτής της εργασίας. Έχοντας ολοκληρώσει αναθεώρηση ποιότητας περιεχόμενο της εργασίας, σημειώνουμε ότι μπορούμε να προσφέρουμε διάφορες προσεγγίσεις εξοικείωσης με το υλικό αυτού του βιβλίου. Το πρώτο είναι γραμμικό και συνίσταται στη διαδοχική ανάγνωση και των τεσσάρων κεφαλαίων. Το δεύτερο προορίζεται για τον αναγνώστη που ενδιαφέρεται περισσότερο για τα επίσημα μοντέλα και συνίσταται στην ανάγνωση του δεύτερου και του τρίτου κεφαλαίου και μια πρόχειρη γνωριμία με τα παραδείγματα του τέταρτου κεφαλαίου. Το τρίτο απευθύνεται σε έναν αναγνώστη που δεν θέλει να εμβαθύνει σε μαθηματικές λεπτότητες και συνίσταται στην ανάγνωση της εισαγωγής, του τέταρτου κεφαλαίου και του συμπεράσματος. ΚΕΦΑΛΑΙΟ 1. ΠΛΗΡΟΦΟΡΙΕΣ ΣΤΗ ΛΗΨΗ ΑΠΟΦΑΣΕΩΝ Στο πρώτο κεφάλαιο αυτής της εργασίας, παρουσιάζουμε ένα μοντέλο ατομικής λήψης αποφάσεων (Ενότητα 1.1), εξετάζουμε τις κύριες έννοιες για την επίλυση μη συνεργατικών παιχνιδιών, συζητάμε τις υποθέσεις που χρησιμοποιούνται σε αυτές τις έννοιες σχετικά με το ευαισθητοποίηση και αμοιβαία επίγνωση των παραγόντων (Ενότητα 1.2) και αναλύστε την επίγνωση και τη γενική γνώση γνωστών μοντέλων (ενότητα 1.3). 1.1. ΑΤΟΜΙΚΗ ΛΗΨΗ ΑΠΟΦΑΣΕΩΝ: ΕΝΑ ΜΟΝΤΕΛΟ ΟΡΘΟΛΟΓΙΚΗΣ ΣΥΜΠΕΡΙΦΟΡΑΣ Ας περιγράψουμε, ακολουθώντας , το μοντέλο λήψης αποφάσεων από έναν μόνο παράγοντα. Αφήστε τον πράκτορα να μπορεί να επιλέξει κάποια ενέργεια x από το σύνολο X των επιτρεπόμενων ενεργειών. Ως αποτέλεσμα της επιλογής της ενέργειας x н X, ο πράκτορας λαμβάνει αμοιβή f(x), όπου f: X ® Β1 είναι μια αντικειμενική συνάρτηση με πραγματική αξία που αντικατοπτρίζει τις προτιμήσεις του πράκτορα. Ας αποδεχτούμε την υπόθεση της ορθολογικής συμπεριφοράς, η οποία είναι ότι ο πράκτορας, λαμβάνοντας υπόψη όλες τις πληροφορίες που έχει στη διάθεσή του, επιλέγει ενέργειες που είναι πιο προτιμότερες όσον αφορά τις αξίες της αντικειμενικής λειτουργίας του (αυτή η υπόθεση δεν είναι η μόνη δυνατή ένα - δείτε, για παράδειγμα, την έννοια του περιορισμένου ορθολογισμού). Σύμφωνα με την υπόθεση της ορθολογικής συμπεριφοράς, ο πράκτορας επιλέγει μια εναλλακτική από το σύνολο των «καλύτερων» εναλλακτικών. Στην περίπτωση που εξετάζουμε, αυτό το σύνολο είναι το σύνολο των εναλλακτικών επιλογών στις οποίες επιτυγχάνεται το μέγιστο της αντικειμενικής συνάρτησης. Επομένως, η επιλογή μιας ενέργειας από έναν πράκτορα καθορίζεται από τον κανόνα της μεμονωμένης ορθολογικής επιλογής P(f, X) н X, ο οποίος ξεχωρίζει το σύνολο των ενεργειών που είναι πιο προτιμητέες από τη σκοπιά του πράκτορα5: P( f, X) = Arg max f(x). xн X Ας περιπλέκουμε το μοντέλο, δηλαδή, υποθέτουμε ότι η ανταμοιβή του πράκτορα καθορίζεται όχι μόνο από τις δικές του ενέργειες, αλλά και από την τιμή της αόριστης παραμέτρου q н W – η κατάσταση της φύσης. Δηλαδή, ως αποτέλεσμα της επιλογής μιας ενέργειας x н X και της πραγματοποίησης μιας φυσικής κατάστασης q н W, ο πράκτορας λαμβάνει μια πληρωμή f(q, x), όπου f: W ´ X ® Â1. Εάν το κέρδος του πράκτορα εξαρτάται, εκτός από τις ενέργειές του, από μια αόριστη παράμετρο - την κατάσταση της φύσης, τότε στη γενική περίπτωση δεν υπάρχει μοναδικά "καλύτερη" ενέργεια - όταν αποφασίζει για την επιλεγμένη ενέργεια, ο πράκτορας πρέπει να "προβλέψει" κατάσταση της φύσης. Επομένως, εισάγουμε την υπόθεση του ντετερμινισμού, η οποία συνίσταται στο γεγονός ότι ο πράκτορας επιδιώκει να εξαλείψει, λαμβάνοντας υπόψη όλες τις πληροφορίες που έχει στη διάθεσή του, την υπάρχουσα αβεβαιότητα και να λάβει αποφάσεις σε συνθήκες πλήρους πληροφόρησης (με άλλα λόγια, το τελικό κριτήριο που καθοδηγεί τον πράκτορα που λαμβάνει αποφάσεις δεν πρέπει να περιέχει αβέβαιες παραμέτρους). Δηλαδή, ο πράκτορας πρέπει, σύμφωνα με την υπόθεση του ντετερμινισμού, να εξαλείψει την αβεβαιότητα σχετικά με παραμέτρους ανεξάρτητες από αυτόν (ίσως εισάγοντας ορισμένες υποθέσεις για τις τιμές τους). Ανάλογα με τις πληροφορίες I που έχει ο παράγοντας για αβέβαιες παραμέτρους, υπάρχουν: - αβεβαιότητα διαστήματος (όταν είναι γνωστό μόνο το σύνολο W των πιθανών τιμών αβέβαιων παραμέτρων). 5 Όταν χρησιμοποιούνται ψηλά και χαμηλά, θεωρείται ότι έχουν επιτευχθεί. 22 - πιθανολογική αβεβαιότητα (όταν, εκτός από το σύνολο W των πιθανών τιμών αβέβαιων παραμέτρων, είναι γνωστή η κατανομή πιθανοτήτων p(q)). - ασαφής αβεβαιότητα (όταν, εκτός από το σύνολο W των πιθανών τιμών αβέβαιων παραμέτρων, είναι γνωστή η συνάρτηση μέλους των τιμών τους). Σε αυτή την εργασία, εξετάζουμε την απλούστερη - "σημείο" - περίπτωση, όταν οι πράκτορες έχουν ιδέες για μια συγκεκριμένη έννοια της κατάστασης της φύσης. Η δυνατότητα γενίκευσης των ληφθέντων αποτελεσμάτων στην περίπτωση διαστήματος ή πιθανολογικής αβεβαιότητας συζητείται στο συμπέρασμα. Εισάγουμε την ακόλουθη υπόθεση σχετικά με τις διαδικασίες εξάλειψης της αβεβαιότητας που χρησιμοποιούνται από τον πράκτορα: η αβεβαιότητα διαστήματος εξαλείφεται με τον υπολογισμό του μέγιστου εγγυημένου αποτελέσματος (MGR), η πιθανολογική είναι η αναμενόμενη τιμή της αντικειμενικής συνάρτησης, η ασαφής είναι το σύνολο των μέγιστων μη κυριαρχούμενες εναλλακτικές από την αντικειμενική συνάρτηση f(q, x) στην αντικειμενική συνάρτηση f(x), η οποία δεν εξαρτάται από τις αβέβαιες παραμέτρους. Σύμφωνα με την εισαγόμενη υπόθεση, στην περίπτωση του διαστήματος) αβεβαιότητα f (x) = min f(q, x), στην περίπτωση πιθανολογικής αβεβαιότητας f (x) = q нW ò f (x,q) p(q )dq κ.λπ. . W Εξαλείφοντας την αβεβαιότητα, λαμβάνουμε ένα ντετερμινιστικό μοντέλο, δηλαδή, ο κανόνας της ατομικής ορθολογικής επιλογής έχει τη μορφή:) P(f, X, I) = Arg max f (x), xн X 6 Οι υποθέσεις που εισάγονται δεν είναι οι μόνο πιθανές. Η χρήση άλλων υποθέσεων (για παράδειγμα, η υπόθεση για τη χρήση του MHR μπορεί να αντικατασταθεί από την υπόθεση της αισιοδοξίας ή την υπόθεση «σταθμισμένη αισιοδοξία-απαισιοδοξία» κ.λπ. ) θα οδηγήσει σε άλλες έννοιες λύσεων, αλλά η διαδικασία απόκτησής τους θα ακολουθήσει το γενικό σχήμα που εφαρμόζεται παρακάτω. 23 όπου I είναι η πληροφορία που χρησιμοποιεί ο πράκτορας κατά την εξάλειψη της αβεβαιότητας f Þ f . Μέχρι στιγμής εξετάζαμε τη λήψη ατομικών αποφάσεων. Ας εξετάσουμε τώρα την αβεβαιότητα του παιχνιδιού, στο πλαίσιο της οποίας οι υποθέσεις του πράκτορα σχετικά με το σύνολο των πιθανών τιμών του περιβάλλοντος παιχνιδιού (οι ενέργειες άλλων πρακτόρων που επιλέγουν στο πλαίσιο ορισμένων ανακριβών αρχών συμπεριφοράς που είναι γνωστές στον πράκτορα υπό εξέταση) είναι ουσιώδεις. 1.2. ΔΙΑΔΡΑΣΤΙΚΗ ΛΗΨΗ ΑΠΟΦΑΣΕΩΝ: ΠΑΙΧΝΙΔΙΑ ΚΑΙ ΙΣΟΡΡΟΙΕΣ Μοντέλο παιχνιδιού. Για να περιγράψουμε τη συλλογική συμπεριφορά των πρακτόρων, δεν αρκεί να προσδιορίσουμε τις προτιμήσεις τους και τους κανόνες της ατομικής ορθολογικής επιλογής ξεχωριστά. Όπως σημειώθηκε παραπάνω, στην περίπτωση που το σύστημα έχει έναν μόνο παράγοντα, η υπόθεση της ορθολογικής (ατομικής) συμπεριφοράς του προϋποθέτει ότι ο πράκτορας συμπεριφέρεται με τέτοιο τρόπο ώστε να μεγιστοποιεί την αξία της αντικειμενικής του συνάρτησης επιλέγοντας μια ενέργεια. Στην περίπτωση που υπάρχουν πολλοί πράκτορες, είναι απαραίτητο να ληφθεί υπόψη η αμοιβαία επιρροή τους: σε αυτήν την περίπτωση, προκύπτει ένα παιχνίδι - μια αλληλεπίδραση στην οποία η ανταμοιβή κάθε πράκτορα εξαρτάται τόσο από τη δική του δράση όσο και από τις ενέργειες άλλων πρακτόρων . Εάν, δυνάμει της υπόθεσης της ορθολογικής συμπεριφοράς, καθένας από τους πράκτορες επιδιώκει να μεγιστοποιήσει την αντικειμενική του λειτουργία επιλέγοντας μια δράση, τότε είναι σαφές ότι στην περίπτωση πολλών παραγόντων, η ατομική ορθολογική δράση καθενός από αυτούς εξαρτάται από τις ενέργειες άλλων πρακτόρων7. Εξετάστε ένα θεωρητικό μοντέλο αλληλεπίδρασης μεταξύ n πρακτόρων. Κάθε πράκτορας επιλέγει μια ενέργεια xi που ανήκει στο αποδεκτό σύνολο Xi, i н N = (1, 2, …, n) – το σύνολο των παραγόντων. Η επιλογή των ενεργειών από τους πράκτορες πραγματοποιείται μία φορά, ταυτόχρονα και ανεξάρτητα. 7 Σε μοντέλα θεωρητικών παιγνίων, θεωρείται ότι ο ορθολογισμός των παικτών, δηλαδή, μετά την υπόθεσή τους για ορθολογική συμπεριφορά, είναι κοινή γνώση. Αυτή η υπόθεση γίνεται δεκτή και στην παρούσα εργασία. 24 Η ανταμοιβή του i-ου πράκτορα εξαρτάται από τη δική του δράση xi н Xi, από το διάνυσμα ενέργειες x-i= (x1, x2, …, xi-1, xi+1, …, xn) н Xi= Õ X j αντιπάλους N\(i) και από την κατάσταση της φύσης8 q н W, και jнN \ (i ) περιγράφεται από μια συνάρτηση αποπληρωμής πραγματικής αξίας fi = fi(q, x), όπου x = (xi, x-i) = (x1, x2, ..., xn) Î X" = Õ X j είναι το διάνυσμα των ενεργειών όλων των πρακτόρων jÎN Για μια σταθερή τιμή της κατάστασης της φύσης, το σύνολο Г = ( N, (Xi)i н N, (fi(×))i н N) σύνολα παραγόντων, σύνολα των αποδεκτών ενεργειών και αντικειμενικών συναρτήσεων καλείται παιχνίδι σε κανονική μορφή πράκτορες Δυνάμει της υπόθεσης της ορθολογικής συμπεριφοράς, κάθε πράκτορας θα προσπαθήσει να επιλέξει τις καλύτερες ενέργειες γι 'αυτόν (από την άποψη της αξίας της αντικειμενικής του λειτουργίας) σε μια δεδομένη κατάσταση. παιχνίδια x-i н X-i και φυσικές καταστάσεις q н W. Επομένως, η αρχή της λήψης απόφασης σχετικά με την επιλεγμένη ενέργεια μπορεί να γραφτεί ως εξής (BR υποδηλώνει την καλύτερη απόκριση - καλύτερη απόκριση): (1) BRi(q, x-i) = Arg max fi(q, xi, x-i), i н N. xi н X i Παράλληλα, θα συζητήσουμε την ευαισθητοποίηση που είναι απαραίτητη για την εφαρμογή της ισορροπίας. Ισορροπία σε κυρίαρχες στρατηγικές. Εάν για κάποιον πράκτορα το σύνολο (1) δεν εξαρτάται από την κατάσταση, τότε αποτελεί το σύνολο των κυρίαρχων στρατηγικών του (το σύνολο των κυρίαρχων στρατηγικών των πρακτόρων ονομάζεται ισορροπία στις κυρίαρχες στρατηγικές - RDS). Αν καθένας από τους πράκτορες έχει μια κυρίαρχη στρατηγική, τότε μπορούν να πάρουν αποφάσεις ανεξάρτητα, δηλαδή να επιλέξουν ενέργειες χωρίς να έχουν καμία πληροφορία και χωρίς να κάνουν τίποτα. 25 υποθέσεις για την κατάσταση. Δυστυχώς το RDS δεν υπάρχει σε όλα τα παιχνίδια. Για να επιτύχουν οι πράκτορες ισορροπία σε κυρίαρχες στρατηγικές, εάν υπάρχει η τελευταία, αρκεί ο καθένας από αυτούς να γνωρίζει μόνο την αντικειμενική του λειτουργία και τα αποδεκτά σύνολα X" και W. όλα τα παιχνίδια: (2) xiг н Arg max min min fi(q , xi, x-i), i н N. xi н X i x -i н X -i q нW Εάν για τουλάχιστον έναν από τους πράκτορες το σύνολο (1) εξαρτάται από την κατάσταση (δηλαδή δεν υπάρχει RDS), τότε το Η κατάσταση είναι πιο περίπλοκη. -2), …, BRn(q, x-n)). την ακόλουθη συνθήκη: (4) x*(q) О BR(q, x*(q)). Η ενσωμάτωση (4) μπορεί επίσης να γραφτεί ως: " i н N, " yi н Xi fi(q, x*(q)) ³ fi(q, yi, x-* i (q)). Το σύνολο EN(q) όλων των σημείων της μορφής (4) μπορεί να περιγραφεί ως εξής: (5) EN(q) = (x О X’ | xi О BRi(q, x-i), i О N). Για την περίπτωση δύο πρακτόρων, ένας εναλλακτικός ισοδύναμος τρόπος για να ορίσετε το σύνολο EN(q) είναι να το ορίσετε ως ένα σύνολο ζευγών σημείων (x1* (q), x2* (q)), που ικανοποιούν ταυτόχρονα τις ακόλουθες σχέσεις υπό όρους : (6) x1* (q) н BR1(q, BR2(q, BR1(q, . ..BR2(q, x2* (q))...))), (7) x2* (q) н BR2(q, BR1(q, BR2(q, ...BR1(q, x1* ( ιζ))...))). Ας εξετάσουμε τι πρέπει να έχουν οι πράκτορες πληροφοριών για να εφαρμόσουν την ισορροπία Nash επιλέγοντας ταυτόχρονα και ανεξάρτητα τις ενέργειές τους. Εξ ορισμού, η ισορροπία Nash είναι το σημείο από το οποίο μια μονόπλευρη απόκλιση δεν είναι ευνοϊκή για οποιονδήποτε από τους παράγοντες (υπό την προϋπόθεση ότι οι άλλοι παράγοντες επιλέγουν τα αντίστοιχα 26 συστατικά του διανύσματος δράσης ισορροπίας Nash). Εάν οι πράκτορες επιλέγουν επανειλημμένα ενέργειες, τότε το σημείο Nash είναι κατά μία έννοια (δείτε λεπτομέρειες στο ) σταθερό και μπορεί να θεωρηθεί υλοποιήσιμο στο πλαίσιο της γνώσης, όπως στην περίπτωση του RDS, από κάθε πράκτορα μόνο της δικής του αντικειμενικής λειτουργίας και αποδεκτό σύνολα X" και W (ταυτόχρονα, ωστόσο, είναι απαραίτητο να εισαχθούν πρόσθετες υποθέσεις σχετικά με τις αρχές για τη λήψη αποφάσεων από τους πράκτορες σχετικά με την επιλογή των ενεργειών ανάλογα με την ιστορία του παιχνιδιού). και W για να πραγματοποιηθεί η ισορροπία Nash είναι δεν είναι πλέον αρκετό. Ως εκ τούτου, εισάγουμε την ακόλουθη υπόθεση, την οποία θα θεωρήσουμε ότι εκπληρώνεται κατά τη διάρκεια ολόκληρης της επόμενης παρουσίασης: οι πληροφορίες για το παιχνίδι Г, το σύνολο W και τον ορθολογισμό των πρακτόρων είναι κοινή γνώση. Η ουσιαστικά εισαγόμενη υπόθεση σημαίνει ότι καθένας από τους πράκτορες είναι λογικός, γνωρίζει το σύνολο των συμμετεχόντων στο παιχνίδι, τις αντικειμενικές λειτουργίες και τα αποδεκτά σύνολα όλων των παραγόντων και επίσης γνωρίζει το σύνολο των πιθανών τιμών των καταστάσεων της φύσης. Επιπλέον, γνωρίζει ότι οι άλλοι πράκτορες το ξέρουν, και ότι ξέρουν ότι το ξέρει και ούτω καθεξής. στο άπειρο (βλ. παραπάνω). Αυτή η ευαισθητοποίηση μπορεί, ειδικότερα, να επιτευχθεί με τη δημόσια (δηλαδή, ταυτόχρονα σε όλους τους φορείς που συγκεντρώνονται μαζί) την επικοινωνία των σχετικών πληροφοριών, η οποία διασφαλίζει πιθανό επίτευγμα από όλους τους πράκτορες της άπειρης βαθμίδας αντανάκλασης πληροφοριών. Σημειώστε ότι η υπόθεση που εισήχθη δεν λέει τίποτα για την ευαισθητοποίηση των παραγόντων σχετικά με τη συγκεκριμένη αξία της κατάστασης της φύσης. Εάν η έννοια της κατάστασης της φύσης είναι κοινή γνώση, τότε αυτό αρκεί για την εφαρμογή της ισορροπίας Nash. Για να τεκμηριώσουμε αυτόν τον ισχυρισμό, ας μοντελοποιήσουμε, χρησιμοποιώντας το παράδειγμα ενός παιχνιδιού δύο παικτών, την πορεία του συλλογισμού του πρώτου πράκτορα (ο δεύτερος πράκτορας υποστηρίζει με εντελώς παρόμοιο τρόπο και ο συλλογισμός του θα εξεταστεί χωριστά μόνο εάν διαφέρει από το σκεπτικό του πρώτου πράκτορα). Υποστηρίζει ως εξής (βλ. έκφραση (6)): "Η ενέργειά μου, δυνάμει του (1), θα πρέπει να είναι η καλύτερη απάντηση στη δράση του δεύτερου πράκτορα σε μια δεδομένη κατάσταση της φύσης. Επομένως, πρέπει να διαμορφώσω το μοντέλο της συμπεριφοράς του Σχετικά με αυτόν (με βάση τις υποθέσεις ότι οι αντικειμενικές συναρτήσεις και τα αποδεκτά σύνολα είναι κοινή γνώση), ξέρω ότι θα ενεργήσει στο πλαίσιο του (1), δηλαδή θα αναζητήσει την καλύτερη απάντηση στις ενέργειές μου για μια δεδομένη κατάσταση της φύσης (βλέπε (7)). χρειάζεται να μοντελοποιήσει τις ενέργειές μου και θα (και πάλι, βάσει των εισαγόμενων παραδοχών ότι οι αντικειμενικές συναρτήσεις και τα αποδεκτά σύνολα είναι κοινή γνώση) θα συλλογιστεί με τον ίδιο τρόπο όπως εγώ, και ούτω καθεξής ad infinitum (βλ. (6))." Στη θεωρία παιγνίων, για τέτοιους συλλογισμούς, χρησιμοποιείται μια επιτυχημένη φυσική αναλογία της αντανάκλασης στους καθρέφτες - βλ., για παράδειγμα,. Έτσι, για να εφαρμοστεί η ισορροπία Nash, αρκεί όλες οι παράμετροι του παιχνιδιού, καθώς και η τιμή της κατάστασης της φύσης, να είναι κοινή γνώση (εξασθένιση αυτής της υπόθεσης εξετάζεται στο ). Τα αντανακλαστικά παιχνίδια που εξετάζονται σε αυτή την εργασία χαρακτηρίζονται από το γεγονός ότι η αξία της κατάστασης της φύσης δεν είναι κοινή γνώση και κάθε πράκτορας έχει γενικά τις δικές του ιδέες για αυτήν την αξία, τις ιδέες άλλων παραγόντων κ.λπ. υποκειμενική ισορροπία. Οι εξεταζόμενοι τύποι ισορροπίας είναι ειδικές περιπτώσεις υποκειμενικής ισορροπίας, η οποία ορίζεται ως ένα διάνυσμα ενεργειών πρακτόρων, κάθε συστατικό του οποίου είναι η καλύτερη απόκριση του αντίστοιχου παράγοντα στο περιβάλλον του παιχνιδιού που μπορεί να πραγματοποιηθεί από την υποκειμενική του σκοπιά. Ας εξετάσουμε πιθανές περιπτώσεις. Ας υποθέσουμε ότι ο i-ος πράκτορας υπολογίζει στην πραγματοποίηση της κατάστασης) του παιχνιδιού x-Bi (το "B" σημαίνει πεποιθήσεις· μερικές φορές χρησιμοποιούνται οι όροι "υπόθεση", "μαντεύω" - εικασία) και καταστάσεις) της φύσης q i , τότε θα επιλέξει)) (8 ) xiB н BRi(q i , x-Bi), i н N. Το διάνυσμα xB είναι μια σημειακή υποκειμενική ισορροπία. Σημειώστε ότι αυτός ο ορισμός της "ισορροπίας" δεν απαιτεί την εγκυρότητα των υποθέσεων των πρακτόρων σχετικά με τις ενέργειες των αντιπάλων, δηλαδή, μπορεί να αποδειχθεί ότι $ i н N: x-Bi ¹ x-Bi . Μια δικαιολογημένη υποκειμενική ισορροπία, δηλαδή, τέτοια που x-Bi = x-Bi , i Î N, είναι μια ισορροπία Nash (για αυτό, ειδικότερα, αρκεί όλες οι παράμετροι του παιχνιδιού να είναι κοινές και ότι κάθε παράγοντας στο 28 ) κατασκευάζοντας το x-Bi μοντελοποίησε την ορθολογική συμπεριφορά των αντιπάλων). Στην ειδική περίπτωση, εάν η καλύτερη απόκριση κάθε παράγοντα δεν εξαρτάται από υποθέσεις για την κατάσταση, τότε η υποκειμενική ισορροπία είναι μια ισορροπία σε κυρίαρχες στρατηγικές. Σε μια πιο γενική περίπτωση, ο i-ος πράκτορας μπορεί να υπολογίζει στην επιλογή των ενεργειών από τους αντιπάλους από το σετ X -Bi н X-i και στην πραγματοποίηση της κατάστασης της φύσης από το σύνολο Wi н Wi н N. Τότε η καλύτερη απάντηση θα να εγγυάται υποκειμενική ισορροπία:) (9) xi (X -Bi , Wi) О Arg max minB min) fi(q, xi, x-i), i О N. xi О X i B -i x ОX q ОW i -i - i) = X-i, Wi = W, i н N, μετά xi(X -Bi) = xiг, i н N, δηλαδή, η εγγυητική υποκειμενική ισορροπία είναι μια «κλασική» εγγυητική ισορροπία. Μια παραλλαγή της εγγυητικής υποκειμενικής ισορροπίας είναι το P-balance, που περιγράφεται λεπτομερώς στο. Σε μια ακόμη πιο γενική περίπτωση, ως η καλύτερη απόκριση του i-ου παράγοντα, μπορούμε να θεωρήσουμε την κατανομή πιθανότητας pi(xi), όπου pi(×) н D(Xi) είναι το σύνολο όλων των πιθανών κατανομών στο Xi που μεγιστοποιεί την αναμενόμενη ανταμοιβή του πράκτορα, λαμβάνοντας υπόψη τις ιδέες του σχετικά με τις πιθανότητες κατανομής mi(x-i) н D(X-i) των ενεργειών που επιλέγονται από άλλους πράκτορες και την κατανομή πιθανότητας qi(q) н D(W) της κατάστασης της φύσης (λαμβάνουμε την αρχή της απόφασης Bayes): (10) pi(mi(×), qi(×), ×) = = arg max ò fi (q , xi , x-i) pi (xi) qi (q) mi (x-i ) dq dx , i Î Î N. p i ÎD (X i) X ", W Έτσι, για την εφαρμογή της υποκειμενικής ισορροπίας, οι πράκτορες πρέπει να είναι ελάχιστα ενημερωμένοι – καθένας από αυτούς πρέπει να γνωρίζει την αντικειμενική του συνάρτηση fi(×) και τα αποδεκτά σύνολα W και X «., δηλαδή, για να δικαιολογηθούν οι υποθέσεις, πρόσθετες έγκυρες υποθέσεις σχετικά με την αμοιβαία επίγνωση των πρακτόρων. Η πιο ισχυρή είναι η υπόθεση της κοινής γνώσης, η οποία μετατρέπει την υποκειμενική σημειακή ισορροπία σε ισορροπία Nash και το σύνολο των αρχών απόφασης Bayes σε μια ισορροπία Bayes-Nash. Ισορροπία Bayes-Nash. Εάν το παιχνίδι έχει ελλιπείς πληροφορίες (δείτε ), τότε το παιχνίδι Bayesian περιγράφεται από το ακόλουθο σύνολο: - ένα σύνολο N πρακτόρων. - ένα σύνολο Κ πιθανών τύπων παραγόντων, όπου ο τύπος του i-ου παράγοντα είναι ki н Ki, i н N, το διάνυσμα των τύπων k = (k1, k2, …, kn) н K' = Õ K i ; - το σύνολο X' = Õ Xi iОN των αποδεκτών διανυσμάτων ενεργειών των πρακτόρων iΟΝ. - ένα σύνολο βοηθητικών συναρτήσεων ui: K' ´ X' ® Â1; - παραστάσεις mi(×|ki) н D(K-i), i н N, πράκτορες. Η ισορροπία Bayes-Nash σε ένα παιχνίδι με ελλιπείς πληροφορίες ορίζεται ως ένα σύνολο στρατηγικών πρακτόρων της μορφής si: Ki ® Xi, i н N που μεγιστοποιούν τις αντίστοιχες αναμενόμενες χρησιμότητα (11) Ui(ki, si(×), s-i(×)) = ò ui (k, si(ki), s-i(k-i)) mi(k-i| ki) dk-i, i Î N. k -i ÎÕ K j j ¹i Στα μπεϋζιανά παιχνίδια, συνήθως υποτίθεται ότι οι παραστάσεις (mi(×| ×))i н N είναι κοινή γνώση. Για αυτό, ειδικότερα, αρκεί να είναι συνεπείς, δηλαδή να προέρχονται από κάθε έναν από τους παράγοντες σύμφωνα με τον τύπο Bayes από την κατανομή m(k) Î D(K’), που είναι κοινή γνώση. Για παιχνίδια Bayes στα οποία το (mi(×|×))in N είναι κοινή γνώση, η έννοια των ορθολογίσιμων στρατηγικών Di Н D(Xi), i О N έτσι ώστε Di Н BRi(D-i), i О N. Σε δύο παιχνίδια ατόμων, το σύνολο των ορθολογίσιμων στρατηγικών συμπίπτει με το σύνολο των στρατηγικών που προέκυψαν ως αποτέλεσμα της επαναληπτικής εξάλειψης στρατηγικών με ισχυρή κυριαρχία9. Γενίκευση ορθολογίσιμων στρατηγικών στην περίπτωση του Maximin 9 Θυμηθείτε ότι η στρατηγική ενός πράκτορα ονομάζεται ισχυρά κυριαρχούμενη, έτσι ώστε να υπάρχει μια άλλη στρατηγική του πράκτορα που σε κάθε περίπτωση παρέχει σε αυτόν τον πράκτορα αυστηρά μεγαλύτερη απόδοση. Η επαναληπτική εξάλειψη των αυστηρά κυριαρχούμενων στρατηγικών συνίσταται στον διαδοχικό (γενικά άπειρο) αποκλεισμό τους από το σύνολο των θεωρούμενων στρατηγικών των πρακτόρων, που οδηγεί στην εύρεση της πιο «αδύνατης» λύσης του παιχνιδιού - του συνόλου των μη κυριαρχούμενων στρατηγικών. 30 (εγγυητική) ισορροπία πραγματοποιείται σε . Είναι δυνατό να περιπλέκονται οι κατασκευές της υποκειμενικής ισορροπίας εισάγοντας απαγορεύσεις σε ορισμένους συνδυασμούς ενεργειών πρακτόρων κ.λπ. Έτσι, η εφαρμογή του RDS, εγγυητικής και υποκειμενικής ισορροπίας (εάν υπάρχουν) απαιτεί κάθε πράκτορας να έχει τουλάχιστον πληροφορίες για την αντικειμενική του λειτουργία και όλα τα αποδεκτά σύνολα, και η εφαρμογή της ισορροπίας Nash, εάν υπάρχει, απαιτεί επιπλέον ότι Οι τιμές όλων των βασικών παραμέτρων ήταν κοινή γνώση. Για άλλη μια φορά, σημειώνουμε ότι η πραγματοποίηση της ισορροπίας Nash συνεπάγεται την ικανότητα των παραγόντων (και του φορέα ελέγχου - του κέντρου ή του ερευνητή επιχειρήσεων, εάν έχουν τις κατάλληλες πληροφορίες) να υπολογίζουν εκ των προτέρων και ανεξάρτητα την ισορροπία Nash και να επιλέγουν αμέσως Ενέργειες ισορροπίας Nash σε ένα παιχνίδι ενός βήματος (στην περίπτωση αυτή, ένα ξεχωριστό θέμα είναι σε ποια από τις ισορροπίες επιλέγουν οι πράκτορες και το κέντρο εάν υπάρχουν πολλές ισορροπίες Nash). Από ποιοτική άποψη, η κοινή γνώση είναι απαραίτητη, ώστε καθένας από τους πράκτορες (και το κέντρο) να μπορεί να μοντελοποιήσει τις αρχές λήψης αποφάσεων άλλων παραγόντων, συμπεριλαμβανομένων εκείνων που λαμβάνουν υπόψη τις δικές του αρχές λήψης αποφάσεων κ.λπ. Επομένως, μπορούμε να συμπεράνουμε ότι η έννοια της επίλυσης του παιχνιδιού σχετίζεται στενά με την ευαισθητοποίηση των πρακτόρων. Οι έννοιες λύσεων όπως το RDS και η ισορροπία Nash είναι, κατά μία έννοια, περιοριστικές περιπτώσεις - η πρώτη απαιτεί ελάχιστη επίγνωση, η δεύτερη απαιτεί το άπειρο του βαθμού αντανάκλασης πληροφοριών όλων των παραγόντων. Επομένως, παρακάτω θα περιγράψουμε άλλες («ενδιάμεσες») περιπτώσεις συνειδητοποίησης των πρακτόρων - ιεραρχίες αναπαράστασης - και θα κατασκευάσουμε τις λύσεις παιχνιδιού που αντιστοιχούν σε αυτές. Πριν εφαρμόσουμε αυτό το πρόγραμμα, ας εξετάσουμε τα γνωστά μοντέλα κοινής γνώσης και την ιεραρχία αναπαράστασης. 1.3. ΓΕΝΙΚΕΣ ΠΡΟΣΕΓΓΙΣΕΙΣ ΣΤΗΝ ΠΕΡΙΓΡΑΦΗ ΤΩΝ ΠΛΗΡΟΦΟΡΙΩΝ Στις έννοιες της ισορροπίας που εξετάστηκαν στην προηγούμενη ενότητα (με πιθανή εξαίρεση τις ισορροπίες Nash και Bayes-Nash, στις οποίες υποτίθεται η παρουσία κοινής γνώσης), δεν υπάρχει προβληματισμός, καθώς κάθε παράγοντας κάνει μην προσπαθήσετε να πάρετε τη θέση των αντιπάλων. Ο προβληματισμός λαμβάνει χώρα όταν ένας πράκτορας έχει και χρησιμοποιεί μια ιεραρχία αναπαραστάσεων όταν λαμβάνει αποφάσεις - τις δικές του αναπαραστάσεις των αναπαραστάσεων άλλων παραγόντων, τις αναπαραστάσεις τους για τις αναπαραστάσεις του και τις αναπαραστάσεις του άλλου κ.λπ. Η ανάλυση ιδεών για αβέβαιους παράγοντες αντιστοιχεί στον προβληματισμό πληροφοριών και οι ιδέες για τις αρχές λήψης αποφάσεων - στον στρατηγικό προβληματισμό. Όσον αφορά την υποκειμενική ισορροπία, ο στρατηγικός προβληματισμός αντιστοιχεί στις υποθέσεις του πράκτορα ότι ο αντίπαλος θα υπολογίσει τη μία ή την άλλη συγκεκριμένη, για παράδειγμα, υποκειμενική εγγυητική ισορροπία και πληροφοριακό προβληματισμό - ποιες συγκεκριμένες υποθέσεις για την κατάσταση θα χρησιμοποιήσει ο αντίπαλος. Ας εξετάσουμε τις επί του παρόντος γνωστές10 προσεγγίσεις για την περιγραφή της ιεραρχίας των αναπαραστάσεων και της γενικής γνώσης. Όπως σημειώθηκε στο, υπάρχουν δύο προσεγγίσεις για την περιγραφή της επίγνωσης - συντακτική και σημασιολογική (υπενθυμίζουμε ότι "συντακτική είναι η σύνταξη των συστημάτων σημείων, δηλαδή η δομή του συνδυασμού των σημείων και οι κανόνες για το σχηματισμό και τον μετασχηματισμό τους, ανεξάρτητα από τις έννοιές τους και λειτουργίες σημαδιακών συστημάτων», «σημασιολογία - μελετά τα συστήματα σημείων ως μέσο έκφρασης νοήματος, το κύριο θέμα του είναι η ερμηνεία σημείων και συνδυασμών συμβόλων»). Τα θεμέλια αυτών των προσεγγίσεων τέθηκαν στη μαθηματική λογική. Με τη συντακτική προσέγγιση περιγράφεται ρητά η ιεραρχία των παραστάσεων. Εάν οι αναπαραστάσεις δίνονται από μια κατανομή πιθανότητας, τότε οι ιεραρχίες των αναπαραστάσεων σε ένα ορισμένο επίπεδο της ιεραρχίας αντιστοιχούν στις κατανομές στο γινόμενο του συνόλου των φυσικών καταστάσεων και των κατανομών που αντικατοπτρίζουν τις αναπαραστάσεις προηγούμενων επιπέδων. Μια εναλλακτική είναι η χρήση "τύπων" (με τη λογική έννοια), δηλαδή οι κανόνες για τη μετατροπή στοιχείων του αρχικού συνόλου με βάση τη χρήση λογικών 10 Πρέπει να σημειωθεί ότι οι ιεραρχίες αναπαράστασης και οι γενικές γνώσεις έχουν γίνει αντικείμενο έρευνας στη θεωρία παιγνίων πολύ πρόσφατα - το προαναφερθέν βιβλίο του D. Lewis είναι πρωτοποριακό (1969) και ένα άρθρο του R. Aumann (1976). Μια ανάλυση της χρονολογίας των δημοσιεύσεων (βλ. βιβλιογραφία) δείχνει ένα αυξανόμενο ενδιαφέρον για αυτήν την προβληματική περιοχή. 32 πράξεις και τελεστές της μορφής "ο παίκτης πιστεύω ότι η πιθανότητα του συμβάντος ... δεν είναι μικρότερη από α" . Ταυτόχρονα, η γνώση μοντελοποιείται με προτάσεις (τύπους) που κατασκευάζονται σύμφωνα με ορισμένους συντακτικούς κανόνες. Στο πλαίσιο της σημασιολογικής προσέγγισης, οι αναπαραστάσεις των παραγόντων δίνονται με κατανομές πιθανοτήτων στο σύνολο των φυσικών καταστάσεων. Στη συνέχεια δημιουργείται η ιεραρχία των αναπαραστάσεων με βάση μόνο αυτές τις κατανομές. Στην απλούστερη ντετερμινιστική περίπτωση, η γνώση αντιπροσωπεύεται από ένα σύνολο W πιθανών τιμών μιας αβέβαιης παραμέτρου και κατατμήσεις (Ri)i О N αυτού του συνόλου. Το στοιχείο διαμερίσματος Ri, το οποίο περιλαμβάνει q н W, αντιπροσωπεύει τη γνώση του ith agent, δηλαδή το σύνολο τιμών μιας αόριστης παραμέτρου που δεν διακρίνονται από την άποψή του, δεδομένου του γνωστού γεγονότος q . Η αντιστοιχία (σχετικά μιλώντας, «ισοδυναμία») μεταξύ συντακτικών και σημασιολογικών προσεγγίσεων εδραιώνεται στο . Ιδιαίτερα αξιοσημείωτες είναι οι πειραματικές μελέτες των ιεραρχιών αναπαράστασης στο - βλ. την ανασκόπηση στο . Που πραγματοποιήθηκε σύντομη κριτική δείχνει ότι υπάρχουν δύο άκρα. Το πρώτο «ακραίο» είναι η γενική γνώση (το πλεονέκτημα του J. Harshany είναι ότι μείωσε όλες τις πληροφορίες για τον πράκτορα που επηρεάζουν τη συμπεριφορά του στο μοναδικό του χαρακτηριστικό – τον ​​τύπο – και δημιούργησε μια ισορροπία (Bayes-Nash) με την υπόθεση ότι η κατανομή πιθανοτήτων είδη είναι κοινή γνώση). Το δεύτερο «ακραίο» είναι μια ατελείωτη ιεραρχία συνεπών ή ασυνεπών απόψεων. Ένα παράδειγμα του τελευταίου είναι η κατασκευή που δίνεται στο , η οποία, αφενός, περιγράφει όλα τα πιθανά παιχνίδια Μπεϋζιανού και όλες τις πιθανές ιεραρχίες αναπαραστάσεων, και, αφετέρου, (λόγω της γενικότητάς της) είναι τόσο δυσκίνητη που δεν επιτρέπουν τον εποικοδομητικό καθορισμό και επίλυση συγκεκριμένων προβλημάτων. Οι περισσότερες μελέτες σχετικά με την ευαισθητοποίηση είναι αφιερωμένες στην απάντηση στο ερώτημα: σε ποιες περιπτώσεις η ιεραρχία των αναπαραστάσεων των πρακτόρων περιγράφει τη γενική γνώση και/ή αντικατοπτρίζει επαρκώς την επίγνωση των πρακτόρων. Η εξάρτηση της λύσης του παιχνιδιού από την τελική ιεραρχία των συνεπών ή ασυνεπών αναπαραστάσεων των πρακτόρων (δηλαδή, ολόκληρο το εύρος μεταξύ των δύο "άκρων" που σημειώθηκαν παραπάνω) πρακτικά δεν έχει μελετηθεί. Εξαιρέσεις αποτελούν, πρώτον, το έργο , στο οποίο οι ισορροπίες Bayes-Nash για ιεραρχίες τριών επιπέδων ασυνεπών αναπαραστάσεων πιθανοτήτων δύο πρακτόρων χτίστηκαν με την υπόθεση ότι οι αναπαραστάσεις στο κατώτερο επίπεδο της ιεραρχίας συμπίπτουν με τις αναπαραστάσεις του προηγούμενου επιπέδου – δείτε επίσης υποθέσεις του τύπου Pm και τις αντίστοιχες ισορροπίες στο . Δεύτερον, το τρίτο κεφάλαιο αυτής της εργασίας, το οποίο περιγράφει αυθαίρετες (πεπερασμένες ή άπειρες, συνεπείς ή ασυνεπείς) ιεραρχίες "σημείων" αναπαραστάσεων, για τις οποίες κατασκευάζεται και μελετάται μια ισορροπία πληροφοριών - η ισορροπία ενός αντανακλαστικού παιχνιδιού (η δυνατότητα και η σκοπιμότητα του Η γενίκευση των αποτελεσμάτων που λαμβάνονται στην περίπτωση των διαστημάτων ή των πιθανολογικών αναπαραστάσεων των παραγόντων συζητείται στο συμπέρασμα). Έτσι, τόσο η μελέτη του στρατηγικού προβληματισμού (Κεφάλαιο 2 αυτής της εργασίας) όσο και η κατασκευή μιας λύσης σε ένα αντανακλαστικό παιχνίδι, καθώς και η μελέτη της εξάρτησης αυτής της ισορροπίας από την ιεραρχία των αναπαραστάσεων των πρακτόρων (Κεφάλαιο 3 αυτής της εργασίας ), είναι σχετικές. ΚΕΦΑΛΑΙΟ 2. ΣΤΡΑΤΗΓΙΚΟΣ ΑΝΑΛΟΓΙΣΜΟΣ Αυτό το κεφάλαιο διερευνά μοντέλα θεωρητικών παιγνίων στρατηγικού προβληματισμού. Στην Ενότητα 2.1, μελετάμε το μοντέλο του στρατηγικού προβληματισμού σε ένα παιχνίδι δύο ατόμων, το οποίο στην Ενότητα 2.2 μας επιτρέπει να λύσουμε το πρόβλημα της μέγιστης πρόσφορης κατάταξης στρατηγικού προβληματισμού σε παιχνίδια bimatrix. Η ενότητα 2.3 είναι αφιερωμένη σε μια συζήτηση για το πεπερασμένο του βαθμού αναστοχασμού, που δημιουργείται από τις περιορισμένες ικανότητες ενός ατόμου να επεξεργάζεται πληροφορίες. 2.1. ΣΤΡΑΤΗΓΙΚΟΣ ΑΝΤΑΚΛΑΣΤΙΚΟΣ ΣΕ ΠΑΙΧΝΙΔΙΑ ΔΙΠΡΟΣΩΠΩΝ Ας εξετάσουμε διαδοχικά, με σειρά αυξανόμενης επίγνωσης, αντανακλαστικά μοντέλα λήψης αποφάσεων σε παιχνίδια δύο ατόμων. Μηδενική κατάταξη αντανάκλασης. Ας εξετάσουμε το πρόβλημα της λήψης απόφασης από έναν πράκτορα σε περίπτωση πλήρους απουσίας πληροφοριών σχετικά με την κατάσταση της φύσης (υπενθυμίζουμε ότι η υπόθεση ότι οι λειτουργίες-στόχοι και τα αποδεκτά σύνολα είναι κοινή γνώση θεωρείται ότι εκπληρώνεται). Από τη μία πλευρά, φαίνεται λογικό να χρησιμοποιηθεί η αρχή λήψης αποφάσεων με βάση το μέγιστο εγγυημένο αποτέλεσμα, σύμφωνα με την οποία ο i-th agent θα επιλέξει μια εγγυητική (ανάλογα με την κατάσταση της φύσης και τη δράση του αντιπάλου) 12) 1 xiг = arg max min min fi(q, xi , x-i). xi н X i q нW x -i н X -i μπορεί να υπολογίσει τη στρατηγική εγγυήσεων του αντιπάλου). Τότε η καλύτερη απάντηση είναι (13) 2 xiг = arg max min fi(q, xi, 1 x-г i). xi н X i q нW Αλλά ο αντίπαλος του υπό εξέταση πράκτορα μπορεί να επιχειρηματολογήσει με παρόμοιο τρόπο. Εάν ο υπό εξέταση πράκτορας επιτρέπει μια τέτοια δυνατότητα, τότε η στρατηγική εγγυήσεώς του θα είναι (14) 13) αντικαθιστώντας τον δείκτη "i" με "i" και αντίστροφα. Η αλυσίδα της αύξησης της «βαθμίδας ανάκλασης» (οι υποθέσεις του πράκτορα για την κατάταξη αντανάκλασης του αντιπάλου) μπορεί να συνεχιστεί περαιτέρω (βλ. αναλογίες στα δυναμικά μοντέλα που εξετάζονται στο ) προσδιορίζοντας αναδρομικά (15) x-i i), k = 2, 3, . .., xi н X i q нW g 1 i όπου x , i = 1, 2, καθορίζονται από το (12). Το σύνολο των ενεργειών του τύπου (15) θα ονομάζεται το σύνολο των αντανακλαστικών στρατηγικών εγγύησης. Ας εξετάσουμε ένα ενδεικτικό παράδειγμα. Παράδειγμα 1. Έστω οι αντικειμενικές συναρτήσεις των πρακτόρων έχουν τη μορφή: f1(x1, x2) = x1 – x12 /2x2, f2(x1, x2) = x2 – x22 /2(x1 + d), όπου d > 0. Ως για αποδεκτά σύνολα, ας υποθέσουμε ότι X1 = X2 = , 0< e < 1. Будем считать, что каждая из констант e и 35 d много меньше единицы. Гарантирующие стратегии агентов приведены в таблице 1. Табл. 1. Гарантирующие стратегии агентов в примере 1 k г k x1 1 e 2 e+d 3 e+d 4 e + 2d 5 e + 2d 6 e + 3d 7 e + 3d ... ... x2г e+d e+d e + 2d e + 2d e + 3d e + 3d e + 4d ... k Видно, что, во-первых, значения гарантирующих действий увеличиваются с ростом «ранга рефлексии». Во-вторых, различным «рангам рефлексии» агентов соответствуют в общем случае различные гарантирующие действия (отметим, что равновесием11 Нэша в данном примере является вектор (1; 1)) ·12. Вопрос о том, какое действие следует выбирать агенту, остается открытым. Единственно, можно констатировать, что, обладая информацией только о множестве возможных значений состояния природы, i-ый агент может выбирать одно из действий k xiг, i = 1, 2; k = 1, 2, ..., определяемых выражениями (12) и (15). Доопределить рациональный выбор агента в рассматриваемой модели можно следующим образом. Если агенту неизвестна целевая функция оппонента (что исключено в рамках предположения о том, что целевые функции и допустимые множества являются общим знанием), то единственным его рациональным действием является выбор (12), то есть классический МГР. В рамках введенных предположений агенту известна целевая функция оппонента, а также известно, что оппоненту известен этот факт и т.д. Поэтому с точки зрения агента нерационально использование классического МГР, и ему следует рассчитывать, как минимум, что оппонент будет ис11 В качестве отступления заметим, что, если в рассматриваемом примере целевая 2 функция второго агента имеет вид f2(x1, x2) = x2 + x2 /2x1, то у него существует доминантная стратегия (равная единице), и последовательность гарантирующих стратегий первого агента стабилизируется уже на втором члене: 2 г i x x 2 xiг. Символ «·» здесь и далее обозначает окончание примера или доказательства. 36 = e, = 1/2. Если первый агент может вычислить доминантную стратегию своего оппонента, то представляется рациональным выбор им действия 12 г 1 i пользовать МГР, что приведет к выбору 2 xiг. Но, опять же, в силу того, что целевые функции являются общим знанием, агент может предположить, что такой ход его рассуждений может быть восстановлен оппонентом, что сделает целесообразным выбор 3 xiг и т.д. до бесконечности. Следовательно, с точки зрения агента остается неопределенность относительно «ранга рефлексии» оппонента13. Относительно этого параметра он не имеет никакой информации (если у агента имеются некоторые убеждения по этому поводу, то может реализоваться соответствующее субъективное равновесие), что делает ορθολογική χρήσηεγγυημένο αποτέλεσμα σύμφωνα με το «reflection rank» του αντιπάλου: (16) x'i = arg max min min fi(q, xi, j x-i i). xi н X i j =1, 2,... q нW Σημειώστε ότι, πρώτον, το x’i μπορεί να διαφέρει από την κλασική στρατηγική εγγύησης 1 xiг που ορίζεται από την έκφραση (12). Δεύτερον, κατά τη χρήση της στρατηγικής (16), το γεγονός ότι ο αντίπαλος έχει κυρίαρχη στρατηγική θα ληφθεί υπόψη από τον πράκτορα (δείτε την υποσημείωση στο παράδειγμα 1). Ο Πίνακας 2 δείχνει τις τιμές της αντικειμενικής συνάρτησης του πρώτου πράκτορα στο παράδειγμα 1, ανάλογα με την «βαθμίδα ανάκλασης» του αντιπάλου και τις αντίστοιχες ενέργειες του αντιπάλου. Μπορεί να φανεί ότι όταν χρησιμοποιείται η στρατηγική (16), η απόδοση του ith πράκτορα είναι ίση με e + d, η οποία υπερβαίνει την ανταμοιβή e που λαμβάνεται όταν χρησιμοποιείται το κλασικό MHR. Αυτί. 2. Οι πληρωμές του πρώτου πράκτορα στο παράδειγμα + 4d e+d e+d e + 2d e + 2d e + 3d e + 3d e + 4d 13 Με άλλα λόγια, το αρχικό παιχνίδι μπορεί να αντικατασταθεί από ένα παιχνίδι στο οποίο οι πράκτορες επιλέξτε τις τάξεις αντανάκλασής τους. Για νέο παιχνίδι Μπορούν επίσης να κατασκευαστούν αντανακλαστικά ανάλογα, και ούτω καθεξής. μέχρι το άπειρο (βλ. παραδείγματα: "Πέναλτι" - στην εισαγωγή, "Κρυφτό και αναζήτηση" και "Κατεδάφιση σε τσιγκούνη" - στην ενότητα 2.2). Ένας από τους πιθανούς τρόπους αντιμετώπισης ενός τέτοιου «άπειρου» είναι να χρησιμοποιήσετε ένα εγγυημένο αποτέλεσμα σύμφωνα με την κατάταξη ανάκλασης του αντιπάλου. Ένας άλλος πιθανός τρόπος, αποτελεσματικός για πεπερασμένα παιχνίδια, είναι ο προσδιορισμός της μέγιστης εύχρηστης κατάταξης αντανακλαστικών παραγόντων – βλέπε ενότητα 2.2. 37 Έτσι, στο υπό εξέταση μοντέλο, μπορεί να θεωρηθεί ορθολογική η χρήση στρατηγικών (15) ή (16) από τον πράκτορα. Η πρώτη βαθμίδα προβληματισμού. Ας υποθέσουμε τώρα ότι ο πράκτορας έχει ορισμένες πληροφορίες για την κατάσταση της φύσης, τις οποίες θεωρεί αληθινές, και τίποτα περισσότερο δεν του είναι γνωστό με βεβαιότητα. Στο πλαίσιο της υπάρχουσας αβεβαιότητας, λόγω της αρχής του ντετερμινισμού, ένας πράκτορας που εκτελεί στρατηγικό προβληματισμό έχει δύο εναλλακτικές λύσεις - είτε να υποθέσει ότι ο αντίπαλός του δεν έχει καμία πληροφορία, είτε να υποθέσει ότι ο τελευταίος έχει τις ίδιες πληροφορίες με τον εαυτό του14. Εάν ο πράκτορας δεν εισάγει υποθέσεις σχετικά με την επίγνωση και τις αρχές της συμπεριφοράς του αντιπάλου, τότε αναγκάζεται να εφαρμόσει την αρχή του μέγιστου εγγυημένου αποτελέσματος (MGR) - όχι επιπλέον (σε σύγκριση με το μοντέλο της μηδενικής κατάταξης προβληματισμού που εξετάστηκε παραπάνω) πληροφορίες για τον αντίπαλο έχουν προστεθεί στον πράκτορα15 - δηλαδή, να βασίζονται στη χειρότερη επιλογή για αυτόν του δεύτερου πράκτορα από το σύνολο των στρατηγικών του τύπου (16). Η στρατηγική εγγύησης θα είναι: (17) xi (qi) = arg max min fi(qi, xi, j x-i i). xi н X i j =1, 2,... Σημειώστε ότι, όντας στην κατάσταση πληροφοριών που αντιστοιχεί στο υπό εξέταση μοντέλο, υπολογίζοντας το (17), ο πράκτορας θεωρεί ότι ο αντίπαλος βρίσκεται στην κατάσταση πληροφοριών που αντιστοιχεί στο προηγούμενο μοντέλο. Αυτή η γενική αρχή - έχοντας κάποιες πληροφορίες, ο πράκτορας μπορεί να θεωρήσει ότι ο αντίπαλος έχει είτε τον ίδιο είτε έναν χαμηλότερο βαθμό αντανακλαστικών - θα χρησιμοποιηθεί σε μια σειρά από άλλα μοντέλα αντανακλαστικής λήψης αποφάσεων. Εάν ο πρώτος πράκτορας πιστεύει ότι ο αντίπαλός του έχει τις ίδιες πληροφορίες με τον εαυτό του (ο δεύτερος πράκτορας μπορεί να συλλογιστεί παρόμοια - βλέπε την υπόθεση P1 στο ), τότε υπολογίζει την υποκειμενική 14 Αυτή η αρχή (και οι γενικεύσεις της) θα χρησιμοποιηθεί ευρέως παρακάτω για τον προσδιορισμό των πεπερασμένων πληροφοριών δομές - πράγματι, έχοντας πληροφορίες Ii, ο i-ος πράκτορας μπορεί, σε περίπτωση αβεβαιότητας, να αποδώσει σε άλλους πράκτορες μόνο την επίγνωση που είναι συνεπής με το Ii. 15 Φυσικά, ο πράκτορας μπορεί να υποθέσει ότι ο αντίπαλος έχει κάποιες πληροφορίες, αλλά επειδή αυτές οι πληροφορίες δεν εμφανίζονται στο μοντέλο, δεν θα εξετάσουμε τέτοιες υποθέσεις. 38 ισορροπία (δηλαδή η «ισορροπία Nash» για την αντίστοιχη υποκειμενική* * περιγραφή του παιχνιδιού) EN(q1) = ((x11 (q1), x12 (q1))) της παρακάτω μορφής: * * * (18 ) " x1 н X1 f1 (q1, x11 (q1), x12 (q1)) ³ f1(q1, x1, x12 (q1)), * * * " x2 Î X2 f2(q1, x11 (q1), x12 ( q1)) ³ f1 (q1, x11 (q1), x2). Ουσιαστικά, τα παραπάνω συστήματα ανισοτήτων αντικατοπτρίζουν τον υπολογισμό από τον πρώτο παράγοντα της «δικής του» ισορροπίας Nash και την επιλογή της αντίστοιχης συντεταγμένης αυτής της ισορροπίας. Στη γενική περίπτωση, ο πράκτορας και ο αντίπαλός του θα υπολογίσουν διαφορετικές ισορροπίες - μια σύμπτωση είναι δυνατή εάν η επίγνωση είναι τέτοια ώστε xij* (qi) = x*jj (qj), i, j = 1, 2. Έτσι, η λογική σε Το μοντέλο της πρώτης τάξης αναστοχασμού μπορεί να ληφθεί υπόψη η επιλογή του πράκτορα είτε μιας αντανακλαστικής στρατηγικής εγγύησης (17) είτε μιας υποκειμενικής ισορροπίας (18). Η υποκειμενική ισορροπία (18) που προσδιορίζεται από τον πρώτο παράγοντα μπορεί συμβατικά να απεικονιστεί ως γραφική παράσταση με δύο κορυφές x12 x1 us x1 και x12, που αντιστοιχούν στον πρώτο παράγοντα και τις ιδέες του για τον δεύτερο παράγοντα16 (βλ. Εικ. 1. Υποκειμενική nok 1). Τα εισερχόμενα βέλη σε ισορροπία στο μοντέλο του πρώτου αντικατοπτρίζουν αυτή την πληροφορία, μιας στρατηγικής κατάταξης, η οποία χρησιμοποιείται από κάθε μια από τις σκέψεις των πρακτόρων για τον αντίπαλο. Η δεύτερη κατάταξη του προβληματισμού. Στο μοντέλο της δεύτερης βαθμίδας προβληματισμού, ο πράκτορας ith έχει πληροφορίες για τις ιδέες του αντιπάλου qij για την κατάσταση της φύσης και για τις δικές του ιδέες qii για την κατάσταση της φύσης (θα υποθέσουμε ότι qi = qii - δείτε το αξίωμα αυτοπληροφόρησης παρακάτω ). Ο πράκτορας μπορεί να περιμένει ότι ο αντίπαλός του θα επιλέξει μια εγγυητική στρατηγική (εν όψει του qij). Τότε η καλύτερη απάντηση είναι 16 Τέτοιοι πράκτορες που υπάρχουν στις αναπαραστάσεις άλλων πρακτόρων ονομάζονται φάντασμα. 39 (19) 2 xiг = arg max fi(qi, xi, x-г i (qij)), xi н X i г -i όπου το x (qi,-i) προσδιορίζεται από το (17). Εκτός από τη στρατηγική εγγυήσεων (19), ο πρώτος πράκτορας μπορεί να υπολογίσει την υποκειμενική ισορροπία * * EN(q1, q12) = ((x11 (q1, q12), x12 (q1, q12))) της ακόλουθης μορφής: * * * (q1,q12) , x12 (q1,q12)) ³ f1(q1, x1, x12 (q1,q12)), (20) " x1 н X1 f1(q1, x11 * * * " x2 н X2 f2 (q12, x121 (q1, q12), x12 (q1,q12)) ³ f2(q12, x121 (q1,q12), x2), * * * " x1 н X1 f1(q12, x121 (q1,q12), x12 (q1,q12)) ³ f2(q12, x1, x12 (q1,q12))). (19) ή υποκειμενική ισορροπία (20). Σημειώστε ότι τα δύο πρώτα συστήματα ανισοτήτων στο (20) αντικατοπτρίζουν την ισορροπία Nash από η άποψη x12 x1 του πρώτου παράγοντα, και το δεύτερο και το τρίτο σύστημα ανισοτήτων αντικατοπτρίζουν την ισορροπία Nash, την οποία ο δεύτερος παράγοντας πρέπει να καθορίσει από την οπτική γωνία του πρώτου παράγοντα - βλ. γράφημα στο σχήμα 3, στο οποίο η διακεκομμένη γραμμή είναι κυκλωμένη. 3. Το υποκειμενικό «μοντέλο» του δεύτερου πράκτορα, το οποίο χρησιμοποιεί ο πρώτος παράγοντας σε ισορροπία στο μοντέλο λήψης αποφάσεων RDM2. Η ανάλυση των απλούστερων μοντέλων στρατηγικής αντανάκλασης των πρώτων βαθμών δείχνει ότι στην περίπτωση πολλών πρακτόρων και της ανεπαρκούς επίγνωσής τους, μπορεί κανείς να εξετάσει τις διαδικασίες λήψης αποφάσεων ανεξάρτητα - καθένας από αυτούς μοντελοποιεί τη συμπεριφορά των αντιπάλων του, ότι είναι, επιδιώκει να χτίσει το δικό του κλειστό μοντέλο του παιχνιδιού (βλ. τη συζήτηση των διαφορών στην υποκειμενική και μια αντικειμενική περιγραφή του παιχνιδιού στο ). Στην περίπτωση της γενικής γνώσης, τα υποκειμενικά μοντέλα συμπίπτουν. 40 Παραπάνω εξετάσαμε την αντανάκλαση της μηδενικής, πρώτης και δεύτερης κατάταξης. Η αύξηση των βαθμών αναστοχασμού μπορεί να γίνει περαιτέρω κατ' αναλογία. Βασικές σε όλα τα μοντέλα είναι οι υποθέσεις του πράκτορα σχετικά με το τι αντανακλαστική κατάταξη έχει ο αντίπαλός του, δηλαδή, στην πραγματικότητα, ο βαθμός αντανάκλασης του πράκτορα καθορίζεται από τον βαθμό αντανάκλασης που αποδίδει στον αντίπαλό του. Δεν μπορούν να προσφερθούν εκ των προτέρων στον πράκτορα εύλογες συστάσεις που να περιορίζουν την ανάπτυξη της τάξης του δικού του προβληματισμού. Από αυτή την άποψη, μπορεί να ειπωθεί ότι δεν υπάρχει καθολική έννοια της ισορροπίας για παιχνίδια με στρατηγικό προβληματισμό. Σε αυτήν την περίπτωση, η μόνη διέξοδος είναι να χρησιμοποιήσετε είτε το MHR σύμφωνα με τις τάξεις αντανακλαστικών του αντιπάλου, είτε την υποκειμενική ισορροπία, στην οποία κάθε πράκτορας εισάγει ορισμένες υποθέσεις σχετικά με την κατάταξη αντανάκλασης του αντιπάλου και επιλέγει τη βέλτιστη δράση του μέσα σε αυτές τις παραδοχές. Ως εκ τούτου, θα επικεντρώσουμε την κύρια προσοχή μας στη μελέτη περιπτώσεων όπου η κατάταξη της αντανάκλασης δεν αυξάνεται απεριόριστα. Υπάρχουν δύο λόγοι για τους οποίους ο βαθμός ανάκλασης μπορεί να είναι πεπερασμένος. Πρώτον, δεν είναι σκόπιμο να αυξηθεί η κατάταξη ανάκλασης πάνω από μια ορισμένη από την άποψη της ανταμοιβής του πράκτορα (όταν μια περαιτέρω αύξηση του βαθμού ανάκλασης σίγουρα δεν οδηγεί σε αύξηση της απόδοσης). Δεύτερον, η ικανότητα ενός ατόμου να επεξεργάζεται πληροφορίες είναι περιορισμένη και η άπειρη κατάταξη του προβληματισμού δεν είναι τίποτα περισσότερο από μια μαθηματική αφαίρεση. Επομένως, στις επόμενες ενότητες αυτού του κεφαλαίου, παρουσιάζονται μοντέλα που λαμβάνουν υπόψη και τους δύο αυτούς λόγους - στην Ενότητα 2.2, χρησιμοποιώντας το παράδειγμα παιχνιδιών bimatrix, προσδιορίζεται η μέγιστη εύχρηστη κατάταξη στρατηγικού προβληματισμού και στην ενότητα 2.3, ο ρόλος των περιορισμών πληροφοριών διερευνάται. 2.2. ΑΝΤΑΝΑΚΛΑΣΗ ΣΕ ΠΑΙΧΝΙΔΙΑ BIMATRIX Η κύρια ιδέα που αναπτύσσεται σε αυτή την ενότητα είναι ότι στα παιχνίδια bimatrix17 στα οποία δεν υπάρχει ισορροπία Nash ή στα οποία, δεδομένης της υπάρχουσας ισορροπίας Nash, οι πράκτορες επιλέγουν υποκειμενικές στρατηγικές εγγύησης (βλ. 17 Θυμηθείτε ότι τα πεπερασμένα παιχνίδια δύο ατόμων ονομάζονται παιχνίδια bimatrix. 41 της προηγούμενης ενότητας αυτής της εργασίας), η ανταμοιβή καθενός από τους πράκτορες εξαρτάται τόσο από την αντανακλαστική κατάταξή του όσο και από την κατάταξη αντανάκλασης του αντιπάλου. Επιπλέον, αποδεικνύεται ότι μια απεριόριστη αύξηση της κατάταξης του στρατηγικού προβληματισμού δεν οδηγεί σε αύξηση της απόδοσης. Ας προχωρήσουμε σε μια επίσημη περιγραφή. Σκεφτείτε ένα παιχνίδι bimatrix18 στο οποίο οι πληρωμές του πρώτου και του δεύτερου πράκτορα δίνονται από τους πίνακες A = ||aij|| και Β = ||bij|| διαστάσεις n ´ m, αντίστοιχα. Σημειώστε19 I = (1, 2, …, n) – το σύνολο των ενεργειών του πρώτου πράκτορα (επιλέγοντας μια σειρά), J = (1, 2, …, m) – το σύνολο των ενεργειών του δεύτερου πράκτορα (επιλογή ενός στήλη). Στο υπό εξέταση παιχνίδι, οι στρατηγικές εγγυήσεων των πρακτόρων είναι οι εξής: i0 Î Arg max min aij, j0 Î Arg max min bij. iОI jОJ jОJ iОI Ας εισαγάγουμε τις ακόλουθες υποθέσεις. Αφήστε τους πίνακες αποπληρωμής να είναι τέτοιοι ώστε κάθε ενέργεια κάθε πράκτορα να είναι η καλύτερη απόκριση σε κάποια ενέργεια του αντιπάλου και, επιπλέον, η καλύτερη απάντηση σε κάθε ενέργεια του αντιπάλου να είναι μοναδική (αν υπάρχουν πολλές καλύτερες απαντήσεις, τότε μπορεί να εισαγάγει έναν κανόνα που καθορίζει περαιτέρω την επιλογή του πράκτορα).20 Επομένως, κατά τον καθορισμό των καλύτερων απαντήσεων, αντί για τις εκφράσεις «i… О Arg max…» και iОI «j… О Arg max…», μπορείτε να χρησιμοποιήσετε αντίστοιχα, οι εκφράσεις jОJ “i… = arg max…” και “j… = arg max…”. iОI jОJ Έστω a0 = max min aij, b0 = max min bij είναι το μέγιστο iОI jОJ jОJ iОI 18 Δεδομένου ότι τα παιχνίδια μήτρας (ανταγωνιστικά πεπερασμένα παιχνίδια δύο ατόμων) είναι μια ειδική περίπτωση παιχνιδιών bimatrix, όλα τα αποτελέσματα που παρουσιάζονται σε αυτήν την ενότητα ισχύουν και για παιχνίδια μήτρας. 19 Ας ελπίσουμε ότι η χρήση του ίδιου (ιστορικά καθιερωμένου) χαρακτηρισμού για τη δομή πληροφοριών και το σύνολο των ενεργειών του πρώτου πράκτορα δεν θα οδηγήσει σε σύγχυση. 20 Εάν αυτές οι παραδοχές εγκαταλειφθούν, τότε όλα τα αποτελέσματα που προκύπτουν σε αυτήν την ενότητα θα παραμείνουν έγκυρα, καθώς οι παραδοχές που εισήχθησαν καθιστούν δυνατή τη λήψη μιας ανώτερης εκτίμησης για τη μέγιστη πρόσφορη κατάταξη στρατηγικού προβληματισμού. 42 Ας ορίσουμε ένα αντανακλαστικό παιχνίδι διμήτρας MGkl (παιχνίδι μήτρας) ως ένα παιχνίδι διμήτρας με πίνακες Α και Β, στο οποίο ο πρώτος και ο δεύτερος πράκτορας έχουν τάξεις αντανακλάσεων ίσες με k και l, αντίστοιχα, k, l О А, όπου Α είναι το σύνολο των φυσικών αριθμών. Ας διευκρινίσουμε τι θα γίνει κατανοητό από την κατάταξη του προβληματισμού (ακριβέστερα, από την κατάταξη του στρατηγικού προβληματισμού) σε παιχνίδια bimatrix. Στο bimatrix (και όχι μόνο bimatrix - βλ. ) στα παιχνίδια, η επιλογή των ενεργειών από τους πράκτορες μπορεί να γίνει με βάση τη γνώση των βαθμολογιών αντανακλάσεων του αντιπάλου. Οι τάξεις ανάκλασης ορίζονται ως εξής. «Ένας πράκτορας έχει μηδενική κατάταξη αντανάκλασης εάν γνωρίζει μόνο τον πίνακα πληρωμών. Ένας πράκτορας έχει την πρώτη κατάταξη αντανάκλασης εάν πιστεύει ότι οι αντίπαλοί του έχουν μηδενική κατάταξη αντανάκλασης, δηλαδή γνωρίζουν μόνο τη μήτρα πληρωμής. Γενικά, ένας πράκτορας με την kth reflexion rank υποθέτει ότι οι αντίπαλοί του έχουν την k-1st reflexion rank. Κάνει τους απαραίτητους συλλογισμούς για την επιλογή της στρατηγικής και επιλέγει τη στρατηγική του με βάση τη γνώση του πίνακα πληρωμών και την προέκταση των ενεργειών των αντιπάλων του. Ας πάρουμε ένα ενδεικτικό παράδειγμα. Παράδειγμα 2 (Απόκρυψη και αναζήτηση) . Ο πρώτος πράκτορας κρύβεται σε ένα από τα πολλά δωμάτια με διαφορετικό φωτισμό και ο άλλος πράκτορας πρέπει να επιλέξει το δωμάτιο όπου θα τον αναζητήσει. Οι βαθμοί φωτισμού είναι γνωστοί και στους δύο παράγοντες. Οι στρατηγικές αντιπροσώπων είναι οι εξής. Ο αναζητητής, ceteris paribus, προτιμά να ψάχνει όπου είναι πιο ελαφρύ (είναι πιο εύκολο να το βρεις εκεί). Κρύβοντας είναι ξεκάθαρο ότι σε ένα πιο σκοτεινό δωμάτιο, οι πιθανότητες να τον βρεις είναι λιγότερες από ό,τι σε ένα φωτισμένο. Η αύξηση του βαθμού αντανάκλασης σημαίνει ότι γίνεται σαφές στον πράκτορα ότι αυτό είναι ξεκάθαρο στον αντίπαλό του και ούτω καθεξής. Ας παρουσιάσουμε τις ανακλαστικές τάξεις των πρακτόρων και τις αντίστοιχες ενέργειες για την επιλογή δωματίων με τη μορφή του Πίνακα 3. Πίν. 3. Rank of reflexion of agents και αντίστοιχες ενέργειες για την επιλογή των δωματίων Rank of reflexion of a agent εκτός από το πιο ανοιχτό Οποιοδήποτε, εκτός από το πιο σκοτεινό Lightest Μπορεί να φανεί ότι μετά τη δεύτερη κατάταξη ανάκλασης, ολόκληρο το σύνολο των επιτρεπόμενων ενεργειών εξαντλείται , και μετά την τρίτη κατάταξη του προβληματισμού, οι στρατηγικές επιλογής δωματίου αρχίζουν να επαναλαμβάνονται. Αυτό το γεγονός ήταν μια απεικόνιση του γεγονότος ότι στο παιχνίδι δύο ατόμων, μια αύξηση στις τάξεις του προβληματισμού πάνω από έναν συγκεκριμένο στόχο δεν δίνει τίποτα νέο, αν και η υποκειμενική αύξηση της πολυπλοκότητας μπορεί να συνεχιστεί. Η απόκλιση μεταξύ των βαθμών της αντανάκλασης της επιτυχίας της δραστηριότητας είναι η εξής. Αφήστε το hider να έχει κατάταξη 0 (κρύβεται στο πιο σκοτεινό δωμάτιο). Αν ταυτόχρονα ο αναζητητής έχει την 1η θέση, τότε κερδίζει πάντα (ψάχνει στο πιο σκοτεινό δωμάτιο). Αν όμως ο αναζητητής έχει την 3η τάξη (ψάχνει σε οποιοδήποτε δωμάτιο εκτός από το πιο σκοτεινό), τότε πάντα χάνει από αυτόν που κρύβεται με τον 0ο βαθμό, γιατί, όπως θυμόμαστε, κρύβεται σε αυτό το πολύ σκοτεινό δωμάτιο, όπου ο αναζητητής, μετά μια σειρά στοχαστικών συλλογισμών, δεν θα φανεί ποτέ. Έτσι, είναι αδύνατο να δηλωθεί κατηγορηματικά ότι μια υψηλότερη κατάταξη ανάκλασης είναι καλύτερη από μια χαμηλότερη. Η προτίμηση μιας ή άλλης κατάταξης καθορίζεται από την αλληλεπίδρασή της με την αντανακλαστική κατάταξη του αντιπάλου. · Δεδομένου ότι στα παιχνίδια bimatrix θεωρείται ότι κάθε πράκτορας έχει κάποια πεποίθηση για την κατάταξη αντανάκλασης του αντιπάλου, αυτό επιτρέπει τη χρήση της έννοιας μιας υποκειμενικής στρατηγικής εγγύησης. Ας ορίσουμε υποκειμενικές στρατηγικές εγγύησης στο παιχνίδι διμήτρας MGkl: (21) ik = arg max aijk -1 , jl = arg max bil -1 j , k, l Î À. iнI jнj Έτσι, το παιχνίδι MG00 συμπίπτει με το αρχικό παιχνίδι και η "ισορροπία" στο παιχνίδι MGkl είναι (aik jl ; bik jl), k, l н └. Σημειώνουμε δύο ενδιαφέροντα στοιχεία. Πρώτον, η απόδοση οποιουδήποτε παράγοντα στο παιχνίδι MGkl για k ³ 1, l ³ 1 μπορεί να αποδειχθεί μικρότερη από τη μέγιστη εγγυημένη απόδοση (δείτε το παράδειγμα «Drift on a miser» παρακάτω). Δεύτερον, η ανάθεση 44 σε έναν αντίπαλο μιας αντανακλαστικής κατάταξης μικρότερης από τη δική του είναι αντιφατική, καθώς στο παιχνίδι MGkl για k ³ 1, l ³ 1 αυτό σημαίνει ότι l = k – 1 και k = l – 1 πρέπει να ικανοποιούνται ταυτόχρονα, το οποίο είναι προφανώς αδύνατο. Επομένως, η ισορροπία σε ένα αντανακλαστικό παιχνίδι είναι ουσιαστικά υποκειμενική και a priori οι πράκτορες δεν ξέρουν τι παιχνίδι παίζουν (οι βαθμοί αντανακλαστικών και των δύο παραγόντων δεν μπορούν να είναι κοινώς γνωστοί, αφού αυτό θα έρχεται σε αντίθεση με τον ίδιο τον ορισμό της κατάταξης ανακλαστικών). Ως εκ τούτου, μια πολλά υποσχόμενη κατεύθυνση για μελλοντική έρευνα είναι η μελέτη του προβληματισμού πληροφοριών σχετικά με τις τάξεις ανάκλασης των παραγόντων σε παιχνίδια bimatrix. Η εσωτερική ασυνέπεια του στρατηγικού προβληματισμού στα παιχνίδια bimatrix μπορεί να απεικονιστεί με το ακόλουθο σχήμα: Το σχήμα 4α δείχνει μια υποκειμενική περιγραφή του παιχνιδιού MGkl από την άποψη του αντανακλαστικού γραφήματος του παιχνιδιού από τη σκοπιά του πρώτου παράγοντα, το σχήμα 4β δείχνει μια υποκειμενική περιγραφή του ίδιου παιχνιδιού από την πλευρά του δεύτερου ατζέντη. i0 j0 i0 j0 i1 j1 i1 j1 … … ik-2 jk-2 il-2 jl-2 ik-1 jk-1 il-1 jl-1 ik ? Ρύζι. 4α. Μια υποκειμενική περιγραφή του παιχνιδιού MGkl από τη σκοπιά του πρώτου πράκτορα; jl Εικ. 4β. Μια υποκειμενική περιγραφή του παιχνιδιού MGkl από τη σκοπιά του δεύτερου πράκτορα 45 Κοιτώντας λίγο μπροστά (βλ. Ενότητα 3.4), σημειώνουμε ότι το γράφημα ενός αντανακλαστικού παιχνιδιού έχει την ιδιότητα ότι ο αριθμός των τόξων που εισέρχονται σε κάθε κορυφή του πρέπει να να είναι ένα λιγότερο από τον αριθμό των πρακτόρων (δηλαδή, στα παιχνίδια bimatrix είναι ίσος με έναν). Οι υποκειμενικές ενέργειες ισορροπίας εμφανίζονται με έντονους χαρακτήρες και οδηγούν σε "ισορροπία" (ik, jl). Οι ενέργειες ik-1 για τον πρώτο πράκτορα και jl-1 για τον δεύτερο δεν χρησιμοποιούνται στις αντίστοιχες υποκειμενικές περιγραφές του παιχνιδιού (βλ. παρακάτω). ερωτηματικά στο σχήμα 4), δηλαδή, καθένα από αυτά αποδεικνύεται ότι είναι εσωτερικά ανοιχτό. Έχοντας ολοκληρώσει μια σύντομη συζήτηση σχετικά με την εσωτερική ασυνέπεια στον προσδιορισμό της κατάταξης του στρατηγικού προβληματισμού σε παιχνίδια με δύο μήτρες, ας επιστρέψουμε στη μελέτη της εξάρτησης της υποκειμενικής ισορροπίας και των κερδών των πρακτόρων από τις τάξεις αναστοχασμού τους. Συμβολίστε IK = ik , JL = jl , K = 0, 1, 2, …, U U k =0 ,1,...,K l =0 ,1,...,L L = 0, 1, 2, … . Με το I¥ και J¥ εννοούμε τις αντίστοιχες ενώσεις σε όλες τις τάξεις ανάκλασης από το μηδέν έως το άπειρο. Εάν ένας πράκτορας (ή και οι δύο παράγοντες) δεν γνωρίζουν την αντανακλαστική κατάταξη του αντιπάλου, τότε είναι λογικό να εξετάσετε το παιχνίδι MG¥¥, στο οποίο κάθε παράγοντας υπολογίζει ένα εγγυημένο αποτέλεσμα από την κατάταξη αντανάκλασης του αντιπάλου. Εισάγουμε στρατηγικές εγγύησης που αντιστοιχούν σε πλήρη αβεβαιότητα σχετικά με την κατάταξη αντανάκλασης του αντιπάλου: (22) i¥ = arg max min aij, j¥ = arg max min bij. iОI jОJ ¥ jОJ iОI ¥ Παρομοίως, μπορεί κανείς να ορίσει στρατηγικές εγγύησης στο πλαίσιο της πληροφορίας ότι η κατάταξη ανάκλασης του αντιπάλου δεν υπερβαίνει μια γνωστή τιμή (δηλαδή, ο πρώτος πράκτορας πιστεύει ότι η κατάταξη ανάκλασης του δεύτερου δεν είναι υψηλότερη από L, και ο δεύτερος πράκτορας πιστεύει ότι η κατάταξη ανάκλασης του πρώτου δεν είναι υψηλότερη από το K : (23) iL = arg max min aijl , jK = arg max min bik j . iОI lОJ L jОJ kОI K Σημειώστε ότι στο (23), σε αντίθεση με το (21), η στρατηγική του καθενός από τους πράκτορες δεν εξαρτάται από τη δική του κατάταξη αντανακλαστικών, αλλά καθορίζεται από πληροφορίες σχετικά με την αντανακλαστική κατάταξη του αντιπάλου. Οι εκφράσεις (21)-(23) δεν εξαντλούν όλη την ποικιλία των πιθανών καταστάσεων, αφού, για παράδειγμα, ο πρώτος πράκτορας μπορεί να υποθέσει ότι ο δεύτερος θα επιλέξει το j¥ και, στη συνέχεια, η καλύτερη απάντησή του θα είναι το arg max aij¥, και σύντομα. Επιπλέον, αν και μόνο οι «ισχυροί» πράκτορες είναι ικανοί να αυξήσουν τον βαθμό αντανάκλασης iI, είναι διαισθητικά σαφές ότι με την αύξηση αυτής της κατάταξης, δηλαδή με την επιμήκυνση της αλυσίδας συλλογισμών «νομίζω ότι πιστεύει ότι εγώ σκέψου…» υπάρχει κίνδυνος «να είσαι πολύ έξυπνος». Ένας ισχυρός παράγοντας με υψηλό βαθμό αντανάκλασης υπερεκτιμά τον αντίπαλο, υποθέτοντας ότι έχει επίσης υψηλό βαθμό ανάκλασης. Αλλά, εάν η κατάταξη του αντιπάλου είναι πραγματικά χαμηλή, αυτό οδηγεί σε απώλεια ενός πιο αδύναμου αντιπάλου - δείτε τα παραδείγματα "Hide and Seek" και "Demolition on a miser". Επομένως, είναι απαραίτητη μια συστηματική μελέτη της αναλογίας των κερδών των πρακτόρων ανάλογα με τον τύπο του παιχνιδιού που παίζεται. Παρουσιάζουμε τα αποτελέσματα αυτής της μελέτης. Απαραίτητη για την εξέταση μας είναι η παρουσία ή η απουσία μιας ισορροπίας Nash, καθώς και η επιλογή από τους παράγοντες (και η χρήση στην κατασκευή υποκειμενικών ισορροπιών) εγγυητικών στρατηγικών ή ενεργειών που είναι ισορροπίας Nash. Έτσι, οι ακόλουθες τέσσερις καταστάσεις είναι δυνατές. Επιλογή 1 (υπάρχει ισορροπία Nash στις καθαρές στρατηγικές και οι πράκτορες καθοδηγούνται από ενέργειες ισορροπίας Nash). Έστω (i*; j*) οι αριθμοί των καθαρών στρατηγικών ισορροπίας Nash. Στη συνέχεια, εάν κατ' αναλογία με το (21) υποθέσουμε ότι σε ένα αντανακλαστικό παιχνίδι κάθε παράγοντας επιλέγει την καλύτερη απόκρισή του στην επιλογή του αντιπάλου για την αντίστοιχη συνιστώσα ισορροπίας, τότε παίρνουμε ότι (24) ik = arg max aij* , jl = arg max bi* j , k, l О А. iнI jнJ Από το (24), λόγω του ορισμού της ισορροπίας Nash, προκύπτει ότι ik = i*, jl = j*, k, l н └, δηλαδή, στο πλαίσιο της παραλλαγής 1, ο στρατηγικός προβληματισμός δεν έχει νόημα21 ( με πιθανή εξαίρεση την περίπτωση που οι καλύτερες αποκρίσεις ορίζονται με τέτοιο τρόπο ώστε οι πράκτορες να επιλέγουν συστατικά διαφορετικών ισορροπιών Nash στην περίπτωση που υπάρχουν πολλές από αυτές). Επιλογή 2 (η ισορροπία Nash υπάρχει σε καθαρές στρατηγικές, αλλά οι πράκτορες επιλέγουν στρατηγικές εγγυήσεων (21)). 21 Με τον όρο παράλογος του στρατηγικού προβληματισμού σε παιχνίδια bimatrix, εννοούμε την περίπτωση που η ισορροπία σε ένα αντανακλαστικό παιχνίδι με οποιονδήποτε συνδυασμό μη μηδενικών τάξεων αντανακλαστικών παραγόντων συμπίπτει με την ισορροπία στο αρχικό παιχνίδι. 47 Εάν οι εγγυητικές στρατηγικές σχηματίζουν μια ισορροπία Nash (όπως συμβαίνει σε ανταγωνιστικά παιχνίδια με σημείο σέλας), τότε εμπίπτουμε στις συνθήκες της επιλογής 1. Επομένως, ο στρατηγικός προβληματισμός έχει νόημα μόνο εάν, στο πλαίσιο της επιλογής 2, Η ισορροπία Nash δεν συμπίπτει με την ισορροπία στις στρατηγικές εγγυήσεων ( i0, j0). Επιλογή 3 (δεν υπάρχει ισορροπία Nash στις καθαρές στρατηγικές και οι πράκτορες καθοδηγούνται από μικτές στρατηγικές ισορροπίας Nash22). Εάν οι πράκτορες, όταν καθορίζουν τις καλύτερες αποκρίσεις τους κατ' αναλογία με το (24), βασίζονται στον αντίπαλο που επιλέγει μικτές στρατηγικές ισορροπίας Nash, τότε είναι εύκολο να δείξουμε ότι η μέγιστη αναμενόμενη απόδοση κάθε πράκτορα θα επιτευχθεί όταν επιλέξει επίσης την αντίστοιχη ισορροπία Nash μικτή στρατηγική. Επομένως, στο πλαίσιο της επιλογής 3, οποιαδήποτε ισορροπία συμπίπτει με την ισορροπία Nash σε μικτές στρατηγικές, δηλαδή, ο στρατηγικός προβληματισμός σε αυτή την περίπτωση δεν έχει νόημα. Επιλογή 4 (δεν υπάρχει ισορροπία Nash στις καθαρές στρατηγικές και οι πράκτορες καθοδηγούνται από στρατηγικές εγγυήσεων (21)). Στην τέταρτη παραλλαγή, η ανάλυση του προβληματισμού προφανώς έχει νόημα. Έτσι, έχοντας εξετάσει και τις τέσσερις πιθανές παραλλαγές της συμπεριφοράς των πρακτόρων, συμπεραίνουμε ότι η εγκυρότητα της παρακάτω δήλωσης είναι τεκμηριωμένη. Δήλωση 1. Ο στρατηγικός αναστοχασμός σε παιχνίδια bimatrix έχει νόημα εάν οι πράκτορες χρησιμοποιούν υποκειμενικές στρατηγικές εγγύησης (21) που δεν είναι ισορροπίας Nash. Σημειώστε (25) Kmin = min (K н └ | IK = I¥), (26) Lmin = min (L н └ | JL = J¥). Ουσιαστικά, το Kmin και το Lmin είναι οι ελάχιστες τάξεις ανάκλασης του πρώτου και του δεύτερου πράκτορα, κάτω από τις οποίες τα σύνολα υποκειμενικών ενεργειών ισορροπίας τους συμπίπτουν με τα μέγιστα δυνατά σύνολα υποκειμενικών στρατηγικών εγγύησης στο υπό εξέταση παιχνίδι. 22 Θυμηθείτε ότι στα παιχνίδια bimatrix η ισορροπία Nash στις μικτές στρατηγικές υπάρχει πάντα. 48 Εξ ορισμού " K, L О └ IK Н IK+1, JL Н JL+1. Ως εκ τούτου " K ³ Kmin IK = I¥, " L ³ Lmin JL = J¥. Εάν η κατάταξη ανάκλασης του πρώτου και του δεύτερου παράγοντα δεν υπερβαίνει το K και το L, αντίστοιχα, τότε τα σύνολα των υποκειμενικών στρατηγικών εγγύησης του πρώτου και του δεύτερου πράκτορα από την άποψη του αντιπάλου είναι ίσα με IL-1 και JK-1, αντίστοιχα. Άρα, μια αύξηση της αντανάκλασης οι τάξεις μπορούν να οδηγήσουν σε διεύρυνση του συνόλου των υποκειμενικών στρατηγικών εγγύησης εάν (27) L – 1< Kmin, (28) K – 1 < Lmin. Отметим, что с рассматриваемой точки зрения максимальный целесообразный ранг рефлексии23 первого агента зависит от свойств субъективных гарантирующих стратегий второго агента (см. (28)), и наоборот. С другой стороны, агенту не имеет смысла увеличивать ранг своей рефлексии, если он уже «исчерпал» собственное множество возможных субъективных равновесных действий. С этой точки зрения увеличение рангов рефлексии может приводить к расширению множества субъективных гарантирующих стратегий, если (29) K < Kmin, (30) L < Lmin. Объединяя (28) и (29), а также (27) и (30), получаем, что первому агенту не имеет смысла увеличивать свой ранг рефлексии выше (31) Kmax = min {Kmin, Lmin + 1}, а второму агенту не имеет смысла увеличивать свой ранг рефлексии выше (32) Lmax = min {Lmin, Kmin + 1}. Обозначим (33) Rmax = max {Kmax, Lmax}. Таким образом, доказана справедливость следующего утверждения. 23 Под максимальным целесообразным рангом рефлексии агента будем понимать такое его значение, что увеличение ранга рефлексии выше данного не приводит к появлению новых субъективных (с точки зрения данного агента) равновесий. 49 Утверждение 2. Использование агентами в биматричной игре рангов стратегической рефлексии выше, чем (31) и (32), не имеет смысла24. Утверждение 2 дает возможность в каждом конкретном случае (для конкретной разыгрываемой игры) каждому агенту (и исследователю операций) вычислить максимальные целесообразные ранги стратегической рефлексии обоих агентов. Так как величины (31)-(33) зависят от игры (матриц выигрышей), то получим оценки зависимости этих величин от размерности матриц выигрышей (очевидно, что |I¥| £ |I| = n, |J¥| £ |J| = m, а для игр размерности два справедлива более точная оценка – см. утверждение 3). Для этого введем в рассмотрение граф наилучших ответов. Графом наилучших ответов G = (V, E) назовем конечный двудольный ориентированный граф, в котором множество вершин V = I È J, а дуги проведены от каждой вершины (соответствующей действию одного из агентов) к наилучшему на нее ответу оппонента. Опишем свойства введенного графа: 1. Из каждой вершины множества I выходит дуга в вершину множества J (у второго агента есть наилучший ответ на любое действие первого агента), из каждой вершины множества J выходит дуга в вершину множества I (у первого агента есть наилучший ответ на любое действие второго агента). 2. В каждую вершину множества V входит ровно одна дуга (так как каждое действие каждого агента является наилучшим ответом на какое-либо действие оппонента). 3. Если любой путь дважды прошел через одну и ту же вершину, то по определению наилучших ответов его часть является контуром, и в дальнейшем новых вершин в этом пути не появится. 4. Максимальное число попарно διάφορες δραστηριότητες του πρώτου παράγοντα που περιέχεται στη διαδρομή που ξεκινά από την κορυφή i0 ισούται με min (n; m + 1). 5. Ο μέγιστος αριθμός διακριτών ενεργειών ανά ζεύγη του δεύτερου παράγοντα που περιέχεται στη διαδρομή που ξεκινά από την κορυφή i0 είναι ίσος με min (n; m). 24 Δηλαδή, για κάθε βαθμό αντανάκλασης που υπερβαίνει τις υποδεικνυόμενες εκτιμήσεις, υπάρχει ένας βαθμός προβληματισμού που ικανοποιεί τις υποδεικνυόμενες εκτιμήσεις και οδηγεί στην ίδια υποκειμενική ισορροπία. 50 6. Ο μέγιστος αριθμός διακριτών ενεργειών ανά ζεύγη του πρώτου παράγοντα που περιέχεται στη διαδρομή που ξεκινά από την κορυφή j0 είναι ίσος με min (n; m). 7. Ο μέγιστος αριθμός διακριτών ενεργειών ανά ζεύγη του δεύτερου παράγοντα που περιέχεται στη διαδρομή που ξεκινά από την κορυφή j0 είναι min (n + 1; m). Οι αποκαλυπτόμενες ιδιότητες του γραφήματος των καλύτερων απαντήσεων καθιστούν δυνατή την απόκτηση ανώτερων ορίων για τις πρόσφορες βαθμίδες του στρατηγικού προβληματισμού σε παιχνίδια bimatrix. Δήλωση 3. Σε παιχνίδια διμήτρας 2 ´ 2 όπου δεν υπάρχει ισορροπία Nash, I¥ = I, J¥ = J. Απόδειξη. Σκεφτείτε ένα αυθαίρετο παιχνίδι διμήτρας 2 ´ 2 στο οποίο δεν υπάρχει ισορροπία Nash. Έστω X1 = (x1, x2), X2 = (y1, y2). Ας υπολογίσουμε τις εγγυητικές στρατηγικές i0 και j0. Για οριστικότητα, θέτουμε x1 = i0, y1 = j0. Υπάρχουν δύο αμοιβαία αποκλειστικές επιλογές: j1 = y1 και j1 = y2. Αν j1 = y1, τότε i1= i2 = x2 (διαφορετικά (x1, y1) είναι μια ισορροπία Nash). Τότε j2 = j3 = y2 (διαφορετικά (x2, y1) είναι μια ισορροπία Nash). Επομένως, i3 = i4 = x1 (διαφορετικά (x2, y2) είναι μια ισορροπία Nash). Δηλαδή, στην πρώτη περίπτωση I¥ = I, J¥ = J. Αν j1 = y2, τότε i2 = x2 (αλλιώς (x1, y2) είναι η ισορροπία Nash). Τότε j3 = y1 (διαφορετικά (x2, y2) είναι μια ισορροπία Nash). Επομένως, i4 = x1 (διαφορετικά (x2, y1) είναι μια ισορροπία Nash). Δηλαδή, στη δεύτερη περίπτωση επίσης I¥ = I, J¥ = J. · Ποιοτικά, η δήλωση 3 σημαίνει ότι σε ένα παιχνίδι διμήτρας 2 ´ 2 στο οποίο δεν υπάρχει ισορροπία Nash, οποιοδήποτε αποτέλεσμα μπορεί να πραγματοποιηθεί ως υποκειμενική ισορροπία. Μια πολλά υποσχόμενη κατεύθυνση για περαιτέρω εφαρμοσμένη έρευνα μπορεί να θεωρηθεί η ανάλυση των υποκειμενικών ισορροπιών σε βασικά συνηθισμένα παιχνίδια δύο ατόμων 2 ´ 2 (υπενθυμίζουμε ότι υπάρχουν 78 δομικά διαφορετικά συνηθισμένα παιχνίδια, δηλαδή παιχνίδια στα οποία και οι δύο πράκτορες, καθένας από τους οποίους έχει δύο αποδεκτές αγωγές, μπορούν να διατάξουν αυστηρά δικά τους κέρδη από το καλύτερο στο χειρότερο). Ο ισχυρισμός 3 προτείνει ότι, ίσως, σε όλα τα παιχνίδια διμήτρας στα οποία δεν υπάρχει ισορροπία Nash, I¥ = I, J¥ = J. όπου οι κορυφές i0 και j0 είναι σκιασμένες. I¥ I J¥ J 5. Ένα παράδειγμα του γραφήματος των καλύτερων απαντήσεων σε ένα παιχνίδι 4 ´ 4 διμήτρας στο οποίο I¥ Ì I, J¥ Ì J J¥, διερευνούμε πόσο γρήγορα (σε ποιες ελάχιστες βαθμίδες στρατηγικού προβληματισμού) αυτά τα σύνολα «καλύπτονται ” από τις αντίστοιχες υποκειμενικές ισορροπίες. Η τρίτη ιδιότητα του γραφήματος των καλύτερων απαντήσεων σημαίνει ότι σε ένα παιχνίδι bimatrix, μια πρόσφορη αύξηση της κατάταξης του στρατηγικού προβληματισμού, ξεκινώντας από το δεύτερο βήμα, αλλάζει αναγκαστικά το σύνολο των στρατηγικών που πρέπει να εγγυώνται υποκειμενικά στις τάξεις αναστοχασμού μικρότερες από ή ίσο με αυτό. Δεδομένου ότι στα παιχνίδια bimatrix τα σύνολα των αποδεκτών ενεργειών είναι πεπερασμένα, τότε τα σύνολα I¥ και J¥ είναι πεπερασμένα, επομένως, λόγω των ιδιοτήτων 4-7 του γραφήματος των καλύτερων απαντήσεων, οι τιμές Lmin και Kmin είναι επίσης πεπερασμένες, Δηλαδή, στα παιχνίδια bimatrix μια απεριόριστη αύξηση του βαθμού αντανακλάσεων είναι προφανώς ακατάλληλη. Και πάλι, λόγω του πεπερασμένου των αποδεκτών συνόλων, οι ποσότητες (31) και (32), οι οποίες καθορίζουν τις μέγιστες εύχρηστες τάξεις ανακλαστικών, μπορούν εύκολα να υπολογιστούν για οποιοδήποτε συγκεκριμένο παιχνίδι bimatrix. Αλλά οι ιδιότητες του γραφήματος των καλύτερων απαντήσεων καθιστούν δυνατή τη λήψη συγκεκριμένων εκτιμήσεων από πάνω από τις μέγιστες βολικές τάξεις ανακλαστικότητας. 52 Σε ένα παιχνίδι bimatrix n ´ m, οι εγγυημένες εκτιμήσεις25 για τις τιμές (31)-(33) θα εξαρτηθούν προφανώς από τη διάσταση των πινάκων απόδοσης, δηλαδή Kmin = Kmin(n), Lmin = Lmin(m ). Επομένως, (34) Kmax(n, m) = min (Kmin(n), Lmin(m) + 1), (35) Lmax(n, m) = min (Lmin(m), Kmin(n) + 1 ). Η έκφραση (33) θα λάβει τότε τη μορφή: (36) Rmax(n, m) = max (Kmax(n, m), Lmax(n, m)). Από τις ιδιότητες 4-7 της γραφικής παράστασης των καλύτερων απαντήσεων και εκφράσεων (34)-(36) ακολουθεί ο παρακάτω ισχυρισμός. Δήλωση 4. Σε παιχνίδια με δύο μήτρες n ´ m, οι μέγιστες πρόσφορες βαθμίδες στρατηγικής αντανάκλασης του πρώτου και του δεύτερου παράγοντα ικανοποιούν τις ακόλουθες ανισότητες (37) Kmax(n, m) £ min (n, m + 1), (38) Lmax (n, m) £ min (m, n + 1), (39) Rmax(n, m) £ max (min (n, m + 1), min (m, n + 1)). Συμπέρασμα 1. Σε ένα παιχνίδι με δύο μήτρες n ´ n, n ³ 2, η μέγιστη κατάλληλη κατάταξη στρατηγικής ανάκλασης οποιουδήποτε πράκτορα26 είναι Rmax(n, n) £ n. Για την περίπτωση δύο παραδεκτών αγωγών (λόγω της επικράτησης της στα εφαρμοσμένα μοντέλα), διατυπώνουμε ξεχωριστό συμπέρασμα. Συμπέρασμα 2. Σε ένα παιχνίδι με δύο πίνακες 2 ´ 2, η μέγιστη εύχρηστη κατάταξη ανάκλασης δεν υπερβαίνει το δύο. Για άλλη μια φορά, σημειώνουμε ότι οι εκτιμήσεις (37)-(39) είναι ανώτερες εκτιμήσεις - η ύπαρξη αρκετών καλύτερων απαντήσεων στην ίδια ενέργεια, η παρουσία ισορροπίας Nash στο αρχικό παιχνίδι ή κυριαρχούμενες στρατηγικές μπορεί να οδηγήσει σε

Ρωσική Ακαδημία Επιστημών V.A. Trapeznikova D.A. NOVIKOV, A.G. CHKHARTISHVILI REFLECTIVE GAMES SINTEG Moscow - 2003 UDC 519 BBC 22.18 N 73 Novikov D.A., Chkhartishvili A.G. Παιχνίδια Reflexive H 73. Μ.: SINTEG, 2003. - 149 σελ. ISBN 5-89638-63-1 Η μονογραφία είναι αφιερωμένη στη συζήτηση των σύγχρονων προσεγγίσεων στη μαθηματική μοντελοποίηση του προβληματισμού. Οι συγγραφείς εισάγουν μια νέα κατηγορία μοντέλων θεωρητικών παιγνίων – αντανακλαστικά παιχνίδια που περιγράφουν την αλληλεπίδραση υποκειμένων (παραγόντων) που λαμβάνουν αποφάσεις με βάση μια ιεραρχία ιδεών για βασικές παραμέτρους, ιδέες για αναπαραστάσεις κ.λπ. Μια ανάλυση της συμπεριφοράς των παραγόντων φάντασμα που υπάρχουν στις αναπαραστάσεις άλλων πραγματικών ή φανταστικών πρακτόρων και των ιδιοτήτων μιας δομής πληροφοριών που αντικατοπτρίζει την αμοιβαία επίγνωση πραγματικών και φανταστικών πρακτόρων μας επιτρέπει να προτείνουμε μια ισορροπία πληροφοριών ως λύση σε ένα αντανακλαστικό παιχνίδι , που είναι μια γενίκευση μιας σειράς γνωστών εννοιών ισορροπίας σε μη συνεργατικά παιχνίδια. Τα στοχαστικά παιχνίδια καθιστούν δυνατή: - τη μοντελοποίηση της συμπεριφοράς των στοχαστικών θεμάτων. - να μελετήσει την εξάρτηση των αποδοχών των πρακτόρων από τις τάξεις του προβληματισμού τους. - Ρύθμιση και επίλυση προβλημάτων αντανακλαστικού ελέγχου. - περιγράφει ομοιόμορφα πολλά φαινόμενα που σχετίζονται με τον προβληματισμό: κρυφός έλεγχος, έλεγχος πληροφοριών μέσω των μέσων ενημέρωσης, προβληματισμός στην ψυχολογία, έργα τέχνης κ.λπ. Το βιβλίο απευθύνεται σε ειδικούς στον τομέα της μαθηματικής μοντελοποίησης και διαχείρισης κοινωνικοοικονομικών συστημάτων, καθώς και ως φοιτητές και μεταπτυχιακοί φοιτητές. Κριτές: Διδάκτωρ Τεχνικών Επιστημών, καθ. V.N. Burkov, Διδάκτωρ Τεχνικών Επιστημών, καθ. A.V. Shchepkin UDC 519 BBK 22.18 N 73 ISBN 5-89638-63-1 Chkhartishvili, 2003 2 ΠΕΡΙΕΧΟΜΕΝΑ ΕΙΣΑΓΩΓΗ ............................................ .......................................................... ..... .......... 4 ΚΕΦΑΛΑΙΟ 1. Πληροφορίες στη λήψη αποφάσεων .......................... ........ ........... 21 1.1. Ατομική Λήψη Αποφάσεων: Ένα Μοντέλο Ορθολογικής Συμπεριφοράς.......................................... ...................................................... .......................... ................................ ..... 21 1.2. Διαδραστική λήψη αποφάσεων: παιχνίδια και ισορροπίες .............................. 24 1.3. Γενικές προσεγγίσεις για την περιγραφή της επίγνωσης................................................ ..... 31 ΚΕΦΑΛΑΙΟ 2. Στρατηγικός προβληματισμός....... ................................ ................. 34 2.1. Στρατηγικός προβληματισμός σε παιχνίδια δύο ατόμων .............................. ................. 34 2.2. Αντανάκλαση σε παιχνίδια bimatrix .............................................. ................ .......... 41 2.3. Περιορισμός του βαθμού αντανάκλασης .............................................. ................................. 57 ΚΕΦΑΛΑΙΟ 3. Πληροφοριακός προβληματισμός ............ ................................. 60 3.1. Πληροφοριακός προβληματισμός σε παιχνίδια δύο ατόμων .......................................... ... 60 3.2. Δομή πληροφοριών του παιχνιδιού ...................................................... ................. .............. 64 3.3. Ισοζύγιο πληροφοριών ................................................... .............. ................... 71 3.4. Γράφημα ενός αντανακλαστικού παιχνιδιού .............................................. .................................. 76 3.5. Τακτικές δομές ευαισθητοποίησης................................................ ................. 82 3.6. Ο βαθμός του προβληματισμού και της πληροφοριακής ισορροπίας .......................................... ... 91 3.7. Ανακλαστικός έλεγχος ..................................................... .................................. 102 ΚΕΦΑΛΑΙΟ 4. Εφαρμοσμένα μοντέλα αντανακλαστικών παιχνιδιών ................................. 102 ............. 106 4.1 . Κρυφός έλεγχος ..................................................... ................................................................ .. 106 4.2. Διαχείριση Μέσων Μαζικής Ενημέρωσης και Πληροφοριών ............................................ ................. ...... 117 4.3. Αντανάκλαση στην ψυχολογία ..................................................... .................................. 121 4.3.1. Ψυχολογία της σκακιστικής δημιουργικότητας................................................ 121 4.3 .2. Ανάλυση συναλλαγών ..................................................... .............. ................. 124 4.3.3. Παράθυρο Johari ................................................ .. ................................. 126 4.3.4. Μοντέλο Ηθικής Επιλογής ..................................................... ................................ 128 4.4. Προβληματισμός σε έργα τέχνης................................................ .. 129 ΣΥΜΠΕΡΑΣΜΑ..... ...................................... ........ ...................................... 137 ΛΟΓΟΤΕΧΝΙΑ .. .......................................................... .......................................................... ........ 142 3 - Τα Minnows γλεντάνε ελεύθερα, αυτή είναι η χαρά τους! – Δεν είσαι ψάρι, πώς ξέρεις ποια είναι η χαρά του; «Δεν είσαι εγώ, πώς ξέρεις τι ξέρω και τι δεν ξέρω;» Από μια ταοϊστική παραβολή - Το θέμα, φυσικά, σεβάσμιε αρχιεπίσκοπε, είναι ότι πιστεύεις σε αυτό που πιστεύεις επειδή ανατράφηκες έτσι. - Ισως. Αλλά το γεγονός παραμένει ότι κι εσύ πιστεύεις ότι πιστεύω αυτό που πιστεύω, γιατί έτσι ανατράφηκα, για τον λόγο ότι έτσι ανατράφηκες κι εσύ. Από το βιβλίο «Κοινωνική Ψυχολογία» του D. Myers με βάση μια ιεραρχία ιδεών για ουσιώδεις παραμέτρους, ιδέες για απόψεις κ.λπ. Αντανάκλαση. Μία από τις θεμελιώδεις ιδιότητες της ανθρώπινης ύπαρξης είναι ότι, μαζί με τη φυσική («αντικειμενική») πραγματικότητα, υπάρχει και η αντανάκλασή της στη συνείδηση. Ταυτόχρονα, μεταξύ της φυσικής πραγματικότητας και της εικόνας της στο μυαλό (θα θεωρήσουμε αυτή την εικόνα ως μέρος μιας ειδικής - ανακλαστικής πραγματικότητας) υπάρχει ένα αναπόφευκτο χάσμα, μια αναντιστοιχία. Η σκόπιμη μελέτη αυτού του φαινομένου συνδέεται παραδοσιακά με τον όρο «αναστοχασμός», ο οποίος ορίζεται στο «Φιλοσοφικό Λεξικό» ως εξής: «ΑΝΤΑΚΛΗΣΗ (λατ. reflexio – αναστροφή). Ένας όρος που σημαίνει προβληματισμό, καθώς και τη μελέτη μιας γνωστικής πράξης. Ο όρος «αντανάκλαση» εισήχθη από τον J. Locke. σε διάφορα φιλοσοφικά συστήματα (J. Locke, G. Leibniz, D. Hume, G. Hegel κ.λπ.) είχε διαφορετικό περιεχόμενο. Μια συστηματική περιγραφή του προβληματισμού από την άποψη της ψυχολογίας ξεκίνησε τη δεκαετία του '60 του XX αιώνα (σχολή 4 του V.A. Lefebvre). Επιπλέον, πρέπει να σημειωθεί ότι υπάρχει μια κατανόηση της αντανάκλασης με διαφορετική έννοια, που σχετίζεται με το αντανακλαστικό - "την αντίδραση του σώματος στη διέγερση των υποδοχέων". Σε αυτή την εργασία, χρησιμοποιούμε τον πρώτο (φιλοσοφικό) ορισμό του προβληματισμού. Για να διευκρινίσουμε την κατανόηση της ουσίας του προβληματισμού, ας εξετάσουμε πρώτα την κατάσταση με ένα θέμα. Έχει ιδέες για τη φυσική πραγματικότητα, αλλά μπορεί επίσης να έχει επίγνωση (αντανακλά, αντανακλά) αυτές τις ιδέες, καθώς και να έχει επίγνωση αυτών των ιδεών κ.λπ. Έτσι διαμορφώνεται η ανακλαστική πραγματικότητα. Αναστοχασμός του θέματος σχετικά με τις δικές του ιδέες για την πραγματικότητα, τις αρχές της δραστηριότητάς του κ.λπ. ονομάζεται αυτόματη αντανάκλαση ή ανάκλαση του πρώτου είδους. Πρέπει να σημειωθεί ότι στην πλειονότητα των ανθρωπιστικών μελετών, μιλάμε, πρώτα απ 'όλα, για αυτοστοχασμό, που στη φιλοσοφία νοείται ως η διαδικασία σκέψης ενός ατόμου για το τι συμβαίνει στο μυαλό του. Ο στοχασμός του δεύτερου είδους λαμβάνει χώρα σχετικά με ιδέες για την πραγματικότητα, αρχές λήψης αποφάσεων, αυτοστοχασμό κ.λπ. άλλα θέματα. Ας δώσουμε παραδείγματα προβληματισμού του δεύτερου είδους, δείχνοντας ότι σε πολλές περιπτώσεις τα σωστά συμπεράσματα μπορούν να εξαχθούν μόνο εάν πάρουμε τη θέση άλλων υποκειμένων και αναλύσουμε την πιθανή συλλογιστική τους. Το πρώτο παράδειγμα είναι το κλασικό παιχνίδι Dirty Face, που μερικές φορές αναφέρεται ως το πρόβλημα των σοφών και των καπέλων ή το πρόβλημα των συζύγων και των άπιστων συζύγων. Ας το περιγράψουμε παρακάτω. «Ας φανταστούμε ότι ο Μπομπ και η ανιψιά του Άλις βρίσκονται στο διαμέρισμα μιας βικτωριανής άμαξης. Το πρόσωπο όλων είναι μπερδεμένο. Ωστόσο, κανείς δεν κοκκινίζει από ντροπή, αν και οποιοσδήποτε βικτωριανός επιβάτης θα κοκκίνιζε γνωρίζοντας ότι ο άλλος τον βλέπει βρώμικο. Από αυτό συμπεραίνουμε ότι κανείς από τους επιβάτες δεν γνωρίζει ότι το πρόσωπό του είναι βρώμικο, αν και όλοι βλέπουν το βρώμικο πρόσωπο του συντρόφου του. Αυτή τη στιγμή, ο Μαέστρος κοιτάζει μέσα στο διαμέρισμα και ανακοινώνει ότι υπάρχει ένας άντρας με βρώμικο πρόσωπο στο διαμέρισμα. Μετά από αυτό, η Άλις κοκκίνισε. Κατάλαβε ότι το πρόσωπό της ήταν βρώμικο. Αλλά γιατί το κατάλαβε αυτό; Δεν της είπε ο Οδηγός αυτό που ήξερε ήδη; 5 Ας ακολουθήσουμε την αλυσίδα του συλλογισμού της Αλίκης. Αλίκη: Ας υποθέσουμε ότι το πρόσωπό μου είναι καθαρό. Τότε ο Μπομπ, γνωρίζοντας ότι ένας από εμάς είναι βρώμικος, θα πρέπει να συμπεράνει ότι είναι βρώμικος και κοκκινίζει. Αν δεν κοκκινίζει, τότε η υπόθεση μου για το καθαρό μου πρόσωπο είναι ψευδής, το πρόσωπό μου είναι βρώμικο και πρέπει να κοκκινίσω. Ο μαέστρος πρόσθεσε πληροφορίες για τις γνώσεις του Μπομπ στις πληροφορίες που γνώριζε η Αλίκη. Μέχρι τότε, δεν ήξερε ότι ο Μπομπ ήξερε ότι ένα από αυτά ήταν βρώμικο. Με λίγα λόγια, το μήνυμα του μαέστρου μετέτρεψε τη γνώση ότι υπήρχε ένας άντρας με βρώμικο πρόσωπο στο διαμέρισμα σε γενική γνώση. Το δεύτερο παράδειγμα σχολικού βιβλίου είναι το πρόβλημα της συντονισμένης επίθεσης. υπάρχουν προβλήματα σχετικά με το βέλτιστο πρωτόκολλο ανταλλαγής πληροφοριών - Παιχνίδι Ηλεκτρονικού Ταχυδρομείου, κ.λπ. (δείτε κριτικές στο ). Η κατάσταση έχει ως εξής. Δύο μεραρχίες βρίσκονται στις κορυφές δύο λόφων και ο εχθρός βρίσκεται στην κοιλάδα. Μπορείτε να κερδίσετε μόνο εάν και οι δύο μεραρχίες επιτεθούν στον εχθρό ταυτόχρονα. Ο στρατηγός - ο διοικητής της πρώτης μεραρχίας - στέλνει στον στρατηγό - τον διοικητή της δεύτερης μεραρχίας - αγγελιοφόρο με το μήνυμα: «Επιτιθέμεθα τα ξημερώματα». Εφόσον ο αγγελιοφόρος μπορεί να αναχαιτιστεί από τον εχθρό, ο πρώτος στρατηγός πρέπει να περιμένει ένα μήνυμα από τον δεύτερο στρατηγό ότι το πρώτο μήνυμα έχει ληφθεί. Αλλά επειδή το δεύτερο μήνυμα μπορεί επίσης να αναχαιτιστεί από τον εχθρό, ο δεύτερος στρατηγός πρέπει να λάβει επιβεβαίωση από τον πρώτο στρατηγό ότι έλαβε επιβεβαίωση. Και ούτω καθεξής επί άπειρον. Το καθήκον είναι να προσδιοριστεί μετά από ποιον αριθμό μηνυμάτων (επιβεβαιώσεων) έχει νόημα οι στρατηγοί να επιτεθούν στον εχθρό. Το συμπέρασμα είναι το εξής: υπό τις περιγραφόμενες συνθήκες, μια συντονισμένη επίθεση είναι αδύνατη και η διέξοδος είναι η χρήση πιθανοτικών μοντέλων. Το τρίτο κλασικό πρόβλημα είναι το "πρόβλημα δύο μεσιτών" (βλ. επίσης μοντέλα κερδοσκοπίας στο ). Ας υποθέσουμε ότι δύο χρηματιστές που παίζουν στο χρηματιστήριο έχουν τα δικά τους εξειδικευμένα συστήματα που χρησιμοποιούνται για την υποστήριξη της λήψης αποφάσεων. Συμβαίνει ο διαχειριστής του δικτύου να αντιγράφει παράνομα και τα δύο έμπειρα συστήματα και να πουλά το έμπειρο σύστημα του αντιπάλου του σε κάθε μεσίτη. Μετά από αυτό, ο διαχειριστής προσπαθεί να πουλήσει σε καθένα από αυτά τις ακόλουθες πληροφορίες - "Ο αντίπαλός σας έχει το έμπειρο σύστημά σας." Στη συνέχεια, ο διαχειριστής προσπαθεί 6 για να πουλήσει πληροφορίες - "Ο αντίπαλός σας ξέρει ότι έχετε το έμπειρο σύστημά του" και ούτω καθεξής. Το ερώτημα είναι πώς πρέπει οι μεσίτες να χρησιμοποιούν τις πληροφορίες που λαμβάνουν από τον διαχειριστή και ποιες πληροφορίες είναι σχετικές σε ποια επανάληψη; Έχοντας ολοκληρώσει την εξέταση παραδειγμάτων αναστοχασμού του δεύτερου είδους, ας συζητήσουμε τις καταστάσεις στις οποίες ο προβληματισμός είναι ουσιαστικός. Εάν το μόνο αντανακλαστικό υποκείμενο είναι ένας οικονομικός παράγοντας που επιδιώκει να μεγιστοποιήσει την αντικειμενική του λειτουργία επιλέγοντας μία από τις ηθικά αποδεκτές ενέργειες, τότε η φυσική πραγματικότητα εισέρχεται στην αντικειμενική συνάρτηση ως παράμετρος και τα αποτελέσματα του προβληματισμού (παραστάσεις για αναπαραστάσεις κ.λπ.) δεν είναι στοιχεία της αντικειμενικής συνάρτησης. Τότε μπορούμε να πούμε ότι η αυτόματη αντανάκλαση «δεν χρειάζεται», αφού δεν αλλάζει τη δράση που έχει επιλέξει ο πράκτορας. Σημειώστε ότι η εξάρτηση των ενεργειών του υποκειμένου από τον προβληματισμό μπορεί να λάβει χώρα σε μια κατάσταση όπου οι ενέργειες είναι ηθικά άνισες, δηλαδή, μαζί με την ωφελιμιστική πτυχή, υπάρχει μια δεοντολογική (ηθική) μία - βλ. Ωστόσο, οι οικονομικές αποφάσεις είναι, κατά κανόνα, ηθικά ουδέτερες, επομένως ας εξετάσουμε την αλληλεπίδραση πολλών θεμάτων. Εάν υπάρχουν πολλά υποκείμενα (η κατάσταση λήψης αποφάσεων είναι διαδραστική), τότε η λειτουργία στόχος κάθε υποκειμένου περιλαμβάνει τις ενέργειες άλλων υποκειμένων, δηλαδή, αυτές οι ενέργειες αποτελούν μέρος της φυσικής πραγματικότητας (αν και οι ίδιες, φυσικά, οφείλονται σε αντανακλαστική πραγματικότητα). Ταυτόχρονα, ο προβληματισμός (και, κατά συνέπεια, η μελέτη της ανακλαστικής πραγματικότητας) καθίσταται απαραίτητος. Ας εξετάσουμε τις κύριες προσεγγίσεις για τη μαθηματική μοντελοποίηση των επιδράσεων ανάκλασης. Θεωρία παιγνίων. Επίσημα (μαθηματικά) μοντέλα ανθρώπινης συμπεριφοράς έχουν δημιουργηθεί και μελετηθεί για περισσότερο από ενάμιση αιώνα (βλ. ανασκόπηση στο ) και χρησιμοποιούνται όλο και περισσότερο τόσο στη θεωρία ελέγχου, την οικονομία, την ψυχολογία, την κοινωνιολογία κ.λπ., όσο και στην επίλυση συγκεκριμένων εφαρμογών προβλήματα.. Η πιο εντατική ανάπτυξη έχει παρατηρηθεί από τη δεκαετία του '40 του ΧΧ αιώνα - τη στιγμή της εμφάνισης της θεωρίας παιγνίων, η οποία συνήθως χρονολογείται στο 1944 (η πρώτη έκδοση του βιβλίου των John von Neumann και Oskar Morgenstern "Game Theory and Economic Behavior "). 7 Κάτω από το παιχνίδι σε αυτό το έργο θα κατανοήσουμε την αλληλεπίδραση των μερών των οποίων τα συμφέροντα δεν συμπίπτουν (σημειώστε ότι είναι δυνατή μια άλλη κατανόηση του παιχνιδιού - ως «ένα είδος μη παραγωγικής δραστηριότητας, το κίνητρο της οποίας δεν βρίσκεται στα αποτελέσματά της, αλλά στην ίδια τη διαδικασία" - βλέπε επίσης , όπου η έννοια του παιχνιδιού ερμηνεύεται πολύ ευρύτερα). Η θεωρία παιγνίων είναι ένας κλάδος των εφαρμοσμένων μαθηματικών που μελετά μοντέλα λήψης αποφάσεων σε συνθήκες αναντιστοιχίας συμφερόντων των μερών (παικτών), όταν κάθε μέρος επιδιώκει να επηρεάσει την εξέλιξη της κατάστασης προς το συμφέρον του. Περαιτέρω, ο όρος "πράκτορας" χρησιμοποιείται για να αναφέρεται στον λήπτη αποφάσεων (παίκτη). Σε αυτή την εργασία, εξετάζουμε τα μη συνεργατικά στατικά παιχνίδια σε κανονική μορφή, δηλαδή παιχνίδια στα οποία οι πράκτορες επιλέγουν τις ενέργειές τους μία φορά, ταυτόχρονα και ανεξάρτητα. Έτσι, το κύριο καθήκον της θεωρίας παιγνίων είναι να περιγράψει την αλληλεπίδραση πολλών πρακτόρων των οποίων τα ενδιαφέροντα δεν συμπίπτουν και τα αποτελέσματα της δραστηριότητας (νίκη, χρησιμότητα κ.λπ.) καθενός εξαρτώνται στη γενική περίπτωση από τις ενέργειες όλων. Το αποτέλεσμα μιας τέτοιας περιγραφής είναι μια πρόβλεψη μιας λογικής έκβασης του παιχνιδιού - η λεγόμενη λύση του παιχνιδιού (ισορροπία). Η περιγραφή του παιχνιδιού συνίσταται στον καθορισμό των ακόλουθων παραμέτρων: - σύνολο πρακτόρων. - προτιμήσεις των πρακτόρων (εξάρτηση πληρωμών από ενέργειες): θεωρείται (και αυτό αντανακλά τη σκοπιμότητα της συμπεριφοράς) ότι κάθε πράκτορας ενδιαφέρεται να μεγιστοποιήσει την απόδοσή του. - σύνολα παραδεκτών αγωγών εκπροσώπων· - ευαισθητοποίηση των πρακτόρων (οι πληροφορίες που έχουν τη στιγμή της λήψης αποφάσεων σχετικά με τις επιλεγμένες ενέργειες). - η σειρά λειτουργίας (η σειρά των κινήσεων - η σειρά επιλογής των ενεργειών). Σχετικά μιλώντας, το σύνολο των πρακτόρων καθορίζει ποιος συμμετέχει στο παιχνίδι. Οι προτιμήσεις αντικατοπτρίζουν αυτό που θέλουν οι πράκτορες, τα σύνολα επιτρεπόμενων ενεργειών τι μπορούν να κάνουν, η επίγνωση αντικατοπτρίζει αυτά που γνωρίζουν και η σειρά λειτουργίας αντανακλά όταν επιλέγουν ενέργειες. 8 Οι αναφερόμενες παράμετροι ορίζουν το παιχνίδι, αλλά δεν επαρκούν για να προβλέψουν την έκβασή του - τη λύση του παιχνιδιού (ή την ισορροπία του παιχνιδιού), δηλαδή το σύνολο των ενεργειών των παραγόντων που είναι λογικές και σταθερές από ένα σημείο του άποψη ή άλλη. Μέχρι σήμερα, δεν υπάρχει καθολική έννοια της ισορροπίας στη θεωρία παιγνίων - λαμβάνοντας ορισμένες υποθέσεις σχετικά με τις αρχές της λήψης αποφάσεων από τους πράκτορες, μπορεί κανείς να βρει διάφορες λύσεις. Επομένως, το κύριο καθήκον οποιασδήποτε έρευνας για τη θεωρία παιγνίων (συμπεριλαμβανομένης της παρούσας εργασίας) είναι η κατασκευή μιας ισορροπίας. Δεδομένου ότι τα αντανακλαστικά παιχνίδια ορίζονται ως μια τέτοια διαδραστική αλληλεπίδραση πρακτόρων στην οποία λαμβάνουν αποφάσεις με βάση την ιεραρχία των αναπαραστάσεών τους, η επίγνωση των πρακτόρων είναι απαραίτητη. Επομένως, ας σταθούμε αναλυτικότερα στην ποιοτική συζήτησή του. Ο ρόλος της ευαισθητοποίησης. Γενικές γνώσεις. Στη θεωρία παιγνίων, τη φιλοσοφία, την ψυχολογία, τα κατανεμημένα συστήματα και άλλους τομείς της επιστήμης (βλ. ανασκόπηση στο ), δεν είναι σημαντικές μόνο οι πεποιθήσεις των πρακτόρων για τις βασικές παραμέτρους, αλλά και οι πεποιθήσεις τους για τις πεποιθήσεις άλλων παραγόντων κ.λπ. Το σύνολο αυτών των αναπαραστάσεων ονομάζεται ιεραρχία πεποιθήσεων και διαμορφώνεται σε αυτό το άρθρο από το δέντρο δομής πληροφοριών ενός αντανακλαστικού παιχνιδιού (βλ. Ενότητα 3.2). Με άλλα λόγια, σε καταστάσεις διαδραστικής λήψης αποφάσεων (μοντελοποιημένες στη θεωρία παιγνίων), κάθε πράκτορας πρέπει να προβλέψει τη συμπεριφορά των αντιπάλων πριν επιλέξει τη δράση του. Για να γίνει αυτό, πρέπει να έχει ορισμένες ιδέες για το όραμα του παιχνιδιού από τους αντιπάλους. Το ίδιο όμως πρέπει να κάνουν και οι αντίπαλοι, οπότε η αβεβαιότητα για το ποιο παιχνίδι θα παιχτεί δημιουργεί μια ατελείωτη ιεραρχία αναπαραστάσεων των συμμετεχόντων στο παιχνίδι. Ας δώσουμε ένα παράδειγμα ιεραρχίας προβολής. Ας υποθέσουμε ότι υπάρχουν δύο πράκτορες, ο Α και ο Β. Καθένας από αυτούς μπορεί να έχει τις δικές του μη αντανακλαστικές ιδέες για την αόριστη παράμετρο q, την οποία θα ονομάσουμε κατάσταση της φύσης (κατάσταση του κόσμου). Σημειώνουμε αυτές τις αναπαραστάσεις με qA και qB, αντίστοιχα. Αλλά κάθε ένας από τους πράκτορες στο πλαίσιο της διαδικασίας προβληματισμού της πρώτης τάξης μπορεί να σκεφτεί τις ιδέες του αντιπάλου. Αυτές οι αναπαραστάσεις (παραστάσεις δεύτερης τάξης) συμβολίζονται με qAB και qBA, όπου qAB είναι οι αναπαραστάσεις του πράκτορα Α των αναπαραστάσεων του πράκτορα Β, 9 qBA είναι οι αναπαραστάσεις του πράκτορα Β των αναπαραστάσεων του πράκτορα Α. δεύτερη τάξη) μπορεί να σκεφτεί ποιες είναι οι ιδέες του αντιπάλου για τον ιδέες είναι. Έτσι δημιουργούνται αναπαραστάσεις τρίτης τάξης, qABA και qBAB. Η διαδικασία δημιουργίας αναπαραστάσεων υψηλότερων τάξεων μπορεί να συνεχιστεί επ 'αόριστον (δεν υπάρχουν λογικοί περιορισμοί για την αύξηση του βαθμού ανακλαστικών). Το σύνολο όλων των αναπαραστάσεων - qA, qB, qAB, qBA, qABA, qBAB, κ.λπ. - σχηματίζει μια ιεραρχία απόψεων. Ιδιαίτερη περίπτωση ευαισθητοποίησης είναι όταν όλες οι αναπαραστάσεις, αναπαραστάσεις για παραστάσεις κ.λπ. συμπίπτουν στο άπειρο – είναι κοινή γνώση. Πιο σωστά, ο όρος "κοινή γνώση" εισάγεται για να δηλώσει ένα γεγονός που ικανοποιεί τις ακόλουθες απαιτήσεις: 1) είναι γνωστό σε όλους τους πράκτορες. 2) όλοι οι πράκτορες γνωρίζουν το 1. 3) όλοι οι πράκτορες γνωρίζουν το 2 και ούτω καθεξής. ad infinitum Το επίσημο μοντέλο γενικής γνώσης προτάθηκε και αναπτύχθηκε σε πολλά έργα - βλ. Τα μοντέλα της επίγνωσης των πρακτόρων - η ιεραρχία των αναπαραστάσεων και η γενική γνώση - στη θεωρία παιγνίων είναι, στην πραγματικότητα, εξ ολοκλήρου αφιερωμένα σε αυτήν την εργασία, επομένως θα δώσουμε παραδείγματα που απεικονίζουν το ρόλο της γενικής γνώσης σε άλλους τομείς της επιστήμης - φιλοσοφία, ψυχολογία κ.λπ. (δείτε επίσης κριτική). Από φιλοσοφική άποψη, η κοινή γνώση αναλύθηκε στη μελέτη των συμβάσεων. Εξετάστε το ακόλουθο παράδειγμα. Είναι γραμμένο στους Κανόνες Οδού ότι κάθε χρήστης του δρόμου πρέπει να συμμορφώνεται με αυτούς τους κανόνες και έχει επίσης το δικαίωμα να περιμένει ότι οι άλλοι χρήστες του δρόμου τους τηρούν. Αλλά και άλλοι χρήστες του δρόμου πρέπει επίσης να είναι σίγουροι ότι οι άλλοι ακολουθούν τους κανόνες κ.λπ. στο άπειρο. Ως εκ τούτου, η συμφωνία για «τήρηση των κανόνων κυκλοφορίας» θα πρέπει να είναι κοινή γνώση. Στην ψυχολογία, υπάρχει η έννοια του λόγου - «(από τα λατινικά discursus - συλλογισμός, επιχείρημα) - λεκτική σκέψη ενός ατόμου που διαμεσολαβείται από προηγούμενη εμπειρία. λειτουργεί ως μια διαδικασία συσχετισμένης λογικής 10