Ισορροπία Νας: Διαφορά μεταξύ των αναθεωρήσεων

Περιεχόμενο που διαγράφηκε Περιεχόμενο που προστέθηκε
Loupasmi (συζήτηση | συνεισφορές)
Loupasmi (συζήτηση | συνεισφορές)
Χωρίς σύνοψη επεξεργασίας
Γραμμή 1:
Στην [ [ θεωρία παιγνίων ] ] , « ισορροπία Nash '' ' του '' είναι έναη [ [ έννοιας λύση ] ] του [ [ μη συνεργάσιμων παιχνίδι ] ]συμμετοχη μεταξύ δύο ή περισσοτέρων παικτών, στο οποίο κάθε παίκτης υποτίθεται ότι γνωρίζουν την [ [η στρατηγική της ισορροπίας | στρατηγικές ισορροπίας ] ] από τους άλλους παίκτες , και κανένας παίκτης δεν έχει τίποτα να κερδίσει , αλλάζοντας μόνο τη δική τουςτου στρατηγική μονομερώς <ref name=Osborne> Osborne , Martin J. , και [ [ Ariel Rubinstein .1]] . '' Μια σειρά μαθημάτων στη '' Θεωρία Παιγνίων . Cambridge, MA : MIT , 1994 . Εκτύπωση </ref > { { rp | 14 } } . Εάν κάθε παίκτης έχει επιλέξει μια στρατηγική και κανένας παίκτης δεν μπορεί να ωφεληθεί από την αλλαγή στρατηγικές , ενώ οι άλλοι παίκτες διατηρούν τις δικές τους αμετάβλητα , τότε το τρέχον σύνολο των πολιτικών επιλογών και τις αντίστοιχες απολαβές αποτελούν Nash ισορροπία.
 
Με απλά λόγια , η Amy και ο Wili βρίσκονται σε ισορροπία Nash αν η Amy κάνει την καλύτερη απόφαση αυτή μπορεί , λαμβάνοντας υπόψη την απόφαση της Wili , καθώς και η Wili κάνειμπορεί να παρει την καλύτερη απόφαση που μπορεί , λαμβάνοντας υπόψη την απόφαση της Amy . Ομοίως , μια ομάδα από παίκτες είναι σε ισορροπία Nash αν ο καθένας κάνει την καλύτερη απόφαση ότιόταν αυτός ή αυτή μπορεί , λαμβάνοντας υπόψη τις αποφάσεις των άλλων .
Πίνακας περιεχομένων
 
1 Εφαρμογές
== Εφαρμογές ==
2 Ιστορία
Θεωρητικοί Game χρησιμοποιούν την έννοια ισορροπίας Nash για να αναλύσει το αποτέλεσμα της [η στρατηγική της [ | στρατηγική αλληλεπίδραση ] ] από διάφορα [ [ λήψης αποφάσεων | ιθύνοντες ] ] . Με άλλα λόγια, προσφέρει έναν τρόπο για να προβλέψουμε τι θα συμβεί εάν πολλά άτομα ή περισσότερα ιδρύματα τη λήψη αποφάσεων , την ίδια στιγμή , και αν το αποτέλεσμα εξαρτάται από τις αποφάσεις των άλλων . Η απλή ιδέα που διαπερνούσε την ιδέα John Nash είναι ότι κανείς δεν μπορεί να προβλέψει το αποτέλεσμα των επιλογών των πολλαπλών φορέων λήψης αποφάσεων , αν αναλύσει κανείς τις αποφάσεις αυτές στην απομόνωση. Αντ 'αυτού , πρέπει να αναρωτηθούμε τι κάθε παίκτης θα κάνει , '' λαμβάνοντας υπόψη '' τη διαδικασία λήψης αποφάσεων από τους άλλους .
3 Ορισμοί
3.1 Άτυπη ορισμό
3.2 Θεώρημα του Nash Ύπαρξη
4 Παραδείγματα
4.1 Παιχνίδι Συντονισμού
4.2 Δίλημμα φυλακισμένου
4.3 Κυκλοφορίας Δίκτυο
4.4 Παιχνίδι του ανταγωνισμού
4.5 Ισορροπία Nash σε μια πληρωμή μήτρα
5 Εμφανίσεων
5.1 Όταν δεν πληρούνται οι προϋποθέσεις
5.2 Εφόσον πληρούνται οι προϋποθέσεις
 
Εφαρμογές
Ισορροπία Nash έχει χρησιμοποιηθεί για την ανάλυση εχθρικές καταστάσεις , όπως [ [ πολέμου ] ] και [ [ κούρσα ] ] s <ref> Schelling , Thomas , Η στρατηγική της σύγκρουσης ] '' , πνευματικά δικαιώματα 1960 , 1980 , Harvard University Press , ISBN 0-674-84031-3 . </ref> (βλ. [ δίλημμα [ κρατουμένου ] ] ) , καθώς επίσης και πώς σύγκρουση μπορεί να μετριαστεί από τις επανειλημμένες αλληλεπίδρασης ( βλ. [ [ tit - for- tat ] ] ) . Επίσης, έχει χρησιμοποιηθεί για να μελετήσει σε ποιο βαθμό οι άνθρωποι με διαφορετικές προτιμήσεις μπορούν να συνεργαστούν (βλέπε [ Μάχη [ των φύλων ( θεωρία παιγνίων ) | μάχη των φύλων ] ] ) , και αν θα πάρουν ρίσκα για να επιτευχθεί μια συνεργατική αποτέλεσμα (βλ. [ [ ελάφι κυνήγι ] ] ) . Έχει χρησιμοποιηθεί για να μελετήσει την υιοθέτηση του [ [ τεχνικό πρότυπο ] ] s { { παραπομπή που απαιτείται | Ημερομηνία = Ιούνιος 2012 } } , καθώς επίσης και η εμφάνιση της [ [ τράπεζας run ] ] s και [ [ κρίση νομίσματος | νομισματικές κρίσεις ] ] ( βλ. [ [ παιχνίδι συντονισμού ] ] ) . Άλλες εφαρμογές περιλαμβάνουν τη ροή της κυκλοφορίας (βλ. [ [ αρχή του Wardrop ] ] ) , πώς να οργανώσουν δημοπρασίες (βλ. [ [ θεωρία της δημοπρασίας ] ] ) , το αποτέλεσμα των προσπαθειών που ασκείται από πολλούς φορείς στην εκπαιδευτική διαδικασία , <ref>
G. De Fraja , Τ. Oliveira , L. Zanchi ( 2010 ) , « [ http://www.mitpressjournals.org/doi/pdf/10.1162/REST_a_00013 must try harder : αξιολόγηση του ρόλου της προσπάθειας στo Εκπαιδευτικό Επίτευγμα ] » . " Η αναθεώρηση της Economis και Στατιστικής " 92:3 . σσ. 577-597 </ref> κανονιστική ρύθμιση, όπως περιβαλλοντικούς κανονισμούς (βλ. [ τραγωδία [ του Θεωρία Παιγνίων και η πολιτική της υπερθέρμανσης του πλανήτη : η κατάσταση των πραγμάτων και πέρα ​​] Hugh Ward , Πολιτικών Σπουδών , τόμος 44 , τεύχος 5 , σελ. 850 - 871 , Δεκέμβριος 1996 </ref> ακόμη και πέναλτι στο [ [ ποδόσφαιρο ] ] ( δείτε [ [ ταιριάζουν πένες ] ] ) . <ref> Π. Chiappori , S. Levitt , και T. Groseclose ( 2002 ) , « [ Testing http://pricetheory.uchicago.edu/levitt/Papers/ChiapporiGrosecloseLevitt2002.pdf Mixed - Ισορροπίες στρατηγική όταν οι παίκτες είναι ετερογενής : . . Η υπόθεση των πέναλτι στο ποδόσφαιρο ] » '' American Economic Review '' 92 , σελ. 1138 - 1151 </ref>
 
Στο Game theory χρησιμοποιούν την έννοια της ισορροπίας Nash για να αναλύσουν το αποτέλεσμα της [η στρατηγική της [ | στρατηγική αλληλεπίδραση ] ] από διάφορα [ [ λήψης αποφάσεων | ιθύνοντες ] ] . Με άλλα λόγια, προσφέρει έναν τρόπο για να προβλέψουμε τι θα συμβεί εάν πολλά άτομα συνισφέρουν στη λήψη αποφάσεων , την ίδια στιγμή , και αν το αποτέλεσμα εξαρτάται από τις αποφάσεις των άλλων . Η απλή ιδέα που διαπερνούσε την ιδέα John Nash είναι ότι κανείς δεν μπορεί να προβλέψει το αποτέλεσμα των επιλογών των πολλαπλών φορέων λήψης αποφάσεων , αν αναλύσει κανείς τις αποφάσεις αυτές στην απομόνωση. Αντ 'αυτού , πρέπει να αναρωτηθούμε τι κάθε παίκτης θα κάνει , λαμβάνοντας υπόψη τη διαδικασία λήψης αποφάσεων από τους άλλους .
== Ιστορία ==
Η ισορροπία Nash πήρε το όνομά του [ [ John Forbes Nash , Jr | John Forbes Nash , Jr .]] Μια εκδοχή της έννοιας της ισορροπίας Nash για πρώτη φορά γνωστό ότι χρησιμοποιούνται το 1838 από [ [ Antoine Augustin Cournot ] ] στη θεωρία του [ [ ολιγοπωλίου ] ] . <ref> Cournot Α. ( 1838 ) Έρευνες για τις Μαθηματικές Αρχές της Θεωρίας του Πλούτου </ref> σε επιχειρήσεις θεωρία του Cournot επιλέξετε πόσο έξοδο ώστε να παράγει για να μεγιστοποιήσουν το κέρδος τους . Ωστόσο, η καλύτερη απόδοση για μία επιχείρηση εξαρτάται από τις εξόδους των άλλων. A [ [ ισορροπία Cournot ] ] εμφανίζεται όταν η παραγωγή κάθε επιχείρησης μεγιστοποιεί τα κέρδη της, λόγω της εξόδου των άλλων επιχειρήσεων , η οποία είναι μια [ [ καθαρή στρατηγική ] ] ισορροπία Nash . Cournot εισήγαγε επίσης την έννοια της [ [ καλύτερη απάντηση ] ] δυναμική στην ανάλυσή του για την ευστάθεια της ισορροπίας .
 
Ισορροπία Nash έχει χρησιμοποιηθεί για την ανάλυση εχθρικών καταστάσεων , όπως [ [ πολέμου ] ] και [ [ κούρσα ] ] s [2] (βλ. [ δίλημμα [ κρατουμένου ] ] ) , καθώς επίσης και πώς η σύγκρουση μπορεί να μετριαστεί από τις επανειλημμένες αλληλεπίδρασης ( βλ. [ [ tit - for- tat ] ] ) . Επίσης, έχει χρησιμοποιηθεί για να μελετήσει σε ποιο βαθμό οι άνθρωποι με διαφορετικές προτιμήσεις μπορούν να συνεργαστούν (βλέπε [ Μάχη [ των φύλων ( θεωρία παιγνίων ) | μάχη των φύλων ] ] ) , και αν θα πάρουν ρίσκα για να επιτευχθεί μια συνεργατική αποφαση (βλ. [ [ ελάφι κυνήγι ] ] ) . Έχει χρησιμοποιηθεί για να μελετήσει την υιοθέτηση του [ [ τεχνικό πρότυπο ] ] s { { παραπομπή που απαιτείται | Ημερομηνία = Ιούνιος 2012 } } , καθώς επίσης και η εμφάνιση της [ [ τράπεζας run ] ] s και [ [ κρίση νομίσματος | νομισματικές κρίσεις ] ] ( βλ. [ [ παιχνίδι συντονισμού ] ] ) . Άλλες εφαρμογές περιλαμβάνουν τη ροή της κυκλοφορίας (βλ. [ [ αρχή του Wardrop ] ] ) , πώς να οργανώσουν δημοπρασίες (βλ. [ [ θεωρία της δημοπρασίας ] ] ) , το αποτέλεσμα των προσπαθειών που ασκείται από πολλούς φορείς στην εκπαιδευτική διαδικασία , [3] κανονιστική ρύθμιση, όπως περιβαλλοντικούς κανονισμούς (βλ. [ τραγωδία [ του Θεωρρήματος των Παιγνίων και η πολιτική της υπερθέρμανσης του πλανήτη : η κατάσταση των πραγμάτων και πέρα ​​] Hugh Ward , Πολιτικών Σπουδών , τόμος 44 , τεύχος 5 , σελ. 850 - 871 , Δεκέμβριος 1996 </ref> ακόμη και πέναλτι στο [ [ ποδόσφαιρο ] ] ( δείτε [ [ ταιριάζουν πένες ] ] ) . [4]
Το σύγχρονο παιχνίδι - θεωρητική έννοια της ισορροπίας Nash ορίζεται αντ 'αυτού από την άποψη της [ [ μικτή στρατηγική | μικτές στρατηγικές ] ] , όπου οι παίκτες επιλέγουν μια κατανομή πιθανοτήτων για πιθανές ενέργειες . Η έννοια της μικτής ισορροπίας Nash στρατηγικής εισήχθη από [ [ John von Neumann ] ] και [ [ Oskar Morgenstern ] ] το 1944 το βιβλίο του '' Η Θεωρία των Αγώνων και Οικονομικών '' Συμπεριφορά . Ωστόσο , η ανάλυσή τους περιορίζεται στην ειδική περίπτωση της [ [ μηδενικού αθροίσματος ] ] παιχνίδια . Έδειξαν ότι η μεικτή στρατηγική ισορροπία Nash θα υπάρχουν για κάθε παιχνίδι μηδενικού αθροίσματος με ένα πεπερασμένο σύνολο των δράσεων . Η συνεισφορά της [ [ John Forbes Nash , Jr ] ] το 1951 το άρθρο του '' μη συνεργάσιμες Αγώνες '' ήταν να καθοριστεί μια μικτή στρατηγική ισορροπία Nash για κάθε παιχνίδι με ένα πεπερασμένο σύνολο των ενεργειών και να αποδείξει ότι τουλάχιστον ένα ( μικτή στρατηγική ) Ισορροπία Nash πρέπει να υπάρχει σε ένα τέτοιο παιχνίδι .
Ιστορία
 
Η ισορροπία Nash πήρε το όνομά της απο τους [ [ John Forbes Nash , Jr | John Forbes Nash , Jr .]] Μια εκδοχή της έννοιας της ισορροπίας Nash για πρώτη φορά έγινε γνωστό ότι χρησιμοποιήθηκε το 1838 από [ [ Antoine Augustin Cournot ] ] στη θεωρία του [ [ ολιγοπωλίου ] ] . [5] σε επιχειρήσεις θεωρία του Cournot επιλέξετε πόσο έξοδο ώστε να παράγει για να μεγιστοποιήσουν το κέρδος τους . Ωστόσο, η καλύτερη απόδοση για μία επιχείρηση εξαρτάται από τις εξόδους των άλλων. A [ [ ισορροπία Cournot ] ] εμφανίζεται όταν η παραγωγή κάθε επιχείρησης μεγιστοποιεί τα κέρδη της, λόγω της εξόδου των άλλων επιχειρήσεων , η οποία είναι μια [ [ καθαρή στρατηγική ] ] ισορροπία Nash . Cournot εισήγαγε επίσης την έννοια της [ [ καλύτερη απάντηση ] ] δυναμική στην ανάλυσή του για την ευστάθεια της ισορροπίας .
Δεδομένου ότι η ανάπτυξη της έννοιας της ισορροπίας Nash , οι θεωρητικοί των παιγνίων έχουν ανακαλύψει ότι κάνει παραπλανητικές προβλέψεις ( ή παραλείπει να κάνει μια μοναδική πρόβλεψη ) σε ορισμένες περιπτώσεις . Ως εκ τούτου έχουν προταθεί πολλές σχετικές [ [ έννοιας λύση ] ] s ( που ονομάζεται επίσης « βελτιώσεις » της ισορροπίας Nash ) με στόχο να ξεπεραστεί η αντιληπτή ατέλειες στην έννοια Nash . Ένα ιδιαίτερα σημαντικό θέμα είναι ότι κάποια ισορροπία Nash μπορεί να βασίζεται σε απειλές που δεν είναι « [ η αξιοπιστία [ | αξιόπιστη ] ] ». Ως εκ τούτου , το 1965 [ [ Reinhard Selten ] ] προτεινόμενης [ [ subgame τέλεια ισορροπία ] ] ως φινέτσα που εξαλείφει ισορροπίες οι οποίες εξαρτώνται από την [ [ μη αξιόπιστες απειλές ] ] . Άλλες επεκτάσεις της έννοιας της ισορροπίας Nash έχουν ασχοληθεί με το τι θα συμβεί αν ένα παιχνίδι είναι [ [ Επαναλαμβανόμενη παιχνίδι | επανειλημμένες ] ] , ή τι θα συμβεί αν το παιχνίδι παίζεται στο [ [ Παγκόσμιο παιχνίδι | απουσία τέλεια πληροφόρηση ] ] . Ωστόσο , μεταγενέστερες τροποποιήσεις και επεκτάσεις του μεριδίου της έννοιας ισορροπίας Nash η κύρια εικόνα για το οποίο η έννοια Nash στηρίζεται : όλες οι έννοιες ισορροπίας αναλύει τις επιλογές που θα γίνουν όταν κάθε παίκτης λαμβάνει υπόψη τη διαδικασία λήψης αποφάσεων των άλλων .
 
Το σύγχρονο παιχνίδι - θεωρητική έννοια της ισορροπίας Nash ορίζεται αντ 'αυτού από την άποψη της [ [ μικτή στρατηγική | μικτές στρατηγικές ] ] , όπου οι παίκτες επιλέγουν μια κατανομή πιθανοτήτων για πιθανές ενέργειες . Η έννοια της μικτής ισορροπίας Nash στρατηγικής εισήχθη από [ [ John von Neumann ] ] και [ [ Oskar Morgenstern ] ] το 1944 το βιβλίο του Η Θεωρία των Αγώνων και Οικονομικών Συμπεριφορά . Ωστόσο , η ανάλυσή τους περιορίζεται στην ειδική περίπτωση της [ [ μηδενικού αθροίσματος ] ] παιχνίδια . Έδειξαν ότι η μεικτή στρατηγική ισορροπία Nash θα υπάρχουν για κάθε παιχνίδι μηδενικού αθροίσματος με ένα πεπερασμένο σύνολο των δράσεων . Η συνεισφορά της [ [ John Forbes Nash , Jr ] ] το 1951 το άρθρο του μη συνεργάσιμες Αγώνες ήταν να καθοριστεί μια μικτή στρατηγική ισορροπία Nash για κάθε παιχνίδι με ένα πεπερασμένο σύνολο των ενεργειών και να αποδείξει ότι τουλάχιστον ένα ( μικτή στρατηγική ) Ισορροπία Nash πρέπει να υπάρχει σε ένα τέτοιο παιχνίδι .
== Ορισμοί ==
 
Δεδομένου ότι η ανάπτυξη της έννοιας της ισορροπίας Nash , οι θεωρητικοί των παιγνίων έχουν ανακαλύψει ότι κάνει παραπλανητικές προβλέψεις ( ή παραλείπει να κάνει μια μοναδική πρόβλεψη ) σε ορισμένες περιπτώσεις . Ως εκ τούτου έχουν προταθεί πολλές σχετικές [ [ έννοιας λύση ] ] s ( που ονομάζεται επίσης « βελτιώσεις » της ισορροπίας Nash ) με στόχο να ξεπεραστεί η αντιληπτή ατέλειες στην έννοια Nash . Ένα ιδιαίτερα σημαντικό θέμα είναι ότι κάποια ισορροπία Nash μπορεί να βασίζεται σε απειλές που δεν είναι « [ η αξιοπιστία [ | αξιόπιστη ] ] ». Ως εκ τούτου , το 1965 [ [ Reinhard Selten ] ] προτεινόμενης [ [ subgame τέλεια ισορροπία ] ] ως φινέτσα που εξαλείφει ισορροπίες οι οποίες εξαρτώνται από την [ [ μη αξιόπιστες απειλές ] ] . Άλλες επεκτάσεις της έννοιας της ισορροπίας Nash έχουν ασχοληθεί με το τι θα συμβεί αν ένα παιχνίδι είναι [ [ Επαναλαμβανόμενη παιχνίδι | επανειλημμένες ] ] , ή τι θα συμβεί αν το παιχνίδι παίζεται στο [ [ Παγκόσμιο παιχνίδι | απουσία τέλεια πληροφόρηση ] ] . Ωστόσο , μεταγενέστερες τροποποιήσεις και επεκτάσεις του μεριδίου της έννοιας ισορροπίας Nash η κύρια εικόνα για το οποίο η έννοια Nash στηρίζεται : όλες οι έννοιες ισορροπίας αναλύει τις επιλογές που θα γίνουν όταν κάθε παίκτης λαμβάνει υπόψη τη διαδικασία λήψης αποφάσεων των άλλων .
=== Άτυπη ορισμό ===
Ορισμοί
Ανεπίσημα , ένα σύνολο στρατηγικών είναι μια ισορροπία του Nash , εάν κανένας παίκτης δεν μπορεί να κάνει καλύτερα από τον μονομερώς την αλλαγή του ή την στρατηγική της . Για να δούμε τι σημαίνει αυτό , φανταστείτε ότι κάθε παίκτης έχει πει τις στρατηγικές των άλλων . Ας υποθέσουμε τότε ότι κάθε παίκτης ο ίδιος ρωτά τον εαυτό του : " Γνωρίζοντας τις στρατηγικές των άλλων παικτών , και τη θεραπεία των στρατηγικών των άλλων παικτών , όπως ορίζεται στην πέτρα , μπορώ να επωφεληθούν από την αλλαγή της στρατηγικής μου; " <ref>
Άτυπη ορισμό
 
Ανεπίσημα , ένα σύνολο στρατηγικών είναι μια ισορροπία του Nash , εάν κανένας παίκτης δεν μπορεί να κάνει καλύτερα από τον μονομερώς την αλλαγή του ή την στρατηγική της . Για να δούμε τι σημαίνει αυτό , φανταστείτε ότι κάθε παίκτης έχει πει τις στρατηγικές των άλλων . Ας υποθέσουμε τότε ότι κάθε παίκτης ο ίδιος ρωτά τον εαυτό του : " Γνωρίζοντας τις στρατηγικές των άλλων παικτών , και τη θεραπεία των στρατηγικών των άλλων παικτών , όπως ορίζεται στην πέτρα , μπορώ να επωφεληθούν από την αλλαγή της στρατηγικής μου; " [6]
Εάν κάποιος παίκτης θα απαντήσει "ναι", τότε αυτό το σύνολο των στρατηγικών δεν είναι μια ισορροπία Nash . Αλλά αν κάθε παίκτης προτιμά να μην αλλάξει (ή είναι αδιάφορος μεταξύ της μεταγωγής και όχι ), τότε το σύνολο των στρατηγικών αποτελεί ισορροπία Nash . Έτσι, κάθε στρατηγική σε μια ισορροπία Nash είναι ένα [ [ καλύτερη απάντηση ] ] σε όλες τις άλλες στρατηγικές σε αυτήν την ισορροπία .
Θεώρημα του Nash Ύπαρξη
 
Nash απέδειξε ότι αν επιτρέψουμε [η στρατηγική της [ ( θεωρία παιγνίων ) # Γνήσιες και μικτές στρατηγικές | μικτές στρατηγικές ] ] , στη συνέχεια, κάθε παιχνίδι με έναν πεπερασμένο αριθμό των παικτών στο οποίο κάθε παίκτης μπορεί να επιλέξει από πεπερασμένου πλήθους καθαρά στρατηγικές έχει τουλάχιστον μία ισορροπία Nash .
Η ισορροπία Nash μπορεί μερικές φορές να φαίνεται ότι δεν είναι ορθολογικό σε μια προοπτική τρίτου προσώπου . Αυτό οφείλεται στο γεγονός ότι μπορεί να συμβεί μια ισορροπία του Nash δεν είναι [ [ Pareto αποτελεσματικότητα | Pareto βέλτιστη ] ] .
Παραδείγματα
Παιχνίδι Συντονισμού
 
{ { Κύρια | παιχνίδι Συντονισμού } }
Η ισορροπία Nash μπορεί επίσης να έχουν μη ορθολογική συνέπειες σε διαδοχικές παιχνίδια επειδή οι παίκτες μπορούν να « απειλούν » ο ένας τον άλλο με μη ορθολογική κινήσεις . Για τέτοια παιχνίδια η [ [ subgame τέλεια ισορροπία Nash ] ] μπορεί να είναι πιο κατανοητή ως εργαλείο ανάλυσης .
 
{ | Align = right border = " 1 " cellpadding = " 4 " cellspacing = " 0 " style = " margin: 1em 1em 1em 1em ? Φόντου : # f9f9f9 ? Σύνορα : 1px # aaa στερεών ? Σύνορα - κατάρρευση : κατάρρευση ? Font- μέγεθος : 95 % ? "
Όταν η ανισότητα ισχύει παραπάνω αυστηρά ( με > αντί για ≥ ) για όλους τους φορείς και όλες τις εφικτές εναλλακτικές στρατηγικές , τότε η ισορροπία έχει χαρακτηριστεί ως '' αυστηρή ισορροπία Nash '' . Αν, αντίθετα , για κάποιο παίκτη , υπάρχει ακριβής ισότητα μεταξύ <math> x ^ * _I </ μαθηματικά > και κάποια άλλη στρατηγική στο σύνολο <math> S < / μαθηματικά > , τότε η ισορροπία έχει ταξινομηθεί ως '' αδύναμο Nash '' ισορροπίας.
 
ένα παιχνίδι του συντονισμού δείγμα που δείχνει σχετική πληρωμή για τον παίκτη 1 / 2 player με κάθε συνδυασμό
Ένα παιχνίδι μπορεί να έχει είτε ένα [ [ καθαρή στρατηγική | καθαρής στρατηγικής ] ] ή [ [ μικτή στρατηγική | μικτή ] ] ισορροπία Nash . ( Στην τελευταία μια καθαρή στρατηγική επιλέγεται [[ στοχαστική ] ] σύμμαχος με ένα σταθερό [ πιθανότητα [] ] ) .</ref>
 
Παίκτης 2 υιοθετεί στρατηγική Α Παίκτης 2 υιοθετεί στρατηγική B - Παίκτης 1 υιοθετεί τη στρατηγική A
=== Θεώρημα του Nash Ύπαρξη ===
Nash απέδειξε ότι αν επιτρέψουμε [η στρατηγική της [ ( θεωρία παιγνίων ) # Γνήσιες και μικτές στρατηγικές | μικτές στρατηγικές ] ] , στη συνέχεια, κάθε παιχνίδι με έναν πεπερασμένο αριθμό των παικτών στο οποίο κάθε παίκτης μπορεί να επιλέξει από πεπερασμένου πλήθους καθαρά στρατηγικές έχει τουλάχιστον μία ισορροπία Nash .
 
4 / 4
== Παραδείγματα ==
1 / 3
 
- Player 1 υιοθετεί τη στρατηγική B
=== Παιχνίδι Συντονισμού ===
{ { Κύρια | παιχνίδι Συντονισμού } }
 
3 / 1
{ | Align = right border = " 1 " cellpadding = " 4 " cellspacing = " 0 " style = " margin: 1em 1em 1em 1em ? Φόντου : # f9f9f9 ? Σύνορα : 1px # aaa στερεών ? Σύνορα - κατάρρευση : κατάρρευση ? Font- μέγεθος : 95 % ? "
2 / 2
'' ένα παιχνίδι του συντονισμού δείγμα που δείχνει σχετική πληρωμή για τον παίκτη 1 / 2 player με κάθε συνδυασμό
 
- }
<nowiki> </nowiki>Παίκτης 2 υιοθετεί στρατηγική Α
<nowiki> </nowiki>Παίκτης 2 υιοθετεί στρατηγική B
<nowiki> -
</nowiki>Παίκτης 1 υιοθετεί τη στρατηγική A
'' 4 '' / '' 4 ''
'' 1 '' / '' 3 ''
<nowiki> -
</nowiki>Player 1 υιοθετεί τη στρατηγική B
'' 3 '' / '' 1 ''
'' 2 '' / '' 2 ''
<nowiki> -
</nowiki>}
 
Ο συντονισμός '' '' παιχνίδι είναι ένα κλασικό ( [ [ συμμετρικό παιχνίδι | συμμετρικό ] ] ) δύο παικτών , δύο [η στρατηγική της [ ( θεωρία παιγνίων ) | στρατηγική ] ] παιχνίδι , με ένα παράδειγμα [ [ πληρωμή μήτρα ] ] φαίνεται στα δεξιά . Οι παίκτες θα πρέπει επομένως συντονίζει , τόσο την υιοθέτηση της στρατηγικής Α , για να λάβει την υψηλότερη πληρωμή ? Δηλαδή , 4 . Αν και οι δύο παίκτες επέλεξαν B στρατηγική όμως , εξακολουθεί να υπάρχει μια ισορροπία του Nash . Παρά το γεγονός ότι κάθε παίκτης κερδίζει λιγότερο από βέλτιστη πληρωμή , κανένας παίκτης δεν έχει κίνητρο για να αλλάξει τη στρατηγική λόγω της μείωσης στην άμεση πληρωμή ( 2-1 ) .
 
Ένα διάσημο παράδειγμα αυτού του τύπου παιχνίδι ονομαζόταν η [ [ ελάφι κυνήγι ] ] ? Στο παιχνίδι δύο παίκτες μπορούν να επιλέξουν να κυνηγούν ένα ελάφι ή ένα κουνέλι , ο πρώην παροχή περισσότερο κρέας ( 4 μονάδες χρησιμότητας ) σε σχέση με την τελευταία ( 1 μονάδα χρησιμότητας ) . Ο περιορισμός είναι ότι το ελάφι θα πρέπει να συνεργάζονται κυνήγι , έτσι ώστε αν κάποιος παίχτης προσπαθεί να κυνηγήσει το ελάφι , ενώ το άλλο κυνηγά το κουνέλι , θα αποτύχει στο κυνήγι ( 0 μονάδων χρησιμότητα ) , ενώ αν και οι δύο κυνηγούν αυτό που θα χωρίσει το ωφέλιμο φορτίο ( 2 , 2). Το παιχνίδι παρουσιάζει , ως εκ τούτου δύο ισορροπίες στο ( ελάφι , ελάφι ) και ( κουνέλι , κουνέλι) και ως εκ τούτου η βέλτιστη στρατηγική των παικτών εξαρτάται από την εμπιστοσύνη τους σε ό, τι ο άλλος παίκτης μπορεί να κάνει . Αν ένας κυνηγός ευελπιστεί ότι ο άλλος θα κυνηγήσουν το ελάφι , θα πρέπει να κυνηγήσουν το ελάφι ? Ωστόσο, εάν υποψιάζεται ότι ο άλλος θα κυνηγήσουν το κουνέλι , θα πρέπει να κυνηγήσουν το κουνέλι . Αυτό το παιχνίδι είχε χρησιμοποιηθεί ως μια αναλογία για την κοινωνική συνεργασία , δεδομένου ότι πολλά από τα οφέλη που οι άνθρωποι αποκτούν στην κοινωνία εξαρτάται από τους ανθρώπους συνεργάζονται και εμμέσως εμπιστεύονται ο ένας τον άλλο να ενεργούν κατά τρόπο αντίστοιχο με τη συνεργασία .
Γραμμή 64 ⟶ 68 :
 
{ | Align = αριστερά border = " 1 " cellpadding = " 4 " cellspacing = " 0 " style = " margin: 1em 1em 1em 1em ? Φόντου : # f9f9f9 ? Σύνορα : 1px # aaa στερεών ? Σύνορα - κατάρρευση : κατάρρευση ? Font- μέγεθος : 95 % "
'' Το παιχνίδι οδήγησης ''
 
Το παιχνίδι οδήγησης
<nowiki> </nowiki>Οδηγείτε στην αριστερή
 
<nowiki> </nowiki>Οδηγούνται στην δεξιά
Οδηγείτε στην αριστερή Οδηγούνται στην δεξιά - Οδηγείτε στην αριστερή 10 , 10 0 , 0 - Οδηγούνται στην δεξιά 0 , 0 10 , 10 - }
<nowiki> -
</nowiki>Οδηγείτε στην αριστερή
<nowiki> 10 , 10
0 , 0
-
</nowiki>Οδηγούνται στην δεξιά
<nowiki> 0 , 0
10 , 10
-
</nowiki>}
 
Σε αυτή την περίπτωση υπάρχουν δύο καθαρή στρατηγική ισορροπίας του Nash , όταν και οι δύο να επιλέξουν είτε να οδηγείτε στην αριστερή ή τη δεξιά . Αν παραδεχτούμε [ [ μικτή στρατηγική | μικτές στρατηγικές ] ] (όπου μια καθαρή στρατηγική που επιλέγεται τυχαία , υπόκεινται σε κάποια σταθερή πιθανότητα) , τότε υπάρχουν τρεις ισορροπίες Nash για την ίδια περίπτωση : δύο έχουμε δει από τη μορφή καθαρής στρατηγικής , όπου οι πιθανότητες είναι ( 0 % , 100 %) για έναν μόνο παίκτη , ( 0 % , 100 % ) για τον παίκτη δύο? και ( 100 % , 0 % ) για έναν μόνο παίκτη , ( 100 % , 0 % ) για τον παίκτη δύο αντίστοιχα . Προσθέτουμε άλλο, όπου οι πιθανότητες για κάθε παίκτη είναι (50 % , 50%) .
 
{ { Clear αριστερά } }
Δίλημμα φυλακισμένου
 
{ { Κύρια | δίλημμα φυλακισμένου } } { | Align = right border = " 1 " cellpadding = " 4 " cellspacing = " 0 " style = " margin: 1em 1em 1em 1em ? Φόντου : # f9f9f9 ? Σύνορα : 1px # aaa στερεών ? Σύνορα - κατάρρευση : κατάρρευση ? Font- μέγεθος : 95 % ? "
=== Δίλημμα φυλακισμένου ===
{ { Κύρια | δίλημμα φυλακισμένου } }
{ | Align = right border = " 1 " cellpadding = " 4 " cellspacing = " 0 " style = " margin: 1em 1em 1em 1em ? Φόντου : # f9f9f9 ? Σύνορα : 1px # aaa στερεών ? Σύνορα - κατάρρευση : κατάρρευση ? Font- μέγεθος : 95 % ? "
'' Παράδειγμα μήτρας εξόφληση PD
 
Παράδειγμα μήτρας εξόφληση PD
<nowiki> </nowiki>πεδίο = " col " style = " color: # 900 " | Συνεργασία ( με άλλους )
 
<nowiki> </nowiki>πεδίο = " col " style = " color: # 900 " | Ελάττωμα ( προδώσει άλλα )
πεδίο = " col " style = " color: # 900 " | Συνεργασία ( με άλλους ) πεδίο = " col " style = " color: # 900 " | Ελάττωμα ( προδώσει άλλα ) - πεδίο = " γραμμή " style = " color: # 009 " | Συνεργασία ( με άλλους ) 4 , 4
<nowiki> -
 
</nowiki>πεδίο = " γραμμή " style = " color: # 009 " | Συνεργασία ( με άλλους )
0 < / span> 5 < /span>
<nowiki> </nowiki>4 , 4
-
<span style="color: #009"> 0 < / span> <span style="color: #900"> 5 < /span>
πεδίο = " γραμμή " style = " color: # 009 " | Ελάττωμα ( προδώσει άλλα )
-
5 < / span> 0 </span>
πεδίο = " γραμμή " style = " color: # 009 " | Ελάττωμα ( προδώσει άλλα )
<span style="color: #009"> 5 < / span> <span style="color: #900"> 0 <nowiki></span>
3 , 3
}
</nowiki>}
 
Φανταστείτε δύο φυλακισμένων που κρατούνται σε ξεχωριστά κελιά , ανακρίνονται ταυτόχρονα , και προσφέρονται ευκαιρίες ( αναπτήρα φυλάκιση) για την προδοσία τους συναδέλφους ποινική τους. Μπορούν να «συνεργάζονται» ( με το άλλο κρατούμενο ), με το να μην snitching , ή "ελάττωμα " προδίδοντας την άλλη . Ωστόσο , υπάρχει μια παγίδα ? Αν και οι δύο παίκτες ελάττωμα , τότε και οι δύο εξυπηρετούν μια μεγαλύτερη ποινή από ό, τι αν δεν είπε τίποτα . Οι χαμηλότερες ποινές φυλάκισης που ερμηνεύεται ως υψηλότερες απολαβές (όπως φαίνεται στον πίνακα ) .
Γραμμή 105 ⟶ 96 :
 
Τι καιρό κάνει αυτό μια ενδιαφέρουσα περίπτωση για τη μελέτη είναι το γεγονός ότι αυτό το σενάριο είναι παγκοσμίως κατώτερα " τόσο για τους συνεργασθέντες . " Δηλαδή , οι δύο παίκτες θα είναι καλύτερα αν και οι δύο επέλεξαν να " συνεργαστούν ", αντί των δύο που επιλέγουν να αποστατήσουν . Ωστόσο , κάθε παίκτης θα μπορούσε να βελτιώσει την κατάστασή του, με το σπάσιμο της αμοιβαίας συνεργασίας , δεν έχει σημασία πόσο ο άλλος παίκτης ενδεχομένως ( ή σίγουρα) θα αλλάξει την απόφασή του .
Κυκλοφορίας Δίκτυο
 
{ { Δείτε επίσης | παράδοξο Braess του } } [7]
=== Κυκλοφορίας Δίκτυο ===
Παιχνίδι του ανταγωνισμού
{ { Δείτε επίσης | παράδοξο Braess του } } <ref>
[ [File : Nash γράφημα equilibrium.png | frame | διάγραμμα του δικτύου δείγματος . Οι τιμές στις άκρες είναι ο χρόνος διαδρομής που βιώνουν ένα « αυτοκίνητο » ταξιδεύουν κάτω από αυτό το πλεονέκτημα . <math> x < / math > είναι ο αριθμός των αυτοκινήτων που ταξιδεύουν μέσω αυτής της ακμής . ] ]
Η εφαρμογή των ισορροπιών Nash είναι για τον προσδιορισμό της αναμενόμενης ροή της κυκλοφορίας σε ένα δίκτυο . Εξετάστε το γράφημα στα δεξιά. Αν υποθέσουμε ότι υπάρχουν <math> x < / math > "αυτοκίνητα ", που ταξιδεύουν από το Α έως Δ , ποια είναι η αναμενόμενη κατανομή της κυκλοφορίας στο δίκτυο ;
 
{ | Align = right border = " 1 " cellpadding = " 1 " cellspacing = " 0 " style = " margin: 1em 1em 1em 1em ? Φόντου : # f9f9f9 ? Σύνορα : 1px # aaa στερεών ? Σύνορα - κατάρρευση : κατάρρευση ? Font- μέγεθος : 95 % ? "
Αυτή η κατάσταση μπορεί να μοντελοποιηθεί ως ένα " παιχνίδι" , όπου κάθε άτομο έχει μια επιλογή από 3 στρατηγικές , όπου κάθε στρατηγική είναι μια διαδρομή από το Α έως D ( είτε <math> ABD < / math > , <math> ABCD < / math > , ή <math> ACD < / math > ) . Η « πληρωμή » κάθε στρατηγικής είναι ο χρόνος διαδρομής της κάθε διαδρομής . Στο διάγραμμα στα δεξιά , ένα αυτοκίνητο που κινείται μέσω <math> ABD < / math > εμπειρίες χρόνο ταξιδιού <math> ( 1 + x/100 ) +2 < / math > , όπου <math> x < / math > είναι ο αριθμός των αυτοκινήτων που ταξιδεύουν στην άκρη <math> AB < / math > . Έτσι , κέρδη για κάθε δεδομένη στρατηγική εξαρτάται από τις επιλογές των άλλων παικτών , όπως συνηθίζεται . Ωστόσο , ο στόχος σε αυτή την περίπτωση είναι να ελαχιστοποιηθεί ο χρόνος ταξιδιού , δεν μεγιστοποιήσετε . Ισορροπία θα συμβεί , όταν ο χρόνος για όλες τις διαδρομές είναι ακριβώς η ίδια . Όταν συμβαίνει αυτό, δεν είναι μόνο οδηγός έχει κάθε κίνητρο να στραφούν γραμμές , δεδομένου ότι μπορεί μόνο να προσθέσει / της χρόνο ταξιδιού του. Για το γράφημα στα δεξιά , αν, για παράδειγμα , 100 αυτοκίνητα που ταξιδεύουν από το Α έως Δ , τότε ισορροπία θα συμβεί όταν 25 οδηγοί ταξίδι μέσω <math> ABD < / math > , 50 μέσω <math> ABCD < / math > , και 25 μέσω <math> ACD < / math > . Κάθε οδηγός έχει τώρα ένα συνολικό χρόνο ταξιδιού από 3,75 ( για να δείτε αυτό , σημειώστε ότι συνολικά 75 αυτοκίνητα αναλαμβάνουν την <math> AB < / math > άκρη , και επίσης 75 αυτοκίνητα πάρει το <math> CD < / math > άκρη ) . < - ! 25 ταξιδιωτικών οδηγών μέσω της ΝΑΒ και 50 μέσω του ABCD , οπότε 75 ταξίδια αυτοκίνητα στην άκρη AB . Ομοίως 75 αυτοκίνητα ταξιδεύουν σε CD άκρη . Παίρνει ( 1 + 75/100 ) + 2 = 3.75 για να ταξιδέψουν μέσω ΝΑΒ . Η διάρκεια του ταξιδιού από τις άλλες γραμμές είναι τα ίδια . ->
 
Ένα παιχνίδι ανταγωνισμού
Σημειώστε ότι αυτή η κατανομή δεν είναι , στην πραγματικότητα , κοινωνικά βέλτιστο . Αν τα 100 αυτοκίνητα συμφώνησαν ότι το 50 ταξίδια μέσω <math> ABD < / math > και η άλλη 50 μέσω <math> ACD < / math > , τότε το ταξίδι στο χρόνο για κάθε μεμονωμένο αυτοκίνητο θα είναι στην πραγματικότητα 3.5 η οποία είναι μικρότερη από 3,75 . Αυτή είναι επίσης η ισορροπία Nash εάν η διαδρομή μεταξύ των Β και C έχει αφαιρεθεί, το οποίο σημαίνει ότι η προσθήκη ενός επιπλέον πιθανή διαδρομή μπορεί να μειώσει την αποτελεσματικότητα του συστήματος , ένα φαινόμενο γνωστό ως [[ Braess το παράδοξο ] ] .</ref>
 
Player 2 επιλέγει '0 ' Player 2 επιλέγει '1 ' Player 2 επιλέγει '2 ' Player 2 επιλέγει '3 ' - Παίκτης 1 επιλέξει '0 '
=== Παιχνίδι του ανταγωνισμού ===
 
{ | Align = right border = " 1 " cellpadding = " 1 " cellspacing = " 0 " style = " margin: 1em 1em 1em 1em ? Φόντου : # f9f9f9 ? Σύνορα : 1px # aaa στερεών ? Σύνορα - κατάρρευση : κατάρρευση ? Font- μέγεθος : 95 % ? "
0 , 0
'' Ένα παιχνίδι ανταγωνισμού ''
2 , -2
2 , -2
2 , -2
 
- Παίκτης 1 επιλέξει '1 '
 
-2 , 2
1 , 1
3 , -1
3 , -1
 
- Παίκτης 1 επιλέξει '2 '
 
-2 , 2
-1 , 3
2 , 2
4 , 0
 
- Παίκτης 1 επιλέξει '3 '
 
-2 , 2
-1 , 3
0 , 4
3 , 3
 
- }
<nowiki> </nowiki>Player 2 επιλέγει '0 '
<nowiki> </nowiki>Player 2 επιλέγει '1 '
<nowiki> </nowiki>Player 2 επιλέγει '2 '
<nowiki> </nowiki>Player 2 επιλέγει '3 '
<nowiki> -
</nowiki>Παίκτης 1 επιλέξει '0 '
'' 0 '' , '' 0 ''
'' 2 '' , '' -2 ''
'' 2 '' , '' -2 ''
'' 2 '' , '' -2 ''
<nowiki> -
</nowiki>Παίκτης 1 επιλέξει '1 '
'' -2 '' , '' 2 ''
'' 1 '' , '' 1 ''
'' 3 '' , '' -1 ''
'' 3 '' , '' -1 ''
<nowiki> -
</nowiki>Παίκτης 1 επιλέξει '2 '
'' -2 '' , '' 2 ''
'' -1 '' , '' 3 ''
'' 2 '' , '' 2 ''
'' 4 '' , '' 0 ''
<nowiki> -
</nowiki>Παίκτης 1 επιλέξει '3 '
'' -2 '' , '' 2 ''
'' -1 '' , '' 3 ''
'' 0 '' , '' 4 ''
'' 3 '' , '' 3 ''
<nowiki> -
</nowiki>}
 
Αυτό μπορεί να απεικονιστεί με ένα παιχνίδι δύο παικτών, στο οποίο οι δύο παίκτες επιλέγουν ταυτόχρονα ένας ακέραιος 0-3 και οι δύο να κερδίσει το μικρότερο από τους δύο αριθμούς στα σημεία . Επιπλέον, εάν ένας παίκτης επιλέγει ένα μεγαλύτερο αριθμό από το άλλο , τότε αυτός / αυτή έχει να δώσει μέχρι και δύο σημεία στο άλλο .
 
Αυτό το παιχνίδι έχει μια μοναδική καθαρής στρατηγικής ισορροπίας Nash : και οι δύο παίκτες επιλέγουν 0 ( επισημαίνονται με κόκκινο φως ) . Οποιαδήποτε άλλη στρατηγική μπορεί να βελτιωθεί από έναν παίκτη μεταγωγής αριθμό του σε ένα μικρότερο από εκείνο του άλλου παίκτη. Στον πίνακα στα δεξιά , αν το παιχνίδι ξεκινά από την πράσινη πλατεία , είναι προς το συμφέρον παίκτης 1 να κινηθεί προς το πορφυρό τετράγωνο και είναι προς το συμφέρον παίκτη 2 να κινηθεί προς το μπλε τετράγωνο . Αν και δεν θα ταίριαζε με τον ορισμό ενός παιχνιδιού του ανταγωνισμού , αν το παιχνίδι έχει τροποποιηθεί έτσι ώστε οι δύο παίκτες να κερδίσει το όνομα ποσό, αν και οι δύο επιλέξουν τον ίδιο αριθμό , και με άλλο τρόπο να κερδίσει τίποτα , τότε υπάρχουν 4 ισορροπίες Nash : ( 0,0 ) , (1,1 ) , (2,2 ) , και (3,3 ) .
Ισορροπία Nash σε μια πληρωμή μήτρα
 
=== Ισορροπία Nash σε μια πληρωμή μήτρα ===
Υπάρχει ένας εύκολος αριθμητική τρόπος για τον εντοπισμό σημείων ισορροπίας Nash σε μια πληρωμή μήτρα . Είναι ιδιαίτερα χρήσιμο σε δύο άτομα, παιχνίδια όπου οι παίκτες έχουν περισσότερα από δύο στρατηγικές . Στην περίπτωση αυτή, τυπική ανάλυση μπορεί να γίνει πάρα πολύ καιρό . Ο κανόνας αυτός δεν ισχύει για την περίπτωση που μικτή ( στοχαστική ) στρατηγικές είναι ενδιαφέρον . Ο κανόνας έχει ως εξής : αν ο πρώτος αριθμός εξόφληση , στο ζεύγος εξόφληση του κυττάρου, είναι το μέγιστο της στήλης του στοιχείου και αν ο δεύτερος αριθμός είναι το μέγιστο της γραμμής του κυττάρου - τότε το κύτταρο αντιπροσωπεύει Nash ισορροπία.
 
{ | Align = "left " border = " 1 " cellpadding = " 4 " cellspacing = " 0 " style = " margin: 1em ? Υπόβαθρο: # f9f9f9 ? Σύνορα : 1px # aaa στερεών ? Σύνορα - κατάρρευση : κατάρρευση ? Font-size : 95 % ? "
'' Η εξόφληση μήτρα - ισορροπία Nash με έντονους ''
 
Η εξόφληση μήτρα - ισορροπία Nash με έντονους
<nowiki> Επιλογή Α
 
Επιλογή Β
Επιλογή Α Επιλογή Β Επιλογή Γ - Επιλογή Α 0 , 0
 
-
'25 , 40 '
Επιλογή Α
5 , 10
</nowiki>0 , 0
-
'' '25 , 40 '' '
Επιλογή Β
5 , 10
'40 , 25 '
-
0 , 0
Επιλογή Β
5 , 15
'' '40 , 25 '' '
-
0 , 0
Επιλογή Γ
5 , 15
10 , 5
-
15 , 5
Επιλογή Γ
'10 , 510 '
-
15 , 5
}
'' '10 , 10 '' '
-
}
 
Μπορούμε να εφαρμόσουμε αυτόν τον κανόνα σε ένα 3 × 3 πίνακα :
Γραμμή 187 ⟶ 169 :
Αυτό είπε , η πραγματική μηχανική για την εξεύρεση κυττάρων ισορροπίας είναι προφανής : να βρείτε το μέγιστο μιας στήλης και ελέγξτε αν το δεύτερο μέλος του ζεύγους είναι το μέγιστο της γραμμής . Εάν πληρούνται αυτές οι προϋποθέσεις , το κύτταρο αντιπροσωπεύει μια ισορροπία Nash . Δείτε όλες τις στήλες με αυτόν τον τρόπο να βρείτε όλα τα ΒΑ κύτταρα . Ένας n × n πίνακας μπορεί να έχουν μεταξύ 0 και N × N [ [η στρατηγική της καθαρής ] ] ισορροπία Nash .
 
Σταθερότητα == == Η έννοια του [[ θεωρίας Σταθερότητας | σταθερότητα ] ] , είναι χρήσιμα στην ανάλυση των πολλών ειδών ισορροπιών , μπορεί επίσης να εφαρμοστεί σε ισορροπία Nash .
Σταθερότητα == ==
Η έννοια του [[ θεωρίας Σταθερότητας | σταθερότητα ] ] , είναι χρήσιμα στην ανάλυση των πολλών ειδών ισορροπιών , μπορεί επίσης να εφαρμοστεί σε ισορροπία Nash .
 
Μια ισορροπία Nash για ένα μικτό παιχνίδι στρατηγικής είναι σταθερή , αν μια μικρή αλλαγή ( συγκεκριμένα , μια απειροελάχιστη μεταβολή) σε πιθανότητες για έναν παίκτη οδηγεί σε μια κατάσταση όπου κατέχουν δύο προϋποθέσεις :
 
# Ο παίκτης που δεν έχει αλλάξει δεν έχει καλύτερη στρατηγική στη νέα περίσταση
# Ο παίκτης που έκανε την αλλαγή τώρα παίζει με ένα αυστηρά χειρότερη στρατηγική.
 
Αν αυτές οι περιπτώσεις και οι δύο προϋποθέσεις, τότε ο παίκτης με την μικρή αλλαγή στο μικτής στρατηγικής του θα επιστρέψει αμέσως στην ισορροπία Nash . Η ισορροπία λέγεται ότι είναι σταθερή. Εάν κάποιος όρος δεν ισχύει , τότε η ισορροπία είναι ασταθής . Εάν υπάρχει μόνο μία συνθήκη ισχύει τότε είναι πιθανό να είναι ένας άπειρος αριθμός των βέλτιστων στρατηγικών για τον παίκτη που άλλαξε . [ [ John Forbes Nash | John Nash ] ] έδειξε ότι η τελευταία κατάσταση δεν θα μπορούσαν να προκύψουν σε μια σειρά από σαφώς καθορισμένα παιχνίδια .
Γραμμή 201 ⟶ 182 :
Η σταθερότητα είναι ζωτικής σημασίας για τις πρακτικές εφαρμογές των ισορροπιών Nash , δεδομένου ότι η μεικτή στρατηγική του κάθε παίκτη δεν είναι απολύτως γνωστός , αλλά πρέπει να συναχθεί από την στατιστική κατανομή των ενεργειών του στο παιχνίδι . Στην περίπτωση αυτή, ασταθή ισορροπία είναι πολύ πιθανό να ανακύψουν στην πράξη , δεδομένου ότι κάθε λεπτό αλλαγή στις αναλογίες δει κάθε στρατηγική θα οδηγήσει σε μια αλλαγή στρατηγικής και την κατανομή της ισορροπίας .
 
Η ισορροπία Nash ορίζει τη σταθερότητα μόνο από την άποψη της μονομερούς αποκλίσεις . Σε παιχνίδια συνεργασίας μια τέτοια έννοια δεν είναι αρκετά πειστική . [ [ Ισχυρή ισορροπία Nash ] ] επιτρέπει παρεκκλίσεις από κάθε πιθανό συνασπισμό <ref name="CoalitionProof"> { { Citation | . Doi = 10.1016/0022-0531 ( 87 ) 90099 - [8 | title = Συνασπισμός -Proof Ισορροπίες I. Έννοιες | author = BD Bernheim , Β. Φαλέγ , MD Whinston | = περιοδικό Journal of Economic Theory | όγκος = 42 | year = 1987 | θέμα = 1 | pages = 1-12 | . υστερόγραφο = } } </ref>] Τυπικά, ένας . [ [ ισχυρή ισορροπία Nash ] ] είναι μια ισορροπία Nash στην οποία δεν συνασπισμό , λαμβάνοντας τις ενέργειες των συμπληρωμάτων του, όπως δίνεται , μπορεί να αποκλίνουν σε συνεργασία με έναν τρόπο που ωφελεί όλα τα μέλη της <ref name="SNE"> { { Citation | Συγγραφέας = R. Aumann , | title = Αποδεκτή σημεία σε γενικές γραμμές συνεταιριστικές n -person παιχνίδια στο "Συμβολή στη Θεωρία των Αγώνων IV " | εκδότης = Princeton Univ . Press , Princeton , NJ | year = 1959 | υστερόγραφο = } } </ref>[9] Ωστόσο , η ισχυρή αντίληψη Nash είναι μερικές φορές θεωρείται ως πολύ " ισχυρή" το ότι το περιβάλλον επιτρέπει την απεριόριστη ιδιωτική επικοινωνία . . Στην πραγματικότητα , η ισχυρή ισορροπία Nash πρέπει να είναι [ [ Pareto αποτελεσματική ] ] . Ως αποτέλεσμα αυτών των απαιτήσεων , ισχυρή Nash είναι υπερβολικά σπάνιο να είναι χρήσιμο σε πολλούς κλάδους της θεωρίας παιγνίων. Ωστόσο , σε παιχνίδια όπως οι εκλογές με πολλούς περισσότερους παίκτες από ό, τι πιθανά αποτελέσματα , μπορεί να είναι πιο συχνές από ό, τι μια σταθερή ισορροπία .
 
Μια εκλεπτυσμένη ισορροπία Nash είναι γνωστή ως [ [ συνασπισμού -απόδειξη ισορροπίας Nash ] ] ( CPNE ) <ref name="CoalitionProof"/>[8] συμβαίνει όταν οι παίκτες δεν μπορούν να κάνουν καλύτερα, ακόμη και αν έχουν τη δυνατότητα να επικοινωνούν και να "αυτο - επιβολή « συμφωνία να αποκλίνει . Κάθε συσχετιζόμενων στρατηγική που υποστηρίζεται από [ Κυριαρχία [ ( θεωρία παιγνίων ) | επαναλαμβάνεται αυστηρή κυριαρχία ] ] και η [ [ Pareto σύνορα ] ] είναι ένα CPNE <ref name="CPNE"> { { Citation | . Title = Συνασπισμός -Proof Equilibrium | Συγγραφέας = D. Moreno , J. Wooders | Εφημερίδα = Παιχνίδια και Οικονομική Συμπεριφορά | όγκος = 17 | θέμα = 1 | year = 1996 | pages = 80-112 | doi = [10.1006/game.1996.0095 | . υστερόγραφο = } } </ref>] Περαιτέρω, είναι δυνατόν για ένα παιχνίδι να έχει μια ισορροπία Nash που είναι ανθεκτικά έναντι συνασπισμούς λιγότερο από ένα συγκεκριμένο μέγεθος , k. CPNE σχετίζεται με την [ [Πυρήνας ( Οικονομικά) | θεωρία του πυρήνα ] ] .
 
Τέλος, στη δεκαετία του ογδόντα , κτίριο με μεγάλο βάθος για τέτοιες ιδέες [ [ Mertens - σταθερές ισορροπίες ] ] εισήχθησαν ως [ [ έννοιας λύση ] ] . Mertens σταθερή ισορροπία ικανοποιεί και τα δύο [ [ εμπρός επαγωγή ] ] και [ [ πίσω επαγωγή ] ] . Σε μια [ [ θεωρία παιγνίων ] ] το περιβάλλον [ [ σταθερή ισορροπίες ] ] τώρα συνήθως αναφέρονται σε Mertens σταθερή ισορροπία .
Εμφανίσεων
 
== Εμφανίσεων ==
Αν ένα παιχνίδι έχει μια [ [ μοναδικό ] ] ισορροπία Nash και παίζεται μεταξύ των παικτών , υπό ορισμένες προϋποθέσεις , τότε η ΒΑ σύνολο στρατηγική θα πρέπει να ληφθούν. Επαρκείς συνθήκες για να εξασφαλιστεί ότι η ισορροπία Nash παίζεται είναι :
# Οι παίκτες όλοι θα κάνουν κάθε δυνατή προσπάθεια για να μεγιστοποιήσουν την αναμενόμενη πληρωμή τους, όπως περιγράφεται από το παιχνίδι .
# Οι παίκτες άψογη εκτέλεση.
# Οι παίκτες έχουν αρκετή νοημοσύνη για να συναγάγει τη λύση .
# Οι παίκτες γνωρίζουν την προγραμματισμένη στρατηγική ισορροπία όλων των άλλων παικτών .
# Οι παίκτες πιστεύουν ότι μια απόκλιση στη δική της στρατηγική τους δεν θα προκαλέσουν αποκλίσεις από άλλους παίκτες .
# Υπάρχει [ [ κοινή γνώση ( λογική ) | κοινή γνώση ] ] ότι όλοι οι παίκτες πληρούν τις προϋποθέσεις αυτές , συμπεριλαμβανομένου αυτού. Έτσι , όχι μόνο θα πρέπει κάθε παίκτης γνωρίζει τους άλλους παίκτες πληρούν τις προϋποθέσεις , αλλά πρέπει να ξέρουν ότι όλοι ξέρουν ότι θα τους συναντήσει , και να ξέρετε ότι ξέρουν ότι ξέρουν ότι θα τους συναντήσει , και ούτω καθεξής .
 
Οι παίκτες όλοι θα κάνουν κάθε δυνατή προσπάθεια για να μεγιστοποιήσουν την αναμενόμενη πληρωμή τους, όπως περιγράφεται από το παιχνίδι .
=== Όταν δεν πληρούνται οι προϋποθέσεις ===
Οι παίκτες άψογη εκτέλεση.
Οι παίκτες έχουν αρκετή νοημοσύνη για να συναγάγει τη λύση .
Οι παίκτες γνωρίζουν την προγραμματισμένη στρατηγική ισορροπία όλων των άλλων παικτών .
Οι παίκτες πιστεύουν ότι μια απόκλιση στη δική της στρατηγική τους δεν θα προκαλέσουν αποκλίσεις από άλλους παίκτες .
Υπάρχει [ [ κοινή γνώση ( λογική ) | κοινή γνώση ] ] ότι όλοι οι παίκτες πληρούν τις προϋποθέσεις αυτές , συμπεριλαμβανομένου αυτού. Έτσι , όχι μόνο θα πρέπει κάθε παίκτης γνωρίζει τους άλλους παίκτες πληρούν τις προϋποθέσεις , αλλά πρέπει να ξέρουν ότι όλοι ξέρουν ότι θα τους συναντήσει , και να ξέρετε ότι ξέρουν ότι ξέρουν ότι θα τους συναντήσει , και ούτω καθεξής .
 
Όταν δεν πληρούνται οι προϋποθέσεις
 
Παραδείγματα [ [ θεωρία παιγνίων ] ] προβλημάτων στα οποία δεν πληρούνται οι ακόλουθοι όροι:
# Η πρώτη προϋπόθεση δεν πληρούται , αν το παιχνίδι δεν περιγράφει σωστά τις ποσότητες που ένας παίκτης επιθυμεί να μεγιστοποιήσει . Σε αυτή την περίπτωση, δεν υπάρχει ιδιαίτερος λόγος για αυτόν τον παίκτη να υιοθετήσει μια στρατηγική ισορροπία . Για παράδειγμα , το δίλημμα του φυλακισμένου δεν είναι ένα δίλημμα εάν είτε παίκτης είναι στην ευχάριστη θέση να φυλακιστεί επ 'αόριστον .
# Εκούσια ή ακούσια ατέλεια κατά την εκτέλεση . Για παράδειγμα , ένας υπολογιστής μπορεί να άψογη λογική παιχνιδιού αντιμετωπίζει ένα δεύτερο άψογη υπολογιστή θα οδηγήσει σε ισορροπία . Εισαγωγή της ατέλειας θα οδηγήσει σε διακοπή της, είτε μέσω της απώλειας του παίκτη που κάνει το λάθος , ή μέσω άρνησης της [ [ κοινή γνώση ( λογική ) | κοινή γνώση ] ] κριτήριο οδηγώντας σε πιθανή νίκη για τον παίκτη . ( Ένα παράδειγμα θα ήταν ένας παίκτης ξαφνικά βάζοντας το αυτοκίνητο προς τα πίσω στο [ παιχνίδι [ κοτόπουλο ] ] , εξασφαλίζοντας μια μη- απώλεια no- win σενάριο ) .
# Σε πολλές περιπτώσεις , η τρίτη προϋπόθεση αυτή δεν πληρούται , διότι , ακόμη και αν η ισορροπία πρέπει να υπάρχει , είναι άγνωστη, λόγω της πολυπλοκότητας του παιχνιδιού , για παράδειγμα, στο [ [ κινέζικο σκάκι ] ] <ref> { { αναφοράς που είναι αναγκαία | . Κείμενο = Nash απέδειξε ότι ένας τέλειος NE υπάρχει για αυτό το είδος των πεπερασμένων [ [ εκτεταμένη μορφή παιχνιδιού ] ] | Ημερομηνία = Απρίλης 2010 } } - μπορεί να παρουσιαστεί ως μια στρατηγική σύμφωνα με την αρχική τους όρους του για ένα παιχνίδι με ΒΑ . Τέτοια παιχνίδια μπορεί να μην έχει το μοναδικό NE , αλλά τουλάχιστον μία από τις πολλές στρατηγικές ισορροπίας θα παίξει με υποθετικά παίκτες που έχουν άριστη γνώση όλων των { { αναφοράς που είναι αναγκαία | text = 10 <sup> 150 < / sup > [ [ πολυπλοκότητα παιχνίδι -tree | δέντρα παιχνίδι ] ] | Ημερομηνία = Απρίλιος 2010 } } </ref> Ή , αν είναι γνωστή , μπορεί να μην είναι γνωστό σε όλους τους παίκτες , όπως όταν παίζει [ [ tic - tac - toe ] ] με ένα μικρό παιδί που θέλει απεγνωσμένα . για να κερδίσει ( που πληρούν τα άλλα κριτήρια ) .
# Το κριτήριο της κοινής γνώσης δεν μπορεί να εκπληρωθεί ακόμη και αν όλοι οι παίκτες κάνουν , στην πραγματικότητα , πληρούν όλα τα άλλα κριτήρια . Οι παίκτες κακώς distrusting ορθολογισμού του άλλου μπορεί να θεσπίσει στρατηγικές για να αναμένεται παράλογη παιχνίδι για λογαριασμό των αντιπάλων τους . Αυτή είναι μια σημαντική εκτίμηση σε " [ [ Game του κοτόπουλου | κοτόπουλου ] ] " ή [ [ κούρσα εξοπλισμών ] ] , για παράδειγμα.
 
Η πρώτη προϋπόθεση δεν πληρούται , αν το παιχνίδι δεν περιγράφει σωστά τις ποσότητες που ένας παίκτης επιθυμεί να μεγιστοποιήσει . Σε αυτή την περίπτωση, δεν υπάρχει ιδιαίτερος λόγος για αυτόν τον παίκτη να υιοθετήσει μια στρατηγική ισορροπία . Για παράδειγμα , το δίλημμα του φυλακισμένου δεν είναι ένα δίλημμα εάν είτε παίκτης είναι στην ευχάριστη θέση να φυλακιστεί επ 'αόριστον .
=== Εφόσον πληρούνται οι προϋποθέσεις ===
Εκούσια ή ακούσια ατέλεια κατά την εκτέλεση . Για παράδειγμα , ένας υπολογιστής μπορεί να άψογη λογική παιχνιδιού αντιμετωπίζει ένα δεύτερο άψογη υπολογιστή θα οδηγήσει σε ισορροπία . Εισαγωγή της ατέλειας θα οδηγήσει σε διακοπή της, είτε μέσω της απώλειας του παίκτη που κάνει το λάθος , ή μέσω άρνησης της [ [ κοινή γνώση ( λογική ) | κοινή γνώση ] ] κριτήριο οδηγώντας σε πιθανή νίκη για τον παίκτη . ( Ένα παράδειγμα θα ήταν ένας παίκτης ξαφνικά βάζοντας το αυτοκίνητο προς τα πίσω στο [ παιχνίδι [ κοτόπουλο ] ] , εξασφαλίζοντας μια μη- απώλεια no- win σενάριο ) .
Σε πολλές περιπτώσεις , η τρίτη προϋπόθεση αυτή δεν πληρούται , διότι , ακόμη και αν η ισορροπία πρέπει να υπάρχει , είναι άγνωστη, λόγω της πολυπλοκότητας του παιχνιδιού , για παράδειγμα, στο [ [ κινέζικο σκάκι ] ] [11] Ή , αν είναι γνωστή , μπορεί να μην είναι γνωστό σε όλους τους παίκτες , όπως όταν παίζει [ [ tic - tac - toe ] ] με ένα μικρό παιδί που θέλει απεγνωσμένα . για να κερδίσει ( που πληρούν τα άλλα κριτήρια ) .
Το κριτήριο της κοινής γνώσης δεν μπορεί να εκπληρωθεί ακόμη και αν όλοι οι παίκτες κάνουν , στην πραγματικότητα , πληρούν όλα τα άλλα κριτήρια . Οι παίκτες κακώς distrusting ορθολογισμού του άλλου μπορεί να θεσπίσει στρατηγικές για να αναμένεται παράλογη παιχνίδι για λογαριασμό των αντιπάλων τους . Αυτή είναι μια σημαντική εκτίμηση σε " [ [ Game του κοτόπουλου | κοτόπουλου ] ] " ή [ [ κούρσα εξοπλισμών ] ] , για παράδειγμα.
 
Εφόσον πληρούνται οι προϋποθέσεις
 
Λόγω των περιορισμένων συνθηκών στις οποίες NE μπορεί πραγματικά να παρατηρηθεί , σπανίως αντιμετωπίζονται ως οδηγός για τη συμπεριφορά ημέρα με την ημέρα , ή που παρατηρούνται στην πράξη τα ανθρώπινα διαπραγματεύσεις . Ωστόσο , ως θεωρητική έννοια, στην [ [ οικονομικά ] ] και [ [ εξελικτική βιολογία ] ] , η ΒΑ έχει επεξηγηματική δύναμη . Το αποτέλεσμα στην οικονομία είναι η χρησιμότητα ( ή μερικές φορές τα χρήματα ) , και στην εξελικτική βιολογία μετάδοσης γονιδίων , και οι δύο είναι το βασικό συμπέρασμα της επιβίωσης . Οι ερευνητές που εφαρμόζουν Θεωρία Παιγνίων στους τομείς αυτούς ισχυρίζονται ότι οι στρατηγικές παραλείποντας να μεγιστοποιήσει αυτά για οποιονδήποτε λόγο θα αγωνιστεί από την αγορά ή το περιβάλλον , οι οποίες αποδίδονται τη δυνατότητα να δοκιμάσουν όλες τις στρατηγικές . Αυτό το συμπέρασμα συνάγεται από το " [ [ Nash ισορροπίας Σταθερότητας # | σταθερότητα ] ] " θεωρία παραπάνω .