Ισορροπία Νας: Διαφορά μεταξύ των αναθεωρήσεων

Περιεχόμενο που διαγράφηκε Περιεχόμενο που προστέθηκε
συντακτικές διορθώσεις
Διαγραφή τμήματος κειμένου που προήλθε πιθανότατα από αυτόματη μετάφραση Google και περιειχε παρα πολλα λάθη
Ετικέτες: μεγάλη αφαίρεση Οπτική επεξεργασία Επεξεργασία από κινητό Διαδικτυακή επεξεργασία από κινητό
Γραμμή 13:
== Ιστορία ==
Η Ισορροπία Nash πήρε το όνομά της απο τον [[Τζων Φορμπς Νας]]. Μια εκδοχή της έννοιας της Ισορροπίας Nash έγινε γνωστό ότι χρησιμοποιήθηκε για πρώτη φορά το 1838 από τον Antoine Augustin Cournot στη θεωρία του Oλιγοπωλίου. Κατά την θεωρία του Cournot οι επιχειρήσεις επιλέγουν την ποσότητα παραγωγής τους ώστε να μεγιστοποιήσουν το κέρδος τους. Ωστόσο, το μέγιστο κέρδος για μία επιχείρηση εξαρτάται από τις παραγωγές των άλλων επιχειρήσεων. Η ισορροπία Cournot εμφανίζεται όταν η παραγωγή κάθε επιχείρησης μεγιστοποιεί τα κέρδη της δεδομένων των παραγωγών των άλλων επιχειρήσεων, η οποία είναι μια γνήσιας στρατηγικής Ισορροπία Nash. Ο Cournot εισήγαγε επίσης την έννοια της Δυναμικής Βέλτιστης Απόκρισης στην ανάλυσή του για την ευστάθεια της ισορροπίας. Παρόλα αυτά, ο ορισμός της Ισορροπίας Nash είναι ευρύτερος από αυτόν του Cournot. Είναι επίσης ευρύτερος από τον ορισμό μιας κατά Pareto Ισορροπίας, καθώς η Ισορροπία Nash δεν κρίνει την βέλτιστη ή μη φύση της ισορροπίας η οποία δημιουργείται.
 
Το σύγχρονο παιχνίδι - θεωρητική έννοια της ισορροπίας Nash ορίζεται αντ 'αυτού από την άποψη της [ [ μικτή στρατηγική | μικτές στρατηγικές ] ] , όπου οι παίκτες επιλέγουν μια κατανομή πιθανοτήτων για πιθανές ενέργειες . Η έννοια της μικτής ισορροπίας Nash στρατηγικής εισήχθη από [ [ John von Neumann ] ] και [ [ Oskar Morgenstern ] ] το 1944 το βιβλίο του Η Θεωρία των Αγώνων και Οικονομικών Συμπεριφορά . Ωστόσο , η ανάλυσή τους περιορίζεται στην ειδική περίπτωση της [ [ μηδενικού αθροίσματος ] ] παιχνίδια . Έδειξαν ότι η μεικτή στρατηγική ισορροπία Nash θα υπάρχουν για κάθε παιχνίδι μηδενικού αθροίσματος με ένα πεπερασμένο σύνολο των δράσεων . Η συνεισφορά της [ [ John Forbes Nash , Jr ] ] το 1951 το άρθρο του μη συνεργάσιμες Αγώνες ήταν να καθοριστεί μια μικτή στρατηγική ισορροπία Nash για κάθε παιχνίδι με ένα πεπερασμένο σύνολο των ενεργειών και να αποδείξει ότι τουλάχιστον ένα ( μικτή στρατηγική ) Ισορροπία Nash πρέπει να υπάρχει σε ένα τέτοιο παιχνίδι .
 
Δεδομένου ότι η ανάπτυξη της έννοιας της ισορροπίας Nash , οι θεωρητικοί των παιγνίων έχουν ανακαλύψει ότι κάνει παραπλανητικές προβλέψεις ( ή παραλείπει να κάνει μια μοναδική πρόβλεψη ) σε ορισμένες περιπτώσεις . Ως εκ τούτου έχουν προταθεί πολλές σχετικές [ [ έννοιας λύση ] ] s ( που ονομάζεται επίσης « βελτιώσεις » της ισορροπίας Nash ) με στόχο να ξεπεραστεί η αντιληπτή ατέλειες στην έννοια Nash . Ένα ιδιαίτερα σημαντικό θέμα είναι ότι κάποια ισορροπία Nash μπορεί να βασίζεται σε απειλές που δεν είναι « [ η αξιοπιστία [ | αξιόπιστη ] ] ». Ως εκ τούτου , το 1965 [ [ Reinhard Selten ] ] προτεινόμενης [ [ subgame τέλεια ισορροπία ] ] ως φινέτσα που εξαλείφει ισορροπίες οι οποίες εξαρτώνται από την [ [ μη αξιόπιστες απειλές ] ] . Άλλες επεκτάσεις της έννοιας της ισορροπίας Nash έχουν ασχοληθεί με το τι θα συμβεί αν ένα παιχνίδι είναι [ [ Επαναλαμβανόμενη παιχνίδι | επανειλημμένες ] ] , ή τι θα συμβεί αν το παιχνίδι παίζεται στο [ [ Παγκόσμιο παιχνίδι | απουσία τέλεια πληροφόρηση ] ] . Ωστόσο , μεταγενέστερες τροποποιήσεις και επεκτάσεις του μεριδίου της έννοιας ισορροπίας Nash η κύρια εικόνα για το οποίο η έννοια Nash στηρίζεται : όλες οι έννοιες ισορροπίας αναλύει τις επιλογές που θα γίνουν όταν κάθε παίκτης λαμβάνει υπόψη τη διαδικασία λήψης αποφάσεων των άλλων .
Ορισμοί
Άτυπη ορισμό
 
Ανεπίσημα , ένα σύνολο στρατηγικών είναι μια ισορροπία του Nash , εάν κανένας παίκτης δεν μπορεί να κάνει καλύτερα από τον μονομερώς την αλλαγή του ή την στρατηγική της . Για να δούμε τι σημαίνει αυτό , φανταστείτε ότι κάθε παίκτης έχει πει τις στρατηγικές των άλλων . Ας υποθέσουμε τότε ότι κάθε παίκτης ο ίδιος ρωτά τον εαυτό του : " Γνωρίζοντας τις στρατηγικές των άλλων παικτών , και τη θεραπεία των στρατηγικών των άλλων παικτών , όπως ορίζεται στην πέτρα , μπορώ να επωφεληθούν από την αλλαγή της στρατηγικής μου; " [6]
Θεώρημα του Nash Ύπαρξη
 
Nash απέδειξε ότι αν επιτρέψουμε [η στρατηγική της [ ( θεωρία παιγνίων ) # Γνήσιες και μικτές στρατηγικές | μικτές στρατηγικές ] ] , στη συνέχεια, κάθε παιχνίδι με έναν πεπερασμένο αριθμό των παικτών στο οποίο κάθε παίκτης μπορεί να επιλέξει από πεπερασμένου πλήθους καθαρά στρατηγικές έχει τουλάχιστον μία ισορροπία Nash .
Παραδείγματα
Παιχνίδι Συντονισμού
 
{ { Κύρια | παιχνίδι Συντονισμού } }
 
{ | Align = right border = " 1 " cellpadding = " 4 " cellspacing = " 0 " style = " margin: 1em 1em 1em 1em ? Φόντου : # f9f9f9 ? Σύνορα : 1px # aaa στερεών ? Σύνορα - κατάρρευση : κατάρρευση ? Font- μέγεθος : 95 % ? "
 
ένα παιχνίδι του συντονισμού δείγμα που δείχνει σχετική πληρωμή για τον παίκτη 1 / 2 player με κάθε συνδυασμό
 
Παίκτης 2 υιοθετεί στρατηγική Α Παίκτης 2 υιοθετεί στρατηγική B - Παίκτης 1 υιοθετεί τη στρατηγική A
 
4 / 4
1 / 3
 
- Player 1 υιοθετεί τη στρατηγική B
 
3 / 1
2 / 2
 
- }
 
Ο συντονισμός παιχνίδι είναι ένα κλασικό ( [ [ συμμετρικό παιχνίδι | συμμετρικό ] ] ) δύο παικτών , δύο [η στρατηγική της [ ( θεωρία παιγνίων ) | στρατηγική ] ] παιχνίδι , με ένα παράδειγμα [ [ πληρωμή μήτρα ] ] φαίνεται στα δεξιά . Οι παίκτες θα πρέπει επομένως συντονίζει , τόσο την υιοθέτηση της στρατηγικής Α , για να λάβει την υψηλότερη πληρωμή ? Δηλαδή , 4 . Αν και οι δύο παίκτες επέλεξαν B στρατηγική όμως , εξακολουθεί να υπάρχει μια ισορροπία του Nash . Παρά το γεγονός ότι κάθε παίκτης κερδίζει λιγότερο από βέλτιστη πληρωμή , κανένας παίκτης δεν έχει κίνητρο για να αλλάξει τη στρατηγική λόγω της μείωσης στην άμεση πληρωμή ( 2-1 ) .
 
Ένα διάσημο παράδειγμα αυτού του τύπου παιχνίδι ονομαζόταν η [ [ ελάφι κυνήγι ] ] ? Στο παιχνίδι δύο παίκτες μπορούν να επιλέξουν να κυνηγούν ένα ελάφι ή ένα κουνέλι , ο πρώην παροχή περισσότερο κρέας ( 4 μονάδες χρησιμότητας ) σε σχέση με την τελευταία ( 1 μονάδα χρησιμότητας ) . Ο περιορισμός είναι ότι το ελάφι θα πρέπει να συνεργάζονται κυνήγι , έτσι ώστε αν κάποιος παίχτης προσπαθεί να κυνηγήσει το ελάφι , ενώ το άλλο κυνηγά το κουνέλι , θα αποτύχει στο κυνήγι ( 0 μονάδων χρησιμότητα ) , ενώ αν και οι δύο κυνηγούν αυτό που θα χωρίσει το ωφέλιμο φορτίο ( 2 , 2). Το παιχνίδι παρουσιάζει , ως εκ τούτου δύο ισορροπίες στο ( ελάφι , ελάφι ) και ( κουνέλι , κουνέλι) και ως εκ τούτου η βέλτιστη στρατηγική των παικτών εξαρτάται από την εμπιστοσύνη τους σε ό, τι ο άλλος παίκτης μπορεί να κάνει . Αν ένας κυνηγός ευελπιστεί ότι ο άλλος θα κυνηγήσουν το ελάφι , θα πρέπει να κυνηγήσουν το ελάφι ? Ωστόσο, εάν υποψιάζεται ότι ο άλλος θα κυνηγήσουν το κουνέλι , θα πρέπει να κυνηγήσουν το κουνέλι . Αυτό το παιχνίδι είχε χρησιμοποιηθεί ως μια αναλογία για την κοινωνική συνεργασία , δεδομένου ότι πολλά από τα οφέλη που οι άνθρωποι αποκτούν στην κοινωνία εξαρτάται από τους ανθρώπους συνεργάζονται και εμμέσως εμπιστεύονται ο ένας τον άλλο να ενεργούν κατά τρόπο αντίστοιχο με τη συνεργασία .
 
Ένα άλλο παράδειγμα ενός παιχνιδιού συντονισμού είναι το περιβάλλον όπου δύο τεχνολογίες που είναι διαθέσιμες σε δύο επιχειρήσεις με συμβατά προϊόντα, και θα πρέπει να εκλέξουν μια στρατηγική για να γίνει το πρότυπο της αγοράς . Αν και οι δύο εταιρείες συμφωνούν για την τεχνολογία που θα επιλεγεί , οι υψηλές πωλήσεις αναμένεται και για τις δύο εταιρείες . Εάν οι επιχειρήσεις δεν συμφωνούν σχετικά με τη βασική τεχνολογία , λίγα αποτέλεσμα των πωλήσεων . Και οι δύο στρατηγικές είναι ισορροπία Nash του παιχνιδιού .
 
Η οδήγηση σε ένα δρόμο εναντίον ενός επερχόμενου αυτοκινήτου , και έχουν να επιλέξουν είτε να ολισθαίνει στην αριστερή ή να ολισθαίνει στα δεξιά του δρόμου , είναι επίσης ένα παιχνίδι του συντονισμού . Για παράδειγμα, με απολαβές 10 σημαίνει ότι δεν υπάρχει συντριβή και 0 σημαίνει μια συντριβή , το παιχνίδι του συντονισμού μπορεί να οριστεί με τον ακόλουθο εξόφληση πίνακα :
 
{ | Align = αριστερά border = " 1 " cellpadding = " 4 " cellspacing = " 0 " style = " margin: 1em 1em 1em 1em ? Φόντου : # f9f9f9 ? Σύνορα : 1px # aaa στερεών ? Σύνορα - κατάρρευση : κατάρρευση ? Font- μέγεθος : 95 % "
 
Το παιχνίδι οδήγησης
 
Οδηγείτε στην αριστερή Οδηγούνται στην δεξιά - Οδηγείτε στην αριστερή 10 , 10 0 , 0 - Οδηγούνται στην δεξιά 0 , 0 10 , 10 - }
 
Σε αυτή την περίπτωση υπάρχουν δύο καθαρή στρατηγική ισορροπίας του Nash , όταν και οι δύο να επιλέξουν είτε να οδηγείτε στην αριστερή ή τη δεξιά . Αν παραδεχτούμε [ [ μικτή στρατηγική | μικτές στρατηγικές ] ] (όπου μια καθαρή στρατηγική που επιλέγεται τυχαία , υπόκεινται σε κάποια σταθερή πιθανότητα) , τότε υπάρχουν τρεις ισορροπίες Nash για την ίδια περίπτωση : δύο έχουμε δει από τη μορφή καθαρής στρατηγικής , όπου οι πιθανότητες είναι ( 0 % , 100 %) για έναν μόνο παίκτη , ( 0 % , 100 % ) για τον παίκτη δύο? και ( 100 % , 0 % ) για έναν μόνο παίκτη , ( 100 % , 0 % ) για τον παίκτη δύο αντίστοιχα . Προσθέτουμε άλλο, όπου οι πιθανότητες για κάθε παίκτη είναι (50 % , 50%) .
 
{ { Clear αριστερά } }
Δίλημμα φυλακισμένου
 
{ { Κύρια | δίλημμα φυλακισμένου } } { | Align = right border = " 1 " cellpadding = " 4 " cellspacing = " 0 " style = " margin: 1em 1em 1em 1em ? Φόντου : # f9f9f9 ? Σύνορα : 1px # aaa στερεών ? Σύνορα - κατάρρευση : κατάρρευση ? Font- μέγεθος : 95 % ? "
 
Παράδειγμα μήτρας εξόφληση PD
 
πεδίο = " col " style = " color: # 900 " | Συνεργασία ( με άλλους ) πεδίο = " col " style = " color: # 900 " | Ελάττωμα ( προδώσει άλλα ) - πεδίο = " γραμμή " style = " color: # 009 " | Συνεργασία ( με άλλους ) 4 , 4
 
0 < / span> 5 < /span>
-
πεδίο = " γραμμή " style = " color: # 009 " | Ελάττωμα ( προδώσει άλλα )
5 < / span> 0 </span>
3 , 3
}
 
Φανταστείτε δύο φυλακισμένων που κρατούνται σε ξεχωριστά κελιά , ανακρίνονται ταυτόχρονα , και προσφέρονται ευκαιρίες ( αναπτήρα φυλάκιση) για την προδοσία τους συναδέλφους ποινική τους. Μπορούν να «συνεργάζονται» ( με το άλλο κρατούμενο ), με το να μην snitching , ή "ελάττωμα " προδίδοντας την άλλη . Ωστόσο , υπάρχει μια παγίδα ? Αν και οι δύο παίκτες ελάττωμα , τότε και οι δύο εξυπηρετούν μια μεγαλύτερη ποινή από ό, τι αν δεν είπε τίποτα . Οι χαμηλότερες ποινές φυλάκισης που ερμηνεύεται ως υψηλότερες απολαβές (όπως φαίνεται στον πίνακα ) .
 
Το δίλημμα του φυλακισμένου έχει μια παρόμοια μήτρα όπως απεικονίζεται για το παιχνίδι του συντονισμού , αλλά η μέγιστη ανταμοιβή για κάθε παίκτη ( στην περίπτωση αυτή , 5 ) επιτυγχάνεται μόνο όταν οι αποφάσεις των παικτών είναι διαφορετικά . Κάθε παίκτης βελτιώνει την κατάστασή του, με τη μετάβαση από το " συνεργάζεται " με την " αποκάλυψη ", δεδομένου ότι η γνώση καλύτερη απόφαση του άλλου παίκτη είναι να « ελάττωμα ». Το δίλημμα του φυλακισμένου έχει έτσι ένα ενιαίο ισορροπία Nash : και οι δύο παίκτες επιλέγουν να αποστατήσουν .
 
Τι καιρό κάνει αυτό μια ενδιαφέρουσα περίπτωση για τη μελέτη είναι το γεγονός ότι αυτό το σενάριο είναι παγκοσμίως κατώτερα " τόσο για τους συνεργασθέντες . " Δηλαδή , οι δύο παίκτες θα είναι καλύτερα αν και οι δύο επέλεξαν να " συνεργαστούν ", αντί των δύο που επιλέγουν να αποστατήσουν . Ωστόσο , κάθε παίκτης θα μπορούσε να βελτιώσει την κατάστασή του, με το σπάσιμο της αμοιβαίας συνεργασίας , δεν έχει σημασία πόσο ο άλλος παίκτης ενδεχομένως ( ή σίγουρα) θα αλλάξει την απόφασή του .
Κυκλοφορίας Δίκτυο
 
{ { Δείτε επίσης | παράδοξο Braess του } } [7]
Παιχνίδι του ανταγωνισμού
 
{ | Align = right border = " 1 " cellpadding = " 1 " cellspacing = " 0 " style = " margin: 1em 1em 1em 1em ? Φόντου : # f9f9f9 ? Σύνορα : 1px # aaa στερεών ? Σύνορα - κατάρρευση : κατάρρευση ? Font- μέγεθος : 95 % ? "
 
Ένα παιχνίδι ανταγωνισμού
 
Player 2 επιλέγει '0 ' Player 2 επιλέγει '1 ' Player 2 επιλέγει '2 ' Player 2 επιλέγει '3 ' - Παίκτης 1 επιλέξει '0 '
 
0 , 0
2 , -2
2 , -2
2 , -2
 
- Παίκτης 1 επιλέξει '1 '
 
-2 , 2
1 , 1
3 , -1
3 , -1
 
- Παίκτης 1 επιλέξει '2 '
 
-2 , 2
-1 , 3
2 , 2
4 , 0
 
- Παίκτης 1 επιλέξει '3 '
 
-2 , 2
-1 , 3
0 , 4
3 , 3
 
- }
 
Αυτό μπορεί να απεικονιστεί με ένα παιχνίδι δύο παικτών, στο οποίο οι δύο παίκτες επιλέγουν ταυτόχρονα ένας ακέραιος 0-3 και οι δύο να κερδίσει το μικρότερο από τους δύο αριθμούς στα σημεία . Επιπλέον, εάν ένας παίκτης επιλέγει ένα μεγαλύτερο αριθμό από το άλλο , τότε αυτός / αυτή έχει να δώσει μέχρι και δύο σημεία στο άλλο .
 
Αυτό το παιχνίδι έχει μια μοναδική καθαρής στρατηγικής ισορροπίας Nash : και οι δύο παίκτες επιλέγουν 0 ( επισημαίνονται με κόκκινο φως ) . Οποιαδήποτε άλλη στρατηγική μπορεί να βελτιωθεί από έναν παίκτη μεταγωγής αριθμό του σε ένα μικρότερο από εκείνο του άλλου παίκτη. Στον πίνακα στα δεξιά , αν το παιχνίδι ξεκινά από την πράσινη πλατεία , είναι προς το συμφέρον παίκτης 1 να κινηθεί προς το πορφυρό τετράγωνο και είναι προς το συμφέρον παίκτη 2 να κινηθεί προς το μπλε τετράγωνο . Αν και δεν θα ταίριαζε με τον ορισμό ενός παιχνιδιού του ανταγωνισμού , αν το παιχνίδι έχει τροποποιηθεί έτσι ώστε οι δύο παίκτες να κερδίσει το όνομα ποσό, αν και οι δύο επιλέξουν τον ίδιο αριθμό , και με άλλο τρόπο να κερδίσει τίποτα , τότε υπάρχουν 4 ισορροπίες Nash : ( 0,0 ) , (1,1 ) , (2,2 ) , και (3,3 ) .
Ισορροπία Nash σε μια πληρωμή μήτρα
 
Υπάρχει ένας εύκολος αριθμητική τρόπος για τον εντοπισμό σημείων ισορροπίας Nash σε μια πληρωμή μήτρα . Είναι ιδιαίτερα χρήσιμο σε δύο άτομα, παιχνίδια όπου οι παίκτες έχουν περισσότερα από δύο στρατηγικές . Στην περίπτωση αυτή, τυπική ανάλυση μπορεί να γίνει πάρα πολύ καιρό . Ο κανόνας αυτός δεν ισχύει για την περίπτωση που μικτή ( στοχαστική ) στρατηγικές είναι ενδιαφέρον . Ο κανόνας έχει ως εξής : αν ο πρώτος αριθμός εξόφληση , στο ζεύγος εξόφληση του κυττάρου, είναι το μέγιστο της στήλης του στοιχείου και αν ο δεύτερος αριθμός είναι το μέγιστο της γραμμής του κυττάρου - τότε το κύτταρο αντιπροσωπεύει Nash ισορροπία.
 
{ | Align = "left " border = " 1 " cellpadding = " 4 " cellspacing = " 0 " style = " margin: 1em ? Υπόβαθρο: # f9f9f9 ? Σύνορα : 1px # aaa στερεών ? Σύνορα - κατάρρευση : κατάρρευση ? Font-size : 95 % ? "
 
Η εξόφληση μήτρα - ισορροπία Nash με έντονους
 
Επιλογή Α Επιλογή Β Επιλογή Γ - Επιλογή Α 0 , 0
 
'25 , 40 '
5 , 10
-
Επιλογή Β
'40 , 25 '
0 , 0
5 , 15
-
Επιλογή Γ
10 , 5
15 , 5
'10 , 10 '
-
}
 
Μπορούμε να εφαρμόσουμε αυτόν τον κανόνα σε ένα 3 × 3 πίνακα :
 
Χρησιμοποιώντας τον κανόνα , μπορούμε πολύ γρήγορα ( πολύ πιο γρήγορα από ό, τι με την τυπική ανάλυση ) βλέπουμε ότι οι ισορροπίες Nash κύτταρα ( Β , Α ) , ( Α, Β ) και ( C , C ) . Πράγματι, για το κελί (Β , Α) 40 είναι το μέγιστο της πρώτης στήλης και 25 είναι το μέγιστο της δεύτερης σειράς . Για ( Α, Β) 25 είναι το μέγιστο της δεύτερης στήλης και 40 είναι το μέγιστο της πρώτης σειράς . Ίδιο για το κελί ( Γ, Γ ) . Για άλλα κύτταρα , είτε το ένα ή και τα δύο από τα μέλη duplet δεν είναι το μέγιστο των αντίστοιχων γραμμών και στηλών.
 
Αυτό είπε , η πραγματική μηχανική για την εξεύρεση κυττάρων ισορροπίας είναι προφανής : να βρείτε το μέγιστο μιας στήλης και ελέγξτε αν το δεύτερο μέλος του ζεύγους είναι το μέγιστο της γραμμής . Εάν πληρούνται αυτές οι προϋποθέσεις , το κύτταρο αντιπροσωπεύει μια ισορροπία Nash . Δείτε όλες τις στήλες με αυτόν τον τρόπο να βρείτε όλα τα ΒΑ κύτταρα . Ένας n × n πίνακας μπορεί να έχουν μεταξύ 0 και N × N [ [η στρατηγική της καθαρής ] ] ισορροπία Nash .
 
Σταθερότητα == == Η έννοια του [[ θεωρίας Σταθερότητας | σταθερότητα ] ] , είναι χρήσιμα στην ανάλυση των πολλών ειδών ισορροπιών , μπορεί επίσης να εφαρμοστεί σε ισορροπία Nash .
 
Μια ισορροπία Nash για ένα μικτό παιχνίδι στρατηγικής είναι σταθερή , αν μια μικρή αλλαγή ( συγκεκριμένα , μια απειροελάχιστη μεταβολή) σε πιθανότητες για έναν παίκτη οδηγεί σε μια κατάσταση όπου κατέχουν δύο προϋποθέσεις :
 
Ο παίκτης που δεν έχει αλλάξει δεν έχει καλύτερη στρατηγική στη νέα περίσταση
Ο παίκτης που έκανε την αλλαγή τώρα παίζει με ένα αυστηρά χειρότερη στρατηγική.
 
Αν αυτές οι περιπτώσεις και οι δύο προϋποθέσεις, τότε ο παίκτης με την μικρή αλλαγή στο μικτής στρατηγικής του θα επιστρέψει αμέσως στην ισορροπία Nash . Η ισορροπία λέγεται ότι είναι σταθερή. Εάν κάποιος όρος δεν ισχύει , τότε η ισορροπία είναι ασταθής . Εάν υπάρχει μόνο μία συνθήκη ισχύει τότε είναι πιθανό να είναι ένας άπειρος αριθμός των βέλτιστων στρατηγικών για τον παίκτη που άλλαξε . [ [ John Forbes Nash | John Nash ] ] έδειξε ότι η τελευταία κατάσταση δεν θα μπορούσαν να προκύψουν σε μια σειρά από σαφώς καθορισμένα παιχνίδια .
 
Στο " παιχνίδι οδήγησης " παραπάνω παράδειγμα υπάρχουν δύο σταθερά και ασταθή ισορροπία . Η ισορροπία που αφορούν μικτών στρατηγικών με 100 % πιθανότητες είναι σταθερές . Εάν κάποιος παίκτης αλλάζει τις πιθανότητες του ελαφρώς , θα είναι τόσο σε μειονεκτική θέση , και ο αντίπαλός του θα έχουν κανένα λόγο να αλλάξει τη στρατηγική του στη σειρά . Η (50 % , 50%) ισορροπία είναι ασταθής . Εάν κάποιος παίκτης αλλάζει τις πιθανότητες του, τότε ο άλλος παίκτης έχει αμέσως μια καλύτερη στρατηγική είτε σε ( 0 % , 100 %) ή ( 100 % , 0 % ) .
 
Η σταθερότητα είναι ζωτικής σημασίας για τις πρακτικές εφαρμογές των ισορροπιών Nash , δεδομένου ότι η μεικτή στρατηγική του κάθε παίκτη δεν είναι απολύτως γνωστός , αλλά πρέπει να συναχθεί από την στατιστική κατανομή των ενεργειών του στο παιχνίδι . Στην περίπτωση αυτή, ασταθή ισορροπία είναι πολύ πιθανό να ανακύψουν στην πράξη , δεδομένου ότι κάθε λεπτό αλλαγή στις αναλογίες δει κάθε στρατηγική θα οδηγήσει σε μια αλλαγή στρατηγικής και την κατανομή της ισορροπίας .
 
Η ισορροπία Nash ορίζει τη σταθερότητα μόνο από την άποψη της μονομερούς αποκλίσεις . Σε παιχνίδια συνεργασίας μια τέτοια έννοια δεν είναι αρκετά πειστική . [ [ Ισχυρή ισορροπία Nash ] ] επιτρέπει παρεκκλίσεις από κάθε πιθανό συνασπισμό [8] Τυπικά, ένας . [ [ ισχυρή ισορροπία Nash ] ] είναι μια ισορροπία Nash στην οποία δεν συνασπισμό , λαμβάνοντας τις ενέργειες των συμπληρωμάτων του, όπως δίνεται , μπορεί να αποκλίνουν σε συνεργασία με έναν τρόπο που ωφελεί όλα τα μέλη της [9] Ωστόσο , η ισχυρή αντίληψη Nash είναι μερικές φορές θεωρείται ως πολύ " ισχυρή" το ότι το περιβάλλον επιτρέπει την απεριόριστη ιδιωτική επικοινωνία . . Στην πραγματικότητα , η ισχυρή ισορροπία Nash πρέπει να είναι [ [ Pareto αποτελεσματική ] ] . Ως αποτέλεσμα αυτών των απαιτήσεων , ισχυρή Nash είναι υπερβολικά σπάνιο να είναι χρήσιμο σε πολλούς κλάδους της θεωρίας παιγνίων. Ωστόσο , σε παιχνίδια όπως οι εκλογές με πολλούς περισσότερους παίκτες από ό, τι πιθανά αποτελέσματα , μπορεί να είναι πιο συχνές από ό, τι μια σταθερή ισορροπία .
 
Μια εκλεπτυσμένη ισορροπία Nash είναι γνωστή ως [ [ συνασπισμού -απόδειξη ισορροπίας Nash ] ] ( CPNE ) [8] συμβαίνει όταν οι παίκτες δεν μπορούν να κάνουν καλύτερα, ακόμη και αν έχουν τη δυνατότητα να επικοινωνούν και να "αυτο - επιβολή « συμφωνία να αποκλίνει . Κάθε συσχετιζόμενων στρατηγική που υποστηρίζεται από [ Κυριαρχία [ ( θεωρία παιγνίων ) | επαναλαμβάνεται αυστηρή κυριαρχία ] ] και η [ [ Pareto σύνορα ] ] είναι ένα CPNE [10] Περαιτέρω, είναι δυνατόν για ένα παιχνίδι να έχει μια ισορροπία Nash που είναι ανθεκτικά έναντι συνασπισμούς λιγότερο από ένα συγκεκριμένο μέγεθος , k. CPNE σχετίζεται με την [ [Πυρήνας ( Οικονομικά) | θεωρία του πυρήνα ] ] .
 
Τέλος, στη δεκαετία του ογδόντα , κτίριο με μεγάλο βάθος για τέτοιες ιδέες [ [ Mertens - σταθερές ισορροπίες ] ] εισήχθησαν ως [ [ έννοιας λύση ] ] . Mertens σταθερή ισορροπία ικανοποιεί και τα δύο [ [ εμπρός επαγωγή ] ] και [ [ πίσω επαγωγή ] ] . Σε μια [ [ θεωρία παιγνίων ] ] το περιβάλλον [ [ σταθερή ισορροπίες ] ] τώρα συνήθως αναφέρονται σε Mertens σταθερή ισορροπία .
Εμφανίσεων
 
Αν ένα παιχνίδι έχει μια [ [ μοναδικό ] ] ισορροπία Nash και παίζεται μεταξύ των παικτών , υπό ορισμένες προϋποθέσεις , τότε η ΒΑ σύνολο στρατηγική θα πρέπει να ληφθούν. Επαρκείς συνθήκες για να εξασφαλιστεί ότι η ισορροπία Nash παίζεται είναι :
 
#Οι παίκτες όλοι θα κάνουν κάθε δυνατή προσπάθεια για να μεγιστοποιήσουν την αναμενόμενη πληρωμή τους, όπως περιγράφεται από το παιχνίδι .
#Οι παίκτες άψογη εκτέλεση.
#Οι παίκτες έχουν αρκετή νοημοσύνη για να συναγάγει τη λύση .
#Οι παίκτες γνωρίζουν την προγραμματισμένη στρατηγική ισορροπία όλων των άλλων παικτών .
#Οι παίκτες πιστεύουν ότι μια απόκλιση στη δική της στρατηγική τους δεν θα προκαλέσουν αποκλίσεις από άλλους παίκτες .
#Υπάρχει [ [ κοινή γνώση ( λογική ) | κοινή γνώση ] ] ότι όλοι οι παίκτες πληρούν τις προϋποθέσεις αυτές , συμπεριλαμβανομένου αυτού. Έτσι , όχι μόνο θα πρέπει κάθε παίκτης γνωρίζει τους άλλους παίκτες πληρούν τις προϋποθέσεις , αλλά πρέπει να ξέρουν ότι όλοι ξέρουν ότι θα τους συναντήσει , και να ξέρετε ότι ξέρουν ότι ξέρουν ότι θα τους συναντήσει , και ούτω καθεξής .
 
Όταν δεν πληρούνται οι προϋποθέσεις
 
Παραδείγματα [ [ θεωρία παιγνίων ] ] προβλημάτων στα οποία δεν πληρούνται οι ακόλουθοι όροι:
 
Η πρώτη προϋπόθεση δεν πληρούται , αν το παιχνίδι δεν περιγράφει σωστά τις ποσότητες που ένας παίκτης επιθυμεί να μεγιστοποιήσει . Σε αυτή την περίπτωση, δεν υπάρχει ιδιαίτερος λόγος για αυτόν τον παίκτη να υιοθετήσει μια στρατηγική ισορροπία . Για παράδειγμα , το δίλημμα του φυλακισμένου δεν είναι ένα δίλημμα εάν είτε παίκτης είναι στην ευχάριστη θέση να φυλακιστεί επ 'αόριστον .
Εκούσια ή ακούσια ατέλεια κατά την εκτέλεση . Για παράδειγμα , ένας υπολογιστής μπορεί να άψογη λογική παιχνιδιού αντιμετωπίζει ένα δεύτερο άψογη υπολογιστή θα οδηγήσει σε ισορροπία . Εισαγωγή της ατέλειας θα οδηγήσει σε διακοπή της, είτε μέσω της απώλειας του παίκτη που κάνει το λάθος , ή μέσω άρνησης της [ [ κοινή γνώση ( λογική ) | κοινή γνώση ] ] κριτήριο οδηγώντας σε πιθανή νίκη για τον παίκτη . ( Ένα παράδειγμα θα ήταν ένας παίκτης ξαφνικά βάζοντας το αυτοκίνητο προς τα πίσω στο [ παιχνίδι [ κοτόπουλο ] ] , εξασφαλίζοντας μια μη- απώλεια no- win σενάριο ) .
Σε πολλές περιπτώσεις , η τρίτη προϋπόθεση αυτή δεν πληρούται , διότι , ακόμη και αν η ισορροπία πρέπει να υπάρχει , είναι άγνωστη, λόγω της πολυπλοκότητας του παιχνιδιού , για παράδειγμα, στο [ [ κινέζικο σκάκι ] ] [11] Ή , αν είναι γνωστή , μπορεί να μην είναι γνωστό σε όλους τους παίκτες , όπως όταν παίζει [ [ tic - tac - toe ] ] με ένα μικρό παιδί που θέλει απεγνωσμένα . για να κερδίσει ( που πληρούν τα άλλα κριτήρια ) .
Το κριτήριο της κοινής γνώσης δεν μπορεί να εκπληρωθεί ακόμη και αν όλοι οι παίκτες κάνουν , στην πραγματικότητα , πληρούν όλα τα άλλα κριτήρια . Οι παίκτες κακώς distrusting ορθολογισμού του άλλου μπορεί να θεσπίσει στρατηγικές για να αναμένεται παράλογη παιχνίδι για λογαριασμό των αντιπάλων τους . Αυτή είναι μια σημαντική εκτίμηση σε " [ [ Game του κοτόπουλου | κοτόπουλου ] ] " ή [ [ κούρσα εξοπλισμών ] ] , για παράδειγμα.
 
Εφόσον πληρούνται οι προϋποθέσεις
 
Λόγω των περιορισμένων συνθηκών στις οποίες NE μπορεί πραγματικά να παρατηρηθεί , σπανίως αντιμετωπίζονται ως οδηγός για τη συμπεριφορά ημέρα με την ημέρα , ή που παρατηρούνται στην πράξη τα ανθρώπινα διαπραγματεύσεις . Ωστόσο , ως θεωρητική έννοια, στην [ [ οικονομικά ] ] και [ [ εξελικτική βιολογία ] ] , η ΒΑ έχει επεξηγηματική δύναμη . Το αποτέλεσμα στην οικονομία είναι η χρησιμότητα ( ή μερικές φορές τα χρήματα ) , και στην εξελικτική βιολογία μετάδοσης γονιδίων , και οι δύο είναι το βασικό συμπέρασμα της επιβίωσης . Οι ερευνητές που εφαρμόζουν Θεωρία Παιγνίων στους τομείς αυτούς ισχυρίζονται ότι οι στρατηγικές παραλείποντας να μεγιστοποιήσει αυτά για οποιονδήποτε λόγο θα αγωνιστεί από την αγορά ή το περιβάλλον , οι οποίες αποδίδονται τη δυνατότητα να δοκιμάσουν όλες τις στρατηγικές . Αυτό το συμπέρασμα συνάγεται από το " [ [ Nash ισορροπίας Σταθερότητας # | σταθερότητα ] ] " θεωρία παραπάνω .
 
 
{{ενσωμάτωση κειμένου|en|Nash equilibrium}}