Δίλημμα του φυλακισμένου: Διαφορά μεταξύ των αναθεωρήσεων

Περιεχόμενο που διαγράφηκε Περιεχόμενο που προστέθηκε
Caramella1 (συζήτηση | συνεισφορές)
μ Έβαλα bullets στους όρους του παιχνιδιού, γιατί ήταν όλοι σε μια συνεχόμενη πρόταση χωρίς κόμμα.
MarMihalis (συζήτηση | συνεισφορές)
Λεπτομερής λογική ανάλυση της επιλογής των φυλακισμένων και συσχετισμός με τις συγχρονες στάσεις ζωής και τις οικονομικές θεωρίες
Γραμμή 13:
Θυμίζουμε ότι «ορθολογισμός» για τους ειδικούς αυτού του μοντέλου είναι να κοιτάει ο καθένας το συμφέρον του, δηλαδή είτε το μέγιστο όφελος είτε την μικρότερη ζημιά του, λαμβάνοντας υπόψη του ότι και ο άλλος (ο «αντίπαλος»…) θα κάνει το ίδιο. Σύμφωνα λοιπόν με την θεωρία, ο κάθε κρατούμενους, ας πούμε ο Α και ο Β, έχει τις πιο κάτω επιλογές:
 
Με δεδομένο οτι οι κανόνες είναι κοινοι και για τους δύο θεωρούμε οτι και οι δύο κάνουν τις ίδιες λογικές σκέψεις.
Eπειδή ο Α δεν μπορεί να εμπιστευτεί «λογικά σκεπτόμενος» τον Β ότι θα κρατήσει το στόμα του κλειστό (οπότε, κρατώντας κι αυτός το δικό του, «κερδίζει» την μικρότερη ποινή), καρφώνει. Eπειδή και ο Β απ’ την μεριά του κάνει τις ίδιες σκέψεις και τους ίδιους υπολογισμούς, καρφώνει επίσης. Kατά την θεωρία παιγνίων η ευτυχής (και πλήρως ορθολογική κατάληξη) του διλήμματος είναι οτι γίνονται ο ένας ρουφιάνος του άλλου και τρώνε από 4 χρόνια φυλακή.
 
''Σκέψη του Α:''
 
"Εάν ο Β με καρφώσει τότε τι πρέπει να κάνω; Στην περίπτωση που δεν τον καρφώσω τότε εμπίπτω στον 1ο κανόνα απο αυτούς που μας έθεσαν, ώντας ο ένοχος και θα φυλακιστώ για 12 χρόνια, ενώ αν τον καρφώσω εμπίπτουμε και οι δύο στον 3ο κανόνα και θα φυλακιστώ για 4. Με συμφέρει λοιπόν να τον καρφώσω"
 
...
 
" Εάν ο Β δεν με καρφώσει τότε τι πρέπει να κάνω;Στην περίπτωση που τον καρφώσω τότε εμπίπτω στον 1ο κανόνα ώς αθώος θα ελευθερωθώ, ώντας ο αθώος που συνεργάστηκε, ενώ αν δεν τον καρφώσω εμπίπτουμε και οι δύο στον δευτερο κανόνα και θα φυλακιστούμες και οι δυο 1 χρόνο.Πάλι με συμφέρει να τον καρφώσω"
 
Με αυτές τι λογικές σκέψεις του ο Α ώς [[:en:Homo_economicus|homo economicus]] που ενδιαφέρεται πάντα για το μεγαλύτερο για αυτόν όφελος (σε αντίθεση με τον h[[:en:Homo_reciprocans|omo reciprocan]] που κίνητρο του αποτελεί το κοινό όφελος με το περιβάλλον του), αποφασίζει να καρφώσει τον Β διότι τον συμφέρει και στις δύο περιπτώσεις.
 
Ωστόσο και για τον Β ισχύουν οι ίδιοι κανόνες με συνέπεια να καρφώσει και αυτός τον Α.
 
Προβλέπουμε λοιπόν οτι απο αυτήν τη διαδικασία και οι δύο ορθολογικοί ανθρωποι που θέλουν το άμεσο ατομικό τους συμφέρον θα τιμωρηθούν με 4 χρόνια. Αν συνυπολόγιζαν και το όφελος του συνκατηγορούμενού τους ώς δικό τους όφελος τότε θα έβγαζαν το συμπέρασμα ότι το μεγαλύτερο όφελος πρέπει να λογίζεται ώς συνολικό και είναι τα 2 χρόνια φυλάκισης (1 ο καθένας), σε σχέση με τα 12 χρόνια (12 ο ένας και 0 ο άλλος) αλλά και τα 8 χρόνια (απο 4 ο καθένας). Με αυτό στο μυαλό εάν και οι δύο ήταν homo reciprocan, τότε η στρατηγική συνεργασίας τους θα ήταν να μην καρφώσει ο ένας τον άλλο και να λάβουν ποινή απο 1 χρόνο ο καθένας. Μέρος ευθύνης της αστοχίας ορισμένων βραβευμένων κατα τ'άλλα οικονομικών θεωριών, οφείλεται στο οτι θεωρείται ώς rational individual (λογικός άνθρωπος) ο homo economicus και οι θεωρίες αυτές μόνο σε αυτή τη βάση αναπτύσσονται. Απο την παραπάνω θεωρηση αποδεικνύεται οτι η συνεργασία με τις αμοιβαία εποφελείς στρατηγικές είναι πολλές φορές πιο δόκιμη από την επιδείωξη για άμεσο ατομικό όφελος (1 χρόνος ποινή αντί 4 χρόνια).
 
Πρέπει να πούμε ότι σε αυτό το παράδειγμα, όπως και σε κάθε κατάσταση (παίγνιο) της θεωρίας παιγνίων (Game Theory), υποθέτουμε ότι οι εμπλεκόμενοι (οι παίκτες) είναι απόλυτα λογικοί και έχουν ως αποκλειστικό γνώμονα τη μεγιστοποίηση του κέρδους ή την ελαχιστοποίηση του κόστους (όπως σε αυτή την περίπτωση). Θα περίμενε ίσως κάποιος ότι δύο λογικοί άνθρωποι θα επέλεγαν το βέλτιστο δυνατό αποτέλεσμα που θα συνέφερε και τους δύο περισσότερο από αυτό που τελικά κατάφεραν, δηλαδή, να κρατήσουν και οι δύο τη σιωπή τους και να πάνε στη φυλακή με μια ποινή μόνο ενός έτους. Πώς κατέληξαν λοιπόν εδώ τα πράγματα; Η απάντηση βρίσκεται στην εμπιστοσύνη που δείχνει ο ένας στην απόφαση του άλλου. Με άλλα λόγια, με δεδομένη κάθε επιλογή του αντίπαλου παίκτη, το αποτέλεσμα του ανταγωνισμού επικρατεί έναντι του αποτελέσματος της συνεργασίας.
 
Το παραπάνω παράδειγμα καταδεικνύει ότι το «κοινό συμφέρον» δεν είναι πάντα η επιλογή απόλυτα λογικά σκεπτόμενων ατόμων και πολλές φορές απόλυτα λογικά επιλογές μπορούν να οδηγήσουν σε ζημία για όλους τους εμπλεκόμενους. Η κατάσταση αλλάζει αν το παιχνίδι επαναλαμβάνεται, οπότε κάθε παίκτης έχει τη δυνατότητα να «τιμωρήσει» μέσω της επιλογής του τον άλλο παίκτη για την προηγούμενη παρασπονδία του. Σε αυτή την περίπτωση, όταν οι επαναλήψεις του παιγνίου τείνουν στο άπειρο, η επιλογή της συνεργασίας (να κρατήσουν και οι δύο τη σιωπή τους) τείνει στο να επικρατήσει.
 
Η βέλτιστη στρατηγική για κάποιον παίχτη είναι να κρατήσει το στόμα του κλειστό στον πρώτο γύρο και στην συνέχεια να επαναλαμβάνει αυτό που έκανε ο άλλος παίχτης στον προηγούμενο γύρο. Η στρατηγική αυτή επικράτησε ώς καλύτερη, σε round-robin διαγωνισμό επινοήθηκε απο τον Anatol Rapoport, αποκαλείται TIT FOR TAT και αποδεικνύεται με [[Γενετικοί Αλγόριθμοι|γενετικούς αλγόριθμους]].
 
Μεταφέροντας το παράδειγμα στην καθημερινή ζωή μπορούμε να βγάλουμε πολύ χρήσιμα συμπεράσματα για πράγματα που φαίνονται λογικό να γίνουν αλλά τελικά επιλέγεται κάτι διαφορετικό που οδηγεί σε χειρότερα αποτελέσματα.