Θεωρία παιγνίων: Ο φίλαθλος του Τζον Νας
21/08/2023Στην σκιά του αγώνα των εξοπλισμών, η RAND διευρύνει συνεχώς το δυναμικό της, προσλαμβάνοντας συμβούλους που προέρχονται από τα μεγαλύτερα ιδρύματα θετικών επιστημών της χώρας. Στα τέλη της δεκαετίας του 1940, η RAND έρχεται σε επαφή με τον μόλις 22 ετών λαμπρό μαθηματικό, Τζον Νας (John Nash, γνωστό στο ευρύ κοινό από την κινηματογραφική ταινία με τίτλο “A Beautiful Mind”, με πρωταγωνιστή τον διάσημο ηθοποιό Ράσελ Κρόου), που κατέχει ήδη την έδρα Μαθηματικών στο Πανεπιστήμιο ΜΙΤ της Βοστώνης.
Όπως και ο φον Νόιμαν, ο Νας προτιμά να συνεργασθεί ως εξωτερικός σύμβουλος, διατηρώντας παράλληλα την πανεπιστημιακή του έδρα στην Βοστώνη, αναλαμβάνοντας την επεξεργασία διάφορων περίπλοκων προβλημάτων της θεωρίας παιγνίων, που ήδη κυριαρχεί στις έρευνες του οργανισμού. Η μεγάλη προσφορά του Νας στην RAND και συνεπακόλουθα στην αμερικανική στρατηγική, προέρχεται από την επινόηση των παιγνιδιών με μη μηδενικό συνολικό αποτέλεσμα.
Σ’ αυτά, τα κέρδη της μίας πλευράς είναι μεγαλύτερα από τις ζημίες της άλλης, επεκτείνοντας την θεωρία παιγνίων σε κυριολεκτικά αχαρτογράφητους χώρους. Με το αξίωμα μεγίστων-ελαχίστων ο φον Νόιμαν πλήττει ανεπανόρθωτα την ορθολογική σκέψη της εποχής, αποδεικνύοντας πως δύο παίκτες με εντελώς αντίθετα συμφέροντα είναι δυνατόν να επιλέξουν λογικά μία τακτική δράσης που να υιοθετείται και από τους δύο, υπό τον όρο ότι την ακολουθούν υπό την πίεση των αναγκών.
Αυτή η λογική λύση ενός παιγνιδιού με μηδενικό συνολικό αποτέλεσμα, δίδει ένα σημείο ισορροπίας, το οποίο είναι ιδιαίτερα ισχυρό, καθώς η κάθε πλευρά διακατέχεται αφενός από ιδιοτέλεια για τα συμφέροντά της, αφετέρου από έλλειψη εμπιστοσύνης προς την άλλη, με συνέπεια να προκύπτει μία λύση όπου η μόνη ικανοποιητική διέξοδος είναι η ισοκατανομή.
Ο Νας επεκτείνει τη θεωρία παιγνίων, αποδεικνύοντας ότι και σε παιχνίδια με μη μηδενικό συνολικό αποτέλεσμα υπάρχει σημείο ισορροπίας. Σε αυτά τα παιχνίδια, όταν τα συμφέροντα των δύο παικτών δεν είναι εντελώς αντίθετα, οι ενέργειές τους μεγιστοποιούν το κοινό όφελος, με την επιλογή της λογικής λύσης, η οποία προκύπτει και σχετικά ευκολότερα.
Ο παθιασμένος φίλαθλος
Ο πυρήνας της ανάλυσης του λαμπρού μαθηματικού είναι γοητευτικά απλός και η απλούστερη μεταφορά του είναι το παιχνίδι που αποκαλείται “ποδοσφαιρόφιλος” (όπου το πρότυπο είναι το αμερικανικό ποδόσφαιρο, το γνωστό ράγκμπι). Το κεντρικό πρόσωπο του παιχνιδιού είναι ο συνηθισμένος φίλαθλος της Δευτέρας που, απογοητευμένος από την ήττα της αγαπημένης του ομάδας την αμέσως προηγούμενη ημέρα (Κυριακή), σπεύδει να υποκαταστήσει θεωρητικά τον αποτυχημένο κατά την άποψή του προπονητή της. Και εξηγεί πώς ο ίδιος, ως προπονητής, με μία άλλη τακτική, είναι ικανός να προσφέρει την νίκη στην ομάδα του.
Η ανάλυση είναι φαινομενικά σωστή, με την προϋπόθεση ότι ο προπονητής της αντίπαλης ομάδας ακολουθεί την προηγούμενη νικηφόρα τακτική του, χωρίς μεταβολές, ώστε να καρποφορήσει η εναλλακτική λύση που προτείνεται από τον εξοργισμένο φίλαθλο.
Όμως, όπως είναι φυσικά ευνόητο, η αλλαγή τακτικής της μίας πλευράς, συνεπάγεται σχεδόν αυτόματα και την αλλαγή στάσης της άλλης, ώστε να αντιδράσει αποτελεσματικά στην νέα πρόκληση, στοιχείο που οδηγεί ουσιαστικά το παιχνίδι στον αρχικό του κύκλο.
Η προσέγγιση του Νας σε καταστάσεις αντιπαραθέσεων υπερτονίζει τα λεγόμενα σημεία ισορροπίας, δηλαδή τις λύσεις που ικανοποιούν και τους δύο παίκτες. Ας υποθέσουμε ότι μετά τον αγώνα ερωτηθούν κατά σειράν οι δύο προπονητές ως προς το εάν και κατά πόσον είναι ικανοποιημένοι από τις αποδόσεις των ομάδων τους. Ή κάθε προπονητής ερωτηθεί εάν προτιμά εκ των υστέρων να προκρίνει κάποια αλλαγή τακτικής, με βάση την τακτική που ακολουθεί ο αντίπαλός του. Εάν απορρίψει αυτή την επιλογή της αλλαγής τακτικής, τότε η πρώτη απάντηση (ότι είναι ικανοποιημένος από την τακτική) δίδει το σημείο ισορροπίας στο παιχνίδι.
Τα οφέλη των δύο πλευρών
Στον παρατιθέμενο πίνακα εμφανίζονται με αριθμητικές τιμές τα οφέλη των δύο πλευρών σε κάθε περίπτωση, ανάλογα με τις επιλογές τους. Απεικονίζεται απλοποιημένη η σκέψη του Νας, όπου οι αριθμητικές τιμές χρησιμοποιούνται για να τονίσουν άμεσα την ανισότητα των ωφελειών των δύο παικτών σε κάθε μία από τις πιθανές τέσσερις επιλογές τους. Η λύση με σημείο ισορροπίας είναι το κελί κάτω δεξιά, όπου η στρατηγική 2, προσφέρει στον παίκτη Α’ όφελος πέντε και στον παίκτη Β’ δύο.
Αντίθετα, απορρίπτονται οι λύσεις των κελιών επάνω δεξιά και κάτω αριστερά, όπου στην πρώτη περίπτωση ο παίκτης Α έχει μηδενικά οφέλη με τη στρατηγική 1 (ο παίκτης Β μόνον όφελος με τη στρατηγική 2), ενώ στη δεύτερη ο παίκτης Β έχει όφελος μηδέν με τη στρατηγική 1 (ο παίκτης Α κερδίζει δύο με τη στρατηγική 2). Για τον παίκτη Β, η καλύτερη επιλογή είναι το κελί επάνω αριστερά, όπου τα κέρδη του είναι 100 φορές περισσότερα από τα ανάλογα του παίκτη Α, πλην όμως η επιλογή αυτή είναι εξωπραγματική, καθώς σε καμία περίπτωση η άλλη πλευρά δεν πρόκειται να επιτρέψει να μεγιστοποιηθούν τα κέρδη του αντιπάλου της σε αυτό το βαθμό.
“Κλειδί” το σημείο ισορροπίας
Επιπλέον ο Νας στοιχειοθετεί λογικά πως, ανεξάρτητα των αρχικών επιλογών στρατηγικής, ο κάθε παίκτης είναι δυνατόν να τη μεταβάλλει όποτε του δίδεται η ευκαιρία. Κατά συνέπεια η ροή του παιχνιδιού γίνεται ασταθής και απρόβλεπτη, αντιπροτείνοντας πως, από το αρχικό στάδιο του παιχνιδιού, οφείλει να είναι πασιφανές το σημείο ισορροπίας, ώστε να αποτελεί λογικά το ζητούμενο αποτέλεσμα και για τις δύο πλευρές.
Η ανάλυσή του εξελίσσεται σε κομβικό στοιχείο της πολιτικής των ΗΠΑ. Μέσω αυτής της λογικής ανάλυσης αντιλαμβάνονται πως, παρά την ασφυκτική σκιά του αγώνα των εξοπλισμών, υπάρχουν διέξοδοι στην διεθνή πολιτική κονίστρα, εάν κάθε φορά τα σημεία ισορροπίας είναι καταφανή και για τις δύο πλευρές, ή πρόκειται για συμμάχους τους, ή για αντιπάλους τους.