Υπολογιστές και Μπριτζ

Τετάρτη 15 Νοεμβρίου 2017

Υπολογιστές και Μπριτζ

12:32 μ.μ. | Από Κούρτης Δημήτρης | Επεξεργασία ανάρτησης

Τα τελευταία χρόνια οι αλγόριθμοι τεχνητής νοημοσύνης αλλά και οι δυνατότητες των υπολογιστών έχουν βελτιωθεί πάρα πολύ. Αυτό δεν θα μπορούσε να μην επηρεάσει και τα πνευματικά παιχνίδια, ένα χώρο που πάντα αποτελούσε πρόκληση ανάμεσα στον άνθρωπο και τις μηχανές.

Αρχικά οι προγραμματιστές εστίασαν στο σκάκι με την μέθοδο της εξέτασης όλων των πιθανών μελλοντικών θέσεων που μπορούν να προκύψουν μετά από μια κίνηση. Όσο πιο δυνατοί γινόταν οι υπολογιστές, τόσο περισσότερες μελλοντικές κινήσεις μπορούσαν να "δουν" και να εκτιμήσουν, άρα τόσο ισχυρότεροι αντίπαλοι γινόταν. Οπότε φτάσαμε στο 1997 όπου ο υπερυπολογιστής Deep Blue της IBM κέρδισε τον 11 φορές παγκόσμιο πρωταθλητή και κατά πολλούς καλύτερο σκακιστή όλων των εποχών, Γκάρι Κασπάροφ, σε έναν αγώνα 6 παρτίδων. Ήταν η πρώτη νίκη των μηχανών στο σκάκι. Σήμερα υπάρχουν πολλά προγράμματα με ELO (είναι δυναμική αξιολόγηση στο σκάκι) περίπου 3200, τα οποία κερδίζουν εύκολα τον καλύτερο παίκτη παγκοσμίως τα τελευταία χρόνια, Μάγκνους Κάρλσεν (μεγαλύτερο ELO 2861 το 2013).

Μετά το σκάκι το ενδιαφέρον των προγραμματιστών στράφηκε στο κινέζικο παιχνίδι "γκο".

Το γκο είναι ένα στρατηγικό επιτραπέζιο παιχνίδι που ξεκίνησε από την Κίνα (γνωστό σαν Ουέι-Τσι, Weiqi). Οι δυο παίκτες, άσπρος και μαύρος, προσθέτουν εναλλάξ πέτρες στο γκόμπαν (ταμπλό), περικυκλώνοντας περιοχή, φυλακίζοντας πέτρες του αντιπάλου και προστατεύοντας τις δικές τους πέτρες. Το Γκο παίζεται κυρίως στην Ανατολική Ασία (Κίνα, Ιαπωνία, Κορέα κλπ.), και μέσω του διαδικτύου στον υπόλοιπο κόσμο. Οι κανόνες του Γκο είναι πολύ απλοί, αλλά η στρατηγική που ακολουθεί είναι περίπλοκη και θεωρείται ότι ξεπερνά σε βάθος άλλα παιχνίδια σαν το Σκάκι. (πηγή Βικιπαίδεια)
Η DeepMind είναι μια λονδρέζικη εταιρεία τεχνητής νοημοσύνης που εξαγοράστηκε από τη Google.
Ο αλγόριθμος AlphaGo της εταιρείας, ένα «νευρωνικό δίκτυο» που μιμείται την αρχιτεκτονική του ανθρώπινου εγκεφάλου, τον Μάρτιο του 1996, νίκησε τον Λι Σέντολ (παγκόσμιο πρωταθλητή του Γκο) σε αγώνα 5 παρτίδων με σκορ 4-1. Κέρδισε επίσης στο 99,8% των παρτίδων ενάντια σε άλλα προγράμματα που παίζουν Γκο.

Το Γκο είναι δύσκολο για τους υπολογιστές για δύο λόγους: πρώτον, σε μια τυπική αναμέτρηση των 150 κινήσεων οι πιθανές διατάξεις των πετρών στο ταμπλό φτάνει τις 10 εις την 170 -ένας αριθμός μεγαλύτερος από τον αριθμό όλων των ατόμων στο Σύμπαν. Αυτό σημαίνει ότι θα ήταν πρακτικά αδύνατο να εξετάσει ένας υπολογιστής όλες τις δυνατές κινήσεις και τις εκβάσεις τους.

Δεύτερον, είναι δύσκολο να εκτιμήσει κανείς ποιος παίκτης έχει το πάνω χέρι απλά κοιτώντας το ταμπλό -σε αντίθεση με παιχνίδια σαν το σκάκι, όπου οι παίκτες έχουν μια εικόνα για το ποιος προηγείται από τον αριθμό των πιονιών που έχουν αποσπάσει από τον αντίπαλο.

Σε αντίθεση με άλλα προγράμματα Γκο, τα οποία δημιουργήθηκαν ειδικά για να παίζουν το παιχνίδι, ο αλγόριθμος AlphaGo δεν διδάχθηκε καν τους κανόνες του παιχνιδιού -είναι ένας αλγόριθμος μάθησης που βελτιώνεται με την εμπειρία.

Το πρόγραμμα αρχικά μελέτησε 50 εκατομμύρια κινήσεις από παιχνίδια επαγγελματιών παικτών και έμαθε έτσι να προβλέπει ποια είναι η καλύτερη κίνηση. Έπαιξε επίσης εκατομμύρια παρτίδες εναντίον του εαυτού του και διδάχτηκε να εκτιμά ποιος παίκτης έχει το πάνω χέρι υπολογίζοντας την πιθανότητα να κερδίσει τελικά το παιχνίδι η μία ή η άλλη πλευρά.

Το AlphaGo μπορεί να μαθαίνει επειδή βασίζεται σε ένα δίκτυο από εικονικούς νευρώνες που συνδέονται μεταξύ τους με εικονικές συνάψεις, οι οποίες ισχυροποιούνται ή εξασθενίζουν ανάλογα με τα παραδείγματα και την εμπειρία.

Παρόμοιες τεχνικές θα μπορούσαν να εφαρμοστούν τώρα σε άλλες εφαρμογές που απαιτούν λήψη αποφάσεων, σχεδιασμό στρατηγικής, μακροπρόθεσμο σχεδιασμό και αναγνώριση περίπλοκων μοτίβων.

Σύμφωνα με τον Ντέμις Χασάμπις, συνιδρυτή της DeepMind και μέλος της ερευνητικής ομάδας στην τελευταία δημοσίευση, τέτοιες πιθανές εφαρμογές είναι οι αυτόματες διαγνώσεις σε απεικονιστικές εξετάσεις, η βελτίωση των μοντέλων του παγκόσμιου κλίματος. (πηγή in.gr)

Και φτάνουμε στο κρίσιμο ερώτημα:
Έχουν νικήσει ποτέ οι υπολογιστές τους καλύτερους παίκτες στο μπριτζ;
Η απάντηση είναι όχι ακόμη.

Οπως εξηγεί και το ολλανδικό περιοδικό ΙΜΡ, «ένας σκακιστής βλέπει όλα τα πιόνια στο ταμπλό: και τα δικά του και εκείνα του αντιπάλου του. Ενας παίκτης του μπριτζ δεν βλέπει παρά μόνο ό,τι χέρι του και τα χαρτιά που αποσύρονται από το παιχνίδι». Ετσι, γίνεται πολύ περίπλοκο για μια μηχανή να «διαβάσει» το παιχνίδι και να αναπτύξει στρατηγικές. Και αυτό είναι μια λογική εξήγηση στο γεγονός πως ο υπολογιστής GIB κατά το Παγκόσμιο Πρωτάθλημα Μπριτζ του 1998, έμεινε στη 12η θέση. Το 2005, ο υπολογιστής «Jack» ηττήθηκε από τους Ολλανδούς πρωταθλητές Ευρώπης. (πηγή iefimerida.gr)

Αλλά για πόσο ακόμη ο άνθρωπος θα κερδίζει στο μπριτζ; ή μήπως είναι άλλοι οι λόγοι που δεν έχει ήδη κερδίσει ο υπολογιστής;

Σύμφωνα με τον Luis Argerich, καθηγητή Τεχνητής Νοημοσύνης του Πανεπιστημίου του Μπουένος Άιρες, το Μπριτζ δεν έχει προσελκύσει αρκετά το πεδίο της Τεχνητής Νοημοσύνης για να κατασκευάσει ένα πρόγραμμα που θα κερδίζει σε αγώνες ομάδων.

Όλα τα επιχειρήματα για ελλιπείς πληροφορίες, παιχνίδια πιθανοτήτων, ψυχολογικοί παράγοντες κ.τ.λ. δεν είναι σημαντικά γιατί εμφανίζονται και στο πόκερ όπου η Τεχνητή Νοημοσύνη έχει κερδίσει τους καλύτερους παίκτες στον κόσμο.

Ένα πρόγραμμα τεχνητής νοημοσύνης έχει πολλά πλεονεκτήματα σε σχέση με τον άνθρωπο:

Τέλεια εκτέλεση:
Οι αλγόριθμοι μπορούν εύκολα να βρουν το πλάνο με τις μεγαλύτερες πιθανότητες επιτυχίας. Σε περιπτώσεις που χρειάζεται το ανθρώπινο λάθος για να βγει ένα συμβόλαιο, μπορούν να προγραμματιστούν ώστε να μας δίνουν τις μεγαλύτερες ελπίδες να γίνει αυτό, ακόμη και αν θα βασιστούν σε όχι τέλεια άμυνα.

Τέλεια Άμυνα:
Θα είναι τόσο τέλεια που σχεδόν θα "κλέβει"! Δείτε το εξής: στην άμυνα ο υπολογιστής βγάζει συμπεράσματα για το τι μπορεί να έχει ή να μην έχει ο συμπαίκτης του. Υποθέτοντας πως ο συμπαίκτης του έχει ένα συγκεκριμένο χέρι, ο υπολογιστής μπορεί να τρέξει έναν αλγόριθμο και να δει πως θα μπορούσε να εξελιχθεί το παίξιμο. Αν το παίξιμο εξελιχθεί διαφορετικά ο υπολογιστής μπορεί να αποκλείσει αυτό το χέρι. Το ίδιο κάνει και ο άνθρωπος αλλά το επίπεδο αβεβαιότητας είναι πολύ μεγαλύτερο γιατί οι άνθρωποι δεν αμύνονται αλγοριθμικά!

Αγορές χωρίς Λάθη:
Ακόμη και οι καλύτεροι παίκτες στον κόσμο έχουν κάποιες φορές μπερδευτεί στο σύστημα ή δεν είναι σίγουροι για το νόημα κάποιας αγοράς. Οι υπολογιστές είναι αδύνατο να κάνουν τέτοια λάθη.

Τέλεια κρίση:
Οι άνθρωποι βασίζονται αρκετά στην κρίση τους για να πάρουν αποφάσεις όπως "θα πρέπει να κοντράρω αυτό το συμβόλαιο;" ή "πόσο πιθανό είναι αυτό το σλεμ;". Ο υπολογιστής μπορεί να παίρνει τις σωστές αποφάσεις βασισμένος σε προσομοιώσεις.

Τέλειες αντάμ και τέλειο παίξιμο στο φινάλε της παρτίδας:
Οι αντάμ και το παίξιμο προς το τέλος της παρτίδας μπορούν να μοντελοποιηθούν με τον τρόπο που έχουν μοντελοποιηθεί τα ανοίγματα και τα φινάλε στο σκάκι. Με αυτόν τον τρόπο ο υπολογιστής θα κάνει πάντα την καλύτερη αντάμ που μπορεί να μην κερδίζει στην συγκεκριμένη διανομή αλλά θα κερδίζει σε βάθος χρόνου*.

Τελικά το πραγματικό εμπόδιο για το οποίο οι υπολογιστές δεν έχουν ακόμη κερδίσει τους πρωταθλητές στο Μπριτζ είναι το γεγονός πως δεν έχουν επενδυθεί ακόμη αρκετά χρήματα και πόροι για την ανάπτυξη προγραμμάτων Τεχνητής Νοημοσύνης για το μπριτζ. (πηγή quora.com)

* Μελετήστε και το αντίστοιχο θέμα στο βιβλίο του Γιώργου Κλείτσα: "Μπριτζ: Καινοτομία και μινιμαλισμός" όπου ήδη οι υπολογιστές έχουν αποδείξει για κάποιες αντάμ ότι είναι οι καλύτερες ενώ οι πρωταθλητές ήταν βέβαιοι πως χάνουν σε βάθος χρόνου.

Κλείνοντας δείτε μια αγορά από το πρόγραμμα Jack που που αναφέρθηκε παραπάνω και πολλοί χρησιμοποιούμε για εξάσκηση:

Μήπως κάτι δεν πήγε καλά στον προγραμματισμό;

Ετικέτες:Ενδιαφέροντα

Μαθήματα Προχωρημένων

Περιεχόμενα

Χρήσιμες Διευθύνσεις

Δημοφιλείς αναρτήσεις

Προβολές σελίδας

Υπολογιστές και Μπριτζ

0 σχόλια:

Δημοσίευση σχολίου

Αυτόματη ενημέρωση

Αναζήτηση

Πρόσφατα Άρθρα

Παλαιοτερα Αρθρα


e-mail: