Θα είναι το πόκερ ο νέος αντίπαλος της τεχνητής νοημοσύνης;
1 Απρ 2016 - 14:30
Πριν από μερικές εβδομάδες το AlphaGo της DeepMind κατάφερε να κερδίσει τον παγκόσμιο πρωταθλητή του “Γκο”, σημειώνοντας μία ακόμα νίκη της τεχνητής νοημοσύνης απέναντι στον άνθρωπο, μετά το σκάκι, τη ντάμα και το Scrabble.
Όπως όλα δείχνουν, επόμενος στόχος του AlphaGo δεν είναι άλλος από το πόκερ και ήδη οι ερευνητές που βρίσκονται πίσω από το πρόγραμμα έχουν αρχίσει τις προσπάθειες να “εκπαιδεύσουν” τον υπολογιστή σε παιχνίδια ημιτελών πληροφοριών.
Σε paper που δημοσίευσαν, το οποίο τιτλοφορείται “Deep Reinforcement Learning from Self-Play in Imperfect Information Games” οι ερευνητές David Silver και Johan Heinrich αναφέρεται η χρήση μεθόδων εκπαίδευσης του υπολογιστή για παιχνίδια πόκερ όπως το Texas Hold’em και το Leduc.
Το πόκερ αποτελεί μια νέα πρόκληση για το AlphaGo, καθώς είναι το μόνο παιχνίδι στο οποίο ο υπολογιστής δεν θα έχει διαθέσιμες όλες τις πληροφορίες που χρειάζεται. Δεν υπάρχει μπλόφα σε παιχνίδια όπως το Γκο και το Σκάκι. Η “ατέλεια” αυτή δε συνεπάγεται ότι το εγχείρημα του υπολογιστή στο πόκερ θα είναι αδύνατο, σίγουρα όμως θα είναι πολύ πιο δύσκολο.
Ο αλγόριθμος που έχει σχεδιαστεί – στον οποίο περιλαμβάνονται 1 δισεκατομμύριο παρτίδες – είναι εντυπωσιακός αλλά προς το παρόν δεν μπορεί να “επιλύσει” το παιχνίδι. Επιπλέον, είναι σχεδιασμένος για παιχνίδι αποκλειστικά με δύο παίκτες και δεν μπορεί να χειριστεί καταστάσεις περισσότερων παικτών στο τραπέζι.
Οι εξελίξεις στην προσπάθεια αυτή του AlphaGo και των προγραμματιστών του είναι ενδιαφέρουσες καθώς θα πρέπει να δούμε αν ο υπολογιστής θα μπορέσει να “μπλοφάρει” τον ανθρώπινο νου για να πετύχει την τελική νίκη. Οι ερευνητές πάντως τονίζουν ότι ο αλγόριθμος μπορεί να αποκτήσει σαφές πλεονέκτημα επιλέγοντας πάντα την καλύτερη δυνατή στρατηγική.
Εσείς τι πιστεύετε;
Νικητής ο Dan Bilzerian στο prop bet που πήρε επικές διαστάσεις.