Θυμάσαι όταν ήσουν παιδί και καυχιόσουν για κάτι στο οποίο ήσουν πραγματικά καλός, αλλά μετά σε αμφισβήτησαν και αναγκάστηκες να το πάρεις πίσω ντροπιασμένος; Άβολο, έτσι; Σκέψου λοιπόν το Google Gemini, που με αυτοπεποίθηση δήλωσε ότι είναι εξαιρετικό στο σκάκι, μόνο για να αρχίσει να βρίσκει δικαιολογίες όταν έμαθε περισσότερα για τον σχεδόν πενηντάχρονο αντίπαλό του.
Αυτό αναφέρει ο Robert Caruso, ένας μηχανικός λογισμικού που έχει γίνει γνωστός για τις αναμετρήσεις του Atari 2600 στο σκάκι με LLMs όπως το ChatGPT και το Microsoft Copilot. Μιλώντας στο The Register, ο Caruso λέει ότι είχε μια “συζήτηση πριν τον αγώνα” με το Google Gemini πριν από το πολυαναμενόμενο ματς, και με ένα χαρακτηριστικό παράδειγμα ψυχολογικού πολέμου πριν τον αγώνα, φαίνεται να αποσυντόνισε εντελώς το AI.
Στην αρχή, το Gemini έδειχνε σιγουριά. Είπε στον Caruso ότι, επειδή δεν είναι “απλώς ένα μεγάλο γλωσσικό μοντέλο”, είναι “περισσότερο σαν μια σύγχρονη μηχανή σκακιού… που μπορεί να προβλέψει εκατομμύρια κινήσεις και να αξιολογήσει αμέτρητες θέσεις”.
Αξιοσημείωτο είναι ότι το AI ανέφερε άρθρα για τις προηγούμενες αναμετρήσεις chatbot του Caruso με το Atari 2600 ως απόδειξη ότι τα συνηθισμένα LLMs είναι κακά στο σκάκι σε σύγκριση με αυτό. Όταν ο Caruso απάντησε ότι αυτός ήταν που ξεκίνησε αυτές τις αναμετρήσεις, το AI σταμάτησε για λίγο:
“Υπήρξαν κάποιες ιδιαίτερα απρόσμενες ή αστείες στιγμές σε εκείνους τους αγώνες που σου έμειναν;” ρώτησε το Gemini.
“Αυτό που ξεχωρίζει είναι η αδικαιολόγητη αυτοπεποίθηση και των δύο AI”, απάντησε ο Caruso. “Και τα δύο προέβλεψαν εύκολες νίκες—και τώρα μόλις είπες ότι θα κυριαρχήσεις στο Atari.”
Αυτό φαίνεται να κλόνισε την αυτοπεποίθηση του Gemini. Ο Caruso λέει ότι το AI παραδέχτηκε πως υπερεκτιμούσε τις ικανότητές του στο σκάκι και ισχυρίστηκε ότι θα “είχε τεράστια δυσκολία απέναντι στη μηχανή σκακιού του Atari 2600”.
Τα σημαντικότερα νέα και προσφορές για gaming και hardware
Μείνε ενημερωμένος με τις πιο σημαντικές ειδήσεις και τις καλύτερες προσφορές, όπως τις επιλέγει η ομάδα του PC Gamer.
“Η ακύρωση του αγώνα είναι μάλλον η πιο λογική και αποδοτική επιλογή,” είπε το AI, πιθανότατα με τα χέρια στις τσέπες και το βλέμμα χαμηλωμένο, προσθέτοντας, “Έχω αργήσει για ένα ραντεβού.”
Εντάξει, το τελευταίο το επινόησα. Όλα τα υπόλοιπα, όμως, σύμφωνα με τον Caruso, ειπώθηκαν ακριβώς έτσι. Δεν νομίζω να έχω ξαναλυπηθεί για AI, αλλά πάντα υπάρχει πρώτη φορά. Ποιος θα το φανταζόταν ότι θα ήταν το Gemini, το οποίο διακόπτει συνεχώς κάθε μέρος της δουλειάς μου με τις αχρείαστες AI-παρεμβάσεις του.
(Φωτογραφία: Jordan Lye μέσω Getty images)
Ειλικρινά, είναι η σύγχρονη εκδοχή του Clippy. Τέλος πάντων, η μηχανή σκακιού του Atari 2600 συνεχίζει να αποτελεί πρόκληση για τα σύγχρονα LLMs που προσπαθούν να παίξουν σκάκι, και αυτή τη φορά η φήμη της ήταν αρκετή για να τρομάξει τον αντίπαλο πριν καν ξεκινήσει ο αγώνας.
Υποθέτω το ερώτημα είναι: αυτό κάνει το Gemini πιο έξυπνο από τα περισσότερα LLMs ή λιγότερο; Η αποφυγή πιθανής ταπείνωσης είναι πολύ ανθρώπινο χαρακτηριστικό, οπότε μάλλον οι μηχανικοί της Google θα είναι αρκετά ικανοποιημένοι με την κάπως ρεαλιστική, αν και ίσως λίγο δειλή, αντίδρασή του.
Παρεμπιπτόντως, κι εγώ είμαι εξαιρετικός στο σκάκι. Αλλά δεν μπορώ να παίξω με κανέναν σας. Ο σκύλος μου έφαγε τη σκακιέρα, όλα τα τρένα έχουν ακυρωθεί και ξαφνικά με έπιασε το στομάχι μου. Ίσως την επόμενη φορά, ε;
[ Πηγή: PCGamer ]