Η Google Gemini AI ηττήθηκε στο σκάκι

Περιεχόμενα άρθρου

Τα σημαντικότερα νέα και προσφορές για gaming και hardware

Θυμάσαι όταν ήσουν παιδί και καυχιόσουν για κάτι στο οποίο ήσουν πραγματικά καλός, αλλά μετά σε αμφισβήτησαν και αναγκάστηκες να το πάρεις πίσω ντροπιασμένος; Άβολο, έτσι; Σκέψου λοιπόν το Google Gemini, που με αυτοπεποίθηση δήλωσε ότι είναι εξαιρετικό στο σκάκι, μόνο για να αρχίσει να βρίσκει δικαιολογίες όταν έμαθε περισσότερα για τον σχεδόν πενηντάχρονο αντίπαλό του.

Αυτό αναφέρει ο Robert Caruso, ένας μηχανικός λογισμικού που έχει γίνει γνωστός για τις αναμετρήσεις του Atari 2600 στο σκάκι με LLMs όπως το ChatGPT και το Microsoft Copilot. Μιλώντας στο The Register, ο Caruso λέει ότι είχε μια “συζήτηση πριν τον αγώνα” με το Google Gemini πριν από το πολυαναμενόμενο ματς, και με ένα χαρακτηριστικό παράδειγμα ψυχολογικού πολέμου πριν τον αγώνα, φαίνεται να αποσυντόνισε εντελώς το AI.

Στην αρχή, το Gemini έδειχνε σιγουριά. Είπε στον Caruso ότι, επειδή δεν είναι “απλώς ένα μεγάλο γλωσσικό μοντέλο”, είναι “περισσότερο σαν μια σύγχρονη μηχανή σκακιού… που μπορεί να προβλέψει εκατομμύρια κινήσεις και να αξιολογήσει αμέτρητες θέσεις”.

Αξιοσημείωτο είναι ότι το AI ανέφερε άρθρα για τις προηγούμενες αναμετρήσεις chatbot του Caruso με το Atari 2600 ως απόδειξη ότι τα συνηθισμένα LLMs είναι κακά στο σκάκι σε σύγκριση με αυτό. Όταν ο Caruso απάντησε ότι αυτός ήταν που ξεκίνησε αυτές τις αναμετρήσεις, το AI σταμάτησε για λίγο:

“Υπήρξαν κάποιες ιδιαίτερα απρόσμενες ή αστείες στιγμές σε εκείνους τους αγώνες που σου έμειναν;” ρώτησε το Gemini.

“Αυτό που ξεχωρίζει είναι η αδικαιολόγητη αυτοπεποίθηση και των δύο AI”, απάντησε ο Caruso. “Και τα δύο προέβλεψαν εύκολες νίκες—και τώρα μόλις είπες ότι θα κυριαρχήσεις στο Atari.”

Αυτό φαίνεται να κλόνισε την αυτοπεποίθηση του Gemini. Ο Caruso λέει ότι το AI παραδέχτηκε πως υπερεκτιμούσε τις ικανότητές του στο σκάκι και ισχυρίστηκε ότι θα “είχε τεράστια δυσκολία απέναντι στη μηχανή σκακιού του Atari 2600”.

Τα σημαντικότερα νέα και προσφορές για gaming και hardware

Μείνε ενημερωμένος με τις πιο σημαντικές ειδήσεις και τις καλύτερες προσφορές, όπως τις επιλέγει η ομάδα του PC Gamer.

“Η ακύρωση του αγώνα είναι μάλλον η πιο λογική και αποδοτική επιλογή,” είπε το AI, πιθανότατα με τα χέρια στις τσέπες και το βλέμμα χαμηλωμένο, προσθέτοντας, “Έχω αργήσει για ένα ραντεβού.”

Εντάξει, το τελευταίο το επινόησα. Όλα τα υπόλοιπα, όμως, σύμφωνα με τον Caruso, ειπώθηκαν ακριβώς έτσι. Δεν νομίζω να έχω ξαναλυπηθεί για AI, αλλά πάντα υπάρχει πρώτη φορά. Ποιος θα το φανταζόταν ότι θα ήταν το Gemini, το οποίο διακόπτει συνεχώς κάθε μέρος της δουλειάς μου με τις αχρείαστες AI-παρεμβάσεις του.

(Φωτογραφία: Jordan Lye μέσω Getty images)

Ειλικρινά, είναι η σύγχρονη εκδοχή του Clippy. Τέλος πάντων, η μηχανή σκακιού του Atari 2600 συνεχίζει να αποτελεί πρόκληση για τα σύγχρονα LLMs που προσπαθούν να παίξουν σκάκι, και αυτή τη φορά η φήμη της ήταν αρκετή για να τρομάξει τον αντίπαλο πριν καν ξεκινήσει ο αγώνας.

Υποθέτω το ερώτημα είναι: αυτό κάνει το Gemini πιο έξυπνο από τα περισσότερα LLMs ή λιγότερο; Η αποφυγή πιθανής ταπείνωσης είναι πολύ ανθρώπινο χαρακτηριστικό, οπότε μάλλον οι μηχανικοί της Google θα είναι αρκετά ικανοποιημένοι με την κάπως ρεαλιστική, αν και ίσως λίγο δειλή, αντίδρασή του.

Παρεμπιπτόντως, κι εγώ είμαι εξαιρετικός στο σκάκι. Αλλά δεν μπορώ να παίξω με κανέναν σας. Ο σκύλος μου έφαγε τη σκακιέρα, όλα τα τρένα έχουν ακυρωθεί και ξαφνικά με έπιασε το στομάχι μου. Ίσως την επόμενη φορά, ε;

[ Πηγή: PCGamer ]

Άφησε ένα σχόλιο! Ακύρωση απάντησης

Προηγούμενο άρθρο

Οι τίτλοι του Xbox Game Pass για τον Ιούλιο περιλαμβάνουν τα Grounded 2, Wuchang: Fallen Feathers και άλλα.

Επόμενο άρθρο

Το να λειτουργεί το Donkey Kong Bananza στα 60FPS ήταν σημαντικό για τη Nintendo.

Περιεχόμενα άρθρου

Τα σημαντικότερα νέα και προσφορές για gaming και hardware

Άφησε ένα σχόλιο! Ακύρωση απάντησης

Mount and Blade 2 Bannerlord: Το Καλύτερο Όπλο για Κάθε Κατηγορία

Το τρέιλερ του βιντεοπαιχνιδιού Star Trek: Voyager, Across the Universe, ξυπνά στρατηγική νοσταλγία.

Ανασκόπηση του επιτραπέζιου παιχνιδιού Deep Regrets: Σαν να φέρνεις το Dredge στο τραπέζι

Η Nvidia γίνεται η πρώτη εταιρεία στην ιστορία που φτάνει κεφαλαιοποίηση αγοράς 4 τρισεκατομμυρίων δολαρίων (ναι, τρισεκατομμύρια με «Τ»).

Η OpenAI δηλώνει πλέον ότι το ChatGPT «δεν θα πρέπει να σου δίνει απάντηση» όταν ρωτάς: «Να χωρίσω με το αγόρι μου;»

Αυτό το δωρεάν παιχνίδι ανατρέπει το Turing Test με ένα τρομακτικό κουίζ τεχνητής νοημοσύνης.

Δεν είναι αργά για την Apple να αξιοποιήσει σωστά την τεχνητή νοημοσύνη.

Αυτό το HP Laptop (32GB RAM, 1TB SSD) με έκπτωση 72% είναι η δελεαστική ευκαιρία που κάθε «πρωινό πουλί» θέλει να προλάβει πριν τη...

Ένας άνδρας προκάλεσε στον εαυτό του μια πάθηση που σπάνια εμφανίζεται τα τελευταία εκατό χρόνια, αφού συμβουλεύτηκε το ChatGPT για το πώς να μειώσει...