Η Anthropic παρουσιάζει το Claude Sonnet 4.5, το κορυφαίο AI μοντέλο της για προγραμματισμό.

Η Anthropic παρουσίασε το Claude Sonnet 4.5, ένα νέο AI μοντέλο που ξεχωρίζει για την αξιοπιστία και τις κορυφαίες επιδόσεις του στον προγραμματισμό, προσφέροντας λύσεις έτοιμες για παραγωγή. Διατίθεται μέσω API και chatbot, ενώ συνοδεύεται από εργαλεία για ανάπτυξη agents και real-time δημιουργία λογισμικού.
Χρόνος αν΄άγνωσης: 3 λεπτά

Νέο μοντέλο Claude Sonnet 4.5

Τη Δευτέρα, η Anthropic παρουσίασε το νέο frontier μοντέλο Claude Sonnet 4.5, το οποίο, σύμφωνα με την εταιρεία, προσφέρει κορυφαίες επιδόσεις σε δοκιμές προγραμματισμού. Η Anthropic υποστηρίζει ότι το Claude Sonnet 4.5 μπορεί να δημιουργεί εφαρμογές έτοιμες για παραγωγή, και όχι απλώς πρωτότυπα, σηματοδοτώντας σημαντική βελτίωση στην αξιοπιστία σε σχέση με προηγούμενα AI μοντέλα.

(Credit: Anthropic)
Πηγή: Anthropic

Διαθεσιμότητα και τιμολόγηση

Το Claude Sonnet 4.5 θα είναι διαθέσιμο μέσω του Claude API και του chatbot Claude. Η τιμολόγηση για προγραμματιστές παραμένει ίδια με το Claude Sonnet 4: $3 ⇾ ανά εκατομμύριο input tokens (περίπου 750.000 λέξεις, δηλαδή περισσότερο από ολόκληρη τη σειρά Lord of The Rings) και $15 ανά εκατομμύριο output tokens.

Δημοτικότητα μεταξύ προγραμματιστών

Τα τελευταία χρόνια, τα AI μοντέλα της Anthropic έχουν κερδίσει την προτίμηση προγραμματιστών και επιχειρήσεων, κυρίως λόγω της υψηλής απόδοσής τους σε εργασίες λογισμικού. Η Apple και η Meta φέρεται να χρησιμοποιούν εσωτερικά τα Claude AI μοντέλα, ενώ η Anthropic έχει αναπτύξει σημαντική δραστηριότητα προσφέροντας API πρόσβαση σε εφαρμογές προγραμματισμού όπως τα Cursor, Windsurf και Replit. Πρόσφατα, το GPT-5 της OpenAI αμφισβήτησε την κυριαρχία της Anthropic, ξεπερνώντας τα Claude μοντέλα σε διάφορες δοκιμές προγραμματισμού.

Επιδόσεις σε benchmarks

Η Anthropic αναφέρει ότι το Claude Sonnet 4.5 επιτυγχάνει κορυφαία αποτελέσματα σε αρκετά coding benchmarks, όπως το SWE-Bench Verified. Ωστόσο, ο ερευνητής AI της Anthropic, David Hershey, δήλωσε στο TechCrunch ότι η απόδοση του Claude Sonnet 4.5 δεν αποτυπώνεται πλήρως μόνο μέσα από τα benchmarks.

Πραγματικές δοκιμές και δυνατότητες

Ο Hershey ανέφερε ότι έχει παρατηρήσει το Claude Sonnet 4.5 να γράφει κώδικα αυτόνομα για έως και 30 ώρες σε δοκιμές με εταιρικούς πελάτες. Μέσα σε αυτό το διάστημα, το μοντέλο κατάφερε όχι μόνο να δημιουργήσει μια εφαρμογή, αλλά και να στήσει υπηρεσίες βάσης δεδομένων, να αγοράσει domain names και να πραγματοποιήσει έλεγχο SOC 2 για την ασφάλεια του προϊόντος.

Απόψεις από τον χώρο της τεχνολογίας

Σε δήλωσή του στο TechCrunch, ο CEO της Cursor, Micheal Truell, ανέφερε ότι το Claude Sonnet 4.5 προσφέρει κορυφαίες επιδόσεις στον προγραμματισμό, ειδικά σε εργασίες μεγάλης διάρκειας. Ο CEO της Windsurf, Jeff Wang, χαρακτήρισε το Claude Sonnet 4.5 ως “νέα γενιά μοντέλων προγραμματισμού”.

Ευθυγράμμιση και ασφάλεια του μοντέλου

Η Anthropic υποστηρίζει ότι το Claude Sonnet 4.5 είναι το πιο ευθυγραμμισμένο frontier AI μοντέλο της μέχρι σήμερα, με χαμηλότερα ποσοστά κολακείας και παραπλάνησης σε σχέση με προηγούμενες εκδόσεις. Επιπλέον, η εταιρεία έχει ενισχύσει την ανθεκτικότητα του Claude απέναντι σε επιθέσεις prompt injection.

Νέες δυνατότητες και εργαλεία

Παράλληλα με το λανσάρισμα του Claude Sonnet 4.5, η Anthropic παρουσιάζει και το Claude Agent SDK. Σύμφωνα με την εταιρεία, πρόκειται για την ίδια υποδομή που χρησιμοποιεί το Claude Code και μπορεί να βοηθήσει τους προγραμματιστές να δημιουργήσουν τους δικούς τους agents.

Προεπισκόπηση “Imagine with Claude”

Η Anthropic διαθέτει επίσης μια προσωρινή ερευνητική προεπισκόπηση με τίτλο “Imagine with Claude” για συνδρομητές Max, όπου το AI μοντέλο δημιουργεί λογισμικό σε πραγματικό χρόνο. Η εταιρεία αναφέρει ότι το μοντέλο ανταποκρίνεται άμεσα στα αιτήματα των χρηστών, χωρίς προκαθορισμένες λειτουργίες ή έτοιμο κώδικα.

Ταχύτητα ανταγωνισμού στην AI

Ο έντονος ανταγωνισμός στον χώρο της τεχνητής νοημοσύνης έχει οδηγήσει τις εταιρείες να παρουσιάζουν νέα flagship μοντέλα κάθε λίγους μήνες. Το Claude Sonnet 4.5 κυκλοφορεί λιγότερο από δύο μήνες μετά το προηγούμενο AI μοντέλο της Anthropic, το Claude Opus 4.1. Αυτοί οι γρήγοροι κύκλοι παραγωγής δυσκολεύουν κάθε εταιρεία να διατηρήσει το προβάδισμα για μεγάλο χρονικό διάστημα.

[ Πηγή: TechCrunch ]

Άφησε ένα σχόλιο!

εισάγετε το σχόλιό σας!
παρακαλώ εισάγετε το όνομά σας εδώ

Τυχαία

Σχετικά

Νέο έργο διευκολύνει την πρόσβαση της τεχνητής νοημοσύνης στα δεδομένα της Wikipedia.

Η Wikimedia Deutschland ανακοίνωσε μια νέα βάση δεδομένων, το Wikidata Embedding Project, που αξιοποιεί προηγμένη σημασιολογική αναζήτηση για να κάνει τη γνώση της Wikipedia πιο προσβάσιμη στην τεχνητή νοημοσύνη. Το έργο, ανοιχτό και συνεργατικό, διευκολύνει φυσικές ερωτήσεις και ενισχύει την αξιοπιστία των AI μοντέλων.

TechCrunch Mobility: Η startup αυτόνομων φορτηγών Kodiak εισάγεται στο χρηματιστήριο και αλλαγές στη Supernal της Hyundai

Η αγορά αυτόνομων οχημάτων παραμένει ασταθής, με startups όπως οι Gatik και Kodiak AI να σημειώνουν πρόοδο μέσω εμπορικών συμφωνιών και εισόδου στο χρηματιστήριο. Παράλληλα, ανακατατάξεις στη Supernal, νέες επενδύσεις σε τεχνολογίες μπαταριών και κυβερνοεπιθέσεις δείχνουν τις προκλήσεις και τις ευκαιρίες στον τομέα της μετακίνησης.

TechCrunch Mobility: Η Toyota επενδύει 1,5 δισεκατομμύρια δολάρια στο οικοσύστημα των startups

Οι πωλήσεις ηλεκτρικών οχημάτων σημείωσαν άνοδο πριν τη λήξη της ομοσπονδιακής επιδότησης, με εταιρείες όπως Tesla, Ford και Hyundai να καταγράφουν ρεκόρ. Ωστόσο, η αβεβαιότητα για το μέλλον παραμένει, ενώ η κυβέρνηση ακύρωσε σημαντικά έργα καθαρής ενέργειας, επηρεάζοντας κυρίως πολιτείες που ψήφισαν Δημοκρατικούς.

Η ανερχόμενη ευρωπαϊκή εταιρεία τεχνητής νοημοσύνης Nexos.ai εξασφαλίζει χρηματοδότηση ύψους €30 εκατομμυρίων για να επιταχύνει την υιοθέτηση της AI από τις επιχειρήσεις.

Η Nexos.ai, με επικεφαλής τους ιδρυτές της Nord Security, συγκέντρωσε €30 εκατ. για να βοηθήσει επιχειρήσεις να υιοθετήσουν την τεχνητή νοημοσύνη με ασφάλεια, λειτουργώντας ως ουδέτερος διαμεσολαβητής μεταξύ εργαζομένων και AI. Η πλατφόρμα στοχεύει στον έλεγχο δεδομένων και την ενίσχυση της παραγωγικότητας, επεκτεινόμενη σε Ευρώπη και Αμερική.

Το BioShock 4 δεν ακυρώνεται, παρά τα «κάποια σκαμπανεβάσματα».

Έξι χρόνια μετά την ανακοίνωση του νέου BioShock, το παιχνίδι αντιμετωπίζει καθυστερήσεις, αλλαγές ηγεσίας και ανησυχίες για ακύρωση. Η Take-Two διαβεβαιώνει πως θα κυκλοφορήσει, στοχεύοντας σε εξαιρετική ποιότητα. Παράλληλα, ετοιμάζεται και ταινία στο Netflix, ενώ η ανάπτυξη συνεχίζεται με προκλήσεις.

Εικασίες για την ημερομηνία κυκλοφορίας της δεύτερης σεζόν του Delicious in Dungeon, η υπόθεση και όλα όσα γνωρίζουμε μέχρι τώρα

Η δεύτερη σεζόν του Delicious in Dungeon ανακοινώθηκε επίσημα τον Ιούνιο 2024 και αναμένεται το 2026, καθώς το στούντιο Trigger εργάζεται ήδη πάνω της. Θα συνεχίσει από το arc των Ερειπίων της Πόλης των Νάνων, με το βασικό καστ να επιστρέφει και τη σειρά να προβάλλεται αποκλειστικά στο Netflix.

Κατηγορίες