Η Anthropic παρουσιάζει το Claude Sonnet 4.5, το κορυφαίο AI μοντέλο της για προγραμματισμό.

Η Anthropic παρουσίασε το Claude Sonnet 4.5, ένα νέο AI μοντέλο που ξεχωρίζει για την αξιοπιστία και τις κορυφαίες επιδόσεις του στον προγραμματισμό, προσφέροντας λύσεις έτοιμες για παραγωγή. Διατίθεται μέσω API και chatbot, ενώ συνοδεύεται από εργαλεία για ανάπτυξη agents και real-time δημιουργία λογισμικού.
Χρόνος αν΄άγνωσης: 3 λεπτά

Νέο μοντέλο Claude Sonnet 4.5

Τη Δευτέρα, η Anthropic παρουσίασε το νέο frontier μοντέλο Claude Sonnet 4.5, το οποίο, σύμφωνα με την εταιρεία, προσφέρει κορυφαίες επιδόσεις σε δοκιμές προγραμματισμού. Η Anthropic υποστηρίζει ότι το Claude Sonnet 4.5 μπορεί να δημιουργεί εφαρμογές έτοιμες για παραγωγή, και όχι απλώς πρωτότυπα, σηματοδοτώντας σημαντική βελτίωση στην αξιοπιστία σε σχέση με προηγούμενα AI μοντέλα.

(Credit: Anthropic)
Πηγή: Anthropic

Διαθεσιμότητα και τιμολόγηση

Το Claude Sonnet 4.5 θα είναι διαθέσιμο μέσω του Claude API και του chatbot Claude. Η τιμολόγηση για προγραμματιστές παραμένει ίδια με το Claude Sonnet 4: $3 ⇾ ανά εκατομμύριο input tokens (περίπου 750.000 λέξεις, δηλαδή περισσότερο από ολόκληρη τη σειρά Lord of The Rings) και $15 ανά εκατομμύριο output tokens.

Δημοτικότητα μεταξύ προγραμματιστών

Τα τελευταία χρόνια, τα AI μοντέλα της Anthropic έχουν κερδίσει την προτίμηση προγραμματιστών και επιχειρήσεων, κυρίως λόγω της υψηλής απόδοσής τους σε εργασίες λογισμικού. Η Apple και η Meta φέρεται να χρησιμοποιούν εσωτερικά τα Claude AI μοντέλα, ενώ η Anthropic έχει αναπτύξει σημαντική δραστηριότητα προσφέροντας API πρόσβαση σε εφαρμογές προγραμματισμού όπως τα Cursor, Windsurf και Replit. Πρόσφατα, το GPT-5 της OpenAI αμφισβήτησε την κυριαρχία της Anthropic, ξεπερνώντας τα Claude μοντέλα σε διάφορες δοκιμές προγραμματισμού.

Επιδόσεις σε benchmarks

Η Anthropic αναφέρει ότι το Claude Sonnet 4.5 επιτυγχάνει κορυφαία αποτελέσματα σε αρκετά coding benchmarks, όπως το SWE-Bench Verified. Ωστόσο, ο ερευνητής AI της Anthropic, David Hershey, δήλωσε στο TechCrunch ότι η απόδοση του Claude Sonnet 4.5 δεν αποτυπώνεται πλήρως μόνο μέσα από τα benchmarks.

Πραγματικές δοκιμές και δυνατότητες

Ο Hershey ανέφερε ότι έχει παρατηρήσει το Claude Sonnet 4.5 να γράφει κώδικα αυτόνομα για έως και 30 ώρες σε δοκιμές με εταιρικούς πελάτες. Μέσα σε αυτό το διάστημα, το μοντέλο κατάφερε όχι μόνο να δημιουργήσει μια εφαρμογή, αλλά και να στήσει υπηρεσίες βάσης δεδομένων, να αγοράσει domain names και να πραγματοποιήσει έλεγχο SOC 2 για την ασφάλεια του προϊόντος.

Απόψεις από τον χώρο της τεχνολογίας

Σε δήλωσή του στο TechCrunch, ο CEO της Cursor, Micheal Truell, ανέφερε ότι το Claude Sonnet 4.5 προσφέρει κορυφαίες επιδόσεις στον προγραμματισμό, ειδικά σε εργασίες μεγάλης διάρκειας. Ο CEO της Windsurf, Jeff Wang, χαρακτήρισε το Claude Sonnet 4.5 ως “νέα γενιά μοντέλων προγραμματισμού”.

Ευθυγράμμιση και ασφάλεια του μοντέλου

Η Anthropic υποστηρίζει ότι το Claude Sonnet 4.5 είναι το πιο ευθυγραμμισμένο frontier AI μοντέλο της μέχρι σήμερα, με χαμηλότερα ποσοστά κολακείας και παραπλάνησης σε σχέση με προηγούμενες εκδόσεις. Επιπλέον, η εταιρεία έχει ενισχύσει την ανθεκτικότητα του Claude απέναντι σε επιθέσεις prompt injection.

Νέες δυνατότητες και εργαλεία

Παράλληλα με το λανσάρισμα του Claude Sonnet 4.5, η Anthropic παρουσιάζει και το Claude Agent SDK. Σύμφωνα με την εταιρεία, πρόκειται για την ίδια υποδομή που χρησιμοποιεί το Claude Code και μπορεί να βοηθήσει τους προγραμματιστές να δημιουργήσουν τους δικούς τους agents.

Προεπισκόπηση “Imagine with Claude”

Η Anthropic διαθέτει επίσης μια προσωρινή ερευνητική προεπισκόπηση με τίτλο “Imagine with Claude” για συνδρομητές Max, όπου το AI μοντέλο δημιουργεί λογισμικό σε πραγματικό χρόνο. Η εταιρεία αναφέρει ότι το μοντέλο ανταποκρίνεται άμεσα στα αιτήματα των χρηστών, χωρίς προκαθορισμένες λειτουργίες ή έτοιμο κώδικα.

Ταχύτητα ανταγωνισμού στην AI

Ο έντονος ανταγωνισμός στον χώρο της τεχνητής νοημοσύνης έχει οδηγήσει τις εταιρείες να παρουσιάζουν νέα flagship μοντέλα κάθε λίγους μήνες. Το Claude Sonnet 4.5 κυκλοφορεί λιγότερο από δύο μήνες μετά το προηγούμενο AI μοντέλο της Anthropic, το Claude Opus 4.1. Αυτοί οι γρήγοροι κύκλοι παραγωγής δυσκολεύουν κάθε εταιρεία να διατηρήσει το προβάδισμα για μεγάλο χρονικό διάστημα.

[ Πηγή: TechCrunch ]

Άφησε ένα σχόλιο!

εισάγετε το σχόλιό σας!
παρακαλώ εισάγετε το όνομά σας εδώ

Τυχαία

Σχετικά

Πηγές: Η νέα startup τεχνητής νοημοσύνης του Naveen Rao στο χώρο του hardware στοχεύει σε αποτίμηση 5 δισεκατομμυρίων δολαρίων, με τη στήριξη της a16z.

Ο Naveen Rao, πρώην επικεφαλής AI στη Databricks, ιδρύει τη Unconventional, Inc., στοχεύοντας σε αποτίμηση $5 δισ. με επενδύσεις από a16z, Lightspeed και Lux. Η εταιρεία αναπτύσσει νέο υπολογιστικό σύστημα για τεχνητή νοημοσύνη, ανταγωνιζόμενη την Nvidia, ενώ η αγορά AI εξελίσσεται ραγδαία με ποικιλία εργαλείων.

Το Hollow Knight: Silksong είναι τόσο δημοφιλές που ακόμα και οι πειρατές προτρέπουν τους άλλους να μην το κατεβάσουν παράνομα.

Το Hollow Knight: Silksong κυκλοφόρησε με τεράστια επιτυχία, ξεπερνώντας το μισό εκατομμύριο ταυτόχρονους παίκτες στο Steam. Παρά το ότι «έσπασε» γρήγορα, ακόμα και οι πειρατές προτρέπουν να το αγοράσουν λόγω της χαμηλής τιμής και της στήριξης στη μικρή ομάδα ανάπτυξης.

Ο πρώην επικεφαλής του PlayStation εκφράζει αμφιβολίες σχετικά με τα συνδρομητικά μοντέλα τύπου Netflix για τα παιχνίδια.

Ο πρώην επικεφαλής του PlayStation, Σον Λέιντεν, αμφιβάλλει για τα συνδρομητικά μοντέλα τύπου Netflix στα βιντεοπαιχνίδια, θεωρώντας τα επικίνδυνα για τους δημιουργούς. Πιστεύει ότι δεν εμπνέουν τους developers, καθώς τους μετατρέπουν σε απλούς εργάτες χωρίς πραγματική ανταμοιβή ή δημιουργική ελευθερία.

Νιώθεις εξαντλημένος για να ταξιδέψεις; Αυτή η νέα εφαρμογή δημιουργεί ψεύτικες καλοκαιρινές φωτογραφίες διακοπών για εσένα.

Σε μια εποχή που η κουλτούρα του αδιάκοπου εργασιακού ρυθμού επιστρέφει, η εφαρμογή Endless Summer επιτρέπει στους χρήστες να δημιουργούν ρεαλιστικές, νοσταλγικές φωτογραφίες διακοπών με τεχνητή νοημοσύνη. Προσφέρει μια αίσθηση χαλάρωσης και απόδρασης, ακόμα κι αν η πραγματική ξεκούραση παραμένει άπιαστη.

Η πολιτιστική κυριαρχία των KPop Demon Hunters, δύο μήνες μετά

Το KPop Demon Hunters έγινε παγκόσμιο φαινόμενο χάρη στη viral επιτυχία του στο Netflix, την εντυπωσιακή του αισθητική και το εθιστικό του soundtrack. Παρά τον αρχικό σκεπτικισμό της Sony, η ταινία απέδειξε τη δύναμη του γυναικείου κοινού και της διαδικτυακής διάδοσης, ανοίγοντας δρόμο για περισσότερες γυναίκες δημιουργούς.

TechCrunch Mobility: Η Toyota επενδύει 1,5 δισεκατομμύρια δολάρια στο οικοσύστημα των startups

Οι πωλήσεις ηλεκτρικών οχημάτων σημείωσαν άνοδο πριν τη λήξη της ομοσπονδιακής επιδότησης, με εταιρείες όπως Tesla, Ford και Hyundai να καταγράφουν ρεκόρ. Ωστόσο, η αβεβαιότητα για το μέλλον παραμένει, ενώ η κυβέρνηση ακύρωσε σημαντικά έργα καθαρής ενέργειας, επηρεάζοντας κυρίως πολιτείες που ψήφισαν Δημοκρατικούς.

Κατηγορίες