Η Anthropic παρουσιάζει το Claude Sonnet 4.5, το κορυφαίο AI μοντέλο της για προγραμματισμό.

Η Anthropic παρουσίασε το Claude Sonnet 4.5, ένα νέο AI μοντέλο που ξεχωρίζει για την αξιοπιστία και τις κορυφαίες επιδόσεις του στον προγραμματισμό, προσφέροντας λύσεις έτοιμες για παραγωγή. Διατίθεται μέσω API και chatbot, ενώ συνοδεύεται από εργαλεία για ανάπτυξη agents και real-time δημιουργία λογισμικού.
Χρόνος αν΄άγνωσης: 3 λεπτά

Νέο μοντέλο Claude Sonnet 4.5

Τη Δευτέρα, η Anthropic παρουσίασε το νέο frontier μοντέλο Claude Sonnet 4.5, το οποίο, σύμφωνα με την εταιρεία, προσφέρει κορυφαίες επιδόσεις σε δοκιμές προγραμματισμού. Η Anthropic υποστηρίζει ότι το Claude Sonnet 4.5 μπορεί να δημιουργεί εφαρμογές έτοιμες για παραγωγή, και όχι απλώς πρωτότυπα, σηματοδοτώντας σημαντική βελτίωση στην αξιοπιστία σε σχέση με προηγούμενα AI μοντέλα.

(Credit: Anthropic)
Πηγή: Anthropic

Διαθεσιμότητα και τιμολόγηση

Το Claude Sonnet 4.5 θα είναι διαθέσιμο μέσω του Claude API και του chatbot Claude. Η τιμολόγηση για προγραμματιστές παραμένει ίδια με το Claude Sonnet 4: $3 ⇾ ανά εκατομμύριο input tokens (περίπου 750.000 λέξεις, δηλαδή περισσότερο από ολόκληρη τη σειρά Lord of The Rings) και $15 ανά εκατομμύριο output tokens.

Δημοτικότητα μεταξύ προγραμματιστών

Τα τελευταία χρόνια, τα AI μοντέλα της Anthropic έχουν κερδίσει την προτίμηση προγραμματιστών και επιχειρήσεων, κυρίως λόγω της υψηλής απόδοσής τους σε εργασίες λογισμικού. Η Apple και η Meta φέρεται να χρησιμοποιούν εσωτερικά τα Claude AI μοντέλα, ενώ η Anthropic έχει αναπτύξει σημαντική δραστηριότητα προσφέροντας API πρόσβαση σε εφαρμογές προγραμματισμού όπως τα Cursor, Windsurf και Replit. Πρόσφατα, το GPT-5 της OpenAI αμφισβήτησε την κυριαρχία της Anthropic, ξεπερνώντας τα Claude μοντέλα σε διάφορες δοκιμές προγραμματισμού.

Επιδόσεις σε benchmarks

Η Anthropic αναφέρει ότι το Claude Sonnet 4.5 επιτυγχάνει κορυφαία αποτελέσματα σε αρκετά coding benchmarks, όπως το SWE-Bench Verified. Ωστόσο, ο ερευνητής AI της Anthropic, David Hershey, δήλωσε στο TechCrunch ότι η απόδοση του Claude Sonnet 4.5 δεν αποτυπώνεται πλήρως μόνο μέσα από τα benchmarks.

Πραγματικές δοκιμές και δυνατότητες

Ο Hershey ανέφερε ότι έχει παρατηρήσει το Claude Sonnet 4.5 να γράφει κώδικα αυτόνομα για έως και 30 ώρες σε δοκιμές με εταιρικούς πελάτες. Μέσα σε αυτό το διάστημα, το μοντέλο κατάφερε όχι μόνο να δημιουργήσει μια εφαρμογή, αλλά και να στήσει υπηρεσίες βάσης δεδομένων, να αγοράσει domain names και να πραγματοποιήσει έλεγχο SOC 2 για την ασφάλεια του προϊόντος.

Απόψεις από τον χώρο της τεχνολογίας

Σε δήλωσή του στο TechCrunch, ο CEO της Cursor, Micheal Truell, ανέφερε ότι το Claude Sonnet 4.5 προσφέρει κορυφαίες επιδόσεις στον προγραμματισμό, ειδικά σε εργασίες μεγάλης διάρκειας. Ο CEO της Windsurf, Jeff Wang, χαρακτήρισε το Claude Sonnet 4.5 ως “νέα γενιά μοντέλων προγραμματισμού”.

Ευθυγράμμιση και ασφάλεια του μοντέλου

Η Anthropic υποστηρίζει ότι το Claude Sonnet 4.5 είναι το πιο ευθυγραμμισμένο frontier AI μοντέλο της μέχρι σήμερα, με χαμηλότερα ποσοστά κολακείας και παραπλάνησης σε σχέση με προηγούμενες εκδόσεις. Επιπλέον, η εταιρεία έχει ενισχύσει την ανθεκτικότητα του Claude απέναντι σε επιθέσεις prompt injection.

Νέες δυνατότητες και εργαλεία

Παράλληλα με το λανσάρισμα του Claude Sonnet 4.5, η Anthropic παρουσιάζει και το Claude Agent SDK. Σύμφωνα με την εταιρεία, πρόκειται για την ίδια υποδομή που χρησιμοποιεί το Claude Code και μπορεί να βοηθήσει τους προγραμματιστές να δημιουργήσουν τους δικούς τους agents.

Προεπισκόπηση “Imagine with Claude”

Η Anthropic διαθέτει επίσης μια προσωρινή ερευνητική προεπισκόπηση με τίτλο “Imagine with Claude” για συνδρομητές Max, όπου το AI μοντέλο δημιουργεί λογισμικό σε πραγματικό χρόνο. Η εταιρεία αναφέρει ότι το μοντέλο ανταποκρίνεται άμεσα στα αιτήματα των χρηστών, χωρίς προκαθορισμένες λειτουργίες ή έτοιμο κώδικα.

Ταχύτητα ανταγωνισμού στην AI

Ο έντονος ανταγωνισμός στον χώρο της τεχνητής νοημοσύνης έχει οδηγήσει τις εταιρείες να παρουσιάζουν νέα flagship μοντέλα κάθε λίγους μήνες. Το Claude Sonnet 4.5 κυκλοφορεί λιγότερο από δύο μήνες μετά το προηγούμενο AI μοντέλο της Anthropic, το Claude Opus 4.1. Αυτοί οι γρήγοροι κύκλοι παραγωγής δυσκολεύουν κάθε εταιρεία να διατηρήσει το προβάδισμα για μεγάλο χρονικό διάστημα.

[ Πηγή: TechCrunch ]

Άφησε ένα σχόλιο!

εισάγετε το σχόλιό σας!
παρακαλώ εισάγετε το όνομά σας εδώ

Τυχαία

Σχετικά

Ο Guillermo del Toro αναθέτει στον σκηνοθέτη του The Empty Man να διασκευάσει τη horror νουβέλα The Boy In The Box για το Netflix.

Ο Γκιγιέρμο ντελ Τόρο συνεργάζεται ξανά με το Netflix, αυτή τη φορά αναθέτοντας στον Ντέιβιντ Πράιορ τη σκηνοθεσία της νουβέλας τρόμου του, «The Boy in the Iron Box». Η ιστορία ακολουθεί μισθοφόρους που βρίσκουν ένα αλυσοδεμένο κουτί σε ένα φρούριο, ενώ η παραγωγή ξεκινά τον Οκτώβριο.

Αυτό το παιχνίδι σε στυλ Super Punch-Out!! έρχεται στο Switch – ρίξτε μια ματιά.

Το Baki Hanma: Blood Arena, βασισμένο στο δημοφιλές anime, κυκλοφορεί στο Switch στις 11 Σεπτεμβρίου 2025 με τιμή 29,99 δολάρια. Πρόκειται για ένα 2D παιχνίδι μάχης με 12 μοναδικούς αντιπάλους, πέντε τοποθεσίες, ειδικές επιθέσεις και πρωτότυπο soundtrack, προσφέροντας έντονες αναμετρήσεις και ατμόσφαιρα shonen.

Μόλις 8 χρόνια μετά, το Assassin’s Creed φέρνει «δύναμη, βία, σεξ, απληστία και εκδίκηση» στο Netflix ως τηλεοπτική σειρά.

Η σειρά Assassin’s Creed του Netflix είχε ανακοινωθεί το 2017, αλλά προχώρησε αργά, με ελάχιστες ενημερώσεις και αλλαγές showrunner. Τώρα, με νέους παραγωγούς, υπόσχεται να εστιάσει στη δύναμη, τη βία, το σεξ και τη διασύνδεση των ανθρώπων, αν και πολλοί παραμένουν δύσπιστοι για το τελικό αποτέλεσμα.

Το BioShock 4 δεν κατάφερε να εντυπωσιάσει στην εσωτερική αξιολόγηση της 2K, με αποτέλεσμα αλλαγές στην ηγεσία και ανανέωση της πλοκής.

Το BioShock 4 δεν εντυπωσίασε στη δοκιμή της 2K, οδηγώντας σε αλλαγές ηγεσίας και αναθεώρηση της ιστορίας. Ακυρώθηκε επίσης το remake του πρώτου BioShock. Η Cloud Chamber καλείται να γίνει πιο ευέλικτη, ενώ οι εργαζόμενοι ανησυχούν για περικοπές. Η 2K δηλώνει δεσμευμένη στην επιτυχία της σειράς.

Αυτοί οι YC founders άλλαξαν κατεύθυνση πέντε φορές πριν δημιουργήσουν μια κοινωνική εφαρμογή που προσέλκυσε 300.000 χρήστες και ξεπέρασε το $1 εκατομμύριο ετήσια έσοδα...

Οι ιδρυτές της Candle, μετά από πολλές αποτυχημένες ιδέες, δημιούργησαν μια εφαρμογή που ενισχύει τις σχέσεις με καθημερινές ερωτήσεις και παιχνίδια. Η εφαρμογή γνώρισε γρήγορη επιτυχία, φτάνοντας τους 300.000 χρήστες, και ήδη αποφέρει σημαντικά έσοδα, δείχνοντας ισχυρό product-market fit και προοπτικές περαιτέρω ανάπτυξης.

Η 6η Ιουνίου θα είναι μια σπουδαία μέρα για τους θαυμαστές του Dandadan.

Η δεύτερη σεζόν του Dandadan θα κυκλοφορήσει τρία επεισόδια στις 6 Μαΐου 2025, με πλήρη πρεμιέρα στις 3 Ιουλίου 2025 σε Crunchyroll και Netflix. Η σειρά έχει κερδίσει αναγνώριση για την ιστορία και τους χαρακτήρες της, αποδεικνύοντας ότι δεν απαιτούνται υπερφυσικές δυνάμεις για την επιτυχία ενός shonen anime.

Κατηγορίες