Κυκλοφορία του DGX Spark και σύγκριση με Strix Halo
Το μικρό χρυσό κουτί της Nvidia, γεμάτο AI ισχύ, το DGX Spark, κυκλοφόρησε επιτέλους. Αξίζει όμως πραγματικά; Η απάντηση εξαρτάται από το ποιος ρωτάει και τι ακριβώς ζητάει από το Spark. Σε αρκετές περιπτώσεις, δεν είναι ταχύτερο από ένα άλλο μικρό σύστημα με το chip Strix Halo της AMD, το οποίο κοστίζει περίπου τα μισά. Αυτό πονάει.
Σημασία της ακρίβειας στα floating point
Το ζήτημα εδώ σχετίζεται κυρίως με την ακρίβεια των floating point υπολογισμών. Ίσως το θέμα να φαίνεται τεχνικό, αλλά η ουσία είναι απλή: μειώνοντας την ακρίβεια, αυξάνεται η ταχύτητα εις βάρος της τελικής ακρίβειας του AI μοντέλου.
FP4 βελτιστοποιήσεις και επιδόσεις
Όπως όλα τα συστήματα της Nvidia με την τελευταία τεχνολογία Blackwell, το DGX Spark διαθέτει ειδικές βελτιστοποιήσεις για το ταχύτερο και χαμηλότερης ακρίβειας επίπεδο floating point, γνωστό ως FP4. Με απλά λόγια, τα AI μοντέλα αποδίδουν καλύτερα με μεγαλύτερη ακρίβεια όπως το FP8, αλλά αυτό συνεπάγεται χαμηλότερη ταχύτητα—και σημαντικά χαμηλότερη σε σχέση με GPU που υποστηρίζουν FP4.
Τιμές και τεχνικά χαρακτηριστικά
Ας δούμε πώς συγκρίνονται τα δύο συστήματα. Ένα DGX Spark με 128 GB μνήμης και SSD 4 TB κοστίζει $3,999⇾, ενώ ένα Framework Desktop με το chip AMD Strix Halo (AMD Ryzen AI Max 385), 128 GB μνήμης και κορυφαίο WD Black SN850X SSD φτάνει τα $2,348. Η διαφορά στην τιμή είναι τεράστια.
Πρώτη μαρτυρία: Bijan Bowen
Ο Bijan Bowen αγόρασε το DGX Spark με δικά του χρήματα και δήλωσε επιφυλακτικός απέναντι στην υπερβολικά θετική κάλυψη που έλαβε το προϊόν στην αρχή. Δεν διευκρινίζει ακριβώς ποια floating point modes χρησιμοποίησε, αλλά ενδιαφέρεται για πραγματικές επιδόσεις και όχι για ειδικές περιπτώσεις που ευνοούν το FP4. Από ό,τι φαίνεται, οι δοκιμές του έγιναν σε FP8 ή FP16.
Συγκριτικά αποτελέσματα σε AI μοντέλα
Στο μοντέλο Llama 3.3 70B, με το ίδιο prompt “Πες μου μια ιστορία”, το Strix Halo αποδίδει 4.97 tokens το δευτερόλεπτο, ενώ το DGX Spark 4.67 tokens το δευτερόλεπτο.
Στο Qwen3 Coder (context length 32,768), με το prompt “Χρησιμοποιώντας HTML, IS και CSS, δημιούργησε ένα λειτουργικό σύστημα για browser”, το Strix Halo φτάνει τα 35.13 tokens το δευτερόλεπτο και το DGX Spark 38.03 tokens το δευτερόλεπτο.
Στο GPT-OSS-20B, το Strix Halo αντιμετώπισε πρόβλημα να ξεπεράσει context length 8,192. Με το prompt “Εξήγησε την έννοια της ποσοτικοποίησης σε έναν 85χρονο”, το Strix Halo παράγει 64.69 tokens το δευτερόλεπτο, ενώ το DGX Spark 60.33 tokens το δευτερόλεπτο.
Συμπέρασμα απόδοσης FP8/FP16
Συνολικά, όσον αφορά τις επιδόσεις σε FP8 και FP16, το DGX Spark κοστίζει τα διπλάσια από το Strix Halo για παρόμοια αποτελέσματα. Αυτό είναι απογοητευτικό.
Δεύτερη μαρτυρία: Level1Techs
Ο Level1Techs υποστηρίζει ότι το DGX Spark λειτουργεί ως ένα μικρό AI εργαστήριο που υποστηρίζει ευρεία γκάμα λογισμικού και βοηθά στην εκμάθηση των πλεονεκτημάτων του FP4, όχι απαραίτητα στην κορυφαία απόδοση. Αναγνωρίζει ότι το Strix Halo προσφέρει παρόμοιες επιδόσεις σε FP8, αλλά τονίζει πως το Blackwell έχει hardware υποστήριξη για FP4. Δεν παρέχει όμως συγκριτικά τεστ.
Άλλες αξιολογήσεις και γενική εικόνα
Υπάρχουν και άλλες πρώιμες αξιολογήσεις, όπως του NetworkChuck, που καταλήγουν στο ίδιο συμπέρασμα. Για τα χρήματα, το DGX Spark είναι αργό, αλλά τα 128 GB μνήμης επιτρέπουν πολύ περισσότερα σε σχέση με μια τυπική desktop GPU, ενώ η υποστήριξη λογισμικού το καθιστά εξαιρετικό εργαλείο μάθησης.
Τελικές σκέψεις για το DGX Spark
Το DGX Spark είναι μια ενδιαφέρουσα συσκευή με εμφανείς αδυναμίες και περιορισμούς. Η τιμή του είναι υπερβολική σε σχέση με την ακατέργαστη απόδοση. Για τους περισσότερους χρήστες, ένα σύστημα με το chip Strix Halo της AMD προσφέρει πολύ καλύτερη αξία. Ωστόσο, το DGX Spark μπορεί να αποδειχθεί ιδιαίτερα χρήσιμο, ανάλογα με τους στόχους ή το τι θέλει να μάθει κανείς.