Νέο έργο διευκολύνει την πρόσβαση της τεχνητής νοημοσύνης στα δεδομένα της Wikipedia.

Η Wikimedia Deutschland ανακοίνωσε μια νέα βάση δεδομένων, το Wikidata Embedding Project, που αξιοποιεί προηγμένη σημασιολογική αναζήτηση για να κάνει τη γνώση της Wikipedia πιο προσβάσιμη στην τεχνητή νοημοσύνη. Το έργο, ανοιχτό και συνεργατικό, διευκολύνει φυσικές ερωτήσεις και ενισχύει την αξιοπιστία των AI μοντέλων.
Χρόνος αν΄άγνωσης: 2 λεπτά

Νέα βάση δεδομένων για την τεχνητή νοημοσύνη

Την Τετάρτη, η Wikimedia Deutschland ανακοίνωσε μια νέα βάση δεδομένων που στοχεύει να κάνει τη γνώση της Wikipedia πιο προσβάσιμη στα μοντέλα τεχνητής νοημοσύνης. Το Wikidata Embedding Project εφαρμόζει μια αναζήτηση βασισμένη σε διανύσματα, μια τεχνική που βοηθά τους υπολογιστές να κατανοούν το νόημα και τις σχέσεις μεταξύ των λέξεων, στα υπάρχοντα δεδομένα της Wikipedia και των αδελφών της πλατφορμών, που περιλαμβάνουν σχεδόν 120 εκατομμύρια καταχωρήσεις.

Υποστήριξη για φυσική γλώσσα και MCP

Με την προσθήκη υποστήριξης για το Model Context Protocol (MCP), ένα πρότυπο που διευκολύνει την επικοινωνία των συστημάτων τεχνητής νοημοσύνης με πηγές δεδομένων, το έργο καθιστά τα δεδομένα πιο εύκολα προσβάσιμα σε ερωτήματα φυσικής γλώσσας από LLMs.

Συνεργασίες και τεχνολογική υποδομή

Το έργο υλοποιήθηκε από το γερμανικό παράρτημα της Wikimedia σε συνεργασία με την Jina.AI, εταιρεία που ειδικεύεται στην αναζήτηση με νευρωνικά δίκτυα, και τη DataStax, εταιρεία που ανήκει στην IBM και δραστηριοποιείται στα δεδομένα εκπαίδευσης σε πραγματικό χρόνο.

Βελτιωμένη αναζήτηση και αξιοποίηση δεδομένων

Η Wikidata προσφέρει εδώ και χρόνια δεδομένα σε μορφή αναγνώσιμη από μηχανές, αλλά τα υπάρχοντα εργαλεία επέτρεπαν μόνο αναζήτηση με λέξεις-κλειδιά ή ερωτήματα SPARQL, μια εξειδικευμένη γλώσσα ερωτημάτων. Το νέο σύστημα συνεργάζεται καλύτερα με συστήματα retrieval-augmented generation (RAG), επιτρέποντας στα μοντέλα τεχνητής νοημοσύνης να αντλούν εξωτερικές πληροφορίες και δίνοντας στους προγραμματιστές τη δυνατότητα να βασίζουν τα μοντέλα τους σε γνώση που έχει ελεγχθεί από συντάκτες της Wikipedia.

Παροχή σημασιολογικού πλαισίου

Τα δεδομένα είναι δομημένα ώστε να προσφέρουν ουσιαστικό σημασιολογικό πλαίσιο. Για παράδειγμα, μια αναζήτηση στη βάση για τη λέξη «επιστήμονας» εμφανίζει λίστες με διακεκριμένους πυρηνικούς επιστήμονες, καθώς και επιστήμονες που εργάστηκαν στα Bell Labs. Περιλαμβάνονται επίσης μεταφράσεις της λέξης «επιστήμονας» σε διάφορες γλώσσες, μια εγκεκριμένη εικόνα από τη Wikimedia με επιστήμονες εν ώρα εργασίας, καθώς και συνδέσεις με συναφείς έννοιες όπως «ερευνητής» και «μελετητής».

Πρόσβαση και εκδηλώσεις για προγραμματιστές

Η βάση δεδομένων είναι δημόσια διαθέσιμη στο Toolforge. Η Wikidata διοργανώνει επίσης ένα webinar για ενδιαφερόμενους προγραμματιστές στις 9 Οκτωβρίου.

Ανάγκη για αξιόπιστα δεδομένα στην τεχνητή νοημοσύνη

Το νέο αυτό έργο έρχεται σε μια περίοδο όπου οι δημιουργοί τεχνητής νοημοσύνης αναζητούν ποιοτικές πηγές δεδομένων για τη βελτίωση των μοντέλων τους. Τα συστήματα εκπαίδευσης έχουν εξελιχθεί και πλέον αποτελούνται από σύνθετα περιβάλλοντα, αλλά εξακολουθούν να απαιτούν προσεκτικά επιλεγμένα δεδομένα για να λειτουργήσουν σωστά. Σε εφαρμογές που απαιτούν υψηλή ακρίβεια, η ανάγκη για αξιόπιστα δεδομένα είναι ιδιαίτερα επιτακτική. Παρόλο που κάποιοι υποτιμούν τη Wikipedia, τα δεδομένα της είναι πολύ πιο ακριβή σε σύγκριση με γενικά σύνολα όπως το Common Crawl, που αποτελεί μια τεράστια συλλογή ιστοσελίδων από όλο το διαδίκτυο.

Νομικές και οικονομικές προεκτάσεις

Σε ορισμένες περιπτώσεις, η αναζήτηση ποιοτικών δεδομένων μπορεί να έχει σημαντικό οικονομικό κόστος για τα εργαστήρια τεχνητής νοημοσύνης. Τον Αύγουστο, η Anthropic πρότεινε να διευθετήσει μια αγωγή με ομάδα συγγραφέων, των οποίων τα έργα χρησιμοποιήθηκαν ως υλικό εκπαίδευσης, προσφέροντας αποζημίωση ύψους $1.5 δισεκατομμυρίων για να τερματιστούν οι σχετικές αξιώσεις.

Ανεξαρτησία και ανοιχτή πρόσβαση

Σε δήλωσή του προς τα μέσα, ο υπεύθυνος του έργου Wikidata AI, Philippe Saadé, τόνισε την ανεξαρτησία του εγχειρήματος από μεγάλες εταιρείες τεχνητής νοημοσύνης ή τεχνολογικούς κολοσσούς. Όπως ανέφερε, «Η έναρξη του Embedding Project αποδεικνύει ότι η ισχυρή τεχνητή νοημοσύνη δεν χρειάζεται να ελέγχεται από λίγες εταιρείες. Μπορεί να είναι ανοιχτή, συνεργατική και σχεδιασμένη για όλους».

[ Πηγή: TechCrunch ]

Άφησε ένα σχόλιο!

εισάγετε το σχόλιό σας!
παρακαλώ εισάγετε το όνομά σας εδώ

Τυχαία

Σχετικά

Πότε θα είναι διαθέσιμο το The Conjuring: Last Rites σε υπηρεσίες streaming;

Το The Conjuring: Last Rites θα κυκλοφορήσει ψηφιακά στις 7 Οκτωβρίου σε πλατφόρμες όπως Amazon Prime Video και AppleTV, με ειδικά αφιερώματα. Η κυκλοφορία σε 4K UHD, Blu-ray και DVD αναμένεται στις 25 Νοεμβρίου, ενώ συλλογές με όλες τις ταινίες του σύμπαντος Conjuring θα διατεθούν επίσης.

Το ασφαλιστικό τμήμα της Tesla κατηγορείται από τη ρυθμιστική αρχή της Καλιφόρνιας για «σοβαρές καθυστερήσεις» και «συστημικές αποτυχίες».

Η Tesla αντιμετωπίζει σοβαρές κυρώσεις από την Καλιφόρνια λόγω συστηματικών καθυστερήσεων και αδικαιολόγητων απορρίψεων αποζημιώσεων, παρά τις επανειλημμένες προειδοποιήσεις. Οι παραβιάσεις αυξήθηκαν δραματικά, προκαλώντας οικονομική ζημιά στους πελάτες. Η εταιρεία καλείται να απαντήσει εντός 15 ημερών, ενώ κινδυνεύει με σημαντικά πρόστιμα και νομικές συνέπειες.

Οι πρωταγωνιστές του A House of Dynamite μιλούν για το καθηλωτικό θρίλερ του Netflix με θέμα τα πυρηνικά, τονίζοντας πόσο ρεαλιστικό και τρομακτικά πιθανό...

Το «A House of Dynamite» στο Netflix παρουσιάζει με ρεαλισμό και αγωνία τις συνέπειες μιας πυρηνικής απειλής, εστιάζοντας στις κρίσιμες στιγμές μετά τον εντοπισμό πυραύλου. Με εξαιρετικό καστ και αυθεντική αναπαράσταση διαδικασιών, η ταινία λειτουργεί ως προειδοποίηση για τους κινδύνους της ανθρώπινης διαχείρισης πυρηνικών όπλων.

Η ημερομηνία κυκλοφορίας του JoJo’s Bizarre Adventure: Steel Ball Run επιβεβαιώθηκε.

Το Steel Ball Run, το έβδομο μέρος του JoJo’s Bizarre Adventure, θεωρείται αριστούργημα του Araki και θα κυκλοφορήσει ως anime αποκλειστικά στο Netflix το 2026. Οι δημιουργοί διαβεβαιώνουν για υψηλή ποιότητα, ενώ οι θαυμαστές ελπίζουν σε εβδομαδιαία επεισόδια. Η ιστορία ακολουθεί τον Johnny Joestar και τον Gyro Zeppeli.

Η Amazon υποστηρίζει μια νέα υπηρεσία που περιγράφεται ως το «Netflix της Τεχνητής Νοημοσύνης» και θα επιτρέπει στους χρήστες να δημιουργούν τις δικές τους...

Η Amazon επενδύει στη Showrunner, μια νέα υπηρεσία που επιτρέπει στους χρήστες να δημιουργούν δικές τους τηλεοπτικές εκπομπές με τεχνητή νοημοσύνη, χρησιμοποιώντας υπάρχουσες ιστορίες. Η υπηρεσία προκαλεί ανησυχίες στη βιομηχανία ψυχαγωγίας για απώλεια θέσεων εργασίας, πνευματικά δικαιώματα και περιβαλλοντικές επιπτώσεις.

Ο επικεφαλής τεχνολογίας της Wiz, Ami Luttwak, για το πώς η τεχνητή νοημοσύνη μεταμορφώνει τις κυβερνοεπιθέσεις.

Η κυβερνοασφάλεια είναι πλέον αγώνας ταχύτητας και εξυπνάδας, καθώς η ενσωμάτωση της τεχνητής νοημοσύνης αυξάνει τα τρωτά σημεία. Επιχειρήσεις και επιτιθέμενοι αξιοποιούν AI, με συχνές επιθέσεις μέσω αλυσίδας εφοδιασμού. Η ασφάλεια πρέπει να σχεδιάζεται από την αρχή, με σωστή αρχιτεκτονική και υπεύθυνη διαχείριση δεδομένων.

Κατηγορίες