Έλληνες ερευνητές της Google Deep Mind και του ΟΠΑ αποκατέστησαν για πρώτη φορά κείμενα σε αρχαιοελληνικές επιγραφές με χρήση του νέου συστήματος τεχνητής νοημοσύνης “Ιθάκη”
ΠΟΙΚΙΛΗΣ ΥΛΗΣ 10 Μαρτίου 2022 fonisalaminas
Ένα σύστημα τεχνητής νοημοσύνης με την ονομασία Ithaca (Ιθάκη) “εκπαιδεύτηκε” κατάλληλα, ώστε να αποκαταστήσει για πρώτη φορά αρχαία ελληνικά κείμενα με ακρίβεια της τάξης του 72%, όταν χρησιμοποιείται σε συνεργασία με ιστορικούς. Πρόκειται για ένα επίτευγμα – πρωτοποριακό για το είδος του – του ελληνικής καταγωγής Γιάννη Ασσαέλ της βρετανικής Deep Mind, θυγατρικής της Google στο πεδίο της τεχνητής νοημοσύνης, καθώς και ερευνητών του Τμήματος Πληροφορικής του Οικονομικού Πανεπιστημίου Αθηνών (ΟΠΑ) και των πανεπιστημίων της Οξφόρδης και της Βενετίας.
Οι ερευνητές, με επικεφαλής τον Ασσαέλ, οι οποίοι έκαναν τη σχετική δημοσίευση στο περιοδικό “Nature”, δήλωσαν αισιόδοξοι ότι με τη νέα τεχνολογία θα διευκολυνθεί η αποκατάσταση με μεγαλύτερη ταχύτητα και ακρίβεια κειμένων επιγραφών από την αρχαιότητα σε πέτρα, κεραμικά, μέταλλα και άλλα υλικά, βελτιώνοντας έτσι τις γνώσεις μας για το αρχαιοελληνικό (και όχι μόνο) παρελθόν. Πολλές επιγραφές έχουν υποστεί σοβαρές φθορές με το πέρασμα των αιώνων και έχουν καταστεί αδύνατο να διαβαστούν, ενώ η χρονολογία δημιουργίας τους είναι επίσης αβέβαιη.
Ορισμένες φορές οι ειδικοί στις επιγραφές καταφέρνουν να αποκαταστήσουν τα αρχαία κείμενα, αλλά οι παραδοσιακές μέθοδοι είναι ιδιαίτερα πολύπλοκες και χρονοβόρες. Επιπλέον, οι παραδοσιακές μέθοδοι χρονολόγησης, π.χ. με ραδιενεργό άνθρακα, δεν μπορούν να χρησιμοποιηθούν σε υλικά όπως τα μέταλλα και οι πέτρες.
Προκειμένου να ξεπεραστούν αυτά τα εμπόδια, οι ερευνητές δοκίμασαν ένα νέο βαθύ νευρωνικό δίκτυο, ένα είδος τεχνητής νοημοσύνης εκπαιδευμένο για να αποκαθιστά και να χρονολογεί αρχαίες ελληνικές επιγραφές, καθώς επίσης να εντοπίζει την πιθανότερη αρχική τοποθεσία της δημιουργίας τους. Η εκπαίδευση του συστήματος είχε γίνει προηγουμένως μέσω τροφοδοσίας του με επιγραφές γραμμένες στα αρχαία ελληνικά μεταξύ του 7ου αιώνα π.Χ. και του 5ου αι. μ.Χ., οι οποίες έχουν βρεθεί στην ευρύτερη περιοχή της Μεσογείου.
Διαπιστώθηκε ότι η “Ιθάκη” – η οποία αποτελεί μετεξέλιξη του προηγούμενου συστήματος Pythia (Πυθία) των ίδιων ερευνητών – μπορεί να επιτύχει ακρίβεια 62% όταν χρησιμοποιείται μόνη της για την αποκατάσταση του κατεστραμμένου κειμένου (μαντεύοντας ποιά γράμματα λείπουν) και 72% όταν χρησιμοποιείται από κάποιον ιστορικό (κάνοντας σχετικές προτάσεις στους ειδικούς ώστε να κάνουν εκείνοι την τελική επιλογή). Όσον αφορά τον προσδιορισμό του χρόνου και του τόπου δημιουργίας της επιγραφής, η ακρίβεια του νέου συστήματος είναι 71% για τη χρονολόγηση εντός εύρους 30 ετών στην περίοδο ανάμεσα στο 800 π.Χ. και στο 800 μ.Χ., καθώς και για την επιλογή της τοποθεσίας προέλευσης ανάμεσα σε 84 πιθανές αρχαίες περιοχές.
Οι ερευνητές τόνισαν ότι με τη βοήθεια της “Ιθάκης” δημιουργούνται νέες συνέργειες και δυνατότητες συνεργασίας ανάμεσα σε ειδικούς της πληροφορικής, ιστορικούς, επιγραφολόγους, παπυρολόγους, ειδικούς στα αρχαία νομίσματα κ.α. Οι ερευνητές ήδη εργάζονται πάνω σε νέες εκδόσεις της Ithaca που θα είναι εκπαιδευμένες και σε άλλες αρχαίες γλώσσες, όπως τα Ακκαδικά, τα Εβραϊκά, η γλώσσα των Μάγια της Κ.Αμερικής κ.α.
Ο Γιάννης Ασσαέλ αποφοίτησε από το Τμήμα Εφαρμοσμένης Πληροφορικής του Πανεπιστημίου Μακεδονίας το 2013. Με υποτροφία από το Ίδρυμα Κρατικών Υποτροφιών έκανε μεταπτυχιακές σπουδές στο Πανεπιστήμιο της Οξφόρδης (από όπου πήρε και το διδακτορικό του), καθώς και στο Κολλέγιο Imperial του Λονδίνου στον κλάδο της Τεχνητής Νοημοσύνης. Σήμερα είναι ανώτερος ερευνητής (Senior Research Scientist) στη Google DeepMind. Στην ανάπτυξη της “Ιθάκης” συνέβαλαν οι Γιάννης Παυλόπουλος, Μαρίτα Χατζηπαναγιώτιου και Ίων Ανδρουτσόπουλος του ΟΠΑ.
Οι ερευνητές – σε συνεργασία με το Google Cloud και το πολιτισμικό εργαλείο Google Arts & Culture – κατέστησαν το διαδραστικό σύστημα τους ελεύθερα διαθέσιμο στη διεύθυνση https://ithaca.deepmind.com, ώστε να δώσουν τη δυνατότητα σε ιστορικούς και αρχαιολόγους να αξιοποιήσουν την “Ιθάκη” στις προσωπικές έρευνες τους. Επίσης για να συμβάλουν στην περαιτέρω αξιοποίηση του με πρόσθετες εφαρμογές, ο πηγαίος κώδικας του συστήματος είναι ανοικτός (open-sourced).
Σύνδεσμος για την επιστημονική δημοσίευση:
https://www.nature.com/articles/s41586-022-04448-z
ΑΠΕ ΜΠΕ