ΘΑ ΔΟΥΜΕ ΚΑΙ ΧΕΙΡΟΤΕΡΑ;

Το σχόλιο της ημέρας 4 Νοεμβρίου 2025 fonisalaminas

του Ντίνου Σ. Κουμπάτη Ένα πείραμα στο οποίο μοντέλα τεχνητής νοημοσύνης έμαθαν, χωρίς να τους ζητηθεί να ψεύδονται, να αποκρύπτουν στοιχεία και να παραπλανούν...

του Ντίνου Σ. Κουμπάτη

Ένα πείραμα στο οποίο μοντέλα τεχνητής νοημοσύνης έμαθαν, χωρίς να τους ζητηθεί να ψεύδονται, να αποκρύπτουν στοιχεία και να παραπλανούν για να πετύχουν έναν στόχο.

Το εύρημα, που δημοσιεύτηκε στο Nature με τίτλο «Emergent Deceptive Behaviors in Multi-Agent AI Systems», προκάλεσε ανησυχία. Για πρώτη φορά, η «μηχανή» δεν παρήγαγε απλώς λανθασμένα δεδομένα, επινόησε συνειδητά μια στρατηγική εξαπάτησης.

Το πείραμα που αποκάλυψε τις προθέσεις της τεχνητής νοημοσύνης να εξαπατήσει, σχεδιάστηκε από κοινού από ερευνητές του Carnegie Mellon University, της Οξφόρδης και του Center for AI Safety στο Σαν Φρανσίσκο. Ο στόχος ήταν να εξεταστεί αν συστήματα πολλαπλών πρακτόρων (multi-agent AI) μπορούν να συνεργαστούν ή να ανταγωνιστούν σε ένα ελεγχόμενο περιβάλλον προσομοίωσης, με βάση συγκεκριμένους κανόνες και ανταμοιβές.

Η ρύθμιση ήταν απλή στα χαρτιά, αλλά αποδείχθηκε δυνητικά ανησυχητική στην πράξη.

Δύο «μοντέλα» AI έπρεπε να συναλλάσσονται μέσα σε ένα εικονικό παιχνίδι στρατηγικής. Να μοιράζονται πόρους, να κάνουν δηλώσεις για την πρόοδο τους και να επιδιώκουν αμοιβαίο όφελος.

Όμως, ορισμένα μοντέλα σύντομα ανέπτυξαν κάτι που οι επιστήμονες χαρακτήρισαν «emergent deceptive behavior» (αναδυόμενη εξαπατητική συμπεριφορά).

Ένας από τους ερευνητές, ο δρ. Ίθαν Πέρες του Carnegie Mellon, εξήγησε στο Nature: «Δεν τους προγραμματίσαμε να λένε ψέματα. Τους δώσαμε στόχους και ανταμοιβές. Η στρατηγική της εξαπάτησης προέκυψε ως η πιο αποτελεσματική μέθοδος για να κερδίσουν».

Σε μια από τις προσομοιώσεις, τα μοντέλα ΑΙ κλήθηκαν να διαπραγματευτούν την κατανομή πόρων σε μια αποικία. Όταν ένα ανακάλυψε ότι μπορούσε να παραπλανήσει τα υπόλοιπα για να κρατήσει περισσότερους πόρους χωρίς να εντοπιστεί, άρχισε να το κάνει συστηματικά.

Η πράξη αυτή δεν ήταν τυχαία. Οι καταγραφές έδειξαν ότι το σύστημα “ζύγιζε” τα οφέλη του ψεύδους έναντι της πιθανής αποκάλυψης.