TECH

Περί τα 191.000 βιβλία «εκπαιδεύουν» την Τεχνητή Νοημοσύνη χωρίς την άδεια των συγγραφέων τους

Περί τα 191.000 βιβλία «εκπαιδεύουν» την Τεχνητή Νοημοσύνη χωρίς την άδεια των συγγραφέων τους
191.000 e-books από την «πειρατική» βάση δεδομένων Books3 χρησιμοποιούνται για την εκπαίδευση συστημάτων τεχνητής νοημοσύνης zoha noor / Pixabay

Σχεδόν 200.000 βιβλία χρησιμοποιούνται για την εκπαίδευση συστημάτων τεχνητής νοημοσύνης από τις μεγαλύτερες εταιρείες στο χώρο της τεχνολογίας. Αλλά κανείς δεν το είπε στους συγγραφείς τους…

Το σύστημα ονομάζεται Books3, και σύμφωνα με έρευνα του The Atlantic, τα δεδομένα βασίζονται σε μια συλλογή πάνω από 191.000 «πειρατικών» ηλεκτρονικών βιβλίων (εκ των οποίων τα 183.000 φέρουν το όνομα του δημιουργού τους) που καλύπτουν όλα τα είδη, από ερωτική λογοτεχνία μέχρι ποίηση, και περιλαμβάνουν έργα διάσημων συγγραφέων όπως η Μάργκαρετ Άτγουντ, ο Στίβεν Κινγκ και η Τζ. Κ. Ρόουλινγκ, σε διάφορες γλώσσες. Τα βιβλία βοηθούν τα συστήματα δημιουργικής τεχνητής νοημοσύνης να μάθουν πώς να επικοινωνούν πληροφορίες.

Κάποια κείμενα εκπαίδευσης της ΤΝ μπορούν να αντληθούν από άρθρα που αναρτώνται στο διαδίκτυο, αλλά η υψηλής ποιότητας ΤΝ απαιτεί υψηλής ποιότητας κείμενο για την απορρόφηση της γλώσσας, σύμφωνα με το Atlantic, και σε αυτό το σημείο έρχονται τα βιβλία. Το Books3 είναι ήδη αντικείμενο πολλαπλών μηνύσεων κατά της Meta και άλλων εταιρειών που χρησιμοποιούν το σύστημα για την εκπαίδευση της ΤΝ.

Τώρα, χάρη σε μια βάση δεδομένων που δημοσίευσε το The Atlantic την περασμένη εβδομάδα και αντλεί πληροφορίες από το Books3, οι συγγραφείς μπορούν να δουν αν τα βιβλία τους χρησιμοποιούνται για την εκπαίδευση αυτών των συστημάτων τεχνητής νοημοσύνης. Και πολλοί δεν είναι ευχαριστημένοι.

«Είμαι εξοργισμένη και ταυτόχρονα αισθάνομαι εντελώς αβοήθητη», έγραψε η Μέρι Χ. Κ. Τσόι στα μέσα κοινωνικής δικτύωσης, όταν ανακάλυψε ότι το πρώτο της μυθιστόρημα «Emergency Contact», μπεστ σέλερ των New York Times, οποίο περιλαμβάνεται στη λίστα του Books3. «Είμαι έξαλλη και θέλω να αγωνιστώ, αλλά είμαι επίσης τόσο κουρασμένη».

Η Μιν Τζιν Λι, συγγραφέας των μυθιστορημάτων «Pachinko» και «Free Food for Millionaires», εξέφρασε παρόμοιες σκέψεις, χαρακτηρίζοντας ευθέως τη χρήση των βιβλίων της «κλοπή».

«Ξόδεψα τρεις δεκαετίες της ζωής μου για να γράψω τα βιβλία μου», είπε. «Οι εταιρείες ΤΝ έκλεψαν τη δουλειά μου, τον χρόνο και τη δημιουργικότητά μου. Έκλεψαν τις ιστορίες μου. Έκλεψαν ένα κομμάτι του εαυτού μου».

Η συγγραφέας ρομαντικών μυθιστορημάτων Νόρα Ρόμπερτς, έχει 206 βιβλία στη βάση δεδομένων Books3, τα περισσότερα από κάθε εν ζωή συγγραφέα. Ο μόνος που την ξεπερνάει είναι ο Ουίλιαμ Σαίξπηρ. Η ίδια χαρακτήρισε τη βάση δεδομένων και τη χρήση της από εταιρείες τεχνολογίας «λάθος από κάθε άποψη».

«Είμαστε ανθρώπινα όντα, είμαστε συγγραφείς και μας εκμεταλλεύονται άνθρωποι που θέλουν να χρησιμοποιήσουν τη δουλειά μας, χωρίς άδεια ή αποζημίωση, για να “γράψουν” βιβλία, σενάρια, δοκίμια, επειδή είναι ένας φθηνός και εύκολος τρόπος», δήλωσε η Ρόμπερτς στο CNNi.

Η τεχνητή νοημοσύνη, στα χέρια μεγάλων τεχνολογικών εταιρειών, έχει εξελιχθεί σε σημαντική ανησυχία για πολλούς συγγραφείς. Η Ένωση Σεναριογράφων της Αμερικής προχώρησε σε απεργία αυτό το καλοκαίρι, διεκδικώντας μεταξύ άλλων αυστηρά όρια στη χρήση της τεχνητής νοημοσύνης στη συγγραφή ταινιών και τηλεοπτικών εκπομπών. Το εργαλείο ChatGPT, ειδικότερα, έχει χρησιμοποιηθεί για τα πάντα, από τη συγγραφή πανεπιστημιακών εργασιών μέχρι νομικών εγγράφων.

Όρια στην τεχνητή νοημοσύνη

Και δεν είναι μόνο οι συγγραφείς που ανησυχούν. Οι εικαστικοί καλλιτέχνες βρέθηκαν στην ίδια κατάσταση πέρυσι, όταν ανακάλυψαν ότι η δουλειά τους χρησιμοποιήθηκε χωρίς την άδειά τους για την εκπαίδευση εργαλείων τεχνητής νοημοσύνης που μετατρέπουν το κείμενο σε εικόνες.

Στα τέλη του περασμένου μήνα, ο πρόεδρος των ΗΠΑ Τζο Μπάιντεν ανακοίνωσε τα σχέδιά του να εισαγάγει εκτελεστικό διάταγμα για την τεχνητή νοημοσύνη μέσα σε αυτό το φθινόπωρο, λέγοντας ότι η χώρα θα ηγηθεί «στο δρόμο προς την υπεύθυνη καινοτομία της ΤΝ».

Η Νόρα Ρόμπερτς καλεί τόσο τους συγγραφείς όσο και το αναγνωστικό κοινό να ενωθούν στην καταπολέμηση αυτών των ζητημάτων. «Εμείς που δημιουργούμε ιστορίες πρέπει να ενωθούμε για να καταπολεμήσουμε αυτή την κατάχρηση του ταλέντου και της σκληρής δουλειάς μας», είπε. «Πρέπει να υπερασπιστούμε τη δουλειά μας και τη δουλειά των άλλων. Ελπίζω οι αναγνώστες και οι θεατές να σταθούν στο πλευρό μας σε αυτό το ζωτικό ζήτημα».

Με πληροφορίες από: These books are being used to train AI. No one told the authors by Leah Asmelash, CNN

ΔΗΜΟΦΙΛΗ