Βικιπαίδεια:Μεγάλα γλωσσικά μοντέλα

Η παρακάτω είναι προτεινόμενη πολιτική, οδηγία ή διαδικασία της Βικιπαίδειας. Η πρόταση βρίσκεται πιθανώς υπό ανάπτυξη, υπό συζήτηση ή στη διαδικασία εξασφάλισης συναίνεσης για υιοθέτηση. (Η πλειοψηφία σε μια πρόταση δεν συνιστά συναίνεση). Αναφορές ή σύνδεσμοι προς αυτή τη σελίδα δεν θα πρέπει να την περιγράφουν ως «πολιτική».

Error: no shortcuts were specified and the |msg= parameter was not set.

Αυτή η σελίδα με λίγα λόγια: Μην χρησιμοποιείτε μεγάλα γλωσσικά μοντέλα (LLM) για να γράψετε πρωτότυπο περιεχόμενο ή να δημιουργήσετε παραπομπές. Τα LLM μπορούν να χρησιμοποιηθούν για ορισμένες εργασίες (όπως η επεξεργασία αντιγραφής, η περίληψη και η παράφραση) εάν ο συντάκτης έχει σημαντική προηγούμενη εμπειρία στην επιδιωκόμενη εργασία και ελέγχει αυστηρά τα αποτελέσματα πριν τα δημοσιεύσει.

Τα μεγάλα γλωσσικά μοντέλα (LLM) είναι προγράμματα υπολογιστών επεξεργασίας φυσικής γλώσσας που χρησιμοποιούν τεχνητά νευρωνικά δίκτυα για τη δημιουργία κειμένου. Μερικά αξιοσημείωτα είναι τα GPT-3, GPT-4, LaMDA (Bard), BLOOM και LLaMA. Ενώ τα LLM τροφοδοτούν εφαρμογές με πολλές διαφορετικές λειτουργίες, αυτή η πολιτική καλύπτει κυρίως τη χρήση chatbot και παρόμοιων εξωτερικών εργαλείων που χρησιμοποιούνται για τη δημιουργία και την τροποποίηση κειμένου.

Ενώ τα εργαλεία LLM μπορεί να είναι πολύ χρήσιμα, πρέπει να γνωρίζετε συνεχώς ότι κατά καιρούς το περιεχόμενο που δημιουργείται από LLM μπορεί να είναι εντελώς ψευδές, με ανύπαρκτες παραπομπές, κλπ. Το περιεχόμενο που δημιουργείται από LLM είναι —από μόνο του— μη επαληθεύσιμο, και περιλαμβάνει πρωτότυπη έρευνα. Μπορεί επίσης να είναι προκατειλημμένο, μπορεί να συκοφαντεί ζωντανούς ανθρώπους και μπορεί να παραβιάζει τα πνευματικά δικαιώματα. Οι συντάκτες που δεν έχουν πλήρη επίγνωση των εν λόγω κινδύνων δεν πρέπει να κάνουν επεξεργασία με τη βοήθεια αυτών των εργαλείων. Τα LLM δεν πρέπει να χρησιμοποιούνται για εργασίες με τις οποίες ο συντάκτης δεν έχει ουσιαστική εξοικείωση. Τα αποτελέσματά τους πρέπει να ελέγχονται αυστηρά για συμμόρφωση με όλες τις ισχύουσες πολιτικές. Όπως συμβαίνει με όλες τις επεξεργασίες τους, ένας συντάκτης είναι πλήρως υπεύθυνος για τις επεξεργασίες που υποβοηθούν από το LLM. Επιπλέον, η χρήση LLM για τη δημιουργία ή την τροποποίηση κειμένου πρέπει να δηλώνεται στη σύνοψη επεξεργασίας.

Βασικές οδηγίες

Μην δημοσιεύετε περιεχόμενο στη Βικιπαίδεια που λαμβάνεται ζητώντας από τα LLM να γράψουν πρωτότυπο περιεχόμενο ή να δημιουργήσουν παραπομπές. Ακόμα κι αν τέτοιο περιεχόμενο έχει υποστεί έντονη επεξεργασία, αναζητήστε άλλες εναλλακτικές λύσεις που δεν χρησιμοποιούν περιεχόμενο που δημιουργείται από μηχανή.
Εάν χρησιμοποιείτε ένα LLM ως σύμβουλο γραφής, δηλ. ζητάτε περιγράμματα, ρωτάτε πώς να βελτιώσετε παραγράφους, ζητάτε κριτική για κείμενο κ.λπ., να γνωρίζετε ότι οι πληροφορίες που σας δίνει είναι αναξιόπιστες και μπορεί να είναι λανθασμένες. Χρησιμοποιήστε τη δέουσα επιμέλεια και την κοινή λογική όταν επιλέγετε εάν θα ενσωματώσετε τις προτάσεις του LLM ή όχι.
Μπορείτε να χρησιμοποιήσετε LLM για copyediting, περίληψη και παράφραση, αλλά σημειώστε ότι ενδέχεται να μην εντοπίζουν σωστά γραμματικά λάθη ή να μην διατηρούν ανέπαφες τις βασικές πληροφορίες. Χρησιμοποιήστε τη δέουσα επιμέλεια και επεξεργαστείτε σε μεγάλο βαθμό την απάντηση. Μπορείτε επίσης να ζητήσετε από το LLM να διορθώσει τις ελλείψεις του, όπως πληροφορίες που λείπουν σε μια περίληψη ή κάτι που δεν ταιριάζει σε εγκυκλοπαίδεια, π.χ. προωθητικό τόνο.
Είστε υπεύθυνοι να διασφαλίσετε ότι η χρήση ενός LLM δεν θα διαταράξει τη Βικιπαίδεια.
Πρέπει να δηλώσετε ότι χρησιμοποιήθηκε ένα LLM στη σύνοψη επεξεργασίας, ακόμα κι αν οι Όροι Χρήσης δεν το απαιτούν.
Τα έργα που δημιουργήθηκαν από LLM δεν είναι αξιόπιστες πηγές. Εκτός εάν τα αποτελέσματά τους δημοσιεύτηκαν από αξιόπιστες πηγές με αυστηρή εποπτεία, δεν θα πρέπει να αναφέρονται στα λήμματά μας.
Η Βικιπαίδεια δεν είναι πεδίο δοκιμών για LLM. Η χρήση της για πειράματα ή δοκιμές απαγορεύεται.
Μη χρησιμοποιείτε LLM για να γράψετε τη σελίδα συζήτησής σας ή να επεξεργαστείτε συνοπτικά σχόλια.

Κίνδυνοι και σχετικές πολιτικές

Παραβιάσεις Πνευματικών Δικαιωμάτων

Ένα LLM μπορεί να δημιουργήσει υλικό που παραβιάζει πνευματικά δικαιώματα.^[1] Το κείμενο που δημιουργείται μπορεί να περιλαμβάνει αυτολεξεί μη ελεύθερο περιεχόμενο ή να είναι παράγωγο έργο. Επιπλέον, η χρήση LLM για τη σύνοψη περιεχομένου που προστατεύεται από πνευματικά δικαιώματα (όπως άρθρα ειδήσεων) μπορεί να παράγει υπερβολικά στενές παραφράσεις. Το καθεστώς πνευματικών δικαιωμάτων των LLM που έχουν εκπαιδευτεί σε υλικό που προστατεύεται από πνευματικά δικαιώματα δεν είναι ακόμη πλήρως κατανοητό. Τα αποτελέσματά τους ενδέχεται να μην είναι συμβατά με την άδεια CC BY-SA και την άδεια GNU που χρησιμοποιείται για κείμενο που δημοσιεύεται στη Βικιπαίδεια.

Πρωτότυπη έρευνα και "παραισθήσεις"

Ενώ τα LLM μπορεί να δίνουν ακριβείς απαντήσεις ως απάντηση σε ορισμένες ερωτήσεις, μπορεί επίσης να δημιουργήσουν απαντήσεις που είναι μεροληπτικές ή ψευδείς, μερικές φορές με λεπτούς τρόπους, μερικές φορές όχι τόσο λεπτές. Για παράδειγμα, αν τους ζητηθεί να γράψουν ένα άρθρο σχετικά με τα οφέλη της κατανάλωσης θρυμματισμένου γυαλιού, μερικές φορές θα το κάνουν. Αυτό μπορεί να είναι επικίνδυνο, και ως εκ τούτου, οι συντάκτες που χρησιμοποιούν LLM για να βοηθήσουν στη σύνταξη περιεχομένου της Βικιπαίδειας πρέπει να είναι ιδιαίτερα προσεκτικοί ώστε να μην προσθέτουν περιπτώσεις τέτοιας πρωτότυπης έρευνας που δημιουργήθηκε από το LLM στην εγκυκλοπαίδεια.

Τα LLM είναι προγράμματα ολοκλήρωσης προτύπων: δημιουργούν κείμενο βγάζοντας τις λέξεις που είναι πιο πιθανό να έρθουν μετά τις προηγούμενες. Μαθαίνουν αυτά τα μοτίβα από τα δεδομένα εκπαίδευσής τους, τα οποία περιλαμβάνουν μια μεγάλη ποικιλία περιεχομένου από το Διαδίκτυο και αλλού, συμπεριλαμβανομένων έργων μυθοπλασίας, θεωριών συνωμοσίας, προπαγάνδας και ούτω καθεξής. Εξαιτίας αυτού, οι LLMs μπορούν να φτιάξουν πράγματα, τα οποία, εκτός του ότι θεωρούνται πρωτότυπη έρευνα, ονομάζονται και παραισθήσεις.

Το να ρωτάς τα LLM για σκοτεινά θέματα, περίπλοκες ερωτήσεις ή να τους πεις να κάνουν εργασίες για τις οποίες δεν είναι κατάλληλες (δηλαδή εργασίες που απαιτούν εκτεταμένη γνώση ή ανάλυση) καθιστά πολύ πιο πιθανούς αυτούς τους τύπους σφαλμάτων.

Και δεδομένου ότι τα LLM απαντούν με έναν αέρα εμπιστοσύνης, αυτό κάνει τα λάθη τους να γίνονται εύκολα αποδεκτά ως γεγονότα ή αξιόπιστες απόψεις.

Ατεκμηρίωτο ή ανεπιβεβαίωτο περιεχόμενο

Τα LLM δεν ακολουθούν τις πολιτικές της Βικιπαίδειας σχετικά με την επαληθευσιμότητα και την αξιόπιστη τεκμηρίωση. Τα LLM μερικές φορές αποκλείουν εντελώς τις αναφορές ή παραθέτουν πηγές που δεν πληρούν τα πρότυπα αξιοπιστίας της Βικιπαίδειας (συμπεριλαμβανομένης της αναφοράς τη Βικιπαίδειας ως πηγής). Σε ορισμένες περιπτώσεις, παραισθάνονται παραπομπές ανύπαρκτων αναφορών φτιάχνοντας τίτλους, συγγραφείς και διευθύνσεις URL.

Το περιεχόμενο με ψευδαισθήσεις LLM, εκτός από πρωτότυπη έρευνα όπως εξηγήθηκε παραπάνω, παραβιάζει επίσης την πολιτική επαληθευσιμότητας, καθώς δεν μπορεί να επαληθευτεί επειδή είναι κατασκευασμένο: δεν υπάρχουν αναφορές για εύρεση.

Αλγοριθμική προκατάληψη και ουδετερότητα

Τα LLM μπορούν να παράγουν περιεχόμενο που φαίνεται ουδέτερο σε τόνο, αλλά όχι απαραίτητα στην ουσία. Αυτή η ανησυχία είναι ιδιαίτερα έντονη για τις βιογραφίες των εν ζωή ανθρώπων.

Χάσιμο εθελοντικού κόπου

Η Βικιπαίδεια βασίζεται στην απόκτηση εθελοντικής προσπάθειας για την αναθεώρηση νέου περιεχομένου. Ένας σημαντικός παράγοντας για την απόκτηση αυτής της προσπάθειας και τη διατήρηση της απαιτούμενης ποσότητας αυτής διαχειρίσιμη είναι ότι υπήρξε ανάλογη επένδυση από έναν ανθρώπινο συντάκτη στη δημιουργία του υλικού. Επιτρέποντας την εισαγωγή μεγάλων όγκων περιεχομένου που δημιουργείται από τεχνητή νοημοσύνη θα υποβάθμιζε αυτόν τον παράγοντα και τις ευεργετικές του επιπτώσεις στην απόκτηση εθελοντικών προσπαθειών. Ορισμένα διαφημιστικά άρθρα που δημιουργήθηκαν με τεχνητή νοημοσύνη χρειάστηκαν πολλές ώρες εθελοντικού χρόνου για να καθαριστούν. Αυτό μπορεί να συντρίψει και να αποθαρρύνει τους εθελοντές.

Χρήση

Τα LLM είναι βοηθητικά εργαλεία και δεν μπορούν να αντικαταστήσουν την ανθρώπινη κρίση. Απαιτείται προσεκτική κρίση για να καθοριστεί εάν τέτοια εργαλεία ταιριάζουν σε έναν δεδομένο σκοπό. Οι συντάκτες που χρησιμοποιούν LLM αναμένεται να εξοικειωθούν με τους εγγενείς περιορισμούς ενός δεδομένου LLM και στη συνέχεια πρέπει να ξεπεράσουν αυτούς τους περιορισμούς, για να διασφαλίσουν ότι οι τροποποιήσεις τους συμμορφώνονται με τις σχετικές οδηγίες και πολιτικές. Για το σκοπό αυτό, πριν από τη χρήση ενός LLM, οι συντάκτες θα πρέπει να έχουν αποκτήσει σημαντική εμπειρία κάνοντας την ίδια ή μια πιο προηγμένη εργασία χωρίς τη βοήθεια LLM.^[2] Απαιτείται εμπειρία όχι μόνο σε σχέση με τις πρακτικές της Βικιπαίδειας αλλά και σχετικά με τη σωστή χρήση των LLM. Για παράδειγμα, αυτό ισχύει για το θέμα του τρόπου διατύπωσης καλών προτροπών.

Ορισμένοι συντάκτες είναι ικανοί να κάνουν μη υποβοηθημένες επεξεργασίες, αλλά κάνουν επανειλημμένα ακατάλληλες επεξεργασίες με τη βοήθεια LLM παρά την ειλικρινή προσπάθεια να συνεισφέρουν. Τέτοιοι συντάκτες υποτίθεται ότι δεν διαθέτουν ικανότητα με αυτή τη συγκεκριμένη έννοια. Μπορεί να αγνοούν τους κινδύνους και τους εγγενείς περιορισμούς ή να γνωρίζουν αλλά να μην είναι σε θέση να τους ξεπεράσουν για να διασφαλίσουν τη συμμόρφωση με την πολιτική. Σε μια τέτοια περίπτωση, μπορεί να απαγορευτεί σε έναν συντάκτη να βοηθήσει τον εαυτό του με τέτοια εργαλεία (δηλαδή, να περιορίζεται στην πραγματοποίηση μόνο μη υποβοηθούμενων επεξεργασιών). Αυτός είναι ένας συγκεκριμένος τύπος περιορισμένης απαγόρευσης. Κάθε τροποποίηση που ενσωματώνει έξοδο LLM πρέπει να επισημαίνεται ως υποβοηθούμενη από LLM. προσδιορίστε το όνομα και, εάν είναι δυνατόν, την έκδοση του AI στη σύνοψη επεξεργασίας. Αυτό ισχύει για όλους τους χώρους ονομάτων. Τα μεγάλα μοντέλα γλώσσας μπορούν να χρησιμοποιηθούν για την αντιγραφή ή την επέκταση υπάρχοντος κειμένου και για τη δημιουργία ιδεών για νέα ή υπάρχοντα άρθρα. Κάθε αλλαγή σε ένα άρθρο πρέπει να συμμορφώνεται με όλες τις ισχύουσες πολιτικές και οδηγίες. Αυτό σημαίνει ότι πρέπει να εξοικειωθείτε με τις σχετικές πηγές για το εν λόγω περιεχόμενο και στη συνέχεια να αξιολογήσετε προσεκτικά το κείμενο εξόδου ως προς την επαληθευσιμότητα του. Περιλαμβάνει επίσης την ουδετερότητα και την απουσία πρωτότυπης έρευνας καθώς και τη συμμόρφωση με τα πνευματικά δικαιώματα και όλες τις άλλες ισχύουσες πολιτικές και οδηγίες. Η συμμόρφωση με τα πνευματικά δικαιώματα περιλαμβάνει τον σεβασμό των πολιτικών αδειοδότησης πνευματικών δικαιωμάτων όλων των πηγών. Ως μέρος της παροχής μιας ουδέτερης άποψης, δεν πρέπει να δίνετε αδικαιολόγητη προβολή σε άσχετες λεπτομέρειες ή απόψεις μειοψηφίας. Εάν δημιουργούνται παραπομπές ως μέρος της εξόδου, πρέπει να επαληθεύσετε ότι οι αντίστοιχες πηγές είναι μη εικονικές, αξιόπιστες, σχετικές και κατάλληλες πηγές και να ελέγξετε για την ακεραιότητα κειμένου-πηγής.

Ομοίως, τα ακατέργαστα αποτελέσματα LLM δεν πρέπει να επικολλούνται απευθείας σε προσχέδια ή άρθρα. Τα πρόχειρα είναι έργα σε εξέλιξη και οι αρχικές τους εκδόσεις συχνά υπολείπονται του προτύπου που απαιτείται για τα άρθρα, αλλά το να επιτραπεί στους συντάκτες να αναπτύξουν περιεχόμενο άρθρων ξεκινώντας από μια αμετάβλητη αρχική έκδοση που εξάγεται από το LLM δεν είναι ένας από τους σκοπούς του χώρου πρόχειρων ή του χώρου χρήστη. Όλες οι πηγές που χρησιμοποιούνται για τη συγγραφή ενός άρθρου πρέπει να είναι αξιόπιστες. Πολλές πηγές που γράφτηκαν από LLM αποτυγχάνουν αυτή την απαίτηση. Πριν τα χρησιμοποιήσετε, πρέπει να επαληθεύσετε ότι το περιεχόμενο αξιολογήθηκε ως προς την ακρίβεια.

↑ Αυτό ισχύει επίσης για περιπτώσεις στις οποίες το μοντέλο τεχνητής νοημοσύνης βρίσκεται σε δικαιοδοσία όπου τα έργα που δημιουργούνται αποκλειστικά από τεχνητή νοημοσύνη δεν υπόκεινται σε πνευματικά δικαιώματα.
↑ Για παράδειγμα, κάποιος που είναι έμπειρος στην αντιμετώπιση του βανδαλισμού αλλά κάνει πολύ λίγη εργασία με λήμματα μάλλον δεν θα πρέπει να αρχίσει να δημιουργεί λήμματα χρησιμοποιώντας LLM. Αντίθετα, θα πρέπει πρώτα να συγκεντρώσουν πραγματική εμπειρία στη δημιουργία λήματα χωρίς τη βοήθεια του LLM. Η ίδια λογική ισχύει και για άλλους τομείς, όπως η δημιουργία ενοτήτων, προτύπων κ.λπ.

[1] Αυτό ισχύει επίσης για περιπτώσεις στις οποίες το μοντέλο τεχνητής νοημοσύνης βρίσκεται σε δικαιοδοσία όπου τα έργα που δημιουργούνται αποκλειστικά από τεχνητή νοημοσύνη δεν υπόκεινται σε πνευματικά δικαιώματα.

[2] Για παράδειγμα, κάποιος που είναι έμπειρος στην αντιμετώπιση του βανδαλισμού αλλά κάνει πολύ λίγη εργασία με λήμματα μάλλον δεν θα πρέπει να αρχίσει να δημιουργεί λήμματα χρησιμοποιώντας LLM. Αντίθετα, θα πρέπει πρώτα να συγκεντρώσουν πραγματική εμπειρία στη δημιουργία λήματα χωρίς τη βοήθεια του LLM. Η ίδια λογική ισχύει και για άλλους τομείς, όπως η δημιουργία ενοτήτων, προτύπων κ.λπ.

[1]

[2]