Βραβείο Netflix: Διαφορά μεταξύ των αναθεωρήσεων

Περιεχόμενο που διαγράφηκε Περιεχόμενο που προστέθηκε
Yobot (συζήτηση | συνεισφορές)
μ WPCleaner v1.34b - Fixed using Βικιπαίδεια:WikiProject Check Wikipedia (Σύνδεσμος με ίδιο κείμενο συνδέσμου)
Γραμμή 7:
Το Netflix παρείχε ένα σύνολο δεδομένων εκπαίδευσης (training data set) συνολικά 100.480.507 αξιολογήσεων οι οποίες είχαν γίνει από 480.189 χρήστες για 17.770 ταινίες. Κάθε εγγραφή του συνόλου δεδομένων εκπαίδευσης αποτελούνταν από μια τετράδα της μορφής <χρήστης, ταινία, ημερομηνία αξιολόγησης, βαθμός αξιολόγησης>. Τα πεδία του χρήστη και της ταινίας ήταν ακέραιοι αναγνωστικοί αριθμοί, ενώ οι αξιολογήσεις ήταν ακέραιοι αριθμοί εύρους 1-5 (αστέρια αξιολόγησης).<ref name="bennet">{{ cite conference | last = James Bennett |author2=Stan Lanning | title = The Netflix Prize | url = http://www.netflixprize.com/assets/NetflixPrizeKDD_to_appear.pdf | booktitle = Proceedings of KDD Cup and Workshop 2007 | date = August 12, 2007 | accessdate = 2007-08-25 }}</ref>
 
Το σύνολο δεδομένων κατάταξης (qualifying data set) περιείχε περισσότερες από 2.817.131 εγγραφές σε μορφή τριάδας <χρήστης, ταινία, ημερομηνία αξιολόγησης>, με τις τιμές των αξιολογήσεων να είναι γνωστές μόνο στην επιτροπή αξιολόγησης. Για να συμμετάσχει μια ομάδα θα έπρεπε να προτείνει έναν αλγόριθμο ο οποίος θα προέβλεπε τις αξιολογήσεις για ολόκληρο το σύνολο δεδομένων κατάταξης, αλλά οι συμμετέχοντες θα είχαν μόνο πληροφόρηση για το αποτέλεσμα των μισών από τα δεδομένα, το σύνολο των ερωτημάτων (quiz set) αποτελούμενο από 1.408.342 αξιολογήσεις. Το άλλο μισό ήταν το σύνολο ελέγχου (test set) των 1.408.789 εγγραφών, επί του οποίου η επίδοση θα αποτελούσε τη βάση για να καθορίσει η επιτροπή τους πιθανούς νικητές του βραβείου. Μόνο η επιτροπή γνώριζε ποιες αξιολογήσεις βρίσκονταν στο σύνολο ερωτημάτων και ποιες βρίσκονταν στο σύνολο ελέγχου - αυτή η ρύθμιση είχε ως στόχο να καταστήσει δύσκολη την ανάβαση στο σύνολο ελέγχου.
 
==Προβληματισμοί σχετικά με την ασφάλεια των προσωπικών δεδομένων==
Αν και τα σύνολα δεδομένων έχουν κατασκευαστεί για να διατηρήσουμε το απόρρητο των πελατών, το βραβείο έχει επικριθεί από υποστηρικτές της προστασίας των δεδομένων. Το 2007, δύο ερευνητές από το Πανεπιστήμιο του Τέξας ήταν σε θέση να εντοπίσει μεμονωμένους χρήστες από το ταίριασμα των συνόλων δεδομένων με τη βαθμολογία των ταινιών στο Internet Movie Database.
 
Στις 17 Δεκεμβρίου 2009, τέσσερις χρήστες Netflix κατέθεσαν αγωγή εναντίων του Netflix, ισχυριζόμενοι ότι το Netflix είχε παραβιάσει τους νόμους του εμπορίου και το Video Privacy Protection Act νόμο για την προστασία από την απελευθέρωση των συνόλων δεδομένων. Υπήρξε δημόσια συζήτηση σχετικά με το απόρρητο των συμμετεχόντων στην έρευνα..Στις 19 Μάρτίου 2010, το Netflix κατέληξε σε συμβιβασμό με τους ενάγοντες, οι οποίοι απέρριψαν την αγωγή εθελοντικά.
 
==Παραπομπές==