Το reCAPTCHA είναι ένα σύστημα το οποίο αναπτύχθηκε αρχικά από τους Luis von Ahn, Ben Maurer, Colin McMillen, Ντέιβιντ Αβραάμ και Manuel Blum στο Πανεπιστήμιο Carnegie Mellon, και εξαγοράστηκε από την Google τον Σεπτέμβριο του 2009. Είναι ένα text based CAPTCHA αλλά με μια σημαντική καινοτομία. Οι λέξεις που εμφανίζονται για την λύση του συστήματος είναι λέξεις από βιβλία τα οποία είναι στο στάδιο της ψηφιοποίησης. Το reCAPTCHA ζητά από τους χρήστες να εισάγουν λέξεις που εμφανίζονται σε παραμορφωμένες εικόνες κειμένου στην οθόνη. Με την υποβολή των δύο λέξεων που απαιτούνται, προστατεύονται και οι ιστοσελίδες από bots, που προσπαθούν να έχουν πρόσβαση σε υπηρεσίες περιορισμένης πρόσβασης και βοηθά στην ψηφιοποίηση βιβλίων.

Ένα Google reCAPTCHA με την λέξη "specific" (συγκεκριμένο) και τη δεύτερη "λέξη" να μην είναι αναγνωρίσιμη. Συνήθως υπήρχαν σε reCAPTCHA και άσχετα γράμματα που σχημάτιζαν μια λέξη ή φράση, η δεύτερη "λέξη" ανήκει σε αυτή τη κατηγορία .

Λειτουργία

Επεξεργασία

Το σαρωμένο κείμενο που προορίζεται για ψηφιοποίηση αναλύεται από δύο διαφορετικά προγράμματα OCR. Οι λέξεις που δεν αναγνωρίστηκαν από το κείμενο ή τα προγράμματα μεταφράζονται  διαφορετικά, χαρακτηρίζονται ύποπτες και μετατρέπονται σε CAPTCHA. Το σύστημα εμφανίζει δύο λέξεις, μια γνωστή στο σύστημα ώστε να γίνει ο έλεγχος, αν είναι άνθρωπος ή bot, και μία άγνωστή στο σύστημα (ύποπτη λέξη από κάποιο βιβλίο). Ο χρήστης θα πρέπει να απαντήσει και στις δύο αυτές λέξεις. Το σύστημα, αν η πρώτη (γνωστή) λέξη είναι σωστή, επιτρέπει την πρόσβαση στην υπηρεσία και καταχωρεί την απάντηση της δεύτερης (άγνωστης) σαν πιθανή λύση. Οι άγνωστες λέξεις εμφανίζονται κι άλλες φορές, ώστε να υπάρχει σύγκριση για την ορθότητα της λύσης.

Παραπομπές

Επεξεργασία

http://www.cs.cmu.edu/~biglou/reCAPTCHA_Science.pdf

http://www.google.com/recaptcha/intro/index.html