Χρήστης:Papyrus/Οδηγός Δημιουργίας ψηφιακού ευρετηρίου βιβλιοθήκης: Διαφορά μεταξύ των αναθεωρήσεων

Περιεχόμενο που διαγράφηκε Περιεχόμενο που προστέθηκε
Papyrus (συζήτηση | συνεισφορές)
μΧωρίς σύνοψη επεξεργασίας
Papyrus (συζήτηση | συνεισφορές)
μΧωρίς σύνοψη επεξεργασίας
Γραμμή 43:
 
'''2.''' Λογισμικό για την ψηφιοποίηση κειμένου (δηλ. για ''αναγνώριση χαρακτήρων'' ή αλλιώς OCR)<br>
:Ένα τέτοιο πρόγραμμα, μπορεί να αναγνωρίσει μέσα σε μια εικόνα, τυπωμένους χαρακτήρες όπως γράμματα, σημεία στίξης κ.λπ. και να τα μετατρέψει σε επεξεργάσιμο κείμενο, σαν να το είχαμε γράψει στον επεξεργαστή κειμένου. Η τεχνολογία αυτή, στην περίπτωσή μας, προσφέρει την εξαιρετική δυνατότητα της εύρεσης λέξεων ή φράσεων μέσα στο κείμενο που έχει περάσει από OCR. Προγράμματα που να αναγνωρίζουν χαρακτήρες υπάρχουν αρκετά. Όμως, κατά την προσωπική μου άποψη η επιλογή ειδικά για αναγνώριση μονοτονικού κειμένου είναι '''μόνο μία''' και λέγεται [http://finereader.abbyy.com Finereader]. Επίσης, αν και δεν υποστηρίζει αναγνώριση πολυτονικού, δίνει πολύ καλά αποτελέσματα, επιστρέφοντας βέβαια κάποια γνωστά προβλήματα. Π.χ. (πολυτ.) ''όταν'' = δταν, (πολυτ.) ''είναι'' = έ'ιναι κ.ά. Οι διορθώσεις όμως που απαιτούνται μετά την αναγνώριση ενός καλοτυπωμένου κειμένου είναι λίγες. Για την αναγνώριση πολυτονικού κειμένου υπάρχει μια λύση ελληνικής μάλιστα κατασκευής, το πρόγραμμα [http://www.ideatech-online.com/index.php?option=com_remository&Itemid=34&func=fileinfo&id=4 Αναγνώστης]. Έχει πολύ καλά αποτελέσματα, όμως η τιμή του είναι αρκετά υψηλή. Προκειμένου για το Finereader, αν και η έκδοση 9.0 είναι η νεώτερη, εντούτοις αν κάποιος δεν χρειάζεται τα επιπλέον χαρακτηριστικά, θα μπορούσε να προτιμήσει την [http://www.software-magazine.gr/default.asp?id=4&mnu=4&ACT=5&content=202 έκδοση 8.0] καθώς είναι αρκετά πιο "ελαφριά" σε απαιτήσεις πόρων του συστήματος. Η έκδοση 9.0 είναι αρκετά βελτιωμένη σε OCR από εικόνες ψηφιακής φωτογραφικής μηχανής καθώς αυτόματα αμβλύνει τα χρωματικά και άλλα προβλήματα που εμφανίζονται, ενώ έχει βελτιωμένη απόδοση σε εξαιρετικά κακοτυπωμένο κείμενο (κακές φωτοτυπίες, κακοτυπωμένα βιβλία). Βεβαίως η ταχύτητα του προγράμματος υστερεί σημαντικά. Σε όλες τις άλλες περιπτώσεις κειμένου, οι διαφορές ανάμεσα στα αποτελέσματα των εκδόσεων 8.0 και 9.0 είναι σχεδόν ανύπαρκτες ενώ η ταχύτητα της έκδοσης 8.0 είναι σημαντικά υψηλότερη. Η έκδοση 9.0 είναι επίσης βελτιωμένη και στην ανατύπωση πολύπλοκης φόρμας (π.χ. μια φόρμα τιμολογίου ή μια διαφημιστική μπροσούρα).
 
==Δημιουργία ψηφιακού ευρετηρίου βιβλιοθήκης==