Χρήστης:Papyrus/Οδηγός Δημιουργίας ψηφιακού ευρετηρίου βιβλιοθήκης: Διαφορά μεταξύ των αναθεωρήσεων

Περιεχόμενο που διαγράφηκε Περιεχόμενο που προστέθηκε
Papyrus (συζήτηση | συνεισφορές)
μΧωρίς σύνοψη επεξεργασίας
Papyrus (συζήτηση | συνεισφορές)
Γραμμή 43:
 
'''2.''' Λογισμικό για την ψηφιοποίηση κειμένου (δηλ. για ''αναγνώριση χαρακτήρων'' ή αλλιώς OCR)<br>
:Ένα τέτοιο πρόγραμμα, μπορεί να αναγνωρίσει μέσα σε μια εικόνα, τυπωμένους χαρακτήρες όπως γράμματα, σημεία στίξης κ.λπ. και να τα μετατρέψει σε επεξεργάσιμο κείμενο, σαν να το είχαμε γράψει στον επεξεργαστή κειμένου. Η τεχνολογία αυτή, στην περίπτωσή μας, προσφέρει την εξαιρετική δυνατότητα της εύρεσης λέξεων ή φράσεων μέσα στο κείμενο που έχει περάσει από OCR. Προγράμματα που να αναγνωρίζουν χαρακτήρες υπάρχουν αρκετά. Όμως, κατά την προσωπική μου άποψη η επιλογή ειδικά για αναγνώριση μονοτονικού κειμένου είναι '''μόνο μία''' και λέγεται [http://finereader.abbyy.com Finereader]. Επίσης, αν και δεν υποστηρίζει αναγνώριση πολυτονικού, δίνει πολύ καλά αποτελέσματα, επιστρέφοντας βέβαια κάποια γνωστά προβλήματα. Π.χ. (πολυτ.) ''όταν'Finereader' = δταν, (πολυτ.) ''είναι'' = έ'ιναι κ.ά. Οι διορθώσεις όμως που απαιτούνται μετά την αναγνώριση ενός καλοτυπωμένου κειμένου είναι λίγες. Για την αναγνώριση πολυτονικού κειμένου υπάρχει μια λύση ελληνικής μάλιστα κατασκευής, το πρόγραμμα [http://www.ideatech-online.com/index.php?option=com_remository&Itemid=34&func=fileinfo&id=4 Αναγνώστης]. Έχει πολύ καλά αποτελέσματα, όμως η τιμή του είναι αρκετά υψηλή. Προκειμένου για το Finereader, αν και η έκδοση 9.0 είναι η νεώτερη, εντούτοις αν κάποιος δεν χρειάζεται τα επιπλέον χαρακτηριστικά, θα μπορούσε να προτιμήσει την [http://www.software-magazine.gr/default.asp?id=4&mnu=4&ACT=5&content=202 έκδοση 8.0] καθώς είναι αρκετά πιο "ελαφριά" σε απαιτήσεις πόρων του συστήματος.
 
 
==Δημιουργία ψηφιακού ευρετηρίου βιβλιοθήκης==