Διαφορά μεταξύ των αναθεωρήσεων του «Αναγνώριση ομιλίας»

καμία σύνοψη επεξεργασίας
μ (Bot: Migrating 38 langlinks, now provided by Wikidata on d:Q189436)
Στην επιστήμη της [[Πληροφορική|πληροφορικής]], η '''αναγνώριση ομιλίας''' αναφέρεται στην [[μετάφραση]] προφερόμενων [[λέξεων]] σε κείμενο. Είναι επίσης αλλιώς γνωστή και ως "''αυτόματη αναγνώριση ομιλίας"'', "''υπολογιστική αναγνώριση ομιλίας''" ή "''speech-to-text''" (''STT''), δηλαδή (μετατροπή) "''από-ομιλία-σε-κείμενο''".
Η '''Αναγνώριση Ομιλίας''' (''ASR: Automatic Speech Recognition'') είναι η αναγνώριση της ανθρώπινης ομιλίας από τους [[ηλεκτρονικός υπολογιστής|υπολογιστές]]. Η διαδικασία της αυτόματης αναγνώρισης ομιλίας παράγει μία ακολουθία λέξεων από ένα ακουστικό σήμα. Επιπλέον εξάγει το νόημα από την φράση που έχει αναγνωρισθεί, ώστε το σύστημα να μπορεί να απαντήσει στον ομιλητή ή να πραγματοποιήσει μία ενέργεια (π.χ. αναζήτηση σε [[βάση δεδομένων]]).
 
Κάποια [[Σύστημα|συστήματα]] αναγνώρισης ομιλίας χρησιμοποιούν "αναγνώριση ομιλίας ανεξάρτητη από τον ομιλήτη", ενώ άλλα χρησιμοποιούν "εξάσκηση", όπου ένα άτομο διαβάζει κομμάτια κειμένου σε ένα σύστημα αναγνώρισης ομιλίας. Τότε, αυτού του είδους τα συστήματα αναλύουν τη φωνή ενός ομιλητή και την χρησιμοποιούν για να προσαρμόσουν την αναγνώριση της ομιλίας του συγκεκριμένου ατόμου από τον υπολογιστή, με αποτέλεσμα την πιο ακριβή καταγραφή της. Συστήματα που δεν χρησιμοποιούν εξάσκηση ονομάζονται συστήματα "ανεξάρτητα από τον ομιλητή".
Η τεχνική της αναγνώρισης ομιλίας χρησιμοποιείται στα Voice User Interfaces (VUI) - Φωνητικά Περιβάλλοντα Χρήστη.
 
Οι εφαρμογές αναγνώρισης ομιλίας περιλαμβάνουν τα Φωνητικά Περιβάλλοντα Χρήστη (Voice User Interfaces) όπως η φωνητική πληκτρολόγιση (π.χ. "Κάλεσε σπίτι"), ο έλεγχος των οικιακών ηλεκτρονικών συσκευών και συστημάτων, η διαδικτυακή αναζήτηση, η απλή τοποθέτηση δεδομένων, η προετοιμασία δοδμημένων εγγράφων, η επεξεργασία "από-ομιλία-σε-κείμενο" και τα αεροσκάφη.
 
Ο όρος αναγνώριση ομιλίας αναφέρεται στο "ποιος" μιλάει, παρά στο "τι" λέει. Αναγνωρίζοντας την ταυτότητα του ομιλητή είναι δυνατόν να διευκολυνθεί η διεργασία της μετάφρασης της ομιλίας σε συστήματα που έχουν προηγουμένως εξασκηθεί στην φωνή του συγκεκριμένου ατόμου ή ακόμη είναι δυνατόν να χρησιμοποιηθεί στην πιστοποίηση ή επαλήθευση της ταυτότητας του ομιλητή σε συστήματα ασφαλείας.
 
{{Πληροφορική-επέκταση}}
186

επεξεργασίες