Μηχανική όραση: Διαφορά μεταξύ των αναθεωρήσεων

Περιεχόμενο που διαγράφηκε Περιεχόμενο που προστέθηκε
JohnMad (συζήτηση | συνεισφορές)
Προσθήκη στοιχείων, μικρή αναδιάταξη
JohnMad (συζήτηση | συνεισφορές)
Προσθήκη στοιχείων, πηγής
Γραμμή 6:
# Οργάνωση πληροφοριών (π.χ. ευρετηριοποίηση βάσεων δεδομένων και ακολουθιών εικόνων)
# Εξομοίωση αντικειμένων και περιβαλλόντων (π.χ. βιομηχανική επιθεώρηση, ιατρική ανάλυση εικόνας ή τοπογραφική εξομοίωση)
# Αλληλεπίδραση χρηστών με υπολογιστικά συστήματα (π.χ. ως [[είσοδος]] σε μια συσκευή επικοινωνίας ανθρώπου / μηχανής).
 
Η μηχανική όραση μπορεί επίσης να περιγραφεί ως συμπλήρωμα (αλλά όχι απαραιτήτως αντίθετο) της [[όραση|βιολογικής όρασης]]. Στην τελευταία, μελετώνται η οπτική αντίληψη στους ανθρώπους και τα ζώα με αποτέλεσμα μοντέλα για το πώς αυτά τα συστήματα λειτουργούν υπό το πρίσμα των φυσιολογικών διαδικασιών. Η μηχανική όραση από την άλλη μελετά και περιγράφει το τεχνητά συστήματα όρασης που εφαρμόζονται σε [[λογισμικό]] ή/και σε [[υλικό υπολογιστών]]. Η διεπιστημονική ανταλλαγή μεταξύ της βιολογικής και υπολογιστικής όρασης αποδεικνύεται όλο και περισσότερο καρποφόρα και για τους δύο τομείς.
 
Οι υποκατηγορίες της μηχανικής όρασης περιλαμβάνουν την ''κατανόηση σκηνής'', την ''ανίχνευση συμβάντων'', την ''ανίχνευση κίνησης'', την ''αναγνώριση αντικειμένων'', την ''ευρετηριοποίηση'', την ''αποκατάσταση εικόνας'' και την ''τριδιάστατη ανακατασκευή'' (παραγωγή τριδιάστατων μοντέλων της σκηνής από δεδομένα εικόνας / βίντεο).
 
Ιστορικά, η μηχανική όραση αναδύθηκε μετά το 1980 ως αποτέλεσμα επέκτασης του πεδίου της πληροφορικής το οποίο καλείται [[ψηφιακή επεξεργασία εικόνας]] σε αλγορίθμους ανάλυσης και κατανόησης εικόνων. Είχαν προηγηθεί η μαθηματική μοντελοποίηση της φυσικής όρασης, έστω σε ένα βασικό επίπεδο, και οι πρώτες προσπάθειες για αναπαραγωγή της αίσθησης της όρασης σε αυτόνομα ρομπότ. Από τη δεκαετία του 1990 κι έπειτα η μηχανική όραση έχει γνωρίσει αλματώδη ανάπτυξη, έχει συνδεθεί με το γνωστικό πεδίο της [[μηχανική μάθηση|μηχανικής μάθησης]] και έχει δώσει σημαντικά απτά αποτελέσματα, με αλγορίθμους όρασης [[πραγματικός χρόνος|πραγματικού χρόνου]] να υλοποιούνται ακόμα και σε φτηνά [[κινητό τηλέφωνο|κινητά τηλέφωνα]] εξοπλισμένα με [[κάμερα]].
 
Μετά την ευρύτατη διάδοση του [[Kinect]], ενός περιφερειακού διασύνδεσης μεταξύ χρηστών και υπολογιστικών συστημάτων, και τη σχετική άνθιση του τριδιάστατου (στερεοσκοπία|στερεοσκοπικού) οπτικού περιεχομένου ύστερα από τη μεγάλη επιτυχία της κινηματογραφικής ταινίας [[Άβαταρ]], η μηχανική όραση έχει αρχίσει να εξετάζει πιο ενδελεχώς και την αξιοποίηση δεδομένων βάθους (π.χ. από στερεοσκοπική κάμερα ή ξεχωριστούς αισθητήρες βάθους) για την επίτευξη των στόχων της.
{{Πληροφορική-επέκταση}}
 
Οι υποκατηγορίες της μηχανικής όρασης περιλαμβάνουν την ''κατανόηση σκηνής'', την ''ανίχνευση συμβάντων'', την ''ανίχνευση κίνησης'', την ''αναγνώριση αντικειμένων'', την ''ευρετηριοποίηση'', την ''αποκατάσταση εικόνας'' και την ''τριδιάστατη ανακατασκευή'' (παραγωγή τριδιάστατων μοντέλων της σκηνής από δεδομένα εικόνας / βίντεο). Σε σχέση με άλλα, συγγενή γνωστικά πεδία, η μηχανική όραση διαφοροποιείται ως εξής:
* Η [[ψηφιακή επεξεργασία εικόνας]] εξετάζει αλγορίθμους οι οποίοι δέχονται ως είσοδο εικόνες / βίντεο και παράγουν ως έξοδο εικόνες / βίντεο.
* Τα [[γραφικά υπολογιστή]] εξετάζουν αλγορίθμους οι οποίοι δέχονται ως είσοδο συμβολικές περιγραφές οπτικών σκηνών και παράγουν ως έξοδο εικόνες / βίντεο (με ή χωρίς αλληλεπίδραση με τον χρήστη).
* Η μηχανική όραση εξετάζει αλγορίθμους οι οποίοι δέχονται ως είσοδο εικόνες / βίντεο και παράγουν συμβολικές περιγραφές των εν λόγω οπτικών σκηνών.
 
== Πηγές ==
* ''Computer and Machine Vision --- Theory, Algorithms, Practicalities'', E. R. Davies, 2012
 
 
[[Κατηγορία:Τεχνητή νοημοσύνη]]
[[Κατηγορία:ΓραφικάΨηφιακή υπολογιστώνΕπεξεργασία Εικόνας]]