Μηχανική μάθηση: Διαφορά μεταξύ των αναθεωρήσεων

Περιεχόμενο που διαγράφηκε Περιεχόμενο που προστέθηκε
Melmathiakh (συζήτηση | συνεισφορές)
Χωρίς σύνοψη επεξεργασίας
Melmathiakh (συζήτηση | συνεισφορές)
επεκταση λημματος
Γραμμή 23:
* Σε προβλήματα [[συσταδοποίηση|συσταδοποίησης]] (clustering) στόχος είναι η κατηγοριοποίηση των δεδομένων σε διαφορετικές λογικές ομάδες. Σε αντίθεση με την ταξινόμηση, τέτοιου τύπου προβλήματα ανήκουν στην μη επιτηρούμενη μηχανική μάθηση, καθώς οι ομάδες δεν είναι γνωστές εκ των προτέρων.
* Σε προβλήματα [[Μείωση διάστασης|μείωσης διάστασης]] (dimensionality reduction) τα δεδομένα απλοποιούνται και μεταφέρονται σε χώρο με λιγότερες διαστάσεις.. Ένα σχετικό πρόβλημα είναι το Topic modeling, όπου η μηχανή καλείται να βρει τα έγγραφα που καλύπτουν ομοια θέματα από ένα σύνολο εγγράφων γραμμένων σε φυσική γλώσσα.
 
== Ιστορική αναδρομή και συσχέτιση με άλλους τομείς ==
Ως επιστημονικό εγχείρημα η μαχανική μάθηση αναπτύχθηκε από την έρευνα για [[τεχνητή νοημοσύνη]]. Ήδη, από τα πρώτα χρόνια της ακαδημαικής εργασίας πάνω στο θέμα της τεχνητής νοημοσύνης το ζήτημα της κατασκευής μηχανών που θα μάθαιναν από δεδομένα απασχόλησε τους ερευνητές. Επιχείρησαν να προσεγγίσουν το πρόβλημα με ποικίλες συμβολικές μεθόδους, καθώς και με τα λεγόμενα [[Νευρωνικό δίκτυο|νευρωνικά δίκτυα]]. Ήταν κατά κύριο λόγο μοντέλα, που όπως διαπιστώθηκε αργότερα ήταν επανεφευρέσεις των [[Γενικευμένα γραμμικά μοντέλα|γενικευμένων γραμμικών μοντέλων]] της στατιστικής, ενώ χρησιμοποιήθηκε και η πιθανοθεωρητική λογική, ιδιαίτερα στην αυτοποιημένη ιατρική διάγνωση.
 
Η μηχανική μάθηση αναπτύχθηκε ως ξεχωριστός τομέας που άνθισε την δεκαετία του 1990.Η προσοχή μετατοπίστηκε από τις συμβολικές προσεγγίσεις που κληρονόμησε από την Τεχνητή Νοημοσύνη, που στόχο είχαν την αντιμετώπιση επιλύσιμων προβλημάτων πρακτικής φύσης, και δόθηκε έμφαση σε μεθόδους και μοντέλα της [[Στατιστική|στατιστικής]] και της [[Θεωρία πιθανοτήτων|θεωρίας πιθανοτήτων]].Επίσης επωφελήθηκε από την διαθεσιμότητα ψηφιοποιημένων πληροφοριών και της δυνατότητας να διανεμηθούν μέσω [[Διαδίκτυο|Διαδικτύου]].
 
Η μηχανική μάθηση και η [[εξόρυξη δεδομένων]] χρησιμοποιούν συχνά τις ίδιες [[Μέθοδος|μεθόδους]] και επικαλύπτονται σημαντικά. Θα μπορούσαμε να τις διακρίνουμε ως εξης:
* Η μηχανική μάθηση εστιάζει στην πρόβλεψη, που βασίζεται σε γνωστές ιδιότητες που απορρέουν από το σύνολο εκπαίδευσης.
* Η εξόρυξη δεδομένων εστιάζει στην ανακάλυψη ιδιοτήτων μη γνωστών εκ των προτέρων. Αυτό είναι το βήμα ανάλυσης στην [[Ανακάλυψη Γνώσης]] από [[Βάση δεδομένων|βάσεις δεδομένων]].
Οι δύο τομείς επικαλύπτονται με πολλούς τρόπους.Η εξόρυξη δεδομένων χρησιμοποιεί πολλές μεθόδους μηχανικής μάθησης, αλλά συχνά με διαφορετικούς στόχους. Από την άλλη πλευρά και η μηχανική μάθηση χρησιμοποιεί μεθόδους εξόρυξης δεδομένων, όπως η [[μη επιτηρούμενη μάθηση]], ή στο στάδιο επεξεργασίας για να βελτιώνει την ακρίβεια της μάθησης. Ένα μεγάλο μέρος της σύγχυσης μεταξύ των δύο ερευνητικών τομέων (που συχνά έχουν ξεχωριστά συνέδρια και περιοδικά, ECML PKDD αποτελεί σημαντική εξαίρεση) προκύπτει από τις βασικες υπόθεσεις πάνω στις οποίες και οι δύο δουλεύουν: όμως στην μηχανική μάθηση η απόδοση συνήθως αξιολογείται ως προς την ικανότητα αναπαραγωγής γνώσης, την οποία ήδη κατέχουμε, ενώ στην Ανακάλυψη Γνώσης και την Εξόρυξη Δεδομένων το κλειδί είναι η ανακάλυψη γνώσης που δεν προκατέχουμε. Στην πρώτη περίπτωση μια μέθοδος [[Επιτηρούμενη μάθηση|επιτηρούμενης μάθησης]] μπορεί να έχει καλύτερα αποτελέσματα, ενώ σε μία τυπική διεργασία Ανακάλυψης Γνώσης και Εξόρυξης δεδομένων οι επιτηρούμενες μέθοδοι μάθησης δεν λειτουργούν εξαιτίας της μη διαθεσιμότητας συνόλου εκπαίδευσης.
 
Ακόμη η μηχανική μάθηση συνδέεται με την [[βελτιστοποίηση]]: πολλά προβλήματα μάθησης διατυπώνονται ως η ελαχιστοποίηση της [[Συνάρτηση απώλειας|συνάρτησης απώλειας]] από ένα σύνολο δεδομένων εκπαίδευσης. Η διαφορά των δύο τομέων απορέει από τον στόχο της γενίκευσης: ενώ οι [[Αλγόριθμος βελτιστοποίησης|αλγόριθμοι βελτιστοποίησης]] μπορούν να ελαχιστοποιήσουν την απώλεια ενός συνόλου εκπαίδευσης, η μηχανική μάθηση εστιάζει στην ελαχιστοποίηση της απώλειας σε άγνωστες καταστάσεις.
 
===== Συσχέτιση με την στατιστική =====
Η μηχανική μάθηση και η [[στατιστική]] είναι δύο στενά συνδεδεμένοι επιστημονικοί τομείς. Σύμφωνα με τον Michael Jordan, οι ιδέες της μηχανικής μάθησης, από τις μεθοδολογικές αρχές μέχρι τα θεωρητικά εργαλεία, προϋπάρχουν στην στατιστική. Ο ίδιος επίσης πρότεινε τον όρο [[Επιστήμη Δεδομένων|Επιστήμη Δεδομένων]] για το συνολικό πεδίο.
 
Ο Leo Breiman διέκρινε δύο υποδείγματα [[Στατιστική μοντελοποίηση|στατιστικής μοντελοποίησης]]: το μοντέλο δεδομένων και το αλγοριθμικό μοντέλο, όπου το δεύτερο σημαίνει λίγο πολύ τους αλγορίθμους μηχανικής μάθησης, όπως τα [[Τυχαία Δάση]].
 
Τέλος, ορισμένοι [[Στατιστικολόγος|στατιστικολόγοι]] υιοθετούν μεθόδους μηχανικής μάθησης, με αποτέλεσμα την δημιουργία ενός ανασυνδυσμένου τομέα που ονομάζεται ''στατιστική μάθηση''.
 
== Θεωρία ==
Ο βασικός σκοπός ενός μαθητευόμενου είναι να γενικεύει την εμπειρία του. Σε αυτό το πλαίσιο γενίκευση είναι η ικανότητα μιας μηχανής μάθησης να αποδίδει με ακρίβεια σε καινούριες, πρωτόγνωρες εργασίες, αφού πρώτα έχει εκπαιδευτεί σε ένα σύνολο δεδομένων εκπαίδευσης. Γενικά τα προς εκπαίδευση παραδείγματα προέρχονται από κάποια άγνωστη κατανομή πιθανότητας, η οποία θεωρείται αντιπροσωπευτική, και η μηχανή πρέπει να κατασκευάσει ένα γενικό μοντέλο που θα επιτρέπει την παραγωγή προβλέψεων σε καινούριες καταστάσεις με επαρκή ακρίβεια.
 
Η υπολογιστική ανάλυση των αλγορίθμων των μηχανών μάθησης και η απόδοσή τους είναι ένας κλάδος της [[Θεωρητική Πληροφορική|θεωρητικής πληροφορικής]], γνωστός ως [[Υπολογιστική θεωρία μάθησης]]. Επειδή τα εκπαιδευτικά σύνολα είναι πεπερασμένα και το μέλλον αβέβαιο, η θεωρία μάθησης δεν εγγυάται πάντα την απόδοση των αλγορίθμων. Αντ΄αυτού είναι συχνή η χρήση των πιπανοθεωρητικών ορίων της απόδοσης.
 
Το πόσο καλά ένα μοντέλο, που έχει εκπαιδευτεί σε υπαρκτά παραδείγματα, μπορεί να προβλέψει άγνωστες καταστάσεις ονομάζεται γενίκευση. Για την καλύτερη δυνατή γενίκευση, η πολυπλοκότητα της υπόθεσης θα πρέπει να είναι αντίστοιχη της πολυπλοκότητας της συνάρτησης των δεδομένων.
 
Πέρα όμως από την απόδοση, οι θεωρηρικοί της υπολογιστικής μάθησης μελετούν την [[χρονική πολυπλοκότητα]] καθώς και το κατά πόσο είναι εφικτή η μάθηση. Στην υπολογιστική θεωρία μάθησης ένας υπολογισμός θεωρείται εφικτός αν μπορεί να επιτελεστεί σε [[πολυωνυμικό χρόνο]]. Υπάρχουν δύο είδη αποτελεσμάτων αναφορικά με την χρονική πολυπλοκότητα. Τα θετικά αποτελέσματα που σημαίνουν ότι μια συγκεκριμένη κλάση αντιστοιχίσεων μπορούν να επιτευχθούν σε πολυωνυμικό χρόνο και τα αρνητικά αποτελέσματα που δείχνουν το αντίθετο.
 
Υπάρχουν πολλά κοινά στοιχεία μεταξύ της θεωρίας μηχανικής μάθησης και της [[Στατιστική συμπερασματολογία|στατιστικής συμπερασματολογίας]], ωστόσο συνήθως χρησιμοποιούν διαφορετικούς όρους.
 
==Παραπομπές==