Χρήστης:Melmathiakh/πρόχειρο

Για την ακρίβεια η μαχανική μάθηση διερευνά την μελέτη και την κατασκευή αλγορίθμων που μπορούν να μαθαίνουν από δεδομένα και να κάνουν προβλέψεις γι' αυτά, χτίζοντας μοντέλα από δεδομένα εισόδου.

Η μηχανική μάθηση εφαρμόζεται σε μια σειρά μηχανογραφικών εργασιών, όπου η χρήση αλγορίθμων, τόσο κατά τον σχεδιασμό όσο και κατά τον ακριβή προγραμματισμό τους, είναι ανέφικτη. Παραδείγματα εφαρμογών αποτελούν....με την εξόρυξη δεδομένων. Στην ανάλυση δεδομένων η μηχανική μάθηση χρησιμοποιείται ως μέθοδος σια την κατασκευή πολύπλοκων μοντέλων και αλγορίθμων με στόχο την πρόβλεψη. Αυτά τα ερυνητικά μοντέλα επιτρέπουν στους ερευνητές, τους αναλυτές δεδομένων και τους μηχανικούς "να παράγουν αξιόπιστες και κατάλληλες decisions και αποτελέσματα" και να ανακαλύπτουν άγνωστες ιστορικές σχέσεις και τάσεις των δεδομένων.

Οι αλγόριθμοι μηχανικής μάθησης κατηγοριοποιούνται ανάλογα με την φύση του σήματος ή της ανατροφοδότησης που είναι διαθέσιμη στο σύστημα εκμάθησης. Αυτές είναι:

Μη επιτηρούμενη μάθηση:Σε αυτήν την κατηγορία δεν παρέχεται κάποια εμπειρία, αλλά ο αλγόριθμος αφήνεται να ανακαλύψει μοτίβα στα δεδομένα εισόδου, μέσω κριτηρίων ομοιότητας...

Ενισχυτική μάθηση:Όπως για παράδειγμα το να μάθει να παίζει ένα παιχνίδι εναντίον κάποιου αντιπάλου ή να οδηγεί ένα όχημα.

Μεταξύ της επιτηρούμενης και της μη επιτηρούμενης μάθησης υπάρχει και η ημι-επιτηρούμενη μάθηση.

....η διαδικασία εκμάθησης μαθαίνει στην μηχανή (να αναπτύσσει) τις δικές του επαγωγικές μεθόδους, βασιζόμενο στην προηγούμενη εμπειρία.

Η ... μάθηση, που επεξεργάστηκε για την εκμάθηση από ρομπότ, γεννά την δική του ακολουθία περιστάσεων μάθησης. Έτσι το ρομπότ αποκτά αθροιστικά την δική του ποικιλία δεξιοτήτων, μέσω της αυτόνομης αυτοεξερεύνησης και της κοινωνικής αλληλεπίδρασης με ανθρώπους σε ρόλους εκπαιδευτών και χρησιμοποιώντας μηχανισμούς καθοδήγησης, όπως η ενεργητική μάθηση και η μίμηση.

Η αναγωγή διάστασης απλοποιεί τα δεδομένα, μεταφέροντάς τα σε ένα χώρο με λιγότερες διαστάσεις. Ένα σχετικό πρόβλημα είναι το Topic modeling, όπου η μηχανή καλείται να βρει τα έγγραφα που καλύπτουν ομοια θέματα από ένα σύνολο εγγράφων γραμμένων σε συνήθη γλώσσα.

ΙΣΤΟΡΙΑ ΚΑΙ ΣΧΕΣΕΙΣ ΜΕ ΑΛΛΕΣ ΕΠΙΣΤΗΜΕΣ

Ως επιστημονικό εγχείρημα η μαχανική μάθηση αναπτύχθηκε από την έρευνα για τεχνητή νοημοσύνη. Ήδη, από τα πρώτα χρόνια της ακαδημαικής εργασίας πάνω στο θέμα της τεχνητής νοημοσύνης μερικοί ερευνητές ενδιαφέρονταν για την κατασκευή μηχανών που θα μάθαιναν από δεδομένα. Επιχείρησαν να προσεγγίσουν το πρόβλημα με ποικίλες συμβολικές μεθόδους, καθώς και με τα λεγόμενα νευρωικά δίκτυα. Αυτά ήταν κατά κύριο λόγο μοντέλα, που όπως διαπιστώθηκε αργότερα ήταν επανεφευρέσεις των γενικευμένων γραμμικών μοντέλων της στατιστικής.

Η μηχανική μάθηση αναπτύχθηκε ως ξεχωριστός τομέας που άνθισε την δεκαετία του 1990.Η προσοχή μετατοπίστηκε από τις συμβολικές προσεγγίσεις που κληρονόμησε από την Τεχνητή Νοημοσύνη και που στόχο είχαν την αντιμετώπιση επιλύσιμων προβλημάτων πρακτικής φύσης και δόθηκε έμφαση σε μεθόδους και μοντέλα της στατιστικής και της θεωρίας πιθανοτήτων.Επίσης επωφελήθηκε από την διαθεσιμότητα ψηφιοποιημένων πληροφοριών και της δυνατότητας να διανεμηθούν μέσω Διαδικτύου.

Η μηχανική μάθηση και η εξόρυξη δεδομένων χρησιμοποιούν συχνά τις ίδιες μεθόδους και επικαλύπτονται σημαντικά. Θα μπορούσαμε να τις διακρίνουμε ως εξης:

Η μηχανική μάθηση εστιάζει στην πρόβλεψη, που βασίζεται σε γνωστές ιδιότητες που απορρέουν από το σύνολο εκπαίδευσης.
Η εξόρυξη δεδομένων εστιάζει στην ανακάλυψη ιδιοτήτων μη γνωστών εκ των προτέρων. Αυτό είναι το βήμα ανάλυσης στην Ανακάλυψη Γνώσης από βάσεις δεδομένων.

Οι δύο τομείς επικαλύπτονται με πολλούς τρόπους.Η εξόρυξη δεδομένων χρησιμοποιεί πολλές μεθόδους μηχανικής μάθησης, αλλά συχνά με διαφορετικούς στόχους. Από την άλλη πλευρά και η μηχανική μάθηση χρησιμοποιεί μεθόδους εξόρυξης δεδομένων, όπως η μη επιτηρούμενη μάθηση, ή στο στάδιο επεξεργασίας για να βελτιώνει την ακρίβεια της μάθησης. Ένα μεγάλο μέρος της σύγχυσης μεταξύ των δύο ερευνητικών τομέων (που συχνά έχουν ξεχωριστά συνέδρια και περιοδικά, ECML PKDD αποτελεί σημαντική εξαίρεση) προκύπτει από τις βασικες υπόθεσεις πάνω στις οποίες και οι δύο δουλεύουν: στην μηχανική μάθηση η απόδοση συνήθως αξιολογείται ως προς την ικανότητα αναπαραγωγής γνώσης, την οποία ήδη κατέχουμε, ενώ στην Ανακάλυψη Γνώσης και την Εξόρυξη Δεδομένων το κλειδί είναι η ανακάλυψη γνώσης που δεν προκατέχουμε. Στην πρώτη περίπτωση μια μέθοδος επιτηρούμενης μάθησης μπορεί να έχει καλύτερα αποτελέσματα, ενώ σε μία τυπική διεργασία Ανακάλυψης Γνώσης και Εξόρυξης δεδομένων οι επιτηρούμενες μέθοδοι μάθησης δεν λειτουργούν εξαιτίας της μη διαθεσιμότητας συνόλου εκπαίδευσης.

Ακόμη η μηχανική μάθηση συνδέεται με την βελτιστοποίηση: πολλά προβλήματα μάθησης διατυπώνονται ως η ελαχιστοποίηση των σφαλμάτων της συνάρτησης από ένα σύνολο δεδομένων εκπαίδευσης. Η διαφορά των δύο τομέων απορέει από τον στόχο της γενίκευσης: ενώ οι αλγόριθμοι βελτιστοποίησης μπορούν να ελαχιστοποιήσουν την απώλεια ενός συνόλου εκπαίδευσης, η μηχανική μάθηση εστιάζει στην ελαχιστοποίηση της απώλειας σε άγνωστες καταστάσεις.

Συσχέτιση με την στατιστική

Η μηχανική μάθηση και η στατιστική είναι δύο στενά συνδεδεμένοι επιστημονικόι τομείς. Σύμφωνα με τον Michael Jordan, οι ιδέες της μηχαβικής μάθησης, από τις μεθοδολογικές αρχές μέχρι τα θεωρητικά εργαλεία, προϋπάρχουν στην στατιστική. Ο ίδιος επίσης πρότεινε τον όρο Επιστήμη των Δεδομένων το συνολικό πεδίο.

Ο Leo Breiman διέκρινε δύο υποδείγματα στατιστικής μοντλοποίησης: το μοντέλο δεδομένων και το αλγοριθμικό μοντέλο, όπου το δεύτερο σημαίνει λίγο πολύ τους αλγορίθμους μηχανικής μάθησης, όπως το Random forest.

Τέλος, ορισμένοι στατιστικολόγοι υιοθετούν μεθόδους μηχανικής μάθησης, με αποτέλεσμα την δημιουργία ενός ανασυνδυσμένου τομέα που ονομάζεται στατιστική μάθηση.

Θεωρία

Ο βασικός σκοπός ενός μαθητευόμενου είναι να γενικεύει την εμπειρία του. Σε αυτό το πλαίσιο γενίκευση είναι η ικανότητα μιας μηχανής μάθησης να αποδίδει με ακρίβεια σε καινούριες, πρωτόγνωρες εργασίες, αφού πρώτα έχει εκπαιδευτεί σε ένα σύνολο δεδομένων εκπαίδευσης. Γενικά τα προς εκπαίδευση παραδείγματα προέρχονται από κάποια άγνωστη κατανομή πιθανότητας, η οποία θεωρείται αντιπροσωπευτική, και η μηχανή πρέπει να κατασκευάσει ένα γενικό μοντέλο που θα επιτρέπει την παραγωγή προβλέψεων σε καινούριες καταστάσεις με επαρκή ακρίβεια.

Η υπολογιστική ανάλυση των αλγορίθμων των μηχανών μάθησης και η απόδοσή τους είναι ένας κλάδος της θεωρητικής πληροφορικής, γνωστός ως Υπολογιστική θεωρία μάθησης. Επειδή τα εκπαιδευτικά σύνολα είναι πεπερασμένα και το μέλλον αβέβαιο, η θεωρία μάθησης δεν εγγυάται πάντα την απόδοση των αλγορίθμων. Αντ΄αυτού είναι συχνή η χρήση των πιπανοθεωρητικών ορίων της απόδοσης.

Το πόσο καλά ένα μοντέλο, που έχει εκπαιδευτεί σε υπαρκτά παραδείγματα, μπορεί να προβλέψει άγνωστες καταστάσεις ονομάζεται γενίκευση. Για την καλύτερη δυνατή γενίκευση, η πολυπλοκότητα της υπόθεσης θα πρέπει να είναι αντίστοιχη της πολυπλοκότητας της συνάρτησης των δεδομένων.

Πέρα όμως από την απόδοση, οι θεωρηρικοί της υπολογιστικής μάθησης μελετούν την χρονική πολυπλοκότητα καθώς και το κατά πόσο είναι εφικτή η μάθηση. Στην υπολογιστική θεωρία μάθησης ένας υπολογισμός θεωρείται εφικτός αν μπορεί να επιτελεσρεί σε πολυωνυμικό χρόνο. Υπάρχουν δύο είδη αποτελεσμάτων αναφορικά με την χρονική πολυπλοκότητα. Τα θετικά αποτελέσματα που σημαίνουν ότι μια συγκεκριμένη κλάση αντιστοιχίσεων μπορούν να επιτευχθούν σε πολυωνυμικό χρόνο και τα αρνητικά αποτελέσματα που δείχνουν το αντίθετο.

Υπάρχουν πολλά κοινά στοιχεία μεταξύ της θεωρίας μηχανικής μάθησης και της στατιστικής συμπερασματολογίας, ωστόσο συνήθως χρησιμοποιούν διαφορετικούς όρους.

Εφαρμογές

Οι εφαρμογές μηχανικής μάθησης περιλαμβάνουν:

Το 2006, η διαδυκτιακή εταιρία ταινιών το Netflix διοργάνωσε τον πρώτο διαγωνισμό "Βραβείο Netflix" προκειμένου να βρεθεί ένα πρόγραμμα που να προβλέπει καλύτερα τις προβλέψεις των χρηστών και να βελτιώσει την ακρίβεια του αλγορίθμου πρότασης ταινιών Cinematch, που τότε χρησιμοποιούσε, κατά τουλάχιστον 10%. Μια ομάδα αποτελούμενη από ερευνητές από την AT&T Labs-Research σε συνεργασία με τις ομάδες Big Chaos και Pragmatic Theory κατασκεύασε ένα μοντέλο και κέρδισε το βραβείο του 1εκ.δολαρίων το 2009.Λίγο καιρό μετά την απονομή του βραβείου, η διοίκηση της Netflix συνειδητοποίησε ότι τα ποσοστά τηλεθέασης των θεατών δεν ήταν ο καλύτερος δείκτης των μοτίβων τηλεθέασης ("τα πάντα είναι τηλεθέαση")και άλλαξαν ανλόγως την μηχανή σύστασής τους.

Το 2010 το περιοδικό The Wall Street έγραψε ότι η εταιρεία διαχείρησης χρημάτων Rebellion Research's χεησιμοποιούσε την μηχανική μάθηση για να προβλέψει οικονομικές κινήσεις.Το άρθρο περιέγραφε την πρόβλεψη της εταιρείας για την οικονομική κρίση και την οικονομική ανάκαμψη.

Το 2014 έχει αναφερθεί ότι ένας αλγόριθμος μηχανικής μάθησης έχει εφαρμοστεί στην Ιστορία της Τέχνης για την μελέτη πινάκων ζωγραφικής και ότι θα μπορούσε να αποκαλύψει επιρροές μεταξύ καλλιτεχνών που προηγουμένως δεν είχαν εντοπιστεί.

Ηθική

H Μηχανική Μάθηση, θέτει μια σειρά από ηθικά ζητήματα. Τα συστήματα τα οποία έχουν εκπαιδευτεί σε σύνολα δεδομένων που συλλέγονται με προκαταλήψεις μπορεί να εμφανίζουν αυτές τις προκαταλήψεις κατά τη χρήση, ψηφιοποιώντας πολιτιστικές προκαταλήψεις όπως ο θεσμικός ρατσισμός και ο ταξικός διαχωρισμός. Έτσι η υπεύθυνη συλλογή δεδομένων είναι ένα κρίσιμο κομμάτι της μηχανικής μάθησης.

Χρήστης:Melmathiakh/πρόχειρο

Πίνακας περιεχομένων

ΙΣΤΟΡΙΑ ΚΑΙ ΣΧΕΣΕΙΣ ΜΕ ΑΛΛΕΣ ΕΠΙΣΤΗΜΕΣ

Συσχέτιση με την στατιστική

Θεωρία

Εφαρμογές

Ηθική

Περιοδικά

Συνέδρια