Ομαδοποίηση Κ-μέσων

Αλγόριθμος

Η ομαδοποίηση k-μέσων είναι μία μέθοδος διανυσματικής κβαντοποίησης η οποία είναι δημοφιλής στην ανάλυση συστάδων (κλάδος της εξόρυξης δεδομένων). Η ομαδοποίηση αυτή έχει ως στόχο να διαχωρίσει n παρατηρήσεις σε k ομάδες, έτσι ώστε κάθε παρατήρηση να ανήκει στη συστάδα με το κοντινότερο μέσο, το οποίο χρησιμεύει ως ένα χαρακτηριστικό δείγμα της συστάδας. Αυτό οδηγεί σε μια διαμέριση του χώρου δεδομένων σε κελιά Voronoi.Υπάρχει μία σχετική συσχέτιση του αλγορίθμου με τον k-nearest neighbor classifier, μια δημοφιλή τεχνική μηχανικής μάθησης που χρησιμοποιείται για ταξινόμηση. Συχνά συγχέονται οι δύο αλγόριθμοι εξαιτίας του k στο όνομα αμφότερων. 

Ιστορία Επεξεργασία

Ο όρος "k-means" χρησιμοποιήθηκε για πρώτη φορά από τον Τζέιμς Μακ Κουήν το 1967,[1] αν και η ιδέα ανήκει στον Hugo Steinhaus, το 1957.[2]

Αναφορές Επεξεργασία

  1. MacQueen, J. B. (1967).
  2. Steinhaus, H. (1957). «Sur la division des corps matériels en parties» (στα French). Bull. Acad. Polon. Sci. 4 (12): 801–804. MR 0090073. Zbl 0079.16403.