Διαφορά μεταξύ των αναθεωρήσεων του «Συσταδοποίηση»

μ
→‎Εγκυρότητα: Προσθήκη παραπομπής για τον δείκτη Γ του Hubert.
μ (→‎Εγκυρότητα: Προσθήκη παραπομπής για τον δείκτη Γ του Hubert.)
==Εγκυρότητα==
Η εγκυρότητα συσταδοποίησης είναι η διαδικασία εκείνη κατά την οποία εκτιμάται ότι η έξοδος του αλγόριθμου είναι ουσιαστικά ένα σύνολο από ομάδες διανυσμάτων, οι οποίες πληρούν τον ορισμό της συσταδοποίησης καθώς και ορισμένα επιπλέον κριτήρια. Γενικά ο έλεγχος μπορεί να επιτευχθεί με τρεις διαφορετικούς τρόπους ανάλογα με τα κριτήρια που χρησιμοποιούμε:
#'''Εσωτερικά κριτήρια'''. Ο έλεγχος ενός αλγορίθμου Α επιτυγχάνεται λαμβάνοντας υπ' όψη μόνο τα δεδομένα εισόδου του, αυτά που χρησιμοποιήθηκαν για να επιτευχθεί η συσταδοποίηση. Για παράδειγμα, αν ο Α αποτελεί έναν ιεραρχικό αλγόριθμο, τότε η εκτίμηση του συγκεκριμένου αλγορίθμου μπορεί να γίνει αποκλειστικά από τον πίνακα εγγύτητας. Ένας τέτοιος δείκτης είναι ο τροποποιημένος στατιστικός δείκτης Γ του Hubert <ref>{{Cite journal|url=http://onlinelibrary.wiley.com/doi/10.1111/j.2044-8317.1976.tb00714.x/abstract|title=Quadratic Assignment as a General Data Analysis Strategy|last=Hubert|first=Lawrence|last2=Schultz|first2=James|date=1976-11-01|journal=British Journal of Mathematical and Statistical Psychology|issue=2|doi=10.1111/j.2044-8317.1976.tb00714.x|volume=29|pages=190–241|language=en|issn=2044-8317}}</ref>: <math>\Gamma=\frac{1}{M}\cdot\sum_{i=1}^{N-1} \sum_{j=i+1}^N P(i,j)Q(i,j)</math> όπου P ο πίνακας εγγύτητας μεταξύ των διανυσμάτων, Q ο πίνακας εγγύτητας μεταξύ των αντιπροσώπων, δηλαδή Q(i,j) = d(w<sub>g</sub>,w<sub>r</sub>) με x<sub>i</sub>∈C<sub>g</sub> , x<sub>j</sub>∈C<sub>r</sub> και M=N·(N-1)/2. Οι συμμετρικοί πίνακες P,Q σχηματίζονται χρησιμοποιώντας το ίδιο μέτρο απόστασης d(·). Υψηλές τιμές του Γ μεταφράζονται ως ομοιότητα μεταξύ πινάκων P,Q, κάτι που συνεπάγεται την'' ορθότητα'' του αλγορίθμου.
#'''Εξωτερικά κριτήρια'''. Σε αυτή την περίπτωση ''υπολογίζεται μία δομή των διανυσμάτων Μ εξωτερικά από τον χρήστη''. Στη συνέχεια απλά γίνεται σύγκριση της συσταδοποίησης Μ={m<sub>1</sub>, m<sub>2</sub>… m<sub>s</sub>} με την έξοδο του αλγορίθμου C={ c<sub>1</sub>, c<sub>2</sub>… c<sub>k</sub>} . Για παράδειγμα έστω
#*TP = το πλήθος των διανυσμάτων που ανήκουν σε ίδια ομάδα κατά τη συσταδοποίηση C και P
56

επεξεργασίες