Απόσταση Χάμινγκ
Στην θεωρία πληροφορίας, ως απόσταση Χάμινγκ μεταξύ δύο συμβολοσειρών ίσου μήκους ορίζεται ο αριθμός θέσεων στις οποίες τα αντίστοιχα σύμβολα είναι διαφορετικά. Η απόσταση Χάμινγκ, μετρά τον ελάχιστο αριθμό αντικαταστάσεων που χρειάζονται ώστε να μετατραπεί η μία συμβολοσειρά στην άλλη, ή αλλιώς, τον αριθμό των λαθών που μετέτρεψαν την μία συμβολοσειρά στην άλλη.
Παραδείγματα
ΕπεξεργασίαΗ απόσταση Χάμμινγκ μεταξύ:
- "τόνος" και "πόθοι" είναι 3.
- 1011101 και 1001001 είναι 2.
- 2173896 και 2233796 είναι 3.
Ειδικές ιδιότητες
ΕπεξεργασίαΓια δεδομένο μήκος n, η απόσταση Χάμινγκ είναι μετρική στον διανυσματικό χώρο των λέξεων αυτού του μήκους, καθώς εμφανώς ικανοποιεί τις προϋποθέσεις της μη αρνητικότητας, της ταυτότητας των μη διακρισίμων και της συμμετρίας, και μπορεί να δειχθεί εύκολα με πλήρη επαγωγή ότι ικανοποιεί και την τριγωνική ανισότητα. Η απόσταση Χάμινγκ μεταξύ δύο λέξεων a και b μπορεί επίσης να ειδωθεί ως το βάρος Hamming του a−b για κατάλληλη του τελεστή −.
Για δυαδικές συμβολοσειρές a και b η απόσταση Χάμινγκ είναι ίση με τον αριθμό των μονάδων στο a XOR b. Ο μετρικός χώρος δυαδικών συμβολοσειρών μήκους n, με την απόσταση Χάμινγκ είναι γνωστός ως κύβος Χάμινγκ. Είναι ισοδύναμος ως μετρικός χώρος με το σύνολο των αποστάσεων μεταξύ κορυφών σε ένα γράφημα υπερκύβου. Αν η δυαδική συμβολοσειρά μήκους n θεωρηθεί ως διάνυσμα στο μεταχειρίζοντας κάθε σύμβολο της ως πραγματική συντεταγμένη, οι συμβολοσειρές σχηματίζουν τις κορυφές ενός n-διάστατου υπερκύβου, και η απόσταση Χάμινγκ των συμβολοσειρών είναι ισοδύναμη με την απόσταση Μανχάταν των κορυφών.
Ιστορία και εφαρμογές
ΕπεξεργασίαΗ απόσταση Χάμινγκ πήρε το όνομά της από τον Ρίτσαρντ Χάμινγκ (Richard Hamming), ο οποίος την εισήγαγε στην θεμελιώδη εργασία του για τους κώδικες Χάμινγκ, Κώδικας εντοπισμού και διόρθωσης σφαλμάτων (Error detecting and error correcting codes, 1950).[1] Χρησιμοποιείται στην τηλεπικοινωνία για την μέτρηση των ανεστραμμένων μπιτ σε μία σταθερού μήκους ψηφιακή λέξη ως εκτίμηση σφάλματος, και συνεπώς μερικές φορές αποκαλείται και απόσταση σήματος. Η ανάλυση βάρους Χάμινγκ χρησιμοποιείται σε αρκετούς τομείς, όπως η θεωρία πληροφορίας, θεωρία κωδικοποίησης και κρυπτογραφία. Ωστόσο για την σύγκριση συμβολοσειρών διαφορετικού μήκους, ή συμβολοσειρών όπου δεν έχουν γίνει μόνο αντικαταστάσεις αλλά αναμένονται και εισαγωγές ή διαγραφές είναι καταλληλότερες πιο πολύπλοκες μέθοδοι όπως η απόσταση Λεβενστέιν. Για q-δικές συμβολοσειρές επί ενός αλφάβητου μεγέθους q ≥ 2 η απόσταση Χάμινγκ εφαρμόζεται στην περίπτωση της ορθογωνικής διαμόρφωσης, ενώ η απόσταση Λι χρησιμοποιείται για την φασική διαμόρφωση. Αν q = 2 ή q = 3 οι αποστάσεις συμπίπτουν.
Η απόσταση Χάμινγκ χρησιμοποιείται επίσης στη συστηματική ως μέτρο της γενετικής απόστασης.[2]
Παραπομπές
ΕπεξεργασίαΠηγές
Επεξεργασία- Hamming, Richard W. (1950), «Error detecting and error correcting codes», Bell System Technical Journal 29 (2): 147–160, MR 0035935, http://www.caip.rutgers.edu/~bushnell/dsdwebsite/hamming.pdf, ανακτήθηκε στις 2010-11-03.
- Pilcher, C. D.; Wong, J. K.; Pillai, S. K. (March 2008), «Inferring HIV transmission dynamics from phylogenetic sequence relationships», PLoS Med. 5 (3): e69, doi: , PMID 18351799.
- Wegner, Peter (1960), «A technique for counting ones in a binary computer», Communications of the ACM 3 (5): 322, doi:.