Κανονικοποίηση ποσοστημορίων: Διαφορά μεταξύ των αναθεωρήσεων
Περιεχόμενο που διαγράφηκε Περιεχόμενο που προστέθηκε
Δημιουργήθηκε από μετάφραση της σελίδας "Quantile normalization" |
μΧωρίς σύνοψη επεξεργασίας |
||
Γραμμή 1:
Στη στατιστική, η κανονικοποίηση ποσοστημορίων (quantile normalization ή quantile standardization) είναι μια τεχνική για το μετασχηματισμό δύο [[Κατανομή πιθανότητας|κατανομών]] ώστε να αποκτήσουν παρόμοιες στατιστικές ιδιότητες. Για να κανονικοποιήσουμε μια κατανομή βάσει αυτής της μεθόδου, ορίζουμε μια κατανομή αναφοράς (reference distribution) ίδιου μήκους και τις ταξινομούμε και τις δύο χωριστά. Τότε, η υψηλότερη τιμή της πρώτης κατανομής παίρνει την υψηλότερη τιμή της κατανομής αναφοράς, τη δεύτερη υψηλότερη τιμή της κατανομής αναφοράς, κοκ, μέχρις ότου η κατανομή που μας ενδιαφέρει να αποτελεί τελικά μια αναδιάταξη των στοιχείων της κατανομής αναφοράς.
<span class="cx-segment" data-segmentid="7"></span>Για να κανονικοποιήσουμε δύο ή περισσότερες κατανομές μεταξύ τους, χωρίς τη χρήση μιας κατανομής αναφοράς, ταξινομούμε όπως πριν, κι έπειτα θέτουμε το [[Μέσος όρος|μέσο όρο]] (συνήθως τον αριθμητικό μέσο όρο) των κατανομών. Έτσι, η υψηλότερη τιμή σε όλες τις κατανομές γίνεται ο μέσος όρος των υψηλότερων τιμών, η δεύτερη υψηλότερη γίνεται ο μέσος όρος των δεύτερων υψηλότερων, κοκ.
Γραμμή 6 ⟶ 5 :
<span class="cx-segment" data-segmentid="12"></span>Στις περισσότερες περιπτώσεις, η κατανομή αναφοράς θα είναι μια συνήθης στατιστική κατανομή, όπως η [[Κανονική κατανομή|Κατανομή Gauss]] ή η [[Κατανομή Πουασσόν|κατανομή Poisson]]. Μπορεί επίσης να παραχθεί τυχαία ή να κατασκευαστεί με δειγματοληψία από την αντίστοιχη [[συνάρτηση κατανομής]]. Όπως και να 'χει, μπορεί να χρησιμοποιηθεί οποιαδήποτε συνάρτηση αναφοράς.
Η κανονικοποίηση ποσοστημορίων χρησιμοποιείται συχνά στην ανάλυση δεδομένων από [[
== Παράδειγμα ==
Ακολουθεί μια σύντομη περιγραφή της μεθόδου σε ένα πολύ μικρό σύνολο δεδομένων
Έστω οι μικροσυστοιχίες 1 έως 3, και τα γονίδια A έως D:
A 5 4 3
B 2 1 4
C 3 4 6
D 4 2 8
Για κάθε στήλη αντιστοιχίζουμε ένα βαθμό (i-iv) από τη χαμηλότερη στην υψηλότερη τιμή:
A iv iii i
B i i ii
Γραμμή 26 ⟶ 25 :
C 3 4 6 γίνεται C 4 4 6
D 4 2 8 γίνεται D 5 4 8
Τώρα υπολογίζουμε το μέσο όρο κάθε γραμμής για να αντιστοιχίσουμε τους βαθμούς:
A (2 1 3)/3 = 2.00 = βαθμός i
B (3 2 4)/3 = 3.00 = βαθμός ii
Γραμμή 33 ⟶ 32 :
Στη συνέχεια παίρνουμε τον πίνακα βαθμών που υπολογίσαμε νωρίτερα και αντικαθιστούμε τις τιμές τους.
Το:
A iv iii i
B i i ii
|