Η κανονική κατανομή (γνωστή και ως γκαουσιανή κατανομή) αναφέρεται σε συνεχείς μεταβλητές αποτελώντας μία συνεχή συνάρτηση πυκνότητας πιθανότητας. Χρησιμοποιείται ως μία πρώτη προσέγγιση για να περιγραφούν τυχαίες μεταβλητές πραγματικών τιμών, οι οποίες τείνουν να συγκεντρώνονται γύρω από μια μέση τιμή. Η κανονική κατανομή αποτελεί την πιο σημαντική κατανομή της στατιστικής μεθοδολογίας για τους εξής βασικούς λόγους:[1]

  • Την κανονική κατανομή ακολουθούν είτε με ακρίβεια είτε με μεγάλη προσέγγιση τα περισσότερα συνεχή φαινόμενα.
  • Πολλές ασυνεχείς κατανομές πιθανοτήτων μπορούν να προσεγγιστούν μέσω της κανονικής κατανομής. Για παράδειγμα πολλά πληθυσμιακά χαρακτηριστικά, όπως το ύψος, το βάρος η βαθμολογία σε διαγώνισμα, κ.λπ.
  • Η κανονική κατανομή αποτελεί σύμφωνα με το θεώρημα κεντρικού ορίου (το άθροισμα ενός ικανοποιητικά μεγάλου αριθμού ανεξάρτητων και ισόνομων τυχαίων μεταβλητών προσεγγίζεται από την κανονική κατανομή) τη βάση της στατιστικής συμπερασματολογίας ή επαγωγικής στατιστικής.
  • Τυχαία σφάλματα που εμφανίζονται σε διάφορες μετρήσεις έχουν κανονική κατανομή. Γι' αυτό το λόγο η Κανονική κατανομή αναφέρεται πολλές φορές και ως κατανομή σφαλμάτων.
Συνάρτηση κατανομής για διάφορες παραμέτρους
Συμβολισμός
Παράμετροι = Μέσος
= Διακύμανση
Στήριγμα
Συνάρτηση Πυκνότητας
Πιθανότητας
Μέσος
Διάμεσος
Διακύμανση
Ασυμμετρία
Κύρτωση
Εντροπία
Ροπογεννήτρια
Χαρακτηριστική
Πληροφορία Fisher

Η γραφική παράσταση της σχετιζόμενης συνάρτησης πυκνότητας πιθανότητας έχει σχήμα «καμπάνας», και είναι γνωστή ως γκαουσιανή συνάρτηση ή κωδωνοειδής καμπύλη:[2]

.

Ορισμός Επεξεργασία

Μια πραγματική τυχαία μεταβλητή   ακολουθεί την κανονική κατανομή με μέση τιμή   και διακύμανση  , συμβολίζεται με   όταν η συνάρτηση πυκνότητας πιθανότητας της είναι

 ,

όπου   είναι η βάση του φυσικού λογάριθμου ( ),   η γνωστή μαθηματική σταθερά ( ),   ο μέσος όρος του πληθυσμού,   η τυπική απόκλιση του πληθυσμού και   μια τιμή της συνεχούς τυχαίας μεταβλητής στο διάστημα   έως  ,

Για μια τυχαία μεταβλητή   η συνάρτηση πυκνότητας πιθανότητας συμβολίζεται με   και η συνάρτηση κατανομής με  .

Ιδιότητες Επεξεργασία

Γραμμικοί μετασχηματισμοί Επεξεργασία

Η οικογένεια των κανονικών κατανομών είναι κλειστή ως προς τους γραμμικούς μετασχηματισμούς. Δηλαδή, αν   και   με  , η τυχαία μεταβλητή   ακολουθεί επίσης την κανονική κατανομή με

 

Συγκεκριμένα για   προκύπτει   και αντιστρόφως  

Για τη συνάρτηση κατανομής της   ισχύει   και για τη συνάρτηση πυκνότητας πιθανότητας  .

Συμμετρία Επεξεργασία

Η συνάρτηση πυκνότητας πιθανότητας είναι συμμετρική ως προς τη μέση τιμή, δηλαδή   για κάθε  . Ως ειδική περίπτωση ισχύει ότι   και

 

Διαστήματα εμπιστοσύνης Επεξεργασία

Σε μια δειγματοληψία από κανονική κατανομή το 68,3% των τιμών απέχει το πολύ κατά   από τη μέση τιμή, βρίσκεται δηλαδή στο διάστημα  . Το 95,5% των τιμών βρίσκεται στο   και το 99,7% στο  .

Στη γενική περίπτωση ενός διαστήματος   ισχυεί

 

Αν το διαστημα είναι συμμετρικό ως προς τη μέση τιμή

 

Τυποποιημένη κανονική κατανομή Επεξεργασία

 
Το σκούρο μπλε είναι λιγότερο από μία τυπική απόκλιση από το μέσο. Στην κανονική κατανομή, αυτό αφορά στο 68% των παρατηρήσεων, ενώ δύο τυπικές αποκλίσεις από τον μέσο (μπλε και σκούρο μπλε) αφορούν στο 95%, και τρεις τυπικές αποκλίσεις (ανοιχτό μπλε, μπλε και σκούρο μπλε) αφορούν το 99,7%.

Η κανονική κατανομή που έχει μέση τιμή   και τυπική απόκλιση   (άρα και διακύμανση  ), συμβολίζεται με   και ονομάζεται τυποποιημένη κανονική κατανομή. Μια τυχαία μεταβλητή που ακολουθεί την τυποποιημένη κανονική κατανομή, έχει επικρατήσει να συμβολίζεται με   και η συνάρτηση πυκνότητάς της με  , όπου

 , για  .

Η τυποποίηση των δεδομένων βασίζεται στην απόκλισή τους από το μέσο όρο σε όρους της σ, σύμφωνα με τον τύπο  . Με τον τύπο αυτό μπορούν να μετατραπούν τα δεδομένα μιας μεταβλητής που κατανέμεται κανονικά σε τυποποιημένη μορφή και να υπολογιστούν οι πιθανότητες χρησιμοποιώντας τους πίνακες της τυποποιημένης κανονικής κατανομής. Οι πίνακες της τυποποιημένης κανονικής κατανομής δίνουν τις αθροιστικές πιθανότητες της κατανομής της  , δηλαδή τα εμβαδά της κατανομής από   έως και μία συγκεκριμένη τιμή της   (π.χ.  ). Έτσι, οι πίνακες δίνουν τις πιθανότητες   για όλα τα   από -3,99 έως +3,99 με βήμα 0,01.

Σχέσεις με άλλες κατανομές Επεξεργασία

  • Έστω ανεξάρτητες τυχαίες μεταβλητές   που ακολουθούν την κανονική κατανομή με μέση τιμή 0 και διακύμανση 1. Το άθροισμα των τετραγώνων τους ακολουθεί την κατανομή   με   βαθμούς ελευθερίας, δηλαδή
 
  • Έστω ανεξάρτητες τυχαίες μεταβλητές   που ακολουθούν την κανονική κατανομή με μέση τιμή μ και διακύμανση σ2. Η κάτωθι τυχαία μεταβλητή ακολουθεί την κατανομή t-Student με n−1 βαθμούς ελευθερίας, δηλαδή
 

Προσέγγιση ασυνεχών κατανομών με την κανονική κατανομή Επεξεργασία

Η προσέγγιση ασυνεχών κατανομών με μεγάλη ακρίβεια απ' την κανονική κατανομή, παρά το γεγονός ότι σαν συνεχής κατανομή περιγράφει μόνο συνεχείς μεταβλητές, αποτελεί βασικό της πλεονέκτημα. Η προσέγγιση αυτή ισχύει για εκείνες τις περιπτώσεις που και οι ασυνεχείς κατανομές τείνουν να πάρουν το σχήμα της "κωδωνοειδούς" καμπύλης.

Διωνυμική κατανομή Επεξεργασία

Η διωνυμική κατανομή   τείνει προς την κανονική κατανομή   με   και  , όσο αυξάνει το μέγεθος του δείγματος  .

Η προσέγγιση χρησιμοποείται συνήθως όταν το μέγεθος του δείγματος είναι μεγαλύτερο από 20. Για μικρότερα δείγματα, η παράμετρος   πρέπει να είναι κοντά στο  .

Κατανομή Poisson Επεξεργασία

Η κατανομή Πουασσόν   τείνει προς την κανονική   με   και  , όσο αυξάνει η παράμετρος  .

Εφαρμογές Επεξεργασία

Κατηγοριοποίηση εφαρμογών κανονικής κατανομής σε πρακτικά προβλήματα:

  1. Φαινόμενα που ακολουθούν την κανονική κατανομή
  2. Φαινόμενα που προσεγγίζονται από την κανονική κατανομή, όπως αυτά που η προσέγγισή τους δικαιολογείται από το κεντρικό οριακό θεώρημα
  3. Φαινόμενα των οποίων κατανομές που μοντελοποιούνται ως κανονική

Φαινόμενα που ακολουθούν την κανονική κατανομή Επεξεργασία

 
Η βασική ενεργειακή κατάσταση ενός κβαντικού αρμονικού ταλαντωτή παρουσιάζει κανονική κατανομή.

Ορισμένα μεγέθη στην φυσική κατανέμονται κανονικά, όπως έδειξε πρώτος ο Τζέιμς Κλερκ Μάξγουελ. Παραδείγματα τέτοιων μεγεθών είναι:

Φαινόμενα που προσεγγίζονται από την κανονική κατανομή Επεξεργασία

Προσεγγιστικές κανονικές κατανομές παρατηρούνται σε διάφορες καταστάσεις, όπως εξηγείται από το κεντρικό οριακό θεώρημα. Δηλαδή, όταν το άθροισμα ενός ικανοποιητικά μεγάλου αριθμού ανεξάρτητων και ισόνομων τυχαίων μεταβλητών προκαλεί ένα φαινόμενο, αυτό προσεγγίζεται από την κανονική κατανομή.

  • Σε αριθμητικά προβλήματα, όπου το κεντρικό οριακό θεώρημα περιλαμβάνει μία προσέγγιση διακριτού σε συνεχές, όπως:
  • Το θερμικό φως ακολουθεί την κατανομή Μπόους–Αϊνστάιν για πολύ μικρά χρονικά διαστήματα, και κανονική κατανομή σε μεγαλύτερα χρονικά διαστήματα εξαιτίας του κεντρικού οριακού θεωρήματος.

Φαινόμενα των οποίων κατανομές που μοντελοποιούνται ως κανονική Επεξεργασία

 
  • Στη βιολογία, ο λογάριθμος διαφόρων μεταβλητών τείνει να ακολουθεί την κανονική κατανομή, δηλαδή, τείνουν να ακολουθούν μία λογαριθμική κανονική κατανομή, με παραδείγματα όπως:
    • Μέτρα μεγέθους ζωντανού ιστού (μήκος, ύψος, επιφάνεια δέρματος, βάρος).[3]
    • Το μήκος αδρανών προσαρτημάτων (μαλλιά, νύχια, δόντια) βιολογικών δειγμάτων, στην κατεύθυνση της μεγέθυνσης.
    • Ορισμένα φυσιολογικά μεγέθη, όπως η πίεση του αίματος των ενηλίκων.
  • Στα οικονομικά, και συγκεκριμένα το μοντέλο Black–Scholes, αλλαγές στο λογάριθμο των συναλλαγματικών ισοτιμιών, των δεικτών τιμών, και των χρηματιστηριακών δεικτών υποτίθενται ως κανονικές. Ορισμένοι μαθηματικοί αντιτίθενται σε αυτή την περίπτωση χρήσης της κανονικής κατανομής.
  • Τα υπολογιστικά λάθη σε φυσικά πειράματα μοντελοποιούνται συχνά μέσω της κανονικής κατανομής.
  • Σε τυποποιημένα τεστ, τα αποτελέσματα αναλύονται βάσει της κανονικής κατανομής.
  • Στην υδρολογία η κατανομή της μακροχρόνιας βροχόπτωσης (π.χ. μηνιαία ή ετήσια σύνολα, αποτελούμενα από το άθροισμα 30 και 360 ημερησίων τιμών αντίστοιχα) θεωρείται συχνά ότι ακολουθεί πρακτικά την κανονική κατανομή σύμφωνα με το κεντρικό οριακό θεώρημα.

Ονομασία Επεξεργασία

Από την εμφάνισή της, η κανονική κατανομή έχει ονομαστεί με διαφορετικούς τρόπους: ο νόμος του σφάλματος, δεύτερος νόμος του Λαπλάς, νόμος του Γκάους, κ.λπ. Από το τέλος του 18ου αιώνα ορισμένοι συγγραφείς [4] είχαν αρχίσει να χρησιμοποιούν την ονομασία κανονική κατανομή, όπου η λέξη «κανονική» χρησιμοποιείτο ως επίθετο — ο όρος προερχόταν απ' το γεγονός ότι η κατανομή αυτή θεωρείτο ως τυπική, συνήθης, κανονική. Ο Πιρς (ένας από τους συγγραφείς αυτούς) κάποτε όρισε τον όρο "κανονική" ως: «...το "κανονική" δεν είναι ο μέσος όρος (ή κάποιο άλλο είδος μέσου) αυτού που συμβαίνει πραγματικά, αλλά αυτού που θα συνέβαινε, μακροπρόθεσμα, υπό ορισμένες συνθήκες».[5] Στην αρχή του 20ου αιώνα ο Καρλ Πίρσον έκανε δημοφιλή τον όρο κανονική σαν προσδιορισμό για την κατανομή αυτή.[6]

Επιπλέον, ο Πίρσον ήταν αυτός που πρώτος έγραψε την κατανομή σε όρους τυπικής απόκλισης   όπως στη σύγχρονη σημειογραφία. Σύντομα μετά από αυτό, το έτος 1915, ο Ρόναλντ Φίσερ προσέθεσε την παράμετρο της τοποθεσίας στην εξίσωση για την κανονική κατανομή, εκφράζοντάς την με τον τρόπο που γράφεται ακόμα και σήμερα:

 .

Ο όρος "τυποποιημένη κανονική" ο οποίος υποδηλώνει την κανονική κατανομή με μέσο μηδέν και μοναδιαία διακύμανση ήρθε σε γενική χρήση στη δεκαετία του '50, εμφανιζόμενος στα δημοφιλή εγχειρίδια του P. G. Hoel[7] και A. M. Mood.[8][9]

Η ονομασία «κατανομή του Γκάους» προήλθε από τον Καρλ Φρίντριχ Γκάους, ο οποίος εισήγαγε την κατανομή το 1809 ως έναν τρόπο εκλογίκευσης της μεθόδου ελαχίστων τετραγώνων. Η σχετική δουλειά του Λαπλάς, οδήγησε την κανονική κατανομή στο να ονομάζεται μερικές φορές Λαπλασιανή, ειδικά σε χώρες με επίσημη γλώσσα τα γαλλικά. Μεταξύ των αγγλόφωνων λαών, τόσο η χρήση του όρου «κανονική κατανομή» όσο και του όρου «κατανομή Γκάους» είναι συνήθης, με κάθε μία να προτιμάται από διαφορετική κοινότητα.

Παραπομπές Επεξεργασία

  1. Χαλικιάς, Ιωάννης (2003). Στατιστική: Μέθοδοι Ανάλυσης για Επιχειρηματικές Αποφάσεις (2η έκδοση). Γέρακας: Rosili. σελ. 118. ISBN 9607745086. 
  2. Ο χαρακτηρισμός «κωδωνοειδής καμπύλη» είναι αμφιλεγόμενος: υπάρχουν πολλές κατανομές κωδωνοειδούς σχήματος (καμπάνα): η κατανομή Κωσύ, η κατανομή t-Student, η γενικευμένη κανονική κατανομή, κ.λπ.
  3. Huxley, Julian S. (1932). Problems of Relative Growth. London. ISBN 978-0-486-61114-3. OCLC 476909537. 
  4. όπως σε έργα των Πιρς, Γκάλτον, Lexis περί το 1875
  5. Peirce, C. S. Charles Sanders Peirce bibliography Collected Papers. 6. σελίδες paragraph 327. 
  6. Kruskal, W. H.; Stigler, S. M. (1997). B. Spencer, επιμ. «Normative terminology: "Normal" in statistics and elsewhere». Statistics and Public Policy (Oxford Univ. Press): 85-111. 
  7. Paul G. Hoel (1947). Introduction to mathematical statistics. 
  8. Alexander M. Mood (1950). Introduction to the theory of statistics. 
  9. Jeff Miller. «Earliest Known Uses of Some of the Words of Mathematics». Ανακτήθηκε στις 10 Φεβρουαρίου 2024. 

Βιβλιογραφία Επεξεργασία

  • Spiegel, M.· Stephens, L. (2000). Θεωρία και Προβλήματα Στατιστικής (3η έκδοση). Αθήνα: Τζιόλα. ISBN 960805012X. 
  • Παπαδόπουλος, Γεώργιος. «Βασικές συνεχείς κατανομές και το Κεντρικό Οριακό Θεώρημα» (PDF). Γεωπονικό Πανεπιστήμιο Αθηνών. Ανακτήθηκε στις 10 Φεβρουαρίου 2024. 
  • Δαμιανός, Χ.· Παπαδάτος, Ν.· Χαραλαμπίδης Χ. Α. (2003). Εισαγωγή στις Πιθανότητες και τη Στατιστική, Διδακτικές Σημειώσεις. Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών. ISBN 9789602663080.