Διακύμανση: Διαφορά μεταξύ των αναθεωρήσεων
Περιεχόμενο που διαγράφηκε Περιεχόμενο που προστέθηκε
Δημιουργήθηκε από μετάφραση της σελίδας "Variance" |
Χωρίς σύνοψη επεξεργασίας |
||
Γραμμή 61:
=== Κατανομή Πουασσόν ===
Η [[κατανομή Πουασσόν]] με παράμετρο λ είναι μια διακριτή κατανομή για ''k'' = 0, 1, 2, ... Η [[
: <math>p(k) = \frac{\lambda^k}{k!} e^{-\lambda},</math>
και έχει αναμενόμενη τιμή μ = λ. Η διακύμανση είναι ίση με:
Γραμμή 68:
=== Διωνυμική κατανομή ===
Η [[διωνυμική κατανομή]] με παραμέτρους ''n'' και ''p'' είναι μια διακριτή κατανομή για ''k'' = 0, 1, 2, ..., ''n''. Η [[
: <math>p(k) = {n\choose k}p^k(1-p)^{n-k},</math>
και έχει αναμενόμενη τιμή μ = ''np''. Η διακύμανση είναι ίση με:
Γραμμή 128:
Ένας λόγος για να προτιμηθεί η χρήση της διακύμανσης από άλλα μέτρα διασποράς είναι ότι η διακύμανση του αθροίσματος (ή της διαφοράς) [[ασυσχέτιστων]] μεταβλητών είναι το άθροισμα των διακυμάνσεών τους:
: <math>\operatorname{Var}\left(\sum_{i=1}^n X_i\right) = \sum_{i=1}^n \operatorname{Var}(X_i).</math>
Αυτή η πρόταση ονομάζεται τύπος [[
: <math>\operatorname{Var}\left(\overline{X}\right) = \operatorname{Var}\left(\frac {1} {n}\sum_{i=1}^n X_i\right) = \frac {1} {n^2}\sum_{i=1}^n \operatorname{Var}\left(X_i\right) = \frac {\sigma^2} {n}.</math>
Δηλαδή, η διακύμανση της μέσης τιμής μειώνεται όταν το ''n ''αυξάνεται . Αυτός ο τύπος για τη διακύμανση της μέσης τιμής χρησιμοποιείται στον ορισμό του βασικού σφάλματος της μέσης τιμής του δείγματος , το οποίο χρησιμοποιείται στο [[Θεώρημα κεντρικού ορίου|κεντρικό οριακο θεώρημα.]] <span class="cx-segment" data-segmentid="304"></span>
Γραμμή 210:
=== Μονάδες μέτρησης ===
Σε αντίθεση με την αναμενόμενη απόλυτη απόκλιση, η διακύμανση μιας μεταβλητής έχει μονάδες που είναι το τετράγωνο από τις μονάδες της μεταβλητής. Για παράδειγμα, μια μεταβλητή που μετράται σε μέτρα θα έχει μια απόκλιση που μετράται σε μέτρα στο τετράγωνο. Για το λόγο αυτό, η περιγραφή των συνόλων δεδομένων μέσω της [[
Η τυπική απόκλιση και η αναμενόμενη απόλυτη απόκλιση μπορούν να χρησιμοποιηθούν ως δείκτης της "εξάπλωσης" της κατανομής. Η τυπική απόκλιση είναι πιο δεκτική στην αλγεβρική χειραγώγηση από την αναμενόμενη απόλυτη απόκλιση, και, μαζί με τη διακύμανση και τη γενίκευση [[
== Προσέγγιση της διακύμανσης μιας συνάρτησης ==
Γραμμή 222:
Πραγματικές παρατηρήσεις όπως οι μετρήσεις από τη χθεσινή βροχή καθ'όλη τη διάρκεια της ημέρας τυπικά δεν μπορούν να είναι πλήρη σύνολα όλων των πιθανών παρατηρήσεων που θα μπορούσαν να γίνουν. Οπότε, η διακύμανση που υπολογίζεται από το πεπερασμένο σύνολο γενικά δεν θα ταιριάζει με τη διακύμανση που θα υπολογιζόταν από το συνολικό πλήθος των πιθανών παρατηρήσεων. Αυτό σημαίνει ότι εκτιμάται η μέση τιμή και η διακύμανση που θα είχαν υπολογιστεί από ένα πλήρες σύνολο παρατηρήσεων με τη χρήση μιας [[εκτιμήτριας συνάρτησης]]. Ο εκτιμητής είναι μια συνάρτηση από το [[Στατιστικό δείγμα|δείγμα]] των ''n'' [[Παρατήρηση|παρατηρήσεων]] η οποία σχεδιάζεται αμερόληπτα από το σύνολο του [[Πληθυσμός|πληθυσμού]] των πιθανών παρατηρήσεων. Σε αυτό το παράδειγμα,αυτό το δείγμα θα ήταν το σύνολο των πραγματικών μετρήσεων της χθεσινής βροχόπτωσης από τις διαθέσιμες μετρήσεις βροχής εντός της γεωγραφικής περιοχής που ενδιαφέρει.
Ο πιο απλός εκτιμητής για την μέση τιμή του πληθυσμού και τη διακύμανση του πληθυσμού είναι απλά η μέση τιμή και η διακύμανση του δείγματος, η '''μέση τιμή δείγματος''' και '''(μη διορθωμένη) διακύμανση του δείγματος''' – αυτά είναι [[
Πρώτον, αν και η πραγματική μέση τιμή είναι άγνωστη (και υπολογίζεται ως η μέση τιμή δείγματος), τότε η διακύμανση του δείγματος είναι [[μεροληπτικός εκτιμητής]]: υποτιμά τη διακύμανση κατά ένα παράγοντα (''n'' − 1) / ''n'' * η διόρθωση από αυτόν τον παράγοντα (διαίρεση με ''n'' − 1 αντί για ''n'') ονομάζεται [[Διόρθωση Bessel|διόρθωση Bessel]]. Ο εκτιμητής που προκύπτει είναι αμερόληπτος, και καλείται η '''(διορθωμένη) διακύμανση του δείγματος''' ή '''αμερόληπτη διακύμανση του δείγματος'''. Για παράδειγμα, όταν ''n'' = 1 η διακύμανση της μια μόνο παρατήρηση για τη μέση τιμή του δείγματος (από μόνη της), είναι προφανώς μηδέν, ανεξάρτητα από τη διακύμανση του πληθυσμού. Αν η μέση καθορίζεται με κάποιο άλλο τρόπο από ό,τι από τα ίδια δείγματα που χρησιμοποιούνται για την εκτίμηση της διακύμανσης τότε αυτή η μεροληψία δεν τίθεται και η διακύμανση μπορεί με ασφάλεια να εκτιμηθεί όπως αυτή από τα δείγματα για την (ανεξάρτητα γνωστή) μέση τιμή.
Δεύτερον, η διακύμανση του δείγματος, γενικώς, δεν ελαχιστοποιεί το [[
=== Διακύμανση του πληθυσμού ===
Γραμμή 238:
Σε πολλές πρακτικές περιπτώσεις, η πραγματική διακύμανση του πληθυσμού δεν είναι γνωστή ''εκ των προτέρων'' και πρέπει να υπολογίστεί με κάποιο τρόπο. Όταν έχουμε να κάνουμε με εξαιρετικά μεγάλους πληθυσμούς, δεν είναι δυνατό να μετρούν κάθε αντικείμενο στον πληθυσμό, οπότε ο υπολογισμός πρέπει να γίνεται σε ένα [[Στατιστικό δείγμα|δείγμα]] του πληθυσμού.<ref>Navidi, William (2006) ''Statistics for Engineers and Scientists'', McGraw-Hill, pg 14.</ref> Η διακύμανση του Δείγματος μπορεί επίσης να εφαρμοστεί για τον υπολογισμό της διακύμανσης μια συνεχής κατανομής από ένα δείγμα αυτής της κατανομής.
Παίρνουμε ένα [[Στατιστικό δείγμα|δείγμα με αντικατάσταση]] των ''n'' τιμών ''y''<sub>1</sub>, ..., ''y''<sub>''n''</sub> από τον πληθυσμό, όπου ''n'' < ''N'', και υπολογίζουμε τη διακύμανση με βάση αυτό το δείγμα.<ref>Montgomery, D. C. and Runger, G. C. (1994) ''Applied statistics and probability for engineers'', page 201. </ref> Απευθείας παίρνοντας τη διακύμανση των δεδομένων του δείγματος δίνει το μέσο όρο των [[
: <math />
Εδώ, <math /> δηλώνει τη [[
: <math />
Αφού τα yi δεν έχουν επιλεγεί τυχαία, και το <math /> και το <math /> είναι τυχαίες μεταβλητές. Οι αναμενόμενες τιμές τους μπορούν να υπολογιστούν αθροίζοντας το σύνολο όλων των δυνατών δειγμάτων {''yi''<sub>'' ''</sub>} από τον πληθυσμό. Για <math /> αυτό δίνει:
Γραμμή 257:
Είτε ο εκτιμητής μπορεί να αναφέρεται απλά ως η ''διακύμανση του δείγματος'' , όταν η έκδοχη μπορεί να καθοριστεί από το γενικό πλαίσιο. Την ίδια απόδειξη μπορεί να εφαρμοστεί και για τα δείγματα που λαμβάνονται από μια συνεχή κατανομή πιθανότητας.
Η χρήση του όρου ''n'' − 1 ονομάζεται [[
Η αμερόληπτη διακύμανση του δείγματος είναι μια [[
=== Κατανομή της διακύμανση του δείγματος ===
Γραμμή 270:
Αν το <span>''yι'' </span> δεν είναι ανεξάρτητες και ισόνομα κατανεμημένες, αλλά όχι απαραίτητα κανονικά κατανεμημένες, τότε<ref>Neter, Wasserman, and Kutner (1990) ''Applied Linear Statistical Models'', 3rd edition, pp. 622-623 <sup class="noprint Inline-Template " style="white-space:nowrap;">[''[[Βικιπαίδεια:Παράθεση πηγών|<span title="A more detailed citation is required. (March 2013)">full citation needed</span>]]'']</sup></ref>
: <math />
όπου ''κ'' είναι η [[
Αν οι συνθήκες από το [[Νόμος των μεγάλων αριθμών|νόμο των μεγάλων αριθμών]] ικανοποιούνται για το τετράγωνο των παρατηρήσεων, ''s''<sup>2</sup> είναι [[
=== Ανισότητα του Samuelson ===
Γραμμή 280:
Έχει αποδειχθεί<ref>{{Cite journal|title=Bounds for A–G, A–H, G–H, and a family of inequalities of Ky Fan’s type, using a general method|last=Mercer|first=A. McD.|journal=J. Math. Anal. Appl.|issue=1|doi=10.1006/jmaa.1999.6688|year=2000|volume=243|pages=163–173}}</ref> ότι για ένα δείγμα {''y''<sub>'' i ''</sub>} των πραγματικών αριθμών,
: <math />
όπου ''y''<sub>max</sub> είναι η μέγιστη τιμή του δείγματος, ''A'' είναι ο αριθμητικός μέσος, ''H'' είναι ο [[
Αυτό το όριο έχει βελτιωθεί, και είναι γνωστό ότι η διακύμανση οριοθετείται από
Γραμμή 293:
Πολλοί μη παραμετρικοί έλεγχοι έχουν προταθεί: αυτά περιλαμβάνουν τα Barton–David–Ansari–Freund–Siegel–Tukey test, το [[τεστ Capon]], [[Mood τεστ]], [[Klotz τεστ]] και το [[Sukhatme τεστ]]. Το Sukhatme τεστ ισχύει για δύο διακυμάνσεις και απαιτεί και οι δύο μέροι όροι να είναι γνωστοί και ίσοι με το μηδέν. Τα Mood,Klotz,Capon και Barton–David–Ansari–Freund–Siegel–Tukey τεστ εφαρμόζονται επίσης για δύο διακυμάνσεις. Επιτρέπουν να είναι άγνωστη η μεση τιμή, αλλά απαιτούν να είναι ίσες οι δύο μέσες τιμές.
Το [[
Μέθοδοι αναδειγματοληψίας, οι οποίες περιλαμβάνουν το [[
== Ιστορία ==
Ο όρος ''διακύμανση'' εισήχθη για πρώτη φορά από τον [[Ρόναλντ Φίσερ]] το 1918 στο άρθρο ''The Correlation Between Relatives on the Supposition of Mendelian Inheritance'':<ref>Ronald Fisher (1918) [http://digital.library.adelaide.edu.au/dspace/bitstream/2440/15097/1/9.pdf The correlation between relatives on the supposition of Mendelian Inheritance]</ref><blockquote class="">Το σώμα των διαθέσιμων στατιστικών μας δείχνει ότι οι αποκλίσεις μιας [[Βιοστατιστική|ανθρώπινης μέτρησης]] από την μέση τιμή της ακολουθούν εκ του σύνεγγυς την [[Κανονική κατανομή]], και, ως εκ τούτου, ότι η μεταβλητότητα μπορεί να μετρηθεί ομοιόμορφα από την [[Συνήθης απόκλιση|τυπική απόκλιση]] που αντιστοιχεί στο [[τετραγωνική ρίζα]] του [[
[[Αρχείο:Variance_visualisation.svg|μικρογραφία|Γεωμετρική απεικόνιση της διακύμανσης μιας αυθαίρετη κατανομή (2, 4, 4, 4, 5, 5, 7, 9):
<br>
Γραμμή 310:
== Ροπή αδράνειας ==
Η διακύμανση μιας κατανομής πιθανότητας είναι ανάλογη με τη [[
: <math />
Αυτή η διαφορά μεταξύ ροπής αδράνειας στη φυσική και στις στατιστική είναι σαφείς για τα δημεία που έχουν συγκεντρωθεί κατά μήκος μιας γραμμής. Ας υποθέσουμε ότι πολλά σημεία είναι κοντά στον άξονα ''x'' και διανέμονται κατά μήκος του. Ο πίνακας συνδιασποράς θα είναι περίπου
Γραμμή 325:
Αν <math /> είναι μία[[Διανυσματικός χώρος| διανυσματική τυχαία]] μεταβλητή, με τιμές στο <math />και θεωρώντας την ως ένα διάνυσμα στήλης,τότε η φυσική γενίκευση της διακύμανσης είναι <math />πού <math /> και <math /> είναι ο ανάστροφος του <math /> Το αποτέλεσμα είναι [[θετικά ημι-ορισμένος τετραγωνικός πίνακας]], που συνήθως αναφέρεται ως ο [[πίνακας διακύμανσης-συνδιακύμανσης]].
Αν <math /> είναι ένα διάνυσμα - και μιγαδική τυχαία μεταβλητή, με τιμές στο <math />,τότε η γενίκευση της διακύμανσης είναι <math />πού <math /> είναι ο [[
== See also ==
|