Διακύμανση: Διαφορά μεταξύ των αναθεωρήσεων

Περιεχόμενο που διαγράφηκε Περιεχόμενο που προστέθηκε
Spiros790 (συζήτηση | συνεισφορές)
Δημιουργήθηκε από μετάφραση της σελίδας "Variance"
Γραμμή 1:
Στη [[θεωρία πιθανοτήτων]] και τη [[στατιστική]],η '''διακύμανση''' είναι η [[αναμενόμενη τιμή]] της τετραγωνικής απόκλισης της [[Τυχαία μεταβλητή|τυχαίας μεταβλητής]] από τη [[μέση τιμή]], και άτυπα μετρά πόσο μακριά ένα σύνολο (τυχαίων) αριθμών απλώνεται από τη μέση τιμή του. Η διακύμανση έχει κεντρικό ρόλο στη στατιστική. Χρησιμοποιείται στην [[περιγραφική στατιστική]], [[στατιστικήΣτατιστική συμπερασματολογία]], [[έλεγχο υποθέσεων]],[[έλεγχο καλής προσαρμογής]], [[Monte Carlo (μέθοδος)|Μόντε Κάρλο δειγματοληψίας]], μεταξύ πολλών άλλων. Αυτό την καθιστά μία κεντρική ποσότητα σε πολλά πεδία όπως η [[Φυσική]], [[Βιολογία]], [[Χημεία]], [[Οικονομικά]], και [[Χρηματοοικονομικά]]. Η διακύμανση είναι το τετράγωνο της τυπικής απόκλισης, η δεύτερη [[κεντρική ροπή]] της κατανομής, και η [[συνδιασπορά]] της τυχαίας μεταβλητής με τον εαυτό της, και συχνά συμβολίζεται σ² ή Var(X).<span class="cx-segment" data-segmentid="25"></span>
 
== Ορισμός ==
Η διακύμανση μιας τυχαίας μεταβλητής ''Χ'' είναι η [[αναμενόμενη τιμή]] της τετραγωνικής απόκλισης από τη [[Μέσος όρος|μέση τιμή]] του ''X'', {{Πρότυπο:Nowrap|1<span class="nowrap" contenteditable="false">''μ'' = E[''X'']}}</span>:
: <math> \operatorname{Var}(X) = \operatorname{E}\left[(X - \mu)^2 \right]. </math>
Ο ορισμός αυτός περιλαμβάνει τυχαίες μεταβλητές που δημιουργούνται από διαδικασίες που είναι [[διακριτές]], συνεχείς, ούτε διακριτές ούτε συνεχείς, ή μικτές. Η διακύμανση μπορεί επίσης να θεωρηθεί ως η [[συνδιασπορά]] μιας τυχαίας μεταβλητής με τον εαυτό της:<span class="cx-segment" data-segmentid="43"></span>
: <math>\operatorname{Var}(X) = \operatorname{Cov}(X, X).</math>
Η διακύμανση είναι επίσης ισοδύναμη με το δεύτερο [[αθροιστικό]] από μια κατανομή πιθανότητας που παράγει την X. Η διακύμανση τυπικά συμβολίζεται Var(X), ή απλά σ2 (προφέρεται "[[σίγμα]] στο τετράγωνο"). Ο τύπος για τη διασπορά μπορεί να αναπτυχθεί: <span class="cx-segment" data-segmentid="52"></span>
: <math>\begin{align}
\operatorname{Var}(X) &= \operatorname{E}\left[(X - \operatorname{E}[X])^2\right] \\
Γραμμή 13:
&= \operatorname{E}\left[X^2 \right] - (\operatorname{E}[X])^2
\end{align}</math>
ΈναςΈνα μνημονικός κανόναςμνημονικό για τον παραπάνω τύπο είναι το "μέσο του τετραγώνου μείον το τετράγωνο του μέσου". Στην υπολογιστική αριθμητική κινητής υποδιαστολής, η εξίσωση αυτή δεν πρέπει να χρησιμοποιείται, γιατί πάσχει από [[έλλειψη σημασίας]] αν τα δύο μέρη της εξίσωσης είναι παρόμοια σε μέγεθος. Υπάρχουν [[αριθμητικά σταθερές εναλλακτικές λύσεις]]. <span class="cx-segment cx-highlight" data-segmentid="60"></span>
 
=== Συνεχής τυχαία μεταβλητή ===
Αν η τυχαία μεταβλητή X αντιπροσωπεύει δείγματα που παράγονται από μια [[συνεχή κατανομή]] με [[συνάρτηση πυκνότητας πιθανότητας]] f(x),τότε η διακύμανση του πληθυσμού δίνεται από
: <math>\operatorname{Var}(X) =\sigma^2 =\int (x-\mu)^2 \, f(x) \, dx\, =\int x^2 \, f(x) \, dx\, - \mu^2</math>
όπου <math>\mu</math> είναι η αναμενόμενη τιμή,
Γραμμή 77:
 
=== Ρίψη ζαριού ===
Ένα εξάεδρο [[ζάρι]] μπορεί να μοντελοποιηθεί με μια διακριτή τυχαία μεταβλητή με αποτελέσματα από το 1 έως το 6, το καθένα με ίση πιθανότητα <math>\textstyle\frac{1}{6}</math>. Η αναμενόμενη τιμή είναι (1&#x20;+&#x20;2&#x20;+&#x20;3&#x20;+&#x20;4&#x20;+&#x20;5&#x20;+&#x20;6)/6 =&#x20;3.5. Ως εκ τούτου, η διακύμανση μπορεί να υπολογιστεί να είναι:
: <math>
\begin{align}
Γραμμή 109:
 
: <math>\operatorname{Var}(aX-bY)=a^2\operatorname{Var}(X)+b^2\operatorname{Var}(Y)-2ab\, \operatorname{Cov}(X,Y),</math>
όπου {{Πρότυπο:Math|<span class="texhtml " contenteditable="false">Cov(⋅, ⋅)}}</span> είναι η [[συνδιασπορά]].Γενικά,για το άθροισμα <math>N</math> τυχαίων μεταβλητών <math>\{X_1,\dots,X_N\}</math> έχουμε:
: <math>\operatorname{Var}\left(\sum_{i=1}^N X_i\right)=\sum_{i,j=1}^N\operatorname{Cov}(X_i,X_j)=\sum_{i=1}^N\operatorname{Var}(X_i)+\sum_{i\ne j}\operatorname{Cov}(X_i,X_j).</math>
Αυτά τα αποτελέσματα οδηγούν στη διακύμανση ενός [[γραμμικού συνδιασμού]]:
Γραμμή 135:
Γενικά,αν οι μεταβλητές είναι [[συσχετισμένες]],τότε η διακύμανση του αθροίσματός τους είναι το άθροισμα των [[συνδιασπορών]] τους:
: <math>\operatorname{Var}\left(\sum_{i=1}^n X_i\right) = \sum_{i=1}^n \sum_{j=1}^n \operatorname{Cov}(X_i, X_j) = \sum_{i=1}^n \operatorname{Var}(X_i) + 2\sum_{1\le i}\sum_{<j\le n}\operatorname{Cov}(X_i,X_j).</math>
(Σημείωση : Η δεύτερη ισότητα προκύπτει από το γεγονός ότι {{Πρότυπο:Math|<span class="texhtml " contenteditable="false">Cov(''X''<sub>''i''</sub>,''X''<sub>''i''</sub>) {{=}} Var(''X''<sub>''i''</sub>)}}</span>.)
 
Εδώ {{Πρότυπο:Math|<span class="texhtml " contenteditable="false">Cov(⋅, ⋅)}}</span> είναι η [[συνδιασπορά]],η οποία είναι μηδέν για ανεξάρτητες τυχαίες μεταβλητές (αν υπάρχει).Ο τύπος δηλώνει ότι η διακύμανση ενός αθροίσματος είναι ίση με το άθροισμα όλων των στοιχείων στον πίνακα συνδιασποράς των παραγόντων. Ο τύπος αυτός χρησιμοποιείται στην θεωρία του [[Cronbach's alpha]] στην [[κλασική ψυχομετρικη θεωρία]]. <span class="cx-segment" data-segmentid="323"></span>
 
Έτσι, αν οι μεταβλητές έχουν την ίδια διακύμανση ''σ''<sup>2</sup>και η μέση συσχέτιση διακριτών μεταβλητών είναι  ''ρ'', τότε η διακύμανση της μέσης τιμής τους ειναι
Γραμμή 143:
Αυτό συνεπάγεται ότι η διακύμανση της μέσης τιμής αυξάνει με το μέσο όρο των συσχετισμών . Με άλλα λόγια , πρόσθετες συσχετιζόμενες παρατηρήσεις δεν είναι τόσο αποτελεσματικές όσο πρόσθετες ανεξάρτητες παρατηρήσεις στη μείωση της [[αβεβαιότητας του μέσου όρου]]. Επιπλέον, εάν η διακύμανση των μεταβλητών είναι μονάδα, για παράδειγμα , αν είναι σταθεροποιημένες , τότε αυτό απλοποιείται<span class="cx-segment" data-segmentid="335"></span>
: <math>\operatorname{Var}(\overline{X}) = \frac {1} {n} + \frac {n-1} {n} \rho.</math>
Αυτός ο τύπος χρησιμοποιείται στον [[τύπο πρόβλεψης των Spearman–Brown]] της κλασικής ψυχομετρικής θεωρίας. Αυτό συγκλίνει στο ''ρ'' αν το ''n'' τείνει στο άπειρο, υπό την προϋπόθεση ότι ο μέσος συσχετισμός παραμένει σταθερός ή συγκλίνει . Έτσι, για τη διακύμανση της μέσης τιμής των σταθεροποιημένων μεταβλητών με τις ίδιες συσχετίσεις ή συγκλίνουσα μέση συσχέτιση έχουμε<span class="cx-segment" data-segmentid="343"></span>
: <math> \lim_{n \to \infty} \operatorname{Var}(\overline{X}) = \rho.</math>
Κατά συνέπεια, η διακύμανση της μέσης τιμής ενός μεγάλου αριθμού σταθεροποιημένων μεταβλητών είναι περίπου ίση με τη μέση συσχέτιση τους . Αυτό καθιστά σαφές ότι η μέση τιμή του δείγματος των συσχετισμένων μεταβλητών γενικά δεν συγκλίνει προς τη μέση τιμή του πληθυσμού, παρόλο που ο[[ νόμος των μεγάλων αριθμών]] αναφέρει ότι η μέση τιμή του δείγματος θα συγκλίνει για ανεξάρτητες μεταβλητές.
 
=== Σημειογραφία πίνακα για τη διακύμανση ενός γραμμικού συνδυασμού ===
Γραμμή 152:
 
=== Σταθμισμένο άθροισμα  μεταβλητών ===
Η ιδιότητα της κλιμάκωσης και ο τύπος Bienaymé , μαζί με την ιδιότητα της συνδιασποράς  {{Πρότυπο:Math|<span class="texhtml " contenteditable="false">Cov(''aX'',&nbsp;''bY'') {{=}} ''ab'' Cov(''X'',&nbsp;''Y'')}}</span> απο κοινού συνεπάγεται ότι
: <math>\operatorname{Var}(aX \pm bY) =a^2 \operatorname{Var}(X) + b^2 \operatorname{Var}(Y) \pm 2ab\, \operatorname{Cov}(X, Y).</math>
Αυτό σημαίνει ότι σε ένα σταθμισμένο άθροισμα μεταβλητών , η μεταβλητή με το μεγαλύτερο βάρος θα έχει ένα δυσανάλογα μεγάλο βάρος στη διακύμανση του συνόλου.Για παράδειγμα,αν ''X'' και ''Y'' είναι ασυσχέτιστα και το βάρος του ''X'' είναι δύο φορές το βάρος του ''Y'', τότε το βάρος της διακύμανσης του ''X'' θα είναι τέσσερις φορές το βάρος της διακύμαμσης του ''Y''.
Γραμμή 181:
\end{align}</math>
 
=== Ανάλυση ===
== Παραπομπές==
Ο γενικός τύπος για την ανάλυση διακύμανσης ή [[νόμος ολικής διακύμανσης]] είναι: Αν <math /> και <math /> είναι δύο τυχαίες μεταβλητές, και η διακύμανση της <math /> υπάρχει, τότε
{{Reflist|30em}}
: <math />
όπου <math>\operatorname E(X|Y)</math> είναι η υπό συνθήκη αναμενόμενη τιμή του <math>X</math> δοθέντος του <math>Y</math>, και <math>\operatorname{Var}(X|Y)</math> είναι η [[υπο συνθήκη διακύμανση]] του <math>X</math> δοθέντος του <math>Y</math>. (Μία πιο διαισθητική εξήγηση είναι ότι για μία δεδομένη τιμή του <math>Y</math>, τότε το <math>X</math> ακολουθεί μια κατανομή με μέση τιμή <math>\operatorname E(X|Y)</math> και διακύμανση <math>\operatorname{Var}(X|Y)</math>. Καθώς <math>\operatorname E(X|Y)</math> είναι μία συνάρτηση της μεταβλητής  <math>Y</math>, η αναμενόμενη τιμή της διακύμανσης βρίσκεται σε σχέση με το Y. Ο παραπάνω τύπος περιγράφει το πως να βρούμε <math>\operatorname{Var}(X)</math> βασισμένη στις κατανομές αυτών των δύο ποσοτήτων όταν το <math>Y</math> μπορεί να αλλάζει.Ένας παρόμοιος τύπος εφαρμόζεται στην [[ανάλυση διασποράς]],όπου ο αντιστοιχος τύπος είναι<span class="cx-segment" data-segmentid="439"></span>
: <math />
εδώ το <math /> αναφέρεται στη Μέση τιμή των Τετραγώνων. Στην [[ανάλυση γραμμικής παλινδρόμησης]] ο αντίστοιχος τύπος είναι
: <math />
 
== See also ==
 
== Notes ==
{{authority control}}
{{Reflist|30em}}
{{Portal bar|Μαθηματικά}}