Διωνυμική κατανομή

Η διωνυμική κατανομή είναι μια διακριτή συνάρτηση κατανομής τυχαίας μεταβλητής. Περιγράφει το πλήθος των επιτυχιών σε $n$ ανεξάρτητες επαναλήψεις ενός τυχαίου πειράματος με δυο πιθανά αποτελέσματα (επιτυχία - αποτυχία) και πιθανότητα επιτυχίας $p$ .

Διωνυμική Κατανομή
Συμβολισμός	${\mathsf {Bin}}(n,p)$
Παράμετροι	$n\in \mathbb {N} ,p\in [0,1]$
Φορέας	$x\in \{0,1,\ldots ,n\}$
Συνάρτηση Μάζας Πιθανότητας	${\binom {n}{p}}\cdot p^{x}\cdot (1-p)^{n-x}$
Μέσος	$np$
Διάμεσος	$\lfloor n\cdot p\rfloor$ ή $\lceil n\cdot p\rceil$
Διακύμανση	$n\cdot p\cdot (1-p)$
Λοξότητα	${\frac {1-2p}{\sqrt {n\cdot p\cdot (1-p)}}}$
Κύρτωση	${\frac {1-6\cdot p\cdot (1-p)}{p\cdot (1-p)}}+3$
Εντροπία	$\approx {\frac {1}{2}}\log _{2}(2\pi enp(1-p))$
Ροπή	$\operatorname {E} [X^{k}]=p$
Πιθανογεννήτρια	$(p\cdot t+1-p)^{n}$
Χαρακτηριστική	$(p\cdot e^{t}+1-p)^{n}$

Η πιθανότητα να έχουμε $x$ επιτυχίες σε $n$ ανεξάρτητα πειράματα με πιθανότητα επιτυχίας $p$ κάθε φορά είναι:^[1]^[2]^[3]

\operatorname {P} (X=x)={\binom {n}{x}}p^{x}(1-p)^{n-x}

,

όπου ${\tbinom {n}{x}}={\tfrac {n!}{x!(n-x)!}}$ είναι ο διωνυμικός συντελεστής.

Μοντέλο με κάλπη

Θεωρούμε μια κάλπη με $K$ λευκές μπάλες και $N-K$ μαύρες. Η πιθανότητα να τραβήξουμε μια λευκή μπάλα είναι $p=K/N$ . Τραβάμε μια μια μπάλες από την κάλπη επανατοποθετώντας τις κάθε φορά πίσω στην κάλπη (δειγματοληψία με επαναφορά) μέχρι να τραβήξουμε n μπάλες. Ζητάμε την πιθανότητα οι $k$ από αυτές να είναι λευκές.

Σύμφωνα με τον κλασικό ορισμό της πιθανότητας αυτή ορίζεται ως το πηλίκο του πλήθους των ευνοϊκών αποτελεσμάτων ως προς το πλήθος των δυνατών αποτελεσμάτων.

Για κάθε λήψη έχουμε $N$ δυνατά αποτελέσματα. Στο σύνολο των n λήψεων τα δυνατά αποτελέσματα ειναι $N^{n}$ . Ευνοϊκά αποτελέσματα είναι αυτά κατα τα οποία έχουμε $k$ λευκές μπάλες. Για τη λήψη μιας λευκής μπάλας έχουμε $K$ πιθανά αποτελέσματα και για την λήψη μιας μαύρης $N-K$ . Τα δυνατά αποτελέσματα στις n λήψεις οι $k$ να είναι λευκές για μια συγκεκριμένη σειρά, π.χ. να τραβήξουμε πρώτα όλες τις λευκές μπάλες και μετά τις μαύρες, είναι $K^{k}(N-K)^{n-k}$ . Όλες οι πιθανές διατάξεις $k$ λευκών και $n-k$ μαύρων μπαλών είναι $\scriptstyle {\binom {n}{k}}$ .

Συνολικά η ζητούμενη πιθανότητα, σύμφωνα με τον παραπάνω ορισμό, είναι:

{\begin{aligned}\operatorname {P} (X=k)&={\binom {n}{k}}{\frac {K^{k}(N-K)^{n-k}}{N^{n}}}\\&={\binom {n}{k}}\left({\frac {K}{N}}\right)^{k}\left({\frac {N-K}{N}}\right)^{n-k}\\&={\binom {n}{k}}p^{k}(1-p)^{n-k}.\end{aligned}}

Σχέσεις με άλλες κατανομές

Αν πραγματοποιήσουμε μόνο μια λήψη, τότε η τυχαία μεταβλητή που δηλώνει η μπάλα να είναι λευκή ακολουθεί την κατανομή Bernoulli. Στην γενική περίπτωση, αν $X_{1},\ldots ,X_{n}$ είναι ανεξάρτητες τυχαίες μεταβλητές με κατανομή $X_{i}\sim {\mathsf {Ber}}(p)$ τότε το άθροισμά τους ${\textstyle \sum _{i=1}^{n}X_{i}}$ ακολουθεί την ${\mathsf {Bin}}(n,p)$ .

Αν η δειγματοληψία γίνει χωρίς επαναφορά, η τυχαία μεταβλητή που δηλώνει τον αριθμό των λευκών μπαλών ακολουθεί την υπεργεωμετρική κατανομή.

Μέση Τιμή

Η μέση τιμή δίνεται από τον τύπο

{\begin{aligned}\operatorname {E} [X]&=\sum _{k=0}^{n}{\binom {n}{k}}\cdot p^{k}\cdot (1-p)^{n-k}\cdot k\\&=\sum _{k=1}^{n}{\frac {n!}{(k-1)!(n-k)!}}\cdot p^{k}\cdot (1-p)^{n-k}\\&=n\cdot p\cdot \sum _{k=1}^{n}{\frac {(n-1)!}{(k-1)!(n-k)!}}\cdot p^{k-1}\cdot (1-p)^{(n-1)-(k-1)}\\&=n\cdot p\cdot \sum _{k=0}^{n-1}{\binom {n-1}{k}}\cdot p^{k}\cdot (1-p)^{(n-1)-k}\\&=n\cdot p\cdot (p+(1-p))^{n-1}\\&=n\cdot p,\end{aligned}}

χρησιμοποιώντας το διωνυμικό θεώρημα για $n-1$ όρους.

Διακύμανση

Ξεκινάμε υπολογίζοντας την τιμή

{\begin{aligned}\operatorname {E} [X\cdot (X-1)]&=\sum _{k=0}^{n}{\binom {n}{k}}p^{k}\cdot (1-p)^{n-k}\cdot k\cdot (k-1)\\&=\sum _{k=2}^{n}{\frac {n!}{(k-2)!(n-k)!}}p^{k}\cdot (1-p)^{n-k}\\&=n\cdot (n-1)\cdot p^{2}\cdot \sum _{k=2}^{n}{\frac {(n-2)!}{(k-2)!(n-k)!}}p^{k-2}\cdot (1-p)^{(n-2)-(k-2)}\\&=n\cdot (n-1)\cdot p^{2}\cdot \sum _{k=0}^{n-2}{\frac {n!}{k!(n-k)!}}p^{k}\cdot (1-p)^{n-k}\\&=n\cdot (n-1)\cdot p^{2}\cdot (p+1-p)^{n-2}\\&=n\cdot (n-1)\cdot p^{2},\end{aligned}}

χρησιμοποιώντας το διωνυμικό θεώρημα για $n-2$ όρους.

Από τον ορισμό της διακύμανσης και χρησιμοποιώντας ότι η μέση τιμή είναι $n\cdot p$ έχουμε ότι:

\operatorname {V} [X]=\operatorname {E} [X\cdot (X-1)]+\operatorname {E} [X]-(\operatorname {E} [X])^{2}=n\cdot (n-1)\cdot p^{2}+n\cdot p-n^{2}\cdot p^{2}=n\cdot p\cdot (1-p).

Πιθανογεννήτρια συνάρτηση

Η πιθανογεννήτρια συνάρτηση δίνεται από τον τύπο:

{\begin{aligned}G_{X}(t)&=\operatorname {E} [t^{X}]=\sum _{k=0}^{n}{\binom {n}{k}}\cdot p^{k}\cdot (1-p)^{n-k}\cdot t^{k}\\&=\sum _{k=0}^{n}{\binom {n}{k}}\cdot (pt)^{k}\cdot (1-p)^{n-k}\\&=(pt+1-p)^{n},\end{aligned}}

χρησιμοποιώντας το διωνυμικό θεώρημα. Ο ίδιος τύπος προκύπτει και από την έκφραση του $X$ ως ανεξάρτητες μεταβλητές Μπερνούλλι.

Χαρακτηριστική συνάρτηση

Η χαρακτηριστική συνάρτηση δίνεται από τον τύπο:

{\begin{aligned}\operatorname {E} [e^{tX}]&=\sum _{k=0}^{n}{\binom {n}{k}}\cdot p^{k}\cdot (1-p)^{n-k}\cdot e^{tk}\\&=\sum _{k=0}^{n}{\binom {n}{k}}\cdot (pe^{t})^{k}\cdot (1-p)^{n-k}\\&=(pe^{t}+1-p)^{n},\end{aligned}}

χρησιμοποιώντας το διωνυμικό θεώρημα. Ο ίδιος τύπος προκύπτει και από την έκφραση του $X$ ως ανεξάρτητες μεταβλητές Μπερνούλλι.

Ασυμπτωτική συμπεριφορά

Κανονική κατανομή

Διωνυμική σμπ σε σύγκριση με την κανονική κατανομή

n=12

και

p=0.4

.

Για μεγάλο n η διωνυμική κατανομή συγκλίνει σύμφωνα με το θεώρημα de Moivre–Laplace στην κανονική κατανομή με μέση τιμή $np$ και διακύμανση $np(1-p)$

{\mathcal {N}}(np,\,np(1-p))

.

Κατανομή Poisson

Για $n\rightarrow \infty$ και $p\rightarrow 0$ έτσι ώστε $np$ σταθερό η διωνυμική κατανομή συγκλίνει στην κατανομή Poisson με παράμετρο $\lambda =np$ .

{\begin{aligned}\lim _{n\to \infty }P(X=k)&=\lim _{n\to \infty }{\frac {n!}{k!\,(n-k)!}}\left({\frac {\lambda }{n}}\right)^{k}\left(1-{\frac {\lambda }{n}}\right)^{n-k}\\&=\lim _{n\to \infty }\left({\frac {\lambda ^{k}}{k!}}\right)\left({\frac {n(n-1)(n-2)\cdots (n-k+1)}{n^{k}}}\right)\left(1-{\frac {\lambda }{n}}\right)^{n}\left(1-{\frac {\lambda }{n}}\right)^{-k}\\&={\frac {\lambda ^{k}}{k!}}\cdot \lim _{n\to \infty }\underbrace {\left({\frac {n}{n}}\cdot {\frac {n-1}{n}}\cdot {\frac {n-2}{n}}\cdots {\frac {n-k+1}{n}}\right)} _{\to 1}\underbrace {\left(1-{\frac {\lambda }{n}}\right)^{n}} _{\to e^{-\lambda }}\underbrace {\left(1-{\frac {\lambda }{n}}\right)^{-k}} _{\to 1}\\&={\frac {\lambda ^{k}\mathrm {e} ^{-\lambda }}{k!}}\end{aligned}}

Δείτε επίσης

Παραπομπές

↑ Ζιούτας, Γεώργιος. «Θεωρητικές Κατανομές Πιθανότητας για Διακριτή Τυχαία Μεταβλητή» (PDF). Τμήμα Ηλεκτρολόγων Μηχανικών & Μηχανικών Υπολογιστών Α.Π.Θ. Ανακτήθηκε στις 9 Ιουνίου 2023.
↑ Κουτρας, Μαρκος. «Πιαθνότητες Ι» (PDF). Πανεπιστήμιο Πειραιώς. Ανακτήθηκε στις 9 Ιουνίου 2023.
↑ Πανάρετος, Ιωάννης. «Μερικές Ειδικές Διακριτές Κατανομές» (PDF). Τμήμα Στατιστικής, Οικονομικό Πανεπιστήμιο Αθηνών. Ανακτήθηκε στις 9 Ιουνίου 2023.

[1] Ζιούτας, Γεώργιος. «Θεωρητικές Κατανομές Πιθανότητας για Διακριτή Τυχαία Μεταβλητή» (PDF). Τμήμα Ηλεκτρολόγων Μηχανικών & Μηχανικών Υπολογιστών Α.Π.Θ. Ανακτήθηκε στις 9 Ιουνίου 2023.

[2] Κουτρας, Μαρκος. «Πιαθνότητες Ι» (PDF). Πανεπιστήμιο Πειραιώς. Ανακτήθηκε στις 9 Ιουνίου 2023.

[3] Πανάρετος, Ιωάννης. «Μερικές Ειδικές Διακριτές Κατανομές» (PDF). Τμήμα Στατιστικής, Οικονομικό Πανεπιστήμιο Αθηνών. Ανακτήθηκε στις 9 Ιουνίου 2023.

[1]

[2]

[3]