Διαφορά μεταξύ των αναθεωρήσεων του «Δοκιμασία X2»

Επίσης θεωρούμε ο,τι ένα  [[χ²-τεστ]] είναι ένα τεστ στο οποίο η κατανομή [[δειγματοληψίας]] (αν ισχύει η [[μηδενική υπόθεση]]) μπορεί να προσεγγίσει , όσο εμείς επιθυμούμε ,μια[[ χ² κατανομή]] μεγαλώνοντας το μέγεθος του δείγματος αρκετά. Τα [[χ² - τεστ]] μπορούν να χρησιμοποιηθούν για να προσδιορίσουν αν υπάρχει σημαντική διαφορά μεταξύ των αναμενόμενων συχνοτήτων και των παρατηρούμενων συχνοτήτων σε μια ή περισσότερες κατηγορίες. Μήπως ο αριθμός των ατόμων ή αντικειμένων που εμπίπτουν σε κάθε κατηγορία διαφέρουν σημαντικά από τον αριθμό που θα περιμέναμε; Είναι η διαφορά μεταξύ των αναμενόμενων και των παρατηρούμενων συχνοτήτων επηρεασμένη από την διακύμανση της δειγματοληψίας, ή είναι μια πραγματική διαφορά;
 
== Προϋποθέσεις==
== Assumptions ==
Οι προϋποθέσεις για να είναι αξιόπιστο το τεστ χ τετράγωνο είναι:
The chi-squared test, when used with the standard approximation that a chi-squared distribution is applicable, has the following assumptions:<sup>[''[[Wikipedia:Citation needed|citation needed]]'']</sup>
; [[SimpleΤυχαίο random sampleδείγμα]]
: Το δείγμα δεδομένων είναι μια τυχαία δειγματοληψία από έναν πληθυσμό, όπου κάθε παρατήρηση έχει ίση πιθανότητα επιλογής. Υπάρχουν και άλλες παραλλαγές του ελέγχου για πολύπλοκα δείγματα, στα οποία τα δεδομένα έχουν βάρη καθώς και παραλλαγές στις οποίες έχει γίνει σκόπιμη δειγματοληψία.
: The sample data is a random sampling from a fixed distribution or population where every collection of members of the population of the given sample size has an equal probability of selection. Variants of the test have been developed for complex samples, such as where the data is weighted. Other forms can be used such as [[purposive sampling]].
; Μέγεθος Δείγματος
; Sample size (whole table)
: Γίνεται η υπόθεση ότι το δείγμα έχει αρκετά μεγάλο μέγεθος. Εάν μια χ τετράγωνο δοκιμή διεξάγεται σε ένα δείγμα με μικρό μέγεθος, τότε το τεστ θα αποδώσει ένα ανακριβές συμπέρασμα. Ο ερευνητής, χρησιμοποιώντας το χ τετράγωνο τεστ σε μικρά δείγματα, θα μπορούσε να καταλήξει σε [[Σφάλματα τύπου Α και Β|σφάλμα τύπου Β]].
: A sample with a sufficiently large size is assumed. If a chi squared test is conducted on a sample with a smaller size, then the chi squared test will yield an inaccurate inference. The researcher, by using chi squared test on small samples, might end up committing a [[Σφάλματα τύπου Α και Β|Type II error]].
; Ποσοστό Αναμενόμενων Συχνοτήτων
; Expected cell count
: Το ποσοστό των αναμενόμενων συχνοτήτων που είναι μικρότερες από το 5, δε θα πρέπει να υπερβαίνει το 20% και καμιά συχνότητα ίση με 0. Όταν η υπόθεση αυτή δεν πληρείται, εφαρμόζεται η διόρθωση του Yates.
: Adequate expected cell counts. Some require 5 or more, and others require 10 or more. A common rule is 5 or more in all cells of a 2-by-2 table, and 5 or more in 80% of cells in larger tables, but no cells with zero expected count. When this assumption is not met, [[Yates's correction for continuity|Yates's correction]] is applied.
; Ανεξαρτησία
; Independence
: Γίνεται η υπόθεση ότι οι παρατηρήσεις είναι πάντα ανεξάρτητες η μία από την άλλη. Αυτό σημαίνει ότι το χ τετράγωνο δεν μπορεί να χρησιμοποιηθεί για τον έλεγχο συσχετιζόμενων δεδομένων. Σε αυτή την περίπτωση μπορεί να χρησιμοποιηθεί το τεστ του McNemar.
: The observations are always assumed to be independent of each other. This means chi-squared cannot be used to test correlated data (like matched pairs or panel data). In those cases you might want to turn to [[McNemar's test]].
A test that relies on different assumptions is [[Fisher's exact test]]; if its assumption of fixed marginal distributions is met it is substantially more accurate in obtaining a significance level, especially with few observations. In the vast majority of applications this assumption will not be met, and Fisher's exact test will be over conservative and not have correct coverage.
 
== Παραδείγματα χ² έλέγχου με δείγματα ==
45

επεξεργασίες