Στη στατιστική και ιδίως στην ανάλυση παλινδρόμησης, ένας πίνακας σχεδιασμού[1], γνωστός επίσης ως πίνακας μοντέλου ή πίνακας παλινδρόμησης και συχνά συμβολιζόμενος με Χ, είναι ένας πίνακας τιμών των επεξηγηματικών μεταβλητών ενός συνόλου αντικειμένων. Κάθε γραμμή αντιπροσωπεύει ένα μεμονωμένο αντικείμενο, ενώ οι διαδοχικές στήλες αντιστοιχούν στις μεταβλητές και τις συγκεκριμένες τιμές τους για το συγκεκριμένο αντικείμενο. Ο πίνακας σχεδιασμού χρησιμοποιείται σε ορισμένα στατιστικά μοντέλα, π.χ. στο γενικό γραμμικό μοντέλο.[2][3][4] Μπορεί να περιέχει μεταβλητές δείκτες (μονάδες και μηδενικά) που υποδηλώνουν τη συμμετοχή σε ομάδες σε μια ANOVA, ή μπορεί να περιέχει τιμές συνεχών μεταβλητών[5].

Ο πίνακας σχεδιασμού περιέχει δεδομένα σχετικά με τις ανεξάρτητες μεταβλητές (που ονομάζονται επίσης επεξηγηματικές μεταβλητές), σε ένα στατιστικό μοντέλο που προορίζεται να εξηγήσει τα παρατηρούμενα δεδομένα για μια μεταβλητή απόκρισης (που συχνά ονομάζεται εξαρτημένη μεταβλητή). Η θεωρία που σχετίζεται με τέτοια μοντέλα χρησιμοποιεί τον πίνακα σχεδιασμού ως είσοδο σε κάποια γραμμική άλγεβρα : Δείτε για παράδειγμα τη γραμμική παλινδρόμηση. Ένα αξιοσημείωτο χαρακτηριστικό της έννοιας του πίνακα σχεδιασμού είναι ότι μπορεί να αναπαραστήσει έναν αριθμό διαφορετικών πειραματικών σχεδίων και στατιστικών μοντέλων, π.χ. ANOVA, ANCOVA[6][7] και γραμμική παλινδρόμηση.

Ο πίνακας σχεδιασμού ορίζεται ως ένας πίνακας   τέτοιος ώστε  jth στήλη της ith γραμμής του  ) αντιπροσωπεύει την τιμή της jth μεταβλητής που σχετίζεται με το ith αντικείμενο.

Ένα μοντέλο παλινδρόμησης μπορεί να αναπαρασταθεί με πολλαπλασιασμό πινάκων της ακόλουθης μορφής

 

όπου X είναι ο πίνακας σχεδιασμού,   είναι ένα διάνυσμα των συντελεστών του μοντέλου (ένας για κάθε μεταβλητή),   είναι ένα διάνυσμα τυχαίων σφαλμάτων με μέση τιμή μηδέν και y είναι το διάνυσμα των προβλεπόμενων εξόδων για κάθε αντικείμενο.

Ο πίνακας σχεδιασμού έχει διάσταση n-επί-p, όπου n είναι ο αριθμός των παρατηρούμενων δειγμάτων και p είναι ο αριθμός των μεταβλητών (χαρακτηριστικών) που μετρήθηκαν σε όλα τα δείγματα. [8][9]

Σε αυτή την αναπαράσταση οι διάφορες γραμμές αντιπροσωπεύουν συνήθως διαφορετικές επαναλήψεις ενός πειράματος, ενώ οι στήλες αντιπροσωπεύουν διαφορετικούς τύπους δεδομένων (π.χ. τα αποτελέσματα από συγκεκριμένους ανιχνευτές). Παραδείγματος χάριν, ας υποθέσουμε ότι διεξάγεται ένα πείραμα όπου 10 άτομα τραβάνε από το δρόμο και τους κάνουν 4 ερωτήσεις. Ο πίνακας δεδομένων Μ θα ήταν ένας πίνακας 10×4 (δηλαδή 10 γραμμές και 4 στήλες). Το δεδομένο στη γραμμή i και τη στήλη j αυτού του πίνακα θα ήταν η απάντηση του i th ατόμου στην j th ερώτηση.

Παραδείγματα

Επεξεργασία

Αριθμητικός μέσος όρος

Επεξεργασία

Ο πίνακας σχεδιασμού για έναν αριθμητικός μέσος είναι διάνυσμα στήλης, Πίνακας από μονάδες.

Απλή γραμμική παλινδρόμηση

Επεξεργασία

Στην παρούσα ενότητα δίνεται ένα παράδειγμα απλής γραμμικής παλινδρόμησης - δηλαδή παλινδρόμησης με μία μόνο επεξηγηματική μεταβλητή - με επτά παρατηρήσεις[10]. Τα επτά σημεία δεδομένων είναι {yi, xi}, για i = 1, 2, …, 7. Το μοντέλο απλής γραμμικής παλινδρόμησης είναι

 

όπου   είναι η y-τομή και   είναι η κλίση της γραμμής παλινδρόμησης. Το μοντέλο αυτό μπορεί να αναπαρασταθεί σε μορφή πίνακα ως εξής

 

όπου η πρώτη στήλη των 1s στον πίνακα σχεδιασμού επιτρέπει την εκτίμηση της y-διατομής, ενώ η δεύτερη στήλη περιέχει τις x-τιμές που σχετίζονται με τις αντίστοιχες y-τιμές. Ο πίνακας του οποίου οι στήλες είναι 1 και x σε αυτό το παράδειγμα είναι ο πίνακας σχεδιασμού.

Πολλαπλή παλινδρόμηση

Επεξεργασία

Αυτή η ενότητα περιέχει ένα παράδειγμα πολλαπλής παλινδρόμησης με δύο συνυπολογιζόμενες μεταβλητές (επεξηγηματικές μεταβλητές): w και x. Έστω και πάλι ότι τα δεδομένα αποτελούνται από επτά παρατηρήσεις και ότι για κάθε παρατηρούμενη τιμή που πρόκειται να προβλεφθεί ( y i ( ), παρατηρούνται επίσης οι τιμές wi και xiτων δύο συνυπολογιζόμενων μεταβλητών. Το υπόδειγμα που πρέπει να εξεταστεί είναι

 

Το μοντέλο αυτό μπορεί να γραφεί σε όρους πίνακα ως εξής

 

Εδώ ο πίνακας 7×3 στη δεξιά πλευρά είναι ο πίνακας σχεδιασμού.

Μονόδρομος ANOVA (μοντέλο μέσων κυττάρων)

Επεξεργασία

Αυτή η ενότητα περιέχει ένα παράδειγμα με ανάλυση διακύμανσης μονής κατεύθυνσης (ANOVA) με τρεις ομάδες και επτά παρατηρήσεις. Το δεδομένο σύνολο δεδομένων έχει τις τρεις πρώτες παρατηρήσεις που ανήκουν στην πρώτη ομάδα, τις δύο επόμενες παρατηρήσεις που ανήκουν στη δεύτερη ομάδα και τις δύο τελευταίες παρατηρήσεις που ανήκουν στην τρίτη ομάδα. Εάν το μοντέλο που πρέπει να προσαρμοστεί είναι μόνο ο μέσος όρος κάθε ομάδας, τότε το μοντέλο είναι

 

το οποίο μπορεί να γραφτεί

 

Σε αυτό το μοντέλο το   αντιπροσωπεύει τον μέσο όρο της  th ομάδας.

Μονόδρομος ANOVA (αντιστάθμιση από την ομάδα αναφοράς)

Επεξεργασία

Το μοντέλο ANOVA θα μπορούσε να γραφτεί ισοδύναμα ως εξής: κάθε παράμετρος της ομάδας   είναι μια μετατόπιση από κάποια συνολική αναφορά. Συνήθως αυτό το σημείο αναφοράς θεωρείται ότι είναι μία από τις εξεταζόμενες ομάδες. Αυτό έχει νόημα στο πλαίσιο της σύγκρισης πολλαπλών ομάδων θεραπείας με μια ομάδα ελέγχου και η ομάδα ελέγχου θεωρείται η «αναφορά». Σε αυτό το παράδειγμα, η ομάδα 1 επιλέχθηκε ως ομάδα αναφοράς. Ως εκ τούτου, το μοντέλο που πρέπει να προσαρμοστεί είναι

 

με τον περιορισμό ότι   είναι μηδέν.

 

Σε αυτό το μοντέλο   είναι ο μέσος όρος της ομάδας αναφοράς και   είναι η διαφορά της ομάδας   από την ομάδα αναφοράς. Το   δεν περιλαμβάνεται στον πίνακα επειδή η διαφορά του από την ομάδα αναφοράς (η ίδια) είναι αναγκαστικά μηδέν.

Δημοσιεύσεις

Επεξεργασία

Δείτε επίσης

Επεξεργασία

Εξωτερικοί σύνδεσμοι

Επεξεργασία

Παραπομπές

Επεξεργασία
  1. «design matrix | ISI». isi-web.org. Ανακτήθηκε στις 16 Σεπτεμβρίου 2024. 
  2. Everitt, B. S. (2002). Cambridge Dictionary of Statistics (2nd έκδοση). Cambridge, UK: Cambridge University Press. ISBN 0-521-81099-X. 
  3. Box, G. E. P.· Tiao, G. C. (1992) [1973]. Bayesian Inference in Statistical Analysis. New York: John Wiley and Sons. ISBN 0-471-57428-7.  (Section 8.1.1)
  4. Timm, Neil H. (2007). Applied Multivariate Analysis. Springer Science & Business Media. σελ. 107. ISBN 9780387227719. 
  5. Olkin, I.; Tate, R. F. (1961-06). «Multivariate Correlation Models with Mixed Discrete and Continuous Variables». The Annals of Mathematical Statistics 32 (2): 448–465. doi:10.1214/aoms/1177705052. ISSN 0003-4851. https://projecteuclid.org/journals/annals-of-mathematical-statistics/volume-32/issue-2/Multivariate-Correlation-Models-with-Mixed-Discrete-and-Continuous-Variables/10.1214/aoms/1177705052.full. 
  6. «Analysis of Variance and Covariance». www.southampton.ac.uk. Ανακτήθηκε στις 16 Σεπτεμβρίου 2024. 
  7. «One-Way ANCOVA For 2 Independent Samples». vassarstats.net. Ανακτήθηκε στις 17 Σεπτεμβρίου 2024. 
  8. Johnson, Richard A· Wichern, Dean W (2001). Applied Multivariate Statistical Analysis. Pearson. σελίδες 111–112. ISBN 0131877151. 
  9. «Basic Concepts for Multivariate Statistics p.2» (PDF). SAS Institute. 
  10. Goupy, J. L. (5 Μαΐου 1993). Methods for Experimental Design: Principles and Applications for Physicists and Chemists. Elsevier. ISBN 978-0-08-086839-4.