Πίνακας σχεδιασμού
Στη στατιστική και ιδίως στην ανάλυση παλινδρόμησης, ένας πίνακας σχεδιασμού[1], γνωστός επίσης ως πίνακας μοντέλου ή πίνακας παλινδρόμησης και συχνά συμβολιζόμενος με Χ, είναι ένας πίνακας τιμών των επεξηγηματικών μεταβλητών ενός συνόλου αντικειμένων. Κάθε γραμμή αντιπροσωπεύει ένα μεμονωμένο αντικείμενο, ενώ οι διαδοχικές στήλες αντιστοιχούν στις μεταβλητές και τις συγκεκριμένες τιμές τους για το συγκεκριμένο αντικείμενο. Ο πίνακας σχεδιασμού χρησιμοποιείται σε ορισμένα στατιστικά μοντέλα, π.χ. στο γενικό γραμμικό μοντέλο.[2][3][4] Μπορεί να περιέχει μεταβλητές δείκτες (μονάδες και μηδενικά) που υποδηλώνουν τη συμμετοχή σε ομάδες σε μια ANOVA, ή μπορεί να περιέχει τιμές συνεχών μεταβλητών[5].
Ο πίνακας σχεδιασμού περιέχει δεδομένα σχετικά με τις ανεξάρτητες μεταβλητές (που ονομάζονται επίσης επεξηγηματικές μεταβλητές), σε ένα στατιστικό μοντέλο που προορίζεται να εξηγήσει τα παρατηρούμενα δεδομένα για μια μεταβλητή απόκρισης (που συχνά ονομάζεται εξαρτημένη μεταβλητή). Η θεωρία που σχετίζεται με τέτοια μοντέλα χρησιμοποιεί τον πίνακα σχεδιασμού ως είσοδο σε κάποια γραμμική άλγεβρα : Δείτε για παράδειγμα τη γραμμική παλινδρόμηση. Ένα αξιοσημείωτο χαρακτηριστικό της έννοιας του πίνακα σχεδιασμού είναι ότι μπορεί να αναπαραστήσει έναν αριθμό διαφορετικών πειραματικών σχεδίων και στατιστικών μοντέλων, π.χ. ANOVA, ANCOVA[6][7] και γραμμική παλινδρόμηση.
Ορισμός
ΕπεξεργασίαΟ πίνακας σχεδιασμού ορίζεται ως ένας πίνακας τέτοιος ώστε (η jth στήλη της ith γραμμής του ) αντιπροσωπεύει την τιμή της jth μεταβλητής που σχετίζεται με το ith αντικείμενο.
Ένα μοντέλο παλινδρόμησης μπορεί να αναπαρασταθεί με πολλαπλασιασμό πινάκων της ακόλουθης μορφής
όπου X είναι ο πίνακας σχεδιασμού, είναι ένα διάνυσμα των συντελεστών του μοντέλου (ένας για κάθε μεταβλητή), είναι ένα διάνυσμα τυχαίων σφαλμάτων με μέση τιμή μηδέν και y είναι το διάνυσμα των προβλεπόμενων εξόδων για κάθε αντικείμενο.
Μέγεθος
ΕπεξεργασίαΟ πίνακας σχεδιασμού έχει διάσταση n-επί-p, όπου n είναι ο αριθμός των παρατηρούμενων δειγμάτων και p είναι ο αριθμός των μεταβλητών (χαρακτηριστικών) που μετρήθηκαν σε όλα τα δείγματα. [8][9]
Σε αυτή την αναπαράσταση οι διάφορες γραμμές αντιπροσωπεύουν συνήθως διαφορετικές επαναλήψεις ενός πειράματος, ενώ οι στήλες αντιπροσωπεύουν διαφορετικούς τύπους δεδομένων (π.χ. τα αποτελέσματα από συγκεκριμένους ανιχνευτές). Παραδείγματος χάριν, ας υποθέσουμε ότι διεξάγεται ένα πείραμα όπου 10 άτομα τραβάνε από το δρόμο και τους κάνουν 4 ερωτήσεις. Ο πίνακας δεδομένων Μ θα ήταν ένας πίνακας 10×4 (δηλαδή 10 γραμμές και 4 στήλες). Το δεδομένο στη γραμμή i και τη στήλη j αυτού του πίνακα θα ήταν η απάντηση του i th ατόμου στην j th ερώτηση.
Παραδείγματα
ΕπεξεργασίαΑριθμητικός μέσος όρος
ΕπεξεργασίαΟ πίνακας σχεδιασμού για έναν αριθμητικός μέσος είναι διάνυσμα στήλης, Πίνακας από μονάδες.
Απλή γραμμική παλινδρόμηση
ΕπεξεργασίαΣτην παρούσα ενότητα δίνεται ένα παράδειγμα απλής γραμμικής παλινδρόμησης - δηλαδή παλινδρόμησης με μία μόνο επεξηγηματική μεταβλητή - με επτά παρατηρήσεις[10]. Τα επτά σημεία δεδομένων είναι {yi, xi}, για i = 1, 2, …, 7. Το μοντέλο απλής γραμμικής παλινδρόμησης είναι
όπου είναι η y-τομή και είναι η κλίση της γραμμής παλινδρόμησης. Το μοντέλο αυτό μπορεί να αναπαρασταθεί σε μορφή πίνακα ως εξής
όπου η πρώτη στήλη των 1s στον πίνακα σχεδιασμού επιτρέπει την εκτίμηση της y-διατομής, ενώ η δεύτερη στήλη περιέχει τις x-τιμές που σχετίζονται με τις αντίστοιχες y-τιμές. Ο πίνακας του οποίου οι στήλες είναι 1 και x σε αυτό το παράδειγμα είναι ο πίνακας σχεδιασμού.
Πολλαπλή παλινδρόμηση
ΕπεξεργασίαΑυτή η ενότητα περιέχει ένα παράδειγμα πολλαπλής παλινδρόμησης με δύο συνυπολογιζόμενες μεταβλητές (επεξηγηματικές μεταβλητές): w και x. Έστω και πάλι ότι τα δεδομένα αποτελούνται από επτά παρατηρήσεις και ότι για κάθε παρατηρούμενη τιμή που πρόκειται να προβλεφθεί ( y i ( ), παρατηρούνται επίσης οι τιμές wi και xiτων δύο συνυπολογιζόμενων μεταβλητών. Το υπόδειγμα που πρέπει να εξεταστεί είναι
Το μοντέλο αυτό μπορεί να γραφεί σε όρους πίνακα ως εξής
Εδώ ο πίνακας 7×3 στη δεξιά πλευρά είναι ο πίνακας σχεδιασμού.
Μονόδρομος ANOVA (μοντέλο μέσων κυττάρων)
ΕπεξεργασίαΑυτή η ενότητα περιέχει ένα παράδειγμα με ανάλυση διακύμανσης μονής κατεύθυνσης (ANOVA) με τρεις ομάδες και επτά παρατηρήσεις. Το δεδομένο σύνολο δεδομένων έχει τις τρεις πρώτες παρατηρήσεις που ανήκουν στην πρώτη ομάδα, τις δύο επόμενες παρατηρήσεις που ανήκουν στη δεύτερη ομάδα και τις δύο τελευταίες παρατηρήσεις που ανήκουν στην τρίτη ομάδα. Εάν το μοντέλο που πρέπει να προσαρμοστεί είναι μόνο ο μέσος όρος κάθε ομάδας, τότε το μοντέλο είναι
το οποίο μπορεί να γραφτεί
Σε αυτό το μοντέλο το αντιπροσωπεύει τον μέσο όρο της th ομάδας.
Μονόδρομος ANOVA (αντιστάθμιση από την ομάδα αναφοράς)
ΕπεξεργασίαΤο μοντέλο ANOVA θα μπορούσε να γραφτεί ισοδύναμα ως εξής: κάθε παράμετρος της ομάδας είναι μια μετατόπιση από κάποια συνολική αναφορά. Συνήθως αυτό το σημείο αναφοράς θεωρείται ότι είναι μία από τις εξεταζόμενες ομάδες. Αυτό έχει νόημα στο πλαίσιο της σύγκρισης πολλαπλών ομάδων θεραπείας με μια ομάδα ελέγχου και η ομάδα ελέγχου θεωρείται η «αναφορά». Σε αυτό το παράδειγμα, η ομάδα 1 επιλέχθηκε ως ομάδα αναφοράς. Ως εκ τούτου, το μοντέλο που πρέπει να προσαρμοστεί είναι
με τον περιορισμό ότι είναι μηδέν.
Σε αυτό το μοντέλο είναι ο μέσος όρος της ομάδας αναφοράς και είναι η διαφορά της ομάδας από την ομάδα αναφοράς. Το δεν περιλαμβάνεται στον πίνακα επειδή η διαφορά του από την ομάδα αναφοράς (η ίδια) είναι αναγκαστικά μηδέν.
Δημοσιεύσεις
Επεξεργασία- Brualdi, Richard A. (2006). «Combinatorial Matrix Classes». Encyclopedia of Mathematics and its Applications. 108. Cambridge University Press. doi: . ISBN 978-0-521-86565-4.
- Brualdi, Richard A.; Ryser, Herbert J. (1991). «Combinatorial Matrix Theory». Encyclopedia of Mathematics and its Applications. 39. Cambridge University Press. doi: . ISBN 0-521-32265-0.
- Botha, J.D. (2013), «31. Matrices over Finite Fields §31.3 Binary Matrices», Handbook of Linear Algebra (Discrete Mathematics and Its Applications) (2nd έκδοση), Chapman & Hall/CRC, doi: , ISBN 978-0-429-18553-3
- Kim, Ki Hang (1982), Boolean Matrix Theory and Applications, ISBN 978-0-8247-1788-9
- Ryser, H.J. (1957). «Combinatorial properties of matrices of zeroes and ones». Canadian Journal of Mathematics 9: 371–7.
- Ryser, H.J. (1960). «Traces of matrices of zeroes and ones». Canadian Journal of Mathematics 12: 463–476. doi: .
- Freedman, David A.· Pisani, Robert· Purves, Roger (2007). Statistics (4th έκδοση). W.W. Norton & Company. ISBN 978-0-393-92972-0.
- Tabachnick, Barbara G.· Fidell, Linda S. (2006). Using Multivariate Statistics. Pearson International Edition (5th έκδοση). Needham, MA: Allyn & Bacon, Inc. ISBN 978-0-205-45938-4.
- Wichura, Michael J. (2006). The coordinate-free approach to linear models. Cambridge Series in Statistical and Probabilistic Mathematics. Cambridge University Press. σελίδες xiv+199. ISBN 978-0-521-86842-6. MR 2283455.
- Christensen, Ronald (2002). Plane Answers to Complex Questions: The Theory of Linear Models (Third έκδοση). New York: Springer. ISBN 978-0-387-95361-8.
Δείτε επίσης
Επεξεργασία- Field Arithmetic
- Πραγματικό προβολικό επίπεδο
- Μιγαδικός αριθμός
- Αντιερμιτιανός πίνακας
- Μέγιστος κοινός διαιρέτης
- Υπολογιστική βιολογία
- Ελάσσων (γραμμική άλγεβρα)
- Προβολή (γραμμική άλγεβρα)
- Συμμετρικός πίνακας
- Άλγεβρα Μπουλ
- Πολλαπλασιασμός πινάκων
- Επαναλαμβανόμενη συνάρτηση
- Ιδιοτιμές και ιδιοδιανύσματα
- Πεπερασμένο σώμα
- Θεωρία πιθανοτήτων
- High performance algorithms for reduction to condensed (Hessenberg, tridiagonal, bidiagonal) form
Εξωτερικοί σύνδεσμοι
Επεξεργασία- English - Greek Dictionary of Pure and Applied Mathematics Εθνικό Μετσόβιο Πολυτεχνείο
- Αγγλοελληνικό Λεξικό Μαθηματικής Ορολογίας - Πανεπιστήμιο Κύπρου
- Matrix calculator
- Matrix Analysis
- Complex-Valued Matrix Derivatives: With Applications in Signal Processing ...
- Foundation Mathematics for Computer Science: A Visual Approach
- Multidimensional Statistical Analysis and Theory of Random Matrices ...
- Quantum Probability and Spectral Analysis of Graphs.
- Symplectic Methods in Harmonic Analysis and in Mathematical Physics...
- Global Product Development: Proceedings of the 20th CIRP Design Conference ...
- Matrix Algebra: Theory, Computations, and Applications in Statistics ..
- Innovations in Classification, Data Science, and Information Systems ..
- Modern Industrial Statistics: With Applications in R, MINITAB, and JMP.
Παραπομπές
Επεξεργασία- ↑ «design matrix | ISI». isi-web.org. Ανακτήθηκε στις 16 Σεπτεμβρίου 2024.
- ↑ Everitt, B. S. (2002). Cambridge Dictionary of Statistics (2nd έκδοση). Cambridge, UK: Cambridge University Press. ISBN 0-521-81099-X.
- ↑ Box, G. E. P.· Tiao, G. C. (1992) [1973]. Bayesian Inference in Statistical Analysis. New York: John Wiley and Sons. ISBN 0-471-57428-7. (Section 8.1.1)
- ↑ Timm, Neil H. (2007). Applied Multivariate Analysis. Springer Science & Business Media. σελ. 107. ISBN 9780387227719.
- ↑ Olkin, I.; Tate, R. F. (1961-06). «Multivariate Correlation Models with Mixed Discrete and Continuous Variables». The Annals of Mathematical Statistics 32 (2): 448–465. doi: . ISSN 0003-4851. https://projecteuclid.org/journals/annals-of-mathematical-statistics/volume-32/issue-2/Multivariate-Correlation-Models-with-Mixed-Discrete-and-Continuous-Variables/10.1214/aoms/1177705052.full.
- ↑ «Analysis of Variance and Covariance». www.southampton.ac.uk. Ανακτήθηκε στις 16 Σεπτεμβρίου 2024.
- ↑ «One-Way ANCOVA For 2 Independent Samples». vassarstats.net. Ανακτήθηκε στις 17 Σεπτεμβρίου 2024.
- ↑ Johnson, Richard A· Wichern, Dean W (2001). Applied Multivariate Statistical Analysis. Pearson. σελίδες 111–112. ISBN 0131877151.
- ↑ «Basic Concepts for Multivariate Statistics p.2» (PDF). SAS Institute.
- ↑ Goupy, J. L. (5 Μαΐου 1993). Methods for Experimental Design: Principles and Applications for Physicists and Chemists. Elsevier. ISBN 978-0-08-086839-4.
- Bhatia, Rajendra (November 15, 1996), Matrix Analysis, Graduate Texts in Mathematics, Springer, ISBN 978-0-387-94846-1
- Demmel, James W. (August 1, 1997), Applied Numerical Linear Algebra, SIAM, ISBN 978-0-89871-389-3
- Bareiss, Erwin (1968), «Sylvester's Identity and Multistep Integer-Preserving Gaussian Elimination», Mathematics of Computation 22 (102): 565–578, doi:, https://www.ams.org/journals/mcom/1968-22-103/S0025-5718-1968-0226829-0/S0025-5718-1968-0226829-0.pdf