Κατανομή νόμου δύναμης

(Ανακατεύθυνση από Νόμος δύναμης)

Στη στατιστική, ένας νόμος δύναμης είναι μια συναρτησιακή σχέση μεταξύ δύο ποσοτήτων, όπου μια ποσότητα μεταβάλλεται ως δύναμη της άλλης. Για παράδειγμα, ο αριθμός των πόλεων που έχουν ένα ορισμένο μέγεθος πληθυσμού βρέθηκε να εξαρτάται από μια δύναμη του μεγέθους του πληθυσμού. Εμπειρικές κατανομές νόμου δύναμης ισχύουν σε ένα περιορισμένο εύρος.

Ένα παράδειγμα γραφικής παράστασης νόμου δύναμης, που χρησιμοποιείται για να δείξει την κατάταξη της συχνότητας. Στα δεξιά είναι η ουρά και στα αριστερά είναι οι λίγες τιμές που επικρατούν (γνωστό ως αρχή του Παρέτο).

Εμπειρικά παραδείγματα των νόμων δύναμης Επεξεργασία

Οι κατανομές μιας ευρείας ποικιλίας φυσικών, βιολογικών, και ανθρωπογενών φαινομένων ακολουθούν προσεγγιστικά κάποια κατανομή νόμου δύναμης πάνω σε ένα ευρύ φάσμα-εύρος μεγεθών: σε αυτά περιλαμβάνονται τα μεγέθη των σεισμών,των κρατήρων στη Σελήνη και των ηλιακών εκλάμψεων,[1] η αναζήτηση τροφής διαφόρων ειδών,[2] τα μεγέθη των μοντέλων για νευρωνικούς πληθυσμούς,[3] η συχνότητα εμφάνισης των λέξεων στις περισσότερες γλώσσες, η συχνότητα εμφάνισης των επωνύμων, το πλήθος των ειδών σε διάφορες κατηγορίες οργανισμών,[4] τα μεγέθη της διακοπής ρεύματος, η συχνότητα πολέμων, ποινικών διώξεων ανά κατάδικο και πολλές άλλες ποσότητες.[5] Ελάχιστες κατανομές ταιριάζουν με κάποια κατανομή νόμου δύναμης σε όλες τις τιμές τους, αλλά περισσότερο ακολουθούν κάποια κατανομή νόμου δύναμης στην ουρά τους. Η συχνότητα της ακουστικής απόσβεσης ακολουθεί κατανομή νόμου δύναμης για μεγάλης συχνότητας μπάντες για πολλά σύνθετα μέσα. Οι νόμοι αλλομετρικής κλίμακας για σχέσεις μεταξύ βιολογικών μεταβλητών είναι ανάμεσα στις πιο γνωστές συναρτήσεις νόμου δύναμης στη φύση.

Ιδιότητες των κατανομών νόμου δύναμης Επεξεργασία

Η σταθερότητα της κλίμακας Επεξεργασία

Ένα χαρακτηριστικό της κατανομής νόμου δύναμης  είναι η σταθερότητα της κλίμακας. Αν ισχύει  ,  για τον υπολογισμό της συνάρτησης με τη μεταβλητή    πολλαπλασιασμένη κατά ένα σταθερό παράγοντα   παρατηρούμε ότι δημιουργείται απλά μία ανάλογη απεικόνιση της ίδιας της συνάρτησης. Δηλαδή

 

Επομένως, ο πολλαπλασιασμός του   με ένα σταθερό πραγματικό αριθμό    πολλαπλασιάζει απλώς την αρχική συνάρτηση της κατανομής νόμου δύναμης με τη σταθερά  . Έτσι, προκύπτει ότι όλες οι κατανομές νόμου δύναμης με ιδιαίτερη κλιμάκωση στον εκθέτη είναι ισοδύναμες με προσέγγιση ενός σταθερού παράγοντα, αφού το καθένα είναι απλώς μια κλιμακωτή εκδοχή των άλλων. Αυτή η συμπεριφορά είναι που παράγει τη γραμμική σχέση όταν λογαριθμίζουμε και τα δύο μέρη της συνάρτησης f, και η ευθεία γραμμή στο γράφημα των λογαρίθμων αποκαλείται ως υπογραφή του νόμου δύναμης. Στα πραγματικά δεδομένα, η γραμμική σχέση είναι αναγκαία, αλλά όχι και ικανή συνθήκη για  δεδομένα που συνδέονται με κατανομή νόμου δύναμης. Στην πραγματικότητα, υπάρχουν πολλοί τρόποι για να δημιουργηθούν πεπερασμένες ποσότητες δεδομένων που μιμούνται τη συμπεριφορά-ιδιότητα της υπογραφής της κατανομής νόμου δύναμης, αλλά, στο ασυμπτωτικό τους όριο, δεν έχουμε πραγματικά νόμο δύναμης (π.χ. όταν η διαδικασία παραγωγής ορισμένων στοιχείων ακολουθεί μια λογαριθμοκανονική κατανομή). Έτσι, η ακρίβεια στην αντιστοίχιση και η επαλήθευση των μοντέλων της κατανομής νόμου δύναμης αποτελούν ένα ενεργό κομμάτι της έρευνας στον τομέα της στατιστικής.

Ροπές Επεξεργασία

Οι κατανομές νόμου δύναμης έχουν ένα καλά ορισμένο μέσο μόνο αν ο εκθέτης υπερβαίνει το 2 και έχουν πεπερασμένη διακύμανση μόνο όταν ο εκθέτης υπερβαίνει το 3. Οι περισσότερες κατανομές νόμου δύναμης που εντοπίστηκαν στη φύση έχουν εκθέτες, έτσι ώστε η μέση τιμή τους να είναι καλά ορισμένη, αλλά η διακύμανση τους όχι. Παρουσιάζουν, δηλαδή, συμπεριφορά black swan.[6]  Αυτό μπορεί να φανεί στο ακόλουθο πείραμα σκέψης:[7] φανταστείτε ένα δωμάτιο με τους φίλους σας και υπολογίστε το μέσο μηνιαίο εισόδημα στο δωμάτιο αυτό. Τώρα φανταστείτε τον πλουσιότερο άνθρωπο στον κόσμο να μπαίνει στο δωμάτιο αυτό, με μηνιαίο εισόδημα περίπου 1 δισεκατομμύριο δολάρια ΗΠΑ. Τι συμβαίνει με το μέσο εισόδημα στο δωμάτιο; Τα έσοδα διανέμονται σύμφωνα με μια κατανομή νόμου δύναμης που είναι γνωστή ως η κατανομή Παρέτο (Για παράδειγμα, η εργασία των Αμερικανών κατανέμεται σύμφωνα με μία κατανομή νόμου δύναμης με εκθέτη 2[8]).

Από τη μία πλευρά, αυτό καθιστά εσφαλμένη την εφαρμογή των παραδοσιακών στατιστικών μεθόδων που βασίζονται στη διακύμανση και τη τυπική απόκλιση (όπως ανάλυση παλινδρόμησης). Από την άλλη πλευρά, αυτό επιτρέπει αποδοτικές παρεμβάσεις ελαχίστου κόστους[7]. Για παράδειγμα, δεδομένου ότι η εξάτμιση των καυσαερίων των αυτοκινήτων κατανέμεται σύμφωνα με μια κατανομή νόμου δύναμης μεταξύ των αυτοκινήτων (πολύ λίγα αυτοκίνητα μπορεί να συμβάλλουν κατά πολύ στη μόλυνση του αέρα) θα αρκούσε για μια σημαντική μείωση εκροής των συνολικών καυσαερίων η εξαφάνιση πολύ λίγων αυτοκινήτων από το δρόμο.[9]

Καθολικότητα Επεξεργασία

Η αντιστοιχία της κατανομής του νόμου δύναμης με ένα σταθερό εκθέτη μπορεί να οφείλεται σε δυναμικές διαδικασίες που παράγουν τη σχέση νόμου δύναμης. Στη φυσική, για παράδειγμα, μεταβάσεις φάσεων σε θερμοδυναμικά συστήματα  συνδέονται με την εμφάνιση των κατανομών  νόμου δύναμης ορισμένων ποσοτήτων, οι εκθέτες των οποίων αναφέρονται ως κρίσιμοι εκθέτες του συστήματος. Διάφορα συστήματα με τους ίδιους κρίσιμους εκθέτες μπορεί να δειχθεί με τη θεωρία συνόλων επανακανονικοποίησης , ότι έχουν τις ίδιες δυναμικές. Για παράδειγμα, η συμπεριφορά του νερού και του CO2 στα σημεία βρασμού τους εμπίπτουν στην ίδια κλάση καθολικότητας, επειδή έχουν παρόμοιους κρίσιμους εκθέτες. Στην πραγματικότητα, σχεδόν όλες οι μεταβάσεις φάσεων των υλικών περιγράφονται από ένα μικρό σύνολο καθολικών κλάσεων. Παρόμοιες παρατηρήσεις έχουν γίνει, αν και όχι τόσο εκτενώς, για διάφορα κρίσιμα συστήματα που αυτο-οργανώνονται και στα οποία το κρίσιμο σημείο του συστήματος είναι ένας ελκυστής. Επισήμως, αυτή η κοινή χρήση των δυναμικών αναφέρεται ως καθολικότητα, και τα συστήματα με τους ίδιους ακριβώς εκθέτες δηλώνουν ότι ανήκουν στην ίδια κλάση καθολικότητας.

Συναρτήσεις νόμου δύναμης Επεξεργασία

Το επιστημονικό ενδιαφέρον στις σχέσεις νόμου δύναμης προέρχεται κατά ένα τμήμα από την ευκολία με την οποία ορισμένες κλάσεις μηχανισμών τις παράγουν.[10] Η παρουσίαση της σχέσης νόμου δύναμης σε μερικά δεδομένα μπορεί να επικεντρωθεί σε συγκεκριμένα είδη μηχανισμών που ίσως υπογραμμίζουν το εν λόγω φυσικό φαινόμενο, και μπορούν να υποδείξουν μια βαθιά σχέση με άλλα, φαινομενικά άσχετα συστήματα.[11]. Δείτε επίσης Καθολικότητα παραπάνω. Η ασάφεια των σχέσεων νόμου δύναμης στη φυσική οφείλεται κατά ένα τμήμα σε περιορισμούς της διάστασης, ενώ σε σύνθετα συστήματα οι νόμοι δύναμης θεωρούνται υπογραφές της ιεραρχίας ή από ειδικές στοχαστικές διαδικασίες. Υπάρχουν μερικά αξιοσημείωτα παραδείγματα του νόμου δύναμης στο νόμο Gutenberg-Richter για τα σεισμικά μεγέθη όπως και ο νόμος του Παρέτο για την κατανομή εισοδημάτων, η αυτο-ομοιότητα των fractals και ο αλλομετρικός νόμος στα βιολογικά συστήματα. Η έρευνα στις ρίζες της σχέσης νόμου δύναμης και τις προσπάθειες να παρατηρήσουμε και να εξακριβώσουμε αυτά στον πραγματικό κόσμο είναι ενεργό θέμα έρευνας σε ποικίλους τομείς της επιστήμης, συμπεριλαμβάνοντας τη φυσική, την πληροφορική, τη γλωσσολογία, τη γεωφυσική, τη νευρολογία, τα οικονομικά και άλλα.

Ωστόσο σημαντικό κομμάτι από το πρόσφατο ενδιαφέρον στους νόμους δύναμης πηγάζει από τη μελέτη των κατανομών πιθανότητας. Οι κατανομές μιας μεγάλης ποικιλίας από μεγέθη φαίνεται να υπακούουν στη σχέση νόμου δύναμης, τουλάχιστον στην ουρά τους (μεγάλα γεγονότα). Η συμπεριφορά αυτών των μεγάλων γεγονότων συνδέεται με αυτές τις ποσότητες στη μελέτη της θεωρίας των μεγάλων αποκλίσεων (που καλείται θεωρία ακραίων τιμών), που υπολογίζει τη συχνότητα εξαιρετικά σπάνιων γεγονότων όπως τα χρηματηστηριακά κραχ και τις μεγάλες φυσικές καταστροφές. Είναι πρωτίστως στη μελέτη των στατιστικών κατανομών που χρησιμοποιείται ο όρος "νόμος δύναμης". Σε άλλους τομείς, όπως στη φυσική και τη μηχανική μια συναρτησιακή μορφή νόμου δύναμης με έναν όρο και έναν θετικό ακέραιο εκθέτη θεωρείται τυπικά ως πολυωνυμική συνάρτηση.

Σε εμπειρικά δεδομένα, μια προσέγγιση σε ένα νόμο δύναμης   περιλαμβάνει συχνά ένα όρο απόκλισης που μπορεί να αντιπροσωπεύει μια αβεβαιότητα σε παρατηρούμενες τιμές (ίσως δειγματοληπτικά σφάλματα ή σφάλματα μέτρησης) ή να παρέχει έναν απλό τρόπο για τις παρατηρήσεις να αποκλίνουν από τη συνάρτηση νόμου δύναμης (ίσως για στοχαστικούς λόγους):

 

Μαθηματικά, ένας αυστηρός νόμος δύναμης δεν μπορεί να είναι μια συνάρτηση κατανομής, αλλά μια κατανομή που είναι μια αποκομμένη συνάρτηση δύναμης είναι πιθανή:   για   εκεί που ο εκθέτης   είναι μεγαλύτερος του 1 ( αλλιώς η ουρά έχει πεπερασμένη περιοχή), η ελάχιστη τιμή   που χρειάζεται να λάβουμε υπόψη αλλιώς η κατανομή έχει άπειρο άθροισμα καθώς το x προσεγγίζει το 0, και μια σταθερά C είναι ένας πολλαπλασιαστικός παράγων για να επιβεβαιώσει ότι το συνολικό άθροισμα των πιθανοτήτων είναι 1, όπως απαιτείται από την αθροιστική κατανομή. Πιο συχνά κανείς χρησιμοποιεί τον ασυμπτωτικό νόμο δύναμης, ένα νόμο που ισχύει στο όριο- περισσότερες λεπτομέρειες στις συναρτήσεις κατανομής. Τυπικά ο εκθέτης πέφτει στο όριο   πράγμα που δεν ισχύει πάντα.[5]

Παραδείγματα της κατανομής νόμου δύναμης Επεξεργασία

Περισσότερες από εκατό κατανομές νόμου δύναμης έχουν εξακριβωθεί στη φυσική (π.χ. κατολίσθηση άμμου και σεισμοί), στη βιολογία (π.χ. εξαφάνιση ειδών και μάζα σώματος) και στις κοινωνικές επιστήμες (π.χ. μέγεθος πόλεων και εισόδημα).[12] Ανάμεσα σε αυτά είναι και:

.

Παραλλαγές της κατανομής νόμου δύναμης Επεξεργασία

Κλαδωτή συνάρτηση κατανομής νόμου δύναμης Επεξεργασία

 Μία κλαδωτή συνάρτηση κατανομής νόμου δύναμης ορίζεται με όριο στο    ως εξής:[16]      for       .

Συνάρτηση κατανομής νόμου δύναμης με εκθετικό όρο Επεξεργασία

Μια συνάρτηση κατανομής νόμου δύναμης με εκθετικό όρο, είναι απλά μια κατανομή νόμου δύναμης επί μια εκθετική:[17]

 

Καμπυλόγραμμη συνάρτηση νόμου δύναμης Επεξεργασία

 [18]

Συναρτήσεις κατανομής νόμου δύναμης Επεξεργασία

Σε μια πιο χαλαρή εικόνα, μια συνάρτηση κατανομής νόμου δύναμης είναι μια κατανομή της οποίας η συνάρτηση πυκνότητας κνότητας πιθανότητας (ή συνάρτηση πιθανότητας στην περίπτωση διακριτού) έχει τη μορφή

 

όπου  , και   είναι  μία βραδέως μεταβαλλόμενη συνάρτηση, η οποία ικανοποιεί την ισότητα   με   σταθερό και  . Αυτή η ιδιότητα του  προκύπτει άμεσα από την απαίτηση του   να είναι ασυμπτωτικά αμετάβλητο. Έτσι, μόνο η μορφή του   ελέγχει το σχήμα και το μέγεθος της κάτων ουράς. Για παράδειγμα, αν η  είναι συνεχής συνάρτηση, τότε έχουμε μία κατανομή νόμου δύναμης που ισχύει για όλα τα  . Σε πολλές περιπτώσεις, βολεύει να επιλέξουμε το όριο της κατανομής νόμου δύναμης στο   απ' το οποίο και πέρα ισχύει ο νόμος. Ο συνδυασμός αυτών των δύο περιπτώσεων, όπου είναι   μια συνεχής μεταβλητή η κατανομή νόμου δύναμης να έχει τη μορφή

 

όπου ο όρος   είναι η ομαλοποιητική σταθερά. Μπορούμε να θεωρήσουμε τώρα διάφορες ιδιότητες αυτής της κατανομής. Για παράδειγμα,οι ροπές που είναι λύσεις της

 

το οποίο υπάρχει μόνο όταν  . Δηλαδή όταν   τότε αποκλίνει. Έτσι όταν  , η μέση τιμή και όλες οι ροπές ανώτερης τάξης τείνουν στο άπειρο, όταν  , τότε η μέση τιμή υπάρχει, αλλά η διακύμανση και οι ροπές υψηλότερης τάξης απειρίζονται. Για τα δείγματα πεπερασμένου μεγέθους που προέρχονται από μία τέτοια κατανομή, η συμπεριφορά αυτή υποδηλώνει ότι οι εκτιμητές των κεντρικών ροπών, όπως η μέση τιμή και η διακύμανση, για αποκλίνουσες ροπές δεν θα συγκλίνουν ποτέ- καθώς συσσωρεύονται περισσότερα γεγονότα, αυτές συνεχίζουν να μεγαλώνουν. Αυτές οι κατανομές νόμου δύναμης ονομάζονται κατανομές τύπου Παρέτο, ή κατανομές με ουρά Παρέτο ή κατανομές με κανονικές ασταθείς ουρές.

Ένα άλλο χαρακτηριστικό είδος κατανομής νόμου δύναμης , το οποίο δεν πληροί την ανωτέρω γενική μορφή, είναι η κατανομή νόμου δύναμης με εκθετικό όριο της μορφής Πρότυπο:Clarify

 

Σε αυτήν την κατανομή, ο εκθετικός όρος   φθίνει και τελικά παίρνει την τιμή της κατανομής νόμου δύναμης σε πολύ μεγάλες τιμές του  . Η κατανομή αυτή δεν φράσσεται και ως εκ τούτου δεν είναι ασυμπτωτικά μία κατανομή νόμου δύναμης. (Σημειώστε ότι η παραπάνω μορφή είναι ένα υποσύνολο αυτής της οικογένειας, με  .) Η κατανομή αυτή έχει μια κοινή εναλλακτική λύση για την ασυμπτωτική κατανομή νόμου δύναμης επειδή δεσμεύει φυσικά αποτελέσματα πεπερασμένου μεγέθους. Για παράδειγμα, αν και ο νόμος Gutenberg–Richter συνήθως αναφέρεται ως ένα παράδειγμα κατανομής νόμου δύναμης, η κατανομή των σεισμικών μεγεθών δεν μπορεί να φράσεται στο όριο  , επειδή υπάρχει ένα πεπερασμένο ποσό ενέργειας στο φλοιό της Γης το οποίο πρέπει να παίρνει κάποια μέγιστη τιμή σε ένα σεισμό. Καθώς η συμπεριφορά στο πεδίο ορισμού προσεγγίζει αυτό το μέγεθος, θα πρέπει να φθίνει αλλά και να υπάρχει.

Η κατανομή Tweedie είναι μια οικογένεια στατιστικών μοντέλων που χαρακτηρίζεται από το τελείωμα των κάτω επιπλέον σημείων της γραφικής παράστασης και της αναπαραγωγικής συνέλιξης καθώς και από την κλίμακα μετασχηματισμού. Κατά συνέπεια, τα μοντέλα αυτά όλα εκφράζουν μια σχέση κατανομής νόμου δύναμης μεταξύ της διακύμανσης και της μέσης τιμής. Αυτά τα μοντέλα έχουν ένα θεμελιώδη ρόλο ως βάσεις της μαθηματικής σύγκλισης κατά παρόμοιο με το ρόλο που διαδραματίζει η κανονική κατανομή ,η οποία έχει ως επίκεντρο το κεντρικό οριακό θεώρημα. Αυτό το φαινόμενο της σύγκλισης εξηγεί γιατί στη κατανομή νόμου δύναμης, η διακύμανση της μέσης τιμής εκδηλώνεται τόσο ευρέως σε φυσικές διαδικασίες, όπως με το νόμο του Taylor στην οικολογία και με τη διακύμανση συνεχών σταθερών [19] στη φυσική. Μπορεί, επίσης, να αποδειχθεί ότι αυτή η διακύμανση στη μέση τιμή της κατανομής νόμου δύναμης, όταν υποδεικνύεται από τη μέθοδο επέκτασης αποθήκευσης, συνεπάγεται την παρουσία της 1 / f διάδοσης και ότι 1 / f διάδοση μπορεί να προκύψει ως συνέπεια του αποτελέσματος σύγκλισης Tweedie.[20]

Γραφικές μέθοδοι για την αναγνώριση μιας κατανομής νόμου δύναμης Επεξεργασία

Παρ' ότι έχουν προταθεί ισχυρότερες και πιο εξελιγμένες μέθοδοι, οι πιο συχνά χρησιμοποιούμενες γραφικές μέθοδοι για την αναγνώριση του νόμου δύναμης σε αθροιστικές συναρτήσεις κατανομών χρησιμοποιώντας τυχαία δείγματα είναι τα Q-Q plots του Παρέτο,[εκκρεμεί παραπομπή] τα διαγράμματα υπολειπόμενης διάρκειας ζωής [21][22] και τα διαγράμματα λογαρίθμων. Μια άλλη ισχυρότερη γραφική μέθοδος χρησιμοποιεί δέσμες των συναρτήσεων υπολειπόμενων ποσοστημορίων.[23] (Κρατήστε στο μυαλό σας ότι οι κατανομές νόμου δύναμης καλούνται ακόμη και κατανομές τύπου Παρέτο.) Υποτίθεται εδώ ότι ένα τυχαίο δείγμα αποκτάται από μια συνάρτηση κατανομής, και ότι θέλουμε να ξέρουμε εάν η ουρά της κατανομής ακολουθεί ένα νόμο δύναμης (με άλλα λόγια, θέλουμε να ξέρουμε αν η κατανομή έχει "ουρά Παρέτο"). Εδώ, ένα τυχαίο δείγμα καλείται ώς "τα δεδομένα".

Τα Q-Q plots του Παρέτο συγκρίνουν τα [ποσοστημόριο|ποσοστημόρια] από τα λογαριθμισμένα δεδομένα με τα αντίστοιχα ποσοστημόρια μιας εκθετικής κατανομής με μέσο 1 (ή με τα ποσοστημόρια μιας τυπικής κατανομής Παρέτο) σχεδιάζοντας τα σε διάγραμμα. Εάν το διάγραμμα διασποράς που προκύπτει δείχνει ότι τα σημεία "συγκλίνουν ασυμπτωτικά" σε μια ευθεία, τότε πρέπει κανείς να περιμένει μια κατανομή νόμου δύναμης. Ένα χαρακτηριστικό στα Q-Q plots του Παρέτο είναι ότι συμπεριφέρονται ανεπαρκώς όταν ο δείκτης ουράς   (που ονομάζεται και δείκτης του Παρέτο) είναι κοντά στο 0, επειδή τα Q-Q plots δεν είναι σχεδιασμένα για να αναγνωρίζουν κατανομές με βραδέως μεταβαλλόμενες ουρές.[23]

Από την άλλη πλευρά, στην έκδοσή του για την αναγνώριση των κατανομών νόμου δύναμης, το διάγραμμα μέσης υπολειπόμενης ζωής αποτελείται από τα λογαριθμισμένα δεδομένα πρώτα, και μετά σχεδιάζοντας το μέσο από εκείνα τα λογαριθμισμένα δεδομένα που είναι μεγαλύτερα από το στατιστικό i-οστής τάξης έναντι του στατιστικού i-οστής τάξης για i=1,...,n, όπου n είναι το μέγεθος του τυχαίου δείγματος. Εάν το διάγραμμα διασποράς που προκύπτει υποδεικνύει ότι τα σημεία τείνουν να σταθεροποιούνται γύρω από μια οριζόντια ευθεία, τότε αναμένουμε την κατανομή νόμου δύναμης. Επειδή το διάγραμμα μέσης υπολειπόμενης ζωής είναι πολύ ευαίσθητο σε παράτυπα σημεία (δεν είναι ισχυρό), παράγει συνήθως σημεία που είναι δύσκολο να ερμηνευτούν. Για το λόγο αυτό, τέτοια διαγράμματα ονομάζονται Hill horror plots.[24]

Τα διαγράμματα λογαρίθμων είναι ένας εναλλακτικός τρόπος για την εξέταση της ουράς μιας κατανομής με τη χρήση ένός τυχαίου δείγματος. Αυτή η μέθοδος αποτελείται από τη σχεδίαση του λογαρίθμου ενός εκτιμητή της πιθανότητας ώστε ένας συγκεκριμένος αριθμός της κατανομής να συμβαίνει ως προς το λογάριθμο του αριθμού αυτού. Συνήθως, αυτός ο εκτιμητής είναι ο αριθμός των φορών που ο αριθμός εμφανίζεται στο σύνολο των δεδομένων. Εαν τα σημεία του διαγράμματος τείνουν να "συγκλίνουν" σε μεια ευθεία γραμμή για μεγάλους αριθμούς του άξονα x, τότε ο ερευνητής συμπεραίνει ότι η κατανομή έχει ουρά που υπακούει στο νόμο δύναμης. Παραδείγματα της εφαρμογής από αυτόυς τους τύπους διαγραμμάτων έχουν εκδοθεί.[25] Ένα πλεονέκτημα αυτών των διαγραμμάτων είναι ότι, προκειμένου να παρέχουν αξιόπιστα αποτελέσματα, απαιτούν μεγάλες ποσότητες δεδομένων. Επιπροσθέτως, είναι κατάλληλα μόνο για διακριτά (ή ομαδοποιημένα) δεδομένα.

 
Μια ευθεία γραμμή σε ένα διάγραμμα λογαρίθμων είναι μια ισχυρή απόδειξη ότι πρόκειται για νόμο δύναμης. Η κλίση της ευθείας αντιστοιχεί στον εκθέτη του νόμου δύναμης

Έχει προταθεί και μία άλλη γραφική μέθοδος για την αναγνώριση κατανομών νόμου δύναμης με χρήση τυχαίων δειγμάτων.[23] Αυτή η μεθοδολογία αποτελείται από την κατασκευή του διαγράμματος για μια "δέσμη λογαριθμημένων δειγμάτων". Αρχικά προτεινόμενη ως ένα εργαλείο για τη διερεύνηση της ύπαρξης ροπών και της ροπογεννήτριας συνάρτησης χρησιμοποιώντας τυχαία δείγματα, μια μεθοδολογία δέσμης είναι βασισμένη στις συναρτήσεις υπολειπόμενων ποσοστημορίων (RQFs), που ονομάζονται και συναρτήσεις υπολειπόμενων εκατοστημορίων,,[26][27][28][29][30][31][32] οι οποίες παρέχουν έναν πλήρη χαρακτηρισμό της συμπεριφορές της ουράς για πολλές γνωστές κατανομές, συμπεριλαμβανομένων των κατανομών νόμου δύναμης, κατανομές με άλλων τύπων βαριές ουρές και ακόμη κατανομές χωρίς βαριές ουρές. Τα διαγράμματα δέσμης δεν έχουν το μειονέκτημα των Q-Q plots του Παρέτο, τα διαγράμματα μέσης υπολειπόμενης ζωής και τα διαγράμματος λογαρίθμων που προαναφέρθηκαν (είναι ισχυρά στα παράτυπα σημεία, επιτρέπουν την αναγνώριση του νόμου δύναμης με μικρές τιμές του  , και δεν απαιτούν συλλογή πολλών δεδομένων).[εκκρεμεί παραπομπή] Επιπροσθέτως, άλλοι τύποι της συμπεριφοράς της ουράς μπορούν να αναγνωριστούν κατά τη χρήση των διαγραμμάτων δέσμης.

.

Αναπαράσταση κατανομής νόμου δύναμης Επεξεργασία

Σε γενικές γραμμές, οι κατανομές νόμου δύναμης απεικονίζονται σε λογαριθμικούς άξονες, που δίνουν έμφαση στην άνω ουρά. Ο πιο βολικός τρόπος για να γίνει αυτό είναι μέσω της (συμπληρωματικής) αθροιστικής κατανομής (cdf),  ,

 

Σημειώστε εδώ ότι η cdf είναι επίσης συνάρτηση νόμου δύναμης, αλλά με μικρότερο εκθέτη. Για τα δεδομένα, ισοδύναμη μορφή της cdf είναι η προσέγγιση με βαθμό συχνότητας, στην οποία πρέπει πρώτα να ταξινομήσουμε τις   παρατηρούμενες τιμές σε αύξουσα σειρά, και να σχεδιάσετε με ως προς ένα διάνυσμα  .

Αν και μπορεί να είναι βολική η λογαριθμοκανονική κατανομή για την αναπαράσταση των δεδομένων μας, ή αλλιώς να ομαλοποιήσουμε συνάρτηση πυκνότητας πιθανότητας αυτής, αυτή η μέθοδος παρουσιάζει μία έμμεση μεροληψία όσον αφορά την αναπαράσταση των δεδομένων, και ως εκ τούτου θα πρέπει να αποφεύγεται. [εκκρεμεί παραπομπή] Η cdf, από την άλλη πλευρά, δεν εισάγει καμία μεροληψία στα δεδομένα και διατηρεί έτσι το γραμμική σχέση της υπογραφής στους λογαριθμικούς άξονες.

Εκτίμηση του εκθέτη από εμπειρικά δεδομένα Επεξεργασία

Υπάρχουν πολλοί τρόποι να εκτιμήσει κανείς την τιμή του εκθέτη για μια ουρά νόμου δύναμης. Εντούτοις, δεν δίνουν όλοι αποτελέσματα αμερόληπτα και συνεπή. Μερικές από τις πλέον αξιόπιστες τεχνικές βασίζονται συνήθως στη μέθοδο της μέγιστη πιθανοφάνεια. Οι εναλλακτικές μέθοδοι βασίζονται συνήθως στη δημιουργία γραμμικής παλλινδρόμησης είτε στους λογαρίθμους των διαγραμμάτων συχνοτήτων είτε σε λογαριθμημένα δεδομένα, αλλά αυτές οι προσεγγίσεις είναι καλό να αποφεύγονται καθώς μπορούν να οδηγήσουν σε ιδιέταιρα μεροληπτικές εκτιμήσεις του εκθέτη.[5]

Εκτίμηση του εκθέτη με τη μέθοδο μέγιστης πιθανοφάνειας Επεξεργασία

Για πραγματικά,ανεξάρτητα και παρόμοια κατανεμημένα δεδομένα, αντιστοιχίζουμε μια κατανομή νόμου δύναμης της μορφής

 

στα δεδομένα  , όπου ο συντελεστής   διασφαλίζει ότι η κατανομή είναι ομαλοποιημένη. Με δεδομένη την επιλογή για  , ο λογάριθμος της πιθανοφάνειας γίνεται:

 

Η μέγιστη αυτή πιθανοφάνεια βρίσκεται από διαφόριση ως προς την παράμετρο  , θέτοντας το αποτέλεσμα να ισούται με το μηδέν. Κατά την αναδιάταξη, αυτό αποδίδει την εξίσωση του εκτιμητή:

 

που   είναι τα   δεδομένα των  .[1][33] Αυτός ο εκτιμητής παρουσιάζει μιαμικρή πεπερασμένη μεροληψία του μεγέθους του δείγματος της τάξης  , η οποία είναι μικρή, όταν n > 100. Περαιτέρω, το τυπικό σφάλμα της εκτίμησης είναι  . Αυτός ο εκτιμητής είναι ισοδύναμος με το δημοφιλές εκτιμητή Hill από τα ποσοτικά οικονομικά και τη θεωρία των ακραίων τιμών.

Σε ένα σύνολο από n δεδομένων με ακέραιες τιμές  , όπου και πάλι το καθένα απ'τα  , ο εκθέτης-εκτιμιτής μέγιστης πιθανοφάνειας είναι η λύση για την υπερβατική εξίσωση

 

όπου το   είναι η ατελής ζήτα κατανομή. Η αβεβαιότητα στην εκτίμηση αυτή ακολουθεί την ίδια φόρμουλα, όπως για τη συνεχή εξίσωση. Ωστόσο, οι δύο εξισώσεις για τον εκτιμητή   δεν είναι ισοδύναμες, και ο τύπος των συνεχών δεν θα πρέπει να εφαρμόζεται σε διακριτά στοιχεία, ούτε το αντίστροφο.

Περαιτέρω, και οι δύο υπολογισμοί των εκτιμητών απαιτούν πρώτα την επιλογή του  . Για τις συναρτήσεις με μια μη τετριμμένη   συνάρτηση, η επιλογή ενός   πολύ μικρού παράγει ένα σημαντικό σφάλμα στο  , ενώ η επιλογή πάρα πολύ μεγάλου  min αυξάνει την αβεβαιότητα του  , και μειώνει τη στατιστική ισχύ του μοντέλου μας. Σε γενικές γραμμές, η καλύτερη επιλογή του   του εξαρτάται σημαντικά από τη συγκεκριμένη μορφή της κάτω ουράς, που αντιπροσωπεύεται από τον   που είδαμε παραπάνω. Περισσότερες πληροφορίες σχετικά με αυτές τις μεθόδους, και τις προϋποθέσεις υπό τις οποίες μπορούν να χρησιμοποιηθούν, μπορούν να βρεθούν στον εξής σύνδεσμο: [5] Επιπλέον, αυτό το περιεκτικό άρθρο επισκόπησης παρέχει και από κώδικα στο Matlab, στην R και στην C++ για ρουτίνες εκτιμήσεων και ελέγχου των κατανομών νόμου δύναμης.

Εκτίμηση του εκθέτη με τη μέθοδο του Kolmogorov–Smirnov Επεξεργασία

Μια άλλη μέθοδος για την εκτίμηση του εκθέτη της κατανομής νόμου δύναμης, η οποία δεν περιλαμβάνει ανεξάρτητα και παρόμοια κατανεμημένα (iid) δεδομένα, χρησιμοποιεί την ελαχιστοποίηση του στατιστικού Kolmogorov–Smirnov,  , μεταξύ των συναρτήσεων αθροιστικής κατανομής των δεδομένων και της κατανομής νόμου δύναμης:   με 

όπου   και   δηλώνουν τις cdfs των δεδομένων και του νόμου δύναμης με εκθέτη  , αντίστοιχα. Δεδομένου ότι αυτή η μέθοδος δεν αναλαμβάνει iid δεδομένα, παρέχει έναν εναλλακτικό τρόπο για να προσδιοριστεί ο εκθέτης της κατανομής νόμου δύναμης για τα σύνολα των δεδομανων στα οποία δεν μπορεί να αγνοηθεί η χρονική συσχέτιση.[3]

Δυο σημεία μεθόδων προσαρμογής Επεξεργασία

Αυτό το κριτήριο Πρότυπο:Clarify μπορεί να εφαρμοστεί για την εκτίμηση του εκθέτη του νόμου δύναμης στην περίπτωση μιας ελεύθερης κλίμακας κατανομής και παρέχει μια περισσότερο συγκλίνουσα εκτίμηση από αυτήν της μεθόδου μέγιστης πιθανοφάνειας.[34] Έχει εφαρμοστεί για τη μελέτη κατανομών θραυσματικών ανοιγμάτων.[34] Σε κάποια περιεχόμενα η κατανομή περιγράφεται όχι από τη συνάρτηση αθροιστικής κατανομής, από τηναθροιστική συχνότητα μιας ιδιότητας "Χ", ορισμένης ως ο αριθμός των στοιχείων ανά μέτρο (ή μονάδα εμβαδού, δευτερόλεπτο κλπ.) για τα οποία ισχύει X>x, όπου "x" είναι ένας τυχαίος πραγματικός. Για παράδειγμα,[34] η αθροιστική κατανομή των θραυσματικών ανοιγμάτων,"Χ" για δείγμα "Ν" στοιχείων ορίζεται ως " ο αριθμός των θραυσμάτων ανά μετο έχοντας άνοιγμα μεγαλύτερο του "x". Η χρήση της αθροιστικής συχνότητας έχει κάποια πλεονεκτήματα, π.χ, επιτρέπει σε κάποιον να συγκεντρώσει στο ίδιο διάγραμμα δεδομένα συγκεντρωμένα από δείγματα διαφορετικών μηκών και κλιμάκων (π.χ. από outcrop και από μικροσκόπιο). .

Συνάρτηση R Επεξεργασία

Η παρακάτω συνάρτηση υπολογίζει την τιμή του εκθέτη της R, την αποτύπωση των στοιχείων της λογαριθμοκανονικής κατανομής και της προσαρμοσμένης γραμμής.
   pwrdist <- function(u,...) {
       # u is vector of event counts, e.g. how many
       # crimes was a given perpetrator charged for by the police
       fx <- table(u)
       i <- as.numeric(names(fx))
       y <- rep(0,max(i))
       y[i] <- fx
       m0 <- glm(y~log(1:max(i)),family=quasipoisson())
       print(summary(m0))
       sub <- paste("s=",round(m0$coef[2],2),"lambda=",sum(u),"/",length(u))
       plot(i,fx,log="xy",xlab="x",sub=sub,ylab="counts",...)
       grid()
       lines(1:max(i),(fitted(m0)),type="l")
       return(m0)
   }

Επιβεβαίωση της κατανομής νόμου δύναμης Επεξεργασία

Παρά το γεγονός ότι οι σχέσεις των κατανομών νόμου δύναμης είναι ελκυστικές για πολλούς θεωρητικούς λόγους, ο ισχυρισμός ότι τα δεδομένα ακολουθούν πράγματι μια σχέση κατανομής νόμου δύναμης απαιτεί περισσότερα από την απλή αντιστοίχιση ενός συγκεκριμένου μοντέλου στα δεδομένα.[14] Για παράδειγμα η λογαριθμοκανονική κατανομή συγχέεται πολλές φορές με την κατανομή νόμου δύναμης.[35] Όπως για παράδειγμα γίνεται στο νόμο του Gibrat ο οποίος παρουσιάζει περίπου ανάλογη συμπεριφορά με την λογαριθμοκανονική κατανομή ,της οποίας το διάγραμμα λογαρίθμων είναι ευθεία όπως και της κατανομής νόμου δύναμης. Μία εξήγηση αυτού είναι ότι αν και ο λογάριθμος της λογαριθμοκανονικής συνάρτησης πυκνότητας είναι τετραγωνικός σε σχέση με την log(x), έτσι προκύπτει ένα κυρτό σχήμα στο διάγραμμα των λογαρίθμων, εάν ο τετραγωνικός όρος είναι μικρός σε σχέση με το γραμμικό όρο τότε το αποτέλεσμα που θα εμφανιστεί μπορεί να είναι σχεδόν γραμμικό. Ως εκ τούτου, ένα λογαριθμικό διάγραμμα που ελαφρά κοίλο προς τα κάτω μπορεί να αντανακλά μια λογαριθμοκανονική κατανομή και όχι μια κατανομή νόμου δύναμης. Σε γενικές γραμμές, πολλές εναλλακτικές κατανομές που μοιάζουν πολύ με την κατανομή νόμου δύναμης μπορούν να εμφανιστούν να ακολουθήσουν μια μορφή νόμου δύναμης ως ένα βαθμό[36] Επίσης, οι ερευνητές έχουν συνήθως να αντιμετωπίσουν το πρόβλημα του να αποφασίσουν αν ή όχι μια κατανομή πιθανοτήτων του πραγματικού κόσμου ακολουθεί μια κατανομή νόμου δύναμης ή μια άλλη που της μοιάζει πολύ. Ως λύση σε αυτό το πρόβλημα, ο Diaz[37] πρότεινε μια γραφική μεθοδολογία που βασίζεται σε τυχαία δείγματα που επιτρέπουν οπτικά τη διάκριση αυτή μεταξύ των διαφόρων τύπων συμπεριφοράς στην ουρά. Αυτή η μεθοδολογία χρησιμοποιεί δέσμες συναρτήσεων υπολειόμενου ποσοστημόριου, που ονομάζονται επίσης συναρτήσεις ζωής υπολειπόμενων ποσοστημορίων, οι οποίες χαρακτηρίζουν πολλούς διαφορετικούς τύπους κατανομών ουρών, τόσο βαριές όσο και μη βαριές ουρές.

Μια μέθοδος για να επιβεβαιώσουμε αν μια κατανομή είναι κατανομή νόμου δύναμης ελέγχει πολλές ορθογώνιες προβλέψεις ενός συγκεκριμένου είδους παραγωγικόυ μηχανισμόυ έναντι στα δεδομένα. Απλά η αντιστοίχιση μιας σχέσης νόμου δύναμης σε ένα συγκεκριμένο είδος δεδομένων δεν θεωρείται ορθολογική προσέγγιση. Ως εκ τούτου, η επιβεβαίωση των ισχυρισμών της κατανομής νόμου δύναμης παραμένει ένας πολύ δραστήριος τομέας της έρευνας σε πολλούς τομείς της σύγχρονης επιστήμης.[5]

Δείτε επίσης Επεξεργασία

Αναφορές Επεξεργασία

  1. 1,0 1,1 Newman, M. E. J. (2005). «Power laws, Pareto distributions and Zipf's law». Contemporary Physics 46 (5): 323–351. doi:10.1080/00107510500052444. Bibcode2005ConPh..46..323N. 
  2. Humphries NE, Queiroz N, Dyer JR, Pade NG, Musyl MK, Schaefer KM, Fuller DW, Brunnschweiler JM, Doyle TK, Houghton JD, Hays GC, Jones CS, Noble LR, Wearmouth VJ, Southall EJ, Sims DW (2010). «Environmental context explains Lévy and Brownian movement patterns of marine predators». Nature 465 (7301): 1066–1069. doi:10.1038/nature09116. PMID 20531470. Bibcode2010Natur.465.1066H. 
  3. 3,0 3,1 3,2 Klaus A, Yu S, Plenz D (2011). Zochowski, Michal, επιμ. «Statistical Analyses Support Power Law Distributions Found in Neuronal Avalanches». PLoS ONE 6 (5): e19779. doi:10.1371/journal.pone.0019779. PMID 21720544. PMC 3102672. Bibcode2011PLoSO...619779K. http://www.plosone.org/article/info%3Adoi%2F10.1371%2Fjournal.pone.0019779. 
  4. Albert, J. S.· Reis, R. E., επιμ. (2011). Historical Biogeography of Neotropical Freshwater Fishes. Berkeley: University of California Press. 
  5. 5,0 5,1 5,2 5,3 5,4 Clauset, Shalizi & Newman 2009.
  6. «[cond-mat/0412004] Power laws, Pareto distributions and Zipf's law». arxiv.org. 
  7. 7,0 7,1 9na CEPAL Charlas Sobre Sistemas Complejos Sociales (CCSSCS): Leyes de potencias, http://www.youtube.com/watch?v=4uDSEs86xCI
  8. G. Neukum and B. A. Ivanov, Crater size distributions and impact probabilities on Earth from lunar, terrestrial-planet, and asteroid cratering data. In T. Gehrels (ed.), Hazards Due to Comets and Asteroids, pp. 359–416, University of Arizona Press, Tucson, AZ (1994).
  9. Malcolm Gladwell (2006), Million-Dollar Murray; http://gladwell.com/million-dollar-murray/ Αρχειοθετήθηκε 2015-03-18 στο Wayback Machine.
  10. Sornette 2006.
  11. Simon 1955.
  12. Andriani, P., & McKelvey, B. (2007). Beyond Gaussian averages: redirecting international business and management research toward extreme events and power laws. Journal of International Business Studies, 38(7), 1212–1230. doi:10.1057/palgrave.jibs.8400324
  13. Reed W.J.; Hughes B.D. From gene families and genera to incomes and internet file sizes: Why power laws are so common in nature. Phys Rev E 2002, 66, 067103; http://www.math.uvic.ca/faculty/reed/PhysRevPowerLawTwoCol.pdf
  14. 14,0 14,1 "Hilbert, M. (2013), Scale-free power-laws as interaction between progress and diffusion.", Martin Hilbert (2013), Complexity (journal), doi: 10.1002/cplx.21485; free access to the article through this link: martinhilbert.net/Powerlaw_ProgressDiffusion_Hilbert.pdf
  15. Bolmatov, D.; Brazhkin, V. V.; Trachenko, K. (2013). «Thermodynamic behaviour of supercritical matter». Nature Communications 4. doi:10.1038/ncomms3331. 
  16. . "Afterglow Light Curves and Broken Power Laws: A Statistical Study". Ανακτήθηκε στις 2013-07-07.
  17. . "POWER-LAW DISTRIBUTIONS IN EMPIRICAL DATA". Ανακτήθηκε στις 2013-07-07.
  18. «Curved-power law». Αρχειοθετήθηκε από το πρωτότυπο στις 8 Φεβρουαρίου 2016. Ανακτήθηκε στις 7 Ιουλίου 2013. 
  19. Kendal WS & Jørgensen B (2011) Taylor's power law and fluctuation scaling explained by a central-limit-like convergence. Phys. Rev. E 83,066115
  20. Kendal WS & Jørgensen BR (2011) Tweedie convergence: a mathematical basis for Taylor's power law, 1/f noise and multifractality. Phys. Rev E 84, 066120
  21. Beirlant, J., Teugels, J. L., Vynckier, P. (1996a) Practical Analysis of Extreme Values, Leuven: Leuven University Press
  22. Coles, S. (2001) An introduction to statistical modeling of extreme values. Springer-Verlag, London.
  23. 23,0 23,1 23,2 Diaz, F. J. (1999). «Identifying Tail Behavior by Means of Residual Quantile Functions». Journal of Computational and Graphical Statistics 8 (3): 493–509. doi:10.2307/1390871. 
  24. Resnick, S. I. (1997) "Heavy Tail Modeling and Teletraffic Data", The Annals of Statistics, 25, 1805–1869.
  25. Jeong, H; Tombor, B. Albert; Oltvai, Z.N.; Barabasi, A.-L. (2000). «The large-scale organization of metabolic networks». Nature 407 (6804): 651–654. doi:10.1038/35036627. PMID 11034217. Bibcode2000Natur.407..651J. 
  26. Arnold, B. C., Brockett, P. L. (1983) "When does the βth percentile residual life function determine the distribution?", Operations Research 31 (2), 391–396.
  27. Joe, H., Proschan, F. (1984) "Percentile residual life functions", Operations Research 32 (3), 668–678.
  28. Joe, H. (1985), "Characterizations of life distributions from percentile residual lifetimes", Ann. Inst. Statist. Math. 37, Part A, 165–172.
  29. Csorgo, S., Viharos, L. (1992) "Confidence bands for percentile residual lifetimes", Journal of Statistical Planning and Inference 30, 327–337.
  30. Schmittlein, D. C., Morrison, D. G. (1981), "The median residual lifetime: A characterization theorem and an application", Operations Research 29 (2), 392–399.
  31. Morrison, D. G., Schmittlein, D. C. (1980) "Jobs, strikes, and wars: Probability models for duration", Organizational Behavior and Human Performance 25, 224–251.
  32. Gerchak, Y. (1984) "Decreasing failure rates and related issues in the social sciences", Operations Research 32 (3), 537–546.
  33. Hall, P. (1982). «On Some Simple Estimates of an Exponent of Regular Variation». Journal of the Royal Statistical Society, Series B 44 (1): 37–42. 
  34. 34,0 34,1 34,2 Guerriero, V. (2012). «Power Law Distribution: Method of Multi-scale Inferential Statistics». Journal of Modern Mathematics Frontier (JMMF) 1: 21–28. Αρχειοθετήθηκε από το πρωτότυπο στις 2013-03-21. https://web.archive.org/web/20130321064636/http://www.sjmmf.org/paperInfo.aspx?ID=886. Ανακτήθηκε στις 2015-05-30. 
  35. Mitzenmacher 2004.
  36. Laherrère & Sornette 1998.
  37. Diaz, F. J. (1999). «Identifying Tail Behavior by Means of Residual Quantile Functions». Journal of Computational and Graphical Statistics 8 (3): 493–509. doi:10.2307/1390871. 

Βιβλιογραφία Επεξεργασία

Εξωτερικοί σύνδεσμοι Επεξεργασία