Βιβλιοθήκη (υπολογιστές): Διαφορά μεταξύ των αναθεωρήσεων
Περιεχόμενο που διαγράφηκε Περιεχόμενο που προστέθηκε
Χωρίς σύνοψη επεξεργασίας |
Χωρίς σύνοψη επεξεργασίας |
||
Γραμμή 1:
Στην [[επιστήμη υπολογιστών]] καλούμε '''βιβλιοθήκη''' μια συλλογή από έτοιμα [[Διαδικασία (υπολογιστές)|υποπρογράμματα]] που χρησιμοποιείται για την ανάπτυξη λογισμικού. Οι βιβλιοθήκες περιέχουν υποβοηθητικό κώδικα και δεδομένα παρέχοντας υπηρεσίες σε προγράμματα. Αυτό επιτρέπει
το διαμοιρασμό και τη χρήση κώδικα και δεδομένων με [[άρθρωμα (υπολογιστές)|αρθρωτό]] τρόπο. Η έννοια της βιβλιοθήκης είναι αναπόσπαστο τμήμα του [[δομημένος προγραμματισμός|δομημένου προγραμματισμού]] και αναπτύχθηκε παράλληλα με αυτόν.
Μερικά [[εκτελέσιμο (υπολογιστές)|εκτελέσιμα]] είναι προγράμματα και βιβλιοθήκες ταυτόχρονα αλλά οι περισσότερες βιβλιοθήκες δεν είναι εκτελέσιμα. Τα εκτελέσιμα και οι βιβλιοθήκες αναφέρονται το ένα στον κώδικα και τα δεδομένα του άλλου μέσω μιας διαδικασίας που ονομάζεται ''σύνδεση'' και την πραγματοποιεί ο [[συνδέτης]]. Τα σύγχρονα [[λειτουργικό σύστημα|λειτουργικά συστήματα]] παρέχουν βιβλιοθήκες που υλοποιούν την πλειονότητα των υπηρεσιών του συστήματος. Έτσι ο περισσότερος κώδικας που χρησιμοποιούν οι σύγχρονες εφαρμογές παρέχεται από αυτές τις βιβλιοθήκες και δε χρειάζεται να γραφεί από την αρχή για κάθε νέο πρόγραμμα.
== Λειτουργία ==
Ένα αρχείο πηγαίου κώδικα υψηλού επιπέδου γραμμένο σε κάποια γλώσσα μεταγλωτίζεται σε ένα αντίστοιχο αρχείο συμβολικού κώδικα ([[assembly]]) από τον κατάλληλο μεταγλωττιστή. Το προκύπτον αρχείο στη συνέχεια μετασχηματίζεται σε [[αντικειμενικό αρχείο]] [[γλώσσα μηχανής|γλώσσας μηχανής]] από έναν συμβολομεταφραστή ([[assembler]]), μία διαδικασία που μετατρέπει τον κώδικα σε άμεσα εκτελέσιμο από τον επεξεργαστή. Η συμβολική γλώσσα και η γλώσσα μηχανής είναι ίδιου επιπέδου και υπάρχει αμφιμονοσήμαντη αντιστοιχία μεταξύ τους, απλώς η assembly αποτελείται από χαρακτήρες του λατινικού αλφαβήτου και δεκαεξαδικά ψηφία, ώστε να είναι κάπως κατανοητή από τον άνθρωπο, ενώ η γλώσσα μηχανής συντίθεται αποκλειστικά από [[bit]].
Έτσι τελικά σε κάθε αρχείο πηγαίου κώδικα, είτε αυτό είναι αυτόνομο (με σημείο εισόδου εκτέλεσης, π.χ. συνάρτηση main()) είτε όχι (π.χ. αρχείο βιβλιοθήκης), αντιστοιχίζεται ένα αντικειμενικό αρχείο με κώδικα μηχανής (αρχεία *.o στο [[Unix]] και *.obj στα [[Windows]]). Ένα αντικειμενικό αρχείο περιέχει εκτελέσιμο κώδικα, δηλώσεις δεδομένων, έναν πίνακα συμβόλων, όπου ορίζονται τα αναγνωριστικά (ονόματα μεταβλητών, σταθερών ή συναρτήσεων) που εξάγονται από το αρχείο -δηλώνονται δηλαδή σε αυτό- ή εισάγονται στο αρχείο -χρησιμοποιούνται δηλαδή χωρίς να δηλώνονται-, και λοιπές πληροφορίες για το συνδέτη. Ο συνδέτης (linker) συνήθως καλείται αυτόματα αμέσως μετά τον assembler, δέχεται ως είσοδο ένα ή περισσότερα αντικειμενικά αρχεία, τα συνενώνει κατάλληλα και παράγει ένα μοναδικό, τελικό εκτελέσιμο αρχείο. Αυτή η συνένωση που επιτελεί όμως ο συνδέτης δεν αφορά μόνο πολλαπλά αντικειμενικά αρχεία (που προκύπτουν προφανώς από αντίστοιχα πολλαπλά πηγαία αρχεία) της ίδιας εφαρμογής, αλλά επεκτείνεται και στο να "επιλύει αναφορές εισαγόμενων συμβόλων": σαρώνει δηλαδή τον πίνακα συμβόλων κάθε αντικειμενικού αρχείου εισόδου, ανακαλύπτει ποια αναγνωριστικά παρέχονται από κάποια βιβλιοθήκη, αναζητά τον αντικειμενικό κώδικα της βιβλιοθήκης και εισάγει στο τελικό εκτελέσιμο της εφαρμογής τα κατάλληλα τμήματα του. Προκειμένου να επιτύχει τους στόχους του ο συνδέτης, ανάμεσα στ' άλλα, προβαίνει σε ένα πρώτο βήμα "επανατοποθέτησης". Αυτό σημαίνει ότι κάθε τμήμα κώδικα μηχανής που εισάγει και τακτοποιεί στο τελικό εκτελέσιμο αρχείο, είτε είναι από αντικειμενικό αρχείο που έδωσε ως είσοδο στο συνδέτη ο χρήστης είτε από αντικειμενικό αρχείο βιβλιοθήκης, το τροποποιεί κατάλληλα ώστε τελικά όλες οι διευθύνσεις μνήμης εντολών και δεδομένων στο τελικό εκτελέσιμο να είναι συνεπείς μεταξύ τους, να μην επικαλύπτονται και να είναι σχετικές ως προς μία κοινή διεύθυνση βάσης. Αυτό το βήμα είναι απαραίτητο γιατί ο μεταγλωττιστής νωρίτερα είχε δράσει θεωρώντας ξεχωριστό [[χώρος διευθύνσεων|χώρο διευθύνσεων]] για κάθε αντικειμενικό αρχείο με διαφορετικές διευθύνσεις βάσης. Συνήθως, για διευκόλυνση του προγραμματιστή, ο μεταγλωττιστής, ο assembler και ο συνδέτης καλούνται με μία μόνο εντολή και με τη σωστή σειρά -ενώ αν ο προγραμματιστής το επιθυμεί μπορεί περνώντας κάποια κατάλληλη παράμετρο να τροποποιήσει αυτήν τη συμπεριφορά (π.χ. στον μεταγλωττιστή της [[C (γλώσσα προγραμματισμού)|C]] [[gcc]] με την παράμετρο -c παραλείπεται η σύνδεση). Τα αντικειμενικά αρχεία υπακούν σε διάφορα προτυποποιημένα [[φορμά]] τα οποία καθορίζουν τη δομή τους και συνήθως είναι ίδια και για τα τελικά εκτελέσιμα αρχεία. Επιπλέον τα φορμά αυτά είναι ίδια τόσο για τα αυτόνομα εκτελέσιμα όσο και για τις βιβλιοθήκες. Σύνηθες φορμά στα MS Windows είναι το PE ενώ στο Unix το ELF.
Όταν επίκειται το τρέξιμο ενός εκτελέσιμου αρχείου εκτελείται πρώτα ένα κατάλληλο πρόγραμμα του ΛΣ: ο [[φορτωτής]]. Ο τελευταίος αντιγράφει τα περιεχόμενα του εκτελέσιμου από το δίσκο στη μνήμη, δίνει κατάλληλες τιμές σε εσωτερικές δομές του πυρήνα (αφού ουσιαστικά εκκινείται μία νέα διεργασία) και ειδοποιεί σχετικά το υποσύστημα εικονικής μνήμης, ενώ αν το τελευταίο δεν είναι διαθέσιμο, κάτι σπάνιο σήμερα αφού όλα τα μοντέρνα ΛΣ χρησιμοποιούν [[εικονική μνήμη]], τροποποιεί επιπλέον τον κώδικα του προγράμματος με ένα δεύτερο βήμα επανατοποθέτησης που είναι απαραίτητο κάθε φορά που το πρόγραμμα εκτελείται: η διεύθυνση βάσης, ως προς την οποία γίνονται όλες οι αναφορές μνήμης εντός του κώδικα, παίρνει την τιμή της θέσης μνήμης στην οποία πραγματικά φορτώθηκε η πρώτη εντολή του προγράμματος. Αυτή η θέση μνήμης δεν είναι γνωστή πριν από τη φόρτωση (εκτός αν το ΛΣ δεν είναι [[πολυδιεργασία|πολυδιεργασιακό]], όπως το MS-DOS, κάτι σπάνιο σήμερα) οπότε αυτή η επανατοποθέτηση όλου του εκτελέσιμου πρέπει να γίνεται σε κάθε εκτέλεση. Αν όμως το ΛΣ παρέχει υποσύστημα εικονικής μνήμης τότε αυτό το βήμα δεν είναι απαραίτητο, αφού κάθε διεργασία έχει έναν πλήρη, ιδιωτικό χώρο εικονικών διευθύνσεων στη διάθεση της, με το μηχανισμό εικονικής μνήμης του [[πυρήνας (υπολογιστές)|πυρήνα]] να αναλαμβάνει την αντιστοίχιση με τη φυσική μνήμη (αχρηστεύοντας έτσι την επανατοποθέτηση [[χρόνος φόρτωσης|χρόνου φόρτωσης]]). Εν πάσει περιπτώσει, μόλις ο φορτωτής ολοκληρώσει την εργασία του τερματίζεται και η νέα διεργασία είναι έτοιμη προς εκτέλεση. Το πότε θα αρχίσει πραγματικά να εκτελείται είναι θέμα του [[χρονοπρογραμματιστής|χρονοπρογραμματιστή]] του πυρήνα.
== Κατηγορίες ==
Οι βιβλιοθήκες μπορεί να είναι στατικές ή δυναμικές, καθώς και κοινόχρηστες ή μη. Όταν ένα πρόγραμμα καλεί ρουτίνες από στατικές βιβλιοθήκες, ο συνδέτης (ο οποίος συμβουλεύεται κατάλληλα αρχεία ρυθμίσεων ή το ΛΣ για να βρει τις βιβλιοθήκες) ενσωματώνει πραγματικά τον αντικειμενικό τους κώδικα στο εκτελέσιμο που παράγει και επανατοποθετεί κατάλληλα τις διευθύνσεις μνήμης σε [[χρόνος σύνδεσης|χρόνο σύνδεσης]]. Αντίθετα οι δυναμικές βιβλιοθήκες ενσωματώνονται και επανατοποθετούνται στον τελικό κώδικα απευθείας στη μνήμη ενώ το πρόγραμμα εκτελείται, με αποτέλεσμα τα εκτελέσιμα αρχεία να έχουν σαφώς μικρότερο μέγεθος (αφού περιέχουν απλώς οδηγίες προς έναν συνδέτη [[χρόνος εκτέλεσης|χρόνου εκτέλεσης]], που παρέχεται από το ΛΣ, αντί για τον ίδιο τον αντικειμενικό κώδικα των καλούμενων ρουτινών βιβλιοθήκης) αλλά να απαιτείται η μόνιμη παρουσία του αντικειμενικού αρχείου της βιβλιοθήκης στο σύστημα αρχείων προκειμένου να είναι δυνατή η εκτέλεση του προγράμματος. Επίσης οι βιβλιοθήκες -συνήθως οι δυναμικές- μπορεί να είναι κοινόχρηστες, δηλαδή να υπάρχει μόνο ένα αντίγραφο τους το οποίο διαμοιράζεται σε πολλές διεργασίες που τις χρησιμοποιούν ταυτόχρονα. Η κοινοχρησία μπορεί να είναι είτε μόνο στο δίσκο (να υπάρχει δηλαδή ένα μόνο αντικειμενικό αρχείο της βιβλιοθήκης), όπως συμβαίνει με τα αρχεία *.dll στα Windows, είτε και στη μνήμη (να φορτώνεται μόνο μία φορά η βιβλιοθήκη στη RAM και όσα προγράμματα τη χρησιμοποιούν να απεικονίζουν το τμήμα μνήμης που καταλαμβάνει στο χώρο διευθύνσεων τους), όπως συμβαίνει με τα αρχεία *.so στο Unix. Επειδή το φορμά αρχείου των βιβλιοθηκών είναι ίδιο με των αυτόνομων εκτελέσιμων και αντικειμενικών αρχείων, ακόμα κι ένα εκτελέσιμο μπορεί να χρησιμοποιηθεί ως κοινόχρηστη βιβλιοθήκη αρκεί να περιέχει έναν πίνακα συμβόλων για χρήση από το συνδέτη χρόνου εκτέλεσης, με πληροφορίες για τις συναρτήσεις και τις δομές δεδομένων που εξάγει.
Η εξάπλωση του [[αντικειμενοστρεφής προγραμματισμός|αντικειμενοστρεφούς προγραμματισμού]] στις αρχές της δεκαετίας του '90 έκανε επιτακτική την ανάγκη προτυποποίησης ενός φορμά αντικειμενικών αρχείων βιβλιοθηκών που δε θα περιείχαν μεμονωμένες δομές δεδομένων και συναρτήσεις αλλά κλάσεις. Η κληρονομικότητα όμως, έμφυτο και ισχυρό χαρακτηριστικό της αντικειμενοστρέφειας, δυσχαίρενε αυτήν την προσπάθεια αφού για να οριστεί μία μέθοδος (η αντικειμενοστρεφής εκδοχή της συνάρτησης) δεν επαρκεί το πλήρες αναγνωριστικό της και το σημείο εισόδου του κώδικα της, αλλά χρειάζεται και μια λίστα των κλάσεων από τις οποίες κληρονομεί. Παράλληλα την ίδια στιγμή είχαν γίνει δημοφιλή τα [[κατανεμημένη επεξεργασία|κατανεμημένα συστήματα]] λογισμικού, τα οποία επέτρεπαν σε ένα πρόγραμμα να εκτελεί διαφανώς κλήσεις σε απομακρυσμένες συναρτήσεις ο κώδικας των οποίων ήταν τοποθετημένος σε κάποιον άλλον κόμβο ενός δικτύου. Οι ενδιαφερόμενες εταιρίες λοιπόν, περί τα μέσα της δεκαετίας του '90, δημιούργησαν διάφορα φορμά αντικειμενικών αρχείων βιβλιοθηκών κλάσεων, οι μέθοδοι των οποίων μπορούσαν να εκτελεστούν σε διαφορετικά ΛΣ και να προσπελαστούν από διάφορες γλώσσες προγραμματισμού. Συνήθως διατίθονταν σε δύο εκδόσεις: μία απλή και μία κατανεμημένη που υποστήριζε απομακρυσμένη πρόσβαση και κλήση. Το μόνο που επιβίωσε από αυτά τα πρότυπα είναι το COM της [[Microsoft]] (με το DCOM να είναι η κατανεμημένη εκδοχή του). Εξαίρεση αποτέλεσε ο προγραμματιστικός κόσμος της [[Java]] ο οποίος ακολούθησε τον δικό του δρόμο, αφού τα προγράμματα και οι βιβλιοθήκες της Java δε μεταγλωττίζονται σε εγγενή κώδικα μηχανής αλλά σε έναν ενδιάμεσο, κοινό για όλες τις [[αρχιτεκτονική υπολογιστών|αρχιτεκτονικές υπολογιστών]], [[bytecode]] ο οποίος για να τρέξει [[διερμηνευτής|διερμηνεύεται]] σε χρόνο εκτέλεσης από μία Εικονική Μηχανή Java, ένα περιβάλλον εκτέλεσης που τοποθετείται πάνω από το ΛΣ. Στην Java κάθε κλάση μεταγλωττίζεται σε ένα αρχείο *.class με bytecode, αντίστοιχο του αντικειμενικού αρχείου, ενώ ένα αυτόνομο πρόγραμμα είναι απλά μία κλάση που περιέχει μία μέθοδο με όνομα main() ως σημείο εισόδου. Ο συνδέτης και ο φορτωτής είναι τμήματα της Εικονικής Μηχανής Java και καλούνται αυτόματα και δυναμικά όταν επίκειται εκτέλεση ενός αρχείου *.class. Μία συλλογή αρχείων *.class που δεν περιέχουν μεθόδους main(), ουσιαστικά δηλαδή μία βιβλιοθήκη κλάσεων, μπορεί να συνενωθεί σε ένα συμπιεσμένο αρχείο *.jar, το οποίο δεν είναι παρά ένα ανεξάρτητο αρχιτεκτονικής φορμά αρχείων μεταγλωττισμένων (σε bytecode) βιβλιοθηκών κλάσεων.
==Ονομασία==
*[[GNU]]/[[Linux]], [[Solaris λειτουργικό σύστημα|Solaris]] και κλώνοι του [[BSD]]
*[[Mac OS X]] και άνω: Το σύστημα κληρονομεί για τις στατικές βιβλιοθήκες τις συμβάσεις από το [[BSD]], και μπορεί να χρησιμοποιεί και βιβλιοθήκες
*[[Microsoft Windows]]: αρχεία με κατάληξη <code>*.LIB</code> είναι στατικές βιβλιοθήκες και αρχεία με κατάληξη <code>*.DLL</code> είναι
== Δείτε επίσης==
* [[Επαναχρησιμοποίηση κώδικα]]
* [[Συνδέτης]]
* [[Φορτωτής (υπολογιστές)]]
Γραμμή 136 ⟶ 30 :
* [[Αρχείο αντικείμενο]]
* [[Plugin]]
== Εξωτερικοι σύνδεσμοι ==
|