Open Archives Initiative Protocol for Metadata Harvesting

Το Open Archives Initiative Protocol for Metadata Harvesting (OAI-PMH) είναι ένα πρωτόκολλο που αναπτύχθηκε από την Open Archives Initiative (Πρωτοβουλία Ανοικτών Αρχείων) για την ανταλλαγή μεταδεδομένων. Επιτρέπει τη δημιουργία και την αυτόματη ενημέρωση κεντρικών αποθετηρίων όπου μπορούν να αναζητηθούν ταυτόχρονα μεταδεδομένα από διάφορες πηγές. Χρησιμοποιήθηκε ιδίως από τα Ανοικτά Αρχεία και τα ιδρυματικά αποθετήρια[1] και χρησιμοποιείται πλέον ευρέως σε ιδρύματα πολιτιστικής κληρονομιάς και ιδίως σε βιβλιοθήκες.[2]

Open Archives Initiative Protocol for Metadata Harvesting
ΙστότοποςΕπίσημος ιστότοπος

Το OAI-PMH χρησιμοποιεί τη XML μέσω του HTTP. Η έκδοση 2.0 του πρωτοκόλλου κυκλοφόρησε το 2002- το αρχείο ενημερώθηκε για τελευταία φορά το 2015. Διαθέτει άδεια Creative Commons BY-SA.

Ιστορία Επεξεργασία

Στα τέλη της δεκαετίας του 1990, ο Χέρμπερτ Βαν ντε Σόμπελ (Πανεπιστήμιο της Γάνδης), σε συνεργασία με ερευνητές και βιβλιοθηκονόμους στο Εθνικό Εργαστήριο Λος Άλαμος (ΗΠΑ), οργάνωσε μια συνάντηση για να συζητήσει τις δυσκολίες διαλειτουργικότητας των διακομιστών ηλεκτρονικών εκτυπώσεων και των ψηφιακών αποθετηρίων. Η συνάντηση πραγματοποιήθηκε στη Σάντα Φε του Νέου Μεξικού τον Οκτώβριο του 1999[3]. Ένα από τα κύρια αποτελέσματα της συνάντησης ήταν ο ορισμός μιας διεπαφής που θα επέτρεπε στους διακομιστές ηλεκτρονικών εκτυπώσεων να εκθέτουν τα μεταδεδομένα των εγγράφων που κατέχουν με δομημένο τρόπο, έτσι ώστε άλλα αποθετήρια να μπορούν να εντοπίζουν και να αντιγράφουν τα έγγραφα που τους ενδιαφέρουν. Αυτή η διεπαφή/πρωτόκολλο ονομάστηκε "Σύμβαση Σάντα Φε" [2][4].

Το 2000 διοργανώθηκαν διάφορα σεμινάρια στο Συνέδριο Ψηφιακών Βιβλιοθηκών της ACM [5], στο 1ο Κοινό Συνέδριο Ψηφιακών Βιβλιοθηκών της ACM/IEEE-CS[6][7] και αλλού για την ανταλλαγή ιδεών από το Συνέδριο της Σάντα Φε[8]. Σε αυτά τα σεμινάρια διαπιστώθηκε ότι τα προβλήματα που αντιμετώπιζε η κοινότητα των ηλεκτρονικών εκτυπώσεων τα μοιράζονταν επίσης βιβλιοθήκες, μουσεία, εκδότες εφημερίδων και άλλοι που έπρεπε να μοιράζονται κατανεμημένους πόρους. Για την αντιμετώπιση αυτών των αναγκών, ο Συνασπισμός για τη Δικτυωμένη Πληροφορία [9] and the Digital Library Federation[10] και η Ομοσπονδία Ψηφιακών Βιβλιοθηκών [11] χρηματοδότησαν τη δημιουργία μιας Γραμματείας Open Archives Initiative (OAI), την οποία διαχειρίζονται οι Χέρμπερτ Βαν ντε Σόμπελ και Καρλ Λαγκόζε. Το ΟΑΙ πραγματοποίησε συνάντηση στο Πανεπιστήμιο Κορνέλ (Ίθακα, Νέα Υόρκη) τον Σεπτέμβριο του 2000 για να βελτιώσει τη διεπαφή που αναπτύχθηκε στο συνέδριο της Σάντα Φε [12] . Οι προδιαγραφές βελτιώθηκαν μέσω ηλεκτρονικού ταχυδρομείου.

Η έκδοση 1.0 του OAI-PMH παρουσιάστηκε στο κοινό τον Ιανουάριο του 2001 σε ένα εργαστήριο στην Ουάσινγκτον[13] και σε ένα άλλο τον Φεβρουάριο στο Βερολίνο της Γερμανίας[14]. Μεταγενέστερες αλλαγές στο πρότυπο XML από το W3C απαίτησαν μικρές τροποποιήσεις στο OAI-PMH, με αποτέλεσμα την έκδοση 1.1. Η τρέχουσα έκδοση, 2.0, κυκλοφόρησε τον Ιούνιο του 2002. Περιέχει αρκετές τεχνικές αλλαγές και βελτιώσεις και δεν είναι συμβατή με τις προηγούμενες εκδόσεις[15].

Από το 2001, το CERN, και αργότερα σε συνεργασία με το Πανεπιστήμιο της Γενεύης, διοργανώνει δύο φορές το χρόνο εργαστήρια για τον ΟΑΙ[16], τα οποία με την πάροδο του χρόνου αυξήθηκαν και καλύπτουν τις περισσότερες πτυχές της ανοικτής επιστήμης.

Χρήσεις Επεξεργασία

Ορισμένες εμπορικές μηχανές αναζήτησεως χρησιμοποιούν το OAI-PMH για να εξασφαλίσουν περισσότερους πόρους. Η Google αρχικά συμπεριέλαβε υποστήριξη για το OAI-PMH κατά την έναρξη των sitemaps (χάρτης ιστοτόπου), ωστόσο αποφάσισε να υποστηρίξει μόνο την τυπική μορφή XML Sitemaps τον Μάιο του 2008.[17] Το 2004, η Yahoo! απέκτησε περιεχόμενο από το OAIster (Πανεπιστήμιο του Μίσιγκαν) το οποίο αποκτήθηκε μέσω συγκομιδής μεταδεδομένων με το OAI-PMH. Το Wikimedia χρησιμοποιεί ένα αποθετήριο OAI-PMH για να παρέχει τροφοδοσίες της Βικιπαίδειας και των σχετικών ενημερώσεων του ιστότοπου για μηχανές αναζήτησης και άλλες προσπάθειες μαζικής ανάλυσης/αναδημοσίευσης[18] Ειδικά όταν πρόκειται για χιλιάδες αρχεία που συλλέγονται καθημερινά, το OAI-PMH μπορεί να βοηθήσει στη μείωση της κίνησης του δικτύου και της χρήσης άλλων πόρων κάνοντας σταδιακή συλλογή.[19] Το σύστημα αναζήτησης μεταδεδομένων Mercury της NASA χρησιμοποιεί το OAI-PMH για να ευρετηριάζει χιλιάδες εγγραφές μεταδεδομένων από το Global Change Master Directory (GCMD) κάθε μέρα[20].

Το πρόγραμμα mod_oai χρησιμοποιεί το OAI-PMH για να εκθέσει περιεχόμενο σε ανιχνευτές ιστού που είναι προσβάσιμο από διακομιστές ιστού Apache.

Το OAI-PMH εφαρμόστηκε αργότερα στην κοινή χρήση επιστημονικών δεδομένων[21].

Λογισμικό Επεξεργασία

Το OAI-PMH βασίζεται σε μια δομή πελάτη-εξυπηρετητή, στην οποία οι " συγκομιδές " ζητούν πληροφορίες σχετικά με ενημερωμένα αρχεία από τους παρόχους υπηρεσιών . Τα αιτήματα δεδομένων μπορούν να βασίζονται σε ένα εύρος χρονοσφραγίδων και να περιορίζονται σε ονομαστικά σύνολα που ορίζονται από τον πάροχο. Οι πάροχοι δεδομένων υποχρεούνται να παρέχουν μεταδεδομένα XML σε μορφή Dublin Core και μπορούν επίσης να τα παρέχουν σε άλλες μορφές XML.

Ορισμένα λογισμικά συστήματα υποστηρίζουν το OAI-PMH, όπως το Fedora, το EThOS από τη Βρετανική Βιβλιοθήκη, το GNU EPrints από το Πανεπιστήμιο του Σαουθάμπτον, το Open Journal Systems από το Public Knowledge Project, το Desire2Learn, το DSpace από το MIT, το HyperJournal από το Πανεπιστήμιο της Πίζας, το Digibib από το Digibis, MyCoRe, Koha, Primo, DigiTool, Rosetta και MetaLib από την Ex Libris, ArchivalWare από το PTFS, DOOR [20] από το eLab[22] στο Λουγκάνο της Ελβετίας, panFMP από την ΠΑΝΓΑΙΑ (βιβλιοθήκη δεδομένων),[23] SimpleDL από την Roaring Development και jOAI από το Εθνικό Κέντρο Ατμοσφαιρικής Έρευνας. [24]

Αρχεία Επεξεργασία

Ορισμένα μεγάλα αρχεία υποστηρίζουν το πρωτόκολλο, συμπεριλαμβανομένου του arXiv και του Διακομιστή εγγράφων του CERN.

Παραπομπές Επεξεργασία

  1. Admin. «Home». COAR (στα Αγγλικά). Ανακτήθηκε στις 31 Αυγούστου 2022. 
  2. 2,0 2,1 Marshall Breeding (September 2002). «Understanding the Protocol for Metadata Harvesting of the Open Archives Initiative». Computers in Libraries 22 (8): 24–29. https://librarytechnology.org/document/9944. Ανακτήθηκε στις 2021-02-08. 
  3. Marshall, E. (1999). «Researchers plan free global preprint archive». Science 286 (5441): 887a–887. doi:10.1126/science.286.5441.887a. PMID 10577235. https://www.science.org/doi/10.1126/science.286.5441.887a. 
  4. «The Santa Fe Convention by the Open Archives Initiative». Open Archives Initiative. 15 Φεβρουαρίου 2000. Ανακτήθηκε στις 29 Μαΐου 2022. 
  5. «The Santa Fe Convention of the Open Archives Initiative». dspace.library.uu.nl. Ανακτήθηκε στις 10 Φεβρουαρίου 2021. 
  6. «Proceedings of the first ACM/IEEE-CS joint conference on Digital libraries» (στα αγγλικά). Joint Conference on Digital Libraries (Roanoke, Virginia, United States: ACM Press). 2001. doi:10.1145/379437. ISBN 978-1-58113-345-5. 
  7. Lagoze, Carl; Van de Sompel, Herbert (2001). «The open archives initiative: building a low-barrier interoperability framework» (στα αγγλικά). Proceedings of the First ACM/IEEE-CS Joint Conference on Digital Libraries - JCDL '01 (Roanoke, Virginia, United States: ACM Press): 54–62. doi:10.1145/379437.379449. ISBN 978-1-58113-345-5. http://portal.acm.org/citation.cfm?doid=379437.379449. 
  8. Van de Sompel, Herbert; Lagoze, Carl (2000). «The Santa Fe Convention of the Open Archives Initiative» (στα αγγλικά). D-Lib Magazine 6 (2). doi:10.1045/february2000-vandesompel-oai. ISSN 1082-9873. http://www.dlib.org/dlib/february00/vandesompel-oai/02vandesompel-oai.html. 
  9. «Homepage». Coalition for Networked Information. Ανακτήθηκε στις 29 Μαΐου 2022. 
  10. «Homepage». Digital Library Federation. Ανακτήθηκε στις 29 Μαΐου 2022. 
  11. «Digital Library Federation». DLF (στα Αγγλικά). Ανακτήθηκε στις 1 Σεπτεμβρίου 2022. 
  12. «OAi-tech Meeting, Cornell University, September 7-8 2000». www.openarchives.org. Ανακτήθηκε στις 10 Φεβρουαρίου 2021. 
  13. «The Open Archives Initiative: Open Meeting Renaissance Hotel, Washington DC January 23, 2001». www.openarchives.org. Ανακτήθηκε στις 10 Φεβρουαρίου 2021. 
  14. «The Open Archives Initiative: Open Meeting Staatsbibliothek zu Berlin, Germany February 26, 2001». www.openarchives.org. Ανακτήθηκε στις 10 Φεβρουαρίου 2021. 
  15. Van de Sompel, Herbert; Young, Jeffrey A.; Hickey, Thomas B. (2003). «Using the OAI-PMH ... Differently». D-Lib Magazine 9 (7/8). doi:10.1045/july2003-young. ISSN 1082-9873. http://www.dlib.org/dlib/july03/young/07young.html. 
  16. «OAI11 – CERN-UNIGE Workshop on Innovations in Scholarly Communication». Indico. Ανακτήθηκε στις 10 Φεβρουαρίου 2021. 
  17. «Retiring Support for OAI-PMH in Sitemaps». Google Search Central Blog. 23 Απριλίου 2008. Ανακτήθηκε στις 29 Μαΐου 2022. 
  18. Wikimedia update feed service. Wikimedia Meta-Wiki. http://meta.wikimedia.org/wiki/Wikimedia_update_feed_service. Ανακτήθηκε στις 14 July 2013. 
  19. «OAI Harvesting System». DLXS. Ανακτήθηκε στις 29 Μαΐου 2022. 
  20. R. Devarakonda; G. Palanisamy; J. Green; B. Wilson (2010). «Data sharing and retrieval uses OAI-PMH». Earth Science Informatics (Springer Berlin / Heidelberg) 4 (1): 1–5. doi:10.1007/s12145-010-0073-0. 
  21. Devarakonda, Ranjeet; Palanisamy, Giri; Green, James M.; Wilson, Bruce E. (2011). «Data sharing and retrieval using OAI-PMH» (στα αγγλικά). Earth Science Informatics 4 (1): 1–5. doi:10.1007/s12145-010-0073-0. ISSN 1865-0473. http://link.springer.com/10.1007/s12145-010-0073-0. 
  22. «eLab». Universita della Svizzera italiana (στα Italian). Ανακτήθηκε στις 29 Μαΐου 2022. 
  23. «PANGAEA® Framework for Metadata Portals». panfmp.org. 
  24. «NCAR/joai-project». Github.com. 31 Μαΐου 2022.