Θησαυρός (ανάκτηση πληροφοριών)

Θησαυρός (ανάκτηση πληροφοριών) Αυτό το άρθρο είναι για θησαυρούς που χρησιμοποιούνται για την υποστήριξη ευρετηρίαση, την τοποθέτηση πινακίδων ή αναζήτηση πληροφοριών; για θησαυρούς που χρησιμοποιούνται γενικά/λογοτεχνικές εφαρμογές, δείτε Θησαυρός

Στο πλαίσιο της ανάκτησης πληροφοριών, ένας θησαυρός (στον πληθυντικό: «θησαυροί») είναι μια μορφή ελεγχόμενου λεξιλογίου, που επιδιώκει να υπαγορεύσει σημασιολογική εκδηλώσεις των μεταδεδομένων για την αρχειοθέτηση των αντικειμένων περιεχομένου. Ένας θησαυρός χρησιμεύει για την ελαχιστοποίηση σημασιολογική ασάφεια με την εξασφάλιση της ομοιομορφίας και της συνέπειας στην αποθήκευση και την ανάκτηση των εκδηλώσεων των αντικειμένων περιεχομένου. ANSI / NISO Z39.19-2005 ορίζει ένα αντικείμενο περιεχομένου, όπως «κάθε στοιχείο που πρόκειται να περιγραφεί για την ένταξη σε ένα σύστημα ανάκτησης πληροφοριών, ιστοσελίδα, ή άλλη πηγή πληροφοριών». Ο θησαυρός βοηθά την ανάθεση των προτιμώμενων όρων για την μεταφέρω semantic metadata που σχετίζονται με το αντικείμενο περιεχομένου.

Ένας θησαυρός χρησιμεύει να καθοδηγήσει τόσο ένα ευρετήριο και ψάχνει για την επιλογή του ίδιου προτιμώμενος όρος ή συνδυασμό των προτιμώμενων όρων για να αντιπροσωπεύουν ένα συγκεκριμένο θέμα. ISO 25964, το διεθνές πρότυπο για θησαυρών ανάκτηση πληροφοριών, ορίζει ένα θησαυρό ως «ελεγχόμενο και δομημένο λεξιλόγιο στο οποίο οι έννοιες που αντιπροσωπεύονται από τους όρους, είναι οργανωμένη έτσι ώστε οι σχέσεις μεταξύ των εννοιών γίνονται σαφείς, και οι προτιμώμενους όρους συνοδεύεται από μόλυβδο σε εγγραφές για συνώνυμα ή οιονεί συνώνυμα. Ένας θησαυρός αποτελείται από τουλάχιστον τρία στοιχεία: 1-μια λίστα από λέξεις (ή όροι), 2-η σχέση ανάμεσα στις λέξεις (ή όροι), που υποδεικνύεται από την ιεραρχική σχέση με τη θέση τους (π.χ. γονέας / ευρύτερος όρος? Παιδιού / στενότερο όρο , συνώνυμο, κλπ), 3-ένα σύνολο κανόνων σχετικά με το πώς να χρησιμοποιήσετε το θησαυρό.

Ιστορία Επεξεργασία

Όπου υπήρξαν μεγάλες συλλογές των πληροφοριών, είτε σε έντυπη είτε σε υπολογιστές, οι μελετητές αντιμετώπισαν μια πραγματική πρόκληση για τον εντοπισμό των αντικειμένων που επιδιώκουν. Η χρήση των συστημάτων ταξινόμησης για να οργανώσει τα έγγραφα, ώστε ήταν μόνο μια μερική λύση. Μια άλλη προσέγγιση ήταν να δείκτη του περιεχομένου των εγγράφων, χρησιμοποιώντας λέξεις ή όρους, παρά τους κωδικούς ταξινόμησης. Στη δεκαετία του 1940 και του 1950 μερικοί πρωτοπόροι, όπως Calvin Mooers, Charles L. Bernier, Evan J. Crane και Hans Peter Luhn, συγκεντρώθηκαν μέχρι όροι δείκτη τους σε διάφορα είδη του καταλόγου που ονομάζεται «θησαυρό» (κατ 'αναλογία με το καλά γνωστό θησαυρό που αναπτύχθηκε από τον Peter Ροζέ). η πρώτη τέτοια λίστα θέσει σοβαρά να χρησιμοποιήσει στην ανάκτηση πληροφοριών ήταν ο θησαυρός που αναπτύχθηκε το 1959 στην εταιρεία EI Dupont de Nemours Company.

Οι δύο από αυτές τις λίστες πρώτα να δημοσιευθεί ήταν ο Θησαυρός Αστεία περιγραφείς (1960) και το Χημικών Μηχανικών Θησαυρός του Αμερικανικού Ινστιτούτου Χημικών Μηχανικών (1961), απόγονος του θησαυρού Dupont. Περισσότερα ακολούθησαν, με αποκορύφωμα την επιρροή Θησαυρός της Μηχανικής και Επιστημονικών Όρων (TEST) που δημοσιεύθηκε από κοινού από το Κοινό Συμβούλιο Μηχανικών και το Υπουργείο Άμυνας των ΗΠΑ το 1967 TEST έκανε πολύ περισσότερα από απλώς να χρησιμεύσει ως ένα παράδειγμα? Παράρτημα του 1 παρουσίασε τους κανόνες Θησαυρός και συμβάσεις που έχουν γνώμονα την κατασκευή θησαυρό από τότε. Εκατοντάδες θησαυρών έχουν παραχθεί από τότε, ίσως χιλιάδες. Οι πιο αξιοσημείωτες καινοτομίες από TEST έχουν: (a) Επέκταση από μονόγλωσσα πολύγλωσσο ικανότητα; και (b) προσθήκη ενός εννοιολογικά οργανωμένη εμφάνιση στη βασική αλφαβητική παρουσίαση.

Εδώ αναφέρουμε μόνο μερικά από τα εθνικά και διεθνή πρότυπα που έχουν χτίσει σταθερά για τους βασικούς κανόνες που ορίζονται στο TEST:

  • UNESCO Κατευθυντήριες Οδηγίες για τη δημιουργία και την ανάπτυξη των μονόγλωσσα θησαυρών. 1970 (ακολουθούμενη από μεταγενέστερες εκδόσεις το 1971 και το 1981)
  • DIN 1463 Κατευθυντήριες γραμμές για τη δημιουργία και την ανάπτυξη των μονόγλωσσα θησαυρών. 1972 (ακολουθούμενη από μεταγενέστερες εκδόσεις)
  • ISO 2788 για τη δημιουργία και την ανάπτυξη των μονόγλωσσα θησαυρών. 1974 (αναθεωρημένο 1986)
  • ANSI Αμερικανικό Εθνικό Πρότυπο για την Θησαυρός Δομή, Κατασκευή και Χρήση. 1974 (αναθεωρήθηκε το 1980 και αντικαταστάθηκε από το πρότυπο ANSI / NISO Z39.19-1993)
  • ISO 5964 για τη δημιουργία και την ανάπτυξη των πολύγλωσσων θησαυρών. 1985
  • ANSI/NISO Z39.19 Κατευθυντήριες γραμμές για την κατασκευή, τη μορφή, και τη διαχείριση των μονόγλωσσα θησαυρών. 1993 (αναθεωρήθηκε το 2005 και μετονομάστηκε σε κατευθυντήριες γραμμές για την κατασκευή, τη μορφή, και τη διαχείριση των μονόγλωσσα ελεγχόμενα λεξιλόγια.)
  • ISO 25964 Θησαυροί και η διαλειτουργικότητα με άλλα λεξιλόγια. Μέρος 1 (Θησαυροί για την ανάκτηση πληροφοριών που δημοσιεύθηκε 2011; Μέρος 2 (διαλειτουργικότητα με άλλα λεξιλόγια) που δημοσιεύθηκε το 2013.

Η πιο ευδιάκριτη τάση σε όλη αυτή την ιστορία της ανάπτυξης του θησαυρού ήταν από το πλαίσιο της απομόνωσης μικρής κλίμακας σε ένα δικτυωμένο κόσμο. Η πρόσβαση σε πληροφορίες κυρίως ενισχύεται όταν θησαυροί διέσχισε το χάσμα μεταξύ μονόγλωσσα και πολύγλωσσα εφαρμογές. Πιο πρόσφατα, όπως μπορεί να δει κανείς από τους τίτλους της τελευταίας ISO και τα πρότυπα NISO, υπάρχει μια αναγνώριση ότι οι θησαυροί πρέπει να εργαστεί στο λουρί με άλλες μορφές του λεξιλογίου ή την οργάνωση της γνώσης του συστήματος, όπως είναι τα συστήματα τίτλο θέμα, συστήματα ταξινόμησης, οι ταξινομήσεις και οντολογίες. Η επίσημη ιστοσελίδα για το ISO 25964 δίνει περισσότερες πληροφορίες, συμπεριλαμβανομένου ενός καταλόγου ανάγνωση

Σκοπός Επεξεργασία

Στην ανάκτηση πληροφοριών, ένας θησαυρός μπορεί να χρησιμοποιηθεί ως μια μορφή ελεγχόμενο λεξιλόγιο για να βοηθήσει στην ευρετηρίαση των κατάλληλων μεταδεδομένων για τις πληροφορίες που φέρουν οντότητες. Ένας θησαυρός βοηθά με εκφράζουν τις εκδηλώσεις μιας έννοιας σε ένα καθορισμένο τρόπο, για να βοηθήσουν στη βελτίωση της ακρίβειας και της ανάκλησης. Αυτό σημαίνει ότι οι σημασιολογικές εννοιολογικές εκφράσεις των πληροφοριών που φέρει οντοτήτων είναι ευκολότερο να εντοπίσετε λόγω της ομοιομορφίας της γλώσσας. Επιπροσθέτως, ένας θησαυρός χρησιμοποιείται για τη διατήρηση μια ιεραρχική λίστα των όρων? συνήθως μόνο λέξεις ή φράσεις που δεσμεύεται βοηθήσει το ευρετήριο στο στένεμα των όρων και περιορισμό αμφισημία.

Η Art & Architecture Thesaurus, για παράδειγμα, χρησιμοποιείται από αμέτρητα μουσεία σε όλο τον κόσμο, στον κατάλογο των συλλογών τους. AGROVOC, ο θησαυρός του Οργανισμού Τροφίμων και Γεωργίας του ΟΗΕ, χρησιμοποιείται για δείκτη και / ή να αναζητήσετε AGRIS βάση δεδομένων της παγκόσμιας βιβλιογραφίας για τη γεωργική έρευνα.

Δομή Επεξεργασία

Οι θησαυροί ανάκτησης πληροφοριών επίσημα οργανωμένη έτσι ώστε οι υφιστάμενες σχέσεις μεταξύ των εννοιών γίνονται σαφείς. Για παράδειγμα, «εσπεριδοειδή» θα μπορούσε να συνδεθεί με την ευρύτερη έννοια της "καρπούς", και τις στενότερες αυτές του "πορτοκάλια", "λεμόνια", κ.λπ. Όταν οι όροι εμφανίζονται σε απευθείας σύνδεση, οι συνδέσεις μεταξύ τους να είναι πολύ εύκολο να σερφ γύρω από το θησαυρό, επιλέγοντας χρήσιμη όρους για την αναζήτηση. Όταν ένας μόνο όρος θα μπορούσε να έχει περισσότερες από μία έννοια, όπως τραπέζια (έπιπλα) ή πίνακες (δεδομένα), αυτά παρατίθενται ξεχωριστά έτσι ώστε ο χρήστης μπορεί να επιλέξει ποια έννοια για να αναζητήσετε και να αποφύγει την ανάκτηση άσχετα αποτελέσματα. Για κάθε έννοια ένα, όλα τα γνωστά συνώνυμα που αναφέρονται, όπως η «νόσος των τρελών αγελάδων", "σπογγώδης εγκεφαλοπάθεια των βοοειδών", "ΣΕΒ", κ.λπ. Η ιδέα είναι να καθοδηγήσει όλα τα ευρετήρια και όλους τους ερευνητές να χρησιμοποιούν τον ίδιο όρο για η ίδια έννοια, έτσι ώστε τα αποτελέσματα της αναζήτησης θα είναι όσο το δυνατόν πληρέστερο. Εάν ο θησαυρός είναι πολύγλωσσο, οι ισοδύναμοι όροι στις άλλες γλώσσες φαίνεται πάρα πολύ. Ακολουθώντας τα διεθνή πρότυπα, οι έννοιες είναι γενικά οργανώνονται ιεραρχικά μέσα σε έδρες ή ομαδοποιούνται με θέματα ή θέματα. Σε αντίθεση με τη γενική θησαυρός που χρησιμοποιείται για λογοτεχνικούς σκοπούς, πληροφορίες θησαυροί ανάκτησης συνήθως επικεντρώνονται σε μια πειθαρχία, θέμα ή τομέα σπουδών.

Δείτε επίσης Επεξεργασία

Αναφορές Επεξεργασία

  • 1. ANSI & NISO 2005, Guidelines for the Construction, Format, and Management of Monolingual Controlled Vocabularies, NISO, Maryland, U.S.A, p.11
  • 2. ANSI & NISO 2005, Guidelines for the Construction, Format, and Management of Monolingual Controlled Vocabularies, NISO, Maryland, U.S.A, p.12
  • 3. Roberts, N. The pre-history of the information retrieval thesaurus. Journal of Documentation, 40(4), 1984, p.271-285.
  • 4. Aitchison, J. and Dextre Clarke, S. The thesaurus: a historical viewpoint, with a look to the future. Cataloging & Classification Quarterly, 37 (3/4), 2004, p.5-21.
  • 5. Krooks, D.A. and Lancaster, F.W. The evolution of guidelines for thesaurus construction. Libri, 43(4), 1993, p.326-342.
  • 6. Dextre Clarke, Stella G. and Zeng, Marcia Lei. From ISO 2788 to ISO 25964: the evolution of thesaurus standards towards interoperability and data modeling Information standards quarterly, 24(1), 2012, p.20-26.
  • 7. ISO 25964 – the international standard for thesauri and interoperability with other vocabularies. National Information Standards Organization, 2013.


Εξωτερικοί σύνδεσμοι Επεξεργασία