KEGG

Το KEGG Εγκυκλοπαίδεια του Κιότο για τα γονίδια και τα γονιδιώματα είναι μια συλλογή βάσεων δεδομένων που πραγματεύεται τα γονιδιώματα, τις

Το KEGG Εγκυκλοπαίδεια του Κιότο για τα γονίδια και τα γονιδιώματα (Kyoto Encyclopedia of Genes and Genomes) είναι μια συλλογή βάσεων δεδομένων που πραγματεύεται τα γονιδιώματα, τις βιολογικές οδούς, τις ασθένειες, τα φάρμακα και τις χημικές ουσίες. Το KEGG χρησιμοποιείται στην έρευνα και την εκπαίδευση της βιοπληροφορικής, περιλαμβανομένης της ανάλυσης δεδομένων στη γονιδιωματική, τη μεταγονιδιωματική, τη μεταβολομική και άλλα ωμικά πεδία, καθώς και των προτύπων και των προσομοιώσεων στη βιολογία συστημάτων και στη μεταγραφική έρευνα στην ανάπτυξη φαρμάκων.

KEGG
Περιεχόμενο
ΠεριγραφήΤο KEGG ή η Εγκυκλοπαίδεια Γονιδίων και Γονιδιωμάτων του Κιότο είναι μια ελεύθερα προσβάσιμη βάση δεδομένων βιομορίων, τα φάρμακα.
ΑντικείμενοΕίναι μια συλλογή χαρτών μονοπατιών που ενσωματώνουν πολλές οντότητες όπως γονίδια, πρωτεΐνες, RNA, χημικές ενώσεις, γλυκάνες και χημικές αντιδράσεις, καθώς και γονίδια ασθενειών και στόχους φαρμάκων, που αποθηκεύονται ως μεμονωμένες καταχωρίσεις στις άλλες βάσεις δεδομένων του KEGG.
ΟργανισμοίΌλοι
Επαφή
Ερευνητικό κέντροΠανεπιστήμιο του Κιότο
ΕργαστήριοKanehisa Laboratories
Πρώτη αναφορά10592173
Ημερομηνία έκδοσης1995
Πρόσβαση
Ιστοσελίδαwww.kegg.jp
URL υπηρεσίας ιστούREST δείτε KEGG API
Εργαλεία
Διαδικτυακή εφαρμογήKEGG Mapper
Διάφορα
ΆδειαCreative commons
Συνδέσεις
  • GenomeNet
  • DBGET/LinkDB

Εισαγωγή Επεξεργασία

Το έργο της βάσης δεδομένων KEGG ξεκίνησε το 1995 από τον Minoru Kanehisa, καθηγητή στο Ίδρυμα Χημικής Έρευνας, στο Πανεπιστήμιο του Κιότο, κάτω από το συνεχιζόμενο τότε ιαπωνικό έργο του ανθρώπινου γονιδιώματος.[1][2] Προβλέποντας την ανάγκη μιας υπολογιστικής πηγής που μπορεί να χρησιμοποιηθεί για βιολογική ερμηνεία των δεδομένων της αλληλουχίας του γονιδιώματος, ξεκίνησε την ανάπτυξη της βάσης δεδομένων KEGG PATHWAY. Είναι μια συλλογή χειροκίνητα ληφθείσες χαρτογραφήσεις οδών KEGG που αντιπροσωπεύουν την πειραματική γνώση στον μεταβολισμό και διάφορες άλλες λειτουργίες του κυττάρου και του οργανισμού. Κάθε χαρτογράφηση οδού περιέχει ένα πλέγμα μοριακών αλληλεπιδράσεων και αντιδράσεων και είναι σχεδιασμένη να συνδέσει τα γονίδια του γονιδιώματος με γονιδιακά προϊόντα (κυρίως πρωτεΐνες) της οδού. Αυτό έχει ενεργοποιήσει την ανάλυση που λέγεται χαρτογράφηση οδού KEGG, όπου το περιεχόμενο του γονιδίου στο γονιδίωμα συγκρίνεται με τη βάση δεδομένων KEGG PATHWAY για να εξετάσει ποιες οδοί και συσχετισμένες λειτουργίες είναι πιθανόν να είναι κωδικοποιημένες στο γονιδίωμα.

Σύμφωνα με τους ερευνητές, το KEGG είναι μια "αναπαράσταση του υπολογιστή" για το βιολογικό σύστημα.[3] Ενσωματώνει δομικές μονάδες και διαγράμματα συνδέσεων του συστήματος — πιο συγκεκριμένα, γενετικές δομικές μονάδες από γονίδια και πρωτεΐνες, χημικές δομικές μονάδες μικρών μορίων και αντιδράσεων, καθώς και διαγράμματα σύνδεσης αλληλεπιδράσεων και αντιδράσεων πλεγμάτων. Αυτή η ιδέα πραγματοποιείται στις παρακάτω βάσεις δεδομένων του KEGG, που κατηγοριοποιούνται σε συστημικές, γονιδιωματικές, χημικές πληροφορίες καθώς και σε πληροφορίες υγείας.[4]

  • Συστημικές πληροφορίες
    • PATHWAY — χάρτες οδών για κυτταρικές και οργανισμικές λειτουργίες
    • MODULE — δομικές και λειτουργικές μονάδες των γονιδίων
    • BRITE — ιεραρχικές ταξινομήσεις των βιολογικών οντοτήτων
  • Γονιδιωματικές πληροφορίες
  • Χημικές πληροφορίες
  • Πληροφορίες υγείας
    • DISEASE — ανθρώπινες ασθένειες
    • DRUG — εγκεκριμένα φάρμακα
    • ENVIRON — ακατέργαστα φάρμακα και ουσίες σχετικές με την υγεία

Βάσεις δεδομένων Επεξεργασία

Πληροφορίες συστημάτων Επεξεργασία

Η βάση δεδομένων KEGG PATHWAY, η βάση δεδομένων των διαγραμμάτων σύνδεσης, είναι ο πυρήνας της πηγής του KEGG. Είναι μια συλλογή χαρτών οδών που ενσωματώνει πολλές οντότητες που περιλαμβάνουν γονίδια, πρωτεΐνες, RNAs, χημικές ενώσεις, γλυκάνες και χημικές αντιδράσεις, καθώς και γονίδια ασθενειών και στοχευμένα φάρμακα, τα οποία αποθηκεύονται ως μεμονωμένες καταχωρίσεις στις άλλες βάσεις δεδομένων του KEGG. Οι χάρτες οδών ταξινομούνται στις παρακάτω ενότητες:

Η ενότητα μεταβολισμού περιέχει αισθητικά ληφθέντες γενικούς χάρτες που εμφανίζουν μια γενική εικόνα του μεταβολισμού, επιπρόσθετα από τους κανονικούς χάρτες μεταβολικών οδών. Μπορούν να χρησιμοποιηθούν γενικοί χάρτες χαμηλής ανάλυσης, παραδείγματος χάρη, για να συγκριθούν οι μεταβολικές δυνατότητες διάφορων οργανισμών στις γονιδιωματικές μελέτες και σε διάφορα περιβαλλοντικά δείγματα σε μεταγονιδιωματικές μελέτες. Αντίθετα οι μονάδες KEGG στη βάση δεδομένων KEGG MODULE είναι μεγαλύτερης ανάλυσης, τοπικά διαγράμματα συνδέσεων, που παριστάνουν πιο στενές λειτουργικές μονάδες μέσα σε έναν χάρτη οδού, όπως οι διατηρούμενες υποοδοί μεταξύ ειδικών ομάδων οργανισμών και μοριακών συμπλόκων. Οι μονάδες KEGG ορίζονται ως χαρακτηριστικά σύνολα γονιδίων που μπορούν να συνδεθούν σε ειδικές μεταβολικές δυνατότητες και σε άλλα φαινοτυπικά γνωρίσματα, έτσι ώστε να μπορούν να χρησιμοποιηθούν για αυτόματη ερμηνεία των δεδομένων του γονιδιώματος και του μεταγονιδιώματος.

Μια άλλη βάση δεδομένων που συμπληρώνει το KEGG PATHWAY είναι η KEGG BRITE. Είναι μια βάση δεδομένων οντολογίας που περιέχει ιεραρχικές ταξινομήσεις διαφόρων οντοτήτων που περιλαμβάνουν γονίδια, πρωτεΐνες, οργανισμούς, ασθένειες και χημικές ενώσεις. Ενώ η KEGG PATHWAY περιορίζεται στις μοριακές αλληλεπιδράσεις και αντιδράσεις αυτών των οντοτήτων, η KEGG BRITE ενσωματώνει πολλούς διαφορετικούς τύπους σχέσεων.

Γονιδιωματικές πληροφορίες Επεξεργασία

Αρκετούς μήνες μετά την έναρξη του έργου KEGG το 1995, δημοσιεύτηκε η πρώτη αναφορά για την πλήρη αλληλουχία γονιδιώματος βακτηρίων.[5] Από τότε όλα τα δημοσιευμένα πλήρη γονιδιώματα συλλέγονται στο KEGG και για ευκαρυωτικά κύτταρα και για προκαρυωτικά κύτταρα. Η βάση δεδομένων KEGG GENES περιέχει πληροφορίες επιπέδου γονιδίου/πρωτεΐνης και η βάση δεδομένων KEGG GENOME περιέχει πληροφορίες επιπέδου οργανισμού για αυτά τα γονιδιώματα. Η βάση δεδομένων KEGG GENES αποτελείται από σύνολα γονιδίων για τα πλήρη γονιδιώματα και τα γονίδια σε κάθε σύνολο δίνονται ως σχόλιο με τη μορφή των αντιστοιχιών γνωστοποίησης προς τα διαγράμματα σύνδεσης των χαρτών οδών του KEGG, των μονάδων KEGG και των ιεραρχιών BRITE.

Αυτές οι αντιστοιχίες γίνονται χρησιμοποιώντας την έννοια των ορθολόγων. Οι χάρτες οδών του KEGG σχεδιάζονται με βάσει την πειραματικά στοιχεία σε συγκεκριμένους οργανισμούς, αλλά σχεδιάζονται ώστε να είναι εφαρμόσιμοι και σε άλλους οργανισμούς, επειδή διαφορετικοί οργανισμοί, όπως ο άνθρωπος και το ποντίκι, μοιράζονται συχνά ταυτόσημες οδούς που αποτελούνται από λειτουργικά ταυτόσημα γονίδια που λέγονται ορθολογικά γονίδια ή ορθόλογα. Όλα τα γονίδια στη βάση δεδομένων KEGG GENES ομαδοποιούνται σε τέτοια ορθόλογα στη βάση δεδομένων KEGG ORTHOLOGY (KO). Λόγω των κόμβων (γονιδιακών προϊόντων) των χαρτών οδού του KEGG, καθώς και των μονάδων KEGG και των ιεραρχιών BRITE, δίνονται αναγνωριστικά KO, οι αντιστοιχίες αναγνωρίζονται μόλις τα γονίδια στο γονιδίωμα σημειωθούν με αναγνωριστικά KO από τη διεργασία γονιδιωματικού σχολιασμού στο KEGG.[4]

Χημικές πληροφορίες Επεξεργασία

Οι χάρτες μεταβολικής οδού του KEGG σχεδιάζονται ώστε να αναπαριστάνουν τις διπλές όψεις του μεταβολικού πλέγματος: το γονιδιωματικό πλέγμα του τρόπου σύνδεσης των γονιδιωματικά κωδικοποιημένων ενζύμων ώστε να καταλύουν διαδοχικές αντιδράσεις και το χημικό πλέγμα των χημικών δομών του υποστρώματος και των προϊόντων που μετασχηματίζονται από αυτές τις αντιδράσεις.[6] Ένα σύνολο ενζυμικών γονιδίων στο γονιδίωμα θα ταυτοποιήσει τα πλέγματα της ενζυμικής σχέσης όταν υπερτίθεται στους χάρτες οδού KEGG, που με τη σειρά τους χαρακτηρίζουν τα πλέγματα μετασχηματισμού της χημικής δομής επιτρέποντας την ερμηνεία των βιοσυνθετικών και των βιοαποσυνθετικών δυναμικών του οργανισμού. Εναλλακτικά, ένα σύνολο μεταβολιτών ταυτοποιημένων στο μεταβολίτωμα θα οδηγήσει στην κατανόηση των εμπλεκόμενων ενζυματικών οδών και γονιδίων.

Οι βάσεις δεδομένων στην κατηγορία χημικές πληροφορίες, που συνολικά ονομάζονται KEGG LIGAND, είναι οργανωμένοι παίρνοντας τη γνώση από το χημικό δίκτυο. Στην αρχή του έργου KEGG, το KEGG LIGAND αποτελείτο από τρεις βάσεις δεδομένων: KEGG COMPOUND για χημικές ενώσεις, KEGG REACTION για χημικές αντιδράσεις και KEGG ENZYME για αντιδράσεις στην ενζυμική ορολογία.[7] Τώρα, υπάρχουν τρεις επιπλέον βάσεις δεδομένων: KEGG GLYCAN για τις γλυκάνες[8] και δύο βοηθητικές βάσεις δεδομένων αντιδράσεων που ονομάζονται RPAIR (στοιχίσεις ζεύγους αντιδρώντων (reactant pair alignments)) και RCLASS (τάξη αντίδρασης).[9] Το KEGG COMPOUND έχει επίσης επεκταθεί για να περιέχει διάφορες ενώσεις όπως ξενοβιοτικά (xenobiotics), εκτός από τους μεταβολίτες.

Πληροφορίες για την υγεία Επεξεργασία

Στο KEGG, οι ασθένειες θεωρούνται ως διαταραγμένες καταστάσεις του βιολογικού συστήματος που προκαλούνται από διαταραχές γενετικών και περιβαλλοντικών παραγόντων και τα φάρμακα θεωρούνται ως διαφορετικοί τύποι διαταρακτών.[10] Η βάση δεδομένωνKEGG PATHWAY περιλαμβάνει όχι μόνο τις κανονικές καταστάσεις, αλλά επίσης τις διαταραγμένες καταστάσεις των βιολογικών συστημάτων. Όμως, οι χάρτες οδών των ασθενειών δεν μπορούν να σχεδιαστούν για τις περισσότερες ασθένειες επειδή οι μοριακοί μηχανισμοί δεν είναι καλά κατανοητοί. Μια εναλλακτική προσέγγιση λαμβάνεται στη βάση δεδομένων KEGG DISEASE, που απλά καταλογοποιεί τους γνωστούς γενετικούς και περιβαλλοντικούς παράγοντες των ασθενειών. Αυτοί οι κατάλογοι μπορούν, ενδεχομένως, να οδηγήσουν σε πιο πλήρη διαγράμματα σύνδεσης των ασθενειών.

Η βάση δεδομένων KEGG DRUG περιέχει δραστικά συστατικά των εγκεκριμένων φαρμάκων στην Ιαπωνία, τις ΗΠΑ και την Ευρώπη. Διακρίνονται ανάλογα με τη χημική δομή και/ή τα χημικά συστατικά και συσχετίζονται με τα μόρια του στοχευόμενου φαρμάκου, τα μεταβολίζοντα ένζυμα και άλλες πληροφορίες του πλέγματος των μοριακών αλληλεπιδράσεων στους χάρτες οδών KEGG και τις ιεραρχίες BRITE. Αυτό ενεργοποιεί μια ολοκληρωμένη ανάλυση των φαρμακευτικών αλληλεπιδράσεων με τις γονιδιωματικές πληροφορίες. Τα ακατέργαστα φάρμακα και άλλες ουσίες σχετικές με την υγεία, που είναι εκτός της κατηγορίας των εγκεκριμένων φαρμάκων, αποθηκεύονται στη βάση δεδομένων KEGG ENVIRON. Οι βάσεις δεδομένων στην κατηγορία πληροφοριών υγείας ονομάζονται συλλογικά KEGG MEDICUS, οι οποίες περιλαμβάνουν επίσης οδηγίες χρήσης (package inserts) όλων των εμπορικών φαρμάκων στην Ιαπωνία.

Πρότυπο συνδρομής Επεξεργασία

Τον Ιούλιο του 2011, το KEGG εισήγαγε ένα πρότυπο συνδρομής για την μεταφόρτωση FTP download λόγω των σημαντικών περικοπών της κρατικής χρηματοδότησης. Το KEGG συνεχίζει να είναι ελεύθερα διαθέσιμο μέσω της ιστοσελίδας του, αλλά αυτό το γεγονός έχει προκαλέσει συζητήσεις σχετικά με την βιωσιμότητα των βάσεων δεδομένων της βιοπληροφορικής.[11][12]

Παραπομπές Επεξεργασία

  1. «KEGG: Kyoto Encyclopedia of Genes and Genomes». Nucleic Acids Res 28 (1): 27–30. 2000. doi:10.1093/nar/28.1.27. PMID 10592173. 
  2. Kanehisa M (1997). «A database for post-genome analysis». Trends Genet 13 (9): 375–6. doi:10.1016/S0168-9525(97)01223-7. PMID 9287494. https://archive.org/details/sim_trends-in-genetics_1997-09_13_9/page/375. 
  3. «From genomics to chemical genomics: new developments in KEGG». Nucleic Acids Res 34 (Database issue): D354–7. 2006. doi:10.1093/nar/gkj102. PMID 16381885. 
  4. 4,0 4,1 «Data, information, knowledge and principle: back to metabolism in KEGG». Nucleic Acids Res 42 (Database issue): D199-205. 2014. doi:10.1093/nar/gkt1076. PMID 24214961. 
  5. «Whole-genome random sequencing and assembly of Haemophilus influenzae Rd». Science 269 (5223): 496–512. 1995. doi:10.1126/science.7542800. PMID 7542800. 
  6. Kanehisa M (2013). «Chemical and genomic evolution of enzyme-catalyzed reaction networks». FEBS Lett 587 (17): 2731–7. doi:10.1016/j.febslet.2013.06.026. PMID 23816707. 
  7. «LIGAND database for enzymes, compounds and reactions». Nucleic Acids Res 27 (1): 377–9. 1999. doi:10.1093/nar/27.1.377. PMID 9847234. 
  8. «KEGG as a glycome informatics resource». Glycobiology 16 (5): 63R-70R. 2006. doi:10.1093/glycob/cwj010. PMID 16014746. 
  9. «Modular architecture of metabolic pathways revealed by conserved sequences of reactions». J Chem Inf Model 53 (3): 613–22. 2013. doi:10.1021/ci3005379. PMID 23384306. 
  10. «KEGG for representation and analysis of molecular networks involving diseases and drugs». Nucleic Acids Res 38 (Database issue): D355-60. 2010. doi:10.1093/nar/gkp896. PMID 19880382. 
  11. «The 2012 Nucleic Acids Research Database Issue and the online Molecular Biology Database Collection». Nucleic Acids Res 40 (Database issue): D1-8. 2012. doi:10.1093/nar/gkr1196. PMID 22144685. 
  12. Hayden, EC. «Popular plant database set to charge users». 

Εξωτερικοί σύνδεσμοι Επεξεργασία