İçeriğe atla

Gen Ontolojisi

Vikipedi, özgür ansiklopedi
(Gen ontolojisi sayfasından yönlendirildi)

Gen Ontolojisi ya da GO, gen ve gen ürünü vasıflarının bütün türler kapsamında temsilini birleştirmek için büyük bir biyoenformatik girişimidir.[1] Proje özellikle şunları hedeflemektedir:

  1. Gen ve gen ürünü vasıflarına dair sahip olduğu denetli söz dağarcığının sürdürülmesi ve geliştirilmesi;
  2. Gen ve gen ürünlerinin notlaması, not verilerinin özümsenmesi ve dağıtılması;
  3. Projenin sağladığı verinin bütün boyutlarına kolayca erişilmesi için ve deneysel verilerin GO kullanarak (zenginleşim analizi gibi yollarla) işlevsel yorumlanabilmesi için araçlar sağlanması.

GO daha geniş bir sınıflandırma çabası olan Açık Biyomedikal Ontolojiler'in (Open Biomedical Ontologies - OBO) bir parçasıdır.[2]

GO terimleri ve ontolojisi

[değiştir | kaynağı değiştir]

Pratik bir bakışla ontoloji, bilgi sahibi olduğumuz bir şeyin temsilidir. "Ontolojiler" tespit edilebilir ya da doğrudan gözlemlenebilir şeylerin ve bu şeyler arasındaki ilişkilerin temsilinden oluşur. Biyoloji ve ilişkili sahalarda evrensel bir standart terminoloji bulunmamaktadır, belirli bir türe özgü, araştırma alanına özgü, hatta belirli bir araştırma grubuna özgü terim kullanımları olabilmektedir. Bu da verilere dair iletişim ve paylaşımı daha zor kılmaktadır. Gen Ontolojisi projesi gen ürünü özelliklerini temsil eden tanımlı terimlerin bir ontolojisini sağlar. Ontoloji üç sahayı kapsar:

  • hücresel bileşen, bir hücrenin ya da hücredışı ortamının parçaları;
  • moleküler işlev, bir gen ürününün moleküler düzeydeki bağlanma ya da enzim katalizi gibi öğesel faaliyetleri;
  • biyolojik süreç, entegre yaşam birimlerinin (hücrelerin, dokuların, organların ve organizmaların) işleyişiyle ilgili, tanımlı bir başlangıcı ve sonu olan işlemler veya moleküler olay kümeleri.

Ontoloji dahilindeki her bir GO teriminin bir terim adı vardır, bu ad şunlardan birisi olabilir: bir sözcük ya da sözcük dizisi; eşsiz bir alfanumerik belirteç; atıflar yapan bir tanımlama; ait olduğu sahayı belirten bir ad-uzamı. Terimlere ait eş-anlamlılar olabilir: bunlar terime tam eşdeğer olarak, daha geniş ya da dar kapsamlı olarak veya terimle ilişkili olarak sınıflanırlar. Yine terimlere ait, başka veritabanlarındaki eşdeğer kavramlara atıflar; terim anlamı ya da kullanımı üzerine yorumlar olabilir. GO ontolojisi bir yönlü-çevrimsiz-çizge olarak yapılanmıştır ve her bir terim, aynı sahaya ait (bazen başka sahalara da ait) bir ya da daha fazla başka terim ile tanımlı ilişkilere sahiptir. GO söz dağarcığı tür-tarafsız olarak tasarlanmıştır ve prokaryotlara, ökaryotlara, tek ya da çok hücreli organizmalara uygulanabilir terimler içermektedir.

GO sabit değildir ve ekleme, düzeltme ve değiştirme önerileri hem araştırma ve notlama topluluğu üyelerinden hem de doğrudan GO projesine dahil olan kişilerden gelir ve yine bu kişilerden istenir. Örneğin, bir notlayıcı bir metabolik patikayı temsil edecek özgül bir terim talep edebilir ya da ontolojinin bir kısmı topluluk uzmanlarının yardımıyla gözden geçirilebilir (örn.[3]). Önerilen düzenlemeler ontoloji editörleri tarafından değerlendirilir ve uygun olduklarında yürürlüğe geçirilir.

GO ontoloji dosyası GO websitesinden[4] farklı dosya biçimleriyle ücretsiz olarak edinilebilir ya da GO tarayıcısını kullanarak çevrimiçi erişilebilir AmiGO9 Ocak 2014 tarihinde Wayback Machine sitesinde arşivlendi.. Gen Ontolojisi projesi ayrıca terimlerinin başka sınıflandırma sistemleriyle eşleştirme dosyalarını da sağlamaktadır.

Örnek GO terimi

[değiştir | kaynağı değiştir]
id:      GO:0000016
name:    lactase activity
namespace: molecular_function
def:     "Catalysis of the reaction: lactose   H2O = D-glucose   D-galactose." [EC:3.2.1.108]
synonym: "lactase-phlorizin hydrolase activity" BROAD [EC:3.2.1.108]
synonym: "lactose galactohydrolase activity" EXACT [EC:3.2.1.108]
xref:    EC:3.2.1.108
xref:    MetaCyc:LACTASE-RXN
xref:    Reactome:20536
is_a:    GO:0004553 ! hydrolase activity, hydrolyzing O-glycosyl compounds

Veri kaynağı:[5]

Genom notlaması bir gen ürününe dair veri yakalama pratiğidir ve GO notlamaları bunun için GO ontolojisindeki terimleri kullanır. GO Konsorsiyumunun üyeleri kendi notlamalarını entegrasyon ve dağıtım için GO websitesine gönderirler, notlamalar bu sitede doğrudan indirilebilirler ya da AmiGO9 Ocak 2014 tarihinde Wayback Machine sitesinde arşivlendi. kullanarak çevrimiçi görüntülenebilirler. Gen ürünü belirteci ve ilgili GO terimine ek olarak, GO notlamalarında şu veriler bulunur:

  • Notlamayı yapmakta kullanılan atıf (örn. bir dergi makalesi)
  • Notlamanın dayandırıldığı kanıt tipini belirten bir kanıt kodu
  • Notlamanın tarihi ve yaratıcısı

Kanıt kodu, hem manüel hem otomatik notlama yöntemlerini kapsayan bir denetli söz dağarcığı olan Kanıt Kodu Ontolojisinden gelir. Örneğin, İzlenebilen Yazar Beyanı (Traceable Author Statement - TAS) bir küratörün yayınlanmış bir bilimsel makaleyi okumuş olduğu ve bu notlamadaki üstverinin bu makaleden bir alıntı taşıdığı anlamına gelir; Dizi Benzerliğinden Çıkarım (Inferred from Sequence Similarity - ISS) bir küratörün bir dizi benzerliği aramasına ait çıktıyı değerlendirmiş ve biyolojik anlam taşıdığını geçerlemiş olduğu anlamına gelir. Otomatik süreçlerden (örn. başka bir notlama söz dağarcığı kullanarak yaratılmış notlamaların yeniden eşleştirilmesi) gelen notlamalara Elektronik Notlamadan Çıkarım (Inferred from Electronic Annotation - IEA) kodu verilir. 1 Nisan 2010 itibarıyla bütün GO notlamalarının �'den fazlası hesaplamalı olarak çıkarsanmıştı, küratörler tarafından değil.[6] Bu notlamalar bir insanın muayenesinden geçmemiş olduğundan, GO Konsorsiyumu bunları daha az güvenilir görmektedir ve AmiGO'da çevrimiçi olarak sunulan verilere bunların yalnızca bir altkümesini dahil etmektedir. Tam notlama veri kümeleri GO websitesinden 26 Kasım 2014 tarihinde Wayback Machine sitesinde arşivlendi. indirilebilir. Notlamanın gelişimini desteklemek için, GO Konsorsiyumu yeni geliştirici gruplara çalışma kampları ve mentorlar sağlamaktadır.

Gen ürünü: Actin, alpha cardiac muscle 1, UniProtKB:P68032
GO terimi: heart contraction ; GO:0060047 (biyolojik süreç)
Kanıt kodu: Mutant Fenotipinden Çıkarım (Inferred from Mutant Phenotype - IMP)
Atıf:    PMID 17611253 2 Haziran 2015 tarihinde Wayback Machine sitesinde arşivlendi.
Atayan:  UniProtKB, 6 Haziran 2008

Veri kaynağı:[7]

GO projesinin sağladığı verileri kullanan, hem çevrimiçi hem de indirerek kullanılabilecek çok sayıda araç bulunmaktadır.[8] Bunların muazzam çoğunluğu üçüncü taraflardan gelir; GO Konsorsiyumu araçlardan iki tanesini geliştirip desteklemektedir, AmiGO ve OBO-Edit.

AmiGO,[9] kullanıcıların ontolojileri ve gen ürünü notlama verilerini sorgulamasına, taramasına ve görselleştirmesine olanak veren web-tabanlı bir uygulamadır. Ayrıca, bir BLAST aracı,[10] daha büyük veri kümelerinin analizine olanak veren araçları,[11][12] ve GO veritabanını doğrudan sorgulamak için bir arayüzü de bulunur.[13]

AmiGO GO Konsorsiyumunun sağladığı verilere erişmek için GO websitesinde çevrimiçi olarak kullanılabilir ya da GO veritabanı şemasına uygun herhangi bir veritabanı üzerinde yerel kullanım için indirilerek kurulum yapılabilir (örn.[14]). Özgür bir açık kaynaklı yazılımdır ve go-dev yazılım dağıtımının bir parçası olarak sunulmaktadır.[15]

OBO-Edit,[16] Gen Ontolojisi Konsorsiyumu tarafından geliştirilip sürdürülen, açık kaynaklı, platformdan-bağımsız ontoloji düzenleyicisidir. Java'da yazılmıştır ve ontolojilerin görüntülenmesi ve düzenlenmesinde çizge-yönelimli bir yaklaşım kullanır. OBO-Edit kapsamlı bir arama ve süzme arayüzü ve terimlerin görsel olarak ayırt edilmesi için altkümeleri çizdirme seçeneği içermektedir; kullanıcı arayüzünü kullanıcı tercihlerine göre özelleştirilmesi de mümkündür. OBO-Edit'te ayrıca açıkça beyan edilmemiş bağlantıları mevcut ilişkilerine ve özelliklerine dayalı olarak çıkarsayabilen bir semantik akıl yürütücü de bulunmaktadır. Biyomedikal ontolojiler için geliştirilmiş olsa da, OBO-Edit herhangi bir ontolojiyi görüntülemek, aramak ve düzenlemek için kullanılabilir. Ücretsiz olarak indirilebilmektedir.[15]

GO Konsorsiyumu

[değiştir | kaynağı değiştir]

GO Konsorsiyumu GO projesine etkin olarak dahil olan biyolojik veritabanlarının ve araştırma gruplarının kümesidir.[17] Bunlar, çeşitli model organizma veritabanlarını, çok-türlü protein veritabanlarını, yazılım geliştirme gruplarını ve tahsis edilmiş editoryal bir büroyu içerir.

Gen ontolojisi başlangıçta üç model organizmanın (Drosophila melanogaster (meyve sineği), Mus musculus (fare) ve Saccharomyces cerevisiae (bira ya da ekmek mayası)) genomunu çalışan araştırmacıların bir konsorsiyumu tarafından 1998'de inşa edildi.[18] Birçok diğer model organizma veritabanları Gen Ontolojisi konsorsiyumuna katılarak, hem notlama verisine katkı yaptılar, hem de verilerin görüntülenmesi ve uygulanması için ontoloji ve araçların geliştirilmesine katkı yaptılar. Şimdiye dek, bitki, hayvan ve mikroorganizmalara ait başlıca veritabanlarının çoğu projeye yönelik katkıda bulundular. Ocak 2008 itibarıyla GO, geniş bir çeşitlilikteki biyolojik organizmalara uygulanabilen 24,500'den fazla terim içermektedir. GO'nun gelişimi ve kullanımı üzerine belirgin bir literatür vücut bulmuştur ve biyoenformatik cephaneliğinde standart bir araç olmuştur. Hedeflerinin üç boyutu vardır: gen ontolojisi oluşturulması, genlere/gen ürünlerine ontoloji ataması yapılması ve bu iki hedefe dönük yazılım ve veritabanları geliştirilmesi.

Ayrıca bakınız

[değiştir | kaynağı değiştir]
  1. ^ The Gene Ontology Consortium (Ocak 2008). "The Gene Ontology project in 2008". Nucleic Acids Res. 36 (Database issue). ss. D440-4. doi:10.1093/nar/gkm883. PMC 2238979 $2. PMID 17984083. 
  2. ^ Smith B, Ashburner M, Rosse C, Bard J, Bug W, Ceusters W, Goldberg LJ, Eilbeck K, Ireland A, Mungall CJ, Leontis N, Rocca-Serra P, Ruttenberg A, Sansone SA, Scheuermann RH, Shah N, Whetzel PL, Lewis S (Kasım 2007). "The OBO Foundry: coordinated evolution of ontologies to support biomedical data integration". Nat. Biotechnol. 25 (11). ss. 1251-5. doi:10.1038/nbt1346. PMC 2814061 $2. PMID 17989687. 
  3. ^ Diehl AD, Lee JA, Scheuermann RH, Blake JA (Nisan 2007). "Ontology development for biological systems: immunology". Bioinformatics. 23 (7). ss. 913-5. doi:10.1093/bioinformatics/btm029. PMID 17267433. 
  4. ^ "Gen Ontolojisi Veritabanı". Gen Ontolojisi Konsorsiyumu. 9 Ocak 2014 tarihinde kaynağından arşivlendi. Erişim tarihi: 26 Kasım 2014. 
  5. ^ GO Konsorsiyumu (16 Mart 2009). "gene_ontology.1_2.obo" (OBO 1.2 düz dosya). 6 Ekim 2015 tarihinde kaynağından arşivlendi. Erişim tarihi: 16 Mart 2009. 
  6. ^ "The what, where, how and why of gene ontology—a primer for bioinformaticians — Brief Bioinform". doi:10.1093/bib/bbr002. 
  7. ^ GO Konsorsiyumu (16 Mart 2009). "AmiGO: P68032 Associations". 5 Kasım 2012 tarihinde kaynağından arşivlendi. Erişim tarihi: 16 Mart 2009. 
  8. ^ Mosquera JL, Sánchez-Pla A (Temmuz 2008). "SerbGO: searching for the best GO tool". Nucleic Acids Res. 36 (Web Server issue). ss. W368-71. doi:10.1093/nar/gkn256. PMC 2447766 $2. PMID 18480123. 
  9. ^ DOI:10.1093/bioinformatics/btn615
  10. ^ "AmiGO BLAST aracı". 20 Ağustos 2011 tarihinde kaynağından arşivlendi. Erişim tarihi: 26 Kasım 2014. 
  11. ^ AmiGO Terim Zenginleşim aracı 7 Nisan 2008 tarihinde Wayback Machine sitesinde arşivlendi.; bir notlama kümesinde paylaşılan belirgin GO terimlerini bulur
  12. ^ AmiGO İnceltici 29 Eylül 2011 tarihinde Wayback Machine sitesinde arşivlendi.; granüler notlamaları üst-düzey terimlere kadar eşleştirir
  13. ^ GOOSE 1 Mart 2009 tarihinde Wayback Machine sitesinde arşivlendi., GO Çevrimiçi SQL Ortamı; GO veritabanına dönük doğrudan SQL sorgulamasına olanak verir
  14. ^ Bitki Ontolojisi Konsorsiyumu (16 Mart 2009). "Bitki Ontolojisi Konsorsiyumu". 18 Ekim 2015 tarihinde kaynağından arşivlendi. Erişim tarihi: 16 Mart 2009. 
  15. ^ a b "SourceForge'da Gen Ontolojisi dosyaları". 8 Mayıs 2009 tarihinde kaynağından arşivlendi. Erişim tarihi: 16 Mart 2009. 
  16. ^ DOI:10.1093/bioinformatics/btm112
  17. ^ "GO Konsorsiyumu". 2 Temmuz 2014 tarihinde kaynağından arşivlendi. Erişim tarihi: 16 Mart 2009. 
  18. ^ Ashburner M, Ball CA, Blake JA, Botstein D, Butler H, Cherry JM, Davis AP, Dolinski K, Dwight SS, Eppig JT, Harris MA, Hill DP, Issel-Tarver L, Kasarskis A, Lewis S, Matese JC, Richardson JE, Ringwald M, Rubin GM, Sherlock G (Mayıs 2000). "Gene ontology: tool for the unification of biology. The Gene Ontology Consortium". Nat. Genet. 25 (1). ss. 25-9. doi:10.1038/75556. PMC 3037419 $2. PMID 10802651. 

Dış bağlantılar

[değiştir | kaynağı değiştir]
  • Gen Ontolojisi Konsorsiyumu 26 Kasım 2014 tarihinde Wayback Machine sitesinde arşivlendi. — Ontolojilere erişim sağlar, yazılım araçları, notlanmış gen ürünü listeleri, GO'yu ve kullanımlarını tarif eden kaynak belgeler bulunur.
  • GO Terimi Zenginleşimi proteinler ve GO notlamaları arasında paylaşılan çağrışımların teşhis edilmesinde kullanılan yaygın bir istatistiksel yöntemdir.
  • GONUTS Wiki — üçüncü taraf GO terimi belgelendirmesi, birçok başlıca model organizma veritabanındaki GO notlamalarına bağlantılar içerir.
  • GOCat — Biyomedikal Metinlerin İşlevsel Notlamasına yardımcı Otomatik GO Kategorileyici/Tarayıcı; yüksek-hacimli deneylerce üretilen protein ve gen isim listelerini işlevsel olarak karakterize etmekte kullanışlıdır
  • Protein Ontolojisi Projesi — Protein Ontolojisi (PO), PO ve kullanımlarını tarif eden kaynak belgeler.
  • EAGLi 16 Şubat 2015 tarihinde Wayback Machine sitesinde arşivlendi. — MEDLINE için terminolojiye-dayalı (Gen Ontolojisi, Swiss-Prot anahtar sözcükleri, vb.) bir biyomedikal soru yanıtlama motoru
  • PubOnto — Gen Ontolojisi ve diğer ontolojilere dayanan Medline Dolaşılması.
  • WikiProfessional18 Ocak 2019 tarihinde Wayback Machine sitesinde arşivlendi. — muğlaksızlama, bilgi üretimi ve işbirlikçi zeka.
  • SimCT — bir ontolojiye notlanmış biyolojik nesneler arasındaki ilişkilerin bir öbekleme ağacı biçiminde görüntülenmesi için web-tabanlı araç.
  • SerbGO — farklı programların yeteneklerini karşılaştıran, ortak özelliklerini ve farklarını gösteren, kullanıcının özgül olarak gereksindiği yeteneklere hangi araçların (eğer varsa) sahip olduğunu gösteren bir GO aracı
  • Saha-merkezli Gen Ontolojisi 2 Ocak 2015 tarihinde Wayback Machine sitesinde arşivlendi. — işlevler, fenotipler, hastalıklar ve dahası üzerine saha-merkezli ontolojilerin veritabanı
  • GO2PUB 29 Eylül 2013 tarihinde Wayback Machine sitesinde arşivlendi. — gen ontolojisi terimlerinin semantik genişletilmesi ile PubMed'in sorgulanması