Beruflich Dokumente
Kultur Dokumente
04a Ontologien SO
04a Ontologien SO
Ontologien
Die Sequenz-Ontologie (SO)
Sammeth / GENO 1
Worum es bei den Analysen geht
Generell fallen die meisten bioinformatischen Analysen in
zwei Kategorien:
Sammeth / GENO 2
Fragen Sie jemand nach der Definition für ein "Gen".
Fragen Sie danach jemand anderen.
Die Definition wird vermutlich nicht die gleiche sein.
Sammeth / GENO 4
In der Biologie gibt es viele Spezialwörter
Schauen wir uns die Annotationen in der Datei
SGD_features.tab genauer an:
http://sgd-archive.yeastgenome.org/curation/chromosomal_
feature/SGD_features.tab
Die zweite Spalte der Datei enthält den type (s. README):
cat SGD_features.tab | cut –f 2 | sort | uniq
produziert Wörter wie:
ARS
CDS
...
X_element_combinatorial_repeat
(Frequenzen mit weiterem sort –r -n sichtbar -> Biologie)
Sammeth / GENO 5
Aber wofür stehen ARS und CDS ?
Sammeth / GENO 6
Eine Ontologie
- ist ein strukturiertes Vokabular, welches eine Definition
und eine Klassifikation (Taxonomie) von Wörtern
beschreibt.
Sammeth / GENO 7
Ontologien beschreiben auch Relationen
• in der Biologie sind Ontologien oft
hierarchisch strukturiert.
A
• Konzept von HOs: es gibt fundamentalere
Begriffe, von denen andere (höhere)
Begriffe abhängen (untersch. Relationen).
B C
• hierarchische Ontologien beschreiben
Bäume, d.h. gerichtete Graphen mit einem
überge- ordneten Knoten je Relationstyp).
D E F
z.B. "ist eine konkretere Form von ..."
Relation 1 (Subklassifizierung)
Relation 2 z.B. "ist Teil von..." (Unterteilung)
G H
Relation 3 z.B. "ist neben ..." (Topologie)
Sammeth / GENO z.B. "leitet sich ab von ..." (Derivate) 8
Zuordnung nicht immer trivial
Start
Codons Stop
Codon
Codon
(AUG)
Sammeth / GENO 9
Biologische Ontologien
Sammeth / GENO 10
Die Sequenz Ontologie
Die Sequenz-Ontologie (SO) definiert Sequenz-
Eigenschaften, die in einer Annotation benutzt
werden: http://www.sequenceontology.org/miso
Sammeth / GENO 11
Also was ist ein
X_element_combinatorial_repeat
?
Sammeth / GENO 12
Suche im Browser
Eine Suche im Sequenz-Ontologie Browser liefert:
http://www.sequenceontology.org/miso
"Ein X-Element kombinatorischer Repeat ist eine Repeat-Region, die sich zwischen
dem X-Element und dem Telomer oder dem benachtbarten Y'-Element befindet."
Sammeth / GENO 13
Die Definition muss vielleicht weiter
"definiert" werden.
Die Definition enthält vielleicht andere Begriffe, die Sie nicht
kennen:
Der Baum
zeigt die
hierarchische
Klassifikation
der Ontologie.
Sammeth / GENO 15
Browser der Begriffe zeigt Kontext
Sammeth / GENO 16
Was ist ein "Gen"?
wget https://raw.githubusercontent.com/The-Sequence-
Ontology/SO-Ontologies/master/Ontology_Files/so-simple.obo
Sammeth / GENO 18
Erkundungen in der SO
https://raw.githubusercontent.com/The-Sequence-Ontology/SO-
Ontologies/master/Ontology_Files/so-simple.obo
FAQs http://www.sequenceontology.org/resources/faq.html
Sammeth / GENO 19
https://raw.githubusercontent.com/The-Sequence-Ontology/SO-
Ontologies/master/Ontology_Files/so-simple.obo
Sammeth / GENO 20