Beruflich Dokumente
Kultur Dokumente
02 Kommandozeile03b
02 Kommandozeile03b
Teil 3b
Sammeth / GENO 1
Aktuelles:
Wahlen der Studierendenvertretungen
• Youtube Video "Lass dich aufstellen für die Fachschaft
Angewandte Naturwissenschaften!":
https://www.youtube.com/watch?
v=iEtcNIc_cbA&list=PLmxTSEHfMAxSOEY_4VuCOouqWqKsivTss
cat grep –v head –n tail –n wc -l |
Sammeth / GENO 3
Wie speichere ich die Ergebnisse in einer
neuen Datei?
Sie haben nun einen Teil der Daten aus dem ursprünglichen
Datensatz in einer neuen Datei match.tab gespeichert.
Sammeth / GENO 4
Wie wähle ich Spalten aus?
Es sieht so aus als ob die Datei den Featuretyp ORF (Spalte 2) für
protein-codierende Gene verwendet. Sie wollen also die zweite
(Tab-separierte) Spalte "ausschneiden" (cut):
cat SGD_features.tab | cut –f 2 | head
gibt aus:
ORF
CDS
ORF
CDS
ARS
telomere
telomeric_repeat
Sammeth / GENO 5
Wie baue ich meine Pipeline auf
Bauen Sie Ihre Pipeline Schritt für Schritt aus Kommandos auf, und
überprüfen Sie immer, ob Sie auf dem richtigen Weg sind.
Versichern Sie sich, dass Sie bei jedem Schritt verstehen, was die
Kommandokette "soweit" tut.
cat SGD_features.tab | head
cat SGD_features.tab | cut –f 2 | head
cat SGD_features.tab | cut –f 2 | grep ORF | head
Sammeth / GENO 6
sort: viele Probleme können durch eine Sortierung
gelöst werden
Featuretypen sortieren:
cat types.txt | sort | head
Sammeth / GENO 7
uniq: fasst konsekutive gleiche
Einträge zusammen
Das Tool uniq kondensiert alle konsekutiven identischen Wörter in
einem einzigen Eintrag: findet unterschiedliche ("unique") Worte.
Probieren Sie zunächst:
cat types.txt | uniq | head
und danach:
cat types.txt | sort | uniq | head
Sammeth / GENO 8
Sort + Uniq beantworten überraschend viele
Fragen
Wir erhalten:
44
Sammeth / GENO 9
Uniq –c (count) zählt die Instanzen
Die Herausforderung ist oft zu Erkennen, wann ein Problem durch
eine sort + uniq Aktion modelliert werden kann.
Sammeth / GENO 10
Auch sort hat einige nützliche Flags
Angenommen Sie wollen die Feature-Typen nach ihrer Häufigkeit
sehen, was passiert wenn Sie eingeben:
Und das Flag -r sortiert rückwärts, von der größten zur kleinsten
Zahl:
cat types.txt | sort | uniq –c | sort –r –n
Sammeth / GENO 11
Übung
http://sgd-archive.yeastgenome.org/curation/chromosomal_feature/SGD_features.tab