Beruflich Dokumente
Kultur Dokumente
Herzlich Willkommen!
Informatik I im WS 2021/22
Warum Informatik?
Vorlesung Informatik I
• Ziel 1: Vermittlung einiger zentraler Konzepte der
Informatik
• Ziel 4: Spaß!
Wo ist Informatik? Technische Universität München
Technische Universität München
Wieso?
• Motivation 1: Ein durchgängiges Beispiel für die
Vorlesung
• Motivation 2: Verbindung mit anderen Vorlesungen (Lin.
Alg., HöMa)
• Motivation 3: Es ist cool, Google zu verstehen
Suchmaschinen
• Zutat 1: Textähnlichkeit
Je „näher“ eine Anfrage einem Dokument ist, desto besser „passt“
das Dokument zu der Anfrage.
„Nähe“ bestimmt Ordnung in der Resultatliste.
dies ist ein text über programmieren programmierung ist eine wichtige grundlage
dies ist ein text über programmier programmier ist ein wichtig grundlag
hier ist mehr über programmieren java ist eine wichtige sprache
hier ist mehr über programmier java ist ein wichtig sprach
Wort #
Wort #
mehr 1
text 1
programmier[] 1
programmier[] 2
java 1
wichtig[] 1
wichtig[] 1
grundlag[] 1
sprach 1
Technische Universität München
Vector Space
• Anfrage: „Wichtiges wichtiges Programmieren“
Vektorähnlichkeit?
Technische Universität München
Vektorähnlichkeit?
• Skalarprodukt * berechnet ein Maß für den Cosinus des
Winkels zwischen zwei Vektoren a und b;
– damit für den Winkel;
– damit für die Ähnlichkeit!
Vektorähnlichkeit?
• Skalarprodukt berechnet ein Maß für den Cosinus des
Winkels zwischen zwei Vektoren; damit für den Winkel;
damit für die Ähnlichkeit!
• Zur Illustration Einschränkung auf drei Dimensionen
programmier
doc2
query
doc1
wichtig
sprach
Technische Universität München
Vector Space
• (0,1,0,2,0,0,0)*(1,1,1,1,1,0,0)=3/(√5 √5)=.6
• (0,1,0,2,0,0,0)*(0,2,0,1,0,1,1)=4/(√5 √7)=.67
• Ranking: Doc2, Doc1
PageRank 1
• Eine „relevante“ Seite S wird von vielen anderen
„relevanten“ Seiten verlinkt
– Rekursive Definition
(Eigenwertproblem, numerisch lösbar, konvergiert.)
• Wenn J die Menge der Links auf eine Seite s ist und R
die Relevanz einer Menge von Seiten beschreibt, dann
ist
R({s})= f(R(J))
PageRank 2
Stochastische Interpretation:
Page Rank
Quelle: Wikipedia
Technische Universität München
Kombination
• Dokumentenähnlichkeit d liefert ein Maß für die
Ähnlichkeit, damit Relevanz
Vorlesung: Suchmaschinenperspektive
• Man nehme
– Webseiten/Dokumente
– Wort-/Häufigkeitsvektoren, die diesen Dokumenten (und der
Suchanfrage) entsprechen
– Mengen von Wort-/Häufigkeitsvektoren, die die
Dokumentenmenge darstellen, in der wir suchen
– Einen einfachen Algorithmus zur Ähnlichkeitsberechnung
zwischen Suchanfrage und allen Dokumenten (also: zwischen
Wort-/Häufigkeitsvektoren)
– Einen zweiten, besseren solchen Algorithmus
– Eine Implementierung von PageRank
• … und fertig ist die Suchmaschine
Technische Universität München
Warum nochmal?
• Interessant: Als solches spannend
• Relevant: Wir benutzen Google jeden Tag
• Integrierend:
z.B. Vorlesungen über lineare Algebra und Analysis
(HöMa)
• Angewandt: Zeigt an einem durchgängigen Beispiel,
warum die in der Vorlesung gelehrten Konstrukte
tatsächlich nützlich sind.
Technische Universität München
Vorlesung: Programmierperspektive
Teil 1: Einführung
Teil 2: Objektbasierte Programmierung
Teil 3: Kontrollstrukturen
Teil 4: Felder
Teil 5: Einige Abstrakte Datentypen
Teil 6: Objektorientierung
Teil 7: Rekursion
Teil 8: Fortgeschrittene Programmierkonstrukte
Teil 9: Ein größeres Beispiel
Teil 10: Nebenläufigkeit
Teil 11: Beyond Java
Technische Universität München
Informatik I
• Vorkenntnisse
– Keine
• Bereitschaft
– Zu aktiver und eigenständiger Mitarbeit
– Zu Eigeninitiative
– Zur Benutzung weiterer Quellen
• Bücher, Java-Dokumentation, Prüfungsordnung, Modulhandbuch, ...
• Arbeitsaufwand
– Laut BA-Ordnung 2x6 Credits (1 Credit = 30 Std.)
– Das sind 360 Arbeitsstunden, ca. 25 pro Woche !!!
40
Technische Universität München
Source: https://www.groupon.com/biz/cedar-rapids/evans-ata-black-belt-academy
41
Technische Universität München
19.10.2021 42
Technische Universität München
https://i.redd.it/28arfeidajx01.jpg
19.10.2021 43
Technische Universität München
Und?
Wir sind sehr zahlreich. Störer stören viele.
Falls 1-3 auf Sie zutreffen und Sie 4 und 5 nicht verstehen
können, müssen Sie nicht kommen!
Falls 1-3 nicht (nur) auf Sie zutreffen und Sie die Klugheit
von 4 und 5 würdigen können, interessieren Sie sich für
die Inhalte und das Gesamtpaket. Deswegen kommen –
und schweigen! - Sie.