Sie sind auf Seite 1von 4

Restlichen interessanten Papers durchlesen

Software-Lsungen fr Extraktion testen


Evaluierungen suchen

CLAVIN
Versuchen zu verbessern
o Zwischenergebnisse anschauen
o stanfordNER allein probieren
o Nerd ohne dependecy installieren
o stanfordNER API call nachbauen
eigene Evaluierung
o Gritta versuchsaufbau mit clavin-nerd nachstellen
Yahoo
Obwohl kostenpflichtig trotzdem anschaun -> wie weit kommt man mit API-Call-Limit

Genauerer Vergleich von 10 Textpassagen?


Unlock?, Yahoo, Clavin, Clavin-Nerd, Clavin-Web

https://github.com/memex-explorer/GeoParser?
Geolocator-3.0?
Heidelplace?
Nochmal probieren?
Erstellung eines groben Workflows + Literatur-Grundlage

Zielsetzung des Gesamtprojekts

1. Wikipedia-Viewer mit rumlichen Zusatzfeatures

Vorteile
Dynamisches Geoparsing von Texten nicht unbedingt ntig
o Kann in einer minimal-Form statisch umgesetzt werden
Visualisierung kann auf Wikipedia Formatierung beruhen

Nachteile
Rumliche Erforschung von individuell hochladbaren Texten grundstzlich interessanter als
von fix vorgegebenen Wiki-Artikeln
o Fr reines Proof-of-Concept Umsetzung der erdachten Features aber ausreichend
und deutlich einfacher umzusetzen

Artikelverarbeitung
Alle Artikel von englischen Wikipedia in meiner DB
a. Regelmige Updates
b. Updates nur bei gerade angefragten Artikeln
Artikel wird dann live verarbeitet wenn er vom Nutzer angefragt wird
a. Fr Suchfunktion wren eigtl. alle Artikel jederzeit notwendig bzw. zumindest die
Ergebnisse (Artikel) der thematischen Anfrage mssten alle aufgelst werden
Alles knnte ber Wikipedia-API erfolgen (zB Suche)
Minimal reiner Prototyp mit begrenzter statischen Datenbank
a. zB 1000 Artikel
b. alle Artikel aus 2-3 groen Themengebieten

Minimal Rumliche Suche beschrnkt auf ersten 20 Artikel zum Thema


o Hinzunahme von mehr Artikeln als Option

2. Rumlicher Web-Viewer fr selbst hochgeladene Texte/Textsammlungen


Vorteile
Rumliche Suche und Visualisierung von eigenen Texten/Textsammlungen deutlich
praxisrelevanter als bei Wikipedia-Artikeln

Nachteile
Texte mssen auf jeden Fall live verarbeitet werden
Ansehnliche Visualisierung von hochgeladenen Texten (ohne Formatierung) schwierig
Umgang mit unvorhersehbaren nutzeingaben
Kompletter prozess notwendig im web hochgeladenes Dokument -> geoparsing ->
visualisierung
o Sehr viele Unsicherheitsfaktoren
Zielsetzung der einzelnen Features
Visualisierung
bersichtskarte
o Alle Orte eines Textes werden angezeigt
o Textnavigation ber Karte
Bei Klick auf Ort -> Scrollen zu entsprechenden Textpassage
Bei mehreren Orten -> von Erwhnung zu Erwhnung scrollen
o Nur Textpassage einer bestimmten Region des Artikels anzeigen
Auswahl ber Karte
Relevante Textpassagen als Liste anzeigen
Mglichkeit zum Anzeigen des restlichen Artikels (zentriert auf jeweilige
Passage)

Begleitende Karte
o automatische Visualisierung ber aktuellen Absatz/Satz
o individuelle Visualisierung laut meiner originalen Idee
einzelne Orte/mehrere selbst ausgewhlte Orte
Satz/Absatz/Kapitel
Individuelle Markierung

Rumlich hierarchische Suche


Nach Artikeln
o Zuerst thematische Suche
Liste mit relevanten Artikeln
o Suchgebiet auswhlen
Filtern der Liste nach relevanten Artikeln
o Anzeigen des gesamten Artikels
Nur relevante Abstze

Optional selbst ausgewhlte Artikel


o Visualisierung aller Locations
o Auswahl eines Suchgebiets
Direkter Verweis auf relevante Textstellen in allen Artikeln

Ranking der Ergebnisse


o ber Focus des Gesamt Artikels
o Relative Anzahl der Orte in Suchgebiet

Vernderung des rumlichen Kontexts von Wikipedia-Artikeln


o Sinnfrage bzw. welche Aussagen sollen damit getroffen werden knnen?
Workflow
Kompletten beispielhaften Ablauf erstellen
z.B UML-Schema

Auswhlen Software/Frameworks
Datenbank
Datenbankdesign
Web-Mapping
Serverseitige Sprache

Literatur dazu

Evaluierung berlegen