Benutzerhandbuch
Stand: 24.02.2009
Version 1.0.7
INHALTSVERZEICHNIS
1. EINFÜHRUNG .....................................................................................................3
1.1. BEVOR SIE STARTEN ............................................................................................................................. 3
1.2. SYSTEMVORAUSSETZUNGEN ................................................................................................................. 6
1.3. KONTAKT ............................................................................................................................................. 7
2. TIQVIEW ..............................................................................................................8
2.1. TIQVIEW STARTEN ............................................................................................................................... 9
2.2. DATENAUSWAHL UND DATENLADEN...................................................................................................10
2.2.1. Laden von Daten aus ODBC-Datenquellen mittels TIQView-Composer ..........................................10
2.2.2. Laden von Daten aus QlikView-Anwendungen...................................................................................14
2.2.3. Laden von Daten aus Excel-Anwendungen ........................................................................................18
2.3. ALLGEMEINER AUFBAU VON TIQVIEW ...............................................................................................22
2.3.1. Allgemeines.........................................................................................................................................22
2.3.2. Aufbau der TIQView-Anwendungen ...................................................................................................23
2.3.3. Filter...................................................................................................................................................24
2.3.4. Aufheben von Filtern ..........................................................................................................................27
2.3.5. Sperren und Entsperren einer Auswahl ..............................................................................................27
2.3.6. Erstellen und Löschen von Bookmarks...............................................................................................27
2.3.7. Workflow.............................................................................................................................................28
2.4. TIQVIEW COLUMN – SPALTENINHALTSANALYSE ...............................................................................29
2.4.1. Allgemeines.........................................................................................................................................29
2.4.2. Formatvorkommen..............................................................................................................................34
2.4.3. Wertvorkommen..................................................................................................................................36
2.4.4. Phonetikvorkommen ...........................................................................................................................37
2.4.5. Ausgangsdaten anzeigen.....................................................................................................................39
2.5. TIQVIEW DEPENDENCY – ABHÄNGIGKEITSANALYSE .........................................................................40
2.5.1. Allgemeines.........................................................................................................................................40
2.5.2. Regelbasierte Analyse.........................................................................................................................42
2.5.3. Verknüpfte Tabellen............................................................................................................................45
2.6. TIQVIEW DASHBOARD – DQ-MONITORING ........................................................................................48
3. ÜBUNGSBEISPIELE .........................................................................................49
3.1. FORMATANALYSEN BEI PLZ-DATEN ...................................................................................................49
3.2. IDENTIFIZIERUNG MÖGLICHER SCHLÜSSELATTRIBUTE ........................................................................50
3.3. WERTVORKOMMEN ..............................................................................................................................51
3.4. NULLWERT-ANALYSE ..........................................................................................................................52
1. Einführung
1.1. Bevor Sie starten
TIQView – Interaktives Data Profiling an jedem Ort zu jeder Zeit!
Die TIQ Solutions GmbH hat mit TIQView eine spezielle Datenqualitäts-(DQ) Appli-
kation entwickelt, mit der interaktives Data Profiling unabhängig von Ort und Zeit kein
Problem mehr ist. Sie können ab sofort Ihre Daten mit auf die (Dienst-)Reise nehmen
und ganz einfach auf Ihrem Laptop prüfen, wie es um die Qualität Ihrer Ab-
teilungsdaten bestellt ist. Mit TIQView schaffen Sie sich schnell einen ersten Über-
blick, welche Qualitätsprobleme in Ihrer Datenwelt existieren und wo Sie mit geziel-
ten Verbesserungsmaßnahmen ansetzen müssen. Dadurch werden auch ökonomi-
sche Effekte schnell wirksam, die wiederum die Akzeptanz solcher DQ-Aktivitäten für
die Zukunft erhöhen!
3
Die funktionalen Vorteile gegenüber kostenintensiven herkömmlichen Profi-
ling-Werkzeugen sind:
TIQView Column hilft Ihnen festzustellen, wie die einzelnen Spalten einer Daten-
banktabelle (Attribute) jeweils genau genutzt werden und welche Fehler dabei exis-
tieren. Fehler treten in diesem Zusammenhang vor allem dann auf, wenn Daten
falsch erfasst bzw. übertragen oder Datenfelder für alternative (missbräuchliche)
Zwecke verwendet werden, was Inkonsistenzen befördert. Folgende Untersuchun-
gen werden durch TIQView Column im Einzelnen ermöglicht:
4
Mit der funktionalen Flexibilität gelingt es zudem in nur wenigen Minuten, komplizier-
te datenqualitätsspezifische Zusammenhänge zwischen Spalten verschiedener Da-
tenbanktabellen herzustellen:
5
1.2. Systemvoraussetzungen
TIQView basiert auf der Business Intelligence Software Qlikview von der Firma Qlik-
tech und besitzt dadurch den Vorteil, alle Funktionalitäten eines modernen und
flexiblen Datenanalysewerkzeuges schon in sich zu vereinen und für eine effi-
ziente Datenqualitätsanalyse nutzen zu können. Für den Betrieb von TIQView
wird die Anwendung QlikView in der Version 7 oder 8 mit dem Produktlevel Analyzer
auf Ihrem System benötigt. Ein QlikView-Installationsprogramm ist in der Installation
von TIQView enthalten. Beim Erwerb von TIQView erhalten Sie eine Lizenz des
QlikView Analyzers, welche ausschließlich für TIQView genutzt werden darf. Für um-
fassendere DQ-Analyse-Lösungen sind natürlich auch Entwicklungs- und Serverver-
sionen von Qlikview nutzbar.
Sollten sie noch keine TIQView- oder QlikView-Lizenz haben, können Sie eine
15-tägige Testversion zur Evaluierung von TIQView nutzen. Registrieren Sie
sich dafür unter www.tiqview.de. Nach Ablauf dieser Testversion setzen Sie
sich zum Erwerb der Lizenzen bitte mit unserem Support in Verbindung!
6
Betriebssystem:
• Microsoft Windows XP TM
1.3. Kontakt
Haben Sie Fragen oder Anregungen zu TIQView oder zum Thema Datenquali-
tät?
Kontaktieren Sie uns per Mail unter support@tiq-solutions.de oder telefonisch unter
0341 35590302. Schriftlich erreichen Sie uns per Post unter:
TIQ Solutions GmbH
Support
Weißenfelser Str. 84
D-04229 Leipzig
7
2. TIQView
Außerdem möchten wir Sie darauf hinweisen, dass wir die ausgelieferte
TIQView-Applikation gerade für größere Organisationseinheiten lediglich
als einen Piloten betrachten, der an die spezifischen Anforderungen in
Ihrem Unternehmen angepasst werden kann bzw. muss, um eine effi-
ziente unternehmens- bzw. bereichsspezifische DQ-Analyse-Plattform
bereitstellen zu können. Für eine Erläuterung der Erweiterungsmöglich-
keiten von TIQView, können Sie uns gern jederzeit kontaktieren. Gern
helfen wir Ihnen auch vor Ort bei der Einführung und Erweiterung von
TIQView!
8
2.1. TIQView starten
Starten Sie TIQView durch Doppelklick auf die Datei TIQView.qvw im TIQView-
Programmverzeichnis (z.B. C:\Programme\TIQView). Alternativ können Sie TIQView
auch innerhalb von QlikView öffnen. Starten Sie dazu QlikView. Gehen Sie in das
Menü Datei → Öffnen und wählen Sie aus Ihrem TIQView-Verzeichnis die Datei
TIQView.qvw aus. Geben Sie als Benutzername user ein (die Eingabe eines Pass-
wortes ist nicht notwendig).
9
2.2. Datenauswahl und Datenladen
Durch klicken auf den Registerreiter Auswahl Tabellen und Spalten kommen Sie
auf die Seite für die Auswahl der Tabellen und Spalten:
Tabellen und Spalten können sowohl für externe Datenquellen als auch für QVD-
Dateien direkt aus QlikView-Anwendungen für eine Datenqualitätsanalyse in TIQ-
View geladen werden.
Im Folgenden werden alle Schritte vom Aufbau einer ODBC Verbindung bis zum
Speichern der Analyseauswahl durchgegangen. Dabei werden auch die einzelnen
Arbeitsbereiche des Composers erklärt.
10
Verwaltung der ODBC Verbindungen
• Klicken Sie auf das orangefarbene Symbol mit dem grünen Kreuz
• Geben Sie in dem sich öffnenden Dialog den Namen der ODBC Quelle sowie
den Nutzer und das Passwort ein. Es ist nicht möglich mehrere Datenquellen
mit derselben ODBC Quellbezeichnung einzubinden (Groß-/Kleinschreibung
wird von Windows nicht beachtet.
• Mit einem Klick auf "Verbinden" schließen Sie den Vorgang ab.
Wenn Sie den Baum im Bereich Datenbanken erweitern, werden alle der für sie ver-
fügbaren Schemata der Datenquelle aufgelistet. Der Punkt (ohne Schema) ist ein
Standardeintrag und wird für jede Datenquelle erzeugt. Dort werden je nach Daten-
bankhersteller alle oder bestimmte Tabellen einer ODBC Datenquelle dargestellt.
11
Abbildung 8: Anzeigen der Tabellen zu einem Schema
Bei einem Klick auf das jeweilige Schema werden im Bereich Tabellen/Views die
dazugehörigen Tabellen angezeigt. Diese können einzeln, per Doppelklick oder mit
einem Klick auf das Symbol , zur Auswahl hinzugefügt werden.
Über die Symbole können einfache Anzeigefilter gesetzt und wieder entfernt
werden. Es können durch Leerzeichen getrennte Zeichenketten als Mehrfachfilter
eingegeben werden, der Filter unterscheidet nicht nach Groß-/Kleinschreibung und
verarbeitet keine Wildcards.
Neben der Auswahl ganzer Tabellen können im Bereich Spalten einzelne oder meh-
rere Spalten zur Analyse hinzugefügt werden. Um die Spalten einer bestimmten Ta-
belle anzuzeigen, klicken Sie im entsprechenden Feld des Bereichs Tabellen/Views
mit der linken Maustaste.
Über das Symbol können die Spalten alphabetisch sortiert bzw. in ihrer logischen
Reihenfolge angezeigt werden.
12
Bearbeiten der Auswahl
Im Bereich Auswahl befinden sich nun alle Tabellen/Spalten die Sie mit TIQView
analysieren möchten – gruppiert nach Tabellen. Zusätzlich dazu werden Informatio-
nen zum Datenbanksystem hinter der ODBC-Quelle und dem Schema angezeigt.
Neben reinen Informationsfenstern können einige Attribute der Auswahl noch bear-
beitet werden (Klick in das Feld rechts neben der entsprechenden Eigenschaft):
• Limit – Das Limit bestimmt wie viele Zeilen letztendlich aus der Abfrage an
TIQView zur Analyse übergeben werden. Diese Funktion wird noch nicht für
alle Datenbanksysteme unterstützt – da hier je Hersteller Unterschiede in der
Nomenklatur bestehen
13
.
Abbildung 12: Bearbeiten der Spalteneigenschaften
Über können Tabellen vollständig aus der Analyseauswahl entfernt werden. Kli-
cken Sie dazu vorher auf den Tabellennamen. Mit einem Mausklick auf das Icon
können Sie die Auswahl zur Verarbeitung mit TIQView speichern und mit der Analy-
se starten.
Der Composer kann im Hintergrund offen bleiben und muss nicht nach jeder Aus-
wahl geschlossen werden. Gegebenenfalls müssen nur die ODBC Verbindungen im
Fenster Datenbanken kurzzeitig gelöst werden, z.B. bei Einschränkungen in der zu-
lässigen Anzahl aktiver Verbindungen zu einer Datenbank. Die Verbindung wird au-
tomatisch neu aufgebaut sobald sie eine Aktion im Bereich der jeweiligen Datenbank
tätigen.
Das Laden der QVD-Dateien aus QlikView-Anwendungen können Sie über folgen-
den Button starten:
Nach dem Starten der QVD-Dateienauswahl finden Sie die folgende Oberfläche vor:
14
Abbildung 14: Oberfläche für das Laden von QVD-Dateien
Danach müssen die Dateien aus dem entsprechenden Verzeichnis geladen werden.
Dies geschieht über folgenden Button:
Nach dem Laden der Dateien finden Sie folgende Oberfläche vor:
15
Abbildung 17: Geladene QVD –Dateien
Nach Auswahl einer Tabelle in der Listbox QVD-Dateien auswählen, haben Sie die
Möglichkeit, die zu analysierenden Spalten und den Primärschlüssel der Tabelle
auszuwählen:
16
Abbildung 18: Auswahl der Spalten und des Primärschlüssels
Im oberen Bereich Einschränkung der Daten können Sie die Anzahl der Datensät-
ze durch direkte Einschränkung der Zeilenzahl oder durch eine Filter-Bedingung
(where-Clause) pro Tabelle einschränken.
Mit der where-Bedingung ist es möglich, spezielle Datensätze aus den Tabellen zu
extrahieren. Zum Beispiel im Feld ‚Filter-Bedingung’ KategorieNr = 8 (das bedeutet,
die Bedingung beschränkt die Produkte auf eine Kategorie).
Nachdem Sie alle Einstellungen für eine ausgewählte Tabelle vorgenommen haben,
können Sie diese Einstellungen über den folgenden Button abspeichern und zur
nächsten Tabelle übergehen.
17
Abbildung 20: QVD-Auswahl speichern
Haben Sie alle notwendigen Tabellen bearbeitet, können Sie nun die Daten in TIQ-
View laden. Beim Laden der Daten haben Sie auf der Registerkarte Auswahl Tabel-
len und Spalten die Möglichkeit zu wählen ob ausschließlich Daten aus QVD-
Dateien, externen Datenquellen oder aus beiden Quellen gemeinsam geladen wer-
den sollen.
Nach dem Starten der Excel-Dateienauswahl finden Sie die folgende Oberfläche vor:
18
Abbildung 23: Oberfläche für das Laden von Excel-Dateien
Daten aus Excel-Dateien werden über eine ODBC-Datenquelle mit der Bezeichnung
„Excel-Dateien“ geladen. Sollte der Datenquellenname (ODBC DSN) bei ihrer MS
Office Installation abweichen (z. B. „Excel Files“), können Sie diese Einstellung hier
anpassen.
Ist noch keine Datenquelle eingerichtet, können Sie diese über Systemsteuerung /
Verwaltung / Datenquellen (ODBC) einrichten:
19
Abbildung 24: Excel Datenquelle einrichten
Danach müssen die Dateien aus dem entsprechenden Verzeichnis geladen werden.
Dies geschieht über folgenden Button:
Nach dem Laden der Dateien finden Sie folgende Oberfläche vor:
20
Abbildung 27: Geladene Excel –Dateien
Nach Auswahl einer Tabelle in der Listbox Excel-Dateien auswählen haben Sie die
Möglichkeit, die zu analysierenden Spalten und den Primärschlüssel der Tabelle
auszuwählen.
Im oberen Bereich Einschränkung der Daten können Sie die Anzahl der Datensät-
ze durch direkte Einschränkung der Zeilenzahl oder durch eine where-Bedingung pro
Tabelle einschränken.
Nachdem Sie alle Einstellungen für eine ausgewählte Tabelle vorgenommen haben,
können Sie diese Einstellungen über den folgenden Button abspeichern und zur
nächsten Tabelle übergehen.
Haben Sie alle notwendigen Tabellen bearbeitet, können Sie nun die Daten in TIQ-
View laden. Hierbei besteht die Möglichkeit, die Daten über den Button Excel-Daten
laden zu laden. Eine weitere Option ist über die Registerkarte Auswahl Tabellen
und Spalten den Button Excel-Daten laden zu nutzen oder alle zuvor festgelegten
21
Daten (ODBC, QVD und/oder Excel) zusammen über den Button Alle Daten laden
einzuladen.
2.3.1. Allgemeines
Von der Seite Auswahl Tabellen und Spalten gelangen Sie durch Klick auf den
Registerreiter Auswertungen direkt zur ersten Analyseoberfläche. Hier finden Sie
allgemeine Auswertungen für die jeweiligen Tabellen und Spalten.
Weiterhin haben Sie die Möglichkeit, Ihre Daten speziell nach bestimmten Formaten
und Werten zu analysieren. Die Analyse der Formate ermöglicht es beispielsweise,
verschiedene Muster für Telefonnummern oder PLZ zu erkennen. Mit Hilfe der Wer-
22
teanalyse ist es zum Beispiel möglich, die verschiedenen Werte für die Spalte Ge-
schlecht herauszufinden und so Fehler in den Daten zu entdecken.
Die Oberfläche der TIQView-Anwendung ist in zwei Bereiche aufgeteilt: Oben befin-
det sich die Navigationsleiste mit Filtermöglichkeiten, darunter wird der Auswer-
tungsbereich dargestellt, der je nach Auswahl verschiedene Analysen enthalten.
Auswertungen Filter
Abbildung 31: Aufbau der TIQView-Anwendungen
23
2.3.3. Filter
In TIQView haben Sie die Möglichkeit, Einschränkungen der Daten in List- oder Mul-
tiboxen oder in den Tabellen und Diagrammen der Auswertungen vorzunehmen.
Listboxen
Multiboxen
TIQView besitzt darüber hinaus eine intuitive Bedienoberfläche: Ein Klick auf die
auszuwählenden Werte in Listboxen, Multiboxen und/oder den verschiedenen Aus-
wertungen schränkt die angezeigten Werte auf den ausgewählten Bereich ein. Die
Auswahl kann übergreifend in mehreren Auswahlboxen, Tabellen etc. erfolgen. Bei
der Auswahl sollte berücksichtig werden, dass:
• Werden Daten in einer Tabelle ausgewählt, verschwinden alle Werte bis auf
die selektierten. An einem kleinen grünen Punkt neben dem Spaltennamen
sehen Sie, dass eine Selektion vorgenommen wurde.
24
Abbildung 35: Auswahl in einer Tabelle
1
„a“ steht dabei für einen beliebigen Buchstaben und „9“ für eine beliebige Ziffer.
25
Abbildung 37: Selektion als "UND"-Verknüpfung
Sie können jeweils einen oder mehrere Werte auswählen. Bei mehreren Werten
müssen Sie die Taste [STRG] gedrückt halten oder einfach mit der gedrückten linken
Maustaste über die zu selektierenden Werte ziehen.
In Listboxen und Multiboxen kann nach speziellen Werten gesucht werden. Klicken
Sie dafür auf die Titelleiste der Listbox oder auf den Dropdown-Pfeil einer Spalte in
einer Multibox und beginnen Sie den Begriff zu tippen, nach dem Sie suchen. Es öff-
net sich ein Fenster in dem Sie den Suchbegriff sehen. Alternativ können sie auch
die Taste F3 drücken. Die Suche kann durch die Platzhalter * (für mehrere Buchsta-
ben) und ? (für einen Buchstaben) erweitert werden.
Durch den Klick mit der rechten Maustaste auf eine Listbox können zudem folgende
Aktionen auf die Felder der Listbox durchgeführt werden:
Multiboxen sind komprimierte Darstellungen von Listboxen und werden wie diese
behandelt.
26
2.3.4. Aufheben von Filtern
• Die in einer List- oder Multi-Box selektierten Werte können einzeln durch ei-
nen Klick auf das Radiergummi-Symbol in der Titelleiste der Listbox aufge-
hoben werden.
• Ebenfalls ist es möglich, die Auswahl eines Wertes durch nochmaliges Ankli-
cken aufzuheben.
• Die gesamte Auswahl kann über den Button in der Menüleiste
aufgehoben werden.
Sie können die Auswahl in einzelnen List- oder Multiboxen oder auch die gesamte
Auswahl sperren und freigeben. Bei einzelnen Sperrungen oder Freigaben gehen Sie
bitte über das Menü der rechten Maustaste.
Bookmarks verwalten Sie über den Menüpunkt Bookmarks. Zum Anlegen eines neu-
en Bookmarks können Sie über das Menü Bookmarks → neues Bookmark aus-
wählen, in der Symbolleiste den Button klicken oder sie nutzen die Tastenkom-
27
bination [STRG-B]. Vergeben Sie einen sinnvollen Namen für Ihr Bookmark. Um das
Bookmark dauerhaft im Dokument zu speichern, setzen Sie den Haken bei Als Do-
kument-Bookmark anlegen. Möchten Sie, dass die Auswahl des Bookmarks zu
einer aktuellen Auswahl hinzugefügt wird, markieren Sie Bookmark additiv anwen-
den. Ist dieses Merkmal nicht aktiviert, wird die aktuelle Auswahl bei Aufruf des
Bookmarks überschrieben. Weitere Optionen beim Dialog Neues Bookmark sind für
die Verwendung mit TIQView nicht relevant. Zum Aufrufen eines bestehenden
Bookmarks wählen Sie unter dem Menüpunkt Bookmarks das entsprechende
Bookmark aus. Bookmarks können ebenso unter dem Menüpunkt Bookmarks →
Bookmarks löschen gelöscht werden.
2.3.7. Workflow
Tabellen
Selektieren sie hier die Tabellen, die Sie analysieren wol-
len. Erfolgt keine Auswahl, werden alle aufgelisteten Ta-
bellen betrachtet. Die Anzahl der Datensätze je Tabelle
Abbildung 40: Tabellenauswahl
wird als zusätzliche Information angezeigt.
Spalten
Hier wählen Sie die Spalten aus, die Sie überprüfen möch-
ten. Wurden keine Tabellen in der Tabellenbox ausge-
wählt, enthält die Listbox alle Spalten aller Tabellen, sonst
stehen nur die Spalten der selektierten Tabellen zur Aus-
wahl.
Abbildung 41: Spaltenauswahl
Innerhalb der oben genannten Multibox werden die Primärschlüssel der von Ihnen
selektierten Datensätze angezeigt. Dies ist allerdings nur möglich, wenn entspre-
chende Primärschlüsselinformationen in der Datenquelle vorhanden sind. Ansonsten
finden Sie dort einen künstlich erzeugten Primärschlüssel.
28
2.4. TIQView Column – Spalteninhaltsanalyse
2.4.1. Allgemeines
Für die selektierten Daten werden in der Tabelle „Auswertung allgemein“ verschie-
dene statistische Aussagen pro Tabelle und Spalte getroffen:
29
Anteil Null-Werte
Diese Darstellung zeigt den prozentualen Anteil der Null-Werte (Felder ohne einen
Eintrag bzw. nur mit Leerzeichen gefüllt2) des jeweils ausgewählten Datenbestandes
als so genannte „leere“ Werte an (in diesem Fall 89 Prozent).
Treffen Sie mit dieser „Füllstandsanzeige“ schnell eine Aussage, wie gut bestimmte
Datenfelder (z.B. die Telefonnummer im Kundenbestand) gepflegt wurden.
Anzahl Werte in %
Zum Aufruf dieser Auswertung doppelklicken Sie in der Navigationsleiste auf Anzahl
Werte in %. Die Auswertung zeigt in einem Balkendiagramm an, wie viele Werte
oder wie viele verschiedenen Werte sich in den einzelnen Spalten befinden. Um eine
Berechnung der Auswertung zu erreichen, müssen Sie zuerst eine Tabelle selektie-
ren. Um zwischen den Berechnungen Anzahl Werte (Abbildung 46) und Anzahl
eindeutiger Werte (Abbildung 47) zu wechseln, nutzen Sie bitte den dargestellten
Button , welchen Sie innerhalb der Auswertung links oben finden.
2
Eigentlich ist nur der Wert eines rein leeren Datenfeldes ein Null-Wert. Allerdings zeigt die Praxis, dass
Pflichtfelder in Eingabemasken oft durch Leerzeichen gefüllt werden. Deshalb sind für uns auch eingegebene
Leerzeichen Null-Werte, um so nicht korrekt gefüllte Felder aufzuspüren.
30
Anzahl Werte stellt den prozentualen Anteil gefüllter Felder in einer bestimmten
Spalte dar, während Anzahl eindeutiger Werte den prozentualen Anteil distinkter
Werte darstellt. Im nachfolgenden Beispiel beträgt für die Spalte KundenNR die An-
zahl eindeutiger Werte 100 Prozent. Dadurch ist jeder Datensatz eindeutig unter-
scheidbar, und diese Spalte kann beispielsweise auch als Primärschlüssel benutzt
werden.
31
Mengenverteilung in %
Zum Aufruf dieser Auswertung doppelklicken Sie in der linken Navigationsleiste auf
Mengenverteilung in %. Diese Auswertung zeigt in einem Kreisdiagramm an, wie
die Datenmengen in den einzelnen Tabellen und Spalten verteilt sind.
Indem Sie einen durch die Pfeile angezeigten Bereiche klicken, gelangen Sie in die
Ansicht der Mengenverteilung auf Spaltenebene für die ausgewählte Tabelle.
32
Nutzen Sie bitte den dargestellten Button , welchen Sie innerhalb
der Auswertung rechts oben finden, um zu der Tabellenansicht zurück zu gelangen.
Um in die Darstellung der verschiedenen Werte zu wechseln, betätigen Sie den rot
eingekreisten Button. Nun sehen Sie die Anzahl von untereinander verschiedenen
Werten, die in einer Spalte vorkommen.
33
Abbildung 51: Auswertung Verschiedene Werte
2.4.2. Formatvorkommen
Zum Aufruf der Auswertung Formatvorkommen doppelklicken Sie links in der Navi-
gationsleiste auf Format. Diese zeigt sowohl in Diagrammform als auch als Tabelle,
welche Formate in welcher Häufigkeit in den selektierten Tabellen und Spalten vor-
kommen. Die Formatvorkommen sind nach Häufigkeit sortiert. Natürlich können Sie
34
die Sortierung jederzeit verändern, indem Sie auf die entsprechende Spaltenüber-
schrift doppelklicken. Sie sehen die Sortierung anhand eines kleinen Pfeils, der in der
Spaltenüberschrift erscheint. Durch diese Darstellung können Sie auffällige Formate
leichter identifizieren.
35
Listbox „Format“
Die Listbox zeigt die vorkommenden Muster der getroffenen Auswahl und deren
Häufigkeiten absteigend geordnet an. Zahlen werden durch „9“ symbolisiert, Klein-
buchstaben durch „a“ und Großbuchstaben durch „A“. Alle anderen Zeichen sind un-
verändert. „Formatausreißer“ können so gezielt erkannt werden.
2.4.3. Wertvorkommen
Zum Aufruf dieser Auswertung doppelklicken Sie in der Navigationsleiste auf Wert-
vorkommen. Diese zeigt tabellarisch, welche Werte in welcher Häufigkeit in den se-
lektieren Tabellen und Spalten vorhanden sind. Die Werte sind nach Häufigkeit sor-
tiert. Natürlich können Sie die Sortierung jederzeit verändern, indem Sie auf die Spal-
tenüberschrift einen Doppelklick ausführen. Sie sehen die Sortierung anhand eines
36
kleinen Pfeils, der in der Spaltenüberschrift erscheint. Durch diese Darstellung kön-
nen Sie auffällige Werte identifizieren.
• Sie interessieren sich für einige auffällige Werte? Markieren Sie die näher zu
betrachtenden Werte einfach in der Tabelle. Bedenken Sie, dass Sie für weite-
re Auswertungen die Auswahl wieder aufheben sollten.
Listbox Wert
2.4.4. Phonetikvorkommen
Neben der Auswahl einzelner Phonetik-Codes über die Listbox (analog zu Wertevor-
kommen) haben Sie hier die Möglichkeit eine Auswahl über folgendes Eingabefeld
zu treffen:
37
Abbildung 59: Auswahl über Phonetik-Kodierung
Bei Klick auf den Button Auswahl wird der eingegebene Wert in einen Phonetik-
Code umgewandelt und eine Auswahl in der Listbox mit entsprechendem Phonetik-
Code vorgenommen:
Im Beispiel wurde der Phonetik-Code #0626 der Zeichenkette Anton in der Listbox
als Auswahl *626* selektiert. Die führende Null (Anlaut „A“) wurde entfernt, da Vokale
innerhalb der Zeichenkette nicht kodiert werden. Damit wird eine Suche des einge-
gebenen Wertes innerhalb der gesamten Zeichenkette ermöglicht.
Zur Überprüfung der Eingabe können Sie sich das Ergebnis der Kodierung in Kölner
Phonetik über den Button Kodierung anzeigen lassen:
38
Abbildung 62: Ergebnis der Kodierung in Kölner Phonetik
Über den Button Alle können Sie alle Werte mit Phonetik-Code auswählen. Diese
Auswahl wird auch automatisch getroffen, wenn Sie das Arbeitsblatt Phonetikvor-
kommen selektieren. Alle Nicht-Zeichenketten-Werte (Datum, Number, etc.) werden
damit aus der Auswahl ausgeschlossen, da sie ohne Phonetik-Code innerhalb dieses
Arbeitsblattes nicht relevant sind.
Über den Button Ausgangsdaten anzeigen gelangen Sie zu den vollständigen Da-
tensätzen für die von Ihnen ausgewählten auffälligen Daten.
39
2.5. TIQView Dependency – Abhängigkeitsanalyse
2.5.1. Allgemeines
Zum Aufruf dieser Auswertung klicken Sie in auf den Registerreiter Regeln. In dieser
Auswertung kann geprüft werden, ob Spalten einer Tabelle bestimmte Regeln erfül-
len.
Nach Auswahl der Tabelle über die Multibox Tabelle und der zu prüfenden Spalten
über die Multibox Spalten 1 und Spalten 2 können Regeln erstellt werden.
Abbildung 67:
Auswahl der Tabellen
40
Abbildung 68: Auswahl der Regel
41
Durch Markierung von abweichenden Datensätzen in der Tabelle Regelanalyse und
einen Klick auf den Button Ausgangsdaten können die Inhalte der ausgewählten
Datensätze angeschaut werden.
Zum Aufruf dieser Funktion klicken Sie auf den Registerreiter Regelbasierte Analy-
se. Damit können verschiedene Spalten einer Tabelle über Qlikview-spezifische
Formelausdrücke miteinander verglichen werden. Es ist möglich, mehrere Regeln zu
definieren und zu speichern.
Zur Auswahl der Tabelle, welche mit Regeln analysiert werden soll, wird in der Ta-
belle-Auswahlbox die Tabelle ausgewählt.
42
Im Anschluss an die Tabellenauswahl können Regelsätze definiert werden. Für jeden
Regelsatz muss ein Name vergeben werden. Die Regeln müssen manuell erfasst
werden. Regeln können aufeinander aufbauend deklariert werden (maximal 10 Re-
gelausdrücke). Zur Weiterverwendung der Regel in einem Regelsatz ist der Regel-
spaltenname anzugeben. Im abgebildeten Beispiel wird in Regelspalte3 mit den Re-
geln aus Regelspalte2 und Regelspalte1 gearbeitet.
Zur Definition der Spalten der ausgewählten Tabelle ist folgende Syntax notwendig:
- Spaltenwert: <Spaltenname>
Um die Regeln dauerhaft zu speichern, verwenden Sie den Button Regeln spei-
chern.
Zur Verwendung der Regeln müssen diese nach erfolgter Speicherung mit dem But-
ton Regeln laden geladen werden.
43
Die Auswahl der Regeln erfolgt über die Auswahlbox Regelauswahl. Wählen sie
unter dem Feld Namen die gewünschte Regel aus.
44
2.5.3. Verknüpfte Tabellen
Die Analyse Verknüpfte Tabellen erlaubt die Prüfung der referenziellen Integrität
von Spalten zweier Tabellen, die über einen gemeinsamen einspaltigen Referenz-
wert (z.B. Schlüsselkandidaten) mit einander verknüpft werden können. Zur Auswahl
der beiden Tabellen gelangen Sie mit einem Klick auf den Registerreiter Auswahl zu
verknüpften Tabellen.
45
In den Listboxen Tabelle1 und Tabelle2 können Sie die zwei Tabellen auswählen, die
Sie vergleichen möchten. Nach der Auswahl erscheinen die Auswahlboxen für die
Spalten und die Referenzspalten. Sie können die Auswahl der Spalten optional vor-
nehmen oder die Auswahl freilassen, wenn Sie alle Spalten der Tabelle in die Be-
trachtung einfließen lassen möchten. Die Auswahl der Referenzspalten ist notwen-
dig. In Abbildung 82 wurde als Referenzspalte z.B. die Kundennummer ausgewählt.
Nach erfolgter Auswahl bestätigen Sie diese mit dem Button Tabellenauswahl ers-
tellen.
46
Wechseln Sie nun auf den Registerreiter Verknüpfte Tabellen.
Mit Hilfe der Buttons Schnittmenge, Nicht in Tabelle <Tabelle1> und Nicht in Ta-
belle <Tabelle2> können Sie sehen, welche Referenzwerte in beiden Tabellen oder
nur in jeweils einer Tabelle vorkommen.
Beim Klick auf den Button Nicht in Tabelle Bestellungen in unserem Beispiel, wer-
den diejenigen Werte herausgesucht, die eine Referenz in der Tabelle Kunden, aber
nicht in der Tabelle Bestellungen haben.
47
Abbildung 86: Auswahl Nicht in Tabelle Bestellungen
In dem Bespiel ist ersichtlich, dass es für genau zwei Kunden keine Bestellungen
gibt. Bei Klick auf den Button Schnittmenge werden diese zwei Kunden nicht ange-
zeigt.
48
3. Übungsbeispiele
3.1. Formatanalysen bei PLZ-Daten
1. Zunächst müssen alle Datensätze, die das Land USA enthalten, in den Kun-
dendaten identifiziert werden. Folgen Sie hierfür der nachfolgenden Anleitung
von Schritt 2 bis 7. Die eigentliche Analyse beginnt ab Schritt 8.
3. Klicken Sie auf die Titelleiste der Listbox Spalten und tippen sie auf der Tasta-
tur das Wort „Land“. Wählen sie die Spalte Land.
4. Selektieren Sie in der Listbox Wert den Wert USA. Durch diese Einschrän-
kung ist nun keine direkte Formatanalyse der Postleitzahlen für alle Kunden in
den USA möglich, wie in Abbildung 87 verdeutlicht.
5. Um nun alle Datensätze der Kunden aus den USA für die Postleitzahlenaus-
wahl zu fixieren und auf das Format der Postleitzahlen zugreifen zu können,
nutzen wir die Primärschlüssel als eindeutiges Attribut. Klicken Sie in der Mul-
tibox mit der rechten Maustaste auf Primärschlüssel und wählen sie im Kon-
textmenü Wählbare Werte auswählen. Wiederholen Sie den Vorgang und
klicken Sie im Kontextmenü auf Auswahl sperren.
6. Nun kann die Auswahl der Tabelle und des Landes wieder aufgehoben wer-
den. Klicken Sie dazu Auswahl aufheben in der Symbolleiste. Die Datensät-
ze mit dem Land USA bleiben durch die Sperrung der Primärschlüssel erhal-
ten.
7. Wählen Sie jetzt in der Listbox Spalten die Spalte PLZ, wie nachfolgend in der
Abbildung 88 zu sehen.
49
8. Klicken Sie auf Formatvorkommen und beginnen Sie Ihre Analyse. Sie se-
hen nun alle im Feld PLZ vorhandenen Formate (Muster) für Kunden in den
USA und können prüfen, welche korrekt und welche nicht korrekt sind.
9. Sofern Sie weitere Analysen vornehmen möchten, vergessen Sie nicht, die
Sperrung über den Button Freigeben aufzuheben und die Auswahl über den
Button Auswahl aufheben zu löschen.
2. Unter der Listbox Tabellen finden Sie die Anzahl der Datensätze in der Tabel-
le „Kunden“. Handelt es sich um ein Schlüsselattribut beziehungsweise um ei-
nen Schlüsselkandidaten, müssen die Werte der gesuchten Spalte eindeutig
sein. Das bedeutet, jeder Wert darf nur genau einmal vorkommen.
50
3.3. Wertvorkommen
1. Wählen Sie auf dem Registerblatt Wertvorkommen in der Listbox Spalten
die Spalte Bestelldatum aus.
3. Die identifizierten falschen Datensätze können z.B. nach Excel exportiert oder
ausgedruckt werden. Für den Excel-Export finden Sie ein Symbol XL, für Dru-
cken ein kleines Drucker-Symbol in der Titelleiste der Analyse Wertvorkom-
men.
51
3.4. Nullwert-Analyse
1. In der Analyse Auswertungen allgemein kann in der Spalte Null-Werte, die
Verteilung der Null-Werte analysiert werden.
52