Sie sind auf Seite 1von 80

Informatica Datenqualitt (Fassung 9.1.

0 HotFix 3)

Kurzanleitung

Informatica Datenqualitt Kurzanleitung Fassung 9.1.0 HotFix 3 Dezember 2011 Copyright (c) 1998-2011 Informatica. Alle Rechte vorbehalten. Diese Software und die zugehrige Dokumentation enthalten proprietre Informationen der Informatica Corporation, werden unter einem Lizenzvertrag mit Einschrnkungen hinsichtlich Verwendung und Verffentlichung zur Verfgung gestellt und sind urheberrechtlich geschtzt. Das Zurckentwickeln der Software ist untersagt. Ohne ausdrckliche schriftliche Genehmigung der Informatica Corporation darf kein Teil dieses Dokuments zu irgendeinem Zweck vervielfltigt oder bertragen werden, unabhngig davon, auf welche Art und Weise oder mit welchen Mitteln (elektronisch, mechanisch, durch Fotokopieren, Aufzeichnen usw.) dies geschieht. Diese Software ist mglicherweise durch US-amerikanische und/oder internationale Patente und weitere angemeldete Patente geschtzt. Die Verwendung, Vervielfltigung oder Verffentlichung der Software durch die US-Regierung unterliegt den Bestimmungen des jeweiligen Softwarelizenzvertrags sowie ggf. den Bestimmungen in DFARS 227.7202-1(a) und 227.7702-3(a) (1995), DFARS 252.227-7013 (1)(ii) (OKT. 1988), FAR 12.212(a) (1995), FAR 52.227-19 oder FAR 52.227-14 (ALT III). Die in diesem Produkt und in dieser Dokumentation enthaltenen Informationen knnen jederzeit ohne vorherige Ankndigung gendert werden. Sollten Sie mit diesem Produkt oder dieser Dokumentation Probleme haben, teilen Sie uns dies bitte schriftlich mit. Informatica, Informatica Platform, Informatica Data Services, PowerCenter, PowerCenterRT, PowerCenter Connect, PowerCenter Data Analyzer, PowerExchange, PowerMart, Metadata Manager, Informatica Data Quality, Informatica Data Explorer, Informatica B2B Data Transformation, Informatica B2B Data Exchange Informatica On Demand, Informatica Identity Resolution, Informatica Application Information Lifecycle Management, Informatica Complex Event Processing, Ultra Messaging und Informatica Master Data Management sind Marken oder eingetragene Marken der Informatica Corporation in den USA und anderen Lndern. Alle weiteren Firmen- und Produktnamen sind mglicherweise Handelsbezeichnungen oder Marken der jeweiligen Eigentmer. Teile dieser Software und/oder Dokumentation sind durch die Urheberrechte Dritter geschtzt, einschlielich und ohne Einschrnkung: Copyright DataDirect Technologies. Alle Rechte vorbehalten. Copyright Sun Microsystems. Alle Rechte vorbehalten. Copyright RSA Security Inc. Alle Rechte vorbehalten. Copyright Ordinal Technology Corp. Alle Rechte vorbehalten. Copyright Aandacht c.v. Alle Rechte vorbehalten. Copyright Genivia, Inc. Alle Rechte vorbehalten. Copyright Isomorphic Software. Alle Rechte vorbehalten. Copyright Meta Integration Technology, Inc. Alle Rechte vorbehalten. Copyright Intalio. Alle Rechte vorbehalten. Copyright Oracle. Alle Rechte vorbehalten. Copyright Adobe Systems Incorporated. Alle Rechte vorbehalten. Copyright DataArt, Inc. Alle Rechte vorbehalten. Copyright ComponentSource. Alle Rechte vorbehalten. Copyright Microsoft Corporation. Alle Rechte vorbehalten. Copyright Rouge Wave Software, Inc. Alle Rechte vorbehalten. Copyright Teradata Corporation. Alle Rechte vorbehalten. Copyright Yahoo! Inc. Alle Rechte vorbehalten. Copyright Glyph & Cog, LLC. Alle Rechte vorbehalten. Copyright Thinkmap, Inc. Alle Rechte vorbehalten.. Copyright Clearpace Software Limited. Alle Rechte vorbehalten. Copyright Information Builders, Inc. Alle Rechte vorbehalten. Copyright OSS Nokalva, Inc. Alle Rechte vorbehalten.. Copyright Edifecs, Inc. Alle Rechte vorbehalten.. Copyright Cleo Communications, Inc. Alle Rechte vorbehalten. Copyright International Organization for Standardization 1986. Alle Rechte vorbehalten. Copyright ej-technologies GmbH . Alle Rechte vorbehalten. Copyright Jaspersoft Corporation. Alle Rechte vorbehalten. Dieses Produkt enthlt Software, die von der Apache Software Foundation (http://www.apache.org/) entwickelt wurde, und andere Software, die unter den Bedingungen des Apache-Lizenzvertrags, Version 2.0, lizenziert ist (Lizenz). Eine Kopie des Lizenzvertrags erhalten Sie unter http://www.apache.org/licenses/LICENSE-2.0. Die unter dem Lizenzvertrag vertriebene Software wird WIE BESEHEN, OHNE JEGLICHE GEWHRLEISTUNG, weder ausdrcklich noch konkludent, vertrieben, es sei denn, dies wird durch anwendbares Recht angeordnet oder schriftlich vereinbart. Berechtigungen und Einschrnkungen fr bestimmte Sprachen finden Sie in der Lizenz. Dieses Produkt enthlt Software, die von Mozilla (http://www.mozilla.org/) entwickelt wurde, Software Copyright The JBoss Group, LLC. Alle Rechte vorbehalten; Software Copyright 1999-2006 by Bruno Lowagie und Paulo Soares, und andere Software, die gem dem GNU Lesser General Public License Agreement unter http://www.gnu.org/licenses/lgpl.html lizenziert ist. Die Materialien werden wie besehen kostenlos von Informatica bereitgestellt, ohne ausdrckliche oder stillschweigende Gewhrleistung, einschlielich, jedoch nicht beschrnkt auf die stillschweigenden Gewhrleistungen der Handelsblichkeit und der Eignung fr einen bestimmten Zweck. Das Produkt enthlt ACE(TM) und TAO(TM) Software, Copyright Douglas C. Schmidt und seine Forschungsgruppe an der Washington University, University of California, Irvine und Vanderbilt University, Copyright ( ) 1993-2006. Alle Rechte vorbehalten. Dieses Produkt enthlt Software, die von OpenSSL Project zur Verwendung im OpenSSL Toolkit entwickelt wurde (Copyright The OpenSSL Project. Alle Rechte vorbehalten). Die erneute Verteilung dieser Software unterliegt den Bedingungen, die unter http://www.openssl.org und http://www.openssl.org/source/license.html einsehbar sind. Dieses Produkt enthlt urheberrechtlich geschtzte Curl-Software (Copyright 1996-2007, Daniel Stenberg, <daniel@haxx.se>). Alle Rechte vorbehalten. Die mit dieser Software verbundenen Berechtigungen und Einschrnkungen unterliegen den unter http://curl.haxx.se/docs/copyright.html verfgbaren Bedingungen. Die Erlaubnis, diese Software fr jeden beliebigen Zweck gegen Gebhr oder kostenlos zu verwenden, zu kopieren, zu ndern und zu verteilen, wird hiermit erteilt, sofern die oben genannten urheberrechtlichen Hinweise und diese Erlaubnis in allen Exemplaren angegeben werden. Das Produkt enthlt Software, Copyright 2001-2005 ( ) MetaStuff, Ltd. Alle Rechte vorbehalten. Die mit dieser Software verbundenen Berechtigungen und Einschrnkungen unterliegen den unter http:///www.dom4j.org/license.html einsehbaren Bedingungen. Das Produkt enthlt Software mit dem Copyright 2004-2007, The Dojo Foundation. Alle Rechte vorbehalten. Die mit dieser Software verbundenen Berechtigungen und Einschrnkungen unterliegen den unter http://dojotoolkit.org/license einsehbaren Bedingungen. Dieses Produkt enthlt urheberrechtlich geschtzte ICU-Software, Copyright International Business Machines Corporation und andere. Alle Rechte vorbehalten. Die mit dieser Software verbundenen Berechtigungen und Einschrnkungen unterliegen den unter http://source.icu-project.org/repos/icu/icu/trunk/license.html einsehbaren Bedingungen. Dieses Produkt enthlt Software, Copyright 1996-2006 Per Bothner. Alle Rechte vorbehalten. Das Ihnen erteilte Recht, diese Materialien zu verwenden, unterliegt den unter http://www.gnu.org/software/ kawa/Software-License.html einsehbaren Bedingungen. Dieses Produkt enthlt urheberrechtlich geschtzte OSSP UUID-Software (Copyright 2002 Ralf S. Engelschall, Copyright 2002 The OSSP Project Copyright 2002 Cable & Wireless Deutschland). Die mit dieser Software verbundenen Berechtigungen und Einschrnkungen unterliegen den unter http://www.opensource.org/licenses/ mit-license.php einsehbaren Bedingungen. Dieses Produkt enthlt Software, die von Boost (http://www.boost.org/) oder unter der Softwarelizenz von Boost entwickelt wurde. Die mit dieser Software verbundenen Berechtigungen und Einschrnkungen unterliegen den unter http://www.boost.org/LICENSE_1_0.txt einsehbaren Bedingungen. Dieses Produkt enthlt Software, Copyright 1997-2007 University of Cambridge. Die mit dieser Software verbundenen Berechtigungen und Einschrnkungen unterliegen den unter http://www.pcre.org/license.txt einsehbaren Bedingungen. Dieses Produkt enthlt Software, Copyright 2007 The Eclipse Foundation. Alle Rechte vorbehalten. Die mit dieser Software verbundenen Berechtigungen und Einschrnkungen unterliegen den unter http://www.eclipse.org/org/documents/epl-v10.php einsehbaren Bedingungen. Dieses Produkt enthlt Software, deren Lizenzbedingungen unter http://www.tcl.tk/software/tcltk/license.html, http://www.bosrup.com/web/overlib/?License, http:// www.stlport.org/doc/ license.html, http://www.asm.ow2.org/license.html, http://www.cryptix.org/LICENSE.TXT, http://hsqldb.org/web/hsqlLicense.html, http:// httpunit.sourceforge.net/doc/ license.html, http://jung.sourceforge.net/license.txt, http://www.gzip.org/zlib/zlib_license.html, http://www.openldap.org/software/release/ license.html, http://www.libssh2.org, http://slf4j.org/license.html, http://www.sente.ch/software/OpenSourceLicense.html, http://fusesource.com/downloads/licenseagreements/fuse-message-broker-v-5-3- license-agreement; http://antlr.org/license.html; http://aopalliance.sourceforge.net/; http://www.bouncycastle.org/licence.html; http://www.jgraph.com/jgraphdownload.html; http://www.jcraft.com/jsch/LICENSE.txt; http://jotm.objectweb.org/bsd_license.html; http://www.w3.org/Consortium/Legal/ 2002/copyright-software-20021231; http://www.slf4j.org/license.html; http://developer.apple.com/library/mac/#samplecode/HelpHook/Listings/HelpHook_java.html; http:// www.jcraft.com/jsch/LICENSE.txt; http://nanoxml.sourceforge.net/orig/copyright.html; http://www.json.org/license.html; http://forge.ow2.org/projects/javaservice/, http:// www.postgresql.org/about/licence.html, http://www.sqlite.org/copyright.html, http://www.tcl.tk/software/tcltk/license.html, http://www.jaxen.org/faq.html, http:// www.jdom.org/docs/faq.html und http://www.slf4j.org/license.html einsehbar sind. Dieses Produkt enthlt Software, die unter der Academic Free License (http://www.opensource.org/licenses/afl-3.0.php), der Common Development and Distribution License (http://www.opensource.org/licenses/cddl1.php), der Common Public License (http://www.opensource.org/licenses/cpl1.0.php), den Sun Binary Code License

Agreement Supplemental License Terms, der BSD License (http:// www.opensource.org/licenses/bsd-license.php), der MIT License (http://www.opensource.org/licenses/ mit-license.php) und der Artistic License (http://www.opensource.org/licenses/artistic-license-1.0) lizensiert ist. Dieses Produkt enthlt Software, Copyright 2003-2006 Joe WaInes, 2006-2007 XStream Committers. Alle Rechte vorbehalten. Die mit dieser Software verbundenen Berechtigungen und Einschrnkungen unterliegen den unter http://xstream.codehaus.org/license.html verfgbaren Bedingungen. Dieses Produkt enthlt Software, die von der Indiana University Extreme! Lab. entwickelt wurde. Weitere Informationen finden Sie unter http://www.extreme.indiana.edu/. Diese Software ist durch die US-amerikanischen Patente Nummer 5.794.246, 6.014.670, 6.016.501, 6.029.178, 6.032.158, 6.035.307, 6.044.374, 6.092.086, 6.208.990, 6.339.775, 6.640.226, 6.789.096, 6.820.077, 6.823.373, 6.850.947, 6.895.471, 7.117.215, 7.162.643, 7.254.590, 7.281.001, 7.421.458, 7.496.588, 7.523.121, 7.584.422, 7.720.842, 7.721.270 sowie 7.774.791, internationale Patente und andere angemeldete Patente geschtzt. HAFTUNGSAUSSCHLUSS: Informatica Corporation stellt diese Dokumentation wie besehen bereit, ohne ausdrckliche oder stillschweigende Gewhrleistung, einschlielich, jedoch nicht beschrnkt auf die Gewhrleistungen der Nichtverletzung der Rechte von Dritten, der Handelsblichkeit oder Eignung fr einen bestimmten Zweck. Informatica Corporation gewhrleistet nicht die Fehlerfreiheit dieser Software oder Dokumentation. Die in dieser Software oder Dokumentation bereitgestellten Informationen knnen technische Ungenauigkeiten oder Druckfehler enthalten. Die in dieser Software und in dieser Dokumentation enthaltenen Informationen knnen jederzeit ohne vorherige Ankndigung gendert werden. HINWEISE Dieses Informatica-Produkt (die Software) umfasst bestimmte Treiber (die DataDirect-Treiber) von DataDirect Technologies, einem Betreiber von Progress Software Corporation (DataDirect), die folgenden Bedingungen und Bestimmungen unterliegen: 1. DIE DATADIRECT-TREIBER WERDEN WIE GESEHEN OHNE JEGLICHE GEWHRLEISTUNG, WEDER AUSDRCKLICH NOCH STILLSCHWEIGEND, BEREITGESTELLT, EINSCHLIESSLICH, JEDOCH NICHT BESCHRNKT AUF DIE STILLSCHWEIGENDEN GEWHRLEISTUNGEN DER HANDELSBLICHKEIT, EIGNUNG FR EINEN BESTIMMTEN ZWECK UND DER NICHTVERLETZUNG VON RECHTEN DRITTER. 2. IN KEINEM FALL SIND DATADIRECT ODER DRITTANBIETER DEM ENDBENUTZER GEGENBER HAFTBAR FR UNMITTELBARE, MITTELBARE, KONKRETE, NEBEN-, FOLGE- ODER ANDERE SCHDEN, DIE SICH AUS DER VERWENDUNG DER ODBC-TREIBER ERGEBEN, UNABHNGIG DAVON, OB SIE IM VORAUS BER DIE MGLICHKEIT SOLCHER SCHDEN INFORMIERT WORDEN SIND ODER NICHT. DIESE BESCHRNKUNGEN GELTEN FR ALLE KLAGEGEGENSTNDE, EINSCHLIESSLICH, JEDOCH NICHT BESCHRNKT AUF VERTRAGSBRUCH, GEWHRLEISTUNGSBRUCH, FAHRLSSIGKEIT, KAUSALHAFTUNG, FALSCHDARSTELLUNG UND ANDERE UNERLAUBTE HANDLUNGEN. Teilenummer: IN-QSG-91000-HF3-0001

Inhalt
Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . v
Informatica-Ressourcen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . v Informatica-Kundenportal. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . v Informatica-Dokumentation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . v Informatica-Website. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . v Informatica-How-To-Bibliothek. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . v Informatica-Knowledge-Datenbank. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vi Informatica-Multimedia-Knowledge-Datenbank . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vi Informatica Weltweiter Kundensupport. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vi

Kapitel 1: Erste Schritte - bersicht. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1


Informatica-Domnenbersicht. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 Verfgbarkeit von Funktionen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 Einfhren von Informatica Analyst. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 Informatica Developer - bersicht. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 Informatica Developer -Begrungsseite. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 Spickzettel. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 Data Quality und Data Explorer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 Die Tutorial-Story. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 Die Tutorial-Struktur. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 Informatica Analyst-Tutorial. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 Informatica Developer Tool. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 Voraussetzungen fr das Tutorial. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

Teil I: Erste Schritte mit Informatica Analyst. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 Kapitel 2: Lektion 1. Einrichten von Informatica Analyst. . . . . . . . . . . . . . . . . . . . 12
Einrichten von Informatica Analyst - bersicht. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 Aufgabe 1. Anmelden bei Informatica Analyst. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 Aufgabe 2. Ein Projekt erstellen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 Aufgabe 3 Einen Ordner erstellen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 Einrichten von Informatica Analyst - Zusammenfassung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

Kapitel 3: Lektion 2. Erstellen von Datenobjekten. . . . . . . . . . . . . . . . . . . . . . . . . 15


Erstellen von Datenobjekten - bersicht. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 Aufgabe 1. Erstellen der Einfachdatei-Datenobjekte. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 Aufgabe 2 Datenvorschau. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 Erstellen von Datenobjekten - Zusammenfassung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

Kapitel 4: Lektion 3. Erstellen von Schnellprofilen. . . . . . . . . . . . . . . . . . . . . . . . . 18


Erstellen von Schnellprofilen - bersicht. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 Aufgabe 1 Erstellen und Ausfhren eines Schnellprofils. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 Aufgabe 2 Anzeigen der Profilergebnisse. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

Inhalt

Erstellen von Schnellprofilen - Zusammenfassung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

Kapitel 5: Lektion 4. Erstellen von Kundenprofilen. . . . . . . . . . . . . . . . . . . . . . . . 21


Erstellen von benutzerdefinierten Profilen - bersicht. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 Aufgabe 1 Erstellen eines benutzerdefinierten Profils. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 Aufgabe 2 Ausfhren des Profils. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 Aufgabe 3 Drilldown der Profilergebnisse. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 Erstellen von benutzerdefinierten Profilen - Zusammenfassung. . . . . . . . . . . . . . . . . . . . . . . . . 23

Kapitel 6: Lektion 5. Erstellen von Expressionsregeln. . . . . . . . . . . . . . . . . . . . . . 24


Erstellen von Expressionsregeln - bersicht. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 Aufgabe 1 Erstellen von Expressionsregeln und Ausfhren des Profils. . . . . . . . . . . . . . . . . . . . 25 Aufgabe 2 Anzeigen der Ausgabe der Expressionsregel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 Aufgabe 3 Bearbeiten von Expressionsregeln. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 Erstellen von Expressionsregeln - Zusammenfassung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26

Kapitel 7: Lektion 6. Erstellen und Ausfhren von Scorecards. . . . . . . . . . . . . . . 27


Erstellen und Ausfhren von Scorecards - bersicht. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 Aufgabe 1 Erstellen einer Scorecard aus den Profilergebnissen. . . . . . . . . . . . . . . . . . . . . . . . 28 Aufgabe 2 Ausfhren der Scorecard. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 Aufgabe 3 Anzeigen der Scorecard. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 Aufgabe 4 Bearbeiten der Scorecard. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 Aufgabe 5 Konfigurieren von Schwellenwerten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 Aufgabe 6 Anzeigen von Score-Trenddiagrammen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 Erstellen und Ausfhren von Scorecards - Zusammenfassung. . . . . . . . . . . . . . . . . . . . . . . . . 30

Kapitel 8: Lektion 7. Erstellen von Referenztabellen aus Profilspalten . . . . . . . . 31


Erstellen von Referenztabellen aus Profilspalten - bersicht. . . . . . . . . . . . . . . . . . . . . . . . . . 31 Aufgabe 1 Erstellen einer Referenztabelle aus Profilspalten. . . . . . . . . . . . . . . . . . . . . . . . . . . 32 Aufgabe 2 Bearbeiten der Referenztabelle. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 Erstellen von Referenztabellen aus Profilspalten - Zusammenfassung. . . . . . . . . . . . . . . . . . . . 33

Kapitel 9: Lektion 8. Erstellen von Referenztabellen. . . . . . . . . . . . . . . . . . . . . . . 34


Erstellen von Referenztabellen - bersicht. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34 Aufgabe 1 Erstellen einer neuen Referenztabelle. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 Erstellen von Referenztabellen - Zusammenfassung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

Teil II: Inbetriebnahme des Informatica Developer. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 Kapitel 10: Lektion 1. Einrichten von Informatica Developer. . . . . . . . . . . . . . . . . 37
Einrichten von Informatica Developer - bersicht. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 Aufgabe 1 Informatica Developer starten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 Aufgabe 2 Eine Domne hinzufgen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 Aufgabe 3 Ein Model Repository hinzufgen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 Aufgabe 4 Ein Projekt erstellen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 Aufgabe 5 Einen Ordner erstellen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 Aufgabe 6 Standard-Data Integration Service auswhlen.. . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

ii

Inhalt

Einrichten von Informatica Developer - Zusammenfassung. . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

Kapitel 11: Lektion 2. Importieren von physischen Datenobjekten . . . . . . . . . . . . 41


Importieren von physischen Datenobjekten - bersicht. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 Aufgabe 1 Importieren des Einfachdatei-Datenobjekts Boston_Customers. . . . . . . . . . . . . . . . . . 42 Aufgabe 2 Import des Einfachdatei-Datenobjekts LA_Customers. . . . . . . . . . . . . . . . . . . . . . . . 42 Aufgabe 3 Importieren des Einfachdatei-Datenobjekts All_Customers. . . . . . . . . . . . . . . . . . . . . 43 Importieren von physischen Datenobjekten - Zusammenfassung. . . . . . . . . . . . . . . . . . . . . . . . 44

Kapitel 12: Lektion 3. Profiling von Daten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45


Profiling von Daten - bersicht. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 Aufgabe 1 Durchfhren einer Join-Analyse mit zwei Datenquellen . . . . . . . . . . . . . . . . . . . . . . 46 Aufgabe 2 Anzeigen der Ergebnisse einer Join-Analyse. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47 Aufgabe 3 Ausfhren eines Profils fr eine Datenquelle. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47 Aufgabe 4 Anzeigen von Ergebnissen des Spalten-Profiling . . . . . . . . . . . . . . . . . . . . . . . . . . 48 Profiling von Daten - Zusammenfassung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

Kapitel 13: Lektion 4. Parsen von Daten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49


Parsen von Daten - bersicht. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 Aufgabe 1. Erstellen eines Target-Datenobjekts. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50 Schritt 1. Erstellen eines Datenobjekts LA_Customers_tgt . . . . . . . . . . . . . . . . . . . . . . 50 Schritt 2. Konfigurieren der Lesen- und Schreiben-Optionen. . . . . . . . . . . . . . . . . . . . . 51 Schritt 3. Hinzufgen von Spalten zum Datenobjekt. . . . . . . . . . . . . . . . . . . . . . . . . . 51 Aufgabe 2. Erstellen eines Mappings zum Parsen von Daten. . . . . . . . . . . . . . . . . . . . . . . . . . 51 Schritt 1. Erstellen eines Mappings. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52 Schritt 2. Hinzufgen von Datenobjekten zum Mapping. . . . . . . . . . . . . . . . . . . . . . . . 52 Schritt 3. Hinzufgen einer Parser-Umwandlung zum Mapping. . . . . . . . . . . . . . . . . . . 52 Schritt 4. Konfigurieren der Parser-Umwandlung. . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 Aufgabe 3. Ausfhren eines Profils fr die Parser-Umwandlung. . . . . . . . . . . . . . . . . . . . . . . . 53 Aufgabe 4. Ausfhren des Mappings. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54 Aufgabe 5. Anzeigen der Mapping-Ausgabe. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54 Parsen von Daten - Zusammenfassung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

Kapitel 14: Lektion 5. Standardisieren von Daten . . . . . . . . . . . . . . . . . . . . . . . . . 55


Standardisieren von Daten - bersicht. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 Aufgabe 1. Erstellen eines Target-Datenobjekts. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56 Schritt 1. Erstellen eines Datenobjekts All_Customers_Stdz_tgt. . . . . . . . . . . . . . . . . . 56 Schritt 2. Konfigurieren der Lesen- und Schreiben-Optionen. . . . . . . . . . . . . . . . . . . . . 57 Aufgabe 2 Erstellen eines Mappings zum Standardisieren von Daten. . . . . . . . . . . . . . . . . . . . . 57 Schritt 1. Erstellen eines Mappings. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57 Schritt 2. Hinzufgen von Datenobjekten zum Mapping. . . . . . . . . . . . . . . . . . . . . . . . 58 Schritt 3. Hinzufgen einer Standardisierer-Umwandlung zum Mapping. . . . . . . . . . . . . 58 Schritt 4. Konfigurieren der Standardisierer-Umwandlung. . . . . . . . . . . . . . . . . . . . . . 59 Aufgabe 3. Ausfhren des Mappings. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 Aufgabe 4. Anzeigen der Mapping-Ausgabe. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60 Standardisieren von Daten - Zusammenfassung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

Inhalt

iii

Kapitel 15: Lektion 6. Validieren von Adressdaten. . . . . . . . . . . . . . . . . . . . . . . . . 61


Validieren von Adressdaten - bersicht. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 Aufgabe 1 Erstellen eines Target-Datenobjekts . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62 Schritt 1. Erstellen des Datenobjekts All_Customers_av_tgt . . . . . . . . . . . . . . . . . . . . 62 Schritt 2. Konfigurieren der Lesen- und Schreiben-Optionen. . . . . . . . . . . . . . . . . . . . . 63 Schritt 3. Hinzufgen von Ports zum Datenobjekt. . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 Aufgabe 2 Erstellen eines Mappings zum Validieren von Adressen. . . . . . . . . . . . . . . . . . . . . . 64 Schritt 1. Erstellen eines Mappings. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64 Schritt 2. Hinzufgen von Datenobjekten zum Mapping. . . . . . . . . . . . . . . . . . . . . . . . 64 Schritt 3. Hinzufgen einer Adressvalidierer-Umwandlung zum Mapping. . . . . . . . . . . . . 65 Aufgabe 3. Konfigurieren der Adressvalidierer-Umwandlung. . . . . . . . . . . . . . . . . . . . . . . . . . . 65 Schritt 1. Einstellen des Standardadressen-Referenzdatensatzes. . . . . . . . . . . . . . . . . 65 Schritt 2. Konfigurieren der Eingabeports der Adressvalidierer-Umwandlung. . . . . . . . . . 65 Schritt 3. Konfigurieren der Ausgabe-Ports der Adressvalidierer-Umwandlung. . . . . . . . . 66 Schritt 4. Verbinden unbenutzter Datenquellenports mit dem Daten-Target. . . . . . . . . . . 67 Aufgabe 4. Ausfhren des Mappings. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68 Aufgabe 5. Anzeigen der Mapping-Ausgabe. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68 Validieren von Adressdaten - Zusammenfassung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69

Anhang A: Hufig gestellte Fragen (FAQ). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70


FAQs zu Informatica Analyst . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70 Informatica Developer - Hufig gestellte Fragen (FAQ). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70

iv

Inhalt

Einleitung
Die Kurzanleitung fr die Datenqualitt wurde fr Datenqualitts-Entwickler und Analytiker geschrieben. Sie enthlt Tutorials, um Einsteigern die Anwendung von Informatica Developer und Informatica Analyst zu erleichtern. Diese Anleitung geht davon aus, dass Ihnen die Datenqualittskonzepte, die Konzepte von Flatfiles und relationalen Datenbanken sowie die Datenbank-Engines in Ihrer Umgebung bekannt sind.

Informatica-Ressourcen
Informatica-Kundenportal
Als Informatica-Kunde knnen Sie auf die Website fr das Informatica-Kundenportal unter http://mysupport.informatica.com zugreifen. Die Site enthlt Produktinformationen, Benutzergruppeninformationen sowie Newsletters und bietet Zugriff auf das Informatica-Verwaltungssystem fr den Kundensupport (ATLAS), die Informatica-How-To-Bibliothek, die Informatica-Multimedia-KnowledgeDatenbank, die Informatica-Produktdokumentation und die Informatica User Community.

Informatica-Dokumentation
Das Informatica-Dokumentationsteam ist sehr um genaue, brauchbare Dokumentationen bemht. Wenn Sie Fragen, Kommentare oder Ideen zu dieser Dokumentation haben, wenden Sie sich bitte per E-Mail an das Informatica-Dokumentationsteam unter infa_documentation@informatica.com. Mithilfe Ihrer Rckmeldungen knnen wir unsere Dokumentationen verbessern. Bitte teilen Sie uns mit, ob wir Sie bezglich Ihrer Kommentare kontaktieren drfen. Das Dokumentationsteam aktualisiert die Dokumentation nach Bedarf. Um die neueste Dokumentation zu erhalten, navigieren Sie von http://mysupport.informatica.com zur Produktdokumentation.

Informatica-Website
Auf die Unternehmenswebsite von Informatica knnen Sie unter http://www.informatica.com zugreifen. Auf der Website finden Sie Informationen ber Informatica, seinen Hintergrund, bevorstehende Veranstaltungen und Niederlassungen. Darber hinaus finden Sie dort Produkt- und Partnerinformationen. Der Bereich Services enthlt wichtige Informationen zur technischen Untersttzung, zu Schulungen und zu den Implementierungsdienstleistungen.

Informatica-How-To-Bibliothek
Als Informatica-Kunde knnen Sie auf die Informatica-How-To-Bibliothek unter http://mysupport.informatica.com zugreifen. Die How-To-Bibliothek ist eine Ressourcensammlung, die Ihnen hilft, mehr ber Informatica-Produkte und -Funktionen zu erfahren. Sie umfasst Artikel und interaktive Demonstrationen, die Lsungen fr hufige Probleme bieten, Funktionen und Verhaltensweisen vergleichen und Sie durch spezifische realittsnahe Aufgaben fhren.

Informatica-Knowledge-Datenbank
Als Informatica-Kunde knnen Sie auf die Informatica-Knowledge-Datenbank unter http://mysupport.informatica.com zugreifen. In der Knowledge-Datenbank knnen Sie nach dokumentierten Lsungen zu bekannten technischen Problemen mit Informatica-Produkten suchen. Auerdem finden Sie dort Antworten auf hufig gestellte Fragen sowie technische Whitepapers und Tipps. Wenn Sie Fragen, Kommentare oder Ideen zur Knowledge-Datenbank haben, wenden Sie sich bitte per E-Mail an das Informatica-Knowledge-Datenbankteam unter KB_Feedback@informatica.com.

Informatica-Multimedia-Knowledge-Datenbank
Als Informatica-Kunde knnen Sie auf die Informatica-Multimedia-Knowledge-Datenbank unter http://mysupport.informatica.com zugreifen. Die Multimedia-Knowledge-Datenbank ist eine Sammlung von Multimedia-Schulungsdateien, mit denen Sie hufig verwendete Konzepte erlernen knnen und die Sie durch spezifische Aufgaben fhren. Wenn Sie Fragen, Kommentare oder Ideen zur Multimedia-KnowledgeDatenbank haben, wenden Sie sich bitte per E-Mail an das Informatica-Knowledge-Datenbankteam unter KB_Feedback@informatica.com.

Informatica Weltweiter Kundensupport


Sie knnen sich telefonisch oder ber den Online-Support an ein Kundensupport-Center wenden. Der OnlineSupport erfordert einen Benutzernamen und ein Passwort. Beides erhalten Sie unter http://mysupport.informatica.com. Telefonisch knnen Sie den weltweiten Kundensupport von Informatica unter folgenden Telefonnummern erreichen:
Nordamerika / Sdamerika Gebhrenfrei Brasilien: 0800 891 0202 Mexiko: 001 888 209 8853 Nordamerika: +1 877 463 2435 Europa / Naher Osten / Afrika Gebhrenfrei Frankreich: 0805 804632 Deutschland: 0800 5891281 Italien: 800 915 985 Niederlande: 0800 2300001 Portugal: 800 208 360 Spanien: 900 813 166 Schweiz: 0800 463 200 Grobritannien und Nordirland: 0800 023 4632 Standardtarif Indien: +91 80 4112 5738 Asien / Australien Gebhrenfrei Australien: 1 800 151 830 Neuseeland: 09 9 128 901

Standardtarif Belgien: +31 30 6022 797 Frankreich: +33 1 4138 9226 Deutschland: +49 1805 702 702 Niederlande: +31 306 022 797 Grobritannien und Nordirland: +44 1628 511445

vi

Einleitung

KAPITEL 1

Erste Schritte - bersicht


Dieses Kapitel umfasst die folgenden Themen:
Informatica-Domnenbersicht, 1 Einfhren von Informatica Analyst, 4 Informatica Developer - bersicht, 5 Die Tutorial-Story, 7 Die Tutorial-Struktur, 8

Informatica-Domnenbersicht
Informatica verfgt ber eine dienstorientierte Architektur, die die Fhigkeit zur Skalierung von Diensten und zum gemeinsamen Nutzen von Ressourcen ber mehrere Rechner aufweist. Die Informatica-Domne ist die primre Einheit zur Verwaltung und Administration von Diensten. Informatica enthlt folgende Komponenten:
Anwendungs-Clients. Eine Gruppe von Clients, die Sie nutzen, um auf die zu Grunde liegende Informatica-

Funktionalitt zuzugreifen. Anwendungs-Clients stellen Anfragen an den Service Manager oder an Anwendungsdienste.
Anwendungsdienste. Eine Gruppe von Diensten, die Funktionalitt auf Serverbasis reprsentieren. Eine

Informatica-Domne kann eine Untergruppe von Anwendungsdiensten enthalten. Sie konfigurieren die Anwendungsdienste, die von den eingesetzten Anwendungs-Clients bentigt werden.
Repositories. Eine Gruppe relationaler Datenbanken, die Metadaten zu Objekten und Prozessen

speichern, die erforderlich sind, um Benutzeranfragen von Anwendungs-Clients abzuarbeiten.


Service Manager. Ein Dienst, der in die Domne integriert ist, um alle Domnenvorgnge zu verwalten.

Der Service Manager fhrt die Anwendungsdienste aus und ist fr Domnenfunktionen wie Authentifizierung, Autorisierung und Anmeldung zustndig. Sie knnen sich an Informatica Administrator (dem Administratortool) anmelden, nachdem Sie Informatica installiert haben. Das Administratortool dient zum Verwalten der Domne und zum Konfigurieren der bentigten Anwendungsdienste, bevor Sie auf die restlichen Anwendungs-Clients zugreifen knnen.

Die folgende Abbildung zeigt die Anwendungsdienste und die Repositories, die jeder Anwendungs-Client in einer Informatica-Domne verwendet:

Die folgende Tabelle prsentiert die Anwendungs-Clients (auer dem Administratortool) sowie die Anwendungsdienste und die Repositories, die der Client bentigt:
Anwendungs-Client Data Analyzer Informatica-Berichterstellung und Dashboards Informatica Analyst Anwendungsdienste Reporting Service Berichterstellungs- und Dashboarddienste - Analyst Service - Data Integration Service - Model Repository Service Analyst Service Content Management Service Data Integration Service Model Repository Service Repositories Data Analyzer Repository Jaspersoft-Repository

Model Repository

Informatica Developer

Model Repository

Metadata Manager

- Metadata Manager Service - PowerCenter Integration Service - PowerCenter Repository Service - PowerCenter Integration Service - PowerCenter Repository Service - PowerCenter Integration Service - PowerCenter Repository Service - Web Services Hub

- Metadata Manager Repository - PowerCenter Repository

PowerCenter Client

PowerCenter Repository

Web Services Hub Console

PowerCenter Repository

Kapitel 1: Erste Schritte - bersicht

Auf folgenden Anwendungsdienste kann ein Informatica Anwendungs-Client nicht zugreifen:


PowerExchange Listener Service. Verwaltet den PowerExchange Listener zur Verschiebung von Bulkdaten

und zur nderung der Datenerfassung. Der PowerCenter Integration Service verbindet sich ber den Listener Service mit PowerExchange Listener.
PowerExchange Logger Service. Verwaltet den PowerExchange Logger fr Linux, UNIX und Windows, um

sich ndernde Daten zu erfassen und in die Protokolldateien des PowerExchange Logger zu schreiben. Sich ndernde Daten knnen aus DB2-Wiederherstellungsprotokollen OracleWiederherstellungsprotokollen, einer verteilten Microsoft-SQL-Server-Datenbank oder Datenquellen auf einem i5/OS- oder z/OS-System stammen.
SAP BW Service. Wartet auf RFC-Anfragen von SAP BI und fordert an, dass der PowerCenter Integration

Service Arbeitsablufe durchfhrt, um von SAP BI Daten zu extrahieren oder Daten auf SAP BI zu laden.

Verfgbarkeit von Funktionen


Informatica-9.1.0-Produkte verwenden einen gemeinsamen Satz von Anwendungen. Die Produktfunktionen, welche Sie nutzen knnen, sind von Ihrer Produktlizenz abhngig. In der folgenden Tabelle finden Sie die Lizenzoptionen und die Funktionen der Anwendung, die bei jeder Option zur Verfgung stehen.
Lizenzoption Data Explorer Informatica Developer-Funktionen - Profiling, das die Nutzung des Profilmodells und die Bestimmung der Primrschlssel-, Fremdschlssel und funktionellen Abhngigkeiten umfasst - Arbeiten mit Scorecards - Erstellen und Ausfhren von Mappings mit allen Umwandlungen - Erstellen und Ausfhren von Regeln - Profiling - Arbeiten mit Scorecards - Exportieren von Objekten an PowerCenter - Erstellen logischer Datenobjektmodelle - Erstellen und Ausfhren von Mappings mit Datendienst-Umwandlungen - Erstellen von SQL-Datendiensten - Erstellen von Web-Diensten - Exportieren von Objekten an PowerCenter - Erstellen logischer Datenobjektmodelle - Erstellen und Ausfhren von Mappings mit Datendienst-Umwandlungen - Erstellen von SQL-Datendiensten - Erstellen von Web-Diensten - Exportieren von Objekten an PowerCenter - Erstellen und Ausfhren von Regeln mit Datendienst-Umwandlungen - Profiling Informatica Analyst-Funktionen - Profiling - Arbeiten mit Scorecards - Erstellen und Ausfhren von Profiling-Regeln - Referenztabellenverwaltung Profiling Arbeiten mit Scorecards Referenztabellenverwaltung Erstellen von Profiling-Regeln Ausfhren von Regeln in Profilen Verwaltung fehlerhafter und mehrfacher Datenstze

Datenqualitt

Datendienste

- Referenztabellenverwaltung

Datendienste und Profiling-Option

- Referenztabellenverwaltung

Informatica-Domnenbersicht

Einfhren von Informatica Analyst


Informatica Analyst ist ein webbasierter Anwendungs-Client-Basis, mit dem Daten in einem Unternehmen analysiert, bereinigt, standardisiert, profiliert und bewertet werden knnen. Wirtschaftsanalysten und Entwickler nutzen Informatica Analyst zur datenorientierten Zusammenarbeit. Sie knnen Spalten- und Regel-Profiling durchfhren, mit Scorecards arbeiten und fehlerhafte sowie mehrfache Datenstze verwalten. Sie knnen auch Referenzdaten verwalten und die Daten Entwicklern in einer Datenqualittslsung zur Verfgung stellen. Verwenden Sie Informatica Analyst zur Durchfhrung folgender Aufgaben:
Profilieren von Daten. Erstellen und Ausfhren eines Profils, um Struktur und Inhalt von

Unternehmensdaten zu analysieren und Strken und Schwchen zu identifizieren. Nachdem Sie ein Profil ausgefhrt haben, knnen Sie ein selektives Drilldown durchfhren, um die zu Grunde liegenden Zeilen aus den Profilergebnissen anzuzeigen. Sie knnen Scorecards auch Spalten hinzufgen und zu Referenztabellen Spaltenwerte hinzufgen.
Erstellen von Regeln in Profilen. Erstellen und Anwenden von Regeln innerhalb von Profilen. Eine Regel ist

wiederverwendbare Geschftslogik, die Bedingungen definiert, welche auf Daten angewendet werden, wenn Sie ein Profil ausfhren. Verwenden Sie Regeln zur weiteren Validierung von Daten in einem Profil und zur Messung des Fortschritts in der Datenqualitt.
Bewerten von Daten. Erstellen Sie Scorecards, um die gltigen Werte aus jedweder Spalte oder die

Ausgabe von Regeln zu bewerten. Scorecards zeigen die Werthufigkeit von Spalten in einem Profil als Scores. Verwenden Sie Scorecards, um Fortschritte in der Datenqualitt zu messen und visuell darzustellen. Sie knnen auch Trenddiagramme anzeigen, um die Historie der Scores im Zeitverlauf anzuzeigen.
Verwalten von Referenzdaten. Verwenden Sie Referenztabellen, um zu berprfen, ob die

Quelldatenwerte genau sind und korrekt formatiert wurden. Sie knnen Referenztabellen aus Einfachdateiund Datenbankdaten erstellen. Sie knnen Informatica-Referenztabellen mit dem Datenqualitts-InhaltsInstaller installieren.
Verwalten von fehlerhaften oder mehrfachen Datenstzen. Reparieren von fehlerhaften Datenstzen und

Konsolidieren von mehrfachen Datenstzen.

Kapitel 1: Erste Schritte - bersicht

Informatica Developer - bersicht


Informatica Developer ist ein Anwendungs-Client, mit dem Entwickler Datenlsungen entwerfen und implementieren knnen. Die folgende Abbildung zeigt das Entwicklertool:

Die Entwicklertool-Workbench zeigt die folgenden Ansichten standardmig an: Ansicht Object Explorer Zeigt Projekte, Ordner und die Objekte in den Projekten und Ordnern an. Wird im oberen linken Bereich des Developer Tools angezeigt. Ansicht Verbindungs-Explorer Zeigt Verbindungen zu relationalen Datenbanken an. Wird im oberen rechten Bereich des Developer Tools angezeigt. Ansicht Outline Zeigt Objekte an, die von einem in der Ansicht Object Explorer ausgewhlten Objekt abhngig sind. Wird im unteren linken Bereich des Developer Tools angezeigt. Eigenschaftenansicht Zeigt die Eigenschaften eines Objekts an, das im Editor im Fokus ist. Wird im unteren Bereich des Developer Tools angezeigt. Sie knnen Ansichten ausblenden und Ansichten an einen anderen Speicherort in der Developer ToolWorkbench verschieben. Klicken Sie auf Fenster > Ansicht anzeigen, um die Ansichten auszuwhlen, die Sie anzeigen mchten. Die Developer Tool-Workbench zeigt auerdem die folgenden Ansichten an: Ansicht Spickzettel Zeigt den Spickzettel an, den Sie ffnen. Um einen Spickzettel zu ffnen, klicken Sie auf Hilfe > Spickzettel, und whlen Sie einen Spickzettel aus.

Informatica Developer - bersicht

Hilfeansicht Zeigt kontextsensitive Onlinehilfe an. Statusansicht Zeigt den Status von Operationen, z. B. einer Mapping-Ausfhrung, im Developer Tool an. Suchansicht Zeigt die Suchergebnisse an. Sie knnen auch das Dialogfeld Suchoptionen starten. Tagansicht Zeigt Tags an, die ein Objekt im Modell-Repository anhand der Unternehmensanwendung definieren. Ansicht Validierungs-Log Zeigt Objektvalidierungsfehler an.

Informatica Developer -Begrungsseite


Die Begrungsseite erscheint, wenn Sie zum ersten Mal das Entwicklertool ffnen. Auf der Begrungsseite erfahren Sie mehr ber das Entwicklertool, wie es eingerichtet wird und wie man beginnt, mit dem Entwicklertool zu arbeiten. Die Begrungsseite zeigt folgende Optionen:
bersicht. Klicken Sie auf bersicht, um eine bersicht ber Datenqualitts- und Datendienstelsungen zu

erhalten.
Erste Schritte. Klicken Sie auf Erste Schritte, um mehr darber zu erfahren, wie das Entwicklertool

eingerichtet wird und auf die Lektionen von Informatica Data Quality und Informatica Data Services zugegriffen wird.
Tutorials. Klicken Sie auf Tutorials, um Tutoriallektionen zu Datenqualitts- und Datendienstelsungen

anzuzeigen.
Internet-Ressourcen. Klicken Sie auf Internet-Ressourcen, um einen Link zu mysupport.informatica.com zu

nutzen. Sie knnen auf die Informatica How-To-Bibliothek zugreifen. Die Informatica How-To-Bibliothek enthlt Artikel ber Informatica Data Quality, Informatica Data Services und andere Produkte von Informatica.
Workbench. Klicken Sie auf Workbench, um mit der Arbeit im Entwicklertool zu beginnen.

Spickzettel
Das Entwicklertool umfasst Spickzettel als Teil der Online-Hilfe. Ein Spickzettel ist eine schrittweise Anleitung, die Ihnen bei der Durchfhrung von einem oder mehreren Tasks im Entwicklertool hilft. Nachdem Sie einen Spickzettel vollstndig ausgefllt haben, fhren Sie die Tasks aus und sehen die Ergebnisse. Nachdem Sie beispielsweise einen Spickzettel zum Importieren und zur Vorschau eines relationalen Datenobjekts vollstndig ausgefllt haben, haben Sie eine Tabelle einer relationalen Datenbank importiert und die Vorschau der Daten im Entwicklertool angezeigt. Um auf die Spickzettel zuzugreifen, klicken Sie auf Hilfe > Spickzettel.

Data Quality und Data Explorer


Verwenden Sie die Datenqualittsfunktionen des Entwicklertools, um den Inhalt und die Struktur Ihrer Daten zu analysieren und die Daten gem den Bedrfnissen Ihres Unternehmens besser nutzen zu knnen. Verwenden Sie das Entwicklertool zum Konzipieren und Durchfhren von Prozessen, mit denen die folgenden Ziele erreicht werden knnen:
Profilieren von Daten. Profiling macht den Inhalt und die Struktur Ihrer Daten erkennbar. Profiling ist ein

Schlsselschritt in jedem Datenprojekt, da es Strken und Schwchen in Ihren Daten identifizieren kann und Sie bei der Definition Ihres Projektplans untersttzt.

Kapitel 1: Erste Schritte - bersicht

Erstellen von Scorecards, um die Datenqualitt zu prfen. Eine Scorecard ist eine grafische Darstellung

der Qualittsmessungen in einem Profil.


Standardisieren von Datenwerten. Standardisieren Sie Daten, um Fehler und Inkonsistenzen zu entfernen,

die Sie finden, indem Sie ein Profil ausfhren. Sie knnen Variationen der Zeichensetzung, Formatierung und Rechtschreibung standardisieren. Sie knnen beispielsweise sicherstellen, dass die Werte fr Stadt, Staat und Postleitzahl konsistent sind.
Parsen von Datenstzen. Parsen Sie Datenstze, um die Datensatzstruktur zu verbessern und weitere

Informationen aus Ihren Daten abzuleiten. Sie knnen ein Einzelfeld mit Freiformdaten in Bereicher teilen, die unterschiedliche Informationstypen enthalten. Sie knnen Ihren Datenstzen auch Informationen hinzufgen. Sie knnen beispielsweise Datenstze von Kunden als persnliche oder Geschftskunden markieren.
Validieren von Postadressen. Die Adressvalidierung bewertet und verbessert die Genauigkeit und

Zustellbarkeit Ihrer Postadressendaten. Die Adressvalidierung korrigiert Fehler in Adressen und komplettiert unvollstndige Adressen, indem die Adressdatenstze mit Referenzdaten von nationalen Zustellern verglichen werden. Die Adressvalidierung kann auch Postinformationen hinzufgen, die die Postzustellung beschleunigen und die Zustellkosten reduzieren.
Nach doppelten Datenstzen suchen. Die Analyse auf doppelte Datenstze vergleicht einen Satz von

Datenstzen miteinander, um hnliche oder bereinstimmende Werte in ausgewhlten Datenspalten zu finden. Das hnlichkeitsniveau, welches eine gute hnlichkeit zwischen den Bereichwerten anzeigt, wird von Ihnen vorgegeben. Sie knnen auch die relative Gewichtung vorgeben, die jede Spalte in den hnlichkeitsberechnungen erhlt. Sie knnen beispielsweise dem Nachnamen eine hhere Prioritt als dem Vornamen geben.
Erstellen und Durchfhren von Datenqualittregeln. Informatica bietet vorgefertigte Regeln, die Sie

ausfhren oder bearbeiten knnen, um Ihre Projektziele zu erreichen. Sie knnen im Entwicklertool Regeln erstellen.
Zusammenarbeiten mit Informatica-Anwendern. Die Regeln und Referenzdatentabellen, die Sie dem Model

Repository zufgen, stehen den Anwendern im Entwicklertool und im Analysetool zur Verfgung. Benutzer knnen in Projekten zusammenarbeiten, und in unterschiedlichen Stadien eines Projekts knnen unterschiedliche Benutzer den Eigentmerstatus von Objekten bernehmen.
Exportieren von Mappings an PowerCenter. Sie knnen Mappings an PowerCenter exportieren, um die

Metadaten fr die physische Datenintegration oder fr die Erstellung von Internetdiensten zu verwenden. Datenqualittsbenutzer knnen alle obigen Aufgaben durchfhren. Daten-Explorer-Benutzer knnen zustzliche Profiling-Operationen, einschl. Primrschlssel- und Fremdschlsselanalyse, im Developer Tool durchfhren.

Die Tutorial-Story
HypoStores Corporation ist eine nationale Einzelhandelsorganisation mit Firmensitz in Boston und Geschften in mehreren Staaten. Sie integriert regelmig Betriebsdaten aus den landesweiten Geschften in den Datenspeicher am Sitz des Unternehmens. Vor kurzem wurde ein Geschft in Los Angeles erffnet. Zum Firmensitz gehrt ein zentrales ICC-Team von Administratoren, Entwicklern und Architekten, die dafr verantwortlich sind, eine gemeinsame Datendienst-Layer fr alle Verbund- und BI-Anwendungen zur Verfgung zu stellen. Die BI-Anwendungen umfassen ein CRM-System, das die Dateien mit den Kundenstammdaten enthlt, die zur Abrechnung und zum Marketing verwendet werden. HypoStores Corporation muss folgende Aufgaben durchfhren, um Daten aus dem Betrieb in Los Angeles in die Daten am Firmensitz in Boston zu integrieren:
berprfen der Daten von Boston und Los Angeles auf Qualittsprobleme. Parsen von Informationen aus den Daten von Los Angeles. Standardisieren von Adressinformationen fr die Daten von Boston and Los Angeles.

Die Tutorial-Story

Validieren der Genauigkeit der Postadresseninformationen in den Daten zum Zweck des

Kundenbeziehungsmanagements (CRM).

Die Tutorial-Struktur
Die Kurzanleitung enthlt Tutorials, die Lektionen und Aufgaben beinhalten.

Lektionen
In jeder Lektion werden Konzepte vorgestellt, die Ihnen das Verstndnis der Aufgaben erleichtern, die in der Lektion bearbeitet werden. Die Lektion umfasst geschftliche Anforderungen der gesamten Story. Die Ziele der Lektion erlutern die Aufgaben, die Sie durcharbeiten werden, um die geschftlichen Anforderungen zu erfllen. In jeder Lektion wird angegeben, wie viel Zeit ungefhr bentigt wird. Wenn Sie die Aufgaben in der Lektion abgeschlossen haben, knnen Sie die Zusammenfassung der Lektion einsehen. Wenn die Umgebung innerhalb des Tools nicht konfiguriert ist, finden Sie in der ersten Lektion jedes Tutorials Hilfestellungen, wie dies erledigt wird.

Aufgaben
Die Aufgaben bestehen aus schrittweisen Anweisungen. Bearbeiten Sie alle Aufgaben in der angegebenen Reihenfolge, um die Lektion abzuschlieen.

Informatica Analyst-Tutorial
Whrend dieses Tutorials meldet sich ein Analyst am Analysetool an, erstellt Projekte und Ordner, Profile und Regeln, bewertet Daten und erstellt Referenztabellen. Die Lektionen, welche Sie durchfhren knnen, hngen davon ab, welches der Produkte Informatica Data Quality, Informatica Data Explorer, Informatica Data Services oder PowerCenter Sie haben. In der folgenden Tabelle finden Sie die Lektionen, die Sie je nach Produkt durchfhren knnen.
Lektion Lektion 1. Einrichten von Informatica Analyst Beschreibung Anmelden am Analysetool und Erstellen eines Projekts und Ordners fr die Tutoriallektionen. Importieren einer Einfachdatei als Datenobjekt und Vorschau der Daten. Erstellen eines Schnellprofils, um schnell eine Vorstellung von Data Quality zu erhalten. Erstellen eines benutzerdefinierten Profils zum Konfigurieren von Spalten sowie fr Stichproben- und DrilldownOptionen. Erstellen von Expressionregeln zum Modifizieren und Profilieren von Spaltenwerten Erstellen und Ausfhren einer Scorecard, um den Fortschritt der Datenqualitt im Zeitverlauf zu messen. Produkt Alle

Lektion 2. Erstellen von Datenobjekten

Data Quality Data Explorer Data Quality Data Explorer

Lektion 3. Erstellen von Schnellprofilen

Lektion 4. Erstellen von Kundenprofilen

Data Quality Data Explorer

Lektion 5. Erstellen von Expressionsregeln

Data Quality

Lektion 6. Erstellen und Ausfhren von Scorecards

Data Quality Data Explorer

Kapitel 1: Erste Schritte - bersicht

Lektion Lektion 7. Erstellen von Referenztabellen aus Profilergebnissen Lektion 8. Erstellen von Referenztabellen

Beschreibung Erstellen einer Referenztabelle, die Sie zum Standardisieren von Quelldaten verwenden knnen. Erstellen einer Referenztabelle, um Beziehungen zwischen Quelldaten sowie gltigen und Standard-Werten einzurichten.

Produkt Data Quality Data Explorer Data Services Alle

Hinweis: Dieses Tutorial enthlt keine Lektionen zur Verwaltung von fehlerhaften Datenstzen und zur Konsolidierung von Datenstzen.

Informatica Developer Tool


In diesem Tutorial verwenden Sie das Entwicklertool, um mehrere Vorgnge zur Datenqualitt durchzufhren. Benutzer von Informatica Data Quality und Informatica Data Explorer verwenden das Entwicklertool, um Profile zu erstellen und auszufhren, die den Inhalt und die Struktur von Daten analysieren. Anwender von Data Quality verwenden das Entwicklertool, um Prozesse zu entwerfen und auszufhren, die die Datenqualitt verbessern. Arbeiten Sie folgende Lektionen im Tutorial Data Quality durch:

Lektion 1. Einrichten von Informatica Developer


Erstellen einer Verbindung zum Model Repository, das von einem Model Repository Service in einer Domne verwaltet wird. Erstellen eines Projekts und eines Ordners, um Arbeit fr die Lektionen im Tutorial zu speichern. Auswhlen eines Standard-Data Integration Service.

Lektion 2. Importieren von physischen Datenobjekten


Sie werden Datenqualittsprozesse fr die Kundendatendateien definieren, die mit diesen Objekten assoziiert sind.

Lektion 3. Profiling von Daten


Profiling macht den Inhalt und die Struktur Ihrer Daten erkennbar. Profiling umfasst Join-Analyse, eine Analyseform, die ermittelt, ob zwischen den beiden Datenspalten ein gltiger Join mglich ist.

Lektion 4. Parsing von Daten


Parsing erhht den Nutzen Ihrer Datenstze und verbessert die Struktur des Datensatzes. Durch Parsen knnen Sie ntzliche Informationen in Ihren Daten suchen und neue Informationen aus aktuellen Daten ableiten.

Lektion 5. Standardisieren von Daten


Standardisieren entfernt Datenfehler und Inkonsistenzen, die whrend des Profiling gefunden werden.

Lektion 6. Validieren von Adressdaten


Adressvalidierung bewertet die Genauigkeit und Zustellbarkeit Ihrer Postadressen und behebt Adressfehler und fehlende Angaben in Adressen.

Die Tutorial-Struktur

Voraussetzungen fr das Tutorial


Bevor Sie mit den Lektionen des Tutorials beginnen, muss die Informatica-Domne mit mindestens einem eingerichteten Knoten laufen. Der Installer umfasst Tutorialdateien, die Sie zur Bearbeitung der Lektionen verwenden. Diese Dateien finden Sie sowohl in Client- als auch in Server-Installationen:
Alle Tutorialdateien finden Sie an dem folgenden Speicherort im Installationspfad des Developer Tools: <Informatica Installationsverzeichnis>\clients\DeveloperClient\Tutorials Die Tutorialdateien finden Sie an dem folgenden Speicherort im Services-Installationspfad: <Informatica Installationsverzeichnis>\server\Tutorials

Fr die Tutoriallektionen bentigen Sie folgende Dateien:


All_Customers.csv Boston_Customers.csv LA_customers.csv

10

Kapitel 1: Erste Schritte - bersicht

Teil I: Erste Schritte mit Informatica Analyst


Dieser Teil enthlt die folgenden Kapitel:
Lektion 1. Einrichten von Informatica Analyst, 12 Lektion 2. Erstellen von Datenobjekten, 15 Lektion 3. Erstellen von Schnellprofilen, 18 Lektion 4. Erstellen von Kundenprofilen, 21 Lektion 5. Erstellen von Expressionsregeln, 24 Lektion 6. Erstellen und Ausfhren von Scorecards, 27 Lektion 7. Erstellen von Referenztabellen aus Profilspalten , 31 Lektion 8. Erstellen von Referenztabellen, 34

11

KAPITEL 2

Lektion 1. Einrichten von Informatica Analyst


Dieses Kapitel umfasst die folgenden Themen:
Einrichten von Informatica Analyst - bersicht, 12 Aufgabe 1. Anmelden bei Informatica Analyst, 13 Aufgabe 2. Ein Projekt erstellen, 13 Aufgabe 3 Einen Ordner erstellen, 13 Einrichten von Informatica Analyst - Zusammenfassung, 14

Einrichten von Informatica Analyst - bersicht


Bevor Sie mit den Lektionen in diesem Tutorial beginnen knnen, mssen Sie das Analyst Tool einrichten. Um das Analyst Tool einzurichten, melden Sie sich beim Analyst Tool an und erstellen ein Projekt und einen Ordner, in dem Sie Ihre Arbeit speichern knnen. Die Informatica-Domne ist eine Sammlung von Knoten und Diensten, die die Informatica-Umgebung definieren. Zu den Diensten in der Domne gehren der Analyst Service und der Model Repository Service. Der Analyst Service startet das Analyst Tool, und der Model Repository Service verwaltet das Model Repository. Beim Arbeiten mit dem Analyst Tool speichert dieses die Objekte, die Sie im Model Repository erstellen. Sie mssen ein Projekt erstellen, bevor Sie im Analyst Tool Objekte erstellen knnen. Ein Projekt enthlt Objekte im Analyst Tool. Ein Projekt kann auch Ordner enthalten, in denen zugehrige Objekte gespeichert werden, wie Objekte, die Teile derselben Geschftsumgebung sind.

Ziele
In dieser Lektion fhren Sie folgende Aufgaben durch:
Melden Sie sich beim Analyst Tool an. Erstellen eines Projekts, um die Objekte zu speichern, die Sie im Analyst Tool erstellen. Erstellen eines Ordners im Projekt, in dem Sie zugehrige Objekte speichern knnen.

Voraussetzungen
berprfen Sie die folgenden Voraussetzungen, bevor Sie mit dieser Lektion beginnen:
Ein Administrator hat einen Model Repository Service und einen Analyst Service im Administrator Tool

konfiguriert.
Sie haben den Hostnamen und die Portnummer fr das Analyst Tool. Sie haben einen Benutzernamen und ein Passwort, um auf den Analyst Service zuzugreifen. Sie erhalten

diese Informationen von einem Domnenadministrator.

12

Zeitplan
Diese Lektion dauert ca. 5 bis 10 Minuten.

Aufgabe 1. Anmelden bei Informatica Analyst


Melden Sie sich beim Analysetool an, um mit dem Tutorial zu beginnen. 1. 2. 3. 4. Starten Sie einen Microsoft Internet Explorer- oder Mozilla Firefox-Browser. Geben Sie in der Adresszeile die URL fr Informatica Analyst ein.
http[s]://<host name>:<port number>/AnalystTool

Geben Sie auf der Anmeldeseite Ihren Benutzernamen und Ihr Passwort ein. Whlen Sie Nativ oder den Namen einer spezifischen Sicherheitsdomne. Das Feld Sicherheitsdomne wird eingeblendet, wenn die Informatica-Domne eine LDAPSicherheitsdomne enthlt. Wenn Sie die Sicherheitsdomne, zu der Ihr Benutzerkonto gehrt, nicht kennen, wenn Sie sich an den Domnenadministrator von Informatica.

5.

Klicken Sie auf Anmelden. Der Begrungsbildschirm wird geffnet.

6.

Klicken Sie auf Schlieen, um den Begrungsbildschirm zu verlassen und das Analysetool zu ffnen.

Aufgabe 2. Ein Projekt erstellen


In dieser Aufgabe erstellen Sie ein Projekt, um Objekte zu speichern, die Sie im Analysetool erstellt haben. Erstellen eines Tutorialprojekts, um den Ordner fr das Datenqualittsprojekt zu speichern. 1. Whlen Sie im Analysetool den Ordner Projekte im Navigator. Der Navigator stellt den linken Bereich in der Analyst-Schnittstelle dar. 2. Klicken Sie im Navigator auf Aktionen > Neues Projekt. Das Fenster Neues Projekt wird geffnet. 3. 4. 5. Geben Sie Ihren Namen mit vorangestelltem "Tutorial_" als Namen des Projekts ein. Vergewissern Sie sich, dass Nicht freigegeben ausgewhlt ist. Klicken Sie auf OK.

Aufgabe 3 Einen Ordner erstellen


In dieser Aufgabe erstellen Sie einen Ordner, um zugehrige Objekte zu speichern. Sie knnen einen Ordner in einem Projekt oder in einem anderen Ordner erstellen. Erstellen eines Ordners mit dem Namen Kunden, um die Objekte zu speichern, die zum Datenqualittsprojekt gehren. 1. 2. 3. 4. Whlen Sie im Navigator das Tutorialprojekt aus. Klicken Sie auf Aktionen > Neuer Ordner. Geben als Ordnername Kunden ein. Klicken Sie auf OK. Der Ordner steht jetzt im Tutorialprojekt.

Aufgabe 1. Anmelden bei Informatica Analyst

13

Einrichten von Informatica Analyst Zusammenfassung


In dieser Lektion haben Sie gelernt, dass das Analyst Tool Objekte in Projekten und Ordnern speichert. Ein Model Repository enthlt Projekte und Ordner. Der Analyst Service verwaltet das Analyst Tool. Der Model Repository Service verwaltet das Model Repository. Der Analyst Service und der Model Repository Service sind Anwendungsdienste in der Informatica-Domne. Sie haben sich beim Analyst Tool angemeldet und ein Projekt sowie einen Ordner erstellt. Nun knnen Sie mit dem Analyst Tool weitere Lektionen in diesem Tutorial bearbeiten.

14

Kapitel 2: Lektion 1. Einrichten von Informatica Analyst

KAPITEL 3

Lektion 2. Erstellen von Datenobjekten


Dieses Kapitel umfasst die folgenden Themen:
Erstellen von Datenobjekten - bersicht, 15 Aufgabe 1. Erstellen der Einfachdatei-Datenobjekte, 16 Aufgabe 2 Datenvorschau, 16 Erstellen von Datenobjekten - Zusammenfassung, 17

Erstellen von Datenobjekten - bersicht


Ein Datenobjekt ist im Analysetool eine Darstellung von Daten, die auf einer Einfachdatei oder einer Tabelle einer relationalen Datenbank basieren. Sie erstellen eine Einfachdatei oder ein Tabellenobjekt und fhren dann ein Profil mit den Daten in der Einfachdatei oder der Tabelle der relationalen Datenbank durch. Wenn Sie im Analysetool ein Einfachdatei-Datenobjekt erstellen, knnen Sie die Datei in den Einfachdatei-Cache des Rechners hochladen, auf dem das Analysetool luft, oder Sie knnen den Speicherort fr die Einfachdatei im Netzwerk angeben.

Story
HypoStores speichert die Kundendaten aus Los Angeles in Einfachdateien. HypoStores muss die Daten profilieren und analysieren und Datenqualittsaufgaben damit durchfhren.

Ziele
In dieser Lektion fhren Sie folgende Aufgaben durch: 1. 2. Hochladen der Einfachdatei in den Einfachdatei-Cache und Erstellen eines Datenobjekts. Vorschau der Daten des Einfachdatei-Datenobjekts.

Voraussetzungen
berprfen Sie die folgenden Voraussetzungen, bevor Sie mit dieser Lektion beginnen:
Sie haben Lektion 1 in diesem Tutorial abgeschlossen. Sie haben die Einfachdatei LA_Customers.csv. Diese Datei ist im Ordner <Installation Root Directory>

\<Release Version>\clients\DeveloperClient\Tutorials gespeichert.

Zeitplan
Rechnen Sie mit 5 bis 10 Minuten fr diese Aufgabe.

15

Aufgabe 1. Erstellen der Einfachdatei-Datenobjekte


In dieser Aufgabe erstellen Sie ein Einfachdatei-Datenobjekt aus der Datei LA_Customers. 1. Whlen Sie im Navigator den Ordner Customers in Ihrem Tutorialprojekt aus. Hinweis: Bevor Sie das Einfachdatei-Datenobjekt erstellen knnen, mssen Sie das Projekt oder den Ordner auswhlen, in dem Sie es erstellen mchten. 2. Klicken Sie auf Aktionen > Neu > Neue Einfachdatei. Der Assistent zum Hinzufgen einer Einfachdatei wird eingeblendet. 3. 4. 5. Whlen Sie Durchsuchen und Hochladen aus, und klicken Sie dann auf Durchsuchen. Wechseln Sie zum Speicherort von LA_Customers.csv, und klicken Sie auf ffnen. Klicken Sie auf Weiter. In der Maske Importtyp whlen werden die Optionen Mit Trennzeichen und Feste Breite angezeigt. Die Standardoption ist Mit Trennzeichen. 6. 7. 8. Klicken Sie auf Weiter. Whlen Sie unter Zeilen fr den Import angeben Aus erster Zeile importieren aus, um Spaltennamen aus der ersten Zeile zu importieren, die nicht leer ist. Klicken Sie auf Anzeigen. Die Maske Details wird aktualisiert und enthlt die Spaltenberschriften der ersten Zeile. 9. Klicken Sie auf Weiter. In der Maske Spaltenattribute werden der Datentyp, die Przision, die Grenordnung und das Format fr jede Spalte angezeigt. 10. 11. Klicken Sie fr die Spalten CreateDate und MiscDate auf die Zelle Datentyp, und ndern Sie den Datentyp in datetime. Klicken Sie auf Weiter. Im Feld Name wird LA_Customers angezeigt. 12. ndern Sie optional den Namen der Datei, und fgen Sie eine Beschreibung hinzu. Der Ordner Customers ist standardgem im unteren linken Bereich ausgewhlt. 13. Klicken Sie auf Fertigstellen. Das Datenobjekt erscheint im Ordnerinhalt des Ordners Customers.

Aufgabe 2 Datenvorschau
In dieser Aufgabe sehen Sie die Vorschau der Daten fr das Einfachdatei-Datenobjekt, um Struktur und Inhalt der Daten zu prfen. 1. Whlen Sie im Navigator den Ordner Customers in Ihrem Tutorialprojekt. Der Inhalt des Ordners wird im Bereich Inhalt eingeblendet. 2. Klicken Sie auf das Datenobjekt LA_Customers. Das Datenobjekt wird in einer Registerkarte geffnet. Das Analysetool zeigt die ersten 100 Zeilen des Einfachdatei-Datenobjekts in der Ansicht Datenvorschau. 3. Klicken Sie auf die Ansicht Eigenschaften des Einfachdatei-Datenobjekts. Die Ansicht Eigenschaften zeigt Name, Beschreibung und Ort des Datenobjekts. Sie zeigt auch die Spalten und Spalteneigenschaften fr das Datenobjekt.

16

Kapitel 3: Lektion 2. Erstellen von Datenobjekten

Erstellen von Datenobjekten - Zusammenfassung


In dieser Lektion haben Sie erfahren, dass Datenobjekte Darstellungen von Daten sind, die auf einer Einfachdatei oder einer Quelle einer relationalen Datenbank basieren. Sie haben gelernt, dass Sie ein Einfachdatei-Datenobjekt erstellen und die darin enthaltenen Daten in einer Vorschau anzeigen knnen. Sie haben eine Einfachdatei hochgeladen und ein Einfachdatei-Datenobjekt erstellt, die Vorschau der Daten des Datenobjekts angezeigt und die Eigenschaften des Datenobjekts angezeigt. Nachdem Sie ein Datenobjekt erstellt haben, erstellen Sie in Lektion 3 ein Schnellprofil fr das Datenobjekt und in Lektion 4 ein benutzerdefiniertes Profil fr das Datenobjekt.

Erstellen von Datenobjekten - Zusammenfassung

17

KAPITEL 4

Lektion 3. Erstellen von Schnellprofilen


Dieses Kapitel umfasst die folgenden Themen:
Erstellen von Schnellprofilen - bersicht, 18 Aufgabe 1 Erstellen und Ausfhren eines Schnellprofils, 19 Aufgabe 2 Anzeigen der Profilergebnisse, 19 Erstellen von Schnellprofilen - Zusammenfassung, 20

Erstellen von Schnellprofilen - bersicht


Ein Profil ist die Analyse der Datenqualitt, bezogen auf den Inhalt und die Struktur der Daten. Ein Schnellprofil ist ein Profil, das Sie mit Standardoptionen erstellen. Mit einem Schnellprofil knnen Sie Profilergebnisse erhalten, ohne alle Spalten und Optionen fr ein Profil zu konfigurieren. Erstellen Sie ein Schnellprofil und fhren Sie es aus, um die Qualitt der Daten zu analysieren, wenn Sie ein Datenqualittsprojekt starten. Wenn Sie ein Schnellprofilobjekt erstellen, whlen Sie das Datenobjekt und die Spalten des Datenobjekt , die Sie analysieren mchten. Ein Schnellprofil berspringt die Konfiguration der Profilspalten und -optionen. Das Analysetool fhrt ein Profiling mit der zwischengespeicherten Einfachdatei fr das Einfachdatei-Datenobjekt durch.

Story
HypoStore mcte, dass Daten aus dem neu erworbenen Bro in Los Angeles in das Data Warehouse eingepflegt werden. Bevor diese Daten in das Data Warehouse eingepflegt werden knnen, mssen sie bereinigt werden. Sie sind der Analyst, der fr die Bewertung der Datenqualitt und die Weitergabe der Informationen an den Entwickler zustndig ist, der fr die Bereinigung der Daten verantwortlich ist. Sie mchten die Profilergebnisse rasch anzeigen und eine Grundvorstellung der Datenqualitt erhalten.

Ziele
In dieser Lektion fhren Sie folgende Aufgaben durch: 1. 2. Erstellen und Ausfhren eines Schnellprofils fr das Einfachdatei-Datenobjekt LA_Customers. Anzeigen der Profilergebnisse.

Voraussetzungen
berprfen Sie die folgende Voraussetzung, bevor Sie mit dieser Lektion beginnen:
Sie haben die Lektionen 1 und 2 in diesem Tutorial abgeschlossen.

Zeitplan
Rechnen Sie mit 5 bis 10 Minuten fr diese Lektion.

18

Aufgabe 1 Erstellen und Ausfhren eines Schnellprofils


In dieser Aufgabe erstellen Sie ein Schnellprofil fr alle Spalten in dem Datenobjekt und verwenden Standardoptionen fr Stichproben und Drilldown. 1. 2. Whlen Sie im Navigator den Ordner Customers in Ihrem Tutorialprojekt. Klicken Sie im Bereich Inhalte rechts von dem Link fr das Datenobjekt _LA. Klicken Sie nicht auf den Link des Objekts. 3. Klicken Sie auf Aktionen > Neu > Neues Profil. Der Assistent Neues Profil wird eingeblendet. 4. Klicken Sie auf Speichern und Ausfhren, um das Profil zu erstellen und auszufhren. Das Analysetool erstellt das Profil in dem gleichen Projekt und Ordner wie das Datenobjekt. Die Profilergebnisse fr das Schnellprofil erscheinen in einer neuen Registerkarte, nachdem Sie das Profil gespeichert und ausgefhrt haben.

Aufgabe 2 Anzeigen der Profilergebnisse


In dieser Aufgabe verwenden Sie Spalten-Profiling fr das Profil LA_Customers, um einen raschen berblick ber die Profilergebnisse zu erhalten. In der folgenden Tabelle werden die Informationen wiedergegeben, die fr jede Spalte in einem Profil angezeigt werden:
Eigenschaft Name Eindeutige Werte Eindeutig % Null Null % Datentyp Beschreibung Name der Spalte in dem Profil. Anzahl der eindeutigen Werte in der Spalte Prozentsatz der eindeutigen Werte in der Spalte. Anzahl der Null-Werte in der Spalte Prozentsatz der Spaltenwerte, die Null sind. Datentyp, der von den Werten in der Spalte abgeleitet ist. Das Analysetool kann die folgenden Datentypen aus den Spaltenwerten ableiten: String Varchar Dezimal Integer Null [-] Gefolgert % Prozentsatz der Werte, die dem Datentyp entsprechen, der von dem Datentyp gefolgert wurde Datentyp, der fr die Spalte in dem profilierten Objekt deklariert wurde. Maximalwert in der Spalte. Mindestwert in der Spalte.

Dokumentierter Datentyp Max. Wert Mindestwert

Aufgabe 1 Erstellen und Ausfhren eines Schnellprofils

19

Eigenschaft Zuletzt profiliert Drilldown

Beschreibung Datum und Profil der letzten Profilausfhrung. Ermglicht bei Aktivierung Drilldown mit Live-Daten fr die Spalte.

1.

Klicken Sie auf die berschrift der Null-Wertspalte, um die Werte zu sortieren. Achten Sie darauf, dass die Spalten Address2, Address3, City2, CreateDate und MiscDate 100 % NullWerte aufweisen. Sie erstellen in Lektion 4 ein benutzerdefiniertes Profil , um diese Spalten auszuschlieen.

2.

Klicken Sie auf die Spalte Full Name. Die Werte fr die Spalte erscheinen in der Ansicht Werte. Achten Sie darauf, dass Vorname und Nachname nicht in separaten Spalten erscheinen. In Lektion 5 erstellen Sie eine Regel, um Vorname und Nachname in separate Spalten zu trennen.

3.

Klicken Sie auf die Spalte CustomerTier . Achten Sie darauf, dass die Werte fr CustomerTier inkonsistent sind. In Lektion 6 erstellen Sie eine Scorecard, um die Werte von CustomerTier zu beurteilen. In Lektion 7 erstellen Sie eine Referenztabelle, die ein Entwickler verwenden kann, um die Werte von CustomerTier zu standardisieren.

4.

Klicken Sie auf die Spalte State, und klicken Sie dann auf die Ansicht Muster. Achten Sie darauf, dass 483 Spalten ein Muster von XX aufweisen, das gltige Werte angibt. Siebzehn Werte sind nicht gltig, weil sie dem gltigen Muster nicht entsprechen. In Lektion 6 erstellen Sie eine Scorecard, um die Werte von State zu beurteilen.

Erstellen von Schnellprofilen - Zusammenfassung


In dieser Lektion haben Sie erfahren, dass ein Schnellprofil Profilergebnisse zeigt, ohne alle Stichprobenoptionen der Spalten und Zeilen fr ein Profil zu konfigurieren. Sie haben gelernt, ein Schnellprofil zu erstellen und auszufhren, um die Qualitt der Daten zu analysieren, wenn Sie ein Datenqualittsprojekt starten. Sie haben auch gelernt, dass das Analysetool Profiling mit der zwischengespeicherten Einfachdatei fr das Einfachdatei-Datenobjekt durchfhrt. Sie haben ein Schnellprofil erstellt und die Ergebnisse des Profils analysiert. Sie haben weitere Informationen zu den Spalten in dem Profil erhalten, einschlielich Nullwerten und Datentypen. Sie haben auch die Spaltenwerte und Muster verwendet, um Datenqualittsprobleme zu identifizieren. Nachdem Sie die Ergebnisse eines Schnellprofils analysiert haben, knnen Sie die folgenden Aufgaben abschlieen:
Erstellen eines benutzerdefinierten Profils, um Spalten aus dem Profil auszuschlieen und nur die Spalten

einzuschlieen, an denen Sie interessiert sind.


Erstellen einer Expressionsregel, um virtuelle Spalten zu erstellen und sie zu profilieren. Erstellen einer Referenztabelle, um gltige Werte fr eine Spalte einzuschlieen.

20

Kapitel 4: Lektion 3. Erstellen von Schnellprofilen

KAPITEL 5

Lektion 4. Erstellen von Kundenprofilen


Dieses Kapitel umfasst die folgenden Themen:
Erstellen von benutzerdefinierten Profilen - bersicht, 21 Aufgabe 1 Erstellen eines benutzerdefinierten Profils, 22 Aufgabe 2 Ausfhren des Profils, 22 Aufgabe 3 Drilldown der Profilergebnisse, 23 Erstellen von benutzerdefinierten Profilen - Zusammenfassung, 23

Erstellen von benutzerdefinierten Profilen - bersicht


Ein Profil ist die Analyse der Datenqualitt, bezogen auf den Inhalt und die Struktur der Daten. Ein benutzerdefiniertes Profil ist ein Profil, das Sie erstellen, wenn Sie die Spalten, Stichprobenoptionen und Drilldown-Optionen fr ein schnelleres Profiling konfigurieren mchten. Konfigurieren Sie die Stichprobenoptionen, um die Stichprobenzeilen in der Einfachdatei auszuwhlen. Konfigurieren Sie die Drilldown-Optionen, um Drilldown auf Datenstze in den Profilergebnissen und Drilldown auf Datenzeilen in den Quelldaten oder zwischengespeicherten Daten durchzufhren. Sie erstellen ein Profil und fhren es aus, um die Qualitt der Daten zu analysieren, wenn Sie ein Datenqualittsprojekt starten. Wenn Sie ein Profilobjekt erstellen, whlen Sie das Datenobjekt und die Spalten des Datenobjekts, die Sie profilieren mchten, und konfigurieren die Stichprobenoptionen und die DrilldownOptionen.

Story
HypoStore muss Daten aus dem neu erworbenen Bro in Los Angeles in das eigene Data Warehouse einpflegen. HypoStores mchte die Qualitt der Kundenebenendaten in der LA-Kundendatendatei bewerten. Sie sind der Analyst, der fr die Bewertung der Datenqualitt und die Weitergabe der Informationen an den Entwickler zustndig ist, der fr die Bereinigung der Daten verantwortlich ist.

Ziele
In dieser Lektion fhren Sie folgende Aufgaben durch: 1. 2. 3. Erstellen eines benutzerdefinierten Profils fr das Einfachdatei-Datenobjekt und Ausschlieen der Spalten mit Null-Werten. Ausfhren des Profils, um den Inhalt und die Struktur der Spalte CustomerTier zu analysieren. Drilldown in die Zeilen fr die Profilergebnisse.

Voraussetzungen
berprfen Sie die folgende Voraussetzung, bevor Sie mit dieser Lektion beginnen:
Sie haben die Lektionen 1, 2 und 3 in diesem Tutorial abgeschlossen.

21

Zeitplan
Rechnen Sie mit 5 bis 10 Minuten fr diese Lektion.

Aufgabe 1 Erstellen eines benutzerdefinierten Profils


In dieser Aufgabe verwenden Sie den Assistenten Neues Profil zur Erstellung eines benutzerdefinierten Profils. Wenn Sie ein Profil erstellen, whlen Sie das Datenobjekt und die Spalten, die Sie profilieren mchten. Sie knnen auch die Stichproben- und Drilldown-Optionen konfigurieren. 1. 2. Whlen Sie im Navigator den Ordner Customers in Ihrem Tutorialprojekt. Klicken Sie auf Aktionen > Neu > Neues Profil. Der Assistent Neues Profil wird eingeblendet. 3. Im Bereich Quellen whlen Sie das Datenobjekt LA_Customers. Der Bereich Spalten zeigt die Spalten fr das Datenobjekt. 4. 5. 6. Klicken Sie auf Weiter. Geben Sie als Namen Profile_LA_Customers_Custom ein. berprfen Sie den Speicherort im Bereich Ordner. Der Speicherort zeigt das Tutorialprojekt und den Ordner Customers. Der Bereich Profile zeigt Profile_LA_Customers. 7. 8. 9. 10. 11. 12. 13. Klicken Sie auf Weiter. Lschen Sie im Bereich Spalten die Spalten Address2, Address3, City2, CreateDate und MiscDate. Whlen Sie im Bereich Stichprobenoptionen die Option Alle Zeilen. berprfen Sie im Bereich Drilldown-Optionen, dass Zeilen-Drilldown aktivieren ausgewhlt ist, und whlen Sie mit zwischengespeicherten Daten fr die Option Drilldown. Klicken Sie auf Weiter. Legen Sie gegebenenfalls einen Filter fr das Profil fest. Klicken Sie auf Speichern. Das Analysetool erstellt das Profil und zeigt das Profil in einer anderen Registerkarte an.

Aufgabe 2 Ausfhren des Profils


In dieser Aufgabe fhren Sie ein Profil aus, um an dem Datenobjekt Profilierung durchzufhren und die Profilergebnisse anzuzeigen. Das Analysetool fhrt ein Profiling mit der zwischengespeicherten Einfachdatei fr das Einfachdatei-Datenobjekt durch. 1. 2. Whlen Sie im Navigator den Ordner Customers in Ihrem Tutorialprojekt. Klicken Sie im Bereich Inhalte auf den Link Profile_LA_Customers_Custom. Das Profil wird in einer Registerkarte eingeblendet. 3. Klicken Sie auf Aktionen > Profil ausfhren. Das Fenster Spaltenprofil wird eingeblendet. 4. 5. 6. 7. Im Bereich Spalten aktivieren Sie das Kontrollkstchen Name, um alle zu profilierenden auszuwhlen. Behalten Sie im Fenster Stichprobenoptionen die Standardoptionen bei. Behalten Sie im Fenster Drilldown-Optionen die Standardoptionen bei. Klicken Sie auf Ausfhren Das Analysetool fhrt Profiling mit dem Datenobjekt durch und zeigt die Profilergebnisse an.

22

Kapitel 5: Lektion 4. Erstellen von Kundenprofilen

Aufgabe 3 Drilldown der Profilergebnisse


In dieser Aufgabe fhren Sie ein Drilldown mit den Werten der Spalte CustomerTier durch, um die zu Grunde liegenden Zeilen in dem Datenobjekt fr das Profil anzuzeigen. 1. 2. Whlen Sie im Navigator den Ordner Customers in Ihrem Tutorialprojekt. Klicken Sie das Profil Profile_LA_Customers_Custom an. Das Profil wird in einer Registerkarte geffnet. 3. Whlen Sie in der Ansicht Spalten-Profiling die Spalte CustomerTier. Die Werte fr die Spalte erscheinen in der Ansicht Werte. 4. 5. Verwenden Sie die Shift-Taste zur Auswahl der Werte Diamond, Ruby, Emerald und Bronze. Klicken Sie mit der rechten Maustaste, und whlen Sie Drilldown. Die Zeilen fr die Spalten mit einem Wert von Diamond, Ruby, Emerald und Bronze erscheinen im Bereich Drilldown. Nur die ausgewhlten Spalten erscheinen im Bereich Drilldown . Die Titelleiste fr das Bereich Drilldown zeigt die fr die zu Grunde liegenden Spalten verwendete Logik.

Erstellen von benutzerdefinierten Profilen Zusammenfassung


In dieser Lektion haben Sie erfahren, dass Sie die zu profilierenden Spalten und die Stichproben- und Drilldown-Optionen konfigurieren knnen. Sie haben gelernt, dass Sie ein Drilldown durchfhren knnen, um die zu Grunde liegenden Zeilen fr die Spaltenwerte anzuzeigen, und dass Sie die Spalten konfigurieren knnen, die eingeschlossen werden, wenn Sie die Spaltenwerte anzeigen. Sie haben ein benutzerdefiniertes Profil erstellt, das die Spalte CustomerTier enthlt, das Profil ausgefhrt und ein Drilldown auf die zu Grunde liegenden Zeilen fr die Spalte CustomerTier in den Ergebnissen durchgefhrt. Verwenden Sie das benutzerdefinierte Profil, um in Lektion 5 eine Expressionsregel zu erstellen. Wenn Sie Data Quality oder Data-Explorer haben, knnen Sie in Lektion 6 eine Scorecard erstellen.

Aufgabe 3 Drilldown der Profilergebnisse

23

KAPITEL 6

Lektion 5. Erstellen von Expressionsregeln


Dieses Kapitel umfasst die folgenden Themen:
Erstellen von Expressionsregeln - bersicht, 24 Aufgabe 1 Erstellen von Expressionsregeln und Ausfhren des Profils, 25 Aufgabe 2 Anzeigen der Ausgabe der Expressionsregel , 25 Aufgabe 3 Bearbeiten von Expressionsregeln, 26 Erstellen von Expressionsregeln - Zusammenfassung, 26

Erstellen von Expressionsregeln - bersicht


Expressionsregeln verwenden Expressionsfunktionen und Quellspalten, um die Regellogik festzulegen. Sie knnen im Analysetool Expressionsregeln erstellen und einem Profil hinzufgen. Eine Expressionsregel kann mit einem oder mehreren Profilen assoziiert sein. Die Ausgabe einer Expressionsregel ist eine virtuelle Spalte im Profil. Das Analysetool profiliert die virtuelle Spalte, wenn Sie das Profil ausfhren. Sie knnen Expressionsregeln verwenden, um Quellspalten zu validieren oder weitere Quellspalten bezogen auf den Wert der Quellspalten zu erstellen.

Story
HypoStore mchte, dass Daten aus dem neu erworbenen Bro in Los Angeles in das Data Warehouse eingepflegt werden. HypoStores mchte die Kundennamen analysieren und die Kundennamen in Vorname und Nachname trennen. HypoStores mchte Expressionsregeln verwenden, um eine Spalte, die Vornamen und Nachnamen enthlt, in separate virtuelle Spalten zu parsen, und danach die Spalten profilieren. HypoStores mchte die Regeln auch anderen Analysten zur Verfgung stellen, die die Ausgabe dieser Regeln analysieren mssen.

Ziele
In dieser Lektion fhren Sie folgende Aufgaben durch: 1. Erstellen von Expressionsregeln, um die Spalte FullName (Vollstndiger Name) in die Spalten fr Vornamen und Nachnamen zu trennen. Sie erstellen eine Regel, die den Vornamen von dem vollstndigen Namen abtrennt. Sie erstellen eine weitere Regel, die den Nachnamen von dem Vornamen abtrennt. Sie erstellen diese Regeln fr das Profil Profile_LA_Customers_Custom. Fhren Sie das Profil aus, und zeigen Sie die Ausgabe der Regeln im Profil an. Bearbeiten Sie die Regeln, um sie fr andere Benutzer des Analysetools nutzbar zu machen.

2. 3.

24

Voraussetzungen
berprfen Sie die folgende Voraussetzung, bevor Sie mit dieser Lektion beginnen:
Sie haben die Lektionen 1, 2, 3 und 4 abgeschlossen.

Zeitplan
Rechnen Sie mit 10 bis 15 Minuten fr diese Lektion.

Aufgabe 1 Erstellen von Expressionsregeln und Ausfhren des Profils


In dieser Aufgabe erstellen Sie zwei Expressionsregeln, um die Spalte FullName in zwei virtuelle Spalten mit den Bezeichnungen FirstName (Vorname) und LastName (Nachname) zu parsen. Die Spalten FirstName und LastName sind die Regelnamen. 1. Klicken Sie im Bereich Inhalte auf das Profil Profile_LA_Customers_Custom, um es zu ffnen. Das Profil wird in einer Registerkarte eingeblendet. 2. Klicken Sie auf Aktionen > Regel hinzufgen. Das Fenster Neue Regel wird eingeblendet. 3. 4. 5. 6. Whlen Sie Regel erstellen. Klicken Sie auf Weiter. Geben Sie als Namen fr die Regel FirstName ein. Geben Sie im Bereich Expression folgende Expressionen ein, um den Vornamen von der Spalte Name zu trennen:
SUBSTR(FullName,1,INSTR(FullName,' ' ,-1,1 ) - 1)

7. 8. 9. 10.

Klicken Sie auf Validieren. Klicken Sie auf Weiter. Konfigurieren Sie gegebenenfalls die Spalten-, Stichproben- und Drilldown-Optionen. Klicken Sie auf Speichern. Das Analysetool erstellt die Regel und zeigt sie in der Ansicht Spalten-Profiling an.

11.

Wiederholen Sie die Schritte 2 bis 10, und erstellen Sie eine Regel namens LastName (Nachname). Geben Sie die folgende Expression ein, um den Nachnamen von der Spalte Name zu trennen:
SUBSTR(FullName,INSTR(FullName,' ',-1,1),LENGTH(FullName))

Aufgabe 2 Anzeigen der Ausgabe der Expressionsregel


In dieser Aufgabe zeigen Sie die Ausgabe von Expressionsregeln an, die nach Ausfhrung eines Profils Vornamen und Nachnamen trennen. 1. 2. 3. 4. 5. Klicken Sie im Bereich Inhalte auf Aktionen > Profil ausfhren. Aktivieren Sie in der Ansicht Spalten-Profiling das Kontrollkstchen neben Name auf der Symbolleiste, um alle Spalten zu lschen. Whlen Sie die Spalte FullName und die Regeln FirstName und LastName. Klicken Sie auf Ausfhren Klicken Sie auf die Regel FirstName.

Aufgabe 1 Erstellen von Expressionsregeln und Ausfhren des Profils

25

Die Werte erscheinen in der Ansicht Werte. 6. 7. Whlen Sie einen beliebigen Wert in der Ansicht Werte. Klicken Sie mit der rechten Maustaste, und whlen Sie Drilldown. Die Werte fr die Spalte FullName und die Regeln FirstName und LastName erscheinen im Bereich Drilldown. Achten Sie darauf, dass die Spalte FullName nun in Vornamen und Nachnamen getrennt ist.

Aufgabe 3 Bearbeiten von Expressionsregeln


In dieser Aufgabe machen Sie die Expressionsregeln wiederverwendbar und stellen Sie allen Benutzern des Analysetools zur Verfgung. 1. 2. Whlen Sie in der Ansicht Spalten-Profiling die Regel FirstName. Klicken Sie auf Aktionen > Regel bearbeiten. Das Fenster Regel bearbeiten wird eingeblendet. 3. Whlen Sie Als wiederverwendbare Regel speichern unter. Das Analysetool speichert die Regel standardgem im aktuellen Profil und Ordner. 4. 5. Klicken Sie auf Speichern. Wiederholen Sie die Schritte 1 bis 4 fr die Regel LastName.

Die Regeln FirstName und LastName knnen nun von jedem Benutzer des Analysetools verwendet werden, um eine Spalte mit Vor- und Nachnamen in separate Spalten zu teilen.

Erstellen von Expressionsregeln - Zusammenfassung


In dieser Lektion haben Sie erfahren, dass Expressionsregeln Expressionsfunktionen und Quellspalten zum Definieren von Regellogik verwenden. Sie haben gelernt, dass die Ausgabe einer Expressionsregel eine virtuelle Spalte im Profil ist. Das Analysetool enthlt die virtuelle Spalte, wenn Sie das Profil ausfhren. Sie haben zwei Expressionsregeln erstellt, diese zu einem Profil hinzugefgt und das Profil ausgefhrt. Sie haben die Ausgabe der Regeln angezeigt und sie allen Benutzern des Analysetools zur Verfgung gestellt.

26

Kapitel 6: Lektion 5. Erstellen von Expressionsregeln

KAPITEL 7

Lektion 6. Erstellen und Ausfhren von Scorecards


Dieses Kapitel umfasst die folgenden Themen:
Erstellen und Ausfhren von Scorecards - bersicht, 27 Aufgabe 1 Erstellen einer Scorecard aus den Profilergebnissen, 28 Aufgabe 2 Ausfhren der Scorecard, 28 Aufgabe 3 Anzeigen der Scorecard, 29 Aufgabe 4 Bearbeiten der Scorecard, 29 Aufgabe 5 Konfigurieren von Schwellenwerten, 29 Aufgabe 6 Anzeigen von Score-Trenddiagrammen, 30 Erstellen und Ausfhren von Scorecards - Zusammenfassung, 30

Erstellen und Ausfhren von Scorecards - bersicht


Eine Scorecard ist die grafische Darstellung von gltigen Werten fr eine Spalte oder die Ausgabe einer Regel in Profilergebnissen. Verwenden Sie Scorecards zum Messen und berwachen des Fortschritts der Datenqualitt im Zeitverlauf. Um eine Scorecard zu erstellen, fgen Sie einer Scorecard Spalten aus dem Profil hinzu und konfigurieren die Scorecard-Schwellenwerte. Um eine Scorecard auszufhren, whlen Sie die gltigen Werte fr die Spalte und fhren die Scorecard aus, um die Scores fr die Spalten anzuzeigen. Scorecards zeigen die Werthufigkeit von Spalten in einem Profil als Scores (Punkte). Scores spiegeln den Prozentsatz der gltigen Werte fr eine Spalte wieder.

Story
HypoStore mchte, dass Daten aus dem neu erworbenen Bro in Los Angeles in das Data Warehouse eingepflegt werden. Bevor sie die Daten zusammenfhren, mchten sie sicherstellen, dass die Daten in den unterschiedlichen Kundenebenen (CustomerTiers) und Bundesstaaten (State) auf Datenqualitt analysiert werden. Sie sind der Analyst, der fr die berwachung des Fortschritts bei der Durchfhrung der Datenqualittsanalyse verantwortlich ist. Sie mchten eine Scorecard aus den Spalten "CustomerTier" und "State" erstellen, Schwellenwerte fr die Datenqualitt konfigurieren und die Score-Trenddiagramme anzeigen, um zu ermitteln, wie sich die Scores im Zeitverlauf verbessern.

Ziele
In dieser Lektion fhren Sie folgende Tasks durch: 1. 2. Erstellen einer Scorecard aus den Ergebnissen des Profils Profile_LA_Customers_Custom, um die Scores fr die Spalten Customer Tier und State anzuzeigen. Ausfhren der Scorecard, um die Scores fr die Spalten CustomerTier und State zu erstellen.

27

3. 4. 5. 6.

Anzeigen der Scorecard, um die Scores fr jede Spalte anzuzeigen. Bearbeiten der Scorecard, um unterschiedliche gltige Werte fr die Scores anzugeben. Konfigurieren von Score-Schwellenwerten und Ausfhren der Scorecard. Anzeigen von Score-Trenddiagrammen, um zu ermitteln, wie sich die Scores im Zeitverlauf verbessern.

Voraussetzungen
berprfen Sie die folgende Voraussetzung, bevor Sie mit dieser Lektion beginnen:
Sie haben die Lektionen 1 bis 5 in diesem Tutorial abgeschlossen.

Zeitplan
Planen Sie fr die vollstndige Durchfhrung der Tasks in dieser Lektion 15 Minuten ein.

Aufgabe 1 Erstellen einer Scorecard aus den Profilergebnissen


In dieser Aufgabe erstellen Sie eine Scorecard aus dem Profil Profile_LA_Customers_Custom, um die Spaltenwerte von CustomerTier und State zu bewerten. 1. 2. ffnen Sie das Profil Profile_LA_Customers_Custom. Klicken Sie auf Aktionen > Zu Scorecard zufgen. Der Assistent Zu Scorecard zufgen wird eingeblendet. 3. 4. 5. Whlen Sie die Spalten CustomerTier und State, um sie der Scorecard hinzuzufgen. Klicken Sie auf Weiter. Klicken Sie auf Neu, um eine Scorecard zu erstellen. Das Fenster Neue Scorecard wird eingeblendet. 6. 7. 8. 9. 10. 11. Geben Sie als Namen fr die Scorecard sc_LA_Customer ein, und navigieren Sie zum Ordner Customers fr den Scorecard-Speicherort. Klicken Sie auf OK und dann auf Weiter. Whlen Sie den Score CustomerTier im Bereich Scores und whlen Sie ist gltig fr alle Werte im Bereich Score verwendet: Werte. Whlen Sie den Score State im Bereich Scores und whlen Sie die Spalte ist gltig fr diejenigen Werte, die im Bereich Score verwendet: Werte Staatencodes mit zwei Buchstaben haben. Akzeptieren Sie fr jeden Score im Bereich Scores die Standardeinstellung fr die Score-Schwellenwerte im BereichScore-Einstellungen. Klicken Sie auf Fertigstellen.

Aufgabe 2 Ausfhren der Scorecard


In dieser Aufgabe fhren Sie die Scorecard sc_LA_Customer aus, um die Scores fr die Spalten CustomerTier und State zu erstellen. 1. Klicken Sie auf die Scorecard sc_LA_Customer, um sie zu ffnen. Die Scorecard wird in einer Registerkarte eingeblendet. 2. Klicken Sie auf Aktionen > Scorecard ausfhren. Die Ansicht Scorecard zeigt die Scores fr die Spalten CustomerTier und State.

28

Kapitel 7: Lektion 6. Erstellen und Ausfhren von Scorecards

Aufgabe 3 Anzeigen der Scorecard


In dieser Aufgabe zeigen Sie die Scorecard sc_LA_Customer an, um die Scores fr die Spalten CustomerTier und State zu sehen. 1. 2. Whlen Sie die Spalte State, die den Score fr State enthlt, den Sie sehen mchten. Klicken Sie auf Aktionen > Drilldown. Die gltigen Scores fr die Spalte State erscheinen in der Ansicht Gltig. Klicken Sie auf Ungltig, um die Scores einzublenden, die nicht fr die Statusspalte gltig sind. Im Bereich Scores knnen Sie den Namen des Scores und den Prozentsatz des Scores anzeigen. Sie knnen den als Balken angezeigten Score, die Datenobjekte des Scores und die Quelle und die Quelltypen des Scores sehen. 3. Wiederholen Sie die Schritte 1 und 2 fr die Spalte CustomerTier. Alle Scores fr die Spalte CustomerTier sind gltig.

Aufgabe 4 Bearbeiten der Scorecard


In dieser Aufgabe bearbeiten Sie die Scorecard sc_ LA_Customer, um anzugeben, dass der Wert Ruby nicht gltig fr den Score CustomerTier ist. 1. Klicken Sie auf Aktionen > Bearbeiten. Das Fenster Scorecard bearbeiten wird eingeblendet. 2. 3. Whlen Sie den Score CustomerTier im Bereich Scores . Lschen Sie im Bereich Score verwendet: Werte Ruby aus der Spalte ist gltig. Akzeptieren Sie die Standardeinstellungen im Bereich Score-Einstellungen. 4. 5. Klicken Sie auf Speichern, um die nderungen an der Scorecard zu speichern und diese auszufhren. Sehen Sie sich den Score CustomerTier erneut an.

Aufgabe 5 Konfigurieren von Schwellenwerten


In dieser Aufgabe konfigurieren Sie Schwellenwerte fr den Score State in der Scorecard sc_LA_Customer, um die akzeptablen Bereiche fr die Daten in der Spalte State zu ermitteln. Werte mit einem 2-BuchstabenCode, wie CA, sind akzeptabel, und Codes mit mehr als zwei Buchstaben, wie Calif, sind nicht akzeptabel. 1. 2. Whlen Sie im Fenster Scorecard bearbeiten den Score State im Bereich Scores. Geben Sie im Bereich Score-Einstellungen folgende Bereiche fr die Scores Gut und Inakzeptabel in Benutzerdef. Schwellenwerte fr diesen Score festlegen ein: 90 bis 100 % Gut; 0 bis 50 % Inakzeptabel. 51 % bis 89 % sind Akzeptabel. Die Schwellenwerte stehen fr die unteren Grenzen der akzeptablen und guten Bereiche. 3. Klicken Sie auf Speichern, um die nderungen an der Scorecard zu speichern und diese auszufhren. Sehen Sie sich im Bereich Scores die nderungen an den Score-Prozentstzen und dem Score an, der als Balken fr den Score State angezeigt wird.

Aufgabe 3 Anzeigen der Scorecard

29

Aufgabe 6 Anzeigen von Score-Trenddiagrammen


In dieser Aufgabe zeigen Sie das Trenddiagramm fr den Score State an. Sie knnen Trenddiagramme anzeigen, um Scores im Zeitverlauf zu berwachen. 1. 2. Whlen Sie im Navigator den Ordner Customers in Ihrem Tutorialprojekt. Klicken Sie auf die Scorecard sc_LA_Customer, um sie zu ffnen. Die Scorecard wird in einer Registerkarte eingeblendet. 3. 4. Whlen Sie in der Scorecard -Ansicht den Score State. Klicken Sie auf Aktionen > Trenddiagramm anzeigen. Der Trenddiagramm-Detailfenster wird eingeblendet. Sie knnen die Schwellenwerte Gut, Akzeptabel und Inakzeptabel fr den Score anzeigen. Die Schwellenwerte ndern sich jedes Mal, wenn Sie die Scorecard ausfhren, nachdem Sie die Werte fr Scores in der Scorecard bearbeitet haben.

Erstellen und Ausfhren von Scorecards Zusammenfassung


In dieser Lektion haben Sie gelernt, dass Sie eine Scorecard aus den Ergebnissen eines Profils erstellen knnen. Eine Scorecard enthlt die Spalten aus einem Profil. Sie haben gelernt, dass Sie eine Scorecard ausfhren knnen, um Scores fr Spalten zu erstellen. Sie haben eine Scorecard bearbeitet, um gltige Werte zu konfigurieren und Schwellenwerte fr Scores festzulegen. Sie haben auch erfahren, wie das ScoreTrenddiagramm angezeigt wird. Sie haben eine Scorecard aus den Spalten CustomerTier und State in einem Profil erstellt, um die Datenqualitt fr die Spalten CustomerTier und State zu analysieren. Sie haben die Scorecard ausgefhrt, um Scores fr jede Spalte zu erstellen. Sie haben die Scorecard bearbeitet, um unterschiedliche gltige Werte fr Scores anzugeben. Sie haben Schwellenwerte fr einen Score konfiguriert und das Score-Trenddiagramm angezeigt.

30

Kapitel 7: Lektion 6. Erstellen und Ausfhren von Scorecards

KAPITEL 8

Lektion 7. Erstellen von Referenztabellen aus Profilspalten


Dieses Kapitel umfasst die folgenden Themen:
Erstellen von Referenztabellen aus Profilspalten - bersicht, 31 Aufgabe 1 Erstellen einer Referenztabelle aus Profilspalten, 32 Aufgabe 2 Bearbeiten der Referenztabelle, 33 Erstellen von Referenztabellen aus Profilspalten - Zusammenfassung, 33

Erstellen von Referenztabellen aus Profilspalten bersicht


Eine Referenztabelle enthlt Referenzdaten, die zum Standardisieren von Quelldaten verwendet werden knnen. Referenzdaten knnen gltige und Standardwerte einschlieen. Erstellen Sie Referenztabellen, um Beziehungen zwischen Quelldatenwerten und den gltigen und Standardwerten einzurichten. Sie knnen eine Referenztabelle aus den Ergebnissen eines Profils erstellen. Nachdem Sie eine Referenztabelle erstellt haben, knnen Sie sie bearbeiten, um Spalten oder Zeilen hinzuzufgen oder Standard- und gltige Werte hinzuzufgen oder zu bearbeiten. Sie knnen die nderungen, die an einer Referenztabelle vorgenommen wurden, in einem Audit-Trail anzeigen.

Story
HypoStores mchte die Daten profilieren, um Abweichungen aufzuzeigen und die Daten mit gltigen Werten zu standardisieren. Sie sind der Analyst, der fr die Standardisierung der gltigen Werte in den Daten verantwortlich ist. Sie mchten eine Referenztabelle auf Grundlage von gltigen Werten aus Profilspalten erstellen.

Ziele
In dieser Lektion fhren Sie folgende Aufgaben durch: 1. 2. Erstellen einer Referenztabelle aus der Spalte CustomTier im Profil Profile_LA_Customers_Custom durch Auswahl von gltigen Werten fr Spalten. Bearbeiten der Referenztabelle, um unterschiedliche gltige Werte fr die Spalten zu konfigurieren.

Voraussetzungen
berprfen Sie die folgende Voraussetzung, bevor Sie mit dieser Lektion beginnen:
Sie haben die Lektionen 1 bis 6 in diesem Tutorial abgeschlossen.

Zeitplan
Rechnen Sie mit 15 Minuten, um die Aufgaben in dieser Lektion abzuschlieen.

31

Aufgabe 1 Erstellen einer Referenztabelle aus Profilspalten


In dieser Aufgabe erstellen Sie eine Referenztabelle und fgen die Spalte CustomerTier aus dem Profil Profile_LA_Customers_Custom zu der Referenztabelle hinzu. 1. Klicken Sie das Profil Profile_LA_Customers_Custom an. Das Profil wird in einer Registerkarte eingeblendet. 2. Whlen Sie in der Ansicht Spalten-Profiling die Spalte CustomerTier, die Sie der Referenztabelle hinzufgen mchten. Sie knnen Drilldown bis zu dem Wert und den Musterhufigkeiten fr die Spalte CustomerTier durchfhren, um Datenstze zu untersuchen, die nicht standardgeme Kundenkategoriewerte aufweisen. 3. In der Ansicht Werte whlen Sie die gltigen CustomerTier-Werte, die Sie hinzufgen mchten. Verwenden Sie die STRG- und die Umschalttaste, um folgende Mehrfachwerte auszuwhlen: Diamond, Gold, Silver, Bronze, Emerald (Diamant, Gold, Silber, Bronze, Smaragd). Klicken Sie auf Aktionen > Hinzufgen zu Referenztabelle. Der Assistent Neue Referenztabelle wird eingeblendet. 5. 6. 7. 8. Whlen Sie die Option Neue Referenztabelle erstellen. Klicken Sie auf Weiter. Geben Sie als Tabellennamen Reftab_CustTier_HypoStores ein. Geben Sie eine Beschreibung ein, und legen Sie als Standardwert 0 fest. Das Analysetool verwendet den Standardwert fr jeden Datensatz der Tabelle, welcher keinen Wert enthlt. 9. 10. Klicken Sie auf Weiter. Im Bereich Spaltenattribute konfigurieren Sie die folgenden Spalteneigenschaften fr die Spalte CustomerTier:
Eigenschaft Name Datentyp Przision Grenordnung Beschreibung Beschreibung CustomerTier String 10 0 Referenzwerte fr CustomerTier

4.

11. 12. 13.

Erstellen Sie gegebenenfalls eine Beschreibungsspalte fr Zeilen in der Referenztabelle. Geben Sie den Namen und die Przision fr die Spalte ein. Erstellen Sie im Bereich Vorschau eine Vorschau fr die Werte in der Spalte CustomerTier. Klicken Sie auf Weiter. Die Referenztabelle Reftab_CustomerTier_Hypostores wird eingeblendet. Sie knnen gegebenenfalls eine Beschreibung eingeben.

14.

Whlen Sie im Bereich Speichern unter Ihr Tutorialprojekt, in dem Sie die Referenztabelle erstellen mchten. Der Bereich Referenztabellen:zeigt die Referenztabellen an dem von Ihnen gewhlten Speicherort.

15. 16.

Geben Sie eine optionale Audit-Anmerkung ein. Klicken Sie auf Fertigstellen.

32

Kapitel 8: Lektion 7. Erstellen von Referenztabellen aus Profilspalten

Aufgabe 2 Bearbeiten der Referenztabelle


Sie bearbeiten in dieser Aufgabe die Tabelle Reftab_CustomerTier_Hypostores, um alternative Werte fr die Kundenebenen hinzuzufgen. 1. 2. Whlen Sie im Navigator den Ordner Customers in Ihrem Tutorialprojekt. Klicken Sie auf die Referenztabelle Reftab_CustomerTier_Hypostores. Die Referenztabelle wird in einer Registerkarte geffnet. 3. Um eine Zeile zu bearbeiten, whlen Sie die Zeile aus und klicken auf Aktionen > Bearbeitenoder klicken auf das Symbol Bearbeiten. Das Fenster Zeile bearbeiten wird eingeblendet. Whlen Sie gegebenenfalls mehrere Zeilen, um jeder Zeile den gleichen alternativen Wert hinzuzufgen. 4. Geben Sie fr die Zeilen Diamond, Emerald, Gold, Silver, and Bronze folgende alternative Werte ein: 1, 2, 3, 4, 5. Geben Sie eine optionale Audit-Anmerkung ein. 5. Klicken Sie auf bernehmen, um die nderungen zu bernehmen.

Erstellen von Referenztabellen aus Profilspalten Zusammenfassung


Sie haben in dieser Lektion erfahren, wie Referenztabellen aus den Ergebnissen eines Profils erstellt werden, um gltige Werte fr Quelldaten zu konfigurieren. Sie haben eine Referenztabelle aus einer Profilspalte erstellt, indem gltige Werte fr die Spalten ausgewhlt wurden. Sie haben die Referenztabelle bearbeitet, um unterschiedliche gltige Werte fr die Spalten zu konfigurieren.

Aufgabe 2 Bearbeiten der Referenztabelle

33

KAPITEL 9

Lektion 8. Erstellen von Referenztabellen


Dieses Kapitel umfasst die folgenden Themen:
Erstellen von Referenztabellen - bersicht, 34 Aufgabe 1 Erstellen einer neuen Referenztabelle, 35 Erstellen von Referenztabellen - Zusammenfassung, 35

Erstellen von Referenztabellen - bersicht


Eine Referenztabelle enthlt Referenzdaten, die zum Standardisieren von Quelldaten verwendet werden knnen. Referenzdaten knnen gltige und Standardwerte einschlieen. Erstellen Sie Referenztabellen, um Beziehungen zwischen den Quelldatenwerten und den gltigen und Standard-Werten einzurichten. Eine Referenztabelle kann manuell mit dem Referenztabellen-Editor erstellt werden. Verwenden Sie die Referenztabelle, um die Quelldaten zu definieren und zu standardisieren. Sie knnen die Referenztabelle gemeinsam mit einem Entwickler nutzen, um sie im Standardisierer und in Lookup-Transformationen im Entwicklertool zu verwenden.

Story
HypoStores mchte Daten mit gltigen Werten standardisieren. Sie sind der Analyst, der fr die Standardisierung der gltigen Werte in den Daten verantwortlich ist. Sie mchten eine Referenztabelle erstellen, um Standard-Tier-Codes fr Kunden zu definieren, die die LA-Kundendaten referenzieren. Danach knnen Sie die Referenztabelle gemeinsam mit einem Entwickler nutzen.

Ziele
In dieser Lektion fhren Sie folgende Aufgabe durch:
Erstellen einer Referenztabelle mit dem Referenztabellen-Editor, um Standard-Tier-Codes fr Kunden zu

definieren, die die LA-Kundendaten referenzieren.

Voraussetzungen
berprfen Sie die folgende Voraussetzung, bevor Sie mit dieser Lektion beginnen:
Sie haben die Lektionen 1 und 2 in diesem Tutorial abgeschlossen.

Zeitplan
Rechnen Sie mit 10 Minuten, um die Aufgabe in dieser Lektion abzuschlieen.

34

Aufgabe 1 Erstellen einer neuen Referenztabelle


In dieser Aufgabe erstellen Sie die Referenztabelle Reftab_CustomerTier_Codes, um die gltigen Werte fr die CustomerTier-Daten zu standardisieren. 1. 2. Whlen Sie im Navigator den Ordner Customer in Ihrem Tutorialprojekt, in dem Sie die Referenztabelle erstellen mchten. Klicken Sie auf Aktionen > Neue Referenztabelle. Der Assistent Neue Referenztabelle wird eingeblendet. 3. 4. 5. Whlen Sie die Option Referenztabellen-Editor verwenden. Klicken Sie auf Weiter. Geben Sie als Tabellename Reftab_CustomerTier_Codes an, und geben Sie ggf. eine Beschreibung ein. Setzen Sie den Standardwert auf 0. Das Analysetool verwendet den Standardwert fr jeden Datensatz der Tabelle, welcher keinen Wert enthlt. 6. Klicken Sie fr jede Spalte, die Sie in die Referenztabelle aufnehmen mchten, auf das Symbol Neue Spalte hinzufgen, und konfigurieren Sie die Spalteneigenschaften fr jede Spalte. Fgen Sie folgende Spaltennamen hinzu: CustomerID (Kunden-ID), CustomerTier (Kundenebene) und Status. Sie knnen die Spalten neu ordnen oder Spalten lschen. 7. 8. Klicken Sie auf Fertigstellen. ffnen Sie die Referenztabelle Reftab_CustomerTier_Codes, und klicken Sie auf Aktionen > Zeile hinzufgen, um jede Spalte der Referenztabelle mit vier Werten zu fllen. CustomerID = LA1, LA2, LA3, LA4 CustomerTier = 1, 2, 3, 4, 5. Status = Aktiv, Inaktiv

Erstellen von Referenztabellen - Zusammenfassung


In dieser Lektion haben Sie erfahren, wie Referenztabellen mit dem Referenztabellen-Editor erstellt werden, um gltige Standardwerte zu erstellen, die mit Quelldaten verwendet werden. Sie haben eine Referenztabelle unter Verwendung des Referenztabellen-Editors erstellt, um Kundenebenenwerte fr die LA-Kundendaten zu standardisieren.

Aufgabe 1 Erstellen einer neuen Referenztabelle

35

Teil II: Inbetriebnahme des Informatica Developer


Dieser Teil enthlt die folgenden Kapitel:
Lektion 1. Einrichten von Informatica Developer, 37 Lektion 2. Importieren von physischen Datenobjekten , 41 Lektion 3. Profiling von Daten, 45 Lektion 4. Parsen von Daten, 49 Lektion 5. Standardisieren von Daten , 55 Lektion 6. Validieren von Adressdaten, 61

36

KAPITEL 10

Lektion 1. Einrichten von Informatica Developer


Dieses Kapitel umfasst die folgenden Themen:
Einrichten von Informatica Developer - bersicht, 37 Aufgabe 1 Informatica Developer starten, 38 Aufgabe 2 Eine Domne hinzufgen, 38 Aufgabe 3 Ein Model Repository hinzufgen, 38 Aufgabe 4 Ein Projekt erstellen, 39 Aufgabe 5 Einen Ordner erstellen, 39 Aufgabe 6 Standard-Data Integration Service auswhlen., 39 Einrichten von Informatica Developer - Zusammenfassung, 40

Einrichten von Informatica Developer - bersicht


Bevor Sie mit den Lektionen in diesem Tutorial beginnen knnen, mssen Sie das Entwicklertool starten und einrichten. Fgen Sie eine Domne hinzu, um das Entwicklertool einzurichten. Sie fgen ein ModellRepository hinzu, das sich in der Domne befindet, und Sie erstellen ein Projekt und einen Ordner, um Ihre Arbeit zu speichern. Auerdem whlen Sie einen Standard-Data Integration Service. Die Informatica-Domne ist eine Sammlung von Knoten und Diensten, die die Informatica-Umgebung definieren. Zu den Diensten in der Domne gehren der Model Repository Service und der Data Integration Service. Der Model Repository Service verwaltet das Model Repository. Das Model Repository ist eine relationale Datenbank, die die Metadaten fr Projekte speichert, die Sie im Entwicklertool erstellen. In einem Projekt werden Objekte gespeichert, die Sie im Entwicklertool erstellen. Ein Projekt kann auch Ordner enthalten, in denen verwandte Objekte gespeichert werden, wie Objekte, die Teile der gleichen Geschftsumgebung sind. Der Data Integration Service fhrt Datenintegrationsaufgaben im Entwicklertool aus.

Ziele
In dieser Lektion fhren Sie folgende Aufgaben durch:
Entwicklertool starten und zur Entwicklertool-Workbench gehen. Hinzufgen einer Domne im Entwicklertool. Hinzufgen eines Model Repository, damit Sie ein Projekt erstellen knnen. Erstellen eines Projekts, um die Objekte zu speichern, die Sie im Entwicklertool erstellen. Erstellen eines Ordners im Projekt, in dem Sie verwandte Objekte speichern knnen. Auswhlen eines Standard-Data Integration Service zur Durchfhrung von Datenintegrationsaufgaben.

37

Voraussetzungen
berprfen Sie die folgenden Voraussetzungen, bevor Sie mit dieser Lektion beginnen:
Sie haben das Entwicklertool installiert. Sie haben einen Domnennamen, einen Hostnamen und eine Portnummer, um sich mit einer Domne zu

verbinden. Sie erhalten diese Informationen von einem Domnenadministrator.


Ein Domnenadministrator hat im Administratortool einen Model Repository Service konfiguriert. Sie haben einen Benutzernamen und ein Passwort, um auf den Model Repository Service zuzugreifen. Sie

knnen diese Informationen von einem Domnenadministrator erhalten.


Ein Domnenadministrator hat einen Data Integration Service konfiguriert. Der Data Integration Service wird ausgefhrt.

Zeitplan
Rechnen Sie mit 5 bis 10 Minuten, um die Aufgaben in dieser Lektion abzuschlieen.

Aufgabe 1 Informatica Developer starten


Starten Sie das Entwicklertool, um mit dem Tutorial zu beginnen. 1. Starten Sie das Entwicklertool. Die Begrungsseitedes Entwicklertools wird eingeblendet. 2. Klicken Sie auf Workbench. Die Workbench des Entwicklertools wird eingeblendet.

Aufgabe 2 Eine Domne hinzufgen


In dieser Aufgabe fgen Sie im Entwicklertool eine Domne hinzu, um auf ein Model Repository zuzugreifen. 1. Klicken Sie auf Fenster > Einstellungen. Das Dialogfeld Einstellungen wird eingeblendet 2. 3. Whlen Sie Informatica > Domnen. Klicken Sie auf Hinzufgen. Das Dialogfeld Neue Domne wird eingeblendet 4. 5. 6. Geben Sie den Domnennamen, den Hostnamen und die Portnummer ein. Klicken Sie auf Fertigstellen. Klicken Sie auf OK.

Aufgabe 3 Ein Model Repository hinzufgen


In dieser Aufgabe fgen Sie ein Modell-Repository zum Speichern von Projekten und Ordnern hinzu. 1. Klicken Sie auf Datei > Mit Repository verbinden. Das Dialogfeld Mit Repository verbinden wird eingeblendet. 2. 3. Klicken Sie auf Durchsuchen, um einen Model Repository Service auszuwhlen. Klicken Sie auf OK.

38

Kapitel 10: Lektion 1. Einrichten von Informatica Developer

4. 5. 6. 7.

Klicken Sie auf Weiter. Geben Sie Ihren Benutzernamen und Ihr Passwort ein. Whlen Sie einen Namespace aus. Klicken Sie auf Fertigstellen. Das Modell-Repository wird in der Ansicht Object Explorer angezeigt.

Aufgabe 4 Ein Projekt erstellen


In dieser Aufgabe erstellen Sie ein Projekt, um Objekte zu speichern, die Sie im Entwicklertool erstellt haben. Sie knnen ein Projekt fr alle Tutorials in dieser Anleitung erstellen. 1. 2. Whlen Sie in der Ansicht Object Explorer einen Model Repository Service. Klicken Sie auf Datei > Neu > Projekt. Das Dialogfeld Neues Projekt wird eingeblendet. 3. 4. Geben Sie Ihren Namen mit vorangestelltem "Tutorial_" als Namen des Projekts ein. Klicken Sie auf Fertigstellen. Das Projekt wird unter dem Model Repository Service in der Ansicht Object Explorer angezeigt.

Aufgabe 5 Einen Ordner erstellen


In dieser Aufgabe erstellen Sie einen Ordner, um verwandte Objekte zu speichern. Sie knnen einen Ordner fr alle Tutorials in dieser Anleitung erstellen. 1. 2. 3. 4. Whlen Sie in der Ansicht Object Explorer das Projekt, dem Sie die Ordner hinzufgen mchten. Klicken Sie auf Datei > Neu > Ordner. Geben Sie einen Namen fr den Ordner ein. Klicken Sie auf Fertigstellen. Das Entwicklertool fgt den Ordner unter dem Projekt in der Ansicht Object Explorer ein. Erweitern Sie das Projekt, um den Ordner zu sehen.

Aufgabe 6 Standard-Data Integration Service auswhlen.


In dieser Aufgabe whlen Sie einen Standard-Data Integration Service aus, damit Sie Mappings ausfhren und die Vorschau von Daten anzeigen knnen. 1. Klicken Sie auf Fenster > Einstellungen. Das Dialogfeld Einstellungen wird eingeblendet 2. 3. 4. 5. 6. Whlen Sie Informatica > Data Integration Services. Erweitern Sie die Domne. Whlen Sie einen Data Integration Service. Klicken Sie auf Als Standard definieren. Klicken Sie auf OK.

Aufgabe 4 Ein Projekt erstellen

39

Einrichten von Informatica Developer Zusammenfassung


In dieser Lektion haben Sie erfahren, dass der Model Repository Service und der Data Integration Service zu der Informatica-Domne gehren. Der Model Repository Service verwaltet das Model Repository. Ein Model Repository enthlt Projekte und Ordner. Der Data Integration Service fhrt Datenintegrationsaufgaben aus. Sie haben das Entwicklertool gestartet und eingerichtet. Sie haben im Entwicklertool eine Domne und ein Model Repository hinzugefgt und ein Projekt sowie einen Ordner erstellt. Sie haben auerdem einen Standard-Data Integration Service ausgewhlt. Sie knnen nun das Entwicklertool verwenden, um weitere Lektionen in diesem Tutorial durchzuarbeiten.

40

Kapitel 10: Lektion 1. Einrichten von Informatica Developer

KAPITEL 11

Lektion 2. Importieren von physischen Datenobjekten


Dieses Kapitel umfasst die folgenden Themen:
Importieren von physischen Datenobjekten - bersicht, 41 Aufgabe 1 Importieren des Einfachdatei-Datenobjekts Boston_Customers, 42 Aufgabe 2 Import des Einfachdatei-Datenobjekts LA_Customers, 42 Aufgabe 3 Importieren des Einfachdatei-Datenobjekts All_Customers, 43 Importieren von physischen Datenobjekten - Zusammenfassung, 44

Importieren von physischen Datenobjekten - bersicht


Ein physisches Datenobjekt ist eine Darstellung von Daten, die auf einer Einfachdatei oder einer Tabelle einer relationalen Datenbank basieren. Sie knnen eine Einfachdatei oder Tabelle einer relationalen Datenbank als physisches Datenobjekt importieren, um es als Quelle oder Ziel in einem Mapping einzusetzen.

Story
HypoStores Corporation speichert Kundendaten aus dem Bro in Los Angeles und dem Bro in Boston in Einfachdateien. Sie mchten mit diesen Kundendaten im Entwicklertool arbeiten. Dazu mssen Sie jede Einfachdatei als physisches Datenobjekt importieren.

Ziele
In dieser Lektion importieren Sie Einfachdateien als physische Datenobjekte. Sie knnen das Quelldateiverzeichnis auch so festlegen, dass der Data Integration Service die Quelldaten aus dem richtigen Verzeichnis lesen kann.

Voraussetzungen
berprfen Sie die folgende Voraussetzung, bevor Sie mit dieser Lektion beginnen:
Sie haben Lektion 1 in diesem Tutorial abgeschlossen.

Zeitplan
Rechnen Sie mit 10 bis 15 Minuten, um die Aufgaben in dieser Lektion durchzufhren.

41

Aufgabe 1 Importieren des Einfachdatei-Datenobjekts Boston_Customers


In dieser Aufgabe importieren Sie ein physisches Datenobjekt aus einer Datei, die Kundendaten aus dem Bro in Boston enthlt. 1. 2. Whlen Sie in der Ansicht Object Explorer das Tutorialprojekt aus. Klicken Sie auf Datei > Neu > Datenobjekt. Das Dialogfeld Neu wird eingeblendet. 3. Whlen Sie Physische Datenobjekte > Einfachdatei-Datenobjekt, und klicken Sie auf Weiter Das Dialogfeld Neues Einfachdatei-Datenobjekt wird eingeblendet. 4. 5. 6. Whlen Sie Aus vorhandener Einfachdatei erstellen. Klicken Sie auf Durchsuchen, und gehen Sie zu Boston_Customers.csv im Verzeichnis <Informatica Installation Directory>\clients\DeveloperClient\Tutorials. Klicken Sie auf ffnen. Der Assistent benennt das Datenobjekt "Boston_Customers". 7. 8. 9. 10. 11. 12. 13. Klicken Sie auf Weiter. Vergewissern Sie sich, dass die Codepage MS Windows Latin 1 (ANSI) ist, eine Obermenge von Latin 1. Vergewissern Sie sich, dass das Format "delimited" ist. Klicken Sie auf Weiter. Vergewissern Sie sich, dass das Komma als Delimiter festgelegt ist. Whlen Sie Spaltennamen aus erster Zeile importieren. Klicken Sie auf Fertigstellen. Das physische Datenobjekt Boston_Customers erscheint im Tutorialprojekt unter Physische Datenobjekte. 14. 15. 16. 17. Klicken Sie auf die Ansicht Lesen, und whlen Sie die Ausgabeumwandlung. Klicken Sie auf die Registerkarte Laufzeit in der Ansicht Eigenschaften. Richten Sie das Quelldateiverzeichnis auf das folgende Verzeichnis des Rechners ein, auf dem der Data Integration Service luft: <Informatica Installation Directory>\server\Tutorials Klicken Sie auf Datei > Speichern.

Aufgabe 2 Import des Einfachdatei-Datenobjekts LA_Customers


In dieser Aufgabe importieren Sie ein physisches Datenobjekt aus einer Einfachdatei, die Kundendaten aus dem Bro in Los Angeles enthlt. 1. 2. Whlen Sie in der Ansicht Object Explorer das Tutorialprojekt aus. Klicken Sie auf Datei > Neu > Datenobjekt. Das Dialogfeld Neu wird eingeblendet. 3. Whlen Sie Physische Datenobjekte > Einfachdatei-Datenobjekt, und klicken Sie auf Weiter. Das Dialogfeld Neues Einfachdatei-Datenobjekt wird eingeblendet. 4. 5. Whlen Sie Aus vorhandener Einfachdatei erstellen. Klicken Sie auf Durchsuchen, und gehen Sie im Verzeichnis <Informatica Installation Directory> \clients\DeveloperClient\Tutorialszu LA_Customers.csv.

42

Kapitel 11: Lektion 2. Importieren von physischen Datenobjekten

6.

Klicken Sie auf ffnen. Der Assistent benennt das Datenobjekt LA_Customers.

7. 8. 9. 10. 11. 12. 13.

Klicken Sie auf Weiter. Vergewissern Sie sich, dass die Codepage MS Windows Latin 1 (ANSI) ist, eine Obermenge von Latin 1. Vergewissern Sie sich, dass das Format "delimited" ist. Klicken Sie auf Weiter. Vergewissern Sie sich, dass das Komma als Delimiter festgelegt ist. Whlen Sie Spaltennamen aus erster Zeile importieren. Klicken Sie auf Fertigstellen. Das physische Datenobjekt LA_Customers erscheint im Tutorialprojekt unter Physische Datenobjekte.

14. 15. 16. 17.

Klicken Sie auf die Ansicht Lesen, und whlen Sie die Ausgabeumwandlung. Klicken Sie auf die Registerkarte Laufzeit in der Ansicht Eigenschaften. Richten Sie das Quelldateiverzeichnis auf das folgende Verzeichnis des Rechners ein, auf dem der Data Integration Service luft: <Informatica Installation Directory>\server\Tutorials . Klicken Sie auf Datei > Speichern.

Aufgabe 3 Importieren des Einfachdatei-Datenobjekts All_Customers


In dieser Aufgabe importieren Sie ein physisches Datenobjekt aus einer Einfachdatei, die KundenAuftragsdaten aus den Bros in Los Angeles und Bosten kombiniert. 1. 2. Whlen Sie in der Ansicht Object Explorer das Tutorialprojekt aus. Klicken Sie auf Datei > Neu > Datenobjekt. Das Dialogfeld Neu wird eingeblendet. 3. Whlen Sie Physische Datenobjekte > Einfachdatei-Datenobjekt, und klicken Sie auf Weiter. Das Dialogfeld Neue Einfachdatei-Datenquelle wird eingeblendet. 4. 5. 6. Whlen Sie Aus vorhandener Einfachdatei erstellen. Klicken Sie auf Durchsuchen, und gehen Sie im Verzeichnis <Informatica-Installationsverzeichnis> \clients\DeveloperClient\Tutorials zu All_Customers.csv. Klicken Sie auf ffnen. Der Assistent benennt das Datenobjekt "All_Customers". 7. 8. 9. 10. 11. 12. 13. Klicken Sie auf Weiter. Vergewissern Sie sich, dass die Codepage MS Windows Latin 1 (ANSI) ist, eine Obermenge von Latin 1. Vergewissern Sie sich, dass das Format "delimited" ist. Klicken Sie auf Weiter. Vergewissern Sie sich, dass das Komma als Delimiter festgelegt ist. Whlen Sie Spaltennamen aus erster Zeile importieren. Klicken Sie auf Fertigstellen. Das physische Datenobjekt All_Customers erscheint im Tutorialprojekt unter Physische Datenobjekte. 14. 15. Klicken Sie auf die Ansicht Lesen, und whlen Sie die Ausgabeumwandlung. Klicken Sie auf die Registerkarte Laufzeit in der Ansicht Eigenschaften.

Aufgabe 3 Importieren des Einfachdatei-Datenobjekts All_Customers

43

16. 17.

Richten Sie das Quelldateiverzeichnis auf das folgende Verzeichnis des Rechners ein, auf dem der Data Integration Service luft: <Informatica Installation Directory>\server\Tutorials . Klicken Sie auf Datei > Speichern.

Importieren von physischen Datenobjekten Zusammenfassung


In dieser Lektion haben Sie erfahren, dass physische Datenobjekte Darstellungen von Daten sind, die auf einer Einfachdatei oder einer Tabelle einer relationalen Datenbank basieren. Sie haben physische Datenobjekte aus Einfachdateien erstellt. Sie knnen das Quelldateiverzeichnis auch so festlegen, dass der Data Integration Service die Quelldaten aus dem richtigen Verzeichnis lesen kann. Sie verwenden die Datenobjekte als Mapping-Quellen in den Datenqualittslektionen.

44

Kapitel 11: Lektion 2. Importieren von physischen Datenobjekten

KAPITEL 12

Lektion 3. Profiling von Daten


Dieses Kapitel umfasst die folgenden Themen:
Profiling von Daten - bersicht, 45 Aufgabe 1 Durchfhren einer Join-Analyse mit zwei Datenquellen , 46 Aufgabe 2 Anzeigen der Ergebnisse einer Join-Analyse, 47 Aufgabe 3 Ausfhren eines Profils fr eine Datenquelle, 47 Aufgabe 4 Anzeigen von Ergebnissen des Spalten-Profiling , 48 Profiling von Daten - Zusammenfassung, 48

Profiling von Daten - bersicht


Ein Profil ist ein Satz von Metadaten, das den Inhalt und die Struktur eines Datensatzes zeigt. Daten-Profiling ist oft der erste Schritt in einem Projekt. Sie knnen ein Profil ausfhren, um die Struktur der Daten zu bewerten und sich zu vergewissern, dass Datenspalten mit den Typen von Informationen befllt sind, die Sie erwarten. Wenn ein Profil Probleme in den Daten aufzeigt, knnen Sie Schritte in Ihrem Projekt festlegen, um diese Probleme zu beheben. Wenn ein Profil beispielsweise aufzeigt, dass eine Spalte Werte enthlt, die ber der erwarteten Lnge liegen, knnen Sie Datenqualittsprozesse entwerfen, um die problematischen Werte zu entfernen oder zu entschrfen. Ein Profil, das die Datenqualitt von ausgewhlten Spalten analysiert, wird als Spaltenprofil bezeichnet. Hinweis: Sie knnen auch das Entwicklertool verwenden, um Beziehungen von Primrschlssel, Fremdschlssel und funktionaler Abhngigkeit zu erkennen und Join-Bedingungen an Datenspalten zu analysieren. Ein Spaltenprofil liefert die folgenden Fakten ber Daten:
Die Anzahl der eindeutigen und Null-Werte in jeder Spalte, angegeben als Zahl und als Prozentwert. Das Muster der Daten in jeder Spalte und die Hufigkeit, mit der diese Werte vorkommen. Statistiken zu den Spaltenwerten, wie Maximal- und Minimallnge der Werte und erster und letzter Wert in

jeder Spalte.
Bei Join-Analyse-Profilen wird der berlappungsgrad zwischen zwei Datenspalten als Venn-Diagramm und

als Prozentwert angezeigt. Verwenden Sie Join-Analyse-Profile, um mgliche Profile mit SpaltenJoinbedingungen zu identifizieren. Sie knnen in jedem Stadium eines Projekts ein Spaltenprofil ausfhren und berprfen, ob die nderungen an den Daten Ihren Projektzielen entsprechen. Sie knnen ein Spaltenprofil an einer Umwandlung in einem Mapping ausfhren, um die Wirkung anzuzeigen, die die Umwandlung auf die Daten haben wird.

Story
HypoStores mchte sich vergewissern, dass die Kundendaten frei von Fehlern, Inkonsistenzen und doppelten Informationen sind. Bevor HypoStores die Prozesse entwickelt, um die Datenqualittsziele zu erreichen, muss die Qualitt ihrer Quelldatendateien gemessen werden und besttigt werden, dass die Daten verarbeitet werden knnen.

45

Ziele
In dieser Lektion fhren Sie folgende Aufgaben durch:
Durchfhren einer Join-Analyse an der Datenquelle Boston_Customers und der Datenquelle LA_Customers. Anzeigen der Ergebnisse der Join-Analyse, um zu bestimmen, ob die Daten aus den beiden Bros

erfolgreich zusammengefhrt werden knnen oder nicht.


Ausfhren eines Spaltenprofils an der Datenquelle All_Customers. Anzeigen der Ergebnisse des Spaltenprofils, um die Werte und Muster anzusehen, die in den Daten

enthalten sind.

Voraussetzungen
berprfen Sie die folgende Voraussetzung, bevor Sie mit dieser Lektion beginnen:
Sie haben die Lektionen 1 und 2 in diesem Tutorial abgeschlossen.

Zeitbedarf
Rechnen Sie mit 20 Minuten fr diese Lektion.

Aufgabe 1 Durchfhren einer Join-Analyse mit zwei Datenquellen


In dieser Aufgabe fhren Sie eine Join-Analyse der Datenquellen Bostom_Customers und LA_Customers durch, um die Join-Bedingungen anzuzeigen. 1. 2. In der Object Explorer-Ansicht gehen Sie zu den Datenobjekten in Ihrem Tutorialprojekt. Whlen Sie die Datenquellen Boston_Customers und LA_Customers. Tipp: Halten Sie die Shift-Taste gedrckt, um mehrere Datenobjekte auszuwhlen. 3. Klicken Sie mit der rechten Maustaste auf die ausgewhlten Datenobjekte, und whlen Sie Profil. Der Assistent Neues Profil wird geffnet. 4. 5. Whlen Sie Profil-Modell, und klicken Sie auf Weiter. In das Bereich Namegeben Sie Tutorial_Model ein. Klicken Sie auf Weiter. 6. 7. Vergewissern Sie sich, dass Boston_Customers und LA_Customers in der Spalte Datenobjekt erscheinen. Klicken Sie auf Fertigstellen. Das Profilmodell Tutorial_Model erscheint im Object Explorer. 8. 9. Verwenden Sie die Maus, um im Modellierungsbereich Boston_Customers und LA_Customers auszuwhlen. Klicken Sie mit der rechten Maustaste auf einen Datenobjektnamen, und whlen Sie Join-Profil. Der Assistent Neues Join-Profil wird geffnet. 10. 11. Geben Sie in das Bereich Name JoinAnalysis ein. Vergewissern Sie sich, dass Boston_Customers und LA_Customers als Datenobjekte erscheinen. Klicken Sie auf Weiter. 12. Whlen Sie in beiden Datenquellen die Spalte CustomerID. Scrollen Sie im Assistentenbereich nach unten, um die Spalten in beiden Datenstzen anzuzeigen. Klicken Sie auf Weiter. 13. Klicken Sie auf Hinzufgen, um Join-Bedingungen hinzuzufgen. Das Fenster Join-Bedingung wird geffnet. 14. Klicken Sie im Abschnitt Spalten auf die Schaltflche "Neu".

46

Kapitel 12: Lektion 3. Profiling von Daten

15. 16. 17.

Doppelklicken Sie auf die erste Zeile in der linken Spalte, und whlen Sie CustomerID. Doppelklicken Sie auf die erste Zeile in der rechten Spalte, und whlen Sie CustomerID. Klicken Sie auf OK und dann auf Fertigstellen. Das Profil JoinAnalysis wird im Editor geffnet, und das Profil wird ausgefhrt.

Hinweis: Schlieen Sie das Profil nicht. In der nchsten Aufgabe zeigen Sie die Ergebnisse des Profils an.

Aufgabe 2 Anzeigen der Ergebnisse einer JoinAnalyse


In dieser Aufgabe zeigen Sie die Ergebnisse der Join-Analyse in der Ansicht der Join-Ergebnisse des Profils
JoinAnalysis

1. 2.

Klicken Sie auf die Registerkarte JoinAnalysis im Modellierungsbereich. Klicken Sie im Abschnitt Join-Profil auf die erste Zeile. Der Abschnitt Details zeigt ein Venn-Diagramm und einen Schlssel, der die Ergebnisse der JoinAnalyse detailliert angibt.

3.

Vergewissern Sie sich, dass die Spalte Zeilen verbinden fr die Anzahl der Zeilen, die einen Join enthalten, Null enthlt. Dies zeigt, dass keines der CustomerID-Bereicher Doppelwerte sind, wodurch naheliegt, dass Sie die beiden Datenquellen erfolgreich zusammenfhren knnen. Um die CustomerID-Werte fr das Datenobjekt LA_Customers anzuzeigen, doppelklicken Sie im VennDiagramm auf den Kreis mit der Bezeichnung LA_Customers. Tipp: Doppelklicken Sie auf die Kreise im Venn-Diagramm, um die Datenzeilen anzuzeigen, die von diesen Eintrgen beschrieben werden. In Fllen, in denen sich im Venn-Diagramm Kreise schneiden, doppelklicken Sie auf den Schnittpunkt, um Datenwerte anzuzeigen, die in beiden Datenstzen enthalten sind. Der Daten-Viewer zeigt die CustomerID-Werte an, die im Datenobjekt LA_Customers enthalten sind.

4.

Aufgabe 3 Ausfhren eines Profils fr eine Datenquelle


In dieser Aufgabe fhren Sie ein Profil fr die Datenquelle All_Customers aus, um die Struktur und den Inhalt der Daten anzusehen. 1. 2. 3. Gehen Sie in der Ansicht Objekt-Explorer zu den Datenobjekten in Ihrem Tutorial-Projekt. Whlen Sie die Datenquelle All_Customers aus. Klicken Sie auf Datei > Neu > Profil. Das Fenster Neues Profil wird geffnet. 4. 5. Geben Sie im Bereich Name All_Customers ein. Klicken Sie auf Fertigstellen. Das Profil All_Customers wird im Editor geffnet und das Profil wird ausgefhrt.

Aufgabe 2 Anzeigen der Ergebnisse einer Join-Analyse

47

Aufgabe 4 Anzeigen von Ergebnissen des SpaltenProfiling


In dieser Aufgabe zeigen Sie die Ergebnisse des Spalten-Profiling fr das Datenobjekt All_Customers an und untersuchen die Werte und die in den Daten enthaltenen Muster. 1. Klicken Sie auf Fenster > Ansicht anzeigen > Fortschritt, um den Fortschritt des Profils All_Customers zu sehen. Die Fortschritt-Ansicht wird geffnet. 2. 3. Wenn die Fortschritt-Ansicht angibt, dass die Ausfhrung des Profil All_Customers abgeschlossen ist, klicken Sie auf die Ansicht Ergebnisse im Editor. Klicken Sie im Abschnitt Spalten-Profiling auf die Spalte CustomerTier. Der Abschnitt Details zeigt alle Werte, die in der Spalte CustomerTier enthalten sind, und zeigt Informationen, wie hufig der Wert in dem Datensatz vorkommt. 4. Doppelklicken Sie in dem Abschnitt Details auf den Wert Ruby. Der Daten-Viewer wird ausgefhrt und zeigt die Datenstze, in denen die Spalte CustomerTier den Wert Ruby enthlt. 5. 6. Klicken Sie im Abschnitt Spalten-Profiling auf die Spalte OrderAmount (Bestellmenge). Klicken Sie im Abschnitt Details auf die Liste Anzeigen, und whlen Sie Muster. Der Abschnitt Details zeigt die Muster , die sich in der Spalte OrderAmount befinden. Der String 9((5) in der Spalte Musterbezieht sich auf Datenstze, die fnfstellige Bestellmengen enthalten. Der String 9((4 bezieht sich auf Datenstze, die vierstellige Mengen enthalten. 7. Doppelklicken Sie in der Spalte Muster auf den String 9(4). Der Daten-Viewer wird ausgefhrt und zeigt die Datenstze an, in denen die Spalte OrderAmount eine vierstellige Bestellmenge enthlt. 8. Klicken Sie im Abschnitt Details auf die Liste Anzeigen, und whlen Sie Statistiken. Der Abschnitt Details zeigt Statistiken fr die Spalte OrderAmount einschlielich dem Durchschnittswert, der Standardabweichung, maximalen und Mindestlngen, den fnf hufigsten Werten und den fnf seltensten Werten.

Profiling von Daten - Zusammenfassung


In dieser Lektion haben Sie erfahren, dass ein Profil Informationen ber den Inhalt und die Struktur der Daten liefert. Sie haben gelernt, dass Sie mit zwei Datenobjekten eine Join-Analyse durchfhren knnen und den berlappungsgrad zwischen den Datenobjekten anzeigen knnen. Sie haben auch erfahren, dass Sie ein Spaltenprofil an einem Datenobjekt ausfhren knnen und Werte, Muster und Statistiken anzeigen knnen, die jede Spalte in dem Datenobjekt betreffen. Sie haben das Profil JoinAnalysis erstellt, um zu ermitteln, ob Daten aus dem Datenobjekt Bostom_Customers mit den Daten im Datenobjekt LA_Customers zusammengefhrt werden knnen. Sie haben die Ergebnisse dieses Profils angezeigt und ermittelt, dass alle Werte in der Spalte CustomerID eindeutig sind und die Datenobjekte erfolgreich zusammengefhrt werden knnen. Sie haben das Profil All_Customers erstellt und ein Spaltenprofil mit dem Datenobjekt All_Customers ausgefhrt. Sie haben die Ergebnisse dieses Profils angezeigt, um Werte, Muster und Statistiken fr die Spalten im Datenobjekt All_Customers anzuzeigen. Sie haben schlielich den Daten-Viewer ausgefhrt, um Zeilen anzuzeigen, die die von Ihnen ausgewhlten Werte und Muster enthalten, wodurch Sie die Qualitt der Daten profen konnten.

48

Kapitel 12: Lektion 3. Profiling von Daten

KAPITEL 13

Lektion 4. Parsen von Daten


Dieses Kapitel umfasst die folgenden Themen:
Parsen von Daten - bersicht, 49 Aufgabe 1. Erstellen eines Target-Datenobjekts, 50 Aufgabe 2. Erstellen eines Mappings zum Parsen von Daten, 51 Aufgabe 3. Ausfhren eines Profils fr die Parser-Umwandlung, 53 Aufgabe 4. Ausfhren des Mappings, 54 Aufgabe 5. Anzeigen der Mapping-Ausgabe, 54 Parsen von Daten - Zusammenfassung, 54

Parsen von Daten - bersicht


Sie parsen Daten, um ein oder mehrere Datenelemente in einem Eingabefeld zu kennzeichnen und jedes Datenelement in ein anderes Ausgabefeld zu schreiben. Das Parsen ermglicht Ihnen, die Informationen in den einzelnen Spalten besser zu kontrollieren. Nehmen Sie beispielsweise ein Datenfeld mit dem vollen Namen einer Person, Bob Smith. Anhand der Parser-Umwandlung knnen Sie den vollstndigen Namen in separate Datenspalten fr den Vornamen und den Nachnamen aufteilen. Nachdem Sie die Daten in neue Spalten geparst haben, knnen Sie fr jede Spalte benutzerspezifische Datenqualitts-Operationen erstellen. Sie knnen die Parser-Umwandlung auf die Verwendung von Tokenstzen zum Parsen von Datenspalten in Komponenten-Strings konfigurieren. Ein Tokensatz kennzeichnet Datenelemente, z. B. Wrter, Postleitzahlen, Telefonnummern und Sozialversicherungsnummern. Mit der Parser-Umwandlung knnen Sie ebenfalls Daten parsen, die mit Referenztabelleneintrgen oder von Ihnen eingegebenen benutzerspezifischen regulren Expressionen bereinstimmen.

Story
Bei HypoStores muss das Format der Kundendatendateien der Niederlassung in Los Angeles mit dem Format der Datendateien der Bostoner Niederlassung bereinstimmen. Die Kundendaten der Niederlassung Los Angeles speichern den Kundennamen in einer Spalte FullName, whrend die Kundendaten der Bostoner Niederlassung den Kundennamen in separaten Spalten fr den FirstName und LastName speichern. Bei HypoStores mssen die Daten der Spalten Los Angeles FullName in Vornamen und Nachnamen geparst werden, damit das Format der Daten fr Los Angeles mit dem Format der Bostoner Daten bereinstimmt.

Zielsetzungen
In dieser Lektion bearbeiten Sie folgende Aufgaben:
Erstellen und Konfigurieren eines Datenobjekts LA_Customers_tgt, damit es geparste Daten enthlt. Erstellen eines Mapping zum Parsen der Spalte FullName in separate Spalten fr FirstName und LastName. Hinzufgen des Datenobjekts LA_Customers zum Mapping, um die Verbindung zu den Quellendaten

herzustellen.

49

Hinzufgen des Datenobjekts LA_Customers_tgt zum Mapping, um ein Target-Datenobjekt zu erstellen. Hinzufgen einer Parser-Umwandlung zum Mapping und Konfigurieren dieser Umwandlung, um einen

Tokensatz zum Parsen vollstndiger Namen in Vor- und Nachnamen zu verwenden.


Ausfhren eines Profils fr die Parser-Umwandlung, um die Daten vor dem Generieren der Target-

Datenquelle zu berprfen.
Ausfhren des Mapping, um geparste Namen zu generieren. Ausfhren des Daten-Viewers zur Anzeigen der Mapping-Ausgabe.

Voraussetzungen
berprfen Sie die folgende Voraussetzung, bevor Sie mit dieser Lektion beginnen:
Sie haben die Lektionen 1 und 2 in diesem Tutorial abgeschlossen.

Zeitaufwand
Planen Sie fr die vollstndige Durchfhrung der Aufgaben in dieser Lektion 20 Minuten ein.

Aufgabe 1. Erstellen eines Target-Datenobjekts


In dieser Aufgabe erstellen Sie ein Datenobjekt LA_Customers_tgt, in das Sie geparste Namen schreiben knnen. Zum Erstellen eines Target-Datenobjekts gehen Sie folgendermaen vor: 1. 2. 3. Erstellen Sie ein Datenobjekt LA_Customers_tgt basierend auf der Datei LA_Customers.csv. Konfigurieren Sie die Lesen- und Schreiben-Optionen fr das Datenobjekt einschlielich der Dateispeicherorte und Dateinamen. Fgen Sie die Spalten Firstname und Lastname zum Datenobjekt LA_Customers_tgt hinzu.

Schritt 1. Erstellen eines Datenobjekts LA_Customers_tgt


In diesem Schritt erstellen Sie ein Datenobjekt LA_Customers_tgt basierend auf der Datei LA_Customers.csv. 1. Klicken Sie auf Datei > Neu > Datenobjekt. Das Fenster Neu wird geffnet. 2. 3. 4. 5. 6. 7. 8. 9. 10. Whlen Sie Flatfile-Datenobjekt, und klicken Sie auf Weiter. Vergewissern Sie sich, dass Aus einem vorhandenen Flatfile erstellenausgewhlt wurde. Klicken Sie auf Durchsuchen, und navigieren Sie zuLA_Customers.csv im folgenden Verzeichnis:
<Informatica-Installationsverzeichnis>\clients\DeveloperClient\Tutorials

Klicken Sie auf ffnen. Geben Sie im Feld Name LA_Customers_tgtein. Klicken Sie auf Weiter. Klicken Sie auf Weiter. Whlen Sie im Abschnitt Vorschauoptionen Spaltennamen aus erster Zeile importieren, und klicken Sie auf Weiter. Klicken Sie auf Fertigstellen. Das Datenobjekt LA_Customers_tgt erscheint im Editor.

50

Kapitel 13: Lektion 4. Parsen von Daten

Schritt 2. Konfigurieren der Lesen- und Schreiben-Optionen


In diesem Schritt konfigurieren Sie die Lesen- und Schreiben-Optionen fr das Datenobjekt LA_Customers_tgt einschlielich Dateispeicherort und Dateinamen. 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. Vergewissern Sie sich, dass das Datenobjekt LA_Customers_tgt im Editor geffnet ist. Whlen Sie im Editor die Ansicht Lesen. Klicken Sie auf Fenster > Ansicht zeigen > Eigenschaften. Whlen Sie in der Ansicht Eigenschaften die Ansicht Laufzeit. In der Spalte Wert doppelklicken Sie auf den Quelldateinamen und -typ LA_Customers_tgt.csv. Doppelklicken Sie in der Spalte Wert, um das Quelldateiverzeichnis hervorzuheben. Klicken Sie mit der rechten Maustaste auf den hervorgehobenen Namen, und whlen Sie Kopierenaus. Whlen Sie im Editor die Ansicht Schreiben. Whlen Sie in der Ansicht Eigenschaften die Ansicht Laufzeit aus. Doppelklicken Sie in der Spalte Wert auf den EintragAusgabedateiverzeichnis. Klicken Sie mit der rechten Maustaste, und whlen Sie Einfgen, um den Verzeichnisspeicherort einzufgen, den Sie aus der Ansicht Lesen kopiert haben. Doppelklicken Sie in der Spalte Wert auf den Eintrag Kopfzeilenoptionen, und whlen Sie Ausgabefeldnamen. Doppelklicken Sie in der Spalte Wert auf den Eintrag Ausgabedateinamenund den Typ LA_Customers_tgt.csv. Zum Speichern des Datenobjekts klicken Sie auf Datei > Speichern.

Schritt 3. Hinzufgen von Spalten zum Datenobjekt


In diesem Schritt fgen Sie die Spalten Vorname und Nachname zum Datenobjekt LA_Customers_tgt hinzu. 1. 2. Gehen Sie in der Ansicht Objekt-Explorer zu den Datenobjekten in Ihrem Tutorial-Projekt. Doppelklicken Sie auf das Datenobjekt LA_Customers_tgt. Das Datenobjekt LA_Customers_tgt wird im Editor geffnet. 3. 4. berprfen Sie, dass die Ansicht bersicht ausgewhlt wurde. Whlen Sie die Spalte FullName, und klicken Sie die Schaltflche Neu an, um eine Spalte hinzuzufgen. Eine Spalte mit dem Namen FullName1 wird angezeigt. 5. 6. Benennen Sie die Spalte in Firstname um. Klicken Sie auf das Feld Przision, und geben Sie "30" ein. Whlen Sie die Spalte Firstname, und klicken Sie die Spalte Neu an, um eine Spalte hinzuzufgen. Eine Spalte mit dem Namen FirstName1 wird angezeigt. 7. 8. Benennen Sie die Spalte in Lastname um. Klicken Sie auf das Feld Przision, und geben Sie "30" ein. Klicken Sie auf Datei > Speichern, um das Datenobjekt zu speichern.

Aufgabe 2. Erstellen eines Mappings zum Parsen von Daten


In dieser Aufgabe erstellen Sie ein Mapping und konfigurieren es fr die Arbeit mit Datenobjekten und einer Parser-Umwandlung. Um ein Mapping zum Parsen von Daten anzulegen, gehen Sie bitte folgendermaen vor: 1. Erstellen Sie ein Mapping.

Aufgabe 2. Erstellen eines Mappings zum Parsen von Daten

51

2. 3. 4.

Fgen Sie dem Mapping Quell- und Targetobjekte hinzu. Fgen Sie eine Parser-Umwandlung zum Mapping hinzu. Konfigurieren Sie die Parser-Umwandlung zum Parsen der Quellenspalte mit dem vollstndigen Kundennamen in separate Targetspalten mit Vor- und Nachnamen.

Schritt 1. Erstellen eines Mappings


In diesem Schritt erstellen Sie das Mapping und geben ihm einen Namen. 1. 2. Whlen Sie in der Ansicht Objekt-Explorer das Tutorial-Projekt aus. Klicken Sie auf Datei > Neu > Mapping. Das Fenster Neues Mapping wird geffnet. 3. 4. Geben Sie in das Feld Name ParserMappingein. Klicken Sie auf Fertigstellen. Das Mapping wird im Editor geffnet.

Schritt 2. Hinzufgen von Datenobjekten zum Mapping


In diesem Schritt fgen Sie das Datenobjekt LA_Customers und das Datenobjekt LA_Customers_tgt zum Mapping hinzu. 1. 2. Gehen Sie in der Ansicht Objekt-Explorer zu den Datenobjekten in Ihrem Tutorial-Projekt. Whlen Sie das Datenobjekt LA_Customers aus, und ziehen Sie es in den Editor. Das Fenster Physisches Datenobjekt zum Mapping hinzufgen wird geffnet. 3. Vergewissern Sie sich, das Lesen ausgewhlt ist, und klicken Sie auf OK. Das Datenobjekt erscheint im Editor. 4. 5. Gehen Sie in der Ansicht Objekt-Explorer zu den Datenobjekten in Ihrem Tutorial-Projekt. Whlen Sie das Datenobjekt LA_Customers_tgt aus, und ziehen Sie es in den Editor. Das Fenster Physisches Datenobjekt zum Mapping hinzufgen wird geffnet. 6. Whlen Sie Schreiben, und klicken Sie auf OK. Das Datenobjekt erscheint im Editor. 7. Whlen Sie die Ports CustomerID, CustomerTierund FullName im DatenobjektLA_Customers. Ziehen Sie die Ports in den PortCustomerID im Datenobjekt LA_Customers_tgt. Tipp: Halten Sie die Taste Strg gedrckt, um mehrere Ports auszuwhlen. Die Ports des Datenobjekts LA_Customers stellen die Verbindung mit entsprechenden Ports im Datenobjekt LA_Customers_tgt her.

Schritt 3. Hinzufgen einer Parser-Umwandlung zum Mapping


In diesem Schritt fgen Sie eine Parser-Umwandlung zum Mapping ParserMapping hinzu. 1. 2. 3. Whlen Sie den Editor, der das Mapping ParserMapping enthlt. Whlen Sie aus der Umwandlungspalette die Parser-Umwandlung aus. Klicken Sie auf den Editor. Das Fenster Neue Parser-Umwandlung wird geffnet. 4. Vergewissern Sie sich, dass Token Parser ausgewhlt wurde, und klicken Sie auf Fertigstellen. Die Parser-Umwandlung erscheint im Editor.

52

Kapitel 13: Lektion 4. Parsen von Daten

5.

Whlen Sie den Port FullName im Datenobjekt LA_Customers aus, und ziehen Sie den Port in die GruppeEingabe der Parser-Umwandlung. Der Port FullName erscheint in der Parser-Umwandlung und ist mit dem Port FullName im Datenobjekt verbunden.

Schritt 4. Konfigurieren der Parser-Umwandlung


In diesem Schritt konfigurieren Sie die Parser-Umwandlung auf Parsen der Spalte mit dem vollstndigen Kundennamen in separate Spalten, die den Vornamen und den Nachnamen enthalten. 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. Whlen Sie den Editor aus, der das Mapping ParserMapping enthlt. Klicken Sie auf die Parser-Umwandlung. Klicken Sie auf Fenster > Ansicht zeigen > Eigenschaften. Whlen Sie in der Ansicht Eigenschaften die Ansicht Strategien aus. Klicken Sie auf Neu. Der Assistent fr die neue Strategie wird aufgerufen. Klicken Sie auf den Auswahlpfeil in der Eingabespalte, und whlen Sie den Port FullName. Whlen Sie den Leerschritt-Delimiter [\s]. Klicken Sie auf Weiter. Whlen Sie die Operation Parsen mit Tokensatz, und klicken Sie auf Weiter. Whlen Sie Fester Token-Satz (nur Einzelausgabe), und whlen Sie den Tokensatz Undefiniert. Klicken Sie auf das Feld Ausgaben, und whlen Sie Neu aus. Im Dialogfenster Operationsausgaben ndern Sie den Ausgabenamen in Undefined_Output. Klicken Sie auf Fertigstellen. Klicken Sie in der Parser-Umwandlung auf den Port Undefined_Output, und ziehen Sie ihn in den Port FirstName im Datenobjekt LA_customers_tgt. Zwischen den Ports erscheint eine Verbindung. 15. Klicken Sie in der Parser-Umwandlung auf den Port OverflowField, und ziehen Sie ihn in den Port LastName im Datenobjekt LA_customers_tgt. Zwischen den Ports erscheint eine Verbindung. 16. Klicken Sie zum Speichern des Mappings auf Datei > Speichern.

Aufgabe 3. Ausfhren eines Profils fr die ParserUmwandlung


In dieser Aufgabe fhren Sie ein Profil auf der Parser-Umwandlung aus, um zu berprfen, dass Sie die Parser-Umwandlung so konfiguriert haben, dass der vollstndige Name korrekt geparst wird. 1. 2. Whlen Sie den Editor aus, der das Mapping ParserMapping enthlt. Klicken Sie mit der rechten Maustaste auf die Umwandlung, und whlen Sie Profil jetzt aus. Das Profil wird gestartet und im Editor geffnet. 3. 4. Klicken Sie im Editor auf die Ansicht Ergebnisse, um das Ergebnis der Profilierungsoperation anzuzeigen.. Whlen Sie die Spalte Undefined_output, um Informationen ber die Spalte im Abschnitt Details anzuzeigen. Die in der Spalte Undefined_output enthaltenen Werte erscheinen im Abschnitt Detailszusammen mit der Frequenz und der Prozentstatistik fr jeden Wert. 5. Zeigen Sie die Daten an, und berprfen Sie, dass in der Spalte Undefined_output nur Vornamen stehen.

Aufgabe 3. Ausfhren eines Profils fr die Parser-Umwandlung

53

Aufgabe 4. Ausfhren des Mappings


Bei dieser Aufgabe fhren Sie das Mapping aus, um die Mapping-Ausgabe zu erstellen. 1. 2. Whlen Sie den Editor aus, der das Mapping ParserMapping enthlt. Klicken Sie auf Ausfhren > Mapping ausfhren. Das Mapping wird ausgefhrt und schreibt Ausgaben in die Datei LA_Customers_tgt.csv.

Aufgabe 5. Anzeigen der Mapping-Ausgabe


In dieser Aufgabe fhren Sie den Daten-Viewer aus, um die Mapping-Ausgabe anzuzeigen. 1. Gehen Sie in der Ansicht Objekt-Explorer zum Datenobjekt LA_Customers_tgt in Ihrem Tutorial-Projekt, und doppelklicken Sie auf das Datenobjekt. Das Datenobjekt wird im Editor geffnet. 2. Klicken Sie auf Fenster > Ansicht zeigen > Daten-Viewer. Die Ansicht Daten-Viewer wird geffnet. 3. Klicken Sie in der Ansicht Daten-Viewer auf Ausfhren. Der Daten-Viewer wird ausgefhrt, und die Daten werden angezeigt. 4. Vergewissern Sie sich, dass in den Spalten FirstName und LastName korrekt geparste Daten angezeigt werden.

Parsen von Daten - Zusammenfassung


Sie haben in dieser Lektion gelernt, dass das Parsen von Daten die Datenelemente in einem Eingabefeld kennzeichnet und jedes Element in eine neue Spalte schreibt. Sie haben gelernt, dass Sie Daten mithilfe der Parser-Umwandlung parsen. Auerdem haben Sie gelernt, dass Sie ein Profil fr eine Umwandlung in einem Mapping erstellen knnen, um die Ausgabe dieser Umwandlung zu analysieren. Schlielich haben Sie gelernt, dass Sie die Mapping-Ausgabe mit dem DatenViewer anzeigen knnen. Sie haben das Datenobjekt LA_Customers_tgt erstellt und so konfiguriert, dass es die geparste Ausgabe enthlt. Sie haben ein Mapping erstellt, um die Daten zu parsen. In diesem Mapping haben Sie eine ParserUmwandlung mit einem Tokensatz zum Parsen von Vornamen und Nachnamen aus der Spalte FullName der Kundendatei von Los Angeles konfiguriert. Sie haben das Mapping so konfiguriert, dass die geparsten Daten in die Spalten Firstname und Lastname im Datenobjekt LA_Customers_tgt geschrieben werden. Sie haben auerdem ein Profil ausgefhrt, um die Ausgabe der Umwandlung vor dem Ausfhren des Mappings anzuzeigen. Schlielich haben Sie das Mapping ausgefhrt, um mit dem Daten-Viewer die neuen Datenspalten im Datenobjekt LA_Customers_tgt anzuzeigen.

54

Kapitel 13: Lektion 4. Parsen von Daten

KAPITEL 14

Lektion 5. Standardisieren von Daten


Dieses Kapitel umfasst die folgenden Themen:
Standardisieren von Daten - bersicht, 55 Aufgabe 1. Erstellen eines Target-Datenobjekts, 56 Aufgabe 2 Erstellen eines Mappings zum Standardisieren von Daten, 57 Aufgabe 3. Ausfhren des Mappings, 59 Aufgabe 4. Anzeigen der Mapping-Ausgabe, 60 Standardisieren von Daten - Zusammenfassung, 60

Standardisieren von Daten - bersicht


Das Standardisieren von Daten dient der Qualittsverbesserung durch Entfernen von Fehlern und Inkonsistenzen in den Daten. Zur Qualittsverbesserung sind Daten zu standardisieren, die folgende Wertetypen enthalten:.
Falsche Werte Werte mit korrekten Informationen im falschen Format Werte, von denen Sie neue Informationen ableiten mchten

Mit der Standardisierer-Umwandlung knnen Sie diese Daten in Werten suchen. Sie knnen einen der folgenden Suchoperationstypen verwenden:
Text. Suchen nach von Ihnen eingegebenen benutzerspezifischen Strings. Entfernen Sie diese Strings,

oder ersetzen Sie sie durch benutzerdefinierten Text.


Referenztabelle. Suchen nach in einer von Ihnen auszuwhlenden Referenztabelle enthaltenen Strings.

Entfernen Sie diese Strings, oder ersetzen Sie sie durch Referenztabelleneintrge bzw. benutzerdefinierten Text. Sie knnen die Standardisierer-Umwandlung beispielsweise auf Standardisierung der die benutzerdefinierten Strings Street und St.enthaltenden Adressdaten durch den Ersatz-String ST. konfigurieren. Die Standardisierer-Umwandlung ersetzt die Suchbegriffe durch den Begriff ST. und schreibt das Ergebnis in eine neue Datenspalte.

Story
HypoStores muss seine Kundenadressdaten so standardisieren, dass alle Adressen die Begriffe konsistent verwenden. Die Adressdaten im Datenobjekt All_Customers enthalten inkonsistent formatierte Eintrge fr normale Begriffe wie Street, Boulevard, Avenue, Drive und Park.

55

Zielsetzungen
In dieser Lektion fhren Sie folgende Aufgaben durch:
Erstellen und Konfigurieren eines Datenobjekts All_Customers_Stdz_tgt so, dass es standardisierte Daten

enthlt.
Erstellen eines Mappings zum Standardisieren der Adressbegriffe Street, Boulevard, Avenue, Drive und Park

in ein konsistentes Format.


Hinzufgen des Datenobjekts All_Customers zum Mapping zum Verbinden der Quellendaten. Hinzufgen des Datenobjekts All_Customers_Stdz_tgt zum Mapping zwecks Erstellung eines Datenobjekts. Hinzufgen einer Standardisierer-Umwandlung zum Mapping und dessen Konfiguration auf

Standardisierung der Adressbegriffe.


Ausfhren des Mappings zum Generieren standardisierter Adressdaten. Ausfhren des Daten-Viewers zur Anzeigen der Mapping-Ausgabe.

Voraussetzungen
berprfen Sie, ob folgende Voraussetzung erfllt ist, bevor Sie mit dieser Lektion beginnen:
Sie haben die Lektionen 1 und 2 in diesem Tutorial abgeschlossen.

Zeitaufwand
Planen Sie fr diese Lektion 20 Minuten ein.

Aufgabe 1. Erstellen eines Target-Datenobjekts


In dieser Aifgabe erstellen Sie ein Datenobjekt All_Customers_Stdz_tgt, in das Sie standardisierte Daten schreiben knnen. Zum Erstellen eines Target-Datenobjekts gehen Sie folgendermaen vor: 1. 2. Erstellen Sie ein Datenobjekt All_Customers_Stdz_tgt basierend auf der Datei All_Customers.csv. Konfigurieren Sie die Lesen- und Schreiben-Optionen fr das Datenobjekt einschlielich Dateispeicherorten und Dateinamen.

Schritt 1. Erstellen eines Datenobjekts All_Customers_Stdz_tgt


In diesem Schritt erstellen Sie ein Datenobjekt All_Customers_Stdz_tgt basierend auf der Datei All_Customers.csv. 1. Klicken Sie auf Datei > Neu > Datenobjekt. Das Fenster Neu wird geffnet. 2. 3. 4. 5. 6. 7. 8. 9. Whlen Sie Flatfile-Datenobjekt, und klicken Sie auf Weiter. Vergewissern Sie sich, dass Aus einem vorhandenen Flatfile erstellen ausgewhlt wurde. Klicken Sie auf Durchsuchen, und navigieren Sie zuAll_Customers.csv im Verzeichnis <InformaticaInstallationsverzeichnis>\clients\DeveloperClient\Tutorials. Klicken Sie auf ffnen. Geben Sie im Feld Name All_Customers_Stdz_tgt ein. Klicken Sie auf Weiter. Klicken Sie auf Weiter. Whlen Sie im Abschnitt Vorschauoption Spaltennamen aus der ersten Zeile importieren, und klicken Sie auf Weiter.

56

Kapitel 14: Lektion 5. Standardisieren von Daten

10.

Klicken Sie auf Fertigstellen. Im Editor erscheint das Datenobjekt All_Customers_Stdz_tgt.

Schritt 2. Konfigurieren der Lesen- und Schreiben-Optionen


In diesem Schritt konfigurieren Sie die Lesen- und Schreiben-Optionen fr das Datenobjekt All_Customers_Stdz_tgt, einschlielich der Dateispeicherorte und Dateinamen. 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. berprfen Sie, dass das Datenobjekt All_Customers_Stdz_tgt im Editor geffnet ist. Whlen Sie im Editor die Ansicht Lesen. Klicken Sie auf Fenster > Ansicht zeigen > Eigenschaften. Whlen Sie in der Ansicht Eigenschaften die Ansicht Laufzeit. Doppelklicken Sie in der Spalte Wertauf den Quelldateinamen und -typ All_Customers_Stdz_tgt.csv. In der Spalte Wert doppelklicken Sie auf den Eintrag Quelldateiverzeichnis. Klicken Sie mit der rechten Maustaste auf den hervorgehobenen Namen, und whlen Sie Kopieren aus. Whlen Sie im Editor die Ansicht Schreiben. Whlen Sie in der Ansicht Eigenschaften die Ansicht Laufzeit aus. Doppelklicken Sie in der Spalte Wert auf den Eintrag Ausgabedateiverzeichnis. Klicken Sie mit der rechten Maustaste, und whlen Sie Einfgen, um den Verzeichnisspeicherort einzufgen, den Sie aus der Ansicht Lesen kopiert haben. Doppelklicken Sie in der Spalte Wert auf den Eintrag Kopfzeilenoptionen, und whlen Sie Ausgabefeldnamen. In der Spalte Wert doppelklicken Sie auf den Eintrag Ausgabedateiname und den Typ All_Customers_Stdz_tgt.csv. Klicken Sie zum Speichern des Datenobjekts auf Datei > Speichern.

Aufgabe 2 Erstellen eines Mappings zum Standardisieren von Daten


In dieser Aufgabe erstellen Sie ein Mapping und konfigurieren das Mapping auf die Verwendung von Datenobjekten und einer Standardisierer-Umwandlung. Um ein Mapping zum Standardisieren von Daten zu erstellen, gehen Sie folgendermaen vor: 1. 2. 3. 4. Erstellen Sie ein Mapping. Fgen Sie dem Mapping Quell- und Target-Objekte hinzu. Fgen Sie eine Standardisierer-Umwandlung zum Mapping hinzu. Konfigurieren Sie die Standardisierer-Umwandlung auf die Standardisierung normaler Adressbegriffe in konsistente Formate.

Schritt 1. Erstellen eines Mappings


In diesem Schritt erstellen Sie das Mapping und geben ihm einen Namen. 1. 2. Whlen Sie das Schulungsprojekt in der Ansicht Objekt-Explorer aus. Klicken Sie auf Datei > Neu > Mapping. Das Fenster Neues Mapping wird aufgerufen. 3. Geben Sie im Feld Name StandardizerMapping ein.

Aufgabe 2 Erstellen eines Mappings zum Standardisieren von Daten

57

4.

Klicken Sie auf Fertigstellen. Das Mapping wird im Editor geffnet.

Schritt 2. Hinzufgen von Datenobjekten zum Mapping


In diesem Schritt frgen Sie das Datenobjekt All_Customers und das Datenobjekt All_Customers_Stdz_tgt zum Mapping hinzu. 1. 2. Gehen Sie in der Ansicht Objekt-Explorer zu den Datenobjekten in Ihrem Schulungsprojekt. Whlen Sie das Datenobjekt All_Customers aus, und ziehen Sie es in den Editor. Das Fenster Physisches Datenobjekt zum Mapping hinzufgen wird geffnet. 3. Vergewissern Sie sich, dass Lesen ausgewhlt wurde, und klicken Sie auf OK. Das Datenobjekt erscheint im Editor. 4. 5. Gehen Sie in der Ansicht Objekt-Explorer zu den Datenobjekten in Ihrem Schulungsprojekt. Whlen Sie das Datenobjekt All_Customers_Stdz_tgt aus, und ziehen Sie es in den Editor. Das Fenster Physisches Datenobjekt zum Mapping hinzufgen wird geffnet. 6. Whlen Sie Schreiben aus, und klicken Sie auf OK. Das Datenobjekt erscheint im Editor. 7. Whlen Sie alle Ports im Datenobjekt All_Customers. Ziehen Sie die Ports zum Port CustomerID im Datenobjekt All_Customers_Stdz_tgt. Tipp: Halten Sie die Hochstelltaste gedrckt, um mehrere Spalten auszuwhlen. Mglicherweise mssen Sie in der Portliste herunterscrollen, um alle auszuwhlen. Die Ports des Datenobjekts All_Customers stellen die Verbindung zu den entsprechenden Ports im Datenobjekt All_Customers_Stdz_tgt her.

Schritt 3. Hinzufgen einer Standardisierer-Umwandlung zum Mapping


In diesem Schritt fgen Sie eine Standardisierer-Umwandlung zum Standardisieren von Strings in den Adressdaten hinzu. 1. 2. 3. Whlen Sie den Editor aus, der das Mapping StandardizerMapping enthlt. In der Umwandlungspalette whlen Sie die Standardisierer-Umwandlung aus. Klicken Sie auf den Editor. Eine Standardisierer-Umwandlung mit dem Namen NewStandardizer erscheint im Mapping. 4. 5. Um die Standardisierer-Umwandlung umzubenennen, doppelklicken Sie auf die Titelleiste der Umwandlung und den Typ AddressStandardizer. Whlen Sie den Port Address1 im Datenobjekt All_Customers aus, und ziehen Sie den Port zur Gruppe Eingabe der Standardisierer-Umwandlung. Ein Port mit dem Namen Address1 erscheint in der Eingabegruppe. Der Port stellt die Verbindung zum Port Address1 im Datenobjekt All_Customers her. Hinweis: Sie fgen einen Ausgabeport zur Umwandlung hinzu, wenn Sie eine Standardisierungsstrategie konfigurieren.

58

Kapitel 14: Lektion 5. Standardisieren von Daten

Schritt 4. Konfigurieren der Standardisierer-Umwandlung


In diesem Schritt konfigurieren Sie die Standardisierer-Umwandlung zum Standardisieren von Adressbegriffen in den Quellendaten. Hinweis: In dieser Aufgabe definieren Sie fnf Standardisierungs-Operationen. Jede Operation ersetzt einen String in der Eingabespalte durch einen neuen String. 1. 2. 3. 4. 5. 6. Whlen Sie den Editor, der das Mapping StandardizerMapping enthlt. Klicken Sie auf die Standardisierer-Umwandlung. Klicken Sie auf Fenster > Ansicht zeigen > Eigenschaften. Whlen Sie in der Ansicht Eigenschaften Strategien. Klicken Sie auf Neu. Der Assistent fr die neue Strategie wird aufgerufen. Klicken Sie auf den Auswahlpfeil in der Eingabespalte, und whlen Sie den Eingabeport Address1. Im Ausgabefeld steht als Ausgabeport Address1. 7. 8. 9. 10. 11. Whlen Sie die Leerzeichen- und Komma-Delimiter [\s] und [,]. Whlen Sie optional die Optionen zum Entfernen nachgelagerter Leerzeichen. Klicken Sie auf Weiter. Whlen Sie die Operation Kundenspezifische Strings ersetzen , und klicken Sie auf Weiter. Klicken Sie unter Eigenschaften auf Neu. Bearbeiten Sie die Felder Benutzerdef. Strings und Ersetzen durch, sodass sie das erste String-Paar aus der folgenden Tabelle enthalten:
Benutzerdef. Strings STREET (STRASSE) BOULEVARD AVENUE DRIVE PARK Ersetzen durch ST. (ST.) BLVD. AVE. Dr. PK.

12. 13. 14.

Wiederholen Sie die Schritte 9 bis 12, um Standardisierungs-Operationen fr alle Strings in der Tabelle zu definieren. Ziehen Sie den Ausgabeport Address1 in den Port Address1 des Datenobjekts All_Customers_Stdz_tgt. Um das Mapping zu speichern, klicken Sie auf Datei > Speichern.

Aufgabe 3. Ausfhren des Mappings


Im Rahmen dieser Aufgabe fhren Sie das Mapping aus, um standardisierte Adressen in das Ausgabedatenobjekt zu schreiben. 1. 2. Whlen Sie den Editor, der das Mapping StandardizerMapping enthlt. Klicken Sie auf Ausfhren > Mapping ausfhren. Das Mapping wird ausgefhrt und schreibt die Ausgabe in die Datei All_Customers_Stdz_tgt.csv.

Aufgabe 3. Ausfhren des Mappings

59

Aufgabe 4. Anzeigen der Mapping-Ausgabe


In dieser Aufgabe fhren Sie den Daten-Viewer zum Anzeigen der Mapping Ausgabe aus und berprfen, dass die Mapping-Ausgabedaten korrekt standardisiert wurden. 1. Gehen Sie in der Ansicht Objekt-Explorerzum Datenobjekt All_Customers_Stdz_tgt in Ihrem TutorialProjekt, und doppelklicken Sie auf das Datenobjekt. Das Datenobjekt wird im Editor geffnet. 2. Klicken Sie auf Fenster > Ansicht zeigen > Daten-Viewer. Die Ansicht Daten-Viewer wird geffnet. 3. Klicken Sie in der Ansicht Daten-Viewer auf Ausfhren. Der Daten-Viewer zeigt die Mapping-Ausgabe an. 4. Vergewissern Sie sich, dass in der Spalte Address1 korrekt standardisierte Daten angezeigt werden. Beispielsweise sollten alle Instanzen des Strings STREET durch den String ST.ersetzt werden.

Standardisieren von Daten - Zusammenfassung


In dieser Lektion haben Sie gelernt, dass Sie Daten standardisieren knnen, um Fehler und Inkonsistenzen in den Daten zu entfernen. Sie haben gelernt, dass Sie mit einer Standardisierer-Umwandlung Strings in einer Eingabespalte standardisieren knnen. Auerdem haben Sie erfahren, wie man Mapping-Ausgaben mit dem Daten-Viewer anzeigt. Sie haben das Datenobjekt All_Customers_Stdz_tgt erstellt und so konfiguriert, dass es standardisierte Ausgaben enthlt. Sie haben ein Mapping zum Standardisieren der Daten erstellt. In diesem Mapping haben Sie eine Standardisierer-Umwandlung zum Standardisieren der Spalte Address1 im Datenobjekt All_Customers konfiguriert. Sie haben das Mapping so konfiguriert, dass die standardisierte Ausgabe in das Datenobjekt All_Customers_Stdz_tgt geschrieben wird. Schlielich haben Sie das Mapping ausgefhrt und die standardisierten Daten im Datenobjekt All_Customers_Stdz_tgt mit dem Daten-Viewer angezeigt.

60

Kapitel 14: Lektion 5. Standardisieren von Daten

KAPITEL 15

Lektion 6. Validieren von Adressdaten


Dieses Kapitel umfasst die folgenden Themen:
Validieren von Adressdaten - bersicht, 61 Aufgabe 1 Erstellen eines Target-Datenobjekts , 62 Aufgabe 2 Erstellen eines Mappings zum Validieren von Adressen, 64 Aufgabe 3. Konfigurieren der Adressvalidierer-Umwandlung, 65 Aufgabe 4. Ausfhren des Mappings, 68 Aufgabe 5. Anzeigen der Mapping-Ausgabe, 68 Validieren von Adressdaten - Zusammenfassung, 69

Validieren von Adressdaten - bersicht


Unter Adressvalidierung versteht man die Evaluierung und Verbesserung der Qualitt von Postadressen. Dabei wird die Adressqualitt durch Vergleichen der Eingabeadressen mit einem Referenzdatensatz gltiger Adressen evaluiert. Die Adressqualitt wird verbessert, indem falsche Adresswerte erkannt und anhand des Referenzdatensatzes Felder mit richtigen Werten erstellt werden. Eine Adresse ist gltig, wenn sie zustellfhig ist. Eine Adresse kann gut formatiert sein und Strae, Ort und Postleitzahl enthalten, aber wenn die Daten keine zustellungsfhige Adresse ergeben, ist die Adresse nicht gltig. Das Developer Tool prft die Zustellungsfhigkeit der Eingabeadressen anhand von Adress-ReferenzDatenstzen. Informatica stellt Adressreferenz-Datenstze zur Verfgung. Ein Adressreferenz-Datensatz enthlt Daten, die alle zustellungsfhigen Adressen eines Landes enthalten. Der Adressvalidierungsprozess sucht den Referenz-Datensatz fr die Adresse, die den Eingabeadressdaten am genauesten entspricht. Findet der Prozess eine annhernde bereinstimmung im Referenzdatensatz, schreibt er neue Werte fr etwaige falsche oder unvollstndige Daten. Bei diesem Prozess wird ein Satz alphanumerischer Codes erstellt, die den Typ der gefundenen bereinstimmung von Eingabeadresse und Referenzadresse beschreiben. Dabei kann die Adresse neu strukturiert werden. Auerdem knnen Informationen hinzugefgt werden, die in der Eingabeadresse fehlen, wie ein vierstelliges Postleitzahlensuffix fr eine Adresse in den Vereinigten Staaten. Mit der Adressvalidierer-Umwandlung knnen Sie Adressvalidierungsprozesse im Developer Tool aufbauen. Diese Multi-Gruppen-Umwandlung enthlt einen Satz vordefinierter Eingabeports und Ausgabeports, die allen mglichen Feldern in einer Eingabeadresse entsprechen. Beim Konfigurieren einer AdressvalidiererUmwandlung stellen Sie den Standard-Referenz-Datensatz ein und erstellen anhand der Umwandlungsports eine Eingabe- und Ausgabeadressvorlage. In dieser Lektion konfigurieren Sie die Umwandlung fr die Validierung der US-Adressdaten.

61

Story
HypoStores erfordert richtige und vollstndige Daten, damit gewhrleistet ist, dass seine Direktwerbungskampagnen und andere Verbraucher-Postsendungen seine Kunden erreichen. Richtige und vollstndige Adressdaten helfen, die Postversandkosten der Organisation zu senken. Auerdem mssen die Daten der HypoStores-Kunden Adressen in druckbarem Format enthalten, das flexibel genug ist, um Adressen unterschiedlicher Lnge bearbeiten zu knnen. Um diesen geschftlichen Anforderungen gerecht zu werden, erstellt das HypoStores ICC-Team ein Adressvalidierungs-Mapping im Developer Tool.

Zielsetzungen
In dieser Lektion fhren Sie folgende Aufgaben durch:
Erstellen eines Target-Datenobjekts, das die validierten Adressfelder und Match-Codes enthlt. Erstellen eines Mappings mit einem Quelldatenobjekt, einem Target-Datenobjekt und einer

Adressvalidierer-Umwandlung.
Konfigurieren der Adressvalidierer-Umwandlung fr die Validierung der Adressdaten Ihrer Kunden. Ausfhren des Mappings zum Validieren der Adressdaten und berprfen der Match-Code-Ausgaben zur

Kontrolle der Gltigkeit der Adressdaten.

Voraussetzungen
berprfen Sie, ob die folgenden Voraussetzungen erfllt sind, bevor Sie mit dieser Lektion beginnen:
Sie haben die Lektionen 1 und 2 in diesem Tutorial abgeschlossen. Die US-Adressreferenzdaten wurden in der Domne installiert und mit dem Administrator Tool registriert.

Zwecks berprfung, ob auf Ihrem System US-Adressdaten installiert sind, setzen Sie sich bitte mit Ihrem Informatica-Administrator in Verbindung. Die Referenzdaten werden mit dem Datenqualittsinhalt-Installer installiert.

Zeitaufwand
Bitte veranschlagen Sie fr diese Lektion 25 Minuten.

Aufgabe 1 Erstellen eines Target-Datenobjekts


In dieser Aufgabe erstellen Sie ein Target-Datenobjekt, konfigurieren die Schreiben-Optionen und fgen Ports hinzu. Um das Target-Datenobjekt zu erstellen und zu konfigurieren, fhren Sie die folgenden Schritte aus: 1. 2. 3. Erstellen eine Datenobjekts All_Customers_av_tgt basierend auf der Datei All_Customers.csv. Konfigurieren der Lesen- und Schreiben-Optionen fr das Datenobjekt einschlielich der DateiSpeicherorte und Dateinamen. Hinzufgen von Ports zum Datenobjekt, um die von der Adress-Validierer-Umwandlung generierten Match-Code-Werte zu erhalten.

Schritt 1. Erstellen des Datenobjekts All_Customers_av_tgt


In diesem Schritt erstellen Sie ein Datenobjekt All_Customers_av_tgt basierend auf der Datei All_Customers.csv. 1. Klicken Sie auf Datei > Neu > Datenobjekt. Das Fenster Neu wird aufgerufen. 2. Whlen Sie Flatfile-Datenobjekt, und klicken Sie auf Weiter.

62

Kapitel 15: Lektion 6. Validieren von Adressdaten

3.

Vergewissern Sie sich, dass Aus einem vorhandenen Flatfile erstellen ausgewhlt wurde. Klicken Sie auf Durchsuchen neben dieser Auswahl, suchen Sie die Datei All_Customers.csv, und klicken Sie auf ffnen. Geben Sie im Feld Name All_Customers_av_tgtein. Klicken Sie auf Weiter. Klicken Sie auf Weiter. Whlen Sie im Abschnitt Vorschauoptionen Spaltennamen aus erster Zeile importieren, und klicken Sie auf Weiter. Klicken Sie auf Fertigstellen. Im Editor erscheint das Datenobjekt All_Customers_av_tgt.

4. 5. 6. 7. 8.

Schritt 2. Konfigurieren der Lesen- und Schreiben-Optionen


In diesem Schritt konfigurieren Sie die Lesen- und Schreiben-Optionen fr das Datenobjekt All_Customers_av_tgt, einschlielich Target-Dateiname und Speicherort. 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. berprfen Sie, dass das Datenobjekt All_Customers_av_tgt im Editor geffnet ist. Whlen Sie im Editor die Ansicht Lesen. Whlen Sie Fenster > Ansicht zeigen > Eigenschaften. Whlen Sie in der Ansicht Eigenschaften die Ansicht Laufzeit aus. Doppelklicken Sie in der Spalte Wert auf den Quellendateinamen und -typ All_Customers_av_tgt.csv. In der Spalte Wert doppelklicken Sie, um den Quelldatei-Verzeichnispfad zu markieren. Klicken Sie mit der rechten Maustaste auf den markierten Pfad und Namen, und whlen Sie Kopieren. Whlen Sie im Editor die Ansicht Schreiben. Whlen Sie in der Ansicht Eigenschaften die Ansicht Laufzeit aus. Doppelklicken Sie in der Spalte Wert auf den Eintrag Ausgabedateiverzeichnis. Klicken Sie mit der rechten Maustaste auf diesen Eintrag, und whlen Sie Einfgen, um den aus der Ansicht Lesen kopierten Pfad hinzuzufgen. Doppelklicken Sie in der Spalte Wert auf den Eintrag Kopfzeilenoptionen, und whlen Sie Ausgabefeldnamen. In der Spalte Wert doppelklicken Sie auf den Eintrag Ausgabedateiname, und geben Sie All_Customers_av_tgt.csv ein. Zum Speichern der Datenobjekte whlen Sie Datei > Speichern aus.

Schritt 3. Hinzufgen von Ports zum Datenobjekt


In diesem Schritt fgen Sie zwei Ports zum Datenobjekt All_Customers_av_tgt hinzu, damit die Adressvalidierer-Umwandlung Match-Codewerte in die Target-Datei schreiben kann. Geben Sie den Ports die NamenMailabilityScore und MatchCode. Der Wert MailabilityScore beschreibt die Zustellbarkeit der Eingabeadresse. Der Wert MatchCode beschreibt den Match-Typ, den die Umwandlung zwischen Eingabeadresse und Referenzdatenadresse ergibt. 1. 2. Gehen Sie in der Ansicht Objekt-Explorer zu den Datenobjekten in Ihrem Tutorial-Projekt. Doppelklicken Sie auf das Datenobjekt All_Customers_av_tgt. Das Datenobjekt All_Customers_av_tgt wird im Editor geffnet. 3. 4. 5. Vergewissern Sie sich, dass bersicht ausgewhlt ist. Whlen Sie den endgltigen Port in der Portliste aus. Dieser Port trgt den Namen MiscDate. Klicken Sie auf Neu. Ein Port mit dem Namen MiscDate1 wird angezeigt.

Aufgabe 1 Erstellen eines Target-Datenobjekts

63

6. 7. 8.

Benennen Sie den Port MiscDate1 in MailabilityScore um. Whlen Sie den Port MailabilityScore. Klicken Sie auf Neu. Ein Port mit dem Namen MailabilityScore1 wird angezeigt.

9. 10.

ndern Sie den Namen des Ports MailabilityScore1 in MatchCode. Klicken Sie zum Speichern des Datenobjekts auf Datei > Speichern.

Aufgabe 2 Erstellen eines Mappings zum Validieren von Adressen


In dieser Aufgabe erstellen Sie ein Mapping und fgen Datenobjekte und eine Adressvalidierer-Umwandlung hinzu. Zum Erstellen des Mappings und Hinzufgen der bentigten Objekte gehen Sie folgendermaen vor: 1. 2. 3. Erstellen Sie ein Mapping-Objekt. Fgen Sie Quellen- und Target-Datenobjekte zum Mapping hinzu. Fgen Sie eine Adressvalidierer-Umwandlung zum Mapping hinzu.

Schritt 1. Erstellen eines Mappings


In diesem Schritt erstellen Sie das Mapping und geben ihm einen Namen. 1. 2. Whlen Sie in der Ansicht Objekt-Explorer das Tutorial-Projekt aus. Whlen Sie Datei > Neu > Mapping. Das Fenster Neues Mapping wird geffnet. 3. 4. Geben Sie im Feld NameValidateAddresses ein. Klicken Sie auf Fertigstellen. Das Mapping wird im Editor geffnet.

Schritt 2. Hinzufgen von Datenobjekten zum Mapping


In diesem Schritt fgen Sie Quellen- und Target-Datenobjekte zum Mapping hinzu.
All_Customers ist das Quellendatenobjekt fr das Mapping. Die Adressvalidierer-Umwandlung liest Daten aus

diesem Objekt. All_Customers_av_tgt ist das Daten-Target-Objekt fr das Mapping. Dieses Objekt liest Daten aus der Adressvalidierer-Umwandlung. 1. 2. Gehen Sie in der AnsichtObjekt-Explorer zu den Datenobjekten in Ihrem Schulungsprojekt. Whlen Sie das Datenobjekt All_Customers aus, und ziehen Sie es in den Editor. Das Fenster Physisches Datenobjekt zum Mapping hinzufgen wird geffnet. 3. Vergewissern Sie sich, dass Lesen ausgewhlt ist, und klicken Sie auf OK. Das Datenobjekt erscheint im Editor. 4. 5. Gehen Sie in der Ansicht Objekt-Explorer zu den Datenobjekten in Ihrem Tutorial-Projekt. Whlen Sie das Datenobjekt All_Customers_av_tgt aus, und ziehen Sie es in den Editor. Das Fenster Physisches Datenobjekt zum Mapping hinzufgen wird geffnet. 6. Whlen Sie Schreiben aus, und klicken Sie auf OK. Das Datenobjekt erscheint im Editor. 7. Klicken Sie auf Speichern.

64

Kapitel 15: Lektion 6. Validieren von Adressdaten

Schritt 3. Hinzufgen einer Adressvalidierer-Umwandlung zum Mapping


In diesem Schritt fgen Sie eine Adressvalidierer-Umwandlung zu dem Mapping hinzu, das die Quelle und die Datenobjekte enthlt. Sobald dieser Schritt abgeschlossen ist, knnen Sie die Umwandlung konfigurieren und ihre Ports mit den Datenobjekten verbinden. 1. 2. 3. Whlen Sie den Editor, der das Mapping ValidateAddresses enthlt. Whlen Sie in der Umwandlungspalette die Adressvalidierer-Umwandlung. Klicken Sie auf den Editor. Die Adressvalidierer-Umwandlung erscheint im Editor.

Aufgabe 3. Konfigurieren der AdressvalidiererUmwandlung


In dieser Aufgabe konfigurieren Sie die Adressvalidierer-Umwandlung auf das Lesen und Validieren von Adressen aus der Datenquelle All_Customers. Hinweis: Die Adressvalidierer-Umwandlung enthlt eine Reihe vordefinierter Eingabe- und Ausgabe-Ports. Whlen Sie die bentigten Ports aus, und verbinden Sie sie mit den Objekten im Mapping. Zum Konfigurieren der Umwandlung gehen Sie bitte folgendermaen vor: 1. 2. 3. Whlen Sie den Standardadressen-Referenzdatensatz aus. Konfigurieren Sie die Umwandlungsports, und verbinden Sie die Umwandlung mit dem Mapping. Verbinden Sie unbenutzte Quellen-Ports mit dem Daten-Target.

Schritt 1. Einstellen des Standardadressen-Referenzdatensatzes


In diesem Schritt whlen Sie den Standard-Referenzdatensatz aus. Adressreferenz-Datendateien werden lnderweise angelegt. Daher mssen Sie als Standard-Datensatz einen Landesnamen auswhlen. Wenn die Adress-Validierer-Umwandlung das zu verwendende Land nicht aus den Eingabedatenwerten bestimmen kann, verwendet sie die Referenzdaten fr dieses Land. 1. 2. 3. Whlen Sie die Adressvalidierer-Umwandlung im Editor aus. Klicken Sie unter Eigenschaften auf Allgemeine Einstellungen. Whlen Sie im Men Standardland den Eintrag Vereinigte Staaten aus.

Schritt 2. Konfigurieren der Eingabeports der AdressvalidiererUmwandlung


In diesem Schritt whlen Sie die Umwandlungs-Eingabeports aus und verbinden diese Ports mit dem Datenobjekt All_Customers_av. Die Adressvalidierer-Umwandlung enthlt mehrere Gruppen vordefinierter Eingabe-Ports. Whlen Sie Eingabeports aus, die den Feldern in Ihrer Eingabeadresse entsprechen, und fgen Sie diese Ports zur Umwandlung hinzu. Halten Sie die Strg-Taste gedrckt, wenn Sie in den folgenden Schritten zum Auswhlen mehrerer Ports in einem Arbeitsgang Ports auswhlen. 1. 2. Whlen Sie die Adressvalidierer-Umwandlung im Editor aus. Klicken Sie unter Eigenschaftenauf Vorlagen.

Aufgabe 3. Konfigurieren der Adressvalidierer-Umwandlung

65

3. 4.

Erweitern Sie die Portgruppe Basismodell. Erweitern Sie die Eingabeportgruppe Hybrid, und whlen Sie folgende Ports aus:
Port-Name Lieferadresszeile 1 Vollstndiger Name der Region 1 Postleitzahl 1 Provinz 1 Name des Landes Beschreibung Straenadressdaten, wie Straenname und Hausnummer. Name des Ortes. Postcode bzw. PLZ. Name der Provinz oder des Bundesstaates. Name des Landes bzw. Abkrzung.

Hinweis: Halten Sie die Strg-Taste gedrckt, um mehrere Ports in einem Arbeitsgang auszuwhlen. 5. Klicken Sie auf die Symbolleiste oberhalb der Liste der Port-Namen auf Port zu Umwandlung hinzufgen. Diese Symbolleiste wird angezeigt, wenn Sie Vorlagen auswhlen. Die ausgewhlten Ports erscheinen in der Umwandlung im Mapping-Editor. 6. Verbinden Sie die Quellen-Ports folgendermaen mit den Adressvalidierer-Umwandlungsports:
Quellen-Port Addresse 1 Ort PLZ Bundesland Land Addressvalidierer-Umwandlungsport Lieferadresszeile 1 Vollstndiger Name der Region 1 Postleitzahl 1 Provinz 1 Name des Landes

Schritt 3. Konfigurieren der Ausgabe-Ports der AdressvalidiererUmwandlung


In diesem Schritt whlen Sie die Umwandlungs-Ausgabeports und verbinden diese Ports mit dem Datenobjekt All_Customers_av_tgt. Die Adressvalidierer-Umwandlung enthlt mehrere Gruppen vordefinierter Ausgabeports. Whlen Sie die Ports aus, die die bentigte Adressstruktur festlegen, und fgen Sie diese Ports der Umwandlung hinzu. Sie knnen ebenfalls Ports auswhlen, die Informationen ber den fr jede Adresse erzielten Validierungstyp enthalten. 1. 2. 3. 4. Whlen Sie die Adressvalidierer-Umwandlung im Mapping-Editor. Klicken Sie unter Eigenschaften auf Vorlagen. Erweitern Sie die Portgruppe Basismodell. Erweitern Sie die Ausgabeportgruppe Adresselemente, und whlen Sie folgenden Port aus:
Port-Name Vollstndiger Name der Strae 1 Beschreibung Straenadressdaten, wie Straenname und Hausnummer.

66

Kapitel 15: Lektion 6. Validieren von Adressdaten

5.

Erweitern Sie die Ausgabeportgruppe LastLine Elements, und whlen Sie die folgenden Ports aus:
Port-Name Vollstndiger Name der Region 1 Postleitzahl 1 Provinz Abkrzung 1 Beschreibung Name des Ortes. Postcode oder PLZ. Kennung der Provinz oder des Bundesstaates.

Hinweis: Halten Sie die Strg-Taste gedrckt, um mehrere Ports in einem Arbeitsgang auszuwhlen. 6. Erweitern Sie die Ausgabeportgruppe Land, und whlen Sie den folgenden Port aus:
Port-Name Name des Landes 1 Beschreibung Name des Landes.

7.

Erweitern Sie die Ausgabeportgruppe Status-Info, und whlen Sie folgende Ports aus:
Port-Name Zustellbarkeits-Score Match-Code Beschreibung Score, der die Chance auf eine erfolgreiche Postauslieferung bewertet. Code, der den hnlichkeitsgrad zwischen Eingabeadresse und Referenzdaten darstellt.

8.

Klicken Sie auf der Symbolleiste oberhalb der Liste der Port-Namen auf Port zu Umwandlung hinzufgen. Diese Symbolleiste wird angezeigt, wenn Sie Vorlagen auswhlen.

9.

Verbinden Sie die Addressvalidierer-Umwandlungsports folgendermaen mit den Ports All_Customers_av_tgt:


Addressvalidierer-Umwandlungsport Vollstndiger Name der Strae 1 Vollstndiger Name der Region 1 Postleitzahl 1 Provinz Abkrzung 1 Name des Landes 1 Zustellbarkeits-Score Match-Code Target-Port Address1 (Adresse 1) Ort PLZ Bundesstaat Land MailabilityScore MatchCode

Schritt 4. Verbinden unbenutzter Datenquellenports mit dem DatenTarget


In diesem Schritt verbinden Sie unbenutzte Ports der Datenquelle All_Customers mit dem Daten-Target.
u

Verbinden Sie die unbenutzten Ports der Datenquelle mit den gleichnamigen Ports des Daten-Targets.

Aufgabe 3. Konfigurieren der Adressvalidierer-Umwandlung

67

Aufgabe 4. Ausfhren des Mappings


In dieser Aufgabe fhren Sie das Mapping aus, um die Mapping-Ausgabe zu erstellen. 1. 2. Whlen Sie den Editor aus, der das Mapping ValidateAddresses enthlt. Whlen Sie Ausfhren > Mapping ausfhren. Das Mapping wird ausgefhrt und die Ausgabe in die Datei All_Customers_av_tgt.csv geschrieben.

Aufgabe 5. Anzeigen der Mapping-Ausgabe


In dieser Aufgabe fhren Sie den Daten-Viewer aus, um die Mapping-Ausgabe anzuzeigen. berprfen Sie die Qualitt Ihrer validierten Adressen, indem Sie die in die Spalten "Zustellbarkeits-Score" und "Match-Code" geschriebenen Werte im Target-Datenobjekt untersuchen. Der MatchCode-Wert ist ein alphanumerischer Code, der den Typ der Validierung darstellt, dem das Mapping die Adresse unterzogen hat. Der Wert "Zustellbarkeits-Score" ist in einstelliger Wert, der die Zustellbarkeit der Adresse zusammenfasst. 1. Suchen Sie in der Object-Explorer-Ansicht das Datenobjekt All_Customers_av_tgt in Ihrem TutorialProjekt, und doppelklicken Sie auf das Datenobjekt. Das Datenobjekt wird im Editor geffnet. 2. Whlen Sie Fenster > Ansicht zeigen > Daten-Viewer. Der Daten-Viewer wird geffnet. 3. Klicken Sie im Daten-Viewer auf Ausfhren. Der Daten-Viewer zeigt die Mapping-Ausgabe an. 4. 5. Fhren Sie einen Bildlauf ber die Mapping-Ergebnisse aus, sodass die Spalten "Zustellbarkeits-Score" und "Match-Code" angezeigt werden. berprfen Sie die Werte in der Spalte "Zustellbarkeits-Score". Die mglichen Scores sind 0 bis 5. Bei Adressen mit hheren Scores ist die erfolgreiche Zustellung wahrscheinlicher. 6. berprfen Sie die Werte in der Spalte "Match-Code". Der Match-Code ist ein alphanumerischer Code. Das alphanumerische Zeichen gibt den von der Umwandlung durchgefhrten Validierungstyp an, und die Ziffer bezeichnet die Qualitt der Endadresse. Die folgende Tabelle beschreibt die blichen Match-Code-Werte:
Match-Code V4 Beschreibung Als zustellfhig durch die Adressvalidierung besttigt. Die Eingabedaten sind korrekt, und die Eingaben stimmen genau mit den Referenzdaten berein. Als zustellfhig durch die Adressvalidierung besttigt. Die Eingabedaten sind korrekt, aber es wurde eine Nichtbereinstimmung mit den Referenzdaten gefunden. Dies ist mglicherweise auf die unzureichende Standardisierung der Adresselemente zurckzufhren. Als zustellfhig durch die Adressvalidierung besttigt. Die Eingabedaten sind korrekt, aber es wurde eine Nichtbereinstimmung mit den Referenzdaten gefunden. Unter Umstnden fehlen einige Referenzdatendateien. Als zustellfhig durch die Adressvalidierung besttigt. Die Eingabedaten sind korrekt, wegen unzureichender Standardisierung ist die Zustellbarkeit jedoch beeintrchtigt.

V3

V2

V1

68

Kapitel 15: Lektion 6. Validieren von Adressdaten

Match-Code C4

Beschreibung Durch die Adressvalidierung korrigiert. Alle Elemente wurde bearbeitet und korrigiert, sofern erforderlich. Durch die Adressvalidierung korrigiert. Alle Elemente wurden bearbeitet, einige Elemente konnten jedoch nicht geprft werden. Durch die Adressvalidierung teilweise korrigiert. Unter Umstnden fehlen einige Referenzdatendateien. Wurde von der Adressvalidierung korrigiert, wegen unzureichender Standardisierung ist die Zustellbarkeit jedoch beeintrchtigt. Die Eingabedaten konnten nicht berichtigt werden, aber die Adresse ist hchstwahrscheinlich zustellfhig, da sie mit einer einmaligen Referenzadresse bereinstimmt. Es konnten keine Eingabedaten korrigiert werden, aber die Adresse ist hchstwahrscheinlich zustellfhig, da sie mit mehreren Referenzadressen bereinstimmt. Die Eingabedaten konnten nicht berichtigt werden, und die Zustellfhigkeit ist unwahrscheinlich. Die Eingabedaten konnten nicht berichtigt werden, und die Zustellfhigkeit ist sehr unwahrscheinlich. Es wurde keine Validierung durchgefhrt. Dies ist mglicherweise auf das Nichtvorhandensein aktueller oder lizenzierter Referenzdaten zurckzufhren. Die Adresse kann zustellfhig sein oder auch nicht.

C3

C2

C1

I4

I3

I2 I1

N1... N6

Validieren von Adressdaten - Zusammenfassung


In dieser Lektion haben Sie gelernt, dass bei der Adressvalidierung Eingabeadressdaten mit Referenzdaten verglichen werden und die genauest mgliche Adressversion zurckgegeben wird. Sie haben gelernt, dass bei der Adressvalidierung auerdem Statusinformationen ber die Qualitt jeder Adresse zurckgegeben werden. Weiterhin haben Sie erfahren, dass man als Benutzer des Administrator Tools den Data Quality Content Installer ausfhrt, um Adressreferenzdaten zu installieren. Sie haben ebenfalls gelernt, dass die Adressvalidatorumwandlung eine Multi-Gruppen-Umwandlung ist, und dass Sie die Eingabe- und Ausgabeports fr die Umwandlung aus den Portgruppen auswhlen. Die ausgewhlten Eingabeports legen den Inhalt der Adresse fest, die validiert wird. Die Ausgabeports legen den Inhalt des abschlieenden Adressdatensatzes fest.

Validieren von Adressdaten - Zusammenfassung

69

ANHANG A

Hufig gestellte Fragen (FAQ)


Dieser Anhang umfasst die folgenden Themen:
FAQs zu Informatica Analyst , 70 Informatica Developer - Hufig gestellte Fragen (FAQ), 70

FAQs zu Informatica Analyst


In den FAQs werden viele Fragen beantwortet, die Sie mglicherweise zu Informatica Analyst haben. Welche Kombination von Produktfunktionen ist im Analysetool enthalten? Das Analysetool enthlt einige Funktionen, die in folgende Produkte integriert sind:
Informatica Data Quality Informatica Data Explorer Data Quality Assistant PowerCenter Reference Table Manager

Kann ich ein einziges Benutzerkonto zum Zugriff auf das Administratortool, das Entwicklertool und das Analysetool verwenden? Ja Sie knnen einem Benutzer die Berechtigung zum Zugriff auf alle drei Tools geben. Es mssen keine separaten Benutzerkonten fr jede Client-Anwendung erstellt werden. Was ist mit dem Reference Table Manager passiert? Wo sind meine Referenzdaten gespeichert? Die Funktionen aus dem Reference Table Manager sind in das Analysetool integriert worden. Sie knnen das Analysetool zum Erstellen und gemeinsamen Nutzen von Referenzdaten verwenden. Die Referenzdaten sind in der Staging-Datenbank gespeichert, die Sie konfigurieren, wenn Sie einen Analyst Service erstellen.

Informatica Developer - Hufig gestellte Fragen (FAQ)


Lesen Sie sich die hufig gestellten Fragen (FAQ) durch. Sie finden dort Antworten auf Fragen, die Sie mglicherweise zu Informatica Developer haben. Was ist der Unterschied zwischen einer Quelle und einem Ziel in PowerCenter und einem physischen Datenobjekt im Developer Tool? In PowerCenter erstellen Sie eine Quelldefinition, die eine Mapping-Quelle einschliet. Sie erstellen eine Zieldefinition, die ein Mapping-Ziel einschliet. Bei einem Neustart wird eventuell wieder eine neue Adresse vom Server zugewiesen.'Sie als Mapping-Quelle oder -Ziel verwenden knnen.

70

Was ist der Unterschied zwischen einem Mapping im Developer Tool und einem Mapping in PowerCenter? Ein PowerCenter Mapping gibt an, wie Daten zwischen Quellen und Targets verschoben werden. Ein Developer Tool Mapping gibt an, wie Daten zwischen der Mapping-Eingabe und -Ausgabe verschoben werden. Ein PowerCenter Mapping muss eine oder mehrere Quelldefinitionen, Quellen-Qualifikatoren und Zieldefinitionen aufweisen. Eiin PowerCenter Mapping kann auch Verknpfungen, Umwandlungen und Mapplets enthalten. Ein Developer Tool Mapping muss Mapping-Eingabe und -Ausgabe enthalten. Ein Developer Tool Mapping kann auch Umformungen und Mapplets enthalten. Das Developer Tool beinhaltet folgende Mapping-Typen:
Mapping, das Daten zwischen Quellen und Zielen verschiebt. Dieser Mapping-Typ unterscheidet sich

von einem PowerCenter Mapping nur darin, dass es keine Verknpfungen verwenden kann und keinen Quellen-Qualifikator verwendet.
Zuordnung logisches Datenobjekt. Ein Mapping in einem logischen Datenobjektmodell. Eine

Zuordnung logisches Datenobjekt kann ein logisches Datenobjekt als Mapping-Eingabe und ein Datenobjekt als Mapping-Ausgabe enthalten. Sie kann auch ein oder mehrere logische Datenobjekte als Mapping-Eingabe und logische Datenobjekte als Mapping-Ausgabe enthalten.
Virtuelle Tabellenzuordnung. Ein Mapping in einem SQL-Datendienst. Die Zuordnung enthlt ein

Datenobjekt als Mapping-Eingabe und eine virtuelle Tabelle als Mapping-Ausgabe.


Virtuelles gespeichertes Prozedur-Mapping. Definiert einen Unternehmenslogiksatz in einem SQL-

Datendienst. Es enthlt eine Eingabeparameterumwandlung oder ein physisches Datenobjekt als Mapping-Eingabe und eine Ausgabeparameterumwandlung oder physisches Datenobjekt als MappingAusgabe. Was ist der Unterschied zwischen einem Mapplet in PowerCenter und einem Mapplet im Developer Tool? Ein Mapplet in PowerCenter und im Developer Tool ist ein wiederverwendbares Objekt, das einen Satz von Umwandlungen enthlt. Sie knnen die Umwandlungslogik in mehreren Mappings nutzen. Ein Powercenter-Mapplet kann Quellendefinitionen oder Eingabeumwandlungen als Mapplet-Eingabe enthalten. Es muss Ausgabeumwandlungen als Mapplet-Ausgabe enthalten. Ein Developer Tool Mapplet kann Datenobjekte oder Eingabeumwandlungen als Mapplet-Eingabe enthalten. Es kann Datenobjekte oder Ausgabeumwandlungen als Mapplet-Ausgabe enthalten. Ein Mapping im Developer Tool kann auch die folgenden Merkmale aufweisen:
Sie knnen ein Mapplet als eine Regel validieren. Sie knnen eine Regel in einem Profil verwenden. Ein Mapplet kann andere Mapplets enthalten.

Was ist der Unterschied zwischen einem Mapplet und einer Regel? Sie knnen ein Mapplet als eine Regel validieren. Eine Regel ist Geschftslogik, die Bedingungen definiert, welche auf Quelldaten angewendet werden, wenn ein Profil ausgefhrt wird. Sie knnen ein Mapplet als eine Regel validieren, wenn das Mapplet folgende Anforderungen erfllt:
Es enthlt eine Eingabe- und Ausgabeumwandlung. Das Mapplet enthlt keine aktiven Umwandlungen. Sie gibt keine Kardinalitt zwischen Eingabegruppen an.

Informatica Developer - Hufig gestellte Fragen (FAQ)

71