Beruflich Dokumente
Kultur Dokumente
Guia de Ajuste de
Desempenho
Informatica PowerCenter Guia de Ajuste de Desempenho
Este software e a respectiva documentao contm informaes de propriedade da Informatica Corporation. Eles so fornecidos sob um contrato de licena que
contm restries quanto a seu uso e divulgao, e so protegidos por leis de copyright. A engenharia reversa do software proibida. No est permitida de forma
alguma a reproduo ou a transmisso de qualquer parte deste documento (seja por meio eletrnico, fotocpia, gravao ou quaisquer outros) sem o consentimento
prvio da Informatica Corporation. Este Software pode estar protegido por patentes dos EUA e/ou internacionais e outras patentes pendentes.
O uso, duplicao ou divulgao do Software pelo Governo dos Estados Unidos esto sujeitos s restries estipuladas no contrato de licena de software aplicvel e
como estabelecido em DFARS 227.7202-1(a) e 227.7702-3(a) (1995), DFARS 252.227-7013(1)(ii) (OCT 1988), FAR 12.212(a) (1995), FAR 52.227-19 ou FAR
52.227-14 (ALT III), conforme aplicvel.
As informaes contidas neste produto ou documentao esto sujeitas a alterao sem aviso prvio. Informe-nos por escrito caso encontre quaisquer problemas
neste produto ou documentao.
Informatica, Informatica Platform, Informatica Data Services, PowerCenter, PowerCenterRT, PowerCenter Connect, PowerCenter Data Analyzer, PowerExchange,
PowerMart, Metadata Manager, Informatica Data Quality, Informatica Data Explorer, Informatica B2B Data Transformation, Informatica B2B Data Exchange Informatica
On Demand, Informatica Identity Resolution, Informatica Application Information Lifecycle Management, Informatica Complex Event Processing, Ultra Messaging and
Informatica Master Data Management so marcas comerciais ou marcas registradas da Informatica Corporation nos Estados Unidos e em jurisdisdies pelo mundo.
Todos os outros nomes de outras companhias e produtos podem ser nomes ou marcas comerciais de seus respectivos proprietrios.
Partes desta documentao e/ou software esto sujeitas a direitos autorais de terceiros, incluindo sem limitao: Copyright DataDirect Technologies. Todos os direitos
reservados. Copyright Sun Microsystems. Todos os direitos reservados. Copyright RSA Security Inc. Todos os direitos reservados. Copyright Ordinal Technology
Corp. Todos os direitos reservados. Copyright Aandacht c.v. Todos os direitos reservados. Copyright Genivia, Inc. Todos os direitos reservados. Copyright
Isomorphic Software. Todos os direitos reservados. Copyright Meta Integration Technology, Inc. Todos os direitos reservados. Copyright Intalio. Todos os direitos
reservados. Copyright Oracle. Todos os direitos reservados. Copyright Adobe Systems Incorporated. Todos os direitos reservados. Copyright DataArt, Inc.
Todos os direitos reservados. Copyright ComponentSource. Todos os direitos reservados. Copyright Microsoft Corporation. Todos os direitos reservados.
Copyright Rogue Wave Software, Inc. Todos os direitos reservados. Copyright Teradata Corporation. Todos os direitos reservados. Copyright Yahoo! Inc. Todos
os direitos reservados. Copyright Glyph & Cog, LLC. Todos os direitos reservados. Copyright Thinkmap, Inc. Todos os direitos reservados. Copyright Clearpace
Software Limited. Todos os direitos reservados. Copyright Information Builders, Inc. Todos os direitos reservados. Copyright OSS Nokalva, Inc. Todos os direitos
reservados. Copyright Edifecs, Inc. Todos os direitos reservados. Copyright Cleo Communications, Inc. Todos os direitos reservados. Copyright International
Organization for Standardization 1986. Todos os direitos reservados. Copyright ej-technologies GmbH. Todos os direitos reservados. Copyright Jaspersoft
Corporation. Todos os direitos reservados. Copyright International Business Machines Corporation. Todos os direitos reservados. Copyright yWorks GmbH.
Todos os direitos reservados. Copyright Lucent Technologies. Todos os direitos reservados. Copyright (C) University of Toronto. Todos os direitos reservados.
Copyright Daniel Veillard. Todos os direitos reservados. Copyright Unicode, Inc. Copyright IBM Corp. Todos os direitos reservados. Copyright MicroQuill
Software Publishing, Inc. Todos os direitos reservados. Copyright PassMark Software Pty Ltd. Todos os direitos reservados. Copyright LogiXML, Inc. Todos os
direitos reservados. Copyright 2003-2010 Lorenzi Davide, todos os direitos reservados. Copyright Red Hat, Inc. Todos os direitos reservados. Copyright The
Board of Trustees of the Leland Stanford Junior University. Todos os direitos reservados. Copyright EMC Corporation. Todos os direitos reservados. Copyright
Flexera Software. Todos os direitos reservados. Copyright Jinfonet Software. Todos os direitos reservados. Copyright Apple Inc. Todos os direitos reservados.
Copyright Telerik Inc. Todos os direitos reservados. Copyright BEA Systems. Todos os direitos reservados. Copyright PDFlib GmbH. Todos os direitos
reservados. Copyright Orientation in Objects GmbH. Todos os direitos reservados. Copyright Tanuki Software, Ltd. All rights reserved. Copyright Ricebridge.
Todos os direitos reservados. Copyright Sencha, Inc. All rights reserved.
Este produto inclui software desenvolvido pela Apache Software Foundation (http://www.apache.org/) e/ou outros softwares licenciados nas vrias verses da Licena
Apache (a "Licena"). Voc pode obter uma cpia dessas Licenas em http://www.apache.org/licenses/. A menos que exigido pela legislao aplicvel ou concordado
por escrito, o software distribudo em conformidade com estas Licenas fornecido "NO ESTADO EM QUE SE ENCONTRA", SEM GARANTIA OU CONDIO DE
QUALQUER TIPO, seja expressa ou implcita. Consulte as Licenas para conhecer as limitaes e as permisses que regulam o idioma especfico de acordo com as
Licenas.
Este produto inclui software desenvolvido pela Mozilla (http://www.mozilla.org/), direitos autorais de software de The JBoss Group, LLC; todos os direitos reservados;
direitos autorais de software 1999-2006 de Bruno Lowagie e Paulo Soares e outros produtos de software licenciados sob a Licena Pblica GNU Lesser General
Public License Agreement, que pode ser encontrada em http://www.gnu.org/licenses/lgpl.html. Os materiais so fornecidos gratuitamente pela Informatica, no estado
em que se encontram, sem garantia de qualquer tipo, explcita nem implcita, incluindo, mas no limitando-se, as garantias implicadas de comerciabilidade e
adequao a um determinado propsito.
O produto inclui software ACE(TM) e TAO(TM) com copyright de Douglas C. Schmidt e seu grupo de pesquisa na Washington University, University of California, Irvine
e Vanderbilt University, Copyright () 1993-2006, todos os direitos reservados.
Este produto inclui o software desenvolvido pelo OpenSSL Project para ser usado no kit de ferramentas OpenSSL (copyright The OpenSSL Project. Todos os direitos
reservados) e a redistribuio deste software est sujeita aos termos disponveis em http://www.openssl.org e http://www.openssl.org/source/license.html.
Este produto inclui o software Curl com o Copyright 1996-2013, Daniel Stenberg, <daniel@haxx.se>. Todos os direitos reservados. Permisses e limitaes relativas a
este software esto sujeitas aos termos disponveis em http://curl.haxx.se/docs/copyright.html. permitido usar, copiar, modificar e distribuir este software com
qualquer objetivo, com ou sem taxa, desde que a nota de direitos autorais acima e esta nota de permisso apaream em todas as cpias.
O produto inclui direitos autorais de software 2001-2005 () MetaStuff, Ltd. Todos os direitos reservados. Permisses e limitaes relativas a este software esto
sujeitas aos termos disponveis em http://www.dom4j.org/license.html.
O produto inclui o copyright de software 2004-2007, The Dojo Foundation. Todos os direitos reservados. Permisses e limitaes relativas a este software esto
sujeitas aos termos disponveis em http://dojotoolkit.org/license.
Este produto inclui o software ICU com o copyright International Business Machines Corporation e outros. Todos os direitos reservados. Permisses e limitaes
relativas a este software esto sujeitas aos termos disponveis em http://source.icu-project.org/repos/icu/icu/trunk/license.html.
Este produto inclui o copyright de software 1996-2006 Per Bothner. Todos os direitos reservados. O direito de usar tais materiais estabelecido na licena que pode
ser encontrada em http://www.gnu.org/software/kawa/Software-License.html.
Este produto inclui o software OSSP UUID com Copyright 2002 Ralf S. Engelschall, Copyright 2002 e OSSP Project Copyright 2002 Cable & Wireless
Deutschland. Permisses e limitaes relativas a este software esto sujeitas aos termos disponveis em http://www.opensource.org/licenses/mit-license.php.
Este produto inclui software desenvolvido pela Boost (http://www.boost.org/) ou sob a licena de software Boost. Permisses e limitaes relativas a este software
esto sujeitas aos termos disponveis em http://www.boost.org/LICENSE_1_0.txt.
Este produto inclui direitos autorais de software 1997-2007 University of Cambridge. Permisses e limitaes relativas a este software esto sujeitas aos termos
disponveis em http://www.pcre.org/license.txt.
Este produto inclui o copyright de software 2007 The Eclipse Foundation. Todos os direitos reservados. As permisses e limitaes relativas a este software esto
sujeitas aos termos disponveis em http://www.eclipse.org/org/documents/epl-v10.php e em http://www.eclipse.org/org/documents/edl-v10.php.
Este produto inclui softwares licenciados de acordo com os termos disponveis em http://www.tcl.tk/software/tcltk/license.html, http://www.bosrup.com/web/overlib/?
License, http://www.stlport.org/doc/ license.html, http:// asm.ow2.org/license.html, http://www.cryptix.org/LICENSE.TXT, http://hsqldb.org/web/hsqlLicense.html, http://
httpunit.sourceforge.net/doc/ license.html, http://jung.sourceforge.net/license.txt , http://www.gzip.org/zlib/zlib_license.html, http://www.openldap.org/software/release/
license.html, http://www.libssh2.org, http://slf4j.org/license.html, http://www.sente.ch/software/OpenSourceLicense.html, http://fusesource.com/downloads/license-
agreements/fuse-message-broker-v-5-3- license-agreement; http://antlr.org/license.html; http://aopalliance.sourceforge.net/; http://www.bouncycastle.org/licence.html;
http://www.jgraph.com/jgraphdownload.html; http://www.jcraft.com/jsch/LICENSE.txt; http://jotm.objectweb.org/bsd_license.html; . http://www.w3.org/Consortium/Legal/
2002/copyright-software-20021231; http://www.slf4j.org/license.html; http://nanoxml.sourceforge.net/orig/copyright.html; http://www.json.org/license.html; http://
forge.ow2.org/projects/javaservice/, http://www.postgresql.org/about/licence.html, http://www.sqlite.org/copyright.html, http://www.tcl.tk/software/tcltk/license.html, http://
www.jaxen.org/faq.html, http://www.jdom.org/docs/faq.html, http://www.slf4j.org/license.html; http://www.iodbc.org/dataspace/iodbc/wiki/iODBC/License; http://
www.keplerproject.org/md5/license.html; http://www.toedter.com/en/jcalendar/license.html; http://www.edankert.com/bounce/index.html; http://www.net-snmp.org/about/
license.html; http://www.openmdx.org/#FAQ; http://www.php.net/license/3_01.txt; http://srp.stanford.edu/license.txt; http://www.schneier.com/blowfish.html; http://
www.jmock.org/license.html; http://xsom.java.net; http://benalman.com/about/license/; https://github.com/CreateJS/EaselJS/blob/master/src/easeljs/display/Bitmap.js;
http://www.h2database.com/html/license.html#summary; http://jsoncpp.sourceforge.net/LICENSE; http://jdbc.postgresql.org/license.html; http://
protobuf.googlecode.com/svn/trunk/src/google/protobuf/descriptor.proto; https://github.com/rantav/hector/blob/master/LICENSE; http://web.mit.edu/Kerberos/krb5-
current/doc/mitK5license.html. e http://jibx.sourceforge.net/jibx-license.html.
Este produto inclui software licenciado de acordo com a Academic Free License (http://www.opensource.org/licenses/afl-3.0.php), a Common Development and
Distribution License (http://www.opensource.org/licenses/cddl1.php), a Common Public License (http://www.opensource.org/licenses/cpl1.0.php), a Sun Binary Code
License Agreement Supplemental License Terms, a BSD License (http://www.opensource.org/licenses/bsd-license.php), a nova BSD License (http://opensource.org/
licenses/BSD-3-Clause), a MIT License (http://www.opensource.org/licenses/mit-license.php), a Artistic License (http://www.opensource.org/licenses/artistic-
license-1.0) e a Initial Developers Public License Version 1.0 (http://www.firebirdsql.org/en/initial-developer-s-public-license-version-1-0/).
Este produto inclui copyright do software 2003-2006 Joe WaInes, 2006-2007 XStream Committers. Todos os direitos reservados. Permisses e limitaes relativas a
este software esto sujeitas aos termos disponveis em http://xstream.codehaus.org/license.html. Este produto inclui software desenvolvido pelo Indiana University
Extreme! Lab. Para obter mais informaes, visite http://www.extreme.indiana.edu/.
Este produto inclui software Copyright 2013 Frank Balluffi e Markus Moeller. Todos os direitos reservados. As permisses e limitaes relativas a este software esto
sujeitas aos termos da licena MIT.
Este Software protegido pelos Nmeros de Patentes dos EUA 5,794,246; 6,014,670; 6,016,501; 6,029,178; 6,032,158; 6,035,307; 6,044,374; 6,092,086; 6,208,990;
6,339,775; 6,640,226; 6,789,096; 6,823,373; 6,850,947; 6,895,471; 7,117,215; 7,162,643; 7,243,110; 7,254,590; 7,281,001; 7,421,458; 7,496,588; 7,523,121;
7,584,422; 7,676,516; 7,720,842; 7,721,270; 7,774,791; 8,065,266; 8,150,803; 8,166,048; 8,166,071; 8,200,622; 8,224,873; 8,271,477; 8,327,419; 8,386,435;
8,392,460; 8,453,159; 8,458,230; e RE44,478, Patentes internacionais e outras Patentes Pendentes.
ISENO DE RESPONSABILIDADE: a Informatica Corporation fornece esta documentao no estado em que se encontra, sem garantia de qualquer tipo, expressa
ou implcita, incluindo, mas no limitando-se, as garantias implcitas de no infrao, comercializao ou uso para um determinado propsito. A Informatica
Corporation no garante que este software ou documentao esteja sem erros. As informaes fornecidas neste software ou documentao podem incluir imprecises
tcnicas ou erros tipogrficos. As informaes deste software e documentao esto sujeitas a alteraes a qualquer momento sem aviso prvio.
AVISOS
Este produto da Informatica (o "Software") traz determinados drivers (os "drivers da DataDirect") da DataDirect Technologies, uma empresa em funcionamento da
Progress Software Corporation ("DataDirect"), que esto sujeitos aos seguintes termos e condies:
1. OS DRIVERS DA DATADIRECT SO FORNECIDOS NO ESTADO EM QUE SE ENCONTRAM, SEM GARANTIA DE QUALQUER TIPO, EXPRESSA OU
IMPLCITA, INCLUINDO, MAS NO LIMITANDO-SE, AS GARANTIAS IMPLCITAS DE COMERCIALIZAO, ADEQUAO A UMA FINALIDADE
ESPECFICA E NO INFRAO.
2. EM NENHUM CASO, A DATADIRECT OU SEUS FORNECEDORES TERCEIRIZADOS SERO RESPONSVEIS, EM RELAO AO CLIENTE FINAL, POR
QUAISQUER DANOS DIRETOS, INDIRETOS, INCIDENTAIS, ESPECIAIS, CONSEQUENCIAIS OU DEMAIS QUE POSSAM ADVIR DO USO DE DRIVERS
ODBC, SENDO OU NO ANTERIORMENTE INFORMADOS DAS POSSIBILIDADES DE TAIS DANOS. ESTAS LIMITAES SE APLICAM A TODAS AS
CAUSAS DE AO, INCLUINDO, SEM LIMITAES, QUEBRA DE CONTRATO, QUEBRA DE GARANTIA, NEGLIGNCIA, RESPONSABILIDADE
RIGOROSA, DETURPAO E OUTROS ATOS ILCITOS.
Captulo 2: Afunilamentos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
Viso geral do captulo Afunilamentos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
Usando estatsticas de segmento. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
Eliminando afunilamentos com base em estatsticas de segmento. . . . . . . . . . . . . . . . . . . . 3
Exemplo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
Afunilamentos de destino. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
Identificando afunilamentos de destino. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
Eliminando afunilamentos no destino. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
Afunilamentos de origem. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
Identificando afunilamentos de origem. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
Eliminando afunilamentos na origem. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
Afunilamentos de mapeamento. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
Identificando afunilamentos de mapeamento. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
Eliminando afunilamentos de mapeamento. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
Afunilamentos de sesso. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
Identificando afunilamentos de sesso. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
Eliminando afunilamentos de sesso. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
Afunilamentos do sistema. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
Identificando afunilamentos do sistema. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
Eliminando afunilamentos de sistema. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
Sumrio i
Usando cargas em massa. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
Usando carregadores externos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
Minimizando deadlocks. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
Aumentando o tamanho do pacote de rede do banco de dados. . . . . . . . . . . . . . . . . . . . . . . . 12
Otimizando os bancos de dados de destino Oracle. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
ii Sumrio
Otimizando transformaes personalizadas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
Otimizando transformaes de unificador. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
Otimizando transformaes de pesquisa. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
Usando drivers de banco de dados ideais. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
Armazenando tabelas de pesquisa em cache. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
Otimizando a condio de pesquisa. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
Filtrando linhas de pesquisa. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
Indexao da tabela de pesquisa. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
Otimizando vrias pesquisas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
Criando uma transformao pesquisa de pipeline. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
Otimizando Transformaes de Normalizador. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
Otimizando transformaes de Gerador de Sequncia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
Otimizando transformaes de classificador. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
Alocando memria. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
Diretrios de trabalho para parties. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
Modo Unicode. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
Otimizando transformaes de Qualificador de Origem. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
Otimizando transformaes de SQL. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
Otimizando Transformaes de XML. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
Eliminando erros de transformao. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
Sumrio iii
Captulo 8: Otimizando implantaes de grade. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
Viso geral do captulo Otimizando a implantao de grades. . . . . . . . . . . . . . . . . . . . . . . . . 40
Armazenando arquivos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
Arquivos do sistema de arquivos compartilhado de alta largura de banda. . . . . . . . . . . . . . 41
Arquivos do sistema de arquivos compartilhado de baixa largura de banda. . . . . . . . . . . . . 41
Arquivos de armazenamento local. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
Usando um sistema de arquivos compartilhado. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
Configurando um sistema de arquivos compartilhado. . . . . . . . . . . . . . . . . . . . . . . . . . . 42
Equilibrando o uso da CPU e da memria. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
Configurando mapeamentos e sesses do PowerCenter. . . . . . . . . . . . . . . . . . . . . . . . . 43
Distribuindo arquivos pelos sistemas de arquivos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
Configurando sesses para distribuir arquivos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
Otimizando transformaes de Gerador de Sequncia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
iv Sumrio
Agrupando dados classificados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
Otimizando consultas de classificao nica. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
Otimizando o banco de dados de destino para particionamento. . . . . . . . . . . . . . . . . . . . . . . . 59
ndice. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
Sumrio v
Prefcio
O Guia de Ajuste de Desempenho do PowerCenter foi escrito para desenvolvedores e administradores do
PowerCenter, administradores de rede e de banco de dados que esto interessados em aprimorar o
desempenho do PowerCenter. Esse guia pressupe que voc tenha conhecimento em sistemas
operacionais, redes, PowerCenter, conceitos de banco de dados relacional e arquivos simples no seu
ambiente. Para obter mais informaes sobre o ajuste de desempenho de banco de dados que no foi
abordado nesse guia, consulte a documentao dos seus produtos de banco de dados.
Recursos da Informatica
O site contm informaes sobre produtos, informaes sobre grupos de usurios, boletins informativos,
acesso ao sistema de gerenciamento de casos de suporte a clientes da Informatica (ATLAS), Biblioteca de
Recursos da Informatica, Base de Dados de Conhecimento da Informatica, Documentao de Produtos
da Informatica e comunidade de usurios da Informatica.
Documentao da Informatica
A equipe de Documentao da Informatica se esfora ao mximo para criar documentaes precisas e
utilizveis. Se voc tiver dvidas, comentrios ou ideias sobre esta documentao, entre em contato com a
equipe de Documentao da Informatica pelo e-mail infa_documentation@informatica.com. Ns usaremos
seu feedback para melhorar a documentao. Por favor, avise-nos se pudermos entrar em contato com voc
em relao aos comentrios.
Site da Informatica
Voc pode acessar o site corporativo da Informatica no endereohttp://www.informatica.com. O site contm
informaes sobre a Informatica, seu histrico, eventos futuros e escritrios de vendas. Voc tambm vai
encontrar informaes sobre parceiros e produtos. A rea de servios do site inclui informaes importantes
sobre suporte tcnico, treinamento e educao, bem como servios de implementao.
vi
Biblioteca de Recursos da Informatica
Na qualidade de cliente da Informatica, voc pode acessar a Biblioteca de Recursos da Informatica no
endereo http://mysupport.informatica.com. A Biblioteca de Recursos uma coletnea de recursos que o
ajuda a aprender mais sobre os produtos e recursos da Informatica. Ela inclui artigos e demonstraes
interativas que apresentam solues a problemas comuns, comparam recursos e comportamentos e o
orienta na execuo de tarefas especficas no mundo real.
Informatica Marketplace
O Informatica Marketplace um frum em que desenvolvedores e parceiros podem compartilhar solues
para aumentar, ampliar ou aprimorar implementaes da integrao de dados. Ao tirar proveito de qualquer
uma das centenas de solues disponveis no Marketplace, voc pode melhorar sua produtividade e agilizar
o tempo de implementao em seu projeto. Voc pode acessar o Informatica Marketplace atravs do link
http://www.informaticamarketplace.com.
Informatica Velocity
Voc pode acessar o Informatica Velocity em http://mysupport.informatica.com. Desenvolvido a partir da
experincias reais em centenas de projetos de gerenciamento de dados, o Informatica Velocity representa o
conhecimento coletivo de nossos consultores que trabalharam com organizaes no mundo inteiro para
planejar, desenvolver, implantar e manter solues bem-sucedidas de Gerenciamento de Dados. Se voc
tiver dvidas, comentrios ou ideias sobre o Informatica Velocity, entre em contato com o Informatica
Professional Services em ips@informatica.com.
O Suporte Online requer um nome de usurio e uma senha. Voc pode solicitar um nome de usurio e uma
senha no endereo http://mysupport.informatica.com.
Os nmeros de telefone para o Suporte Global a Clientes da Informatica esto disponveis no site da
Informatica em http://www.informatica.com/us/services-and-training/support-services/global-support-centers/.
Prefcio vii
viii
CAPTULO 1
Se voc ajustar todos os afunilamentos, ser possvel otimizar o desempenho da sesso aumentando o
nmero de parties de pipeline na sesso. A adio de parties pode aprimorar o desempenho por meio
da utilizao maior de hardware do sistema ao processar a sesso.
Como determinar a melhor maneira de melhorar o desempenho pode ser complexo, altere uma varivel de
cada vez, e limite a sesso tanto antes quanto depois da alterao. Se o desempenho da sesso no
melhorar, convm retornar configurao original.
1. Otimize o destino. Habilita o Servio de Integrao para gravar nos destinos eficientemente.
2. Otimize a origem. Habilita o Servio de Integrao para ler os dados da origem eficientemente.
3. Otimize o mapeamento. Habilita o Servio de Integrao para transformar e mover os dados
eficientemente.
4. Otimize a transformao. Habilita o Servio de Integrao para processar as transformaes em um
mapeamento eficientemente.
5. Otimize a sesso. Habilita o Servio de Integrao para executar a sesso mais rapidamente.
6. Otimize as implantaes de grade. Habilita o Servio de Integrao para executar em uma grade com
o desempenho ideal.
7. Otimize os componentes do PowerCenter. Habilita o Servio de Integrao e o Servio de
Repositrio para funcionarem da forma ideal.
8. Otimize o sistema. Habilita os processos do servio do PowerCenter para execuo mais rpida.
1
CAPTULO 2
Afunilamentos
Este captulo inclui os seguintes tpicos:
1. Destino
2. Origem
3. Mapeamento
4. Sesso
5. Sistema
Use os seguintes mtodos para identificar os afunilamentos de desempenho:
Execute sesses de teste. Voc pode configurar uma sesso de teste para ler dados de uma origem de
arquivo simples ou gravar em um destino de arquivo simples para identificar afunilamentos de origem e
destino.
Analise os detalhes do desempenho. Analise os detalhes do desempenho, como contadores de
desempenho, para determinar onde o desempenho da sesso diminui.
Analise as estatsticas do segmento. Analise as estatsticas do segmento para determinar o nmero
ideal de pontos de partio.
2
Monitore o desempenho do sistema. Voc pode usar as ferramentas de monitoramento do sistema
para visualizar a porcentagem de uso da CPU, esperas de E/S e paginao para identificar os
afunilamentos do sistema. possvel tambm usar o Workflow Monitor para visualizar o uso do recursos
do sistema.
Se o segmento do leitor ou do gravador est 100% ocupado, tente usar tipos de dados de string nas
portas de origem e destino. As portas que no so de string exigem mais processamento.
Se um segmento de transformao est 100% ocupado, tente adicionar um ponto de partio no
segmento. Ao adicionar pontos de partio ao mapeamento, o Servio de Integrao aumenta o nmero
de segmentos de transformao que ele usa na sesso. No entanto, se a mquina j est em execuo
prxima ou na capacidade total, no adicione mais segmentos.
Se uma transformao requer mais tempo de processamento que as outras, tente adicionar um ponto de
partio de passagem para a transformao.
Nesse log da sesso, o tempo de execuo total do segmento de transformao de 506 segundos e a
porcentagem de ocupao de 99.7%. Isso significa que o segmento de transformao nunca esteve ocioso
por 506 segundos. As porcentagens de ocupao do leitor e do gravador foram bastante menores,
aproximadamente 9.6% e 24%. Nesta sesso, o segmento de transformao o afunilamento no
mapeamento.
Afunilamentos de destino
O afunilamento de desempenho mais comum ocorre quando o Servio de Integrao grava em um banco de
dados de destino. Os intervalos de ponto de verificao curtos, tamanhos pequenos do pacote de rede de
banco de dados ou problemas durante operaes de carregamentos pesadas podem causar afunilamentos
de destino.
Configure uma cpia da sesso para gravar dados em um destino de arquivo simples. Se o desempenho
da sesso aumentar significativamente, voc ter um afunilamento de destino. Se a sesso j grava
dados em um destino de arquivo simples, provavelmente voc no tem um afunilamento de destino.
Leia as estatsticas do segmento no log da sesso. Quando o Servio de Integrao gasta mais tempo no
segmento do gravador do que nos segmentos do leitor ou de transformao, voc tem um afunilamento
de destino.
4 Captulo 2: Afunilamentos
Eliminando afunilamentos no destino
Conclua as seguintes tarefas para eliminar os afunilamentos de destino:
TPICOS RELACIONADOS:
Otimizando o destino na pgina 10
Afunilamentos de origem
Os afunilamentos de desempenho ocorrem quando o Servio de Integrao l os dados do banco de dados
de origem. A consulta ineficiente ou os tamanhos do pacote de rede do banco de dados podem causar
afunilamentos de origem.
Se a sesso l dados de uma origem relacional, use os seguintes mtodos para identificar afunilamentos de
origem:
Transformao de Filtro
Mapeamento de teste de leitura
Consulta de banco de dados
Se a sesso l dados de uma origem de arquivo simples, provavelmente voc no tem um afunilamento de
origem.
Adicione uma transformao de Filtro aps cada qualificador de origem. Defina a condio do filtro como
falso para que nenhum dado seja processado aps a transformao do Filtro. Se o tempo decorrido para
executar a nova sesso continuar praticamente o mesmo, voc tem um afunilamento de origem.
Afunilamentos de origem 5
2. No mapeamento copiado, mantenha somente as origens, os qualificadores de origem e quaisquer
associaes ou consultas.
3. Remova todas as transformaes.
4. Conecte os qualificadores de origem a um destino de arquivo.
Execute uma sesso no mapeamento de teste de leitura. Se o desempenho do sesso similar ao original,
voc tem um afunilamento de origem.
Copie a consulta de leitura diretamente do log da sesso. Execute a consulta no banco de dados de origem
com uma ferramenta, como o isql. No Windows, possvel carregar o resultado da consulta em um arquivo.
No UNIX, possvel carregar o resultado da consulta em /dev/null.
Mea o tempo de execuo da consulta e o tempo que ela leva para retornar a primeira linha.
Defina o nmero de bytes que o Servio de Integrao l por linha se ele ler de uma origem de arquivo
simples.
Permita que o administrador do banco de dados aprimore o desempenho otimizando a consulta.
Aumente o tamanho do pacote de rede do banco de dados.
Configure restries de ndice e chave.
Se houver um longo atraso entre as duas medidas de tempo em uma consulta do banco de dados, voc
poder usar uma dica do otimizador.
TPICOS RELACIONADOS:
Otimizando a origem na pgina 14
Afunilamentos de mapeamento
Se voc determinar que no tem um afunilamento de origem ou de destino, ser possvel que tenha um
afunilamento de mapeamento.
6 Captulo 2: Afunilamentos
Adicione uma transformao de Filtro antes de cada definio de destino. Defina a condio do filtro
como falso para que nenhum dado seja carregado nas tabelas de destino. Se o tempo decorrido para
executar a nova sesso continuar igual ao original, voc tem um afunilamento de mapeamento.
TPICOS RELACIONADOS:
Otimizando mapeamentos na pgina 17
Afunilamentos de sesso
Se voc no tiver um afunilamento de origem, de destino ou de mapeamento, ser possvel que tenha um
afunilamento de sesso. O tamanho pequeno de cache, a memria baixa de buffer e os pequenos intervalos
de confirmao podem causar afunilamentos de sesso.
TPICOS RELACIONADOS:
Otimizando sesses na pgina 33
Afunilamentos do sistema
Aps ajustar a origem, o destino, o mapeamento e a sesso, tente ajustar o sistema para evitar
afunilamentos do sistema. O Servio de Integrao usa os recursos do sistema para processar
transformaes, executar sesses, ler e gravar dados. O Servio de Integrao tambm usa a memria do
sistema para criar arquivos de cache files para transformaes, como Agregador, Associador, Pesquisa,
Classificador, XML e Classificao.
Afunilamentos de sesso 7
Usando o Workflow Monitor para identificar afunilamentos do sistema
Voc pode visualizar as propriedades do Servio de Integrao no Workflow Monitor o uso da CPU, da
memria e de permuta do sistema quando estiver executando processos de tarefa no Servio de Integrao.
Use as seguintes propriedades do Servio de Integrao para identificar problemas de desempenho:
CPU%. A porcentagem do uso da CPU inclui outras tarefas externas em execuo no sistema.
Uso da memria. A porcentagem do uso da memria inclui outras tarefas externas em execuo no
sistema. Se o uso da memria est prximo de 95%, verifique se as tarefas em execuo mo sistema
esto usando a quantidade indicada no Workflow Monitor ou se h uma perda de memria. Para
solucionar o problema, use as ferramentas do sistema para verificar o uso da memria antes e depois da
execuo da tarefa e, em seguida, compare os resultados do uso da memria ao executar a sesso.
Uso de permuta. O uso de permuta um resultado da paginao devido as possveis perdas de
memria ou um nmero alto de tarefas simultneas.
A tabela a seguir descreve as informaes de sistema que voc pode usar no Monitor de Desempenho do
Windows para criar um grfico:
Propriedade Descrio
Tempo do processador em Se voc tiver mais de uma CPU, monitore cada uma delas para tempo do
percentual processador em percentual.
Pginas/segundo Se as pginas/segundo for maior do que cinco, talvez voc tenha presso de
memria excessiva conhecido como sobrecarga.
Tempo em percentual dos O percentual de tempo que o disco fsico est ocupado executando
discos fsicos solicitaes de leitura e gravao.
Comprimento da fila dos discos O nmero de usurios aguardando para acessar o mesmo dispositivo de
fsicos disco.
superior. Visualize o desempenho geral do sistema. Esta ferramenta exibe o uso da CPU, da memria e
de permuta do sistema e de processos individuais em execuo no sistema.
iostat. Monitore a operao de carregamento para cada disco anexado ao servidor do banco de dados. O
Iostat exibe a porcentagem de tempo que o disco est fisicamente ativo. Se voc utiliza matrizes de
disco, use os utilitrios fornecidos com as matrizes em vez do iostat.
vmstat. Monitore as aes de permuta do disco.
8 Captulo 2: Afunilamentos
sar. Visualize relatrios detalhados das atividades de sistema da CPU, da memria e do uso do disco.
Voc pode usar esta ferramenta para monitorar o carregamento da CPU. Ela oferece o uso em percentual
com base no tempo de espera, no tempo ocioso, no sistema e no usurio. Alm disso, use esta
ferramenta para monitorar as aes de permuta do disco.
Se o uso da CPU maior que 80%, verifique o nmero de tarefas simultneas em execuo. Tente
alterar o carregamento ou usar uma grade para distribuir tarefas para diferentes ns. Se no for possvel
diminuir a carga, tente adicionar mais processadores.
Se a permuta ocorrer, aumente a memria fsica ou reduza o nmero de aplicativos com utilizao
intensa da memria no disco.
Se voc tiver presso de memria excessiva (sobrecarga), tente adicionar mais memria fsica.
Se a porcentagem de tempo alta, ajuste o cache para que o PowerCenter use o cache de memria
interna em vez de gravar no disco. Se voc ajustar o cache, as solicitaes continuarem na fila e a
porcentagem de ocupao do disco for de pelo menos 50%, adicione outro dispositivo de disco ou faa
um upgrade para um dispositivo de disco mais rpido. Voc tambm pode usar um disco separado para
cada partio na sesso.
Se o comprimento da fila do disco fsico maior que dois, tente adicionar outro dispositivo de disco ou
fazer um upgrade no dispositivo de disco. Alm disso, possvel usar discos separados para os
segmentos do leitor, do gravador e de transformao.
Tente aprimorar a largura de banda da rede.
Ao ajustar os sistemas UNIX, ajuste o servidor para um sistema principal de banco de dados.
Se o tempo em percentual gasto aguardando no E/S (%wio) for alto, tente usar outros discos pouco
utilizados. Por exemplo, se os arquivos de cache dos dados de origem, de destino, de pesquisa, de
classificao e agregado esto no mesmo disco, tente coloc-los em discos diferentes.
TPICOS RELACIONADOS:
Reduzindo a paginao na pgina 53
Otimizando o sistema na pgina 52
Afunilamentos do sistema 9
CAPTULO 3
Otimizando o destino
Este captulo inclui os seguintes tpicos:
Se voc desejar descartar e recriar as restries de chave e ndices regularmente, use os seguintes
mtodos para fazer estas operaes sempre que executar a sesso:
10
Nota: Para otimizar o desempenho, use o carregamento com base na restrio somente se necessrio.
Nota: Embora voc obtenha desempenho ao reduzir o nmero de pontos de verificao, voc tambm
aumente o tempo de recuperao se o banco de dados for encerrado inesperadamente.
Ao executar o carregamento em massa, o Servio de Integrao ignora o log do banco de dados, o que
aumenta o desempenho. Entretanto, sem a gravao no log do banco de dados, o banco de dados de
destino no pode realizar a reverso. Como resultado, voc talvez no possa realizar uma recuperao. Ao
usar o carregamento em massa, avalie a importncia do desempenho de sesso aprimorado em relao
capacidade de recuperar uma sesso incompleta.
Quando voc carregar em massa nos destinos do Microsoft SQL Server ou Oracle, defina um grande
intervalo de confirmao para aprimorar o desempenho. O Microsoft SQL Server e o Oracle comeam uma
nova transao de carregamento em massa aps cada confirmao. Aumentar o intervalo de confirmao
reduz o nmero de transaes de carregamento em massa, o que aumenta o desempenho.
TPICOS RELACIONADOS:
Confirmao baseada no destino na pgina 37
Minimizando deadlocks
Se o Servio de Integrao encontrar um deadlock quando tentar gravar em um destino, o deadlock somente
afetar os destinos no mesmo grupo de conexo de destino. O Servio de Integrao ainda grava em
destinos em outros grupos de conexo de destino.
Ao gravar em um banco de dados Oracle, verifique a clusula de armazenamento dos objetos do banco de
dados. Certifique-se de que as tabelas esto usando valores iniciais e prximos grandes. Alm disso, o
Ao gravar em banco de dados Oracle, ele usa os segmentos de reverso e de desfazer durante os
carregamentos. Consulte o administrador do banco de dados Oracle para saber se o banco de dados
armazena segmentos de reverso e de desfazer em espaos de tabela adequados, preferencialmente em
discos diferentes. Os segmentos de reverso e de desfazer devem tambm ter clusulas de armazenamento
apropriadas.
Para otimizar o banco de dados Oracle, ajuste o log de refazer Oracle. O banco de dados Oracle utiliza o log
de refazer para registrar as operaes de carregamento. Certifique-se de que o tamanho do log de refazer e
o tamanho do buffer so ideais. Voc pode visualizar as propriedades do log de refazer no arquivo init.ora.
Para obter mais informaes sobre a otimizao dos bancos de dados Oracle, consulte a documentao do
Oracle.
Otimizando a origem
Este captulo inclui os seguintes tpicos:
Otimizando a consulta, 14
Usando filtros condicionais, 15
Aumentando o tamanho do pacote de rede do banco de dados, 15
Conectando-se s origens de banco de dados Oracle, 15
Usando o Teradata FastExport, 15
Usando o tempdb para associar o Sybase ou as tabelas do Microsoft SQL Server, 16
Otimizando a consulta
Se uma sesso associar diversas tabelas de origem em um Qualificador de Origem, voc poder aprimorar o
desempenho ao otimizar a consulta com dicas de otimizao. Alm disso, as instrues de seleo da tabela
nica com uma clusula ORDER BY ou GROUP BY podem se beneficiar da otimizao, como a adio de
ndices.
Em geral, o otimizador de banco de dados determina a maneira mais eficiente de processar os dados da
origem. No entanto, possvel aprender sobre as tabelas de origem que o otimizador de banco de dados
no processa. O administrador de banco de dados pode criar dicas do otimizador para dizer ao banco de
dados como executar a consulta para um conjunto particular de tabelas de origem.
A consulta usada pelo Servio de Integrao para ler os dados exibida no log da sesso. Alm disso, voc
pode encontrar a consulta na transformao do Qualificador de Origem. Permita que o administrador do
banco de dados analise a consulta e, em seguida, crie ndices e dicas do otimizador para as tabelas de
origem.
Use as dicas de otimizao se houver um longo atraso entre o momento no qual a consulta comea a ser
executada e o momento no qual o PowerCenter recebe a primeira linha de dados. Configure as dicas do
otimizador para comear a retornar linhas o mais rpido possvel, ao invs de retornar todas de uma vez.
Isso permite que o Servio de Integrao processe as linhas paralelas com a execuo da consulta.
Voc tambm pode configurar o banco de dados de origem para executar consultas paralelas para aprimorar
o desempenho. Para obter mais informaes sobre a configurao de consultas paralelas, consulte a
documentao do banco de dados.
14
Usando filtros condicionais
s vezes, um filtro de origem simples no banco de dados de origem pode influenciar de maneira negativa o
desempenho falta de ndices. Voc pode usar o filtro condicional do PowerCenter no Qualificador de Origem
para aprimorar o desempenho.
A utilizao do filtro condicional do PowerCenter para aprimorar o desempenho depender da sesso. Por
exemplo, se diversas sesses so lidas da mesma origem simultaneamente, o filtro condicional do
PowerCenter pode aprimorar o desempenho.
No entanto, algumas sesses podero ser executadas com mais rapidez se os dados de origem forem
filtrados no banco de dados de origem. Voc pode testar a sesso com o filtro do banco de dados e o filtro
do PowerCenter para determinar qual mtodo aprimora o desempenho.
Otimizando mapeamentos
Este captulo inclui os seguintes tpicos:
Em geral, voc reduz o nmero de transformaes no mapeamento e exclui os links desnecessrios entre as
transformaes para otimizar o mapeamento. Configure o mapeamento de forma que o mnimo de
transformaes e expresses faa a maior quantidade de trabalho possvel. Exclua os links desnecessrios
entre as transformaes para minimizar a quantidade de dados movidos.
17
Integrao l 1024 bytes por linha. Se cada linha no arquivo de origem for menor do que a configurao
padro, ser possvel reduzir o comprimento de buffer sequencial nas propriedades da sesso.
Por exemplo, voc tem a tabela de origem Compras e usa essa origem diariamente para executar uma
agregao e uma classificao. Se voc inserir as transformaes de Agregador e de Classificao em
mapeamentos e sesses diferentes, voc forar o Servio de Integrao a ler a mesma tabela de origem
duas vezes. No entanto, se voc incluir a lgica de agregao e de classificao em um mapeamento com
um qualificador de origem, o Servio de Integrao ler a tabela de origem Compras uma vez e enviar os
dados adequados aos pipelines separados.
Quando voc altera mapeamentos para aproveitar a leitura de passagem nica, possvel otimizar esse
recurso fatorando as funes comuns dos mapeamentos. Por exemplo, se voc precisar subtrair uma
porcentagem das portas de Preo tanto para as transformaes de Agregador quanto de Classificao,
possvel minimizar o trabalho subtraindo a porcentagem antes de dividir o pipeline. Voc pode usar uma
transformao de Expresso para subtrair a porcentagem e dividir o mapeamento aps a transformao.
A figura a seguir mostra a leitura de passagem nica, onde o mapeamento dividido aps a transformao
de Expresso:
Otimizando filtros
Use uma das seguintes transformaes para filtrar dados:
Se voc no puder usar um filtro na transformao de Qualificador de Origem, use uma transformao de
Filtro e mova-a o mais prximo possvel para a transformao de Qualificador de Origem para remover os
dados desnecessrios no incio do fluxo de dados. A transformao de Filtro limita o conjunto de linhas
enviado ao destino.
Evite usar expresses complexas em condies de filtro. Para otimizar as transformaes de Filtro, use um
inteiro simples ou expresses de verdadeiro/falso na condio do filtro.
Nota: Voc tambm pode usar uma transformao de Filtro ou Roteador para descartar linhas rejeitadas de
uma transformao de Estratgia de Atualizao caso no precise mant-las.
Use valores inteiros em vez de outros tipos de dados ao realizar comparaes usando as
transformaes de Pesquisa e de Filtro. Por exemplo, muitos bancos de dados armazenam
informaes de CEP dos EUA, como o tipo de dados Char ou Varchar. Se voc converter os dados de
CEP para um tipo de dados de Inteiro, o banco de dados de pesquisa armazenar o CEP 94303-1234
como 943031234. Isso ajudar a aumentar a velocidade das comparaes de pesquisa com base no
CEP.
Converta as datas de origem por meio de converses porta-a-porta para melhorar o desempenho
da sesso. Voc pode manter as portas em destinos como strings ou alter-las para portas de Data/
Hora.
Se voc fatorar a chamada de funo de agregao, conforme abaixo, o Servio de Integrao adicionar
COLUMN_A COLUMN_B e, em seguida, localizar a soma de ambos.
SUM(COLUMN_A + COLUMN_B)
VAL_A + VAL_B ,
VAL_A + VAL_C,
VAL_A ,
VAL_B + VAL_C,
VAL_B ,
VAL_C,
0.0,
))))))))
Otimizando expresses 21
Se voc aproveitar a funo IIF, possvel regravar a expresso como:
IIF(FLG_A='Y', VAL_A, 0.0)+ IIF(FLG_B='Y', VAL_B, 0.0)+ IIF(FLG_C='Y', VAL_C, 0.0)
Isso resultar em trs IIFs, duas comparaes, duas adies e uma sesso mais rpida.
Avaliando expresses
Se voc no tiver certeza quais expresses esto reduzindo o desempenho, avalie o desempenho da
expresso para isolar o problema.
Por exemplo, voc precisa criar um procedimento externo com dois grupos de entrada. O procedimento
externo l uma linha do primeiro grupo de entrada e, em seguida, l uma linha do segundo grupo de entrada.
Se voc usar o bloqueio, ser possvel gravar o cdigo do procedimento externo para bloquear o fluxo de
dados de um grupo de entrada enquanto ele processa os dados do outro grupo de entrada. Quando voc
grava o cdigo do procedimento externo para bloquear dados, o desempenho melhora porque o
procedimento no precisa copiar os dados de origem em um buffer. No entanto, voc poderia gravar o
procedimento externo para alocar um buffer e copiar os dados de um grupo de entrada no buffer at que ele
esteja pronto para processar os dados. A cpia de dados de origem em um buffer prejudica o desempenho.
Otimizando transformaes
Este captulo inclui os seguintes tpicos:
23
Usando entrada classificada
Para melhorar o desempenho da sesso, classifique os dados da transformao de Agregador. Use a opo
de Entrada Classificada para classificar dados.
A opo Entrada Classificada diminui o uso de caches agregados. Quando voc usa a opo Entrada
Classificada, o Servio de Integrao considera que todos os dados esto filtrados por grupo. Ao passo que
o Servio de Integrao l as linhas de um grupo, ele executa os clculos de agregao. Quando
necessrio, ele armazena as informaes do grupo na memria.
A opo Entrada Classificada reduz a quantidade de dados armazenados no cache durante a sesso e
melhora o desempenho. Use essa opo com a opo Nmero de Portas Classificadas do Qualificador de
Origem ou uma transformao Classificador para transferir os dados classificados para a transformao de
Agregador.
Voc pode melhorar o desempenho ao usar a opo Entrada Classificada em sesses com vrias parties.
Quando voc usa a agregao incremental, voc aplica as alteraes capturadas na origem para agregar
clculos em uma sesso. O Servio de Integrao atualiza o destino incrementalmente em vez de processar
a origem inteira e fazer novamente os mesmos clculos todas as vezes que voc executar a sesso.
Voc pode aumentar o tamanho do cache do ndice e dos dados para armazenamento de todos os dados na
memria sem paginao no disco.
TPICOS RELACIONADOS:
Aumentando os tamanhos de cache na pgina 37
Voc pode diminuir o nmero de chamadas de funo feitas pelo Servio de Integrao e pelo
procedimento. O Servio de Integrao chama a funo de notificao de linha de entrada menos vezes
e o procedimento chama a funo de notificao de sada menos vezes tambm.
Voc pode aumentar a localidade do espao de acesso memria para os dados.
Voc pode gravar o cdigo do procedimento para executar algoritmos em blocos de dados, e no em
cada linha de dados.
Use as dicas a seguir para aprimorar o desempenho da sesso com a transformao de Unificador:
Identifique a origem mestre como a origem com menos valores de chave duplicados. Quando o
Servio de Integrao processa uma transformao de Unificador classificada, ele armazena as linhas no
cache, cem chaves exclusivas por vez. Se a origem mestre contiver muitas linhas com o mesmo valor de
chave, o Servio de Integrao dever armazenar mais linhas no cache. Com isso, o desempenho ficar
mais lento.
Identifique a origem mestre como a origem com menos linhas. Durante a sesso, a transformao de
Unificador compara cada linha da origem de detalhes a origem mestre. Quanto menos linhas na origem
mestre, menor o nmero de iteraes da comparao das associaes que ocorrero. Isso acelera o
processo de associao.
Quando possvel, faa associaes em um banco de dados. mais rpido fazer uma associao em
um banco de dados do que na sesso. O tipo de associao de banco de dados usado pode afetar o
desempenho. As associaes normais so mais rpidas que as associaes externas e geram menos
linhas. Em alguns casos, no possvel fazer associaes no banco de dados, como unir tabelas de dois
bancos de dados diferentes ou de sistemas de arquivos simples.
Para realizar uma associao em um banco de dados, utilize as seguintes opes:
- Crie um procedimento armazenado de pr-sesso para unir as tabelas em um banco de dados.
Execute as seguintes tarefas para melhorar ainda mais o desempenho das transformaes de Pesquisa:
TPICOS RELACIONADOS:
Caches na pgina 36
Tipos de caches
Use os seguintes tipos de caches para melhorar o desempenho:
Cache compartilhado. Voc pode compartilhar o cache de pesquisa entre vrias transformaes. Voc
pode compartilhar um cache no nomeado entre transformaes no mesmo mapeamento. Voc pode
compartilhar um cache nomeado entre transformaes no mesmo mapeamento ou em mapeamentos
diferentes.
Voc pode habilitar caches simultneos para melhorar o desempenho. Quando o nmero de pipelines
simultneos adicionais definido como um ou mais, o Servio de Integrao cria caches simultaneamente, e
no sequencialmente. O desempenho melhora significativamente quando as sesses contm um nmero de
transformaes ativas que podem demorar para ser concludas, como transformaes de Agregador,
Unificador ou Classificador. Quando voc habilita vrios pipelines simultneos, o Servio de Integrao no
aguarda mais as sesses ativas serem concludas para criar o cache. Outras transformaes de Pesquisa
no pipeline tambm criam caches simultaneamente.
O Servio de Integrao sempre gera uma instruo ORDER BY, mesmo se voc inserir outra na
substituio. Coloque dois hfens '--' depois da substituio ORDER BY para remover a instruo ORDER
BY gerada.
A transformao de Pesquisa inclui trs portas de pesquisa usadas no mapeamento, ITEM_ID, ITEM_NAME
e PRICE. Quando voc inserir a instruo ORDER BY, insira as colunas na mesma ordem que as portas na
condio de pesquisa. Voc tambm deve incluir todas as palavras reservadas do banco de dados entre
aspas.
Igual a (=)
Menor que (<), maior que (>), menor ou igual a (<=), maior ou igual a (>=)
Diferente de (!=)
Para determinar que transformaes de Pesquisa processam a maior quantidade de dados, examine os
contadores Lookup_rowsinlookupcache de cada transformao de Pesquisa. As transformaes de Pesquisa
que tm um nmero maior no contador podem se beneficiar do ajuste das expresses de pesquisa. Se as
expresses forem otimizadas, o desempenho da sesso ser melhorado.
O pipeline parcial est em um grupo de classificao para carregamento de destino separado nas
propriedades da sesso. Voc pode configurar diversas parties no pipeline para melhorar o desempenho.
A propriedade Nmero de Valores em Cache determina o nmero de valores que o Servio de Integrao
armazena em cache de uma vez. Certifique-se de que o Nmero de Valores em Cache no seja muito
pequeno. Considere configurar o Nmero de Valores em Cache com um valor superior a 1.000.
Se voc no tiver valores armazenados em cache, configure o Nmero de Valores em Cache como 0. As
transformaes de Gerador de Sequncia que no usam cache so mais rpidas que as que o exigem.
Quando voc conectar a porta CURRVAL em uma transformao de Gerador de Sequncia, o Servio de
Integrao processar uma linha em cada bloco. possvel otimizar o desempenho conectando apenas a
porta NEXTVAL em um mapeamento.
TPICOS RELACIONADOS:
Otimizando transformaes de Gerador de Sequncia na pgina 46
Alocando memria
Para obter o desempenho ideal, configure o tamanho do cache do Classificador com um valor menor ou
igual rea da RAM fsica disponvel no n do Servio de Integrao. Aloque, pelo menos, 16 MB de
memria fsica para classificar dados usando a transformao de Classificador. Por padro, o tamanho do
cache do Classificador est definido como 16.777.216 bytes. Se o Servio de Integrao no puder alocar
memria suficiente para a classificao de dados, a sesso falhar.
Se o volume de dados de entrada for maior que o tamanho do cache do Classificador, o Servio de
Integrao armazenar temporariamente os dados no diretrio de trabalho da transformao de
Classificador. Ao armazenar dados no diretrio de trabalho, o Servio de Integrao requer que o espao em
disco seja pelo menos duas vezes maior que o volume dos dados de entrada. Se o volume de dados de
entrada for muito maior que o tamanho do cache do Classificador, pode ser que o Servio de Integrao
precise de bem mais que o dobro de espao em disco disponvel para o diretrio de trabalho.
Nota: O log da sesso contm a contagem de linhas de entrada e o tamanho dos dados de entrada para a
transformao de Classificador.
Por exemplo, a seguinte mensagem exibida quando o Servio de Integrao processa a transformao de
Classificador:
Ao particionar uma sesso com a transformao de Classificador, voc pode especificar um diretrio de
trabalho diferente para cada partio no pipeline. Para melhorar o desempenho da sesso, especifique
diretrios de trabalho em discos fisicamente separados nos ns do Servio de Integrao.
Modo Unicode
Para otimizar uma transformao de Classificador, execute o Servio de Integrao do PowerCenter no
modo ASCII. Se o Servio de Integrao do PowerCenter for executado no modo Unicode, a transformao
de Classificador despejar dados adicionais para o disco.
Cada vez que o Servio de Integrao processa uma nova consulta em uma sesso, ele chama uma funo
chamada SQLPrepare para criar um procedimento SQL e transferi-lo ao banco de dados. Quando a consulta
alterada para cada linha de entrada, h impacto no desempenho.
Quando a transformao for executada no modo de consulta, construa uma consulta esttica na
transformao para melhorar o desempenho. Instrues de consulta esttica no so alteradas, embora os
dados na clusula de consulta sejam. Para criar uma consulta esttica, use a vinculao de parmetros no
lugar da substituio de string no Editor SQL. Quando voc usa a vinculao de parmetros, voc define
parmetros na clusula de consulta para calores nas portas de entrada de transformao.
Quando uma consulta SQL contm instrues de consulta de confirmao e de reverso, o Servio de
Integrao precisa recriar o procedimento SQL depois de cada confirmao ou reverso. Para melhorar o
desempenho, no use instrues de transao em consultas de transformao de SQL.
Quando voc cria a transformao de SQL, voc configura como a transformao se conecta ao banco de
dados. possvel escolher uma conexo esttica ou transferir informaes de conexo para a
transformao em tempo de execuo.
Quando voc configura a transformao para usar uma conexo esttica, voc escolhe uma conexo entre
as conexes do Workflow Manager. A transformao de SQL conecta-se uma vez ao banco de dados
durante a sesso. Quando voc transfere informaes de conexo dinmica, a transformao de SQL
conecta-se ao banco de dados todas as vezes que a transformao processa uma linha de entrada.
Os erros de transformao ocorrem quando o Servio de Integrao encontra erros de converso, lgica de
mapeamento conflitante e qualquer condio configurada como um erro, como uma entrada invlida.
Consulte o log da sesso para verificar onde h erros de transformao. Se os erros se concentram em
transformaes especficas, avalie as restries dessas transformaes.
Se voc no definir o limite de erro, o Servio de Integrao continuar a processar linhas de erro e,
portanto, aumentar o tempo de execuo da sesso. Para otimizar o desempenho, defina o limite de erro
para interromper a sesso depois de um determinado nmero de erros de linha.
Se precisar executar uma sesso que gere um alto nmero de erros de transformao, possvel melhorar o
desempenho configurando um nvel de rastreamento inferior. No entanto, essa no uma soluo
recomendada a longo prazo para erros de transformao.
TPICOS RELACIONADOS:
Rastreamento de erros na pgina 38
Otimizando sesses
Este captulo inclui os seguintes tpicos:
Grade, 33
Otimizao de empilhamento, 34
Sesses e fluxos de trabalho simultneos, 34
Memria de buffer, 34
Caches, 36
Confirmao baseada no destino, 37
Processamento em tempo real, 38
reas de preparao, 38
Arquivos de log, 38
Rastreamento de erros, 38
Emails ps-sesso, 39
Grade
Voc pode usar uma grade para melhorar o desempenho da sesso e do fluxo de dados. Uma grade uma
alias atribudo a um grupo de ns que permite que voc automatize a distribuio de fluxos de trabalho e
sesses pelos ns.
Quando voc usa uma grade, o Servio de Integrao distribui as tarefas do fluxo de trabalho e os
segmentos da sesso por vrios ns. Um Balanceador de Carga distribui as tarefas para os ns sem
sobrecarregar nenhum deles. A execuo de fluxos de trabalho e sesses nos ns de uma grade oferece os
seguintes benefcios de desempenho:
33
memria armazenada em cache, a implantao de uma memria adequada e de um armazenamento em
disco separado para cada instncia de cache resultar no aumento do desempenho.
Executar uma sesso em uma grade pode melhorar a taxa de transferncia de dados porque a grade
oferece mais recursos para executar a sesso. O desempenho melhora quando voc executa algumas
sesses na grade em momentos especficos. Executar uma sesso em uma grade ser mais eficiente que
executar um fluxo de trabalho em uma grade se o nmero de parties de sesso simultnea for inferior ao
nmero de ns.
Quando voc executa vrias sesses em uma grade, as subtarefas da sesso compartilham os recursos de
n com as subtarefas de outras sesses simultneas. Executar uma sesso em uma grade exige a
coordenao entre os processos que esto sendo executados em ns diferentes. Em alguns mapeamentos,
a execuo de uma sesso em uma grade requer uma sobrecarga adicional para mover os dados de um n
para outro. Alm de carregar os recursos de memria e de CPU em cada n, a execuo de vrias sesses
em uma grade aumenta o trfego da rede.
Quando voc executa um fluxo de trabalho em uma grade, o Servio de Integrao carrega os recursos de
memria e de CPU nos ns sem exigir a coordenao entre os ns.
TPICOS RELACIONADOS:
Otimizando implantaes de grade na pgina 40
Otimizao de empilhamento
Para melhorar o desempenho da sesso, transfira a lgica de transformao para o banco de dados de
origem ou de destino. Baseado na configurao de mapeamento e de sesso, o Servio de Integrao
executa o SQL em relao ao banco de dados de origem ou de destino em vez de processar a lgica de
transformao contida no Servio de Integrao.
Memria de buffer
Quando o Servio de Integrao inicializa uma sesso, ele aloca blocos de memria para manter os dados
de origem e de destino. O Servio de Integrao aloca pelo menos dois blocos para cada partio de origem
e de destino. As sesses que usam um grande nmero de origens e de destinos podem exigir blocos
adicionais de memria. Se o Servio de Integrao no puder alocar blocos de memria suficientes para
manter os dados, a sesso falhar.
Voc pode configurar a quantidade de memria de buffer ou pode configurar o Servio de Integrao para
calcular as configuraes de buffer em tempo de execuo.
Tamanho do Buffer DTM. Aumente o tamanho do buffer DTM na guia Propriedades das propriedades da
sesso.
Tamanho Padro do Bloco de Buffer. Reduza o tamanho do bloco de buffer na guia Configurao do
Objeto nas propriedades da sesso.
Nota: Se o particionamento de dados estiver ativado, o tamanho de buffer do DTM ser o tamanho total de
todos os pools de buffer de memria alocados para todas as parties. Em sesses que contm n parties,
defina o Tamanho de Buffer do DTM para pelos menos n vezes o valor da sesso com uma partio.
O aumento da alocao de memria do buffer DTM geralmente faz com que o desempenho melhore
inicialmente e depois se estabilize. Se voc no perceber uma melhora significativa no desempenho, a
alocao de memria de buffer do DTM no ser um determinante do desempenho da sesso.
Para aumentar o tamanho do buffer DTM, abra as propriedades da sesso e clique na guia Propriedades.
Edite a propriedade Tamanho de Buffer do DTM nas configuraes de Desempenho. Aumente a propriedade
Tamanho de buffer DTM em mltiplos do tamanho do bloco de buffer.
Se estiver manipulando um nmero excepcionalmente alto de linhas de dados, aumente o tamanho do bloco
de buffer para melhorar o desempenho. Se voc no souber o tamanho aproximado das linhas, determine o
tamanho da linha executando as etapas a seguir.
Para definir o tamanho do bloco de buffer, abra as propriedades da sesso e clique na guia Configurao do
Objeto. Edite a propriedade Tamanho Padro do Bloco de Buffer nas configuraes Avanadas.
Memria de buffer 35
Da mesma forma que a alocao de memria de buffer DTM, o aumento do tamanho do bloco de buffer
dever melhorar o desempenho. Se voc no perceber um aumento, o tamanho do bloco de buffer no um
determinante do desempenho da sesso.
Caches
O Servio de Integrao usa caches de ndice e de dados para os destinos XML e para as transformaes
de Agregador, Classificao, Pesquisa e Unificador. O Servio de Integrao armazena os dados
transformados no cache de dados antes de retorn-los ao pipeline. Ele armazena as informaes do grupo
no cache de ndice. Alm disso, o Servio de Integrao usa um cache para armazenar os dados para
transformaes de Classificador.
Para configurar a quantidade de memria em cache, use o calculador de cache ou especifique o tamanho do
cache. Voc tambm pode configurar o Servio de Integrao para calcular as configuraes da memria de
cache em tempo de execuo.
Se o cache alocado no for grande o suficiente para armazenar os dados, o Servio de Integrao
armazenar os dados em um arquivo de disco temporrio, um arquivo de cache, pois ele processa os dados
da sesso. O desempenho fica mais lento todas as vezes que o Servio de Integrao realizar a paginao
em um arquivo temporrio. Examine os contadores de desempenho para determinar a frequncia na qual o
Servio de Integrao realiza a paginao em um arquivo.
Voc pode examinar os detalhes de desempenho de uma sesso para determinar quando o Servio de
Integrao realizar a paginao para um arquivo de cache. Os contadores Transformation_readfromdisk ou
Transformation_writetodisk de qualquer transformao de Agregador, Classificao ou Unificador indicam o
nmero de vezes que o Servio de Integrao realiza paginao no disco para processar a transformao.
Se a sesso contiver uma transformao que use um cache e voc executar a sesso em uma mquina com
memria suficiente, aumente os tamanhos de cache para processar a transformao na memria.
Armazenamento em cache. Com uma plataforma de 64 bits, o Servio de Integrao no fica limitado
ao limite de cache de 2 GB de uma plataforma de 32 bits.
Taxa de transferncia de dados. Com um espao maior de memria disponvel, o leitor, o gravador e os
segmentos DTM podem processar blocos de dados maiores.
Quando voc aumentar o intervalo de confirmao, considere os limites de arquivos de log no banco de
dados de destino. Se o intervalo de confirmao for muito alto, o Servio de Integrao poder preencher o
arquivo de log do banco de dados e gerar uma falha na sesso.
Portanto, pondere sobre o benefcio do aumento do intervalo de confirmao em relao ao tempo adicional
que voc levaria para recuperar-se de uma sesso com falha.
Clique nas configuraes de Opes Gerais nas propriedades da sesso para verificar e ajustar o intervalo
de confirmao.
Latncia de liberao
A latncia de liberao determina com que frequncia o Servio de Integrao libera os dados em tempo
real da origem. Quanto mais baixo for definido o intervalo de latncia de liberao, maior ser a frequncia
com que o Servio de Integrao confirmar as mensagens para o destino. Cada vez que o Servio de
Integrao confirmar mensagens para o destino, a sesso consumir mais recursos e a taxa de transferncia
ser interrompida.
Aumente a latncia de liberao para melhorar a taxa de transferncia. A taxa de transferncia aumenta
quando voc aumenta a latncia de liberao at um certo limite dependendo do hardware e dos recursos
disponveis.
reas de preparao
Quando voc usa uma rea de preparao, o Servio de Integrao executa vrias transferncias nos
dados. Quando possvel, remova as reas de preparao para melhorar o desempenho. O Servio de
Integrao ode ler vrias origens com uma nica transferncia, o que pode aliviar a necessidade de reas de
preparao.
TPICOS RELACIONADOS:
Configurando a leitura de passagem nica na pgina 18
Arquivos de log
O fluxos de trabalho so executados mais rapidamente quando voc no os configura para arquivos de
sesso de gravao e de log de fluxo de trabalho. Os fluxos de trabalho e sesses sempre criam logs
binrios. Quando voc configura uma sesso ou fluxo de trabalho para a gravao de um arquivo de log, o
Servio de Integrao grava os eventos de log duas vezes. Voc pode acessar a sesso de logs binrios e
os logs de fluxo de trabalho no Console de Administrao.
Rastreamento de erros
Para melhorar o desempenho, reduza o nmero de eventos de log gerados pelo Servio de Integrao
quando ele executar a sesso. Se uma sesso contiver um grande nmero de erros de transformao e voc
Se precisar depurar o mapeamento e tiver definido o nvel de rastreamento como Detalhado, pode haver um
impacto negativo significativo no desempenho quando voc executar a sesso. No use o rastreamento
Detalhado ao ajustar o desempenho.
Emails ps-sesso
Quando voc anexar o log da sesso a um email ps-sesso, habilite o registro em log de arquivo simples.
Se voc habilitar o registro em log de arquivo simples, o Servio de Integrao obter o arquivo de log da
sesso por meio do disco. Se voc no habilitar o registro em log de arquivo simples, o Servio de
Integrao obter os eventos de log por meio do Log Manager e ir gerar o arquivo de log da sesso a ser
anexado ao email. Quando o Servio de Integrao recuperar o log da sesso do servio de log, o
desempenho do fluxo de trabalho ser reduzido, principalmente quando o arquivo de log for grande e o
servio de log for executado em um n diferente do DTM mestre. Para obter o desempenho ideal, configure
a sesso para gravar no arquivo de log quando voc configurar o email ps-sesso para anexar um log de
sesso.
Emails ps-sesso 39
CAPTULO 8
Otimizando implantaes de
grade
Este captulo inclui os seguintes tpicos:
Adicione ns grade.
Aumente a capacidade e a largura de banda do armazenamento.
Use sistemas de arquivos compartilhados.
Use uma rede de alta transferncia ao executar as seguintes tarefas:
- Acesse origens e destinos pela rede.
Armazenando arquivos
Ao configurar o PowerCenter para ser executado em uma grade, especifique a localizao de
armazenamento para diferentes tipos de arquivos de sesso, como arquivos de origem, de log e de cache.
Para aprimorar o desempenho, armazene os arquivos em localizaes ideais. Por exemplo, armazene
arquivos de cache persistente em um sistema de arquivos compartilhado de alta largura de banda. Os
diferentes tipos de arquivo tm requisitos de armazenamentos diferentes.
40
possvel armazenar arquivos nos seguintes tipos de localizaes:
Arquivos de cache no persistentes que no esto habilitados para uma grade, incluindo arquivos
temporrios de transformao Classificador.
Arquivos de destino individuais de diferentes parties ao executar uma mesclagem sequencial para
sesses particionadas.
Outros arquivos temporrios excludos no final da execuo de uma sesso. Em geral, para estabelecer
isso, configure $PmTempFileDir para um sistema de arquivo local.
Evite armazenar esses arquivos em um sistema de arquivos compartilhado, mesmo quando a largura de
banda alta.
Armazenando arquivos 41
Usando um sistema de arquivos compartilhado
Voc pode usar os seguintes sistemas de arquivos compartilhados para o compartilhamento de arquivo:
Sistemas de arquivo de rede, como CIFS (SMB) no Windows ou Network File System (NFS) no UNIX.
Embora os sistemas de arquivo de rede no tenham sido desenvolvidos para computao de alto
desempenho, eles podem funcionar bem para o acesso de arquivo sequencial.
Sistemas de arquivo clusterizados. Os sistemas de arquivo clusterizados oferecem um grupo de ns com
acesso de arquivo de alta largura de banda, assim como um namespace unificado para arquivos e
diretrios. O desempenho do sistema de arquivo clusterizado similar ao do sistema de arquivo local
anexado diretamente.
Nota: Se voc tiver a opo Alta disponibilidade, use um sistema de arquivo clusterizado.
A configurao e o ajuste adequados so importante para o desempenho de grade pequena. Voc tambm
pode configurar mapeamentos e sesses para evitar as limitaes intrnsecas dos sistemas de arquivos de
compartilhados.
Para evitar isso, use uma ou mais mquinas como servidores dedicados do sistema de arquivos
compartilhado para os ns da grade do PowerCenter. Cada mquina deve ter armazenamento, CPUs e
largura de banda de rede suficientes para as tarefas necessrias.
Como alternativa, possvel montar de forma cruzada o servidor do sistema de arquivos compartilhado para
distribuir a carga do servidor do arquivo entre os ns da grade. Quando os mapeamentos e as sesses do
PowerCenter so configurados para serem executados com um equilbrio do uso da CPU e de E/S, a
montagem cruzada dos servidores do sistema de arquivos compartilhado pode otimizar o desempenho. Se o
nmero de ns na grade pequeno e voc tem uma mistura equilibrada do usa da CPU e de E/S, pode no
ser necessrio um servidor dedicado do sistema de arquivos compartilhado.
Ao usar mais de um servidor dedicado ou montado de forma cruzada do sistema de arquivos compartilhado,
tente distribuir os arquivos compartilhados entre os servidores.
TPICOS RELACIONADOS:
Distribuindo arquivos pelos sistemas de arquivos na pgina 44
Use as seguintes diretrizes para configurar os arquivos de cache persistentes, como pesquisas dinmicas
persistentes, para uma grade com um sistema de arquivos compartilhado:
Quando possvel, configure o tamanho do cache da sesso para manter arquivos de cache persistentes
menores na memria.
Adicione uma transformao do Classificador ao mapeamento para classificar as linhas de entrada antes
da pesquisa persistente. Altero trabalho da pesquisa persistente para a transformao do Classificador
pode aprimorar o desempenho porque a transformao do Classificados pode usar o sistema de arquivo
local.
As linhas de grupo que requerem acesso mesma pgina do cache de pesquisa para minimizar o
nmero de vezes que o Servio de Integrao l cada pgina do cache.
Quando o tamanho dos dados de entrada grande, use as confirmaes baseadas na origem para
gerenciar os dados de entrada para que a classificao seja executada na memria.
Por exemplo, voc tem uma pesquisa dinmica persistente de 4 GB, que no pode ser reduzida sem a
alterao da lgica do mapeamento, e tem 10 GB de dados de origem. Primeiro, adicione uma
transformao do Classificador para classificar os dados de entrada e reduzir o acesso aleatrio ao
cache de pesquisa. Em seguida, execute as seguintes tarefas:
- Configure a sesso para executar confirmaes baseadas na origem com intervalos de confirmao de
1 GB.
- Defina o escopo da transao de transformao do Classificador como Transao.
Se mais de um sistema de arquivo estiver disponvel, configure os arquivos do cache de cada arquivo
para usar diferentes sistemas de arquivo.
Configure as sesses para distribuir os arquivos para sistemas de arquivo diferentes de mais de um
sistema de arquivo estiver disponvel.
Para obter largura de banda E/S ideal, escolha um sistema de arquivo que distribui arquivos entre diversos
dispositivos de armazenamento. Se voc usa um sistema de arquivo clusterizado, distribua os arquivos entre
os servidores. Se possvel, coloque os arquivos de origem, de destino e de cache em diferentes dispositivos
de armazenamento.
Arquivos de origem. Se voc colocar arquivos de origem em um sistema de arquivo que permite que o
Servio de Integrao leia os dados de um grande nmero de arquivos, ajuste a configurao de leitura
antecipada do sistema de arquivo antes de armazenar os arquivos grandes em cache.
Arquivos temporrios. Se voc colocar arquivos temporrios em um sistema de arquivo que permite
que o Servio de Integrao leia os dados de arquivos grandes e os grave em arquivos temporrios,
ajuste as configuraes de leitura e gravao dos arquivos grandes.
Arquivos de destino. Se voc colocar arquivos de destino em um sistema de arquivo que permite que o
Servio de Integrao grave arquivos grandes no disco, ajuste o sistema de arquivo para gravaes em
bloco grandes e simultneas. Os arquivos de destino podem incluir arquivos de mesclagem para sesses
particionadas. Como as sesses particionadas em uma grade precisam gravar arquivos no disco, ajuste o
sistema de arquivo para obter desempenho ideal de bloqueio.
Em vez de editar as sesses manualmente, use as variveis de sesso para distribuir arquivos em diferentes
diretrios. Isso permite que voc redirecione arquivos de sesso para diferentes servidores de arquivo
quando necessrio.
Nomeie as variveis para os diretrios e os nomes de arquivo de sesso pata refletir a lgica de
negcios.
No arquivo de parmetro, defina cada varivel para que a carga do arquivo seja distribuda igualmente
entre os sistemas de arquivo disponvel. Tambm possvel definir variveis especficas de n.
Para manter facilmente a flexibilidade e o controle das localizaes do arquivo de sesso, use um script
para substituir os espaos reservados no arquivo de parmetro.
Considere o tamanho estimado do arquivo e a capacidade do sistema de arquivo ao definir as
localizaes de arquivo.
Evite organizar os arquivos de acordo com a lgica de negcios se as sesses e os fluxos de trabalho
precisarem de acesso aos arquivos relacionados a negcios ao mesmo tempo. Por exemplo, se voc
armazenar arquivos Califrnia em um sistema de arquivo e arquivos Nova York em outro, um
afunilamento poder ocorrer se a sesso precisar de acesso a todos os arquivos ao mesmo tempo.
Quando possvel, coloque os arquivos para diferentes parties da mesma origem, destino ou pesquisa
em diferentes sistemas de arquivo.
Exemplos
No seguinte fragmento de um arquivo de parmetro bruto, o espao reservado {fs} representa o sistema do
arquivo onde o diretrio est localizado e deve ser atribudo por um script antes de ser usado:
[SessionFFSrc_FFTgt_CA]
$InputFile_driverInfo_CA={fs}/driverinfo_ca.dat
$SubDir_processed_CA={fs}
# Session has Output file directory set to:
# $PmTargetFileDir/$SubDir_processed_CA
# This file is the input of SessionFFSrc_DBTgt_CA.
$SubDir_RecordLkup_Cache_CA={fs}
# This session builds this persistent lookup cache to be used
# by SessionFFSrc_DBTgt_CA.
# The Lookup cache directory name in the session is set to:
# $PmCacheDir/$SubDir_RecordLkup_Cache_CA
[SessionFFSrc_FFTgt_NY]
$InputFile_driverInfo_NY={fs}/driverinfo_ny.dat
$SubDir_processed_NY={fs}
[SessionFFSrc_DBTgt_CA]
$SubDir_processed_CA={fs}
# session has Source file directory set to:
# $PmTargetFileDir/$SubDir_processed_CA
$SubDir_RecordLkup_Cache_CA={fs}
# Use the persistent lookup cache built in SessionFFSrc_FFTgt_CA.
No seguinte fragmento do arquivo de parmetro, um script substituiu o espao reservado com os nomes do
sistema de arquivo adequados, como file_system_1 e file_system_2:
[SessionFFSrc_FFTgt_CA]
$InputFile_driverInfo_CA=file_system_1/driverinfo_ca.dat
$SubDir_processed_CA=file_system_2
# Session has Output file directory set to:
# $PmTargetFileDir/$SubDir_processed_CA
# This file is the input of SessionFFSrc_DBTgt_CA.
$SubDir_RecordLkup_Cache_CA=file_system_1
# This session builds this persistent lookup cache to be used
# by SessionFFSrc_DBTgt_CA.
# The Lookup cache directory name in the session is set to:
# $PmCacheDir/$SubDir_RecordLkup_Cache_CA
[SessionFFSrc_FFTgt_NY]
$InputFile_driverInfo_NY=file_system_2/driverinfo_ny.dat
$SubDir_processed_NY=file_system_1
Por exemplo, voc tem 150.000 de dados e sete transformaes do Gerador de Sequncia. O nmero de
valores em cache 10. Os DTMs mestre e operador se comunicam 15.000 vezes. Se voc aumentar o
nmero de valores em cache para 15.000, o DTM mestre e operador se comunicam dez vezes.
Otimizando componentes do
PowerCenter
Este captulo inclui os seguintes tpicos:
Repositrio do PowerCenter
Servio de Integrao
Se voc executa o PowerCenter em diversas mquinas, execute o o Servio de Repositrio e o Servio de
Integrao em mquinas diferentes. Para carregar grandes quantidades de dados, execute o Servio de
Integrao na mquina de maior processamento. Alm disso, execute o Servio de Repositrio na mquina
que esteja hospedando o repositrio do PowerCenter.
Certifique-se de que o repositrio do PowerCenter est na mesma mquina que o processo do Servio de
Repositrio.
Ordene as condies em consultas de objeto.
Use um espao de tabela de n nico para o repositrio do PowerCenter se ele estiver instalado em um
banco de dados DB2.
Otimize o esquema do banco de dados do repositrio do PowerCenter se ele estiver instalado em um
banco de dados DB2 ou Microsoft SQL Server.
47
Localizao do repositrio e do processo do Servio de
Repositrio
Voc pode otimizar o desempenho do Servio de Repositrio configurado sem a opo de alta
disponibilidade. Para otimizar o desempenho, certifique-se de que o processo do Servio de Repositrio est
em execuo na mesmas mquina onde o banco de dados do repositrio reside.
Se voc no especificar o nome do espao de tabela ao criar, copiar ou restaurar um repositrio, o sistema
DB2 especificar o espao de tabela padro para cada tabela do repositrio. O sistema DB2 pode ou no
especificar um espao de tabela de n nico.
Voc pode otimizar o esquema do banco de dados ao criar contedos de repositrio ou fazer backup e
restaurar um repositrio existente. Para otimizar o esquema do banco de dados, o banco de dados do
repositrio deve atender aos seguintes requisitos de tamanho de pgina:
IBM DB2. Tamanho de pgina do banco de dados de 4 KB ou maior. Pelo menos um espao de tabela
temporrio com tamanho de pgina de 16 KB ou maior.
Microsoft SQL Server. Tamanho de pgina do banco de dados de 8 KB ou maior.
Para gerenciar o cache de objetos para o Servio de Repositrio, configure as seguintes propriedades:
Propriedade Descrio
Cache do Agente do Opcional. Habilita o cache do agente de repositrio, o que melhora o desempenho
Repositrio quando o Servio de Integrao executa vrias sesses repetidamente. Se voc
habilitar esta propriedade, o processo do Servio de Repositrio armazena os
metadados solicitados pelo Servio de Integrao e os metadados que descrevem
os objetos de repositrio. O padro Sim.
Capacidade do Cache do Opcional. Nmero de objetos que o cache pode conter quando o cache do agente
Agente do repositrio est habilitado. Voc pode aumentar o nmero de objetos se houver
memria disponvel na mquina que est executando o processo do Servio de
Repositrio. O padro 10.000.
Permitir Gravaes com o Opcional. Permite a utilizao de ferramentas do Cliente do PowerCenter para
Cache do Agente alterar os metadados no repositrio quando o cache do agente do repositrio est
habilitado. Ao habilitar a opo de gravaes, o Servio de Repositrio libera o
cache toda vez que voc salva metadados usando o Cliente do PowerCenter. Se
voc desabilitar a opo de gravaes, voc no pode salvar metadados ao
repositrio por meio do Cliente do PowerCenter e o cache no liberado. Quando
voc desabilita a opo de gravaes, o Servio de Integrao ainda poder gravar
a sesso e os metadados do fluxo de trabalho ao repositrio. O Servio de
Repositrio no libera o cache quando o Servio de Integrao grava metadados.
O padro Sim.
Propriedade Descrio
Limite sobre os Tempos Opcional. Perodo mximo de tempo que o servio mantm os recursos para fins de
de Resilincia resilincia. Esta propriedade pe uma restrio em clientes que conectam-se ao
servio. Quaisquer tempos de espera de resilincia que ultrapassam o limite so
cortados. Se o valor desta propriedade estiver em branco, o valor derivado das
configuraes do nvel de domnio. O padro em branco.
Tempo de Espera de Opcional. Perodo de tempo que o servio tenta estabelecer ou restabelecer uma
Resilincia conexo com outro servio. Se o valor desta propriedade estiver em branco, o valor
derivado das configuraes do nvel de domnio. O padro em branco.
Nota: Ao configurar o Servio de Integrao com alta disponibilidade, ele recupera os fluxos de trabalho e as
sesses que podem falhar devido a erros temporrio da mquina ou da rede. Para recuperar dados de uma
sesso ou fluxo de trabalho, o Servio de Integrao grava os estados de cada sesso e fluxo de trabalho
em arquivos temporrios em um diretrio compartilhado. Isso pode diminuir o desempenho.
Por exemplo, voc executa um fluxo de trabalho com 1.000 sesses. A primeira vez que voc executa um
fluxo de trabalho com a criao de cache habilitada, o Servio de Integrao busca os metadados da sesso
no repositrio. Durante as execues subjacentes do fluxo de trabalho, o Servio de Repositrio busca os
metadados da sesso no cache. Isso aprimora o desempenho do processo do DTM.
Otimizando o sistema
Este captulo inclui os seguintes tpicos:
O acesso lento ao disco em bancos de dados de origem e destino, sistemas de arquivos de origem e destino
e ns no domnio pode diminuir o desempenho da sesso. Permita que o administrador do sistema avalie os
discos rgidos nas mquinas.
Aps determinar qual das ferramentas de monitoramento do sistema apresenta um afunilamento de sistema,
execute as seguintes alteraes globais para aprimorar o desempenho de todas as sesses:
Aumente a velocidade da rede. Conexes lentas de rede podem diminuir o desempenho da sesso.
Permita que o administrador do sistema determine se a rede est sendo executada em uma velocidade
ideal. Diminua o nmero de saltos da rede entre o processo do Servio de Integrao e os bancos de
dados.
Use vrias CPUs. Voc pode usar diversas CPUs para executar vrias sesses e parties de pipeline
em paralelo.
Reduza a paginao. Quando um sistema operacional fica sem memria fsica, ele comea a fazer
paginao para o disco para obter memria fsica livre. Configure a memria fsica para a mquina do
processo do Servio de Integrao para minimizar a paginao para o disco.
Use a associao do processador. Em um ambiente de mltiplos processadores UNIX, o Servio de
Integrao pode usar uma grande quantidade de recursos do sistema. Use a associao do processador
para controlar a utilizao do processador pelo processo do Servio de Integrao. Alm disso, se os
bancos de dados de origem e de destino esto na mesma mquina, use a associao do processador
para limitar os recursos usados pelo banco de dados.
52
Aprimorando a velocidade da rede
O desempenho do Servio de Integrao est relacionado s conexes de rede. O disco local pode mover
dados de 5 a 20 vezes mais rpido que a rede. Considere as opes a seguir para minimizar a atividade da
rede e aprimorar o desempenho do Servio de Integrao.
Se voc usa arquivo simples como uma origem ou destino em uma sesso e o Servio de Integrao
executado em um nico n, armazene os arquivos na mesma mquina que o Servio de Integrao para
aprimorar o desempenho. Ao armazenar arquivos simples em uma mquina diferente do Servio de
Integrao, o desempenho da sesso se torna dependente do desempenho das conexes de rede. Mover os
arquivo para o sistema do processo do Servio de Integrao e adicionar espao ao disco pode aprimorar o
desempenho.
Se voc utiliza bancos de dados de origem e destino relacionais, tente minimizar o nmero de saltos de rede
entre os bancos de dados de origem e destino e o processo do Servio de Integrao. Mover o banco de
dados de destino para um sistema do servidor pode aprimorar o desempenho do Servio de Integrao.
Ao executar sesses que contm diversas parties, permita que o administrador da rede analise a rede e
certifique-se de que existe largura de banda suficiente para tratar a movimentao dos dados entre a rede
de todas as parties.
No entanto, as CPUs adicionais podem causar afunilamento no disco. Para evitar afunilamento no disco,
minimize o nmero de processos que acessam o disco. Os processos que acessam o disco incluem funes
do banco de dados e do sistema operacional. As sesses ou as parties de pipeline paralelas tambm
exigem acesso ao disco.
Reduzindo a paginao
A paginao ocorre quando o sistema operacional do processo do Servio de integrao fica sem memria
para uma operao em particular e usa o disco local para obter memria. Voc pode liberar mais memria
ou aumentar a memria fsica para reduzir a paginao e diminuir o desempenho que resulta em paginao.
Monitore a atividade de paginao usando as ferramentas do sistema.
Em um ambiente HP-UX, o administrador do sistema pode usar o utilitrio Process Resource Manager para
controlar o uso da CPU no sistema. O Process Resource Manager aloca o mnimo de recursos do sistema e
usa a capacidade mxima dos recursos. Para obter mais informaes, consulte o administrador do sistema e
a documentao do HP-UX.
Em um ambiente AIX, os administradores do sistema podem usar o Workload Manager no AIX 5L para
gerenciar recursos do sistema durante demandas mximas. O Workload Manager pode alocar recursos e
gerenciar a CPU, a memria e a largura de banda E/S do disco. Para obter mais informaes, consulte o
administrador do sistema e a documentao do AIX.
Voc pode usar o particionamento de pipeline para aprimorar o desempenho da sesso. Aumentar o nmero
de parties ou de pontos de partio aumentar o nmero de segmentos. Portanto, aumentar o nmero de
parties ou de pontos de partio tambm aumentar a carga nos ns do Servio de Integrao. Se o n ou
ns do Servio de Integrao contiverem uma largura de banda de CPU ampla, o processamento de linhas
de dados em uma sesso poder aumentar simultaneamente o desempenho da sesso.
Nota: Se voc usar um Servio de Integrao de um nico n e criar um grande nmero de parties ou
pontos de partio em uma sesso que processe grandes volumes de dados, o sistema poder ficar
sobrecarregado.
Se voc tiver a opo de particionamento, execute as seguintes tarefas para configurar manualmente as
parties:
Quando uma sesso usa um arquivo de origem, voc pode configur-la para ler a origem com um segmento
ou com diversos segmentos. Configure a sesso para ler origens de arquivos com vrios segmentos para
aumentar o desempenho da sesso. O Servio de Integrao cria vrias conexes simultneas com a
origem do arquivo.
55
Quando voc cria uma sesso, o Workflow Manager valida cada pipeline do particionamento de
mapeamento. Voc poder especificar vrias parties em um pipeline se o Servio de Integrao puder
manter consistncia de dados ao processar os dados particionados.
Adicione uma partio de cada vez. Para obter o melhor desempenho do monitor, adicione uma
partio de cada vez e anote as configuraes da sesso antes de adicionar as parties.
Defina a memria de buffer DTM. Quando voc aumenta o nmero de parties, o tamanho do buffer
DTM tambm aumenta. Se a sesso contiver n parties, aumente o tamanho do buffer DTM para pelo
menos n vezes o valor da sesso com uma partio.
Defina os valores armazenados em cache do Gerador de Sequncia. Se uma sesso contiver n
parties, pode no ser necessrio usar a propriedade Nmero de Valores em Cache para a
transformao de Gerador de Sequncia. Se voc voc definir esse valor como maior que 0, certifique-se
de que ele seja pelo menos n vezes o valor original da sesso com uma partio.
Particione os dados de origem uniformemente. Configure cada partio para extrair o mesmo nmero
de linhas.
Monitore o sistema ao executar a sesso. Se os ciclos de CPU estiverem disponveis, voc poder
adicionar uma partio para melhorar o desempenho. Por exemplo, voc pode disponibilizar ciclos de
CPU se o sistema estiver 20 por cento do tempo inativo.
Monitore o sistema depois de adicionar uma partio. Se a utilizao da CPU no for elevada, a
espera do tempo de E/S aumentar ou a taxa total de transformao de dados diminuir, ento
provavelmente h um afunilamento de hardware ou software. Se a espera do tempo de E/S aumentar em
um valor significativo, verifique a existncia de afunilamentos de hardware no sistema. Caso contrrio,
verifique a configurao do banco de dados.
TPICOS RELACIONADOS:
Memria de buffer na pgina 34
Voc pode usar vrias parties de pipeline e de banco de dados. Para melhorar o desempenho, verifique se
o nmero de parties de pipeline igual ao nmero de parties de banco de dados. Para melhorar o
desempenho das origens Oracle subparticionadas, verifique se o nmero de parties de pipeline igual ao
nmero de subparties de banco de dados.
Para melhorar o desempenho, especifique os tipos de partio nos seguintes pontos de partio no pipeline:
Se voc tiver uma plataforma de multiprocessamento simtrico (SMP), voc poder usar vrias CPUs para
processar simultaneamente dados de sesso ou dados de parties. Isso fornecer um melhor desempenho
devido ao real paralelismo atingido. Em uma plataforma com um nico processador, essas tarefas
compartilham a CPU, portanto, no h paralelismo.
O Servio de Integrao pode usar vrias CPUs para processar uma sesso que contenha vrias parties.
O nmero de CPUs usadas depende de fatores como o nmero de parties, o nmero de segmentos, o
nmero de CPUs disponveis e a quantidade ou os recursos necessrios para processar o mapeamento.
Execute as tarefas a seguir para otimizar o banco de dados de origem para particionamento,
Para agrupar dados, verifique se as linhas com o mesmo valor de chave esto roteadas para a mesma
partio. A melhor maneira de garantir que os dados estejam agrupados e distribudos uniformemente entre
as parties por meio da adio de um ponto de partio de chaves automticas hash ou de limite de
chaves antes da origem de classificao.
Verifique os parmetros de configurao que realizam o ajuste automtico. Por exemplo, a Oracle
tem um parmetro chamado parallel_automatic_tuning.
Verifique se o intraparalelismo est habilitado. Intraparalelismo a capacidade de executar vrios
segmentos em uma nica consulta. Por exemplo, na Oracle, consulte parallel_adaptive_multi_user. No
DB2, consulte intra_parallel.
Verifique o nmero mximo de processos paralelos disponveis para execues paralelas. Por
exemplo, na Oracle, consulte parallel_max_servers. No DB2, consulte max_agents.
Verifique os tamanhos dos vrios recursos usados no paralelismo. Por exemplo, a Oracle tem
parmetros como large_pool_size, shared_pool_size, hash_area_size, parallel_execution_message_size
e optimizer_percent_parallel. O DB2 tem parmetros de configurao como dft_fetch_size,
fcm_num_buffers e sort_heap.
Verifique os graus de paralelismo. possvel que voc consiga definir essa opo usando o parmetro
de configurao de um banco de dados ou uma opo na tabela ou consulta. Por exemplo, a Oracle tem
os parmetros parallel_threads_per_cpu e optimizer_percent_parallel. O DB2 tem parmetros de
configurao como dft_prefetch_size, dft_degree e max_query_degree.
Desative as opes que possam afetar a escalabilidade do banco de dados. Por exemplo, desabilite
os logs de arquivo morto e as estatsticas limitadas na Oracle.
Para obter uma lista completa das opes de ajuste de banco de dados, consulte a documentao do banco
de dados.
Para garantir que o banco de dados insira linhas em paralelo, verifique as seguintes opes de configurao
no banco de dados de destino:
Defina as opes no banco de dados para habilitar inseres paralelas. Por exemplo, defina as
opes db_writer_processes e DB2 has max_agents em um banco de dados Oracle para habilitar
inseres paralelas. Alguns bancos de dados podem habilitar essas opes por padro.
Considere particionar a tabela de destino. Se possvel, tente fazer com que cada partio grave em
uma partio de banco de dados nico usando uma transformao de Roteador para fazer isso. Alm
disso, disponha as parties de banco de dados em discos separados para impedir a conteno de E/S
entre as parties de pipeline.
Defina as opes no banco de dados para aprimorar a escalabilidade do banco de dados. Por
exemplo, desabilite os logs de arquivo morto e as estatsticas limitadas nos bancos de dados Oracle para
aprimorar a escalabilidade.
Contadores de desempenho
Este apndice inclui os seguintes tpicos:
Errorrows
Readfromcache e Writetocache
Readfromdisk e Writetodisk
Rowsinlookupcache
Contador Errorrows
Os erros de transformao afetam o desempenho da sesso. Se uma transformao tem um grande nmero
de linhas de erro em qualquer um dos contadores Transformation_errorrows, possvel eliminar os erros
para aprimorar o desempenho.
60
TPICOS RELACIONADOS:
Eliminando erros de transformao na pgina 32
Para analisar o acesso ao disco, calcule primeiro o ndice de ocorrncias ou perdas. O ndice de ocorrncias
indica o nmero de operaes de leitura ou gravao que Servio de Integrao executa no cache.
O ndice de perdas indica o nmero de operaes de leitura ou gravao que Servio de Integrao executa
no disco.
Para minimizar as leituras e as gravaes no disco, aumente o tamanho do cache. O ndice de ocorrncias
do cache ideal 1.
Se esses contadores exibirem qualquer nmero diferente de zero, ser possvel aumentar os tamanhos dos
caches para aprimorar o desempenho da sesso. O Servio de Integrao usa o cache de ndice para
armazenar informaes do grupo e o cache de dados para armazenar dados transformados, que so
normalmente maiores. Embora os tamanhos dos caches de dados e de ndice afetem o desempenho, poder
ser necessrio aumentar mais o tamanho do cache de dados do que o tamanho do cache de ndice. No
entanto, se o volume de dados processado maior do que a memria disponvel, voc pode aumentar o
tamanho do cache de ndice para aprimorar o desempenho.
Para otimizar o desempenho, aloque 100 MB para o cache de ndice e 200 MB para o cache de dados. O
Servio de Integrao acessa 100% dos dados do cache de ndice e 40% dos dados do cache de dados.
O Servio de Integrao sempre acessa o cache de ndice e no acessa o cache de dados 120 vezes.
Portanto, a porcentagem de dados que so acessados 70%.
Aloque 50 MB para o cache de ndice e 250 MB para o cache de dados. O Servio de Integrao acessa
50% dos dados do cache de ndice e 50% dos dados do cache de dados. O Servio de Integrao no
acessa os caches de ndice e de dados 100 vezes cada. Portanto, a porcentagem de dados que so
acessados 50%.
Se a sesso executa agregao incremental, o Servio de Integrao l os dados de agregao histricos
do disco local durante a sesso e grava no disco ao salvar os dados histricos. Como resultado, os
contadores Aggregator_readtodisk e Aggregator_writetodisk exibem nmeros alm de zero.
No entanto, desde que o Servio de Integrao grave os dados histricos em um arquivo no final da sesso,
voc ainda pode avaliar os contadores durante a sesso. Se os contadores exibem nmeros diferentes de
zero durante a execuo da sesso, possvel ajustar os tamanhos dos caches para aprimorar o
desempenho. No entanto, existe um custo associado a alocao e desalocao de memria. Por isso, se
voc souber qual o volume de dados que o Servio de Integrao processar, retenha o aumento dos
tamanhos dos cache para acomodar mais volumes de dados.
Contador Rowsinlookupcache
Pesquisas mltiplas podem diminuir o desempenho da sesso. Para aprimorar o desempenho da sesso,
ajuste as expresses de pesquisa para as tabelas de pesquisa maiores.
TPICOS RELACIONADOS:
Otimizando vrias pesquisas na pgina 28
A arquivos de cache
armazenamento ideal 41
afunilamentos arquivos de cache persistentes
destinos 4 armazenamento ideal 41
eliminando 2 diretrizes de configurao 43
estatsticas de segmento 3 arquivos de destino
identificando 2 armazenamento ideal 41
mapeamentos 6 arquivos de log
no UNIX 8 armazenamento ideal 41
no Windows 8 arquivos de log de fluxo de trabalho
origens 5 desabilitando 38
sesses 7 arquivos de log de sesso
sistema 7 desabilitando 38
agregao incremental arquivos de origem
otimizando transformao de Agregador 24 armazenamento ideal 41
agrupar por portas simples versus XML 18
otimizando transformao de Agregador 23 arquivos de parmetro
ajustando armazenamento ideal 41
caches 36 diretrizes de desempenho 45
expresses 20 arquivos simples
mapeamentos 17 arquivos de origem delimitados 18
origens relacionais 14 comparado com arquivos XML 18
rede 53 comprimento do buffer 17
Repositrio do PowerCenter 47 localizao de armazenamento ideal 53
Servio de Integrao 50 otimizando origens 17
sesses 33 arquivos simples delimitados
sistema 52 origens 18
Transformao de Agregador 23 arquivos temporrios
Transformao de Classificador 29 armazenamento ideal 41
Transformao de Gerador de Sequncia 29 associaes
Transformao de pesquisa 25 no banco de dados 25
Transformao de Qualificador de Fonte 31 associando
Transformao de SQL 31 processador 54
Transformao de unificador 25 avaliando
Transformao do Normalizador 29 expresses 22
Transformao personalizada 24
Transformao XML 31
transformaes 23
alta disponibilidade
B
sistemas de arquivo clusterizados 42 bancos de dados
armazenamento de arquivo ideal ajustando consultas de classificao nica 58
arquivos de cache no persistentes 41 ajustando destinos Oracle 12
arquivos de destino 41 ajustando origens 14
arquivos de log 41 associaes 25
arquivos de origem 41 intervalos de ponto de verificao 11
arquivos de parmetro 41 minimizando os deadlocks 12
arquivos temporrios 41 otimizando destinos para particionamento 59
armazenamento de arquivos otimizando origens para particionamento 57
local 40 tamanho do pacote de rede 12, 15
sistema de arquivos compartilhado 40 buffer DTM
tipos 40 tamanho ideal do pool 35
armazenando em buffer
dados 22
arquivo XML
comparado com arquivo simples 18
63
C desempenho ()
latncia de liberao 38
cache sesses em tempo real 38
ajustando 36 destinos
localizao ideal 36 afunilamentos, causas 4
metadados do repositrio 51 afunilamentos, eliminando 5
reduzir linhas armazenadas em cache 27 alocando memria de buffer 34
tamanho ideal 37 identificando afunilamentos 4
valores de sequncia 29 diretrio de cache
cache compartilhado compartilhando 36
para pesquisas 26 diretrios
cache de dados caches compartilhados 36
localizao ideal 36 disco
portas conectadas 36 acesso, minimizando 53
tamanho ideal 37 drivers de banco de dados
cache de ndice ideal para o Servio de Integrao 50
localizao ideal 36
tamanho ideal 37
cache no persistente
armazenamento ideal para arquivos 41
E
cache persistente email ps-sesso
para pesquisas 26 desempenho 39
carregador externo entrada classificada
desempenho 11 otimizando transformao de Agregador 24
carregamento em massa erros
ajustando destinos relacionais 11 minimizando o nvel de rastreamento 38
chamadas de funo espao de tabela
minimizando para transformao personalizada 24 tipo ideal para DB2 48
compartilhamento de arquivo espaos
sistemas de arquivo de cluster 42 direita/esquerda, removendo 20
sistemas de arquivo de rede 42 estatsticas de segmento
comprimento do buffer afunilamentos, eliminando 3
configurao ideal 17 afunilamentos, identificando 3
condio de pesquisa expresses
correspondncia 27 ajustando 20
otimizando 28 avaliando 22
consulta de banco de dados substituindo por variveis locais 20
afunilamentos de origem, identificando 6 expresses IIF
consultas ajustando 21
ajustando origens relacionais 14
consultas de objeto
ordenando condies 48
contadores de desempenho
F
Rowsinlookupcache 62 FastExport
tipos 60 para origens Teradata 15
Transformation_errorrows 60 fatoramento
Transformation_readfromcache 61 lgica comum de mapeamento 20
Transformation_readfromdisk 61 filtrando
Transformation_writetocache 61 dados 19
Transformation_writetodisk 61 dados de origem 31
convertendo filtros
tipos de dados 19 origens 15
CPU fluxo de dados
mltiplos para fluxos de trabalho simultneos 53 monitoramento 60
vrias para particionamento de pipeline 57 otimizando 60
fluxos de trabalho
simultneos 34
D funo DECODE
comparada funo Pesquisa 21
DB2 usando para otimizao 21
desempenho do repositrio do PowerCenter 48 funo LOOKUP
deadlocks comparada funo DECODE 21
minimizando 12 minimizando para otimizao 21
descartando funes
restries de ndices e chave 10 comparadas a operadores 21
desempenho DECODE versus LOOKUP 21
ajuste, viso geral 1 funes de agregao
esquema do banco de dados do repositrio, otimizando 48 minimizando chamadas 20
64 ndice
G O
grade Opo Substituio SQL de Pesquisa
afunilamento de n 42 reduzindo o tamanho do cache 27
desempenho 33, 40 operaes
desempenho do Gerador de Sequncia, aumentando 46 numricas versus de string 20
localizaes ideais de armazenamento 40 operaes de string
comparado com operaes numricas 20
minimizando 20
I operaes numricas
comparado com operaes de string 20
IBM DB2 operadores
esquema do banco de dados do repositrio, otimizando 48 comparados a funes 21
intervalo de confirmao Oracle
desempenho da sesso 37 ajustando destinos 12
intervalos de ponto de verificao carregador externo 11
aumentando 11 otimizando conexes 15
protocolo IPC 15
ORDER BY
M origens XML
alocando memria de buffer 34
mapeamento de passagem otimizao de empilhamento
ajustando 19 desempenho 34
mapeamento de teste de leitura
afunilamentos de origem, identificando 5
mapeamentos
afunilamentos, eliminando 7 P
afunilamentos, identificando 6 pacotes de rede
ajustando 17 aumentando 12, 15
leitura de passagem nica 18 paginao
lgica comum da fatoramento 20 reduzindo 53
mapeamento de passagem, ajuste 19 particionamento de pipeline
memria adicionando parties 55
64-bit PowerCenter 37 ajustando o banco de dados de origem 57
aumentando 53 otimizando bancos de dados de destino 59
bancos de dados Microsoft SQL Server 16 otimizando bancos de dados de origem 57
bancos de dados Sybase ASE 16 otimizando o desempenho 55
buffer 34 tipos de partio ideais 56
memria de buffer vrias CPUs 57
alocando 34 parties
mesclagem sequencial adicionando 55
armazenamento de arquivo ideal 41 pipelines
mtodos monitoramento de fluxo de dados 60
filtrando dados 19 portas
Microsoft SQL Server conectadas, limitando 36
banco de dados na memria 16 processador
esquema do banco de dados do repositrio, otimizando 48 associando 54
minimizando processo do Servio de Repositrio
chamadas de funo de agregao 20 localizao ideal 48
modo ASCII protocolo IPC
desempenho 50 origens Oracle 15
modo de movimentao de dados
ideal 50
R
N rastreamento de erros
Consulte nveis de rastreamento[error tracing
nveis de rastreamento aaa] 38
minimizando 38 rede
ajustando 53
ndice 65
rede () sistemas de arquivos compartilhados
aprimorando a velocidade 53 alta largura de banda 41
registro em log de arquivo simples baixa largura de banda 41
emails ps-sesso 39 carga do servidor, distribuindo 42
removendo configurando 42
espaos em branco esquerda/direita 20 CPU, balanceamento 42
Repositrio do PowerCenter viso geral 42
ajustando 47 Sybase ASE
desempenho no DB2 48 banco de dados na memria 16
localizao ideal 48 Sybase IQ
repositrios carregador externo 11
esquema do banco de dados, otimizando 48
restries de chave
descartando 10
T
tamanho da pgina
66 ndice
Transformao de pesquisa () transformaes ()
otimizando com instruo ORDER BY 27 eliminando erros 32
otimizando com mquina de memria alta 28 otimizando 60
otimizando com reduo de cache 27
otimizando vrias expresses de pesquisa 28
Transformao de procedimento externo
bloqueio de dados 22 U
Transformao de Qualificador de Fonte UNIX
ajustando 31 afunilamentos do sistema 8
Transformao de SQL afunilamentos, eliminando 9
ajustando 31 associao de processador 54
Transformao de unificador
ajustando 25
criando uma origem mestre 25
dados classificados 25 V
detalhes de desempenho 61 variveis locais
Transformao do Normalizador substituindo expresses 20
ajustando 29
Transformao personalizada
ajustando 24
minimizando chamadas de funo 24 W
processando blocos de dados 24 Windows
Transformao XML afunilamentos 8
ajustando 31 afunilamentos, eliminando 9
transformaes
ajustando 23
ndice 67