Sie sind auf Seite 1von 0

1

UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL


ESCOLA DE ENGENHARIA
PROGRAMA DE PS-GRADUAO EM ENGENHARIA DE PRODUO
OTIMIZAO DE PROCESSOS COM RESPOSTAS MLTIPLAS E
CATEGRICAS
Ccero de Melo Lucas
Porto Alegre
2007
2
UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL
ESCOLA DE ENGENHARIA
PROGRAMA DE PS-GRADUAO EM ENGENHARIA DE PRODUO
OTIMIZAO DE PROCESSOS COM RESPOSTAS MLTIPLAS E
CATEGRICAS
Ccero de Melo Lucas
Orientador: Prof. Dr. Flvio Sanson Fogliatto
Banca Examinadora:
Prof
a
Dr
a
Carla Schwengber ten Caten
Prof
a
Dr
a
Liane Werner
Prof
a
Dr
a
Morgana Pizzolato
Dissertao submetida ao Programa de Ps-Graduao em
Engenharia de Produo como requisito parcial obteno do ttulo de
MESTRE EM ENGENHARIA DE PRODUO
rea de concentrao: Sistemas de Qualidade
Porto Alegre
2007
3
Esta dissertao foi julgada adequada para a obteno do ttulo de Mestre em
Engenharia de Produo e aprovada em sua forma final pelo Orientador e pela Banca
Examinadora designada pelo Programa de Ps Graduao em Engenharia de Produo.
_________________________________
Prof. Flvio Sanson Fogliatto, Dr.
PPGEP / UFRGS
Orientador
_________________________________
Prof. Flvio Sanson Fogliatto, Dr.
Coordenador do PPGEP / UFRGS
Banca Examinadora:
Carla Schwengber ten Caten, Dr
a
Prof
a
Programa de Ps-Graduao em Engenharia de Produo e Transportes / UFRGS
Liane Werner, Dr
a
Prof
a
Programa de Ps-Graduao em Engenharia de Produo e Transportes / UFRGS
Morgana Pizzolato, Dr
a
Prof
a
Departamento de Engenharia de Produo e Transportes / UFRGS
4

DEDICATRIA
Dedico esta dissertao memria do meu
pai, Norberto Lucas Ferreira, um verdadeiro homem,
que sacrificou-se tarefa de educar os filhos com
base em profundos valores, malgrado as gigantescas
dificuldades que o destino lhe reservou em sua to
breve vida. Que Deus reconhea seu esforo em
podar a videira que hoje rende frutos.
Dedico-a tambm minha querida me,
Maria Terezinha de Melo Lucas, por seu amor
incondicional aos filhos e pela sua presena
confortante nos perodos de dificuldades e
provaes.
Homenageio ainda minha amada noiva,
Adriana Maschio, pelo apoio diuturno aos meus
sonhos e s minhas conquistas.
5
AGRADECIMENTOS
Obrigado a Deus pela criao das coisas do mundo, e a seu Filho que foi Cordeiro de
sacrifcio para a salvao dos homens. Em esprito, agradeo a Santo Toms de Aquino, cujas
obras me auxiliam no rduo amadurecimento segundo as virtudes fundamentais da prudncia,
da justia, da fortaleza e da temperana.
Agradeo aos pagadores de impostos brasileiros, pois foram obrigados a dedicar uma
parcela de seus trabalhos aos meus estudos nesta universidade. Mesmo ciente que se fosse
facultativo aos contribuintes talvez eu no recebesse tal benefcio, gostaria de registrar meu
respeito e agradecimento produo que lhes foi tomada. A universidade gratuita um mito,
porquanto muitos pagam e pouqussimos so beneficiados.
Agradeo, com grande estima, ao Prof. Flvio Sanson Fogliatto, Ph.D por todo seu
empenho na minha orientao para este difcil trabalho. Obrigado tambm s professoras que
compuseram minha banca de avaliao.
Gostaria de retribuir minha gratido a Cludio Roberto Xavier de Souza, tcnico em
informtica do DEPROT, por ter em inmeras oportunidades me auxiliado a resolver os
problemas que tive com os computadores do LOPP. E ainda, pelo auxlio estatstico, retribuo
meus agradecimentos ao colega ngelo Mrcio Oliveira SantAnna, M.Sc. Tenho ainda uma
imensa cota de gratido a Gustavo De Arriba, M.Sc. pela disposio em que se apresentou
para esclarecer detalhes de seu trabalho no PPGEP, pois foram fundamentais para a conduo
desta dissertao.
Aos amigos que formei ao longo destes dois anos no mestrado, deixo meu obrigado
pelas trocas de experincias.
6

Eu digo que um homem deve estar seguro de
sua moralidade pela simples razo de que ele
h de sofrer por causa dela.
G. K. Chesterton (1874-1936), escritor ingls.
7
RESUMO
A presente dissertao aborda a otimizao de processos industriais atravs da
utilizao de projeto de experimentos. Em experimentos planejados, variveis de respostas
so usualmente consideradas como normalmente distribudas. No entanto, em algumas
situaes, tal suposio violada; por exemplo, quando respostas expressam contagens,
podendo assumir somente valores inteiros e no-negativos. Nesses casos, mais provvel que
as respostas sigam uma distribuio de Poisson e, em sua modelagem, deve-se utilizar os
modelos lineares generalizados (MLG), adequados para respostas da chamada famlia
exponencial, qual pertence a distribuio de Poisson. Se ainda persiste a dvida quanto ao
comportamento das respostas, o modelo de quase-verossimilhana tambm uma alternativa
possvel. Esta dissertao apresenta a reanlise de um experimento, apresentado em Arriba
(2005), onde algumas respostas so categricas. Na anlise original do experimento, respostas
categricas foram modeladas atravs de regresso dos mnimos quadrados ordinrios,
desconsiderando a violao do pressuposto de normalidade das respostas. Na reanlise aqui
apresentada, as variveis so corretamente abordadas usando-se os modelos lineares
generalizados. Como o objetivo do trabalho de Arriba (2005) era a otimizao de um processo
descrito por mltiplas respostas, comparam-se os resultados da otimizao mediante as duas
estratgias de modelagem das respostas, alm de se propor um mtodo alternativo, mais
simplificado, de otimizao experimental.
Palavras-chave: otimizao de processos, modelos lineares generalizados, modelo de
quase-verossimilhana, regresso de Poisson, capacidade de processos.
8
ABSTRACT
This dissertation deals with the optimization of industrial processes using
Design of Experiments. In designed experiments, response variables are often considered as
normally distributed. However, in some situations, such assumption is violated; for example,
when responses express counts, and only non-negative integers numbers may come up as
outcomes. In these cases, it is likely that responses follow a Poisson distribution which is then
modeled by generalized linear models (GLM), since such distribution is a member of the
exponential family. If a question still holds on the responses behavior, their modeling through
the quasi-likelihood method is another option that should be considered. This dissertation
analyses an experiment performed by Arriba (2005), where some responses are of categorical
nature. In the original analysis presented by Arriba (2005), categorical responses were
modeled using ordinary least squares regression, violating the normality assumption
associated with that method. In the analysis presented here, variables are appropriately
modeled using GLM. Since the objective in Arriba (2005) was optimizing a multiresponse
process, results from the two optimization processes are compared. In addition, an alternative
experimental optimization method, simpler than the one in Arriba (2005), is also presented.
Key words: process optimization, generalized linear models, quasi-likelihood
models, Poisson regression, process capability.
9
Sumrio
CAPTULO 1............................................................................................................................10
1.1 Consideraes iniciais .................................................................................................10
1.2 Tema e Objetivos.........................................................................................................12
1.3 Justificativa do trabalho...............................................................................................13
1.4 Mtodo de trabalho......................................................................................................16
1.5 Limitaes do trabalho ................................................................................................17
1.6 Estrutura do trabalho ...................................................................................................18
CAPTULO 2............................................................................................................................20
2.1 Os modelos lineares generalizados..............................................................................21
2.2 O ndice de capacidade de processos ..........................................................................46
CAPTULO 3............................................................................................................................56
3.1 O projeto de experimento fatorial de Arriba (2005)....................................................56
3.2 Metodologia aplicada ..................................................................................................67
CAPTULO 4............................................................................................................................72
4.1 As regresses por modelos lineares generalizados e quase-verossimilhana .............72
4.2 A otimizao do experimento com resposta de Poisson .............................................78
4.2 A otimizao atravs de ndices de capacidade de processos .....................................83
4.3 Anlise dos resultados .................................................................................................86
CAPTULO 5............................................................................................................................88
5.2 Concluses...................................................................................................................88
5.2 Sugestes para trabalhos futuros .................................................................................90
REFERNCIAS BIBLIOGRFICAS......................................................................................91
OBRAS CONSULTADAS.......................................................................................................93
APNDICE A...........................................................................................................................94
APNDICE B...........................................................................................................................96
10
CAPTULO 1
1.1 CONSIDERAES INICIAIS
Experimentos, do ponto de vista da Engenharia da Qualidade, podem ser
formalmente definidos como uma srie de testes, nos quais mudanas propositais so
realizadas nas variveis de entrada, ou fatores, de um processo ou sistema. Estas alteraes
planejadas permitem identificar e controlar as influncias destes fatores sobre a varivel de
resposta do processo (MONTGOMERY, 2005).
A evoluo das tcnicas de experimentao tem sido amplamente aproveitada pelas
empresas. A razo que melhor justifica este interesse o fato que estas tcnicas, nascidas
dentro dos estudos da Probabilidade e da Estatstica, permitem no apenas avaliar se as
respostas resultantes dos processos so estveis ou no, mas tambm definir os fatores causais
que mais as influenciam. Alm disso, tcnicas de experimentao, tambm contribuem para
descobrir-se em quais nveis de regulagem destes fatores so alcanados os resultados
desejveis pela empresa. Os resultados de interesse, no mbito produtivo, freqentemente so:
menor refugo, maior rendimento, menor tempo de operao, menor quantidade de matria-
prima, maior aproveitamento dos recursos produtivos, reduo da variabilidade das respostas,
aproximao a uma certa medida de qualidade ou alvo etc. Naturalmente que num contexto de
livre mercado e iniciativa estes interesses so ampliados, pois implicam em uma maior
oportunidade de ganhos adicionais.
Se, num primeiro momento, a utilizao de experimentos estatisticamente planejados
visava encontrar apenas a melhor localizao da varivel de resposta desejada, ou seja, as
mdias (location effects ou efeitos de localizao), atualmente pode-se obter tambm a
minimizao da variabilidade da resposta, ou varincia (dispersion effects ou efeitos de
disperso). Uma vez criteriosamente selecionados os fatores e seus respectivos nveis dos
processos que conduzem s respostas prximas o bastante da mdia desejada e com baixa
varincia, resta ainda uma maior robustez, ou insensibilidade, da varivel de resposta aos
rudos aleatrios inerentes a qualquer processo. Esta seqncia de aes faz parte da espinha
dorsal da Engenharia da Qualidade, e todos eles localizao da mdia, minimizao da
varincia e robustez aos rudos so buscados simultaneamente nos experimentos planejados
(MONTGOMERY, 2001).
11
Os projetos de experimentos podem ser classificados de vrias formas. Quanto
caracterstica da varivel de resposta, eles podem ser de dois tipos: respostas contnuas ou
respostas discretas. As primeiras incluem medidas que admitem qualquer valor entre dois
valores quaisquer. Por exemplo, se em um experimento a varivel de resposta consumo de
combustvel em km/l, entre uma resposta de 13 km/l e outra de 12 km/l, pode-se obter
infinitas outras respostas, tais como 12,4 km/l, 12,8 km/l etc. A limitao est na acurcia e
resoluo do instrumento de medida. Quanto ao segundo tipo, as resposta discretas, s podem
ser admitidos certos valores especficos, e entre dois deles no h a possibilidade natural de
uma terceira medida. Se em um lote de cinqenta peas encontram-se peas boas e ruins, a
contagem de peas boas, por exemplo, poder ser qualquer valor inteiro entre zero e
cinqenta. Porm, esta contagem nunca ser 12,4 peas ruins entre 11 e 13 elementos, por
uma caracterstica natural e evidente da contagem.
Ambos os casos so muito comuns na vida prtica e assumem uma importncia ainda
maior no contexto empresarial em virtude da diversidade de situaes experimentais possveis
na otimizao de produtos e processos. No entanto, por razes que vo desde a complexidade
matemtica e a oferta de cursos preparatrios na tcnica, at ao conhecimento dos mtodos
estatsticos e disponibilidade de uso nos softwares especficos, o segundo tipo de resposta,
as discretas, so menos utilizadas e corretamente tratadas do que as contnuas. Embora, de
forma alguma, elas possam ser ditas menos importantes. Uma conseqncia desta situao
considerar-se respostas claramente discretas como contnuas, e dar a elas o tratamento
matemtico segundo esta considerao. Em alguns casos isto no conduz a erros muito
graves, mas h situaes onde esta aproximao inaceitvel, uma vez que induz a decises
gravemente equivocadas.
Os produtos raramente possuem uma nica caracterstica de qualidade. O mais
comum que essas caractersticas sejam diversas, algumas mais importantes que outras, na
proporo do valor que o cliente atribui a cada uma delas. Voltando ao exemplo do consumo
de combustvel, considere-se como sistema um automvel. O cliente deseja deste sistema,
alm do reduzido consumo de combustvel, alta acelerao, frenagem eficaz, estabilidade nas
curvas, baixo nvel de rudo etc. As tcnicas que permitem combinar da melhor forma
possvel todas estas caractersticas de qualidade so conhecidas como otimizao
multiresposta, ou seja, o sucesso est em obter-se o melhor arranjo das grandezas que so
exigidas e reconhecidas pelos clientes como valiosas e, assim considerar o produto como de
tima qualidade.
12
Uma decorrncia natural da tentativa de se encontrar a melhor combinao dos nveis
dos fatores que resultaro nas melhores respostas de cada caracterstica de qualidade o
conflito entre elas. No raro a melhoria de uma dessas caractersticas implica na piora de
outra. Disto decorre a necessidade de se atribuir pesos para cada resposta conforme sua
importncia no processo de otimizao, de forma que representem a maior qualidade total
do produto; ou melhor ainda, encontrar o arranjo que melhor satisfaa todas as exigncias do
cliente, com o mnimo detrimento de uma ou outra caracterstica.
Assim, por um lado h uma srie de respostas discretas cujo tratamento adequado
nos projetos de experimentos ainda insuficiente e incorretamente utilizado pelas empresas e
at no meio acadmico. Por outro lado, h os casos onde no apenas uma, mas vrias
respostas requerem uma combinao dos fatores em seus respectivos nveis de forma a
otimizar a qualidade percebida, sendo comum o conflito entre essas respostas. Assim, o
encontro desses dois aspectos vastamente comum no dia-a-dia de muitas atividades, e
portanto merecedores de ateno especial para quem deseja produzir bens com maior
eficincia, menor uso de recursos, menor custo e com as caractersticas que atendam s
preferncias dos clientes.
1.2 TEMA E OBJETIVOS
O tema principal desta dissertao a otimizao da qualidade quando esta
expressa por mltiplas caractersticas ou seja, processos multiresposta, e dentre elas, h a
presena de pelo menos uma varivel de resposta categrica, ou discreta. A necessidade deste
tipo de otimizao tpica no meio produtivo, embora nem sempre sejam utilizados os
recursos j desenvolvidos para solucionar problemas desta natureza especfica.
Agresti (2002) afirma que em virtude da presena de varivel de resposta categrica
faz-se necessria a abordagem pela teoria dos modelos lineares generalizados para gerar os
modelos de regresso linear, assim como sua respectiva tcnica de estimao dos parmetros
deste modelo, alm dos testes de hiptese para cada um destes parmetros que iro garantir o
quanto se pode confiar na regresso obtida.
So, portanto, objetivos principais desta dissertao:
13
a) otimizar um processo multiresposta quando pelo menos uma das variveis de
resposta categrica utilizando modelos lineares generalizados na modelagem
das respostas. Tomou-se como exemplo a otimizao do processo de curtimento
de couros executada em Arriba (2005);
b) Propor uma outra forma de otimizao diferente daquela realizada por Arriba
(2005). Este autor usou uma funo objetivo com pesos de ponderao de
importncia, que uma forma mais direta da otimizao hierrquica. Este
critrio ser comparado otimizao atravs da maximizao conjunta de
ndices de capacidade de processo calculados para as mltiplas respostas
proposto por Chan, Cheng e Spiring (1988).
Os objetivos secundrios derivados dos anteriores so:
a) apresentar uma introduo aos modelos lineares generalizados que permita
ampliar sua apropriada utilizao na otimizao de processos;
b) comparar os resultados de dois procedimentos de modelagem de dados com
vistas otimizao de um experimento;
c) comparar os resultados de duas estratgias de otimizao multiresposta aplicadas
a este experimento.
1.3 JUSTIFICATIVA DO TRABALHO
Arriba (2005) abordou, entre outros processos, a otimizao do processo de seleo
de couros no estgio wet-blue de curtimento. Neste trabalho os couros foram avaliados por
especialistas quanto sua qualidade, representada especialmente pela ausncia de marcas na
pele. Foi dada uma nota - ou seja, um nmero inteiro e positivo - para cada pea conforme sua
utilidade como produto final. As peles com melhor nota eram encaminhadas para a utilizao
em produtos de maior valor agregado. Este processo de seleo ocorre no estgio inicial, e
quando h erros ocorrem perdas financeiras considerveis, uma vez que somente quando
encerrado o processo e incorridos os gastos at a finalizao do curtimento possvel
identificar de fato a real classificao da pele.
Arriba (2005) considerou na modelagem dos dados que suas respostas atendiam aos
critrios aceitos pelo mtodo de regresso dos mnimos quadrados. No entanto, suas respostas
14
violavam os seguintes pressupostos implcitos para uso adequado deste mtodo, conforme
indicam Montgomery, Peck e Vining (2006, p.160):
a) os erros do modelo tm mdia zero, varincia constante e no so
correlacionados;
b) o modelo dos erros segue uma distribuio de probabilidade normal. Este
pressuposto feito para a conduo dos testes de hiptese e intervalos de
confiana do modelo, e tambm resulta que os erros so independentes entre si;
c) a forma do modelo, incluindo-se a a especificao das variveis regressoras,
est correta.
muito comum no projeto de experimentos o recurso de otimizao de uma equao
de regresso cuja resposta seja categrica com se esta fosse contnua e obedecendo a uma
distribuio normal. No caso de Arriba (2005) as duas primeiras enumeraes acima foram
violadas. Em muitas outras situaes, talvez na maioria delas, violar estes pressupostos
conduz a graves erros de anlise. Bisgaard e Fuller (1994) afirmam que os mtodos usados
para anlise de experimentos fatoriais quase sempre so baseados na aceitao dos
pressupostos indicados acima. Os autores acrescentam que, como as ferramentas padro de
anlise estatstica so muito poderosas, pode-se simplesmente ignorar estes pressupostos para
o caso das respostas do tipo contagem causando prejuzo s concluses.
Assim, nesta dissertao apropriadamente tratada a otimizao de respostas
categricas, particularmente do tipo contagem ou nmeros inteiros e positivos, nos modelos
de regresso. A teoria dos modelos lineares generalizados a abordagem adequada para este
tipo de anlise, portanto seu desenvolvimento ser detalhado de forma a prevenir o erro
comumente incorrido nos casos apresentados.
Alm do mais, por se tratar de um assunto que exige o conhecimento de teorias mais
avanadas em Matemtica e Estatstica, e tambm fora do contedo dos cursos de graduao
em Engenharia, faz-se necessrio um texto em linguagem mais prxima ao dia-a-dia do
engenheiro, considerando os processos industriais que solicitam a abordagem apropriada
pelos modelos lineares generalizados. A este problema, acrescenta-se ainda a falta de um
nico livro texto em portugus sobre o assunto e que tenha ampla distribuio, tal qual
quando se trata da regresso linear pelo mtodo dos mnimos quadrados, estando ainda o tema
15
dos modelos lineares generalizados restrito a teses, dissertaes e artigos cientficos na lngua
brasileira. No entanto, a partir do aumento de publicaes desta natureza, contribui-se para
chamar a ateno para o assunto a ponto de justificar a edio de um livro texto que trate dos
modelos lineares generalizados, ou pelo menos uma boa traduo dos livros j consagrados
em outros idiomas.
importante ainda que se alerte as empresas dos equvocos do uso indiscriminado da
regresso linear cujos parmetros so estimados pelo mtodo dos mnimos quadrados quando
as respostas so categricas. Melhor orientados, os profissionais da rea de qualidade que se
depararem com este tipo particular de problema tero mais sucesso na otimizao de seus
processos crticos, ou seja, aqueles que mais impactam no resultado da empresa.
Arriba (2005) gerou uma quantidade grande de dados confiveis, pois antes da sua
coleta foram desenvolvidos at mesmo estudos de Reprodutibilidade e Repetitividade (R&R),
cujos resultados foram depurados em vrias etapas at chegar-se queles efetivamente usados
na pesquisa. Assim, seus experimentos so muito valiosos. A otimizao das vrias respostas
atendeu ao critrio de pesos dados a cada uma delas de forma a conferir sua relevncia para o
resultado final da funo objetivo. Como j dito acima, ser realizada neste trabalho a mesma
otimizao, no entanto usando o modelo apropriado de regresso. No entanto, uma outra
forma de otimizao tambm ser usada atravs dos ndices de capacidade de processo destas
respostas.
Os ndices de capacidade de processo so adimensionais e indicam o nvel da
qualidade de um processo: quanto maior o ndice maior a qualidade do atributo medido. O
ndice de capacidade mltiplo mede a combinao de vrias respostas, cada uma com seu
respectivo ndice de capacidade. Assim, nesta dissertao tambm ser avaliado o ndice de
capacidade mltiplo das respostas dos experimentos conduzidos por Arriba (2005), ou seja, a
combinao conjunta de cada ndice de capacidade de processo respectivo a cada
caracterstica de qualidade medida. Desta forma, pode-se comparar este mtodo e aquele
anteriormente usado.
Resumidamente, esta dissertao justifica-se por: contribuir com a divulgao da
teoria dos modelos lineares generalizados para a regresso de respostas categricas, analisar o
experimento apresentado em Arriba (2005) utilizando uma tcnica apropriada para
modelagem das variveis de resposta categricas nele presente, otimizar as mltiplas
16
respostas daquela dissertao segundo o mesmo mtodo proposto pelo autor, otimizar as
mesmas respostas usando o mtodo da capacidade de processos mltipla, e, por fim, comparar
ambos os mtodos de otimizao multiresposta.
1.4 MTODO DE TRABALHO
Nesta dissertao duas formas de otimizao sero aplicadas e seus resultados
discutidos. A primeira delas ser maximizar o valor de uma funo objetivo como valores de
ponderao para cada uma das respostas da caracterstica de qualidade de interesse. Esta foi a
tcnica utilizada por Arriba (2005). A outra forma ser pela maximizao dos ndices de
capacidade de processo de cada uma das respostas, que dentro do mtodo sero agregadas
multiplamente em seguida compondo um ndice mltiplo de capacidade de processo, segundo
os mesmos pesos de ponderao da funo objetivo. Chan, Cheng e Spiring (1988)
introduziram uma nova medida de capacidade de processo, que ser utilizado neste caso. Este
ndice leva tanto em considerao a proximidade de uma medida ao seu alvo, quanto a
variabilidade do processo.
Para encontrar-se o arranjo timo que maximiza tanto a funo objetivo quanto os
mltiplos ndices de capacidade ser usado o algoritmo do gradiente generalizado reduzido
discutido em Castillo e Montgomery (1993), e de uso corrente nas planilhas eletrnicas mais
comerciais, tais como a funo Solver do Excel .
A estimao dos parmetros das respostas dos experimentos, por serem categricas
em pelo menos um caso, ser feita pela teoria dos modelos lineares generalizados que solicita,
por sua vez, o mtodo da mxima verossimilhana. Este mtodo o mais indicado por ser
amplo o suficiente para a estimao de vrios tipos de respostas, em especial aquelas cujas
funes de distribuio de probabilidade pertencem famlia exponencial (NELDER e
WEDDERBURN, 1972; McCULLAGH e NELDER, 1990). Desenvolvido o problema desta
forma, sero corrigidas as violaes de pressupostos da regresso linear incorrida por Arriba
(2005).
De forma a classificar de forma ampla o tipo desta pesquisa conforme seus objetivos,
pode-se afirmar, com base em Gil (2002), que esta uma pesquisa exploratria, uma vez que
17
visa proporcionar maior familiaridade com o problema com vistas a torn-lo mais explcito,
alm de analisar exemplos que estimulam a compreenso do problema com uma proposta de
soluo.
Diante destas consideraes acima, esta , portanto, uma pesquisa aplicada, visto que
seu objetivo a aplicao de conhecimentos especficos e bem delimitados sendo seu uso j
comprovadamente eficaz, alm de, segundo Roesch (2005), incluir a preocupao terica que
fundamenta a soluo dentro de seus pressupostos. Para tanto, ser necessria uma reviso da
literatura que aborde: (i) a introduo e conceituao dos ndices de capacidade de processos;
(ii) a teoria dos modelos lineares generalizados e seu respectivo mtodo de estimao de
parmetros e (iii) apresentao de tcnicas de amplo uso de otimizao multiresposta.
A necessidade de uma forte nfase em mtodos estatsticos e matemticos, processo
industriais sujeitos a otimizao e experimentos planejados para se alcanar os objetivos
esperados, faz com este trabalho tambm seja uma pesquisa quantitativa. De certa forma,
devido s respostas dos experimentos serem, em ltima instncia, opinies dos tcnicos
respeito da qualidade do couro, esta seria tambm uma pesquisa qualitativa, no entanto, no
sero feitas maiores consideraes sobre este tipo de pesquisa que est restrita ao
desenvolvimento de Arriba (2005). Nesta forma de classificao este trabalho , portanto,
estritamente quantitativo.
1.5 LIMITAES DO TRABALHO
Nesta dissertao ser tratada a otimizao de experimentos quando a resposta
categrica, e tambm quando h a necessidade de se encontrar o melhor arranjo entre
mltiplas respostas de interesse para a produo. Embora o escopo da reviso bibliogrfica
abranja as categorias de respostas dicotmicas, quando apenas duas respostas so possveis -
por exemplo, aprovado e rejeitado, conforme e no-conforme - estes casos no sero tratados
na soluo prtica. Ou seja, no caso aplicado as respostas sero sempre valores inteiros e
positivos, uma caracterstica inerente distribuio de Poisson.
As respostas podem ainda ser categricas, mas mltiplas, podendo ser ordinais
quando entre as vrias respostas possveis h uma implicao de graduao entre elas (por
18
exemplo um, dois ou trs defeitos por pea produzida). H ainda um terceiro tipo de respostas
categricas, ditas nominais, onde a graduao implcita no existe: por exemplo quando
ocorrem defeitos de naturezas diferentes em uma mesma pea, tais como risco, bolha ou
descolorao numa pintura. Unicamente o caso ordinal ser objeto de estudo neste trabalho;
portanto, fica fora do interesse de investigao os casos de respostas categricas nominais.
No ser tratado o caso da regresso linear clssica pelo mtodo dos mnimos
quadrados, pois o mtodo da mxima verossimilhana para definio dos parmetros da
regresso linear j engloba esta situao particular, assim como as respostas de natureza
contnua, alm do que h vasta e boa literatura tratando do assunto, mesmo em Portugus.
So feitas as otimizaes de duas formas. A primeira reproduz aquela usada por
Arriba (2005), de forma a permitir a comparao com seus resultados. A segunda lana mo
do ndice mltiplo de capacidade de processos de forma a estabelecer concluses de utilidade
e convenincia com a anterior. Ambos os casos usaro o algoritmo do gradiente generalizado
reduzido para encontrar-se o mximo da funo objetivo. Existem na literatura vrios outros
mtodos de otimizao, nenhum desses ser tratado neste trabalho, uma vez que o algoritmo
selecionado j conduz a resultados satisfatrios no mbito do problema tratado. Esses outros
mtodos de otimizao, para citar dois, so a metodologia da superfcie de resposta (RSM)
tratado em Montgomery (2005) e a funo de perda quadrtica multivariada abordada em
Elsayed e Ribeiro(1995).
Arriba (2005) otimizou quatro artigos diferentes em couro: (i) nubuck chocolate, (ii)
naplex preto; (iii) diamond preto e (iv) nubuck bege. Nesta dissertao ser otimizado apenas
seu experimento para o artigo nubuck chocolate.
1.6 ESTRUTURA DO TRABALHO
Esta dissertao composta por cinco captulos. No primeiro captulo apresentada
uma introduo ao problema que este trabalho vai tratar e buscar uma soluo. So discutidos
tambm seus temas e objetivos principais e secundrios de forma a esclarecer o alcance de sua
proposta que tambm justificada. Para tanto, apresentado sucintamente um mtodo de
19
trabalho que julga-se conseguir chegar aonde se prope para solucionar o problema
encontrado, limitando-se aos assuntos necessrios e suficientes para tal.
No segundo captulo apresentado o referencial terico que sustenta o problema
prtico apresentado. Para tanto so tratados, nesta ordem:
a) os modelos lineares generalizados: sua estrutura formal, a abrangncia da famlia
exponencial, a regresso linear pelo mtodo da mxima verossimilhana e um
mtodo para estabelecer a confiabilidade nos parmetros da regresso Alm da
regresso de quase-verossimilhana;
b) o ndice de capacidade de processos: sero discutidos os principais ndices de
capacidade de processos e, em particular, o ndice de capacidade de processos
mltiplos de forma a poder lidar com processos que possuem mais de uma
caracterstica de qualidade de interesse.
No terceiro captulo revisto o experimento conduzido por Arriba (2005) de forma a
detalhar o encaminhamento dado pelo autor para sua otimizao. Como dito anteriormente, as
respostas deste experimento foram tratadas como obedecendo uma distribuio de
probabilidade normal, no entanto por serem categricas elas no se ajustam a este
pressuposto. Ainda neste captulo tambm so detalhados os procedimentos segundo a
metodologia de otimizao proposta deste texto.
No quarto captulo, as mesmas respostas encontradas por Arriba (2005) so desta vez
modeladas a partir dos modelos lineares generalizados. O modelo de otimizao hierrquica
utilizado por este autor novamente aplicado e uma nova estratgia de otimizao, desta vez
pelo ndice mltiplo de capacidade de processo, tambm conduzida e seus resultados
apresentados.
No quinto captulo, por fim, os resultados encontrados so discutidos, em especial,
de uma forma que ressalte as diferenas entre os obtidos entre este trabalho, aplicando o
mtodo proposto, e aqueles apresentados por Arriba (2005). Em ambos os casos haver a
preocupao em destacar as limitaes de cada soluo, esclarecendo onde os recursos
tericos utilizados so inapropriados e tambm onde mais eles podem ser aplicados.
Encerrando este captulo, para efeito de contribuio com o progresso do assunto no meio
acadmico e industrial, so dadas sugestes de trabalhos futuros.
20
Captulo 2
Neste captulo so tratados dois assuntos distintos. O primeiro sobre os modelos
lineares generalizados. So apresentadas a modelagem das mdias dentro deste mtodo e as
tcnicas de aferio da confiana que se pode depositar no modelo gerado. Esta seo adianta-
se ainda um pouco mais alm ao tratar dos modelos de quase-verossimilhana onde a
suposio da distribuio de probabilidades das respostas no necessria.
A segunda parte deste captulo trata dos ndices de capacidade de processos desde
sua concepo inicial at seu uso para avaliao de mltiplas caractersticas de qualidade.
tambm desenvolvido o modelo que permite a substituio dos valores que calculam a
capacidade de processos por modelos de regresso. Este procedimento permitir a otimizao
do processo estudado sob a ptica dos modelos lineares generalizados no captulo 4.
Ser usada a notao mais comumente adotada pela literatura e textualmente
assumida por Dobson (1990). As variveis aleatrias so anotadas em letras itlicas
maisculas e seus respectivos valores observados pelas mesmas, porm, minsculas; por
exemplo as observaes
N
y y y ,..., ,
2 1
so consideradas como resultantes das variveis aleatrias
N
Y Y Y ,... ,
2 1
. As letras gregas designam os parmetros, sendo que o smbolo ^ (chapu)
adicionado sobre ele representa um estimador do parmetro. Se

o parmetro de uma
regresso, sua estimativa ser, portanto,

. Exceo a esta regra ser feita ao uso da letra


grega

para designar o termo de erro. A notao para vetores e matrizes em negrito, por
exemplo, o vetor das observaes y , a representao de:
N
y
y
y
2
1
A transposio de matrizes ser indicada pela sobrescrito T. Aproveitando o exemplo
anterior:
T
n
y y y
2 1
y
21
As derivadas podem ser designadas tanto pelo operador d(funo)/d(varivel),
quanto pelo smbolo linha sobrescrito () quando expressamente indicado. A funo de
densidade de probabilidade denominada por f(y; ), onde

representa os parmetros da
distribuio. E finalmente, a barra acima da letra, grega ou no, indica tratar-se de uma mdia,
por exemplo: y .
2.1 OS MODELOS LINEARES GENERALIZADOS
Uma classe de modelos lineares generalizados (MLG) foram propostos por Nelder e
Wedderburn (1972). A apresentao de certas equaes de distribuio de probabilidade
assume genericamente o formato cannico por formato cannico aqui entende-se o arranjo
dos componentes de uma equao com propsito de demonstrao e facilidade de
entendimento, porm sem alterar sua estrutura e, desta maneira, permite generalizar o
procedimento de estimao de parmetros baseado no mtodo da mxima verossimilhana:
) , (
) (
) (
exp ) , , ( y c
a
b y
y f (2.1)
Na equao (2.1) Fahrmeir e Tutz (1994) definem seus termos. Onde y a imagem
da distribuio de probabilidade da famlia exponencial. O termo imagem aqui denotado no
contexto da linguagem matemtica para funes. O parmetro

representa a localizao no
eixo das abscissas da curva de distribuio, tambm o chamado parmetro natural. E o
parmetro designa a variabilidade da distribuio, ou seja, este termo definir se a curva ter
um formato mais alargado ou mais estreito em relao ao parmetro de localizao. A
funo b( ), descrever o comportamento da localizao, da mesma forma que a funo a( )
o faz com a variabilidade. comum encontrar na literatura apenas o termo sem o indicador
de funo. O termo c(y,

uma funo especfica que depender do tipo de membro da
famlia exponencial com que se estar lidando.
As equaes de distribuio de probabilidade passveis de apresentao neste
formato configuram a chamada famlia exponencial, pois seus elementos esto elevados
base e ou exp (funo). O modelo tambm dito cannico porque primariamente o
termo y que multiplica , era uma funo a(y) sujeita igualdade a(y)=y (DOBSON, 1990).
22
Neste grupo especial h componentes tanto de distribuies de probabilidade cujas respostas
so contnuas quanto discretas. Myers, Montgomery e Vining (2002) citam as distribuies
normal, binomial, Poisson, geomtrica, binomial negativa, exponencial, gama e normal
inversa como pertencentes a esta famlia exponencial. Os mesmos autores ainda afirmam que
a estruturao destas distribuies no formato apresentado unifica os modelos de regresso
lineares com os no-lineares. Assim, qualquer processo cuja varivel de resposta seja
distribuda segundo uma das equaes da famlia exponencial poder ser modelada dentro da
teoria dos modelos lineares generalizados, quer seja linear ou no-linear em outro mtodo de
estimao de parmetros que definem a funo de distribuio.
A equao (2.1) genrica e representa a famlia exponencial. Ela composta pelas
funes especficas a( b( )

c(y,

O parmetro

est representando a localizao, ou
seja, representa a regio da curva de distribuio onde h maiores chances de se encontrar um
valor aleatrio, portanto, a mdia ou esperana. O parmetro

representa a disperso ou em
que medida os valores se afastam ou se aproximam do parmetro de localizao, sendo
conhecido por varincia (VIEIRA, 2004). Com ambos os parmetros bem definidos pode-se
compreender o comportamento da resposta de um processo.
A equao de distribuio normal, por exemplo, fornece respostas contnuas e
definida em sua apresentao mais conhecida como:
2
2
2
2
exp
2
1
) , , (
y
y f (2.2)
Escrita de maneira a adequar-se ao formato da equao (2.1), aplicando unicamente a
propriedade logartmica geral ) ln( exp ) exp( a b b a

e organizando os expoentes,
parcelas e quocientes, canonicamente, obtm-se:
2
2
2
2
2
2
) 2 ln(
2
1
2
exp ) , , (
y
y
y f (2.3)
As equaes (2.2) e (2.3) so idnticas nas suas respostas, apenas operaes
algbricas foram implementadas com o intuito de se obter o formato indicado por (2.1).
Assim, torna-se imediato identificar que:
23
b(
2
2
; a(
2
e c(y, ) =
2
2
2
2
) 2 ln(
2
1 y

Como a curva normal a mais comum e usada das curvas de distribuio, percebe-se
pela identificao das funes especficas a( b( )

c(y, aplicadas neste caso que o
parmetro de localizao

justamente a mdia , ao passo que o parmetro

de disperso
propriamente
2
, a varincia. O formato de apresentao da equao (2.1) fornece de
imediato a mdia e a varincia de uma distribuio, sendo esta sua primeira grande utilidade.
De fato, partindo dos conceitos de mdia e varincia, confirma-se em Vieira (2004):
2
2
2
) (
) (
) var(
;
) (
) (
a
d
b d
y
d
db
y E
Onde por definio e tambm por se tratar de uma varivel contnua, uma funo de
distribuio de probabilidades qualquer ) (x f , conforme Duncan (1974):
dx x f x
dx x xf
) ( ) (
) (
2 2

Nesta dissertao as respostas sujeitas s distribuies binomial e de Poisson sero
amplamente utilizadas, a fundamental diferena entre elas e a distribuio normal que suas
respostas no so contnuas, so discretas ou categricas. A mais notvel semelhana que
todas as trs so pertencentes famlia exponencial e podem, quando algebricamente
trabalhadas, assumir o formato da equao (2.1).
A distribuio binomial, segundo Kelton e Law (1991), til para as situaes onde
ocorre um processo de Bernoulli, ou seja, entre duas nicas e mutuamente exclusivas
respostas possveis independentes entre si, tais como sucesso ou fracasso, faz-se a
contagem delas dentro de numa amostra de tamanho n. definida como:
y n y
y
n
y f ) 1 ( ) ; ( (2.4)
24
Distribuindo os termos da equao (2.4) convenientemente chega-se ao seu formato
exponencial (VIEIRA, 2004):
y
n
n y y f ln 1 ln
1
ln exp ) , ( (2.5)
Da mesma forma como foi analisado o formato exponencial da distribuio normal,
sero identificados os componentes de localizao e disperso para a distribuio binomial:

=
1
ln ; b( n ln(1- ); a( ; = 1 e c(y, ) =
y
n
ln
Encontrando-se a respectiva mdia e varincia:
1 ) (
) (
) var(
;
) (
) (
2
2
a
d
db
y
d
db
y E
Onde por definio e tambm por se tratar de uma varivel discreta, uma funo de
distribuio de probabilidades qualquer ) (
i
x p , segundo Montgomery (2001):
1
2 2
1
) ( ) (
) (
i
i i
i
i i
x p x
x p x

O mesmo procedimento utilizado para a distribuio de Poisson apresentado na
forma mais comum de se encontrar, exposto em Kelton e Law (1991), e j ajustado ao
formato de apresentao exponencial em Vieira (2004):
) ! ln( ) ln( exp
!
) , ( y y
y
e
y f
y
(2.6)
Identificando-se as equaes especficas, encontra-se:

= ln( ); b( - ; a( = 1; c(y, ) = -ln(y!)
Conforme as definies de mdia e varincia:
25
) (
) (
) var(
;
) (
) (
2
2
a
d
db
y
d
db
y E
Kelton e Law (1991) ainda apresentam que a distribuio de Poisson possui como
caracterstica fundamental ser composta exclusivamente por nmero inteiros e no-negativos.
Esta caracterstica ser fundamental para a otimizao a ser levada adiante neste trabalho.
Assim, conforme Myers et al. apud Elsayed e Ribeiro (1995) que recomendam os
modelos lineares generalizados para modelagem da varincia, uma vez escolhida a funo de
probabilidade, que no caso deste texto so as distribuies binomial de Poisson, o formato
exponencial automaticamente fornece a funo de varincia V(

que a poro da varincia
da resposta y que depende da mdia e o parmetro de disperso

que no depende da mdia e
constante para os membros da famlia exponencial VIEIRA (2004).
O texto de Vieira (2004) usado extensivamente para: (i) a estruturao dos modelos
lineares generalizados, (ii) o mtodo matemtico para estimao dos parmetros de
modelagem e (iii) os testes de hipteses de confiabilidade destes mesmos parmetros. Com
suporte dos respectivos apoios usados por ele que so Dobson (1990) e Myers, Montgomery e
Vining (2002).
Assume-se um experimento com k variveis independentes e n respostas y, conforme
apresentado na tabela (2.1):
Tabela (2.1)
Estrutura para modelos lineares generalizados
1
x
2
x

k
x
y

11
x
12
x

k
x
1 1
y
21
x
22
x

k
x
2 2
y

1 n
x
2 n
x

nk
x
n
y
Fonte: Vieira (2004).
Definindo os termos da tabela (2.1):
As variveis de resposta de cada rodada do experimento
n
y y y , , ,
2 1

tero como
mdias
n
, , ,
2 1
.
26
A distribuio de probabilidade de
i
y pertence genericamente a um dos membros da
famlia exponencial conforme Myers, Montgomery e Vining (2002).
As variveis de regresso ou variveis independentes do modelo sero determinadas
pelos valores possveis assumidos por
k
x x x , , ,
2 1
. Note-se que
k
x x x , , ,
2 1

podem ser
contnuas ou discretas.
O modelo assume o formato de um preditor linear do tipo:
k k
x x x
2 2 1 1 0
(2.7)
H a necessidade de ser unir o preditor linear da equao (2.7) mdia das respostas
n
y y y , , ,
2 1
, de forma a model-la. Assim, define-se a funo de ligao (link function)
) (
i
g . Este procedimento exatamente aquele que unifica os modelos lineares dos no-
lineares. Vieira (2004) ainda acrescenta que a funo de ligao define a forma como os
efeitos sistemticos de
k
x x x , , ,
2 1
so transferidos mdia.
) ( ) (
2 2 1 1 0 ik k i i i i
x x x g (2.8)
Observe-se que cada termo da equao (2.8) representa uma linha na tabela (2.1). O
que significa que para cada resposta haver um preditor linear, ou seja, haver n preditores
lineares. E ainda que, no caso particular da regresso linear clssica, a funo de ligao a
prpria mdia.
i i i
g ) (
Calculando a funo inversa da funo de ligao obtm-se a mdia:
) ( ) (
2 2 1 1 0
1 1
ik k i i i i
x x x g g (2.9)
Conforme j expresso pela equao (2.1), o parmetro representa a localizao
onde h maior probabilidade de se encontrar certo valor, ou seja, a mdia, e segundo Vieira
(2004), a funo de ligao denominada cannica quando
i i
.
Myers, Montgomery e Vining (2002) esclarecem que o uso da funo de ligao na
forma cannica contribui muito com a simplificao do mtodo de estimao dos parmetros,
27
alm do clculo dos testes de hiptese ou intervalos de confiana para estes parmetros. No
entanto, alertam para o mais fundamental: esta convenincia no implica necessariamente em
qualidade de ajuste do modelo.
Vieira (2004) apresenta a tabela (2.2) onde se encontram as ligaes cannicas
resumidamente para as funes de distribuio de probabilidade j apresentadas acima.
Tabela (2.2)
Ligaes Cannicas para os modelos lineares generalizados
Distribuio Ligao Cannica
Normal

Binomial
1
ln
Poisson
) ln(

Fonte: adaptado de Vieira (2004).
Vale ressaltar que a funo de ligao transforma a mdia das respostas
i
y e no as
respostas em si, isto ser til para a modelagem das prprias mdias, obviamente. A partir
deste desenvolvimento, a estruturao dos modelos lineares generalizados fica completa para
a estimao dos parmetros
i
. importante ainda ressalvar que caso se necessite de uma
alternativa funo de ligao - quando o resultado do modelo for insatisfatrio - pode-se
lanar mo, similarmente transformao da resposta, definir uma famlia de funes de
ligao de potncia do tipo:
0 , ln
0 ,

Nelder e Wedderburn (1972) apresentaram em sua proposio dos modelos lineares
generalizados um mtodo de estimao de parmetros via maximizao da funo log-
verossimilhana, em sua apresentao matricial, alerta-se que tanto y quanto

so vetores
como ser notado adiante:
) ; ; ( ln y l L (2.10)
Cox e Hinkley (1974) apud Dobson (1990) afirmam que a famlia de distribuies
exponenciais possuem suficientemente a propriedade de continuidade para garantir um
mximo global da funo log-verossimilhana aps deriv-la e igual-la a zero, ou seja, a
28
famlia exponencial derivvel. Transformando a equao (2.10) em sua apresentao escalar
e tambm como uma funo de distribuio da famlia exponencial:
n
i
n
i
i
i i i
i i
y c
a
b y
y f L
1 1
) ; (
) (
) (
) ; ; ( ln (2.11)
Observe-se que na equao (2.11) o somatrio resulta na soma do modelo resultante
de cada uma das n linhas da tabela (2.1). De forma a maximiz-la, a funo L ser derivada
parcialmente em relao matriz dos parmetros

i
i
i
i
d
d
d
dL L
(2.12)
Mas na ltima igualdade da equao (2.11) o termo

s ocorre na primeira parcela
do somatrio, e ainda nos modelos lineares generalizados o termo

constante, assim,
a(

Ainda, em retrospectiva, para as distribuies apresentadas Normal, binomial e
Poisson e tambm para toda famlia exponencial d db / ) ( . Disto resulta-se:
n
i
i i
n
i i
i
i
i
y
d
db
y
d
dL
1 1
1 ) ( 1
(2.13)
Recorrendo equao (2.8), porm em formato matricial:
i
x

(2.14)
Destacando que conforme a tabela (2.1) os
i
x so as variveis regressoras, ou
independentes, para cada resposta i.
As equaes escore so obtidas aps igualar a zero os resultados das derivadas das
equaes (2.13) e substituindo em (2.12) as igualdades (2.13) e (2.14). O divisor de (2.13)
desaparece devido ao termo ter sido igualado a zero:
n
i
i
i
i i
d
y
1
0 ) (
i
x (2.15)
Se as equaes escore forem cannicas -
i i

- a igualdade acima resume-se a:
29
n
i
i i
y
1
) ( 0 x
i
(2.16)
A soluo das equaes escore (2.16) levar estimao dos parmetros do modelo.
O apndice A.5 de Myers, Montgomery e Vining (2002) explica em detalhes que a equao
(2.16) conduz pelo desenvolvimento da primeira ordem de uma srie de Taylor equao
(2.17). Dobson (1990) tambm apresenta uma soluo similar que naturalmente conduz ao
mesmo resultado. Considere-se a equao matricial, conforme Vieira (2004) e Epprecht e
Vieira (2004):
(m) (m) T (m) T m
z W X X) W (X
1 ) 1 (

(2.17)
O ndice m corresponde m-sima iterao, portanto
) 1 (

m
deve ser entendido como
a estimativa da m-sima mais uma iterao do algoritmo. Desenvolvendo adiante a equao
(2.17), seguem os significados das matrizes que a compe em suas respectivas dimenses.
) (
) (
2
) (
1
) 1 (

m
k
m
m
m

X a matriz que representa as variveis regressoras da tabela (2.1) com acrscimo da
coluna de 1s que est relacionado ao termo independente do modelo a ser gerado:
nk n
k
k
x x
x x
x x
1
2 21
1 11
1
1
1
1
X
A matriz W diagonal e conhecida como a matriz dos pesos para ponderao da
varincia relativa a cada varivel regressora.
nn
(m)
w
w
w
0 0 0
0 0 0
0 0 0
0 0 0
22
11
W
Os elementos da diagonal ii
m
w
) (
so dados por:
30
n i
y
w
m
i
i
i
m
ii
, , 2 , 1 ,
) var(
1
2
) (
) (
(2.18)
Finalmente z o vetor das variveis de ajuste na m-sima iterao.
) (
) (
2
) (
1
m
n
m
m
(m)
z
z
z
z
Cujos elementos so:
, 2 , 1 , ) (
) (
) ( ) ( ) (
i y
m
i
i m
i i
m
i
m
i
z ,n (2.19)
Em destaque observa-se pelas equaes (2.17) e (2.19) que o processo iterativo,
sendo que a estimativa
) 1 (

m
calculada como dependente da estimativa anterior
) (

m
.
Vieira (2004) afirma que a convergncia do mtodo iterativo dos mnimos quadrados
ponderados iterativo (MQPI) depende bastante da qualidade das estimativas iniciais para os
parmetros

.
O ciclo iterativo da figura (2.2) comea fazendo com que m indique, como dito
anteriormente, a ordem da iterao. Assim, a m-sima iterao faz uso da estimativa de
) (

m

que deriva das estimativas para z e W, sendo que o ciclo se fecha quando determinada a
atualizao da estimativa
) 1 (

m
que ser usada na prxima iterao, e assim ciclicamente at
a convergncia conforme os seis passos em seguida apresentados (EPPRECHT; VIEIRA,
2004).
O algoritmo apresentado graficamente nas figuras (2.1) e (2.2). A primeira
apresenta a forma como as variveis da equao (2.17) se inter-relacionam, enquanto que a
segunda seqncia o procedimento iterativo. No apndice A este algoritmo executado para o
caso especfico que trata esta dissertao.
31

Figura (2.1) Relaes entre as variveis do algoritmo MPQI. Fonte: Vieira (2004)

Figura (2.2) Algoritmo MPQI. Fonte: Vieira (2004)
Passo 1: Calcular o vetor
) (

m
, seqncia da figura (2.2), onde k o nmero de
parmetros do modelo mais um, pois o modelo possui o termo independente
0
, pela equao
(2.8):
32
) (
) (
) (
2
) (
1
) (

m
m
k
m
m
m
X (2.20)
Passo 2: Calcular o vetor da mdias de cada fator, onde cada
i
obtido pela
inverso das funes de ligao
i
:
) (
) (
2
) (
1
) (

m
k
m
m
m
(2.21)
Passo 3: Calcular o vetor z segundo equao (2.19).
Passo 4: Calcular os elementos da matriz diagonal W da equao (2.18).
Passo 5: Atualizar a estimativa do vetor
) (

m
segundo a equao (2.17).
(m) (m) T (m) T m
z W X X) W (X
1 ) 1 (


Passo 6: Testar a convergncia do algoritmo pela verificao da distncia definida
pelo condutor do experimento entre
) 1 (

m
e
) (

m
menor do que o valor da tolerncia
especificada. Se a convergncia ocorreu, ento encerra-se o algoritmo, em caso contrrio h
de se retornar ao passo 1 para mais uma iterao.
Vieira (2004) acrescenta que no h uma nica maneira de se estimar o primeiro
valor dos parmetros,
) 1 (

. No entanto, sugere que seja aquela mais comum e a que adota, que
estim-los a partir de uma estimativa inicial de
0
relacionado ao vetor das mdias O
autor ainda chama a ateno de que este vetor das mdias solicitado pela algoritmo no passo
2, assim
) 1 (

obtido a partir de uma tentativa de valores de


(0)
e prosseguindo com os
demais passos e girando o ciclo at a convergncia. A igualdade y
) 0 (
tambm , segundo
o referido autor, muito usada. H ainda a necessidade de clculo dos valores da funo de
ligao ) (
) 0 ( ) 0 (
i i
g

para satisfazer a solicitao do vetor

no passo 3. Esta etapa ser
levada j na prtica apresentada no prximo captulo 4 desta dissertao.
33
Uma vez j definidos os parmetros estimados

, deve ser analisada a significncia


deles, pois esta permitir inferir sobre o quanto se pode confiar nas respostas do modelo
proposto, alcanando as limitaes que ele impe. Para tanto, usado o esquema proposto em
Vieira (2004) para os testes de significncia do modelo. Para a famlia exponencial, pode-se
afirmar dos parmetros estimados

a seguinte igualdade para a matriz de covarincia:


2
1
) cov( WX X
T
(2.22)
Onde W a matriz dos pesos cujos elementos foram apresentados na equao (2.18).
Vale observar que no caso da estimativa de parmetros pelo mtodo dos mnimos quadrados,
esta mesma matriz de covarincia calculada dispensando a matriz dos pesos, pois naquele
modelo no h a necessidade de ponderar as varincias das respostas, seus elementos so
todos a unidade. Isto comprova que a estimao de parmetros pelo mtodo dos mnimos
quadrados, sob esta ptica, um caso particular do mtodo da mxima verossimilhana. A
completa demonstrao da equao (2.22) pode ser obtida em Myers, Montgomery e Vining
(2002, p.50). Se for de interesse encontrar a demonstrao da mesma frmula para o caso da
regresso linear normal recorre-se a Myers, Montgomery e Vining (2002, p.15), que o
mesmo que substituir a matriz W de (2.18) pela identidade.
Nos testes de significncia para os modelos lineares com distribuio normal, usa-se
a estatstica t-student para a seleo dos parmetros:
)

var(

0
j
j
t (2.23)
No entanto, os modelos lineares generalizados no apenas solucionam as respostas
que atendem distribuio normal, para a qual se ajusta bem a estatstica da equao (2.23),
mas tambm com toda a famlia exponencial j apresentada. A equao (2.23) pode ser usada
em outras distribuies que no a normal desde que esta estatstica resulte em um valor alto,
diga-se trs, para se indicar a significncia de parmetros, no entanto ainda assim ser uma
aproximao, Vieira (2004).
Recomenda-se tambm o uso da funo de desvio (deviance) para os testes de
significncia dos coeficientes do modelo. Sua definio, conforme Vieira (2004), pelo
clculo do desvio entre o modelo proposto em relao ao modelo saturado, ou seja, aquele no
34
qual os valores ajustados
i
so iguais s respostas
i
y , coletadas no experimento ou onde o
nmero de parmetros igual ao nmero de observaes.
sat
mod
ln 2
L
L
D (2.24)
Dobson (1990) ressalta que valores elevados de deviance sugerem modelos com
descries pobres dos dados. Sendo numerador e denominador da equao (2.24) as funes
de mxima verossimilhana do modelo proposto e do modelo saturado, respectivamente.
Sendo assim, pode-se desenvolv-la para:
) ; ln( ) ; ln( 2
) ; (
) ; (
ln 2 ) ; (
i i i i
i i
i i
i i
y y y
y y L
y L
y D (2.25)
A tabela (2.3) apresenta as funes de desvio para as distribuies normal, binomial
e de Poisson:
Tabela (2.3)
Funes de Desvio
Distribuio de Probabilidade Funo de desvio (deviance)
Normal
n
i
i i
y
1
2
) (

Binomial
n
i i
i
i
i
i
i
m
y m
y m
y
y
1

ln ) (

ln 2

Poisson
n
i
i i
i
i
i
y
y
y
1

ln 2

Fonte: adaptado Vieira (2004).
McCullagh e Nelder (1990) indicam que o termo m da funo de desvio para a
distribuio binomial refere-se ao nmero de indivduos cujas respostas foram coletadas para
o experimento.
Vieira (2004) chama a ateno para se notar que a deviance da funo normal a
prpria soma dos quadrados dos resduos donde deriva-se o princpio de clculo do mtodo
dos mnimos quadrados.
Lindsey (1997) apud Vieira (2004) demonstra que ) ; (
i i
y D tem distribuio que
obedece assintoticamente distribuio do qui-quadrado -
2

- com n-p graus de liberdade,
35
onde n o nmero de observaes e p a quantidade de parmetros adotados no modelo.
Novamente, Lindsey (1997) apud Vieira (2004), recomenda a anlise de desvios conforme a
diferena deles ou diferena de deviance, como exposto a seguir.
Suponha o modelo A como saturado, ou seja, aquele no qual os valores ajustados
i

so iguais s respostas
i
y ; outro modelo B com p+1 parmetros
p p
, , , ,
1 1 0
.
Considere-se ainda um ltimo modelo C, aninhado do modelo B, porm com um parmetro a
menos, explicitamente,
1 1 0
, , ,
p
. Pela equao (2.25) chega-se a clculo das deviances
dos modelos B e C.
) ; ( ln ; ln 2 ) ; (
) ( ) (
i i A
B
i i B
B
i i B
y y L y L y D

) ; ( ln ; ln 2 ) ; (
) ( ) (
i i A
C
i i C
C
i i C
y y L y L y D

E a diferena entre as deviances C e B:
) ( ) ( ) ( ) (
; ln 2 ; ln 2 ) ; ( ) ; (
B
i i B
C
i i C
B
i i B
C
i i C
y L y L y D y D

) (
) (
) ( ) (
;
;
ln 2 ) ; ( ) ; (
B
i i B
C
i i C B
i i B
C
i i C
y L
y L
y D y D

Sendo que Lindsey (1997) apud Vieira (2004) demonstra que esta diferena segue
aproximadamente a distribuio
2
1

quando o modelo C est correto, assim como
) ; (
) (C
i i C
y D segue
2
p n
no mesmo caso.
Vieira (2004) conclui que sendo correto o modelo C nos casos acima citados, a razo
abaixo segue a distribuio
p n
F
, 1
por aproximao:
p n
i i C
i i B i i C
F
p n
y D
y D y D
F
, 1 0
) ; (
1
)) ; ( ) ; ( (
(2.26)
Desta forma, para uma seqncia de k modelos aninhados pode-se calcular as
deviances ) ; (
i i j
y D

para j=1,2,...,k. e montar os testes de significncia dos parmetros numa
36
tabela ANODE (Analysis of deviance), tal qual na tabela ANOVA para varincias comumente
utilizada na estimao de fatores significativos de um experimento.
O parmetro de disperso ( ) referido na equao (2.1) que define o formato geral de
um modelo linear generalizado tem no caso particular da regresso linear a seguinte
apresentao (MONTGOMERY, 2005):
p n
SS
E 2
(2.27)
Onde
E
SS a soma dos quadrados dos resduos. Atkinson e Riani (2000) apud
Vieira (2004) asseguram que para o caso geral dos modelos lineares generalizados este
parmetro pode ser calculado da seguinte forma:
p n
y D
i i
) ; (

2
(2.28)
Da mesma forma que na regresso linear clssica, nos modelos lineares
generalizados a adequao do modelo checada pela anlise dos resduos. Sendo que o
resduo deviance apresentado aquele que melhor se aproxima da distribuio normal e sua
verso studentizada a recomendvel para se confirmar a adequao do modelo gerado com
base na famlia exponencial que so descritos a seguir (VIEIRA, 2004).
A cada resposta
i
y obtida no experimento pode-se calcular o seu respectivo deviance
i i i
y D d ; . Pela soma de todas as i respostas medidas possvel conhecer a discrepncia
do modelo, assim:
i i
n
i
i
y D d ;
1

(2.28)
A partir da equao (2.28) pode-se definir o resduo deviance associado a cada
resposta
i
y obtida:
i i i Di
d y sinal r ) ( (2.29)
A studentizao das deviances so apresentados por McCullagh e Nelder (1990) pela
matriz chapu. Esta matriz mapeia o vetor dos valores observados em um vetor dos valores
37
ajustados, segundo Myers, Montgomery e Vining (2002), suas propriedades representam um
papel central na anlise de regresso, sua forma mais geral :
2
1
1
2
1
W X WX X X W H
T T
(2.30)
Relembrando que a matriz W a matriz diagonal cujos elementos so dados pela
equao (2.18).
n i
y
w
m
i
i
i
m
ii
, , 2 , 1 ,
) var(
1
2
) (
) (

O i-simo elemento da diagonal da matriz H cujos elementos so
ii
h permite o
clculo dos resduos studentizados:
) 1 (

2
ii
Di
i
h
r
r (2.31)
Enquanto que a estimativa do parmetro de disperso (

) calculado conforme a
equao (2.28). Vieira (2004) tambm indica o grfico de probabilidade normal dos resduos
deviance studentizados versus distribuio destes no eixo horizontal dos percentis de forma a
possibilitar a deteco de observaes atpicas, conforme figura (2.3).
No caso da figura (2.3) no se observam pontos seguramente fora do envelope, ou
seja, das linhas laterais que acompanham a tendncia de orientao das deviances
studentizadas medida que avanam pelos percentis. E ainda, muitos pontos fora do
alinhamento. Segundo Vieira (2004) estes so indicativos suficientes para aprovar o modelo
que gerou a figura (2.3).
Da mesma forma, a anlise da funo de ligao tambm deve ser feita. Para tanto,
gera-se o grfico da figura (2.4) onde os resduos studentizados so plotados segundo o seu
valor ajustado.
38

Figura (2.3) Grfico de probabilidade normal dos resduos deviance studentizados versus percentis. Fonte:
adaptado Vieira (2004)
Na figura (2.4), cujo grfico foi gerado a partir do mesmo modelo referente figura
(2.5), percebe que os resduos studentizados distribuem-se aleatoriamente, sem um padro
definido claramente perceptvel. Neste caso apresentado, o software estatstico que gerou tal
grfico foi o ARC. Este e ainda outros softwares geram uma linha de amortecimento
conhecida por lowess. No caso da figura (2.4) esta linha quase horizontal e prxima do eixo
das abscissas, sendo este o indicativo que aprova a funo de ligao selecionada (VIEIRA,
2004).
Como j discutido, a funo de varincia alternativamente funo de ligao
obtida via funo de potncia da mdia:
) var(
Na figura (2.4) a linha de amortecimento, ou lowess, decresce suavemente num
trecho e cresce numa tendncia bvia em outro. O crescimento da esquerda para a direita
indica a necessidade de se usar um valor maior para

do que o utilizado no modelo. O caso
contrrio, quando a linha de amortecimento decresce o valor utilizado de

de ser menor. Para
39
o grfico em questo a linha lowess o crescimento se verifica aproximadamente no 14
resduo plotado, no entanto quem puxa a linha para o alto so os dois maiores resduos, em
valor absoluto, numa regio de menor densidade de pontos, ou seja, a confiabilidade na linha
de amortecimento menor e assim sujeito a se poder afirmar que no se deve considerar este
fenmeno como indicativo de uma funo de varincia incorreta (VIEIRA, 2004).

Figura (2.4) Resduo studentizado pelo valor ajustado. Fonte: adaptado Vieira (2004)
Para verificao da validade da funo de varincia, mais uma vez recorre-se aos
grficos. Nesta situao o valor absoluto dos resduos studentizados plotado com os seus
respectivos valores ajustados. Na figura (2.5) este grfico apresentado.
Conforme Myers, Montgomery e Vining (2002) a diagonal da matriz chapu H
identifica pontos que so potencialmente influentes devido sua posio no campo das
respostas, assim tornar-se conveniente considerar ponderadamente tanto sua localizao
quanto a varivel de resposta que mea sua influncia. Assim, a distncia de Cook mede a
distncia quadrada entre os mnimos quadrados de todos os n pontos da matriz de parmetros
estimados

.
40
2
2
) 1 (
ii
ii Pi
i
h p
h r
D (2.41)
Onde p o nmero de parmetros estimados e
2
Pi
r o resduo de Pearson
studentizado, da seguinte forma obtido conforme apresentado em Vieira (2004):
) 1 ( var(

ii i
i i
Pi
h
y
r

Figura (2.5) Grfico dos resduos studentizados (absolutos) versus valores ajustado. Fonte: adaptado Vieira
(2004)
A figura (2.6) apresenta o grfico da distncia de Cook, onde pelo comportamento
disperso dos pontos entende-se que no h observao consideravelmente influente no campo
das respostas.
Desde quando se iniciou o tratamento dos modelos lineares generalizados neste
texto, todos os progressos foram feitos em torno da famlia de distribuies dita exponencial,
ou seja, aquelas distribuies que podem ser escritas no formato da equao (2.1). Myers,
41
Montgomery e Vining (2002) lembram que nos casos dos modelos lineares generalizados a
condio de independncia das respostas foi aceita para permitir a modelagem pela via da
funo de mxima verossimilhana. No entanto, h uma vasta coleo de processos
industriais onde ocorrem duas situaes:
a) as respostas so independentes mas no obedecem a um dos membros da famlia
exponencial, ainda que a varincia seja funo da mdia e;
b) as respostas tm varincia que so funo da mdia, no entanto estas respostas
so correlacionadas, ou seja, so dependentes.

Figura (2.6) Distncia de Cook. Fonte: adaptado Vieira (2004)
Assim, segundo estes mesmos autores, a funo de quase-verossimilhana deriva do
conceito dos mnimos quadrados ponderados, ou mais genericamente, mnimos quadrados
generalizados para o caso onde as respostas so correlacionadas, sendo que a funo de quase-
verossimilhana tem propriedades da funo log-verossimilhana vista na equao (2.10).
42
Vieira (2004) diz que a idia usar o mtodo dos mnimos quadrados ponderados
pela varincia, conforme abaixo.
n
i i
i i
n
i i
i i
V
y
y
y
SQP
1
2
1
2
) (
) (
) var(
) (
(2.42)
Primeiramente, deriva-se a equao (2.42) em relao aos coeficientes:
d
d
V
y
d
dSQP
n
i i
i i
1
2
) (
) (
(2.43)
Igualando estas as equaes (2.43) a zero, no processo clssico para se achar
extremos de uma funo que neste caso um mximo, encontram-se as equaes-escore cujas
solues conduzem estimao dos coeficientes:
0
) (
) (
1
2
d
d
V
y
n
i i
i i
(2.44)
Vieira (2004) apresenta a funo de quase-verossimilhana para uma observao:
i
i
y
i
i i i
dt
t V
t y
y Q
) (
) ; (
(2.45)
A equao (2.45) torna-se para n observaes da seguinte forma:
n
i
y
i
n
i
i i i
i
i
dt
t V
t y
y Q Q
1 1
) (
) ; ( ) ; ( y (2.46)
Sendo que as derivadas da equao (2.46) em relao aos coeficientes sero as
prprias equaes-escore apresentadas em (2.44). Por isso, Vieira (2004) diz que a funo de
quase-verossimilhana corresponde funo de log-verossimilhana, onde a diferena cabvel
est em que no uso da funo de quase-verossimilhana com o intuito da estimao de
coeficientes, apenas se define a relao da varincia de resposta com sua mdia, sendo
desnecessria a definio de uma funo de probabilidade e, naturalmente, tampouco uma
distribuio da famlia exponencial. O autor ainda diz que, particularizando ) ( /
i i i
V ,
volta-se s equaes-escore da funo log-verossimilhana, ou o conjunto de equaes (2.15).
Tomando-se o termo do somatrio da equao (2.42), ou:
43
) (
i
i i
i
V
y
U

Sero encontradas as seguintes propriedades para a mdia e varincia:
) (
1
) (
1
) (
) (
(
) var(
) (
var ) var(
0
) (
) (
2 2
i i
i
i
i
i
i
i
i
i i
i
i
i i
i
V
U
E
V
V
V
V
y
V
y
U
V
y
E U E

Estas tambm so propriedades das equaes-escore da funo de mxima log-
verossimilhana.
Como j dito anteriormente, funo de varincia pode ser expressa por uma funo
de potncia com alternativa funo de ligao, no seguinte formato:
t
i i
V ) (
Para diferentes valores de t inseridos na equao (2.45) da funo de quase-
verossimilhana para uma observao tem-se.
Para t=0:
2
) (
) ; (
2
i i
i i i
y
y Q

Para t=1 a funo de quase-verossimilhana :
i i i i i i
y y Q ) ln( ) ; (
Para t=2 a mesma funo :
) ln( ) ; (
i
i
i
i i i
y
y Q

Para t=3 a referida funo :
44
i i
i
i i i
y
y Q
1
2
) ; (
2

Quando t 0, t 1 e t 2, ento a funo de quase-verossimilhana :
t t
y
y Q
i i i t
i i i i
2 1
) ; (
2

E por fim, para o caso da varincia assumir o comportamento da funo
) 1 ( ) (
i
V a quase-verossimilhana ser:
) 1 ln(
1
ln ) ; (
i
i
i
i i i
y y Q

Para efeito de simplificao de clculos, Vieira (2004) diz que quando t igual a 0,
1, 2 e 3 as funes de quase-verossimilhana se identificam com as funes da famlia
exponencial convertidas funo de log-verossimilhana nas distribuies normal, de
Poisson, gama e normal inversa, respectivamente. E ainda, no caso ) 1 ( ) (
i
V que
funo da varincia da distribuio binomial, a funo de quase-verossimilhana se identifica
com a funo de log-verossimilhana da prpria binomial.
Uma vez que a maximizao da funo de quase-verossimilhana capaz de resultar
nas mesmas estimativas dos parmetros


conforme visto atrs, os seis passos indicados no
algoritmo utilizado para encontr-los no caso da funo de log-verossimilhana tambm
podem ser adotados nesta situao (VIEIRA, 2004).
Para os testes de significncia dos parmetros encontrados usa-se a estatstica de
quase-deviance. Conforme explica Vieira (2004) esta estatstica baseia-se nos mesmos termos
da deviance para os modelos lineares generalizados. Assim, da mesma forma esta estatstica
fornece para uma modelo qualquer de quase-verossimlhana o desvio deste modelo em
relao a ele mesmo porm saturado, pois assim definida:
) ; ( ( 2 ) ; ( ) ; ( 2 ) ; (
i i i i i i i i i i i i
y Q y y Q y Q y D

E desenvolvendo:
45
i
i
y
i
i i
i i i
V
y
y D
) (

2 ) ; ( (2.47)
O termo ) ; (
i i i
y Q

a funo de mxima quase-verossimilhana do modelo
encontrado pelo algoritmo. Ao passo que o termo ) ; (
i i i
y y Q a funo de mxima quase-
verossimilhana do modelo saturado, onde os valores ajustados
i
so iguais s respostas
encontradas no experimento, ou seja,
i
y .
Nas funes de mxima quase-verossimilhana os resduos, tal qual nos modelos
lineares generalizados ordinrios, representam papel fundamental para anlise de adequao
do modelo obtido. Lee e Nelder apud Vieira (2004) recomendam o uso do resduo deviance
studentizado j apresentado na equao (2.31).
A figura (2.7) representa o grfico dos resduos deviance studentizados num modelo
desenvolvido a partir do mtodo da mxima quase-verossimilhana e onde a funo de
varincia assumiu a forma ) ( V . Este grfico tambm foi gerado pelo software ARC.
No grfico da esquerda no se percebe um padro de distribuio nos resduos, so
desestruturados e aleatrios. E por este motivo a linha de amortecimento (lowess) comporta-
se horizontalmente e prxima da abscissa. Este segundo Vieira (2004) um indicativo de
adequao da funo de ligao.
J no grfico da direita a linha de amortecimento tem um bvio crescimento da
esquerda para a direita denunciando que o expoente da mdia na funo de varincia, no caso
) ( V , deve ser aumentado. Na situao real, aspas de Vieira (2004), deveria ser
elevado ao quadrado.
46

Figura (2.7) Grfico dos resduos deviance studentizados pelos valores ajustados (esquerda) e grfico dos
resduos absolutos pelos valores ajustados. Fonte: adaptado Vieira (2004)
2.2 O NDICE DE CAPACIDADE DE PROCESSOS
A performance ou capacidade de um processo pode ser medida de diferentes formas.
O significado desta capacidade est relacionada ao cumprimento de determinada promessa de
qualidade ou confiana que se pode depositar no processo de que cumprir com o esperado
pelo cliente. Bothe (1997) diz que a Ford e a Motorola na dcada de 1990 demonstraram a
forte correlao entre a lucratividade e a satisfao do consumidor. Acrescenta-se ainda que a
medio da capacidade de processos um dos melhores mtodos para quantificar quo bem
os requisitos do consumidor esto sendo atendidos.
Em geral, a caracterstica de qualidade expressa em termos numricos e chamada
varivel de controle. As cartas de controle para variveis so muito teis para avaliar se um
processo capaz ou no de cumprir com certa promessa de qualidade, e foram uma das
primeiras tentativas exitosas para tal fim. No entanto, Bothe (1997) afirma que sua principal
funo identificar se o processo est sob controle, o que indica a presena de apenas causas
comuns que afetam a variabilidade das medidas. Se aparecerem causas especiais, a
configurao da carta de controle assumir um padro de comportamento que indicam suas
presenas. Estas causas devem ser eliminadas de forma a retomar-se a estabilidade do
processo.
47
Montgomery (2001) apresenta diversos tipos de carta de controle para variveis,
sendo as mais comuns: x , R e S, respectivamente para os valores mdios, a amplitude da
varivel e a varincia. necessrio, portanto, que se mantenha controle primordialmente
sobre a tendncia central e a disperso das medidas de interesse.
As cartas de controle so construdas baseando-se, na mdia e varincia da varivel
de resposta. Embora muito teis, em especial para averiguar a estabilidade do processo
(BOTHE, 1997), as cartas de controle, sozinhas, contm algumas desvantagens para avaliar
sua capacidade: exige anlise do posicionamento de cada medida em relao aos seus
vizinhos e em relao aos limites de controle para sua interpretao; no indica imediatamente
a perda de qualidade, ainda que mnima, a cada nova medida; sua interpretao depende da
anlise de grficos nem sempre disponveis; e por fim, no permite a informao imediata se a
partir de um determinado arranjo de fatores o processo otimizado ou no, que onde reside
o interesse deste trabalho.
Bothe (1997) diz que um processo sob controle do ponto de vista estatstico
apresentar 99,73% das suas medidas dentro dos limites de controle superior e inferior. Como
na carta de controle cada ponto significa as medidas de um subgrupo de amostras, em apenas
0,27% dos casos 100% - 99,73% - cairo fora destes limites. Neste caso, continua Bothe
(1997), no se poder mais afirmar que o processo est sob controle e certamente ocorreu uma
causa especial que o desestabilizou.
Complementarmente s cartas de controle, surge um outro caminho para expressar a
capacidade de processo em termos do ndice de capacidade de processos (ICP). De certa
maneira, estes ndices suprem as carncias das cartas de controle. Um dos mais comuns
ndices de capacidade de processo - C
p
- definido pela equao (2.48), que para uma
caracterstica de qualidade com limites superior (USL) e inferior (LSL) expressa por:
6
LSL USL
C
p
(2.48)
Neste texto ser preferida a designao USL e LSL originria da literatura
pesquisada em ingls que significam respectivamente, upper specification limit e lower
specification limit. Portanto, USL o limite de especificao superior, enquanto LSL o
limite de especificao inferior. O termo

o desvio-padro da populao da medida, como
na maioria das situaes o desvio-padro populacional desconhecido, Montgomery (2001)
48
freqentemente usa a estimativa amostral do desvio-padro ( ) para populaes, o que
conduzir estimativa
p
C

:
2
d
R
(2.49)
Onde o termo R a amplitude global de cada amostra segundo a equao (2.50):
m
R R R
R
m 2 1
(2.50)
Nesta equao o termo m corresponde quantidade de amostras selecionadas,
Montgomery (2001) recomenda no mnimo 20 a 25 delas, cada uma contendo de 4 a 6
observaes. O termo R
i
, ou amplitude mxima da amostra, representa a diferena entre o
maior e o menor valor de cada uma das m amostras, e dada pela equao (2.51):
mnimo mximo
x x R (2.51)
Ainda na equao (2.49) o termo d
2
no denominador o estimador no-tendencioso,
ou imparcial, para distribuies aproximadamente normais e tabelado em funo do
tamanho da amostra. A referida tabela encontra-se em Montgomery (2001, p. 761). O
algarismo 6 (seis) no denominador da mesma equao proveniente de se arbitrar, por
definio, a distncia da mdia geral de trs vezes o desvio-padro em relao a cada um dos
limites de controle, o superior e o inferior.
Com efeito, a equao (2.48) representa quantas vezes cabem dentro de ambos os
limites de especificao, seis vezes o desvio-padro das respostas do processo. Diversos
renomados estatsticos industriais adotam esta definio arbitrada em seis desvios-padro por
representar performances de produo realsticas e alcanveis, e tambm por serem mais
populares (BOTHE, 1997; MONTGOMERY, 2001).
Uma distino importante ressaltada por Bothe (1997) entre os valores de
referncia da equao (2.48) e os valores dos limites de referncia das cartas de controle, pois
freqentemente so confundidos, ainda que no tenham entre si nenhuma relao matemtica.
Os primeiros so limites de especificao definidos pela engenharia do produto e servem para
distinguir entre peas conforme e no-conforme. Uma vez que a medida em questo est no
intervalo entre USL e LSL o produto aceito; caso contrrio, acima de USL ou abaixo de
49
LSL o produto classificado como no-conforme. J no caso das cartas de controle, os limites
de controle auxiliam os operadores a identificar se o processo est ou no estvel, ou sob
controle, ajudando-os a reconhecer a presena ou no de causas especiais de variao o que
exigiria a ao de elimin-las. Assim, a medida pode estar sob controle, ou seja apenas causas
comuns esto agindo para sua variao, e no atender aos requisitos que indicam
conformidade ou no-conformidade.
O mesmo autor ainda alerta que no tem sentido avaliar o ndice de capacidade de
processos se o processo no estiver estvel. Desta forma, para se buscar um incremento na
qualidade de um produto por intermdio da resposta de uma determinada medida, indicam-se
trs caminhos que envolvem o uso conjunto das cartas de controle e ndice de capacidade de
processos:
a) estabilizar o processo: cartas de controle identificam quando causas especiais
agem no processo desestabilizando-o. Elas fornecem pistas para reconhec-las e
elimin-las;
b) melhorar o processo: uma vez que o processo est sob controle, mudanas
podem ser testadas e suas alteraes no processo medidas. Se a mudana gerar
uma resposta desejvel ela pode ser incorporada ao processo produtivo
permanentemente;
c) medir a capacidade do processo: novamente, caso o processo esteja sob controle,
medidas confiveis da capacidade de processos podem ser quantificadas de
forma a medir-se quo bem o processo alcana as expectativas do cliente.
A tabela (2.4) indica valores para de ndices de capacidade de processos para o caso
de se trabalhar com amostras quando se desconhece o desvio-padro da populao de
acordo com a caracterstica do processo.
A equao (2.48) avalia exclusivamente se o processo apresenta, em relao aos
limites de especificao, baixa ou alta variabilidade. Logicamente, desejvel que um
processo tenha baixa variabilidade, o que implica em valores maiores do ndice C
p
. Portanto,
menor variabilidade implica maior C
p
. No entanto, a equao (2.48) no faz nenhuma
referncia se o valor est centrado ou no no alvo desejado. Assim, proposto um novo ndice
de capacidade de processo que contempla no apenas a variabilidade do processo, mas
50
tambm cujo ndice influenciado pela localizao da mdia

em relao os limites de
controle. Este ndice foi designado por C
pk
:
3
;
3
LSL USL
mnimo C
pk
(2.52)
Tabela (2.4)
Valores mnimos recomendados para ndices de capacidade de processos
Caracterstica do processo Valor recomendado
Processos j existentes 1,33
Novos processos 1,50
Processos existentes, porm que envolvem
segurana, resistncia ou parmetro crticos
1,50
Novos processos, porm que envolvem
segurana, resistncia ou parmetro crticos
1,67
Fonte: adaptado Montgomery (2001, pg. 361).
Montgomery (2001) observa que se o processo estiver centrado, ou seja, a mdia

localiza-se exatamente no ponto mdio entre USL e LSL, C
p
ser igual a C
pk
. Desta forma,
enquanto o processo no est centrado neste ponto mdio, C
pk
ser sempre menor que C
p
, mas
potencialmente ambos podero igualar-se. Da que comumente o primeiro chamado
capacidade potencial, ao passo que o segundo conhecido por capacidade atual. Outra
observao importante decorrida da equao (2.52) que caso a mdia do processo coincida
com qualquer um dos limites isto implicar em um C
pk
igual a zero, ainda que o ndice C
p
seja
muito elevado a capacidade deste processo ser muito baixa devido grande descentralizao
de sua mdia.
O caso aplicvel para a equao (2.52) aquele onde h dois limites de
especificao, ou seja, quando deseja-se atingir um alvo entre eles. No entanto, h outros dois
casos, chamados unilaterais, onde necessrio que (i) a resposta seja to maior quanto
possvel (ou maior melhor), ou (ii) seja to menor quanto possvel (menor melhor). Assim,
a mesma equao (2.52) assume os seguintes formatos, respectivamente:
3
3
USL
C
LSL
C
pks
pki
(2.53)
51
A equao (2.52) exige o conhecimento da mdia da populao. Caso esta no seja
conhecida, utiliza-se a mdia estimada por uma amostra aleatria desta populao. O mesmo
vale para as equaes (2.53). Portanto, a rigor, a referida expresso assume o seguinte
formato:
3

;
3

LSL USL
mnimo C
pk
(2.54)
Chang, Cheng e Spiring (1988) contribuem com a apresentao da unificao das
equaes (2.48) e (2.52) para o caso bastante comum do alvo localizar-se exatamente sobre a
mediana do intervalo entre os dois limites de especificao. Considere-se o ndice k como:
) (
2
LSL USL
T
k (2.55)
onde T o alvo do processo. Portanto, o valor k ser sempre um valor positivo ou nulo. Desta
forma, este autores relacionam:
p pk
C k C ) 1 ( (2.56)
Para os casos onde no se conhecem os valores populacionais de C
pk
e C
p
, continuam
valendo os valores estimados para a equao (2.56), o que exige, pelo rigor da notao
estatstica, o acrscimo do chapu (^) sobre as variveis.
No mesmo texto, Chang, Cheng e Spiring (1988) apresentam uma nova proposta de
ndice de capacidade de processos que leva em considerao no apenas a mdia das respostas
e sua varincia, mas tambm o alvo desejado. O novo ndice foi batizado C
pm
. Segue seu
desenvolvimento, considere-se:
6
LSL USL
C
pm
Onde:
2
) ( T X E

O valor X a varivel aleatria que atende as respostas do processo. O operador
E(X-T) a esperana matemtica ou valor esperado definido em Duncan (1974) como:
52
dx x xf x E ) ( ) (
A funo f(x) a prpria distribuio de probabilidade das respostas do processo. O
parmetro populacional normalmente desconhecido e assim deve ser estimado conforme
segue:
n
i
i
n
T x
1
2
2
1
) (


Aqui, n representa o tamanho da amostra retirada da populao, e x
i
o valor de cada
elemento da amostra. Assim, o resultado estimado de C
pm
:
6

LSL USL
C
pm
(2.57)
Redistribuindo-se convenientemente as equaes acima encontra-se que:
2 2 2
]) [ ( ] ) [( LSL USL X E

E, por definio em Duncan (1974) a varincia :
2 2
) ( X E
Disto resultam as quatro formas mais prticas de apresentao do ndice C
pm
:
2 2 2 2
2
2 2 2
) ( 3 ) ( 3
) ; min(
) (
1
) ( 6
T
T m d
T
LSL T T USL
T
C
T
LSL USL
C
p
pm
(2.58)
Onde ainda no foram definidos:
d
i
: (USL-LSL)/2;
m
i
: (USL+LSL)/2.
53
Os casos unilaterais tambm so aplicveis para a equao (2.58). Assim,
respectivamente, para respostas do tipo maior melhor, e menor melhor a equao (2.58)
assume os seguintes formatos:
2 2
2 2
) ( 3
) ( 3
T
T USL
C
T
LSL T
C
pms
pmi
(2.59)
imediato verificar que C
pm
possui as propriedades necessrias para a avaliao da
capacidade de processos. Alm de ser adimensional, se a varincia do processo cresce o valor
do denominador das equaes (2.58) tambm aumenta, diminuindo o valor do ndice. O
mesmo ocorre se a mdia das observaes da caracterstica de qualidade distancia-se do alvo
pretendido, assim tambm ser maior o denominador aumento da diferena ( -T)
reduzindo novamente o valor de C
pm
.
Processos que apresentam apenas uma caracterstica de qualidade so excees. O
mais comum que se encontra na realidade so processos que geram mltiplas caractersticas
importantes que representam conjuntamente o atendimento das necessidades do cliente. Desta
forma, importante que se desenvolva um ndice de capacidade de processos que contemple
ao mesmo tempo todas as caractersticas do processo.
Chng, Quah e Low (2005) apresentaram para o ndice C
pm
uma evoluo de seu
conceito. Para um produto que tenha mais de uma caracterstica de qualidade calculado o
C
pm
relacionado a cada uma destas medies. Depois, conforme o grau de importncia
individual da caracterstica, multiplicado por um fator de ponderao e
i
, onde i indica a
quantidade de caractersticas em avaliao. Assim, a seguinte equao para a capacidade de
processos mltipla ou total desenvolvida pelos autores:
2 2
1
1
2 2
) ( 3
) ( 3
) ; min(
i i i
i i i
p
i
i
p
i
i i i
i i i i
i pm
T
T m d
e
T
LSL T T USL
e TotalC
(2.60)
Conforme j discutido acima, e
i
o peso dado a cada uma das i caractersticas de
qualidade e tem duas propriedades de interesse imediato: 0

e
i
1 e a soma de todos os e
i
a
54
unidade. O valor p do operador somatrio justamente o nmero de caractersticas de
qualidade em avaliao conjunta. Para os dois casos unilaterais o procedimento similar
queles adotados nas equaes (2.59).
Montgomery (2005) indica o mtodo da superfcie de resposta (MSR) para a
otimizao conjunta de mdia e varincia, o chamado problema dual de otimizao. Em geral,
o MSR envolve a seguinte ordem de elaborao: projeto de experimento, modelo de regresso
e otimizao.
Chng, Quah e Low (2005) aplicam o RSM s mdias e varincias do ndice
TotalC
pm
apresentado na equao (2.60). Para cada valor de C
pm
so solicitadas a mdia e a
varincia; portanto, trata-se do problema dual de otimizao quando estes valores so
substitudos pelas suas respectivas equaes de regresso que modelam seu comportamento
conforme mudam-se os fatores que as influenciam.
Em resumo, o que Chng, Quah e Low (2005) propem : primeiramente executa-se
um projeto de experimento fatorial completo onde fatores so controladamente alterados em
nveis. Para cada alterao planejada destes nveis so coletadas as variveis de resposta,
conforme instrui Montgomery (2005). Em seguida, gerado um modelo de regresso para a
mdia e outro para a varincia. Ambos modelos so instalados em cada equao de C
pm
na
equao (2.60). Por fim, deve-se testar todo o campo possvel que as variveis regressoras
podem assumir em busca da combinao que resultar no maior valor do TotalC
pm
. Este
ltima etapa pode ser realizada pelo software Excel

na ferramenta Solver que utiliza o
algoritmo de otimizao proposto em Castillo e Montgomery (1993) conhecido como
Generalized Reduced Gradient (GRG), ou gradiente generalizado reduzido.
Com este passo adiante a equao (2.60) assume o seguinte formato aplicado para
modelos de regresso:
2 2
1
1
2 2
) ( 3
) ( 3
) ; min(
i i i
i i i
p
i
i
p
i
i i i
i i i i
i
T w w
T m d
e
T w w
LSL T T USL
e TotalCpm
(2.61)
De onde define-se:
55
2

i
w : o modelo de regresso estimado para a varincia;
i
w : o modelo de regresso estimado para a mdia.
Para os casos unilaterais no h novidade. O tipo maior melhor e o tipo menor
melhor assumem os seguintes formatos respectivamente:
p
i
i i i
i i
i
p
i
i i i
i i
i
T w w
T USL
e TotalCpms
T w w
LSL T
e TotalCpmi
1
2 2
1
2 2
) ( 3
) ( 3
(2.62)
Uma outra proposta de otimizao de processos multiresposta por intermdio do
aumento da capacidade de processos do tipo C
pm
apresentada por Plante (2001). No entanto,
em vez de um somatrio, o mtodo envolve um produtrio.
p
p
i
i i i
i i
pm
T
LSL USL
MC
1
1
2 2
) ( 6
(2.63)
Plante (2001) ressalta que uma implicao primordial da equao (2.63) que ela
exige que todos os C
pm
apresentem valores mais ou menos prximos entre si e altos, pois
basta que apenas um deles esteja prximo de zero ou seja, num baixo nvel de qualidade
para que MC
pm
seja baixo tambm, no importando quo bem esto os demais ndices de
capacidade de processos. Seguindo o mesmo raciocnio, esta implicao tambm ajuda
identificar qual a resposta do processo que uma vez sofrendo melhorias de qualidade, mais
impactar na qualidade total do produto.
56
Captulo 3
Este captulo est dividido em duas sees. Na primeira seo apresenta-se uma
reviso do trabalho de Arriba (2005), nos pontos de interesse para esta dissertao, em
especial o Captulo 4 do referido texto. Assim, julga-se que no ser necessrio recorrer
quele texto para o adequado entendimento dos procedimentos aqui adotados. A segunda
seo traz a metodologia a ser aplicada na otimizao dos experimentos conduzidos por
Arriba (2005) segundo a proposta desta dissertao e que foi destacada nos objetivos
principais deste trabalho, a saber, analisar os resultados da otimizao realizada por Arriba
(2005) com outra alternativa de otimizao multiresposta.
3.1 O PROJETO DE EXPERIMENTO FATORIAL DE ARRIBA (2005)
O problema encontrado por Arriba (2005) o erro de classificao de couros em seus
trs estgios de produo. O curtimento de couros passa pelo estgio wet-blue, semi-acabado
e acabado. A figura (3.1) apresenta esquematicamente cada um desses estgios.
As etapas de classificao do couro, objeto de estudo no experimento de Arriba
(2005), ocorre no incio de cada um desses trs estgios. No estgio wet-blue, a classificao
serve para confirmar a seleo conduzida anteriormente no couro, no momento da recepo
da matria-prima. No estgio seguinte, de semi-acabado, uma nova classificao realizada
com as mesmas peas, porm j mais adiantadas no processo de curtimento e, portanto, as
ms caractersticas do couro apresentam-se mais evidentes. Por fim, no estgio final
conhecido como acabado, o couro novamente classificado para dirimir qualquer
possibilidade de falhas de classificao.
O couro apresenta, invariavelmente, defeitos de superfcie que comprometem sua
qualidade quanto ao tipo de aplicao futura, como produto final para consumo. A
classificao destes defeitos est sujeita subjetividade do classificador, dependendo tambm
do estgio de classificao. Quanto mais avanado est o processo de curtimento, mais
destacadas as avarias se apresentam.
57

Figura (3.1) Fluxograma do processo de curtimento de couros. Fonte: Arriba (2005)
No entanto, a cada etapa do processo de curtimento (figura 3.1) mais gastos incidem
sobre o produto. Portanto, erros de classificao implicam em desperdcios que sero
percebidos depois que os custos de curtimento foram incorridos no produto. A qualidade de
uma pele essencialmente determinada pela rea livre de marcas, pois mantm a
padronizao natural do couro. A ruptura desta padronizao natural o defeito, por
excelncia, que os classificadores devem identificar o mais cedo possvel no processo. Arriba
(2005) analisa dois tipos de erros:
a) o classificador no reconhece um couro, em qualquer dos estgios, como no
apto e o aceita como apto. Este tipo de erro denominado como de classificao
errada (CE);
58
b) o classificador, ao contrrio do caso anterior, reconhece um couro apto como no
apto. Este tipo de erro denominado alarme falso (AF).
No erro CE, as conseqncias so piores do ponto de vista dos custos, conforme
anlise de valores conduzidas por Arriba (2005). Dado o alto investimento tpico do
curtimento, couros no to bons quanto se afirma na classificao, recebem tratamento caro e,
adiante no processo, no resultam em matria-prima que possa ser utilizada para o fim
inicialmente esperado. Devido ao conservadorismo caracterstico dos classificadores, o erro
CE menos comum que o erro AF.
justamente esse conservadorismo que abre a possibilidade da ocorrncia do
segundo tipo de erro (AF). Quanto maior a qualidade de uma pele, maior o seu preo de
mercado. Assim, o custo do produtor em ter um couro excelente tratado como possuidor de
uma qualidade inferior a diferena a menos que o mercado pagar por ele.
Os objetivos principais de Arriba (2005) so, portanto: (i) minimizar os erros por
classificao errada (CE); (ii) minimizar os erros por alarme falso (AF); (iii) reduzir as
diferenas de notas que atestam a qualidade entre as classificaes de um estgio a outro e;
(iv) reduzir o desvio-padro destas diferenas. Para tanto, um projeto de experimentos foi
realizado de forma que trs classificadores experientes atribussem notas s peles, em cada um
dos trs estgios de classificao. Foi utilizada a seguinte escala:
a) nota 10: as melhores peles dentro da classificao de utilidade final atribuda a
elas;
b) nota 8: peles de qualidade mdia dentro da classificao de utilidade final
atribuda a elas;
c) nota 6: peles no limite inferior de qualidade dentro da classificao de utilidade
final atribuda a elas;
d) nota zero: peles com classificao errada, ou seja, classificadas para um fim para
o qual no podem ser utilizadas.
Estas notas so atribudas a cada pele nas etapas do processo de curtimento do couro.
Sendo que no estgio wet-blue ocorrem duas classificaes, uma feita pelo prprio
classificador e a outra por seu supervisor. A figura (3.2) esquematiza o mtodo.
59

Figura (3.2) Variveis associadas classificao das peles. Fonte: Arriba (2005)
Na figura (3.2) torna-se evidente que as notas so comparadas entre si em quatro
ocasies:
a) comparao das notas dadas pelo classificador wet-blue e seu supervisor no
mesmo estgio, pele a pele. Estas notas representam o conjunto de respostas Y
1
;
b) comparao entre as notas dadas pelo classificador wet-blue e o classificador do
estgio seguinte (semi-acabado). Estas notas representam o conjunto de respostas
Y
2
;
c) comparao entre as notas dadas pelo classificador de semi-acabado e o
classificador de acabado. Estas notas representam o conjunto de respostas Y
3
;
d) comparao entre o classificador de acabado e de semi-acabado, representada
pelo conjunto de respostas Y
4
. Estas comparaes no foram realizadas para o
artigo nubuck chocolate, e portanto est fora do escopo desta dissertao.
Quando se diz conjunto de respostas Y, faz-se referncia a quatro medidas tomadas a
partir das notas dadas em cada extremidade das setas observadas na figura (3.2). Estas
medidas so:
a) diferena entre as notas. A primeira nota subtrada da segunda nota no sentido
da seta. Por exemplo, se a nota dada pelo classificador de wet-blue for 8 e a nota
dada pelo seu supervisor no mesmo estgio for 10, a resposta ser (2). Aqui o
sinal negativo significa que o classificador foi mais rigoroso na classificao que
60
seu supervisor. Portanto, deseja-se que no haja diferena entre ambos, o que
implica em um valor alvo desejado igual a zero, denotando a situao onde a
nota dada pelo classificador a mesma dada pelo supervisor. Ou ainda, que a
nota dada no estgio anterior de classificao seja igual nota dada no estgio
posterior, conforme j detalhado pela figura (3.2);
b) desvio-padro: a srie de resultados das diferenas acima possui um desvio-
padro que deve ser minimizado. Quanto mais prximo de zero for este desvio-
padro, mais prximas entre si so as diferenas de respostas dadas pelos
classificadores. Diferena que se deseja nula como explicado acima;
c) probabilidade de classificao errada (CE): o percentual dentre as peles do lote
em avaliao que foram classificadas com erro para o fim a que se destina. Por
exemplo, diga-se que o classificador de semi-acabado recebe uma pele e avalia
que esta no serve para o produto cujo uso final foi indicado. Assim, ele atribuir
pele uma nota zero. Se o classificador anterior (wet-blue) atribuiu pele uma
nota 6, por exemplo, ele a classificou errado, pois no processo seguinte a pele foi
rejeitada para aquele fim. O ideal que ainda no estgio wet-blue fosse j
atribuda a esta pele a nota zero. Dentro do lote calcula-se o percentual de erros
desta natureza cometidos. Quanto menor o percentual de classificao errada,
melhor;
d) probabilidade de alarme falso (AF): neste caso, o classificador reprova uma pele
boa que s ser identificada como tal na etapa seguinte. Ou seja, na primeira
avaliao dada uma nota zero, ao passo que no estgio seguinte observa-se que
aquela pele deveria ter sido aprovada. Da mesma forma que no item anterior,
calcula-se o percentual de erros desta natureza dentro do lote para se estimar a
probabilidade de alarme falso. Quanto menor este percentual, melhor.
A partir das diferenas de notas explicadas na alnea (a) acima, pode-se montar a
tabela (3.1) que apresenta as diferenas possveis entre as notas dadas. Na tabela, v-se que
quaisquer que sejam as classificaes erradas ou alarmes falsos, estas sempre envolvem uma
nota zero atribuda a pele, seja num sentido ou noutro da seta. Conforme j dito
anteriormente, a nota zero indica a inaptido da pele para o produto final ao qual ela se
destina.
61
Tabela (3.1)
Possibilidades que as diferenas entre respostas podem assumir
1 Nota
2 Nota
(possibilidades)
Diferena
(Y
i
)
Comentrio
10 Zero Ambos concordam
8 2 Pequena discordncia
6 4 Grande discordncia
10
Zero 10 Classificao errada (CE)
10 -2 Discordncia pequena no sentido inverso
8 Zero Ambos concordam
6 2 Discordncia pequena
8
Zero 8 Classificao errada (CE)
10 -4 Discordncia grande no sentido inverso
8 -2 Discordncia pequena no sentido inverso
6 Zero Ambos concordam
6
Zero 6 Classificao errada (CE)
10 -10 Alarme falso (AF)
8 -8 Alarme falso (AF)
6 -6 Alarme falso (AF)
Zero
Zero Zero Ambos concordam
Observa-se, portanto, a partir das informaes da tabela (3.1), que as possibilidades
de diferenas envolvem exclusivamente nmeros inteiros 10, -8, -6, -4, -2, 0, 2, 4, 6, 8 e 10.
Conclui-se assim que, exceto pelo fato da presena de nmero negativos, atendida uma das
condies da distribuio de Poisson, que a presena exclusiva de nmeros inteiros e no-
negativos.
Uma vez determinadas as quatro respostas que representam a qualidade do produto,
Arriba (2005) elege, a partir de consideraes da engenharia, os fatores controlveis que
podem vir a influenciar as respostas. So eles: (i) a procedncia da matria-prima (couro), (ii)
a umidade da matria-prima, (iii) o mtodo de classificao e (iv) o classificador.
O primeiro fator a procedncia do couro. Na origem, o couro j fornecido ao
curtume com uma determinada finalidade de uso. No incio do processo de classificao,
estgio wet-blue, o classificador confirma esta finalidade. Caso ele no concorde com a
atribuio dada na origem, ele lhe dar nota zero, pois considerou que a classificao foi
errada. O mesmo pode acontecer nos estgios seguintes do processo sempre em relao
etapa anterior, conforme a direo das setas na figura (3.2). So estudadas duas origens:
Centro e Norte. Este fator designado pela abreviao PD e claramente qualitativo.
O segundo fator a umidade, testada em trs nveis: molhado, enxuto e rebaixado
(mais seco). A umidade, acredita-se, pode afetar as notas que se atribuem s peles. Em geral,
62
quanto mais enxuta apresentar-se a pele, mais fidedignas so as classificaes. Arriba (2005)
explica que este poderia ser um fator quantitativo, porm o medidor de umidade impreciso,
o que levou a trat-lo tambm como qualitativo e sob a abreviao UM.
O mtodo de classificao pode ser de dois tipos: esttico ou dinmico. No mtodo
esttico o couro classificado sobre o prprio pallet e o classificador usa o tempo que quiser
para dar a nota. Neste caso, em geral, o tempo de classificao maior, sendo que a distncia
entre o classificador e o couro, bem como a iluminao, so mantidos constantes, por serem
potenciais fatores importantes de rudo. No segundo mtodo, a classificao feita ao longo
de uma esteira mvel que usada pela mquina de enxugar. Portanto, neste caso, a velocidade
da esteira que determina o ritmo de classificao. Este fator , portanto, qualitativo e ser
identificado pela abreviao TE, por envolver o tempo.
Arriba (2005) treinou trs funcionrios experientes para realizar os testes. Estes
classificadores sero designados por Ademir, Geraldo e Valdecir. A deciso de incluir o fator
classificador na anlise foi baseada no fato do mtodo de classificao ser bastante subjetivo
e, portanto, o treinamento da equipe de classificao deve ser feito de tal forma a reduzir-se
ou padronizar-se tanto quanto possvel esta subjetividade. Analisar o fator classificador
poder indicar seu efeito sobre a qualidade do processo, imediato perceber que tambm
qualitativo, e referido com a abreviao CL.
A tabela (3.2) apresenta os fatores, seus nveis e a codificao de nveis usada por
Arriba (2005) e adotada tambm aqui.
Tabela (3.2)
Fatores, nveis e nveis codificados do experimento
Fator Nveis Nveis Codificados
Centro -1
Procedncia (PD)
Norte +1
Molhado -1
Enxuto 0 Umidade (UM)
Rebaixado +1
Ademir -1
Geraldo 0 Classificador (CL)
Valdecir +1
Esttico -1
Mtodo (TE)
Dinmico +1
Fonte: adaptado Arriba (2005).
A combinao dos quatro fatores em seus dez nveis de investigao perfaz um total
de 36 arranjos (ou combinaes) possveis: trata-se de um projeto fatorial 2
2
* 3
2
. Arriba
63
(2005) replicou cada uma dessas combinaes 20 vezes em seu experimento fatorial
completo, totalizando 720 rplicas para cada um dos artigos analisados. Quatro artigos foram
estudados: nubuck chocolate, naplex preto, diamond preto e nubuck bege. Cada um destina-se
a uma finalidade em termos de uso final. Esta dissertao desenvolver sua proposta com o
artigo nubuck chocolate exclusivamente.
A tabela (3.3) exemplifica um dos tratamentos experimentais rodados por Arriba
(2005). No tratamento em questo, o fator TE esttico (nvel -1), o fator CL Valdecir
(nvel +1), o fator UM molhado (nvel -1) e o fator PD Centro (nvel -1). A tabela (3.3)
informa as notas dadas pelo classificador no estgio wet-blue e pelo seu supervisor no mesmo
estgio (sexta e primeira colunas, respectivamente). A diferena entre ambos dada na stima
coluna (Y
1
). A mdia e desvio-padro dos vinte valores da coluna Y
1
so apresentados nas
ltimas linhas da referida tabela. Calcula-se tambm o percentual referente ao total de
classificaes erradas e alarme falso nas vinte observaes. O mesmo feito com as colunas
Y
2
e Y
3
. Observe-se que Y
2
traz as diferenas entre a nota dada pelo classificador no estgio
wet-blue e quando o produto vai para o processo semi-acabado. O mesmo ocorre com Y
3
,
entre as etapas de semi-acabado e acabado.
Tabela (3.3)
Exemplo de tratamento experimental e variveis de resposta
Artigo:Nubuck Bege
Umidade:Molhado
Mtodo: Esttico
Classificador: Valdecir
N
o
t
a

a
t
r
i
b
u

d
a

B
L
U
E

N
o
t
a

a
t
r
i
b
u

d
a

S
E
M
I

N
o
t
a

a
t
r
i
b
u

d
a

A
C
A
B
A
D
O

P
r
o
c
e
d

n
c
i
a

O
r
d
e
m

d
a

p
e
l
e

Nota Y1 Y2 Y3
0 6 6 1 6 6 0 0
6 6 6 2 8 2 2 2
10 10 10 3 10 0 0 0
8 10 10 4 6 -2 -4 -4
10 10 10 5 8 -2 -2 -2
6 10 0 6 8 2 -2 8
8 8 8 7 6 -2 -2 -2
0 10 6
C
e
n
t
r
o

8 8 8 -2 2
64
Tabela (3.3)
Exemplo de tratamento experimental e variveis de resposta (continuao)
Artigo:Nubuck Bege
Umidade:Molhado
Mtodo: Esttico
Classificador: Valdecir
N
o
t
a

a
t
r
i
b
u

d
a

B
L
U
E

N
o
t
a

a
t
r
i
b
u

d
a

S
E
M
I

N
o
t
a

a
t
r
i
b
u

d
a

A
C
A
B
A
D
O

P
r
o
c
e
d

n
c
i
a

O
r
d
e
m

d
a

p
e
l
e

Nota Y1 Y2 Y3
6 10 8 9 6 0 -4 -2
10 10 10 10 8 -2 -2 -2
8 10 8 11 8 0 -2 0
0 6 0 12 8 8 2 8
0 10 6 13 8 8 -2 2
6 8 8 14 6 0 -2 -2
10 10 10 15 6 -4 -4 -4
8 8 8 16 6 -2 -2 -2
10 10 10 17 6 -4 -4 -4
6 10 8 18 8 2 -2 0
8 10 10 19 6 -2 -4 -4
0 6 6
C
e
n
t
r
o

20 6 6 0 0
6,0 8,9 7,4 Mdia total 7,1 1,1 -1,8 -0,3

Desvio-padro 4,0 1,8 3,5

% Prob (CE) 25 0 10

% Prob (AF) 0 0 0
Fonte: adaptado Arriba (2005)
Arriba (2005) utilizou o seguinte mtodo de otimizao em seu experimento.
Primeiramente o autor tomou as 720 observaes para o artigo nubuck chocolate, lembre-se
que cada tratamento foi replicado 20 vezes. Para cada grupo de 20 rplicas foram calculados
Y
1
,Y
2
, e Y
3
, e, para cada uma dessas respostas calculou-se a mdia, o desvio-padro, a
probabilidade de classificao errada e a probabilidade de alarme falso.
65
Em concomitncia, Arriba (2005) associou a varivel de resposta Y
1
aos fatores do
experimento, atravs de regresso linear clssica (para uma introduo sobre o tema, ver
Montgomery, Peck e Vining, 2006). O procedimento foi repetido, obtendo modelos de
regresso para a probabilidade de classificao errada e a probabilidade de alarme falso,
associando-as aos fatores do experimento. Para cada tratamento foram calculados os desvios-
padro da resposta Y
1
e, por regresso linear clssica, estes foram associados aos fatores do
experimento. O mesmo foi tambm realizado para Y
2
e Y
3
. A significncia dos termos
inseridos em todos os modelos de regresso foi analisada atravs de anlise de varincia
(ANOVA). Os resultados obtidos por Arriba (2005) para o artigo nubuck chocolate so
apresentadas nas equaes (3.1). Os coeficientes de determinao R
2
dos modelos por ele
encontrados so 0,33, 0,51 e 0,33, respectivamente.
2
1
2
1
1
1
58 , 9 08 , 17 ) (
54 , 8 29 , 2
29 , 2 29 , 2 67 , 21 ) (
44 , 0 73 , 3 ) (
35 , 0 56 , 0 45 , 0
UM AF PROB
UM CL TE PD
CL UM CE PROB
UM Y DesvPad
CL TE UM CL Y
Y
Y
(3.1)
Existe uma graduao de importncia entre as respostas modeladas nas equaes
(3.1); esta graduao definida conforme o impacto financeiro representado por cada resposta
e foi definida por experincia da equipe. Arriba (2005) atribuiu pesos a cada uma delas
conforme a tabela (3.4). Nota-se que a soma dos pesos de ponderao leva unidade.
Tabela (3.4)
Pesos de ponderao para cada varivel de resposta
Varivel de resposta Peso
Y
1
0,15
Desvio-padro 0,20
Probabilidade de classificao errada 0,40
Probabilidade de alarme falso 0,25
Fonte: adaptado Arriba (2005)
Para unir as respostas em um nico valor adimensional, Arriba (2005) divide o
resultado de cada equao por sua respectiva mdia total (considerando 720 valores no caso
de Y
1
e 36 valores no caso do desvio-padro e das probabilidades). Cada quociente, formado
pela equao de regresso e sua respectiva mdia geral, multiplicado pelo seu valor de
ponderao; finalmente, somam-se os resultados para obter a funo objetivo Z
i
. O resultado
Z
1
, para a varivel de resposta Y
1
e estatsticas dela derivadas, apresentado na seqncia. O
mesmo procedimento repetido para as variveis Y
2
e Y
3
.
66
l_Prob(AF) mdia_gera
Prob(AF)
l_Prob(CE) mdia_gera
CE Prob
padro desvio geral mdia
Y Desvpad
Y geral mdia
Y
Z
25 , 0
) (
40 , 0
_ _
) (
20 , 0
_ _
15 , 0
1
1
1
1
(3.2)
Conforme definido anteriormente, Y
1
corresponde diferena de notas atribudas
entre o classificador e seu supervisor no estgio wet-blue, Y
2
representa a diferena de notas
entre a classificao de wet-blue e semi-acabado, e Y
3
corresponde diferena de notas de
classificao entre wet-blue e a fase final do processo de curtimento, conhecido como
acabado. As equaes (3.1) e (3.2) tambm foram geradas para as respostas Y
2
e Y
3
. Arriba
(2005) atribui uma importncia a cada um desses estgios (ou etapa de classificao),
conforme apresentado na tabela (3.5).
Tabela (3.5)
Pesos de ponderao para cada estgio de classificao
Estgio Peso
Classificao de produto final (Y
3
) 0,50
Classificao de wet-blue (Y
1
) 0,35
Classificao em semi-acabado (Y
2
) 0,15
Fonte: adaptado Arriba (2005)
A otimizao encaminhada, a partir deste ponto, multiplicando-se os valores Z
1
, Z
2
e Z
3
por seus respectivos pesos e somando-se estas parcelas, como apresentado na equao
(3.3).
3 2 1
50 , 0 15 , 0 35 , 0 Z Z Z Z
Total
(3.3)
Para finalizar a otimizao, Arriba (2005) calcula os valores Z
Total
para os 36
tratamentos experimentais. A tabela (3.6) apresenta os resultados encontrados por Arriba
(2005) para o artigo nubuck chocolate.
Os valores-alvo para as respostas Y
1,
Y
2
e Y
3
so iguais a zero, o que indicaria a menor
diferena existente entre as notas dadas entre cada etapa do processo. Para o desvio-padro de
Y
i
, o alvo tambm zero, assim como para as probabilidades de classificao errada e alarme
falso. Desta forma, desejvel que Z
Total
seja o mais prximo de zero. Ou seja, a combinao
dos nveis dos fatores que conduzir ao Z
Total
mais prximo de zero significa a resposta
67
otimizada do experimento. O primeiro tero dos menores valores resultantes de Z
total
esto
sombreados na tabela (3.6), que so, em ordem, os tratamentos: 13, 15, e 14.
Tabela (3.6)
Valores da funo objetivo Z
total.
Valores timos sombreados
Tratamento

PD UM TE CL Z
Total
Tratamento

PD UM TE CL Z
Total
1 -1 -1 -1 -1 0,98 19 +1 -1 -1 -1 1,01
2 -1 -1 -1 +1 1,12 20 +1 -1 -1 +1 1,02
3 -1 -1 -1 0 1,00 21 +1 -1 -1 0 0,96
4 -1 -1 +1 -1 0,86 22 +1 -1 +1 -1 1,09
5 -1 -1 +1 +1 0,86 23 +1 -1 +1 +1 1,12
6 -1 -1 +1 0 0,86 24 +1 -1 +1 0 1,10
7 -1 0 -1 -1 1,03 25 +1 0 -1 -1 1,20
8 -1 0 -1 +1 1,11 26 +1 0 -1 +1 1,15
9 -1 0 -1 0 1,05 27 +1 0 -1 0 1,16
10 -1 0 +1 -1 1,07 28 +1 0 +1 -1 1,16
11 -1 0 +1 +1 1,07 29 +1 0 +1 +1 1,19
12 -1 0 +1 0 1,05 30 +1 0 +1 0 1,16
13 -1 +1 -1 -1 0,76 31 +1 +1 -1 -1 1,07
14 -1 +1 -1 +1 0,84 32 +1 +1 -1 +1 1,02
15 -1 +1 -1 0 0,80 33 +1 +1 -1 0 1,05
16 -1 +1 +1 -1 0,97 34 +1 +1 +1 -1 0,91
17 -1 +1 +1 +1 1,02 35 +1 +1 +1 +1 1,01
18 -1 +1 +1 0 0,94 36 +1 +1 +1 0 0,91
Fonte: adaptado Arriba (2005)
3.2 METODOLOGIA APLICADA
68
Um dos objetivos desta dissertao otimizar um experimento multiresposta, onde
ao menos uma das variveis de resposta seja categrica. No experimento conduzido e
otimizado por Arriba (2005), as respostas Y
1
, Y
2
e Y
3
so claramente categricas. No entanto,
nenhuma instncia da famlia exponencial de distribuies de probabilidade abordadas no
Captulo 2 se adequa s caractersticas das respostas Y
1
, Y
2
e Y
3
, j que suas realizaes podem
assumir valores inteiros positivos, negativos ou zero. Para contornar este problema, deve-se
somar uma constante a cada resposta Y
i
de forma a eliminar os valores negativos. Feita essa
mudana de escala, as respostas Y
1
, Y
2
e Y
3
passam a ser descritas, acredita-se, por uma
distribuio de Poisson.
A tabela (3.1) apresenta os possveis resultados das variveis Y
i
. Se a elas adicionar-
se a constante +10, os valores iniciais 10, -8, -6, -4, -2, 0, 2, 4, 6 8 e 10, sero trasladados na
mesma ordem 0, 2, 4, 6, 2, 10, 12, 14, 16, 18 e 20.
Aplicando-se os testes de aderncia (goodness of fit test) de Kolmogorov-Smirnov e
Anderson-Darling, descritos por Kelton e Law (1991), atravs da verso estudantil do
software Statfit, no possvel rejeitar a hiptese de distribuio de Poisson para as respostas
Y
i
, com um grau de confiana superior a 99,9%. importante ressalvar que, nos testes de
aderncia, no foram utilizados todos os valores de Y
i
, pois tais testes deterioram-se na
medida em que o tamanho de amostra aumenta (ver Kelton e Law, 1991, p.387). Assim, do
conjunto de 720 observaes para cada varivel de resposta foram selecionadas,
aleatoriamente, 50 observaes, as quais foram usadas nos testes de aderncia.
Uma vez identificada a distribuio de probabilidade que melhor se encaixa na
famlia exponencial - no caso a distribuio de Poisson - realizado todo o procedimento de
regresso detalhado na primeira seo do captulo 2 segundo a tcnica dos modelos lineares
generalizados. Pretende-se assim, conforme j apresentado anteriormente, evitar-se o
equvoco incorrido por Arriba (2005) em executar a regresso utilizando o mtodo dos
mnimos quadrados em variveis de resposta categricas.
Os fatores procedncia, umidade, mtodo de classificao e classificador so todos
apresentados em nveis discretos, ou seja, seus nveis no so valores contnuos. Segundo
Gujarati (2006), nestes casos a regresso deve considerar as variveis regressoras os fatores
como variveis dummy. Isto se deve ao fato que, por serem discretos, cada nvel estar
presente ou no na equao de regresso. Por exemplo, tome-se o fator classificador. Segundo
69
a tabela (3.2) h trs nveis possveis neste fator: Ademir, Geraldo e Valdecir. Estes nveis so
mutuamente exclusivos na equao de regresso, ou seja, se Ademir est presente gerando um
certo valor resposta da equao, Geraldo e Valdecir esto obrigatoriamente ausentes.
Na regresso por variveis dummy, portanto, os nveis apresentam-se com a nica
possibilidade de assumirem os valores 1 (quando presentes) ou zero (quando ausentes). Neste
mtodo, um nvel de cada fator ser considerado como grupo de controle, significa que todos
os outros nveis dos fatores so zero. Este outro grupo conhecido por grupo de tratamento.
Quando um nvel do grupo de tratamento assume o valor 1 ou seja, est presente a
equao de regresso expressa o quanto altera-se seu resultado sobre os nveis do grupo de
controle. Desta forma, nesta dissertao, sero considerados os fatores como variveis dummy
em todas as regresses. Este procedimento corrige uma falha nas regresses de Arriba (2005).
O prximo passo metodolgico a ser seguido ser obter um modelo de regresso para
os desvios-padro, calculados com os novos valores de Y
1
, Y
2
e Y
3
aps deslocamento de 10
unidades nos valores observados. Mais uma vez os testes de aderncia de Kolmogorov-
Smirnov e Anderson-Darling foram rodados e a hiptese de normalidade dos desvios no
pode ser rejeitada, o que habilita o uso do mtodo dos mnimos quadrados na regresso, no
entanto, esta regresso ser conduzida pelo mtodo dos modelos lineares generalizados
usando uma funo de ligao apropriada para respostas normais, conforme apresentado na
tabela (2.2).
O prximo passo a ser cumprido a modelagem de regresso das probabilidades de
classificao errada (CE) e alarme falso (AF), desta vez modelados considerando que os
fatores tm nveis em variveis discretas, portanto dummy. Estes procedimentos de regresso
sero idnticos ao descrito no pargrafo anterior.
Em seguida todo o procedimento de otimizao de Arriba (2005) repetido, porm
com as modelagens de regresso apropriadas, ou seja, modelagem por modelos lineares
generalizados com funo de ligao de Poisson, e ainda considerando os fatores como
variveis dummy. Conforme apresentado na seo anterior, o melhor valor para a funo
objetivo Z
i
de Arriba (2005) zero. Na reanlise do experimento a situao muda devido
translao dos resultados do experimento, e o novo valor alvo ser 10. Assim, o valor de Y
i
que representa a menor quantidade de erros aquele que est no ponto mdio da escala, ou
seja, 10. Os desvios-padro e as duas probabilidades devem assumir valores to pequenos
70
quanto possveis. Ser montada, ento, uma tabela similar tabela (3.6) para a eleio dos
fatores e nveis que implicam na melhor forma de seleo de couros.
A modelagem por modelos lineares generalizados exige que se considere uma
distribuio de probabilidade para as respostas do experimento. No presente caso, atribui-se a
distribuio de Poisson baseando-se em dois argumentos principais: as respostas so valores
inteiros e no-negativos e ainda nos resultados dos testes de Kolmogorov-Smirnov e
Anderson-Darling que indicaram que no se pode rejeitar a hiptese desta distribuio no ser
de Poisson. No entanto, embora a possibilidade de erro seja exgua, por precauo contra o
erro ser tambm conduzida, para as respostas Y
1
, Y
2
e Y
3
a regresso por quase-
verossimilhana que no exige a priori que estas respostas atendam obrigatoriamente a uma
distribuio de probabilidade.
Caso haja uma diferena significativa entre os resultados da regresso por modelos
lineares generalizados com funo de ligao de Poisson e a modelagem por quase-
verossimilhana, optar-se- pela segunda.
Assim pretende-se cumprir com o primeiro objetivo especfico desta dissertao. O
prximo objetivo apresentar uma alternativa de otimizao quela utilizado por Arriba
(2005). Para tanto, o procedimento adotado por Chng, Quah e Low (2005) para a capacidade
de processos do tipo C
pm
ser aplicado para as equaes de regresso Y
1
; desvio-padro;
probabilidade de classificao errada e probabilidade de alarme falso. Os valores de
ponderao citados na tabela (3.4) sero utilizados, conforme preconizado pelas equaes
(2.61) e (2.62), segundo a caracterstica da varivel de resposta.
O mesmo procedimento ser adotado para as equaes de regresso Y
2
e Y
3
, e seus
respectivos desvios-padro e probabilidades de classificao errada (CE) e alarme falso (AF),
obedecendo aos pesos de ponderao que Arriba (2005) usou conforme a tabela (3.4) dentro
da equao (2.60). Neste momento ser montado o tableau de otimizao segundo o
algoritmo do gradiente generalizado reduzido, disponvel pela ferramenta Solver do Excel .
Neste tableau, tal qual realizado por Chng, Quah e Low (2005), os nveis dos fatores sero
designados como inteiros variando entre 0 e 1. Pois, cada nvel passa a ser uma varivel que
assume um desses dois valores. Isto se deve instruo de exclusividade entre os nveis em
virtude das variveis dummy dos fatores.
71
Encerrando, o valores de TotalC
pm
da equao (2.61) sero ponderados para Y
1
, Y
2
e
Y
3
, e ainda segundo os pesos da tabela (3.5). Este procedimento ser realizado uma nica vez,
pois o algoritmo busca um timo total dentro de todas as possibilidades de nveis que os
fatores podem assumir. Desta forma, usando-se o mtodo de otimizao proposto com o uso
do TotalC
pm
e os mesmo pesos de Arriba (2005), encontra-se uma nova forma de identificar
os nveis timos onde os fatores produzem o menor erro de classificao entre as etapas de
curtimento do couro. A figura (3.3) resume de forma sucinta os passos que so cumpridos a
partir de adiante.
Figura (3.3) Metodologia da dissertao
Dados do experimento de Arriba (2005)
Modelagem por GLM Poisson.
Considerando variveis dummy.
Modelagem por quase-verossimilhana
Considerando variveis dummy.
Deciso
entre GLM (Poisson)
e quase-verossimilhana
Modelagens:
Desvio-padro, Classificao Errada (CE) e
Alarme Falso (AF). Todos por variveis dummy.
Otimizao realizada por
Arriba (2005)
Reproduo do mtodo de otimizao realizado
por Arriba (2005) com as novas regresses
(crtica)
Otimizao por TotalCpm
Deciso
entre os dois mtodos
de otimizao
Concluso
Dados do experimento de Arriba (2005)
Modelagem por GLM Poisson.
Considerando variveis dummy.
Modelagem por quase-verossimilhana
Considerando variveis dummy.
Deciso
entre GLM (Poisson)
e quase-verossimilhana
Modelagens:
Desvio-padro, Classificao Errada (CE) e
Alarme Falso (AF). Todos por variveis dummy.
Otimizao realizada por
Arriba (2005)
Reproduo do mtodo de otimizao realizado
por Arriba (2005) com as novas regresses
(crtica)
Otimizao por TotalCpm
Deciso
entre os dois mtodos
de otimizao
Concluso
72
Captulo 4
Conforme exposto na figura (3.3) a primeira etapa neste captulo conduzir, a partir
dos dados do experimento de Arriba (2005), a regresso por modelos lineares generalizados
com funo de ligao de Poisson; e tambm a regresso do mesmo experimento pelo mtodo
da quase-verossimilhana.
Aps os resultados destas duas regresses, ser feita a comparao entre ambas de
forma a decidir qual delas ser otimizada segundo o mtodo de Arriba (2005), e,
posteriormente, ser maximizada pelo mtodo do ndice mltiplo de capacidade de processos,
TotalC
pm
, de forma a permitir a comparao entre os dois mtodos de otimizao.
4.1 AS REGRESSES POR MODELOS LINEARES GENERALIZADOS E QUASE-
VEROSSIMILHANA
No anexo B de Arriba (2005, p.131) so apresentados os fatores, os nveis e as
respostas encontradas, os quais sero utilizadas neste trabalho. Conforme mencionado no
captulo anterior, especificamente a tabela (3.2), os fatores so Procedncia (PD), Umidade
(UM), Mtodo de Classificao (TE) e Classificador (CL). Os fatores PD e TE so explorados
em dois nveis (-1 e +1); j os fatores UM e CL so explorados em trs nveis (-1, 0, +1).
Todos os nveis so codificados. Vale ainda ressaltar que o produto cujos dados so
analisados nesta dissertao o nubuck chocolate, relatado em Arriba (2005).
O procedimento de regresso apresentado no captulo 2 foi executado com o uso do
software estatstico R. Este software foi selecionado por permitir o uso de diversas funes de
ligao para a regresso por modelos lineares generalizados, inclusive a funo de ligao de
Poisson. Alm do mais, o programa gratuito e pode ser baixado da internet. Sua
programao e atualizao permanentemente mantida por um comit de programadores e
estatsticos em universidades de diversos pases numa espcie de regime cooperativado.
O apndice A apresenta passo a passo as instrues que devem ser dadas o software
para cada uma das duas regresses. A tabela (4.1) apresenta os resultados da equao de
73
regresso de Y
1
. Tanto para Y
1
, quanto para Y
2
e Y
3
as respostas do experimento de Arriba
(2005) foram somadas por +10, de forma a que apenas valores inteiros e no-negativos
estivessem presentes, adequando-se assim a uma distribuio de Poisson. Alm disso, nas
regresses de Y
1
, Y
2
e Y
3
foram consideradas as interaes at segunda ordem entre os fatores.
No conjunto de tabelas que se segue, esto com fundo sombreado em destaque os
coeficientes que resultaram em um nvel de significncia de pelo menos 95%. As duas ltimas
colunas apresentam o valor do teste de confiabilidade destes coeficientes, sendo que a
probabilidade da significncia no apresentada para os coeficientes que no resultaram em
pelos menos 95% de significncia.
Na coluna que nomeia o coeficiente - primeira coluna da referida tabela observa-se
que, com exceo do termo independente (intercesso), cada fator apresentado com o
subscrito do nvel ao qual a estimativa do coeficiente refere-se. Isto decorrncia da regresso
conduzida considerando que os nveis dos fatores so discretos, portanto, ou variveis dummy.
A ltima linha apresenta ainda o valor da deviance que indica, quanto menor seu valor for, a
validade do modelo conforme apresentado no capitulo 2 desta dissertao.
Tabela (4.1)
Resultado da regresso de Y
1
por modelo linear generalizado
Coeficiente Estimativa Desvio-padro Z-valor Pr(>z)
Intercesso 2,4270 0,0332 73,053 ~100%

CL
GERALDO
-0,1145 0,0484 -2,366 99%

CL
VALDECIR
-0,1071 0,0483 -2,217 99%

UM
ENXUTO
-0,0949 0,0481 -1,971 99%

UM
REBAIXADO
0,0110 0,0469 0,234

CL
GERALDO
xUM
ENXUTO
0,1096 0,0691 1,586

CL
VALDECIR
xUM
ENXUTO
0,1545 0,0686 2,253 99%

CL
GERALDO
xUM
REBAIXADO
-0,0855 0,0690 -1,238

CLV
ALDECIR
xUM
REBAIXADO
-0,0036 0,0681 -0,053

Deviance 1088,533
Portanto, com base na tabela (4.1) a equao de regresso de Y
1
por modelos lineares
generalizados :
74
Enxuto Valdecir Enxuto
Valdecir Geraldo
UM CL UM
CL CL
1545 , 0 0949 , 0
1071 , 0 1145 , 0 4270 , 2
1
(4.1)
Retornando questo das variveis dummy, observe-se que, tomando como exemplo
o caso do fator classificador (CL), a presena do classificador Geraldo reduz o termo
independente em 0,1145. Pois, segundo a explicao dada no captulo anterior, todos os
coeficientes das regresses que tm nveis discretos podem assumir unicamente os valores 1
ou 0. Assim, se o classificador Geraldo for 1, significa que ele est presente e altera,
reduzindo em 0,1145 a ao do classificador Ademir representado, junto com os demais
fatores do grupo de controle no termo independente. Quando, portanto, a varivel CL
Geraldo
for
1, a varivel CL
Valdecir
deve ser zero.
Se todas as variveis da equao (4.1) forem zero, a equao resulta no termo
independente. Este resultado o grupo de controle, que neste caso - j que apenas os fatores
classificador (CL) e umidade (UM) resultaram em significativos - implica que o nvel do fator
classificador Ademir (codificado como -1) e o nvel umidade molhado (codificado como -
1). A presena de qualquer outro nvel, caso de qualquer varivel da equao (4.1) assumir o
valor 1, significa o efeito que esta presena exerce sobre os nveis dos fatores do grupo de
controle, e por isto, estes nveis presentes na equao (4.1) so chamados grupo de
tratamento. Mais detalhes da regresso por variveis dummy encontra-se em Gujarati (2006).
A tabela (4.2) e a equao (4.2) apresentam os resultados da regresso por modelos
lineares generalizados da resposta Y
2
.
Tabela (4.2)
Resultado da regresso de Y
2
por modelo linear generalizado
Coeficiente Estimativa Desvio-padro Z-valor Pr(>z)
Intercesso 2,1432 0,0394 54,346 ~100%

PD
NORTE
0,1415 0,0259 5,455 ~100%

CL
GERALDO
-0,1433 0,0542 -2,645 99,9%

CL
VALDECIR
-0,1339 0,0540 -2,478 99%

UM
ENXUTO
-0,1185 0,0538 -2,201 99%

UM
REBAIXADO
0,0135 0,0520 0,260

CL
GERALDO
xUM
ENXUTO
0,1372 0,0775 1,769 95%

75
Tabela (4.2)
Resultado da regresso de Y
2
por modelo linear generalizado (continuao)
Coeficiente Estimativa Desvio-padro Z-valor Pr(>z)
CL
VALDECIR
xUM
ENXUTO
0,1935 0,0768 2,519 99%

CL
GERALDO
xUM
REBAIXADO
-0,1092 0,0775 -1,408

CL
VALDECIR
xUM
REBAIXADO
-0,0042 0,0762 -0,056

Deviance 1667,457
Enxuto Valdecir Enxuto Geraldo
Enxuto Valdecir
Geraldo Norte
UM CL UM CL
UM CL
CL PD
1935 , 0 1372 , 0
1185 , 0 1339 , 0
1433 , 0 1415 , 0 1432 , 2
2
(4.2)
O mesmo tambm apresentado para a regresso de Y
3
.
Tabela (4.3)
Resultado da regresso de Y
3
por modelo linear generalizado
Coeficiente Estimativa Desvio-padro Z-valor Pr(>z)
Intercesso 2,0458 0,0461 44,385 ~100%

CL
GERALDO
-0,1057 0,0674 -1,567

CL
VALDECIR
-0,1163 0,0672 -1,732 95%

PD
NORTE
0,0959 0,0462 2,076 99%

UM
ENXUTO
-0,1349 0,0574 -2,348 99%

UM
REBAIXADO
0,0153 0,0553 0,276

CL
GERALDO
xPD
NORTE
-0,1133 0,0680 -1,667 95%

CL
VALDECIR
xPD
NORTE
-0,0705 0,0667 -1,057

CL
GERALDO
xUM
ENXUTO
0,1564 0,0830 1,885 95%

CL
VALDECIR
xUM
ENXUTO
0,2207 0,0820 2,689 99,9%

CL
GERALDO
xUM
REBAIXADO
-0,1263 0,0830 -1,521

CL
VALDECIR
xUM
REBAIXADO
-0,0046 0,0814 -0,056

Deviance 1720,766
76
Enxuto Valdecir Enxuto Geraldo
Norte Geraldo Enxuto
Norte Valdecir
UM CL UM CL
PD CL UM
PD CL
2207 , 0 1564 , 0
1133 , 0 1349 , 0
0959 , 0 1163 , 0 0458 , 2
3
(4.3)
Assim, completam-se todas as regresses de Y
i
pelo mtodo dos modelos lineares
generalizados. Como dito anteriormente, admitiu-se que as respostas do experimento de
Arriba (2005) acrescidas do valor +10 configuraram uma distribuio de Poisson. Esta
hiptese foi ainda novamente confirmada pelos testes de ajustamento de Kolmogorov-
Smirnov e Anderson-Darling que indicaram, com aproximadamente 100% de confiana, que
no se pode rejeit-la. No entanto, por precauo a bem da correta regresso a ser usada no
caso do experimento de Arriba (2005), so apresentadas tambm as regresses das mesmas
respostas pelo mtodo da quase-verossimilhana, tal qual feito imediatamente acima.
As tabelas (4.4), (4.5) e (4.6) e as equaes (4.4) , (4.5) e (4.6) apresentam os
resultados das regresses por quase-verossimilhana das respostas Y
1
, Y
2
e Y
3
,
respectivamente de Arriba (2005). O procedimento foi executado pelo software estatstico R e
as instrues de uso encontram-se no apndice A.
Tabela (4.4)
Resultado da regresso de Y
1
por quase-verossimilhana
Coeficiente Estimativa Desvio-padro Z-valor Pr(>z)
Intercesso 2,4270 0,0393 61,770 ~100%

UM
ENXUTO
-0,0949 0,0569 -1,666 95%

UM
REBAIXADO
0,0111 0,0554 0,198

CL
GERALDO
-0,1145 0,0572 -2,000 99%

CL
VALDECIR
-0,1071 0,0571 -1,875 95%

UM
ENXUTO
xCL
GERALDO
0,1096 0,0817 1,341

UM
REBAIXADO
xCL
GERALDO
-0,0855 0,0817 -1,047

UM
ENXUTO
xCL
VALDECIR
0,1545 0,0811 1,905 95%

UM
REBAIXADO
xCL
VALDECIR
-0,0036 0,0806 -0,045

Deviance 1088,533
Valdecir baixado Valdecir
Geraldo Enxuto
CL UM CL
CL UM
Re
1
1545 , 0 1071 , 0
1145 , 0 0949 , 0 4270 , 2
(4.4)
77
Tabela (4.5)
Resultado da regresso de Y
2
por quase-verossimilhana
Coeficiente Estimativa Desvio-padro Z-valor Pr(>z)
Intercesso 2,1432 0,0521 41,114 ~100%

PD
NORTE
0,1415 0,0343 4,127 ~100%

UM
ENXUTO
-0,1185 0,0711 -1,665 95%

UM
REBAIXADO
0,0135 0,0688 0,197

CL
GERALDO
-0,1433 0,0716 -2,001 99%

CL
VALDECIR
-0,1339 0,0714 -1,875 95%

UM
ENXUTO
xCL
GERALDO
0,1372 0,1025 1,338

UM
REBAIXADO
xCL
GERALDO
-0,1092 0,1025 -1,065

UM
ENXUTO
xCL
VALDECIR
0,1935 0,1015 1,906 95%

UM
REBAIXADO
xCL
VALDECIR
-0,0042 0,1007 -0,042

Deviance 1667,457
Valdecir Enxuto
Valdecir Geraldo
Enxuto
CL UM
CL CL
UM
1935 , 0
1339 , 0 1433 , 0
1185 , 0 PD 0,1415 2,1432
Norte 2
(4.5)
Tabela (4.6)
Resultado da regresso de Y
3
por quase-verossimilhana
Coeficiente Estimativa Desvio-padro Z-valor Pr(>z)
Intercesso 2,0949 0,0503 41,643 ~100%

CL
GERALDO
-0,1634 0,0742 -2,201 99%

CL
VALDECIR
-0,1526 0,0740 -2,062 99%

UM
ENXUTO
-0,1349 0,0737 -1,831 95%

UM
REBAIXADO
0,0153 0,0709 0,215

CL
GERALDO
xUM
ENXUTO
0,1564 0,1064 1,469

CL
VALDECIR
xUM
ENXUTO
0,2207 0,1053 2,096 95%

CL
GERALDO
xUM
REBAIXADO
-0,1263 0,1065 -1,186

CL
VALDECIR
xUM
REBAIXADO
-0,0046 0,1043 -0,044

78
Tabela (4.6)
Resultado da regresso de Y
3
por quase-verossimilhana (continuao)
Coeficiente Estimativa Desvio-padro Z-valor Pr(>z)
Deviance 1725,482

Enxuto Valdecir Enxuto
Valdecir Geraldo
UM CL UM
CL CL
2207 , 0 1349 , 0
1526 , 0 1634 , 0 0949 , 2
3
(4.6)
A deciso entre usar-se de agora em diante as regresses geradas pelos modelos
lineares generalizados ou pela quase-verossimilhana ser decidida pelos respectivos valores
da funo de desvio, ou deviance. Conforme Dobson (1990) valores mais elevados da
deviance sugerem modelos mais fracos na descrio dos dados, conforme tambm se verifica
pela equao (2.24). Comparando-se par a par as regresses realizadas, observa-se pela ltima
linha das tabelas (4.1) a (4.6) que os valores da deviance para as duas regresses de Y
1
so
iguais a 1080,533. O mesmo acontece com Y
2
: 1667,457. Apenas para Y
3
h uma ligeira
diferena a favor da regresso por modelos lineares generalizados que apresentou deviance de
1720,766 contra 1725,482 do mtodo da quase-verossimilhana.
Estas proximidades de valores de deviance obviamente no so coincidncias, mas
uma justificativa a mais para confirmar-se que a distribuio das respostas do experimento de
Arriba (2005) atendem a uma distribuio de Poisson. Desta forma, as duas otimizaes que
sero executadas a seguir consideram os coeficientes gerados pelas regresses do mtodo dos
modelos lineares generalizados expressos pelas equaes (4.1), (4.2) e (4.3).
4.2 A OTIMIZAO DO EXPERIMENTO COM RESPOSTA DE POISSON
Na descrio dos modelos lineares generalizados, em dado momento do
procedimento de regresso, tem que se escolher uma funo de ligao. No presente caso esta
funo de ligao foi =ln( ), devido ligao cannica recomenda pela tabela (2.2). Como

o resultado de um logaritmo, as predies obtidas a partir das equaes acima sero dadas
por:
1
1
e (4.7)
79
2
2
e (4.8)
3
3
e (4.9)
Dando prosseguimento, o prximo passo modelar os desvios-padro obtidos em
cada tratamento do experimento. Esta modelagem foi feita tambm por modelos lineares
generalizados. No entanto, uma vez que os ajustamentos por Kolmogorov-Smirnov e
Anderson-Darling no software Statfit indicaram todos os desvios-padro atendendo
distribuio normal de probabilidade, a funo de ligao selecionada foi = . Alm do mais,
devido condio de variveis discretas dos nveis dos fatores, esta regresso considerou
variveis dummy. A descrio deste procedimento est detalhado no apndice e foi executado
com o software estatstico R. As equaes (4.10), (4.11) e (4.12) apresentam os resultados das
trs regresses.
Valdecir baixado Valdecir Enxuto
Geraldo baixado Geraldo Enxuto
baixado Enxuto
CL UM CL UM
CL UM CL UM
UM UM
Re
Re
Re 1
800 , 0 900 , 0
675 , 0 667 , 0
375 , 1 550 , 1 850 , 3
(4.10)
Valdecir Enxuto Valdecir Enxuto
Geraldo Enxuto Enxuto
CL UM CL UM
CL UM UM
050 , 1 800 , 1
550 , 1 375 , 1 325 , 3
2
(4.11)
Valdecir Enxuto Geraldo Enxuto
Geraldo Enxuto
CL UM CL UM
CL UM
525 , 1 425 , 1
050 , 1 600 , 1 475 , 2
3
(4.12)
Os valores de deviance das equaes (4.10), (4.11) e (4.12) so, respectivamente,
7,529, 7,530 e 8,538. As regresses que correspondem s equaes acima poderiam bem ter
sido realizadas pelo mtodo dos mnimos quadrados e conduziriam aos mesmos resultados.
No entanto, optou-se pelos modelos lineares generalizados justamente porque desta forma
gerariam-se os valores de deviance j utilizados anteriormente.
Da mesma forma que para os modelos de desvio-padro, so gerados os modelos
para as probabilidades de classificao errada (CE):
80
Valdecir baixado Valdecir Enxuto
Geraldo Enxuto Valdecir
Geraldo baixado
CL UM CL UM
CL UM CL
CL UM CE
Re
Re 1
250 , 11 250 , 11
250 , 11 500 , 7
000 , 10 000 , 10 25 , 21
(4.13)
Geraldo Enxuto Geraldo Norte
Enxuto Norte Norte
CL UM CL PD
UM PD PD CE
500 , 2 667 , 1
667 , 1 556 , 5
2
(4.14)
0
3
CE (4.15)
A equao (4.15) resultou em zero porque todos as rplicas do experimento
resultaram em nenhum erro de classificao errada. A equao (4.14) no tem termo
independente, isto significa que o grupo de controle, a saber neste caso, procedncia no nvel
centro (codificado a 1), umidade molhado (codificado a 1) e classificador Ademir
(codificado a 1) no so significativos. Os valores de deviance para as equaes (4.13) e
(4.14) so, respectivamente, 781,250 e 11,111.
O mesmo procedimento foi adotado para a probabilidade de alarme falso (AF):
Valdecir Enxuto Enxuto
CL UM UM AF 500 , 12 000 , 15 250 , 6
1
(4.16)
Valdecir Enxuto Geraldo Enxuto
Geraldo Enxuto
CL UM CL UM
CL UM AF
000 , 20 500 , 17
750 , 13 000 , 15 000 , 10
2
(4.17)
Valdecir Enxuto Geraldo Enxuto
Geraldo Enxuto
CL UM CL UM
CL UM AF
250 , 21 750 , 18
750 , 13 250 , 16 000 , 10
3
(4.18)
Os valores de deviance das equaes (4.16), (4.17) e (4.18) so, respectivamente,
1131,250, 2268,750 e 2287,500.
Os subscritos das equaes de regresso apresentadas nas equaes (4.10) a (4.18)
referem-se, naturalmente a Y
1
, Y
2
e Y
3
e estes, por sua vez, representam as respostas
encontradas nos estgios de curtimento do couro em wet-blue, semi-acabado e acabado, nesta
ordem. Assim, dando seguimento ao procedimento de otimizao proposto, ponderam-se as
equaes de regresso segundo a equao (3.2) e tabela (3.4). Os nmeros nos denominadores
das equaes abaixo so as mdias gerais de cada grandeza, de forma a tornar o resultado
adimensional.
81
69 , 10
)] 17 . 4 ( [
25 , 0
97 , 15
)] 14 . 4 ( [
40 , 0
72 , 3
)] 11 . 4 ( [
20 , 0
45 , 10
)] 7 . 4 ( [
15 , 0
1
Eq Eq
Eq Eq
Z
(4.19)
31 , 19
)] 18 . 4 ( [
25 , 0
22 , 2
)] 15 . 4 ( [
40 , 0
77 , 3
)] 12 . 4 ( [
20 , 0
30 , 8
)] 8 . 4 ( [
15 , 0
2
Eq Eq
Eq Eq
Z
(4.20)
44 , 19
)] 19 . 4 ( [
25 , 0
37 , 3
)] 13 . 4 ( [
20 , 0
25 , 7
)] 9 . 4 ( [
15 , 0
3
Eq Eq Eq
Z (4.21)
As equaes (4.19) a (4.21) so reunidas utilizando a equao (3.3) e tabela (3.5).
Observe-se que na equao Z
3
o termo correspondente equao (4.15) no aparece, pois no
houve erro de classificao errada nesta etapa do experimento. O prximo passo da
otimizao de Arriba (2005) rene as equaes (4.19), (4.20) e (4.21) na ponderao Z
Total
de
acordo com a tabela (3.5) e a equao (3.3)
)] 21 . 4 ( [ 50 , 0 )] 20 . 4 ( [ 15 , 0 )] 19 . 4 ( [ 35 , 0 Eq Eq Eq Z
Total
(4.22)
Os resultados das equaes (4.19), (4.20) e (4.21) merecem um exame mais detido
quanto ao valor calculado pela equao (4.22) que de fato representa o arranjo timo dos
nveis, segundo o mtodo de otimizao utilizado por Arriba (2005).
O valor desejado para as respostas Y [equaes (4.7) a (4.9)], devido ao efeito de
translao, +10. Os valores desejados para

[equaes (4.10) a (4.12)], CE [equaes
(4.13) a (4.15)] e AF [equaes (4.16) a (4.18)] so zero. Substituindo-se esses valores alvo
nas equaes (4.19) a (4.21) e, posteriormente, inserindo estes resultados na equao (4.22),
desejvel obter-se um valor alvo para Z
Total
o mais prximo possvel de 0,1808. Em Arriba
(2005) a proximidade desejada era ao valor zero. Aqui, devido ao efeito da translao em +10,
ser o valor 0,1808.
A equao (4.22) calculada para todas as 36 combinaes de nveis dos fatores
experimentais. O resultado que mais se aproximar de 0,1808 , assim, o arranjo de nveis que
conduz otimizao do processo, conforme proposto por Arriba (2005). A tabela (4.7)
apresenta os resultados dos clculos destas 36 combinaes e mantm a ordem de tratamentos
82
da tabela (3.6), adaptada de Arriba (2005), mas tambm, tal qual naquela tabela, destaca com
fundo sombreado os trs melhores valores que se aproximam do alvo 0,1808.
Tabela (4.7)
Z
total
para cada nvel dos fatores. Destaque para os valores timos
Tratamento PD UM TE CL Z
Total
Tratamento PD

UM TE CL Z
Total
1 -1 -1 -1 -1 0,654

19 +1

-1 -1 -1 0,815

2 -1 -1 -1 +1 0,570

20 +1

-1 -1 +1 0,731

3 -1 -1 -1 0 0,703

21 +1

-1 -1 0 0,810

4 -1 -1 +1 -1 0,654

22 +1

-1 +1 -1 0,815

5 -1 -1 +1 +1 0,570

23 +1

-1 +1 +1 0,731

6 -1 -1 +1 0 0,703

24 +1

-1 +1 0 0,810

7 -1 0 -1 -1 0,980

25 +1

0 -1 -1 1,095

8 -1 0 -1 +1 0,670

26 +1

0 -1 +1 0,786

9 -1 0 -1 0 0,854

27 +1

0 -1 0 0,916

10 -1 0 +1 -1 0,980

28 +1

0 +1 -1 1,095

11 -1 0 +1 +1 0,670

29 +1

0 +1 +1 0,786

12 -1 0 +1 0 0,854

30 +1

0 +1 0 0,916

13 -1 +1 -1 -1 0,540

31 +1

+1 -1 -1 0,702

14 -1 +1 -1 +1 0,562

32 +1

+1 -1 +1 0,723

15 -1 +1 -1 0 0,602

33 +1

+1 -1 0 0,709

16 -1 +1 +1 -1 0,540

34 +1

+1 +1 -1 0,702

17 -1 +1 +1 +1 0,562

35 +1

+1 +1 +1 0,723

18 -1 +1 +1 0 0,602

36 +1

+1 +1 0 0,709

A tabela (4.7) destaca os tratamentos que mais se aproximam do alvo 0,1808 e foi
comparada aos valores sombreados da tabela (3.6). Na tabela (4.7) h um empate entre os dois
melhores tratamentos, que so os de nmeros 13 e 16. Os nveis codificados do tratamento 13
83
indicam que os nveis dos fatores que conduzem otimizao do processo so: procedncia
centro (nvel -1), umidade rebaixado (nvel +1), mtodo de classificao esttico (nvel -1) e
classificador Ademir (nvel -1). J o outro melhor tratamento, o de nmero 16, sofre apenas
alterao em relao ao tratamento 13 no nvel do fator mtodo de classificao: dinmico
(nvel +1). Este resultado era esperado e coerente com o fato de que em nenhuma das
equaes de regresso indicou significncia do fator mtodo de classificao (TE). O terceiro
melhor tratamento, tambm sombreado na tabela (4.7), o de nmero 14: procedncia centro
(nvel -1), umidade rebaixado (nvel +1), mtodo de classificao esttico (nvel -1) e
classificador Geraldo (nvel 0).
Em Arriba (2005), o melhor tratamento experimental tambm o de nmero 13
conforme observa-se no sombreamento da tabela (3.6). Mas, a concordncia com a tabela
(4.7) cessa a. Esta diferena deve-se naturalmente regresso inadequada usada por Arriba
(2005) e tambm pela desconsiderao naquele trabalho de que os fatores so variveis
dummy, como j exposto anteriormente.
4.2 A OTIMIZAO ATRAVS DE NDICES DE CAPACIDADE DE PROCESSOS
A estratgia de otimizao adotada por Chng, Quah e Low (2005) para otimizao
multiresposta foi reproduzida nesta seo para o experimento de Arriba (2005) considerando a
regresso de Poisson para as respostas Y
i
.
O procedimento geral de otimizao tornou-se muito mais simples do que aquele
apresentado na seo 4.2. Para operacionaliz-lo, foi criada uma planilha de otimizao
apresentada no apndice B de forma a atender ao mtodo do gradiente generalizado reduzido.
Primeiramente, foram programadas na planilha as equaes (4.7) a (4.9) para a regresso de
Poisson; o mesmo se fez para as equaes (4.10) a (4.12) para as regresses dos desvios-
padro; assim como para as equaes (4.13) a (4.15), para as probabilidades de classificao
errada; e por fim, as equaes (4.16) a (4.18), para as probabilidades de alarme falso. Todas as
equaes esto vinculadas s clulas que contm os nveis dos fatores; assim, se o nvel do
fator variar, todas as equaes sofrero alteraes em seus resultados.
84
Na seqncia, programou-se a equao (2.61), que calcula o ndice de TotalC
pm
, a
cada etapa do processo de curtimento de couro, identificados pelos sobrescritos 1, 2 e 3
respectivamente nas equaes (4.23) a (4.25). Este clculo feito como apresentado abaixo:
)] 16 . 4 ( [ 3
0 100
25 , 0
)] 13 . 4 ( [ 3
0 100
40 , 0
)] 10 . 4 ( [ ) 10 )] 7 . 4 ( ([ 3
) 0 10 ; 10 20 min(
35 , 0
2 2
1
Eq Eq
Eq Eq
TotalC
pm
(4.23)
)] 17 . 4 ( [ 3
0 100
25 , 0
)] 14 . 4 ( [ 3
0 100
40 , 0
)] 11 . 4 ( [ ) 10 )] 8 . 4 ( ([ 3
) 0 10 ; 10 20 min(
35 , 0
2 2
2
Eq Eq
Eq Eq
TotalC
pm
(4.24)
)] 18 . 4 ( [ 3
0 100
25 , 0
)] 12 . 4 ( [ ) 10 )] 9 . 4 ( ([ 3
) 0 10 ; 10 20 min(
35 , 0
2 2
3
Eq
Eq Eq
TotalC
pm
(4.25)
Os valores de ponderao e
i
na equao (2.61) so, respectivamente, 0,35, 0,40 e
0,25, conforme indicado na tabela (3.4). Note-se que os pesos para Y
i
(0,15) e para o desvio-
padro (0,20) foram somados (ver primeiro termo do conjunto de equaes acima). Com este
procedimento, tanto o peso de Y
i
quanto o peso do desvio-padro assumiram uma s
importncia, no sendo possvel a diferenciao entre eles, pois seus valores de ponderao
foram somados.
O alvo para o valor de Y
i
10, sendo USL=20 e LSL=0, isto , os valores mximo e
mnimo possveis de serem obtidos a partir das equaes (4.7) a (4.9). Para as regresses de
ambas as probabilidades, os limites de especificao so unilaterais; para tanto, as expresses
de C
pm
usadas correspondem equao (2.62). O valor do alvo unilateral o limite natural da
probabilidade, ou seja, 100.
Os resultados das equaes (4.23) a (4.25) so ento ponderados numa funo Z
segundo os pesos da tabela (3.5) e os valores de ponderao da equao (3.3):
)] 25 . 4 ( [ 50 , 0 )] 24 . 4 ( [ 15 , 0 )] 23 . 4 ( [ 35 , 0 Eq Eq Eq Z (4.26)
85
A planilha de otimizao solicita as restries que indicam os valores que os nveis
dos fatores podem ocupar. A primeira restrio que deve ser carregada que todos os nveis
so valores inteiros e binrios. Ou seja, podem assumir unicamente os nmeros 0 ou 1. Isto
decorrncia do fato de que os nveis so discretos e a regresso, portanto, os considerou como
variveis dummy. A prxima restrio atende necessidade de informar planilha de
otimizao que se um nvel de determinado fator estiver presente, ou outro nvel dever
obrigatoriamente estar ausente. Em outras palavras, se num mesmo fator h um nvel
assumindo o valor 1, o outro nvel dever ser zero. Para o caso presente, esta restrio
atendida com a insero do conjunto de inequaes (4.27):
1
1
Rebaixado Enxuto
Valdecir Geraldo
UM UM
CL CL
(4.27)
Observando o conjunto de inequaes (4.27) conclui-se que se o classificador
presente for Geraldo, este assumir o valor 1, impedindo que o classificador Valdecir tambm
esteja presente. Ou ainda, se Geraldo e Valdecir estiverem ausentes, ambos assumindo o valor
zero, isto indica a presena do classificador Ademir que est no grupo de controle. Raciocnio
idntico vale para o fator umidade. O fator procedncia, que tambm est nas equaes de
regresso, prescinde da incluso nestas restries do conjunto de inequaes (4.27), uma vez
que apresenta-se em apenas dois nveis: centro e norte.
Por fim, a funo objetivo deve ser maximizada, pois quanto maior o valor de
TotalC
pm
melhor. Solicita-se ento ao algoritmo do gradiente generalizado reduzido a
execuo da maximizao. O resultado indica a melhor combinao de nveis que otimiza o
experimento, so eles: procedncia centro (nvel -1); umidade rebaixado (nvel +1); mtodo
de classificao no est presente em nenhuma equao de regresso e, portanto, indiferente
otimizao podendo ser esttico (nvel -1) ou dinmico (nvel +1); e, por fim, classificador
Geraldo (nvel 0). Nas tabelas (3.6) e (4.7) estes nveis correspondem aos tratamentos 15 e 18.
A diferena nas respostas desta otimizao em relao otimizao realizada na
seo anterior est apenas na seleo do fator classificador. Enquanto pelo mtodo anterior o
classificador selecionado foi Ademir, no presente mtodo da maximizao de TotalC
pm
o fator
classificador selecionado foi Geraldo. Todos os demais fatores coincidem.
86
4.3 ANLISE DOS RESULTADOS
Dois mtodos de otimizao foram apresentados. No primeiro (seo 4.2), as
variveis de regresso categricas foram submetidas a uma modelagem atravs dos modelos
lineares generalizados, corrigindo a violao de pressuposto incorrida por Arriba (2005), que
considerou respostas categricas como contnuas. Antes, na seo 4.1, fez-se a opo entre
usar-se as regresses das respostas Y
i
por modelos lineares generalizados ou por quase-
verossimilhana, os resultados de deviance, embora muito prximos entre si, conduziram a
optar-se pela primeira regresso.
A otimizao, neste primeiro caso, convergiu para o mesmo tratamento experimental.
Assim, ainda que Arriba (2005) tenha violado pressupostos, seus resultados no geraram erros
marcantes a ponto de incorrer em erro para o melhor tratamento, embora na hierarquia dos
demais tratamentos esta concordncia se perca. Este primeiro mtodo de otimizao de
difcil implementao por solicitar muitos clculos e ainda a hierarquizao das respostas. Ele
no testa automaticamente o campo dos nveis em busca da melhor resposta, mas sim gera
todos os resultados possveis e o analista seleciona o melhor entre eles. A tcnica somente
funcionou neste caso porque os fatores eram todos valores discretos, portanto gerando um
nmero finito de tratamentos experimentais.
O segundo mtodo de otimizao, ao contrrio, bem mais simples e exige muito
menos esforo computacional. A planilha de otimizao permite alterar as variveis para
simular outros cenrios. Alm disso, qualquer um - ou todos - os fatores podem ou no ser
contnuos ou variveis; o algoritmo de otimizao apenas solicita que isso seja informado nas
restries da programao linear.
Comparando-se os resultados obtidos entre cada mtodo de otimizao conclui-se
que apenas h divergncia quanto ao fator classificador em termos de seus nveis ideais. Para
os demais fatores, os nveis identificados como timos foram idnticos.
justamente onde o fator tende a uma maior subjetividade que houve discordncia
entre os dois mtodos de otimizao: classificador. Pois, os demais fatores so facilmente
diferenciados e bem delimitados. O fator classificador obviamente muito subjetivo, pois
87
ainda que experiente e bem treinado, este fator ainda est sujeito ao estado de humor, a
presses do ambiente, ao cansao etc.
88
Captulo 5
Neste captulo sero apresentados os principais resultados obtidos face aos objetivos
propostos e tambm sero dadas sugestes para trabalhos futuros.
5.2 CONCLUSES
Um dos propsitos desta dissertao foi a otimizao de processos avaliados por
mltiplas variveis de respostas, uma situao bastante usual no meio produtivo. Otimizar,
neste contexto, significa identificar em quais nveis os fatores que influenciam as respostas do
processo alcanam um ponto timo. O ponto timo est associado a um desempenho exigido
pelo cliente e em geral expresso em termos de menor custo, menor refugo, maior rendimento,
menor tempo de operao, menor quantidade de matria-prima, maior aproveitamento dos
recursos produtivos, reduo da variabilidade das respostas, aproximao a uma certa medida
de qualidade ou alvo, etc.
Em diversas situaes a resposta de um processo uma varivel discreta ou
categrica. Isto significa que ela expressa como, por exemplo, uma contagem ou, ainda,
como conforme ou no-conforme. Em resumo, existe um nmero finito de possibilidades que
a resposta pode assumir. Ao contrrio, se esta resposta fosse contnua (por exemplo, a medida
de uma temperatura), infinitos valores poderiam ser observados. Assim, alm de respostas
mltiplas que otimizam um processo, este trabalho lidou com respostas especiais, ditas
categricas. Nem sempre a modelagem de respostas categricas pode ser feita atravs do
mtodo dos mnimos quadrados, j que este mtodo pressupe observaes normalmente
distribudas. Neste caso, a modelagem deve ser feita pelos modelos lineares generalizados
(MLG). Este foi tambm o caso desta dissertao.
Nesta dissertao foi apresentada uma reanlise de um experimento envolvendo
respostas categricas, originalmente apresentado em Arriba (2005). Na anlise proposta pelo
autor, as respostas foram tratadas como contnuas e modeladas atravs de regresso linear
mltipla. Nesta dissertao, as respostas categricas do experimento em Arriba (2005) foram
modeladas atravs dos modelos lineares generalizados e por quase-verossimilhana, e ainda
89
considerando que os nveis dos fatores so variveis discretas, ou seja, devem ser modelados
como dummy. A modelagem em Arriba (2005) tinha por objetivo otimizar o processo em
estudo. Nesta dissertao, repetiu-se o procedimento de otimizao proposto pelo autor,
utilizando, entretanto, os modelos lineares generalizados obtidos para as respostas do
experimento. Algumas divergncias foram encontradas nos resultados das otimizaes, as
quais so apontadas no Captulo 4.
Foi ainda conduzida uma nova forma de otimizao multiresposta do experimento
em Arriba (2005), utilizando-se ndices de capacidade de processos, onde as mesmas
equaes de regresso utilizadas no mtodo anterior foram novamente usadas. O novo
procedimento de otimizao levou a um ponto timo distinto daquele encontrado na
otimizao anteriormente realizada apenas no que se refere ao fator classificador.
O primeiro objetivo principal desta dissertao era otimizar um processo
multiresposta que quando pelo menos uma das variveis categrica. O segundo objetivo
principal era comparar dois mtodos de otimizao multiresposta. Foram portanto
comparados os mtodos de otimizao adotado por Arriba (2005) e aquele utilizado por
Chng, Quah e Low (2005). Sendo que este segundo mostrou-se bem mais simples do ponto
de vista computacional, alm de permitir a anlise comparativa do comportamento das
respostas quando um ou vrios nveis dos fatores so alterados na planilha de otimizao, o
que facilita as interpretaes a respeito dos impactos que uma dada alterao afeta a qualidade
geral do processo.
Teve-se tambm como objetivo deste trabalho, a ampliao do conhecimento do
mtodo de modelagem atravs dos modelos lineares generalizados, uma vez que notou-se
uma escassa literatura sobre o assunto em Lngua Portuguesa, a despeito do notvel fato de
que o tema foi posto em foco h um bom tempo Nelder e Wedderburn (1972) e que sua
necessidade de uso bastante comum na indstria. Possivelmente, a modelagem equivocada
atravs do mtodo dos mnimos quadrados seja bem mais comum do que se supe.
A modelagem por modelos lineares generalizados significativamente mais
complexa que o mtodo dos mnimos quadrados. Nem todos os softwares estatsticos trazem
as principais funes de ligao citadas na tabela (2.2), como o caso do Minitab verso
12.22 e SPSS 10.0. O Apndice A desta dissertao apresenta o passo a passo de instrues
no software livre R para a modelagem por modelos lineares generalizados.
90

5.2 SUGESTES PARA TRABALHOS FUTUROS
Arriba (2005) considerou suas respostas como diferenas entre notas de avaliadores
em etapas do processo de curtimento do couro. A modelagem foi feita por estas diferenas, no
caso deste trabalho foi necessria a translao das respostas para adequar-se distribuio de
Poisson. H ainda uma outra forma de modelar estas respostas tomando-as como acerto ou
erro. Neste caso, apenas duas possibilidades podem acontecer e o processo encaixa-se
perfeitamente no modelo de regresso binomial que tambm um modelo linear generalizado,
bastando que se altere a funo de ligao conforme a tabela (2.2). Por simplificar bastante as
possibilidades de respostas, pode ser que desta forma encontrem-se valores melhores das
funes de desvio (deviance) que certificam a adeqabilidade do modelo.
Outro experimento pode ser conduzido considerando apenas o fator classificador
porm em uma quantidade maior de nveis, por exemplo cinco. Ao longo do experimento
devem ser anotadas as impresses que cada classificador formou na seleo da pele, assim
poderia-se investigar melhor em que termos ocorrem a subjetividade de classificao.
91
Referncias Bibliogrficas
AGRESTI, A. Categorical Data Analysis. 2.Ed. Hoboken, New Jersey: John Wiley & Sons,
Inc, 2002.
ARRIBA, G.D. Otimizao de um processo de classificao de couros wet blue: Um caso
em uma indstria curtidora. Porto Alegre: UFRGS, 2005. Dissertao de Mestrado,
Engenharia de Produo, Universidade Federal do Rio Grande do Sul, 2005.
BISGAARD, S.; FULLER, H. T. Analysis of factorial experiments with defects or
defectives as the response. Quality Engineering. v. 7, n. 2, p. 429-443, 1994.
BOTHE, D. R. Measuring process capability. Techniques and calculations for quality and
manufacturing engineers. Nova Iorque: McGraw-Hill, 1997.
CASTILLO, E. D.; MONTGOMERY, D. C. A nonlinear programming solution to the
dual response problem. Journal of Quality Technology. v. 25, n. 3, p. 162-175, julho 1993.
CHAN, L. K.; CHENG, S. W.; SPIRING, F. A. A new measure of process Capability:
Cpm. Journal of Quality Technology. v. 25, n. 3, p. 199-204, julho 1988.
CHNG, C.K.; QUAH, S.H.; LOW, H.C. Index Cpm in multiple response optimization.
Quality Engineering. v. 17, n. 1, p. 165-171, 2005, janeiro 2005.
DOBSON, A. J. An Introduction to Generalized Linear Models. New York: Chapman &
Hall/CRC, 1990.
DUNCAN, A. J. Quality Control and Industrial Statistics. Homewood: Richard D. Irwin
INC, 1974.
EPPRECHT, E. K.; VIEIRA, A. F. C. Solving Generalized Linear Models with
Spreadsheets. Brazilian Journal of Operations and Production Management, 1(1), 2004.
FAHRMEIR, L.; TUTZ, G. Multivariate Statistical Modelling Based on Generalized
Linear Models. Nova Iorque: Springer, 1994.
GIL, A. C. Como elaborar projetos de pesquisa. 4. Ed. So Paulo: Atlas, 2002.
92
GUJARATI, D. N. Econometria Bsica. Rio de Janeiro: Elsevier, 2006.
ELSAYED, E. A.; RIBEIRO, J. L. A case study on process optimization using the
gradient loss function. International Journal of Production Research, v. 33, n. 12, p. 3233-
3248, 1995.
KELTON, D. W.; LAW, A. M. Simulation Modeling and Analysis. 2. Ed. Singapura: Mc-
Graw-Hill, Inc, 1991.
McCULLAGH, P.; NELDER, J.A. Generalized Linear Models. 2 ed. Londres. Chapman
and Hall, 1990.
MONTGOMERY, D. C. Design and Analysis of Experiments. 6. ed. Hoboken, Nova Jersei:
John Wiley & Sons, Inc, 2005.
MONTGOMERY, D. C. Introduction to Statistical Quality Control. 4 ed. Hoboken, Nova
Jersei: John Wiley & Sons, Inc, 2001.
MONTGOMERY, D. C.; PECK, E. A.; VINING, G. G. Introduction to Linear Regression
Analysis. 4 ed. Hoboken, Nova Jersei: John Wiley & Sons, Inc, 2006.
MYERS, R. H.; MONTGOMERY, D. C; VINING, G. G. Generalized Linear Models: with
applications in engineering and sciences. Nova Iorque: John Wiley & Sons, Inc, 2002.
NELDER J. A.; WEDDERBURN, R. W. M. Generalized Linear Models. Journal of the
Royal Statistical Society, Ser. A 135, 370-384. 1972.
PLANTE, R. D. Process Capability: a Criterion for Optimizing Multiple Response
Product and Process Design. IIE Transactions, n. 33, p. 497-509, 2001.
ROESCH, S. M. A. Projetos de estgio e de pesquisa em administrao: guia para
estgios, trabalhos de concluso, dissertaes e estudos de caso. 3. ed. So Paulo: Atlas, 2005.
VIEIRA, A. F. C. Anlise da Mdia e Disperso em Experimentos Fatoriais no
Replicados para Otimizao de Processos Industriais. Rio de Janeiro: PUC, 2004. Tese de
doutorado, Engenharia de Produo, Pontifcia da Universidade Catlica, 2004.
93
Obras Consultadas
HSIEH, K.; TONG, L. Optimization of Multiple Quality Responses Involving Qualitative
and Quantitative Characteristics in IC Manufacturing Using Neural Networks.
Computers in Industry, v. 46, p. 1-12, Agosto 2001.
KO, Y.; KIM, K.; JUN, C. A New Loss Function-Based Method for Multiresponse
Optimization. Journal of Quality Technology, v.37, p. 50-60, Janeiro 2005.
KUN-LIN, H et al.. Optimization of a multiresponse problem in Taguchis dynamic
system. Computers & Industrial Engineering, v. 29, p. 556-571, Janeiro 2005.
PIGNATELLO JR., J. J. Strategies for Robust Multiresponses Quality Engineering. IIE
Transactions, n. 25. p. 5-15, 1993.
ROSS, P. J. Aplicaes das Tcnicas de Taguchi na Engenharia de Qualidade. So Paulo:
McGraw-Hill, 1991.
SANTANNA, A. M. O. Mtodo de Orientao Modelagem de Dados Mensurados em
Proporo. Porto Alegre: UFRGS, 2006. Dissertao de Mestrado, Engenharia de Produo,
Universidade Federal do Rio Grande do Sul, 2006.
TAGUCHI, G; ELSAYED, E. A.; HSIANG, T. Engenharia de Qualidade em Sistemas de
Produo. So Paulo: Mc-Graw-Hill, 1990.
94
Apndice A
Neste apndice so apresentadas as instrues que devem ser dadas ao software R
para a modelagem por modelos lineares generalizados segundo a funo de ligao de
Poisson e normal. Tambm apresenta-se o passo a passo para a modelagem por quase-
verossimilhana.
Para os modelos lineares generalizados que correspondem s equaes (4.1), (4.2) e
(4.3) as instrues a ser dadas ao R so:
read.table("C:/bncc2.txt", header=T, sep="")->bncc1
attach(bncc1)
as.factor(X1)->X1
as.factor(X2)->X2
as.factor(X3)->X3
as.factor(X4)->X4
glm(formula = Y1 ~ X1 + X2 + X3 + X4 + X1*X1 + X1*X2 + X1*X3 + X1*X4 +
X2*X2 + X2+X3 + X2*X4 + X3*X3 + X3*X4 +X4*X4 , family = poisson())->M1
summary(M1Q)
deviance(M1Q)
A instruo read.table (argumentos) carrega um banco de dados que contm os
fatores, seus nveis e as respostas de um experimento. O primeiro argumento o prprio
nome do banco de dados que deve estar no formato .txt. Ateno: o R no reconhece vrgulas
como separador de decimais, deve-se usar o ponto. O argumento header=T indica que o
banco de dados possui um cabealho na primeira linha que nomeia as colunas de dados. O
ltima argumento sep= instrui o software que a no h separadores entre os dados alm do
espao em branco. Os dados do banco, neste exemplo, so carregados na varivel bncc1.
Para que os nomes das colunas sejam reconhecidos como variveis deve ser usado o
comando attach(bncc1).
95
No banco de dados os fatores foram nomeados como X1, X2, X3 e X4 e seus nomes
esto no cabealho. Como estes fatores so discretos e ento as variveis devem ser
consideradas como dummy, deve ser usada a instruo as.factor(nome da coluna) e carreg-la
numa varivel. Neste caso, a varivel que carrega esta instruo possui o mesmo nome da
coluna.
A instruo glm(argumentos) indica que a regresso deve ser por modelos lineares
generalizados. O primeiro argumento indica a frmula do modelo com seus fatores e suas
interaes. No presente caso, usou-se interaes entre os fatores at segunda ordem. A
segunda instruo indica qual a funo de ligao, no presente caso ela do tipo Poisson. O
modelo carregado na varivel M1.
A funo summary(argumento) apresentar os resultados da regresso com os
parmetros do modelo e seus nveis de confiabilidade. Uma vez selecionados os parmetros
mais significativos, gera-se novamente a instruo glm(argumentos) contendo no modelo
apenas os fatores selecionados.
A funo deviance(argumento) apresenta o valor da deviance do modelo.
Para um modelo linear generalizado que tem funo de ligao normal, como foi o
caso dos modelos representados nas equaes (4.10) a (4.18), a instruo deve ser a mesma
das anteriores, exceto a seguinte linha:
glm(formula = Y1 ~ X1 + X2 + X3 + X4 + X1*X1 + X1*X2 + X1*X3 + X1*X4 +
X2*X2 + X2+X3 + X2*X4 + X3*X3 + X3*X4 +X4*X4 , family = gaussian())->M1
Identicamente, para a modelagem por quase-verossimilhana a linha que contm o
tipo de modelagem a ser usada deve ser:
glm(formula = Y1 ~ X1 + X2 + X3 + X4 + X1*X1 + X1*X2 + X1*X3 + X1*X4 +
X2*X2 + X2+X3 + X2*X4 + X3*X3 + X3*X4 +X4*X4 , quasi(link=log,variance="mu")-
>M1
Este foi o caso usado nos modelos das equaes (4.4), (4.5) e (4.6).
96
Apndice B
A figura (B.1) apresenta a planilha de otimizao utilizada para encontrar os nveis
timos dos fatores do experimento de Arriba (2005). Foi usado o mtodo do ndice de
capacidade total proposto por Chng, Quah e Low (2005) para a otimizao. O algoritmo
Generalized Reduced Gradient (GRG), ou gradiente generalizado reduzido, o padro do
Solver do Excel

para problemas de programao linear. As letras na primeira linha e os
nmeros na primeira coluna servem para referenciar as clulas.
Figura (B.1) Planilha de otimizao
O campo de clulas compreendido entre B7:O9 contm os parmetros da regresso
de Poisson apresentados nas equaes (4.1), (4.2) e (4.3). Assim como o campo de clulas
B13:O15 contm os parmetros da regresso do desvio-padro. O mesmo vale para o campo
A B C D E F G H I J K L M N
1
2 Fatores
Termo
Independ.
PD
Norte
CLGeraldo CL
Valdecir
UM
Enxuto
UM
Rebaixado
CL
Geraldo
xU
M
Enxuto
CL
Valdecir
x
UM
Enxuto
CLGeradox
UM
Rebaixado
CLValdecirx
UM
Rebaixado
CL
Geraldo
xPD
Norte
CL
Valdecir
xP
D
Norte
UM
Enxuto
xP
D
Norte
3 Nveis 1 0 1 0 0 1 0 0 0 0 0 0 0
4
5
6 Fatores Intercesso PD
Norte
CLGeraldo CL
Valdecir
UM
Enxuto
UM
Rebaixado
CL
Geraldo
xU
M
Enxuto
CL
Valdecir
x
UM
Enxuto
CLGeradox
UM
Rebaixado
CLValdecirx
UM
Rebaixado
CL
Geraldo
xPD
Norte
CL
Valdecir
xP
D
Norte
UM
Enxuto
xP
D
Norte
7 Y1 2,427 0 -0,1145 -0,1071 -0,0949 0 0 0,1545 0 0 0 0 0
8 Y2 2,1432 0,1415 -0,1433 -0,1339 -0,1185 0 0,1372 0,1935 0 0 0 0 0
9 Y3 2,0458 0,0959 0 -0,1163 -0,1349 0 0,1564 0,2207 0 0 -0,1133 0 0
10
11
12 Fatores Intercesso PD
Norte
CLGeraldo CL
Valdecir
UM
Enxuto
UM
Rebaixado
CL
Geraldo
xU
M
Enxuto
CL
Valdecir
x
UM
Enxuto
CLGeradox
UM
Rebaixado
CLValdecirx
UM
Rebaixado
CL
Geraldo
xPD
Norte
CL
Valdecir
xP
D
Norte
UM
Enxuto
xP
D
Norte
13 DP1 3,85 0 0 0 1,55 -1,375 -0,6667 -0,9 0,675 0,8 0 0 0
14 DP2 3,325 0 0 0 1,375 0 -1,55 -1,8 0 -1,05 0 0 0
15 DP3 2,475 0 1,05 0 1,6 0 -1,425 -1,525 0 0 0 0 0
16
17
18 Fatores Intercesso PD
Norte
CLGeraldo CL
Valdecir
UM
Enxuto
UM
Rebaixado
CL
Geraldo
xU
M
Enxuto
CL
Valdecir
x
UM
Enxuto
CL
Geradox
UM
Rebaixado
CLValdecirx
UM
Rebaixado
CL
Geraldo
xPD
Norte
CL
Valdecir
xP
D
Norte
UM
Enxuto
xP
D
Norte
19 CE1 21,25 0 -10 -7,5 0 -10 11,25 11,25 0 11,25 0 0 0
20 CE2 0 5,556 0 0 0 0 -2,5 0 0 0 -1,667 0 -1,667
21 CE3 0 0 0 0 0 0 0 0 0 0 0 0 0
22
23
24 Fatores Intercesso PD
Norte
CLGeraldo CL
Valdecir
UM
Enxuto
UM
Rebaixado
CL
Geraldo
xU
M
Enxuto
CL
Valdecir
x
UM
Enxuto
CLGeradox
UM
Rebaixado
CLValdecirx
UM
Rebaixado
CL
Geraldo
xPD
Norte
CL
Valdecir
xP
D
Norte
UM
Enxuto
xP
D
Norte
25 AF1 6,25 0 0 0 15 0 0 -12,5 0 0 0 0 0
26 AF2 10 0 13,75 0 15 0 -17,5 -20 0 0 0 0 0
27 AF3 10 0 13,75 0 16,25 0 -18,75 -21,25 0 0 0 0 0
28
29 Y1 10,0996 DP1 3,85 CE1 1,2500 AF1
30 Y2 7,3883 DP2 3,325 CE2 0,0000 AF2
31 Y3 7,7353 DP3 2,475 CE3 0,0000 AF3
32
33
Z
4,56 PD
Norte
Instruo
34 0 Binrio <= 1 <=
35 TotalCpm(1) 12,1079
36 TotalCpm(2) 0,4949 #DIV/0!
37 TotalCpm(3) 0,4945
Regresso normal por GLM dos desvios-padro dos Y
Regresso normal por GLM das probabilidades de Classificao Errada (CE)
Regresso normal por GLM das probabilidades de Alame Falso (AF)
Instruo: Binrio e
soma dos nveis
Instruo: Binrio e
soma dos nveis
CLGeraldo + CLValdecir
Prob (CE) Prob (AF) Regresso Y
Fatores em nveis - variveis dummy
Regresso de Poisson por GLM das respostas Y
1
UM
Enxuto
+UM
Rebaixado
1
Regresso
Desvio-
padro
97
B19:O21 para a regresso da probabilidade de classificao errada; e o campo B25:O27 para
a probabilidade de alarme falso.
A linha 3 contm as variveis do problema que so os nveis dos fatores. Estas
variveis so designadas no Solver como inteiras e binrias (0 ou 1). Estas variveis so tm
estas caractersticas por serem dummy.
Os resultados das regresses de Y
1
, Y
2
e Y
3
esto respectivamente nas clulas C29,
C30 e C31. Este resultado apenas o produto entre os nveis dos fatores (linha 3) e seus
respectivos parmetros no campo B7:O9. Da mesma forma, os resultados das equaes dos
desvios-padro esto nas clulas G29, G30 e G 31. Para a probabilidade de classificao
errada esto em K29, K30 e K31. E para a probabilidade de alarme falso os resultados esto
em O29, O30, O31.
As clulas K67 e O67 fazem a restrio do conjunto de inequaes (4.27). As clulas
B35, B36 e B37 apresentam os resultados de TotalC
pm
para os processos de seleo Y
1
, Y
2
e Y
3
respectivamente. Estas clulas contm os valores de ponderao da tabela (3.4). A soma dos
valores das clulas B35, B36 e B37 ponderada pelos valores da tabela (3.5) est na clula B33
e corresponde equao (2.61). O Solver deve ser instrudo de que a clula B33 o alvo da
otimizao para maximizar.
This document was created with Win2PDF available at http://www.win2pdf.com.
The unregistered version of Win2PDF is for evaluation or non-commercial use only.
This page will not be added after purchasing Win2PDF.