Sie sind auf Seite 1von 21

1

Ministrio da Educao Universidade Tecnolgica Federal do Paran/Campus Curitiba Departamento Acadmico de Matemtica (DAMAT) Probabilidade e Estatstica Prof: Silvana Heidemann Rocha Aluno(a): ___________________________________ Data: ___/___/____

INTRODUO ESTATSTICA - Aula 01 - Vocabulrio e viso geral da disciplina


Fenmenos, experimentos e modelos *Determinsticos *Aleatrios ou probabilsticos1
*Caticos

Variabilidade, incerteza, acaso, aleatoriedade, possibilidade, probabilidade Problema: Como medir a incerteza presente numa situao? Histrico, objetivos e principais ramos da Estatstica Populao, censo, recenseamento Amostra, amostragem, amostras representativas, amostras viciadas Tcnicas de amostragem
o Amostragem com reposio ou sem reposio Amostragem aleatria simples Amostragem sistemtica Amostragem proporcional estratificada Amostragem por conglomerados Amostragem por convenincia Amostras aleatrias tericas ou matematicamente idealizadas Amostras aleatrias experimentalmente possveis

Amostras aleatrias
o o

Atributo, varivel, varivel aleatria Classificao das variveis


*Qualitativas (nominais, ordinais) * Quantitativas (discretas, contnuas)

Parmetro, estatstica, estimador, estimao, tendenciosidade (vcio, vis) Diferena entre Estatstica, estatstica e estatsticas. Fases de um levantamento estatstico:
o o o o o o o o Definio do problema, Planejamento Coleta de dados Crtica dos dados Apurao ou organizao dos dados Apresentao dos dados Anlise e interpretao dos resultados Tomada de deciso

Pesquisa piloto Diferena entre dados, informao e propaganda Cdigo de tica para pesquisadores cientficos e cdigo de tica para estatsticos O uso de ferramentas estatsticas por engenheiros

Um experimento aleatrio um experimento com as seguintes caractersticas: i) Reprodutibilidade, isto , o experimento pode ser reproduzido inmeras vezes sob condies inalteradas em sua essncia, ou seja, mantidas constantes as variveis de maior influncia no experimento. ii) Casualidade dos resultados individuais, isto , os resultados individuais so imprevistos, dependem do acaso. iii) possvel descrever um conjunto contendo todos os resultados possveis para o experimento. iv) Regularidade, isto , quando o experimento reproduzido um nmero muito grande de vezes, aparece uma configurao definida ou regularidade do comportamento do experimento. Essa regularidade permite determinar um modelo matemtico para se analisar o experimento. (Cf. MEYER, cap. 1 p. 9, 15, 285 a 287; GNEDENKO, B. V., The theory of probability. Moscow: Mir Publishers, 1969, p. 40).

2 EXERCCIOS: Os exerccios a seguir devem ser feitos mediante pesquisa (livros, dicionrios, internet citar as fontes de referncias): 1) Leia com ateno o captulo 1 (p. 1 a 25), a introduo do captulo 4 (p. 66 a 72), a introduo do captulo 6 (p. 110 e 111), a introduo do captulo 12 (p. 284 a 287), a introduo do captulo 13 (p. 308 a 314) e a introduo do captulo 14 (p. 329 a 331) do livro MEYER, Paul L., Probabilidade: aplicaes estatstica. 2 ed. Rio de Janeiro: LTC, 1983. Leia tambm o prlogo e os captulos 1, 2 e 3 do livro STEWART, Ian, Ser que Deus joga dados?: a nova matemtica do caos. Rio de Janeiro: Jorge Zahar, 1991. Neste primeiro contato com a disciplina de Estatstica, no necessrio entender tudo o que for lido nas pginas indicadas, mas a leitura atenta lhe auxiliar em alguns dos exerccios abaixo. 2) Cite pelo menos dois experimentos de cada tipo: a) Determinstico b) Aleatrio c) Catico

3) Quais so as caractersticas de um experimento aleatrio? 4) H ou no variabilidade nos fenmenos classificados como determinsticos? Justifique. 5) Qual a diferena entre variabilidade, incerteza, acaso e probabilidade? 6) Conceitue ou defina: a) Estatstica (com maisculo) e) Amostra h) Parmetro l) Tendenciosidade b) Populao f) Amostragem i) estatstica (com minsculo) m) Varivel c) Censo d) Recenseamento g) Amostra aleatria j) Estimador n) Varivel aleatria

7) Apresente pelo menos 3 problemas relacionados ao seu curso que so resolvidos atravs de tcnicas estatsticas. 8) Pesquise num site de busca (Google, Altavista, etc) artigos relacionados com cdigo de tica e pesquisa cientfica cdigo de tica para pesquisadores cientficos (engenheiros, mdicos, dentistas, economistas, bilogos, assistentes sociais, estatsticos, etc) cdigo de tica e sua futura profisso.
[...] A cincia totalmente amoral e completamente irresponsvel [...].

9) O fsico belga David Ruelle, no seu livro Acaso e caos (So Paulo: UNESP, 1993, p. 222), afirma: Voc concorda com ele? Justifique sua opinio. Procure ler o contexto em que ele afirma isso. 10) Procure em jornais, revistas, internet, etc propaganda. uma matria que esteja usando dados estatsticos como

3 APRESENTAO DE DADOS - Aula 02 Requisitos de uma boa apresentao de dados o Clareza (at os leigos compreendem o que est sendo apresentado) o Objetividade (atinge o fim que se quer atingir) o Conciso ( resumido, mas tambm preciso, exato) Formas de apresentao dos dados o Rols ou listas o Tabelas ou quadros Partes de uma tabela Ttulo (O qu? Quando? Onde?) Cabealho Coluna indicadora Corpo Casa ou clula Rodap o Fonte o Notas o Chamadas Tipos de tabelas Sries estatsticas o Sries temporais, histricas ou cronolgicas o Sries geogrficas, espaciais, territoriais ou de localizao o Sries categricas ou especficas o Sries mistas, conjugadas ou tabelas de dupla entrada Tabelas de distribuio de freqncias o Tabela primitiva (dados brutos) o Tabela sem intervalos de classe (dados no agrupados) o Tabela com intervalos de classe (dados agrupados)
o

Tabela de distribuio conjunta ou tabela de freqncia conjunta (para


variveis multidimensionais)

Normas de apresentao de tabelas

4 o Grficos ou diagramas Partes de um grfico Ttulo (O qu? Quando? Onde?) Corpo Rodap (Fonte, notas, chamadas)

Principais tipos de grficos

Barras (simples ou mltiplas) Colunas (simples ou mltiplas) Setores circulares (ou pizza) Linha Cartogramas Polares Diagrama de pontos Diagrama de ramo e folhas Diagrama de caixa (Box plot) Diagrama de Pareto Pictogramas Histogramas (Ex.: histogramas de freqncias, de densidade, de probabilidade) o Histogramas sem intervalo de classe o Histogramas com intervalos de classe Polgonos de freqncias o Polgonos de freqncias simples ou absolutas o Ogivas ou polgonos de freqncias acumuladas Curvas de densidades (para variveis aleatrias contnuas) Diagramas de disperso (para variveis quantitativas bidimensionais)

Normas de apresentao de grficos Alguns erros comuns cometidos na apresentao dos dados o Falta de informaes no ttulo ou no rodap o Falta de identificao nos eixos (em grficos) o Escalas inapropriadas (em grficos) o Recursos pictogrficos desproporcionais o Valorizao de aspectos secundrios em detrimento das informaes principais ________
REFERNCIAS: Utilize as referncias indicadas no plano de aulas (ver: http://pessoal.utfpr.edu.br/heidemann) UTFPR. Normas para elaborao de trabalhos acadmicos. Curitiba: Editora UTFPR, 2009.

5 Slides:

APRESENTAO DE DADOS
FORMAS DE APRESENTAO: Rols ou listas Tabelas ou quadros Grficos ou diagramas

Exemplo de um rol
Consumo de gua mensal, em m3, correspondente a uma amostra de 40 contas da SANEPAR Curitiba - Paran __________________________________________ 14 15 16 19 20 26 31 35 14 15 16 20 22 29 31 35 14 15 18 20 22 30 32 35 15 15 18 20 24 31 33 38 15 15 18 20 25 31 33 41 __________________________________________
Fonte: Dados fictcios.

Partes de uma tabela


Taxa de analfabetismo, segundo o ano - Brasil Ano 1970 1980 1991 (1) 1995 (1) 1996 Porcentagem (%) 33,6 25,4 20,1 15,6 14,7

ttulo

cabealho corpo casa ou clula

Fonte: IBGE/Pnad (1996). Nota: Faixa etria de 15 anos ou mais. (1) Em 1995 e 1996, exclui a populao rural de Rondnia, Acre, Amazonas, Roraima, Par e Amap.

rodap

Sries Estatsticas
Populao mundial, em milhes, segundo o continente 2000 Continente frica Amrica sia Europa Oceania Total Populao (em milhes) 783,7 823,2 3.678,2 745,5 30,0 6.060,6

Sries Estatsticas
Sistema Penitencirio Perfil do preso Brasil - 1999 Categorias Reincidentes Jovens (entre 18 e 30 anos) Ensino fundamental incompleto Pobres Homens Porcentagem (%) 53(1) 58(1) 74,5 95 96

Fonte: Almanaque Abril Mundo 2001.

Fonte: Ilanud (1996) e Censo Penitencirio (1994 e 1997). (1) Dados referentes populao carcerria do Estado de So Paulo.

Classificao: localizao

Srie geogrfica ou espacial ou de

Classificao: Srie categrica ou especfica

Sries Estatsticas
Taxa de analfabetismo, segundo o ano - Brasil
Ano 1970 1980 1991 (1) 1995 (1) 1996 Porcentagem (%) 33,6 25,4 20,1 15,6 14,7

Sries Estatsticas
Taxa de famlias chefiadas por mulheres, em porcentagem, segundo o ano e a regio geogrfica Brasil Regies Norte Nordeste Sudeste Sul Centro-Oeste Brasil
Fonte: IBGE (1996).

Fonte: IBGE/Pnad (1996). Nota: Faixa etria de 15 anos ou mais. (1) Em 1995 e 1996, exclui a populao rural de Rondnia, Acre, Amazonas, Roraima, Par e Amap.

1980 12,25 16,58 14,89 12,05 13,17 14,65

Ano 1991 15,52 19,46 18,60 16,03 16,95 18,12

1996 18,61 21,92 21,40 18,55 19,98 20,81

Classificao: Srie temporal ou cronolgica ou histrica

Classificao: Srie geogrfico-temporal ou espacial-temporal

Tabelas de distribuio de freqncias


Exemplo de tabela primitiva:
Tabela 1 Estatura, em centmetros, de 30 alunos do colgio X - Curitiba Fevereiro/2002 155 162 155 160 161 162 161 168 163 163 163 160 162 168 155 160 173 155 155 160 167 167 155 167 164 164 168 160 168 168

Tabelas de distribuio de freqncias


Ex. de tabela de distrib. de freq. sem intervalo de classe:
Tabela 2 - Estatura, em centmetros, de 30 alunos do colgio X Curitiba - Fevereiro/2002 Estatura(cm) Freqncia 155 6 160 5 161 2 162 3 163 3 164 2 167 3 168 5 173 1 Total 30

Fonte: Dados fictcios.

Fonte: Dados fictcios.

Tabelas de distribuio de freqncias


Ex. de tabela de distrib. de freq. com intervalo de classe:
Tabela 3 - Estatura, em centmetros, de 30 alunos do colgio X Curitiba - Fevereiro/2002 Estatura (cm) 155 | 160 160 | 165 165 | 170 170 | 175 Total
Fonte: Dados fictcios.

Tabelas de distribuio de freqncias


Ex. de tabela de distribuio de freqncias conjuntas:
Pacientes HIV positivos, segundo o nmero de internaes (X) e o nmero de crises com infeces oportunistas (Y) Y X 0 1 2 3 4 Total 0 1 2 Total 84 20 6 110 21 59 11 91 8 35 43 86 2 14 28 44 0 2 12 14 115 130 100 345

Freqncia 6 15 8 1 30

Fonte: Baseado em MAGALHES, M. N.; LIMA, A. C. P. Noes de probabilidade e estatstica. 6 ed. So Paulo: Edusp, 2008, p. 127

Observao: a | b um intervalo fechado esquerda e aberto direita, tal como

a x <b

Alguns principais tipos de grficos


1) Grfico em barras:
Oceania 30

Alguns principais tipos de grficos


2) Grfico em colunas: Para sries temporais e para variveis qualitativas ordinais.
Chefes de famlia do Bairro Alto, segundo o grau de escolaridade Curitiba - 2002
1.500

Usado para sries geogrficas e para categricas.

Europa

745,5

1.200

N de chefes
3.678,20 1.500 2.000 2.500 3.000 3.500 4.000

frica

783,7

900

Amrica

823,2

600

sia 0 500 1.000

300

Populao, em milhes

0 Ensino Fundamental Ensino Mdio Ensino Superior

Populao mundial, em milhes, segundo o continente - 2000


Fonte: Almanaque Abril Mundo 2001.

Fonte: Dados fictcios.

Alguns principais tipos de grficos


3) Grfico em colunas mltiplas:
1.600.000 1.400.000

Alguns principais tipos de grficos


4) Grfico em setores circulares:
Para sries geogrficas, categricas e para variveis qualitativas nominais.

Para sries conjugadas.

N de m atrc ulas

1.200.000 1.000.000 800.000 600.000 400.000 200.000 0 1994 1995 1996 1997 1998 1999

1.472.930; 14% 99.454; 1%

9.204.528; 85%

Amrica do Norte

Amrica Central

Amrica do Sul

Rede pblica

Rede privada

Produto Interno Bruto (PIB) americano, em milhes de dlares, segundo a regio do continente 1998
Fonte: Almanaque Abril Mundo 2001.

Matrculas nos cursos superiores de graduao - Brasil 1994 a 1999


Fonte: MEC/INEP/SEEC.

Alguns principais tipos de grficos


5) Grfico em linha:
180 160

Alguns principais tipos de grficos


6) Diagrama de Pareto:
1200 1000

Para ressaltar tendncias em sries temporais.

1062

V o lu m e (U S $ b ilh e s )

140 120 100 80 60 40 20 0 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 Exportao Importao

F re q n c ia

800 600 400 200 0 No entrega de produto ou servio Problemas relativos a contratos No prestao se servios Cobrana indevida Dificuldade em efetuar pagamento

383 227 178 17

Comrcio Exterior - Brasil 1990 a 2007


Fonte: Ministrio do Desenvolvimento, Indstria e Comrcio Exterior.

Reclamaes em relao companhia telefnica Al Doura So Paulo Maro/2004


Fonte: Dados fictcios.

Alguns principais tipos de grficos


7) Diagrama de Ramo e folhas:
Taxas de octanagem de combustvel para motor, de vrias misturas de gasolina Tamanho da amostra: n = 82 - Unidade da folha = 0,1
(1) 83 | 4 (3) 84 | 3 3 (4) 85 | 3 (7) 86 | 7 7 7 (13) 87 | 4 5 6 7 8 9 (24) 88 | 2 3 3 3 4 5 5 6 6 7 9 (34) 89 | 0 2 3 3 6 7 8 8 9 9 (13) 90 | 0 1 1 1 3 4 4 4 5 6 7 8 9 (35) 91 | 0 0 0 1 1 1 2 2 5 6 6 8 8 (22) 92 | 2 2 2 3 6 7 7 7 (14) 93 | 0 2 3 3 4 7 (8) 94 | 2 2 4 7 (4) 95 | (4) 96 | 1 5 (2) 97 | (2) 98 | 8 (1) 99 | (1) 100 | 3 Fonte: MONTEGOMERY et RUNGER. Estatstica aplicada e probabilidade para engenheiros, 2008.

Alguns principais tipos de grficos


8) Diagrama de caixa (box plot):

Renda familiar mensal, em reais

Trabalhadores autnomos, segundo a renda familiar mensal, em reais.


Fonte: Dados fictcios.

Alguns principais tipos de grficos


9) Histograma de freqncia sem intervalos de classe:
12 10 Freqncia 8 6 4 2 0 Nenhum 1 2 N de filhos 3 4
Freqncia

Alguns principais tipos de grficos


10) Histograma de freqncia com intervalos de classe:
30 27 24 21 18 15 12 9 6 3 0 5 25 45 65 85 105 125 145

Para variveis quantitativas discretas.

Para variveis quantitativas contnuas.

Notas

Chefes de famlia do Bairro Alto, segundo o nmero de filhos Curitiba - 2002


Fonte: Dados fictcios.

Notas relativas a uma avaliao do raciocnio lgico dos candidatos ao cargo de auditor fiscal da Receita Federal - Braslia - Julho/2003
Fonte: Dados fictcios.

Alguns principais tipos de grficos


11) Diagrama de disperso:
30 Ganho de peso (Kg) 25 20 15 10 5 0 0 1 2 3 4 Concentrao (mg/l) 5 6 7

Alguns principais tipos de grficos


12) Pictogramas:

Para relacionar duas variveis quantitativas contnuas.

Bois de uma dada regio de Bocaina-So Paulo, segundo a concentrao de certa susbstncia X, em miligramas por litro, e o ganho de peso, em quilos, aps 30 dias de adminstrao da substncia X
Fonte: Baseado em MAGALHES, M. N.; LIMA, A. C. P. Noes de probabilidade e estatstica. 6 ed. So Paulo: Edusp, 2008, p. 332. Fonte: Magalhes et Lima. Noes de probabilidade e estatstica. 6 ed. So Paulo: Edusp, 2008.

Alguns principais tipos de grficos


13) Grfico polar Em especial, usado para sries temporais cclicas.

Fonte: Veja, 12/07/2000, p.55

Alguns erros comuns cometidos na apresentao dos dados


1) Considere os grficos A e B a seguir, relacionados com a tabela abaixo. Qual grfico o mais apropriado? Justifique. Entrega de gasolinas para consumo - Brasil 1985 a 1988 Anos 1985 1986 1987 1988 Quantidade (1000 m3) 9.793 11.095 9.727 9.347

Fonte: CRESPO, Antnio A. Estatstica fcil. 10 ed. So Paulo: Saraiva, 1993, p.52.

Grfico A
Entrega de gasolinas para consumo Brasil - 1985 a 1988
12000 Q u a n ti d a d e (1 0 0 0 m 3 ) 10000 8000 6000 4000 2000 0 1985 1986 1987 1988

Grfico B
Entrega de gasolinas para consumo Brasil - 1985 a 1988
11500 Q u a n t id a d e (1 0 0 0 m 3 ) 11000 10500 10000 9500 9000 8500 8000

Fonte: CRESPO, Antnio A. Estatstica fcil. 10 ed. So Paulo: Saraiva, 1993, p. 52.

1985

1986

1987

1988

Fonte: CRESPO, Antnio A. Estatstica fcil . 10 ed. So Paulo: Saraiva, 1993, p. 52.

Concluso 1:
A escala usada no grfico B distorceu as relaes existentes entre as quantidades de gasolina entregue anualmente para consumo.
Esse um erro comum na apresentao de dados:

Uso de escalas inadequadas.

10

Alguns erros comuns cometidos na apresentao dos dados


2) O que est errado na apresentao abaixo?
frica
1% 2% 34% 38%

Concluso 2:
Entre outros erros, a legenda e a fonte esto maiores que o grfico ou o ttulo.
Esse um erro comum na apresentao de dados:

Amrica sia Europa

25%

Oceania

Produto Interno Bruto (PIB) mundial, em milhes de dlares, segundo o continente 1998

Fonte: Almanaque Abril Mundo 2001.

Valorizao de aspectos secundrios em detrimento das informaes principais.

Alguns erros comuns cometidos na apresentao dos dados


3) O que est errado na apresentao abaixo? Renda per capita duplicou nos Estados Unidos em 1992

Concluso 3:
Os volumes dos recursos pictogrficos usados no so proporcionais ao respectivo aumento da renda per capita.
Esse um erro comum na apresentao de dados:

Uso de recursos pictogrficos desproporcionais s grandezas que devem representar.


Fonte: Baseado em FREUD, John E. Estatstica aplicada: economia, administrao e contabilidade. 11 ed. Porto Alegre: Bookman, 2006.

Alguns erros comuns cometidos na apresentao dos dados


4) Quais os problemas na seguinte apresentao?

Concluso 4:
Se voc come 50% de um boi e eu como 50% de uma galinha, ento comemos quantidades semelhantes?
Esses so erros comuns na apresentao de dados: Ttulos propagandsticos, falaciosos. No exemplo dado, a idia de proporcionalidade foi substituda pela de semelhana. Falta de informao no rodap. Por exemplo: Quais os valores absolutos dos PIBs? Essa informao deveria ter sido colocada como nota, no rodap.

Publicado na revista Exame, 03/04/2002, p. 37.

A tabela a seguir apresenta os valores dos PIBs e o tamanho da populao dos pases indicados no grfico em questo.

11

Pases, segundo o valor do Produto Interno Bruto (PIB) e o tamanho da populao - 1998 Pas Estados Unidos Alemanha Frana Brasil
Fonte: Almanaque Abril, 2001.

Valor do PIB (US$ bilhes) 8.000 2.000 1.500 558

Populao (Milhes) 280,0 82,2 59,1 170,0

Dados, informao e propaganda


Qual o objetivo do grfico abaixo?

Fonte: Veja, 2002.

12 APRESENTAO DE DADOS PARA VARIVEIS QUANTITATIVAS UNIDIMENSIONAIS Aula 03 1) Variveis quantitativas discretas: Tabela de distribuio de freqncias para variveis discretas (dados no agrupados em classes) Histograma para variveis discretas Tabela de distribuio de freqncias para variveis contnuas (dados agrupados em classes) o Elementos da tabela de distribuio de freqncias com um nmero k de classes: Classes de freqncias (i), com i = 1, 2, ..., k. Limites das classes Limite inferior (li ) Limite superior (Li)
onde hi = Li li

2) Variveis quantitativas contnuas

Amplitude de um intervalo de classe (hi) ,

Amplitude total da distribuio (AT), onde AT = Lk l1 . Ponto mdio de uma classe (xi), onde xi =

Li + li 2

Freqncia simples ou absoluta de uma classe (ni), onde Freqncia relativa de uma classe (fri), onde fri =

ni = n .
i =1

ni n
j

Freqncia acumulada de uma classe (Fi), onde F j = ni


i =1

Freqncia acumulada relativa de uma classe (Fri), onde Fri =

Fi n
fri hi

Densidade de freqncia relativa de uma classe ( i ), onde i =


Histograma de freqncias (absolutas ou relativas) para dados agrupados em classes Polgonos de freqncias (absolutas ou acumuladas) Histogramas de densidade de freqncias relativas (para distribuies de freqncias com intervalos de classes de
amplitudes iguais ou diferentes).

3) Diagrama de caixa (box plot) 4) Diagrama de ramo e folhas Observaes: Quando uma varivel discreta apresentar uma quantidade grande de resultados de forma que a tabela de distribuio de freqncias tenha muitas linhas, pode-se agrupar os resultados em intervalos de classe, tal como feito para variveis contnuas.

Usualmente, recomendado que uma tabela apresente de 5 a 20 linhas.

13 EXEMPLOS: 01) Considere o quadro abaixo: Perfil de 30 chefes de famlia do Bairro Alto Curitiba - 2002
N 01 02 03 04 05 06 07 08 09 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 Estado civil Sexo Solteiro Casado Solteiro Solteiro Casado Casado Casado Solteiro Casado Casado Casado Casado Divorciado Vivo Casado Casado Divorciado Divorciado Vivo Solteiro Divorciado Casado Casado Vivo Vivo Divorciado Divorciado Solteiro Casado Casado M F F M M M M M M M F F M M M F M F F M F M M F M M F F F M Religio Catlica Catlica Catlica Catlica Esprita Esprita Catlica Africana Africana Africana Africana Evanglica Evanglica Evanglica Catlica Africana Evanglica Catlica Catlica Catlica Esprita Esprita Catlica Evanglica Africana Africana Catlica Evanglica Evanglica Catlica N de filhos 2 1 3 2 3 4 2 3 2 1 1 1 2 2 3 2 1 1 1 2 2 3 3 2 2 Regio de procedncia Interior Interior Interior Capital Capital Capital Capital Interior Interior Outro Estado Outro Estado Outro Estado Capital Capital Interior Outro Estado Outro Estado Capital Interior Outro Estado Outro Estado Capital Capital Capital Interior Interior Interior Capital Outro Estado Outro Estado Salrio mensal, em salrios mnimos 4,5 4,7 3,2 6,3 6,4 7,1 7,2 5,1 3,7 4,2 16,2 15,9 17,3 5,1 4,6 8,4 9,0 3,6 3,2 6,3 18,4 3,4 9,1 19,1 5,0 3,6 2,6 10,1 5,6 6,3 Escolaridade Fundamental Fundamental Fundamental Mdia Mdia Mdia Mdia Fundamental Fundamental Fundamental Superior Superior Superior Fundamental Fundamental Fundamental Mdia Fundamental Fundamental Fundamental Mdia Fundamental Superior Superior Fundamental Fundamental Fundamental Superior Fundamental Mdia Idade, em anos 26 28 30 45 42 36 41 45 26 25 28 29 35 37 45 42 43 40 42 31 33 29 29 45 34 30 45 46 40 36

Fonte: Dados fictcios.

a) Classifique todas as variveis que aparecem no quadro. b) Faa a tabela de distribuio de freqncias e o grfico apropriado para a varivel nmero de filhos.

14 02) Considere o seguinte rol: Consumo mensal de gua, em metros cbicos, correspondente a uma amostra de 75 contas da SANEPAR Curitiba - 2006 16 17 20 21 21 23 26 30 36 41 16 17 20 21 22 23 27 31 36 45 17 18 20 21 22 23 27 31 36 46 17 18 20 21 22 24 28 31 38 46 17 19 20 21 22 24 29 33 40 46

2 3 13 13 14

14 14 14 15 15

15 15 15 15 16

47 48 49 51 53

54 54 85 102 135

Fonte: Dados fictcios.

a) Identifique a varivel e sua unidade de medida. Classifique a varivel. b) A partir do rol, determine: a amplitude amostral, a mdia, a moda, a mediana, os quartis, o intervalo interquartil, a varincia, o desvio padro, o coeficiente de variao, os pontos discrepantes (se houver). Coloque esses resultados como notas, no rodap do rol. c) Elabore um diagrama de caixa (box plot) e um diagrama ramo e folhas correspondente ao rol. d) Elabore uma distribuio de freqncias (com freqncias simples, freqncias relativas, freqncias acumuladas e freqncias acumuladas relativas) correspondente ao rol e que tenha intervalos de classe de amplitudes iguais. e) Dos dados agrupados (item c) determine: a amplitude total, a amplitude do intervalo de classe, a mdia, a moda bruta, a mediana, os quartis, o intervalo interquartil, a varincia, o desvio padro e o coeficiente de variao. Coloque esses resultados como notas, no rodap da tabela do item c. f) Compare os resultados obtidos nos itens c e d. g) Construa o histograma, o polgono de freqncia e a ogiva (polgono de freqncias acumuladas) associados distribuio de freqncias simples do item c. h) Construa uma tabela de distribuio de freqncias simples com aproximadamente 9 classes, onde a primeira e a ltima classes devem ter amplitudes diferentes das demais classes. Apresente , junto, as colunas dos pontos mdios, das freqncias relativas e da densidade de freqncias relativas. i) Construa o histograma de freqncia simples e o de densidade de freqncias relativas associado tabela: i.1) do item c. Compare as formas dos dois histogramas. i.2) do item g. Compare as formas dos dois histogramas. Observao: Qual o valor da rea total dos histogramas de densidade de freqncias relativas?

15 03) (MONTGOMERY et RUNGER) Um artigo em Technometrics (Vol. 19, 1977, p. 425) apresenta os seguintes dados sobre taxas de octanagem de combustvel para motor, de vrias misturas de gasolina:
88,5 94,7 84,3 90,1 89,0 89,8 91,6 90,3 90,0 91,5 89,9 98,8 88,3 90,4 91,2 90,6 92,2 87,7 91,1 86,7 93,4 96,1 89,6 90,4 91,6 90,7 88,6 88,3 94,2 85,3 90,1 89,3 91,1 92,2 83,4 91,0 88,2 88,5 93,3 87,4 91,1 90,5 100,3 87,6 92,7 87,9 93,0 94,4 90,4 91,2 86,7 94,2 90,8 90,1 91,8 88,4 92,6 93,7 96,5 84,3 93,2 88,6 88,7 92,7 89,3 91,0 87,5 87,8 88,3 89,2 92,3 88,9 89,8 92,7 93,3 86,7 91,0 90,9 89,9 91,8 89,7 92,2

a) Identifique e classifique a varivel; b) Construa um diagrama de ramo e folhas; c) Determine a mdia, a mediana, a moda, os quartis e o intervalo interquartlico a partir do diagrama de ramo e folhas. Coloque esses resultados como notas, no rodap do diagrama. d) Construa um diagrama de caixa (box plot). H pontos discrepantes (outliers)? Se sim, identifique-os. e) Quais as vantagens e as desvantagens do diagrama de ramo e folhas em relao ao histograma para dados agrupados?

04) (MONTGOMERY et RUNGER) Transformaes. Em alguns conjuntos de dados, uma transformao por alguma funo matemtica aplicada aos dados originais, tais como
y ou log(y ) , pode resultar em dados que

sejam mais fceis de trabalhar, estatisticamente, do que os dados originais. Para ilustrar o efeito de uma transformao, considere os seguintes dados, que representam ciclos de falhas de um tecido: 675; 3650; 175; 1150; 290; 2000; 100; 375. a) Construa um diagrama de caixa (box plot) e comente a forma da distribuio dos dados. b) Transforme os dados usando logaritmos, ou seja, faa y1 = log( y ) , onde y so os valores antigos da varivel e y1 so os novos valores aps a transformao. Construa um diagrama de caixa (box plot) dos dados transformados e comente o efeito da transformao.

16

MEDIDAS RESUMO PARA UM CONJUNTO DE DADOS DE UMA VARIVEL QUANTITATIVA UNIDIMENSIONAL - Aula 04

Medidas de posio ou separatrizes ou quantis2 o Mediana ( ~ ) x


o o o o Tercis (T) Quartis (Q) Decis (D) Percentis ou centis (P)

Medidas de tendncia central


o Mdias3 Mdia aritmtica ( x ) Simples Ponderada Mdia geomtrica Mdia de potncia (quadrtica, cbica, biquadrtica etc) Mdia harmnica x Mediana ( ~ ) Moda (Mo)

o o

Medidas de disperso ou variabilidade


o o o Amplitude total (AT) Desvio mdio absoluto (D.M.A.) Varincia Populacional ( 2 ) Amostral (s2) Desvio-padro Populacional ( ) Amostral (s) Coeficiente de variao (C.V.) Populacional Amostral

Medidas de assimetria4 Medidas de curtose5 Momentos6


o o o Momentos absolutos Momentos centrados Momentos conjuntos

H vrios mtodos para calcular os quantis de uma varivel quantitativa discreta e, geralmente, os resultados obtidos so distintos de mtodo para mtodo. Para varivel discreta, o clculo dos quantis ser feito aqui atravs do mtodo mais simples tambm denominado mtodo ingnuo. O clculo dos quantis tambm pode ser feito para dados agrupados em classes. Neste caso, o clculo atravs do histograma de freqncia relativa facilita bastante, pois no requer memorizao de frmulas. 3 Em geral, os levantamentos de dados na Engenharia envolvem variveis quantitativas contnuas. Por isso, trabalharemos especialmente com a mdia aritmtica. Os conceitos, definies e aplicaes dos outros tipos de mdia podem ser encontrados em MILONE, Giuseppe. Estatstica geral e aplicada. So Paulo: Thomson Learning, 2006. 4 Para os interessados em conhecer um pouco mais esse conceito, vide MILONE, Giuseppe. Estatstica geral e aplicada. So Paulo: Thomson Learning, 2006. 5 Idem 6 Ibidem.

17 Conceitos ou definies: 1) Separatrizes para um conjunto de dados contnuo:

50% das observaes Mn Mediana ( x )

50%

Mx

1 das observaes 3
T0 25% das observaes Q0 Q1 T1 25%

1 3
T2 25% Q2 Q3

1 3
T3 25% Q4

10% D0 1% P0 D1

10% D2

10% D3

10% D4

10% D5

10% D6

10% D7

10% D8

10% D9

10% D10

...
P10

...
P50

...
P90

...

P99 P100

2) Mdia aritmtica simples (ou mdia): a. Populacional: Seja X: x1, x2, ..., xN um conjunto de valores para a varivel quantitativa contnua X.

xi
Ento a mdia aritmtica simples de X, denotada por X , dada por X =
i =1

b. Amostral: Seja X: x1, x2, ..., xn um conjunto de valores para a varivel quantitativa contnua X.

xi
Ento a mdia aritmtica simples de X, denotada por x , dada por x =
i =1

18

3) Medidas de disperso ou variabilidade: a. Amplitude total:


Seja X: x1, x2, ..., xn um conjunto de valores para a varivel quantitativa contnua X. Ento a amplitude total de X, denotada por ATX , dada por ATX = Mx( X ) Mn( X ) , onde Mx(X) e Mn(X) so, respectivamente, os valores mximo e mnimo de X.

b. Desvio Mdio Absoluto:


Seja X: x1, x2, ..., xn um conjunto de valores para a varivel quantitativa contnua X. Ento o desvio mdio absoluto de X, denotado por DMA(X), dado por

xi x
DMA( X ) =
i =1

xi
, onde x =
i =1

c. Varincia: i. Populacional:
Seja X: x1, x2, ..., xN um conjunto de valores para a varivel quantitativa
2 contnua X. Ento a varincia de X, denotada por X , dada por

2 X =

( xi X ) 2
i =1

xi
, onde X =
i =1

ii. Amostral:
Seja X: x1, x2, ..., xn um conjunto de valores para a varivel quantitativa contnua X. Ento a varincia de X, denotada por s 2 , dada por X

2 sX

( xi x ) 2
=
i =1

xi
, onde x =
i =1

n 1

d. Desvio padro:
a raiz quadrada positiva da varincia. i. Desvio padro populacional: = + 2 ii. Desvio padro amostral: s = + s 2

19

e. Coeficiente de variao: i. Populacional:


C.V.(X) =

X .100% , onde X e X so, respectivamente, o desvio padro X

populacional e a mdia de X.

ii. Amostral:
C.V.(X) =

sX .100% , onde s X e x so, respectivamente, o desvio padro x

amostral e a mdia de X.

EXERCCIOS:
01) Do conjunto de dados X: 2, 25, 17, 5, 40 determine (manualmente e pela calculadora) e interprete as medidas resumo abaixo, sendo X uma varivel quantitativa contnua amostral: a. n b. Q1 c. Q3 d. x e.

xi
i =1

f.

xi2
i =1

g. sX h. C.V.(X)

02) Considere o conjunto de valores de uma varivel quantitativa contnua populacional X, dado por X: x1, x2, ..., xN . Usando propriedades de somatrio, mostre que a varincia de X, dada por

2 X =

( xi X ) 2
i =1

2 , pode ser escrita mais convenientemente7 por X =

xi2
i =1

2 X , onde

xi
X =
i =1

O uso da frmula de definio de varincia ocasiona a perda de casas decimais, caso a mdia no seja um valor inteiro ou um decimal exato.

20 03) Considere o conjunto de valores de uma varivel quantitativa contnua amostral X, dado por X: x1, x2, ...,

2 xn . Usando propriedades de somatrio, mostre que a varincia de X, dada por s X =

( xi x ) 2
i =1

n 1

, pode

ser escrita mais convenientemente por s 2 X

n xi i =1 i =1 = n 1 n(n 1)
n

xi2

04) Abaixo est representada uma tabela genrica de distribuio de freqncias com intervalos de classe. Caso se tenha os dados de uma varivel quantitativa contnua X agrupados em uma tabela de distribuio de freqncias com intervalos de classes, a varincia amostral ser dada por

2 sX =

( xi x ) 2 .ni
i =1

n 1

. Assim, demonstre que

2 sX

k xi .ni ( xi x ) .ni , = i =1 = i =1 i =1 n 1 n 1 n(n 1)


k
2

xi2 .ni

onde:

ni = freqncia absoluta a i-sima classe, n = tamanho da amostra, com n = ni ,


i =1 k

k= n de classes da distribuio, xi o ponto mdio da i-sima classe. Tabela genrica: i 1 2 l1 l2 X L1 L2 ni n1 n2 xi x1 x2

M
k lk

M
Lk Total

M
nk n

M
xk

05) Considere o conjunto de valores de uma varivel quantitativa contnua populacional X, dado por X: x1, x2, ..., xN . O que acontece com a mdia e com a varincia de X quando: a) Cada valor de X somado de uma constante real no nula c; b) Cada valor de X multiplicado por uma constante real no nula c.

21 06) Assinale V para verdadeiro e F para falso. Justifique as sentenas falsas: ( ) Na prtica, a mdia ser tanto mais representativa do fenmeno estudado quanto menor for o valor do seu coeficiente de variao. (...) Uma curva simtrica se caracteriza por possuir a moda maior que a mediana e a mdia. (...) Numa distribuio de freqncias em que a varivel estudada s apresenta um nico valor, o desvio padro ser 1. (...) Se, numa distribuio de freqncias, 50% dos dados situam-se abaixo da mdia, pode-se dizer que essa distribuio simtrica. (...) Se multiplicarmos todos os elementos de uma srie por uma constante, a mdia no se alterar e a varincia ficar multiplicada por essa constante. (...) Em qualquer distribuio de freqncias, a mediana sempre ser a mdia aritmtica entre o 1 e o 3 quartil. 07) Um comerciante atacadista vende determinado produto em sacas que deveriam conter 16,50 kg. A pesagem de uma amostra de 400 sacas revelou os resultados representados na tabela abaixo:

Pesos (kg)
14,55 15,55 16,05 16,55 17,05

N de sacas
2 40 123 155 80 400

xi

fri

Fi

Fri

15,55 16,05 16,55 17,05 17,55 Total

a) Preencha a tabela dada com as colunas das classes, dos pontos mdios, das freqncias relativas, das freqncias acumuladas, das freqncias acumuladas relativas e da densidade de freqncia relativa. b) Esboce o histograma de densidade de freqncia relativa e a ogiva (polgono de freqncia acumulada). Determine: c) A amplitude da distribuio; d) O peso mdio e o peso mediano por saca; e) A moda bruta; f) h) j) k) l)
5 5

xi .ni
i =1

g)

xi2 .ni
i =1

O desvio padro; Classifique a curva dessa distribuio quanto assimetria. Abaixo de qual peso encontram-se 70% das sacas? Acima de qual peso encontram-se as 100 sacas mais pesadas?

i) O coeficiente de variao;

m) O peso mdio por saca uma boa medida de tendncia central para representar a distribuio? Justifique.

Das könnte Ihnen auch gefallen