Sie sind auf Seite 1von 39

UNIVERSIDADE FEDERAL RURAL DE PERNAMBUCO UFRPE UNIDADE ACADMICA DE SERRA TALHADA UAST CURSO DE LICENCIATURA EM QUMICA

DISCIPLINA ESTATSTICA B (PARTE I)

PROFESSORA VERIDIANA SANTOS

ALUNO():

Serra Talhada, 2010

PROGRAMA

Estatstica B
Parte I Estatstica Descritiva
Introduo Geral (Definio) Conceitos Fundamentais Sries Estatsticas Representao grfica Representao de Dados Distribuio de Freqncia Medidas de tendncia central Medidas de disperso

1. Introduo

POR QUE ESTUDAR ESTATSTICA ?

A cincia Estatstica aplicvel em qualquer ramo do conhecimento onde se manipulam dados experimentais. Assim, a Fsica, Qumica, Engenharia, Economia, Medicina, Engenharia de Pesca, Biologia, Turismo, etc, tendem cada vez mais a servir-se dos Mtodos estatsticos como ferramenta de trabalho, da sua grande e crescente importncia. As aplicaes da estatstica se desenvolveram de tal forma que, hoje, praticamente todo campo de estudo se beneficia da utilizao de mtodos estatsticos. Os fabricantes fornecem melhores produtos a custos menores atravs de tcnicas de controle de qualidade. Controlam-se doenas com auxlio de anlises que antecipam epidemias. Espcies ameaadas so protegidas por regulamentos e leis que reagem a estimativas estatsticas de modificao do tamanho das populaes, etc. O estudo da estatstica pode tornar o leitor mais crtico em sua anlise de informaes, e menos sujeito s afirmaes enganosas, como as que se acham comumente associadas s pesquisas, aos grficos e s mdias. Como cidado, importante que cada um aguce sua capacidade de reconhecer, dados estatsticos distorcidos, assim como a capacidade de interpretar, inteligentemente dados que se apresentem sem distoro.

Texto para se distrair - Faxineiro da Microsoft


Um homem que estava desempregado entra num concurso da Microsoft para ser faxineiro. O Gerente de RH o entrevista, faz um teste (varrer o cho) e lhe diz: - O servio seu. Diga-me seu e-mail e eu lhe enviarei a ficha para preencher, com data e hora em que dever se apresentar para o servio. O homem, desesperado, responde que no tem computador, e muito menos, e-mail. O Gerente de RH, disse que lamenta, mas se no tiver e-mail, quer dizer que virtualmente no existe, e, como no existe, no pode ter o trabalho. O homem sai desesperado, sem saber o que fazer; tem somente R$ 10 no bolso. Ento decide ir ao supermercado e comprar uma caixa de 10 quilos de tomates. Bate de porta em porta vendendo os tomates a quilo, e, em menos de duas horas, tinha conseguido duplicar o capital. Repete a operao mais trs vezes e volta para casa com R$ 60. Ento, ele verifica que pode sobreviver dessa maneira, sai de casa cada dia mais cedo e volta a casa mais tarde, e assim triplica ou quadruplica o dinheiro a cada dia. Pouco tempo depois, compra uma Kombi, depois troca por um caminho e pouco tempo depois chega a ter uma pequena frota de veculos para distribuio. Passados 5 anos, o homem dono de uma das maiores distribuidoras de alimentos dos Estados Unidos. Pensando no futuro da sua famlia, decide fazer um seguro de vida. Chama um corretor, acerta um plano e quando a conversa acaba, o corretor lhe pede o e-mail para enviar a proposta. O homem disse que no tem e-mail. Curioso, o corretor lhe disse: Voc no tem e-mail e chegou a construir este imprio, imagine o que voc seria se tivesse e-mail!! O homem pensa e responde: - Seria faxineiro da Microsoft!!

2. CONCEITOS FUNDAMENTAIS DE ESTATSTICA Conceito Antigo Antigamente a Estatstica era usada para contagem demogrfica (batismo, casamento, bitos). A primeira tentativa de Registro Sistemtico de Informaes foi de nascimento e bito, pelos Romanos. Conceito Moderno A cincia Estatstica aplicvel a qualquer ramo do conhecimento onde se manipulam dados experimentais. Assim, a Fsica, Qumica, Engenharia, Economia, Medicina, Biologia, Cincias Sociais, Cincias Administrativas, etc, tendem cada vez mais a servir-se dos mtodos estatsticos como ferramenta de trabalho, da sua grande e crescente importncia. Estatstica Definio: uma cincia com base matemtica que utiliza a coleta de dados, sua classificao, sua apresentao, sua anlise e sua interpretao visando a sua utilizao dentro dos planos de uma empresa. Diviso da Estatstica: 1. Descritiva ou Dedutiva - Procura descrever, expor um certo grupo de observaes, normalmente denominado de amostra, procurando expressar estas observaes atravs de medidas e formas de representao (tabelas, grficos, curvas, etc). 2. Inferencial ou Indutiva - Compreende um processo de generalizao, a partir da anlise e interpretao de dados amostrais. Estatsticas: So conjuntos de dados ou informaes que servem para demonstrar um determinado fenmeno. Ex1:. estatsticas econmicas (que fornecem dados sobre salrios, preos, vendas, produo, etc). Ex2:. estatsticas demogrficas (que fornecem dados sobre nascimento, morte,etc). Ex3:. Estatsticas qumicas (que fornecem dados sobre tempo de reao de uma soluo, dados sobre germinao de sementes-tempo mdio, pecentuais, etc). Seleo de Elementos

6 1. Populao - Chamamos de populao a qualquer conjunto de pessoas, animais ou objetos sobre o qual estamos interessados em estudar uma certa caracterstica. Assim, a cada elemento da populao corresponde um valor da caracterstica de interesse observada. Tal valor ser genericamente representado por X, e chamado de VARIVEL. Ex:. Podemos dizer que a caracterstica X = IDADE, uma varivel com respeito a uma populao de alunos do curso de LQ. Podemos ter tambm X = NOTAS, etc com respeito ao mesmo conjunto de alunos. 2. Amostra - Chamamos de amostra a qualquer subconjunto no vazio, finito de uma populao. Ex:. Considere a populao de todos os alunos do curso de LQ da UAST matriculados no ano de 2009. Se considerarmos para um determinado estudo, somente os alunos do 2 perodo, ento teremos uma amostra. FASES DO TRABALHO ESTATSTICO As fases do Trabalho Estatstico que iremos estudar so: 1. 2. 3. 4. 5. Planejamento Coleta dos Dados Crtica de Questionrio Apurao de Informaes Resultados

1. PLANEJAMENTO Esta etapa tem como finalidade identificar o objetivo do trabalho, identificar a populao e a amostra, verificar o oramento. 2. COLETA DE DADOS a busca de informaes necessrias para iniciar o trabalho estatstico propriamente dito. A coleta de dados pode ser feita atravs de questionrio, declaraes de registros, consulta ao censo, etc. 3. CRTICA DE QUESTIONRIO o trabalho de reviso e correo com a finalidade de evitar graves erros. Os erros podem surgir atravs de perguntas mal elaboradas, incompatibilidade do programa usado (software).

7 4. APURAO DAS INFORMAES a contagem e o agrupamento dos fatos constatados. A apurao pode ser feita atravs de computador, mquina ou manualmente. 5. Resultados a forma como sero apresentadas as informaes apuradas. Os resultados podem ser apresentados atravs de tabelas, grficos, quadros informativos, e outros.

3. SRIES ESTATSTICAS ou TABELAS ESTATSTICAS As sries estatsticas constituem um grande passo para a anlise dos dados de determinados estudos. Mas para se construir uma srie (tabela) estatstica, necessrio conhecer os elementos que a compem. Elementos que compem uma tabela ou srie estatstica Ttulo (A) Cabealho (B) Corpo (C) Coluna Indicadora (D) Rodap (E) A Obiturio por doenas transmissveis, na cidade Q, do estado E, no ano X B DOENAS DIFTERIA COQUELUCHE SARAMPO TUBERCULOSE MENINGITE TOTAL E Fonte: Fictcia N de BITOS 27 48 09 16 35 135

As sries estatsticas podem ser classificadas em: SIMPLES ou CONJUGADAS. As sries simples so trs, e sua classificao ocorre conforme a variao de um desses caracteres (poca, local, fenmeno) ou fatores.

Temporais, Cronolgicas ou Evolutivas Varia: O tempo (Fator cronolgico ) Geogrficas, Territoriais ou Espaciais Varia: O local (Fator geogrfico ) Especificativas ou Categricas Varia: O Fenmeno (Fator especificativo ) As sries conjugadas so quatro, e sua classificao ocorre tambm conforme a variao de um desses caracteres (poca, local, fenmeno) ou fatores. 1. Geogrfico-temporal (s o fato fixo) 2. Geogrfico-especificativa (s o tempo fixo) 3. Especificativo-temporal (s o local fixo) 4. Especificativo-geogrfico-temporal (so variveis o fato, o local e o tempo).

Vejamos alguns exemplos:

10

TABELAS SIMPLES Espcies capturadas no Rio So Francisco, em agosto de 2008 ESPCIES QUANTIDADE (T) Tilpia 10 Tucunar 15 Dourada 16 Total 41 Fonte: Instituo Xingo SE Classificao: ESPECIFICATIVA Tilpias capturadas no Rio So Francisco, em Piranhas de agosto a dezembro de 2008 MESES QUANTIDADE (T) Agosto 20 Setembro 25 Outubro 27 Novembro 32 Dezembro 26 Total 130 Fonte: Instituto Xingo - SE Classificao: TEMPORAL Tilpias capturadas em trs localidades do Rio So Francisco, em 2008 LOCALIDADES QUANTIDADE (T) Piranhas 20 Paulo Afonso 12 Petrolina 16 Total 48 Fonte: Instituo Xingo SE

11

Classificao: GEOGRFICA TABELAS COMPOSTAS

Mercadorias compradas(caixas) pelo supermercado P-de-Serra, em Serra Talhada de agosto a outubro de 2007 MESES Agosto Setembro Outubro
MERCADORIAS

Sabo em p(Lavarte) Batata frita(Ruffles) Total

20 40 60

22 25 47

28 12 40

Fonte: Supermercado P-de-Serra Classificao: ESPECIFICATIVO - TEMPORAL Peixes vendidos (Kg) pelas duas maiores cidades da regio do Paje, no perodo de agosto a outubro de 2006 MESES Agosto Setembro Outubro CIDADES Serra Talhada So Jos do Egito Total Fonte: SEBRAE Classificao: GEOGRFICO - TEMPORAL

60 70 110

20 40 60

30 20 50

12

Espcies vendidas na Regio do Paje, em agosto de 2007 LOCALIDADE TRIUNFO FLORES ESPCIES(t) Tilpia Tucunar Total Fonte: SEBRAE Classificao: ESPECIFICATIVO - GEOGRFICA 20 40 60 22 25 47

Espcies vendidas (em toneladas) em duas localidades, em 2006 e 2007 ANOS 2006 2007 ESPCIES(t) TUCUNAR 20 TILPIA 12 TOTAL 32 Fonte: Comrcio do peixe de gua doce TABIRA CALUMBI 12 10 22 TABIRA 15 25 40 CALUMBI 16 14 30

Classificao: ESPECIFICATIVO GEOGRFICO - TEMPORAL

13

4. REPRESENTAO GRFICA Introduo As sries estatsticas constituem um grande passo para a anlise dos dados, entretanto, sentimos tambm a necessidade de uma nova maneira de representar os dados de tal forma que nos fornea de uma maneira mais imediata uma impresso de conjunto do material apresentado. As relaes ou variaes dos valores, com respeito s variveis, podem ser melhores e mais rapidamente compreendidas atravs de uma representao grfica do que atravs de uma tabela. Quando se publica um grfico freqente colocar o ttulo ao p do mesmo. Deve-se indicar claramente o ttulo, a origem, as escalas, e se necessrio, notas e/ou chamadas. Quando se representa graficamente mais de uma varivel, devese colocar legendas para diferenci-las. As escalas devem crescer da esquerda para a direita e de baixo para cima. Os eixos do sistema cartesiano e as linhas auxiliares devem ter traado leve em relao ao restante do grfico (parte que pretendemos evidenciar). Existem muitos tipos de representao grfica. A seguir, vamos estudar algumas delas. quelas que julgamos mais importantes de um modo geral, para a rea de qualidade e produtividade. Uma forma de se examinar melhor os dados de uma distribuio de freqncia, atravs de uma representao grfica, onde se possa perceber as variaes das freqncias de uma classe para outra. Tais variaes, olhadas em conjunto, nos do tambm uma idia da simetria ou assimetria da distribuio com respeito a algum valor de interesse. A seguir, apresentaremos alguns dos principais tipos de representao grfica das distribuies de freqncias. 1. HISTOGRAMA a representao grfica de uma distribuio de freqncia, por meio de retngulos justapostos, onde fazemos corresponder, a cada classe da distribuio, um retngulo de base igual amplitude da classe, e cuja rea proporcional freqncia da classe. Em se tratando de intervalos de mesma amplitude, ns consideramos as alturas dos retngulos iguais s freqncias das classes. No eixo das abscissas ns marcamos os limites de classe ou os pontos mdios das classes, enquanto que no eixo das ordenadas, ns marcamos as alturas dos retngulos. 2. POLGONO DE FREQUNCIA a representao grfica que se obtm, ligando os pontos mdios dos retngulos do histograma (nos topos dos retngulos).

14 De maneira anloga poderamos ter construdo uma distribuio de freqncia relativa, e o correspondente polgono de freqncia relativa. OBS:. Estes dois grficos sero confeccionados em sala de aula. Sugiro deixar o espao de umas 6 linhas neste espao para que os senhores possam construir os seus grficos. 3. COLUNAS Esse tipo de grfico utilizado principalmente quando pretendemos comparar dados qualitativos ou quantitativos de carter discreto.
25
22

QUANTIDADE(Toneladas)

20
17 15

15

10

0 MAMONA ALGODO SEMENTES GIRASSOL

Fonte: ONG ABC Sementes doadas pela ONG ABC para o MST, na Fazenda Saco, em agosto de 2007

15

4. BARRAS semelhante ao grfico em colunas, sendo que os retngulos so dispostos horizontalmente.

DEZEMBRO

26

NOVEMBRO

32

MESES

OUTUBRO

27

SETEMBRO

25

AGOSTO

20

10

15

20

25

30

35

N de SEMENTES (T)

Fonte: ONG ABC Sementes de mamona distribudas pela ONG ABC ao MST-Fazenda Saco, de agosto a dezembro de 2007 5. PIZZA ou TORTA ou em SETORES Esse tipo de grfico essencialmente til quando se deseja comparar dados em relao ao nmero total de observaes. A comparao feita atravs de setores de um crculo em lugar de comprimentos de retngulos. Traamos uma circunferncia e calculamos os ngulos centrais para cada valor da varivel ou atributo, com o auxlio de transferidor. Estes ngulos delimitaro os correspondentes setores.

16

31% 41% MAMONA ALGODO GIRASSOL

28%

Fonte: ONG ABC Percentual de sementes doadas pela ONG ABC para o MST, na Fazenda Saco, em agosto de 2007

6. LINHAS Esse tipo de grfico essencialmente til quando se deseja acompanhar ou comparar um determinado fenmeno no decorrer do tempo.
35 32 30

N de SEMENTES

27 25 20 15 10 5 0 20 25

26

AGOSTO

SETEMBRO

OUTUBRO MESES

NOVEMBRO

DEZEMBRO

Fonte: ONG ABC Sementes de mamona distribudas pela ONG ABC ao MST-Fazenda Saco, de agosto a dezembro de 2007

17

5. REPRESENTAO DE DADOS Dados Brutos: Chamamos de dados brutos a um conjunto de dados que no foram ainda numericamente organizados. Ex1:. Os dados representam as idades (em anos) de 20 alunos do curso de ECONOMIA durante um certo ms (supondo uma certa generosidade da professora). 24 23 15 16 17 21 18 20 22 24 19 20 19 20 17 18 20 22 21 22

Rol: Chamamos de rol a um conjunto de dados brutos dispostos em ordem (crescente ou decrescente) de grandeza. Ex2:. Os dados representam as idades (em anos) de 20 alunos do curso de ECONOMIA durante um certo ms. Em ordem crescente de grandeza. 15 18 20 22 16 19 20 22 17 19 21 23 17 20 21 24 18 20 22 24

6. DISTRIBUIO DE FREQUNCIA Quando trabalhamos com uma grande massa de dados, conveniente distribu-la em intervalos ou classes, e associar a cada classe, o nmero de elementos ou valores que pertencem quela classe. Ao nmero de freqncia de uma classe ns chamamos de Freqncia Absoluta dessa classe. Distribuio de Freqncia: Chamamos de distribuio de freqncia a toda correspondncia que associa a cada classe, a sua freqncia. Tal correspondncia geralmente representada atravs de uma tabela aberta nas laterais, e que contenha um ttulo no qual se especifique o fato, o local e a poca em que se realizou o estudo. Deve conter tambm a fonte da qual foram extrados os dados, esta fonte fica localiza no final da tabela. Veja o exemplo.

18

Tabela 1. Idade de 20 alunos dos cursos de ECONOMIA da UAST, em 2008, Pernambuco CLASSES FREQUNCIAS(fi) 15 l----- 17 02 17 l----- 19 04 19 l----- 21 06 21 l----- 23 05 23 l----- 25 03 TOTAL 20 Fonte: UAST

ALGUMAS DENOMINAES Observando a tabela abaixo, percebemos algumas denominaes: Tabela 2. ........................................ LIi l---- LSi fi 18 l--- 24 7 24 l--- 30 16 30 l--- 36 12 36 l--- 42 10 42 l--- 48 15 TOTAL 60 Fi 7 23 35 45 60 1 hi 7/60 16/60 12/60 10/60 15/60 Hi 7/60 23/60 35/60 45/60 60/60 = 1

LI - limite inferior do i - simo intervalo, i = 1,2,...,k , onde: k = n de intervalos ou classes. Ex:. LI3 = 30 (30 o limite inferior da 3 classe ( k = 5)) LS - limite superior do i-simo intervalo , i = 1,2,...,k Ex:. LS3 = 36 (36 o limite sup. da 3 classe) e LS 4 = 48 ( o limite sup. da 5 classe) fi - freq. absoluta da i- sima classe, i = 1,2,...,k Ex:. f4 =10 (freq. absoluta da 4 classe) n = fi = f1+ f2 +.....+ fk = 7 + 16 + 12 + 10 + 15 =60 Amplitude Total ( A)

19 A=M-m Amplitude de Classe ( C ) C = LSi - LIi , i = 1,2,...,k Ex:. C = 24 - 18 = 6 C = 48 - 42 = 6 Frequncia Relativa ( hi ) hi = fi /n , i = 1,2,...,k Ex:. h4 = 10/60 = 0.1666 * 100 (16.666 =~17%) Frequncia Absoluta Acumulada ( Fi ) Fi = f1 + f2 +......+ fi Ex:. freq. acumulada da 4 classe F4 = 7 + 16 + 12 + 10 = 45 Frequncia Relativa Acumulada ( Hi ) Hi = Fi /n , i = 1,2,....,k Ex:. freq . relativa acumulada da 3 classe H3 = F3 /n = 35/60 * 100 = 58.33 =~58%

DISPOSITIVO PRTICO PARA A CONSTRUO DE UMA DISTRIBUIO DE FREQUNCIA Para se construir uma distribuio de frequncia com um mnimo de 5 e um mximo de 20 intervalos de mesma amplitude, deve-se seguir os seguintes passos: 1. Listar os dados (ROL). 2. Calcular a Amplitude Total: A = M - m , onde "M" o maior valor do conjunto de dados e "m" o menor valor deste mesmo conjunto. 3. Calcular os quocientes A/20 e A/5 4. Considerar o intervalo ( A/20, A/5 )

20 5. Escolher convenientemente uma amplitude no intervalo construdo no passo "4", e tomar esse valor como uma amplitude comum para todas as classes. Tal amplitude ser designada por "C". OBS:. Se o n de classes a considerar for fixado (K, conhecido), ento a amplitude comum dos intervalos ser: C = A/K Ex:. Construir uma distribuio de frequncia com intervalos de mesma amplitude, para os dados do Ex1. SOLUO: Seguindo os passos do Dispositivo Prtico 1. 15 18 20 22 16 19 20 22 17 17 18 19 20 20 21 21 22 23 24 24

2. A = 24 - 15 = 9 A=9 3. A/20 = 9/20 = 0.45 A/5 = 9/5 = 1.8 = 2.0 4. Consideremos o intervalo (0.45;2) 5. Decidimos escolher C = 2, por ser uma das amplitudes mais convenientes entre as possveis amplitudes do intervalo (0.45; 2.0). Tabela 3. ... CLASSES 15 l----- 17 17 l----- 19 19 l----- 21 21 l----- 23 23 l----- 25 TOTAL Fonte: UAST

FREQ.(fi) 02 04 06 05 03 20

Esta distribuio, precisamente a distribuio de frequncia da Tabela 1.

21 7. MEDIDAS DE TENDNCIA CENTRAL ou de POSIO Introduo Medidas de tendncia central ou de posio,so indicadores ou medidas descritivas da situao ou colocao de todos os dados (de uma amostra ou de uma populao). Tal valor deve ser um valor mdio de todas as observaes. Os indicadores de posio mais empregados so: Mdia aritmtica, Mediana, e Moda. 1. Mdia Aritmtica Este o indicador de posio que a maioria das pessoas tm em mente, quando se fala na palavra VALOR MDIO. No obstante, devemos entender que esta palavra pode estar representando um qualquer dos indicadores de posio. A mdia aritmtica de um conjunto de valores obtida somando todos os valores do conjunto, e dividindo o resultado obtido pelo nmero total de dados. Por exemplo, se os valores: 25 23 22 30 24 26 28 27 designam as idades de 8 indivduos observados, ento a idade mdia desses indivduos ser: IDADE MDIA = (25+23+22+30+24+26+28+27) / 8 = 205 / 8 = 25,625 IDADE MDIA = 25,625 Formalmente, se x1, x2, ... , xn designam n valores observados de uma varivel X, ento a mdia aritmtica desse conjunto de valores ser designada porx e definida por: (1) x = ( xi ) / n

Para o caso de uma distribuio de freqncia, a mdia aritmtica calculada atravs da frmula (2) x = ( yifi ) / n , onde: yi = ponto mdio da isima classe, isto , yi = (LIi + LSi) / 2 ; i = 1, 2, ..., k k = n de intervalos de classes. EXEMPLO ILUSTRATIVO DAS TRS SITUAES: Considere as seguintes toneladas de uma amostra de 30 caixas de arroz comercializados no supermercado Mercantil, em Serra Talhada em 2007. 116 146 136 119 106 118 118 153 143 122 116 139 127 106 145

22 129 120 122 130 114 146 133 124 141 133 131 144 146 133 141 a) Calcular a mdia aritmtica atravs da frmula (1); b) Construir uma distribuio de freqncia e calcular a mdia aritmtica dessa distribuio. SOLUO: a) Logo, x = xi / 30 = 3897/ 30 = 129,9 = 130 b) Usando o dispositivo prtico referente ao assunto anterior, construmos a seguinte distribuio de freqncia: Caixas de arroz (em toneladas) comercializados no supermercado Mercantil, em Serra Talhada em 2007 Caixas(t) Freqncia(fi) Ponto mdio Produto (yifi) (yi) 105 l115 3 110 330 115 l125 9 120 1080 125 l135 7 130 910 135 l145 6 140 840 145 l155 5 150 750 Total 30 3910 Logo, x = ( yifi) /30 = 3910/ 30 = 130,3 = 130 Observao: Considerando que todos os valores do conjunto de dados entram no clculo da mdia aritmtica, esta fica afetada por cada um desses valores. Dessa forma, a presena de valores extremos, tem uma grande influncia sobre o clculo da mdia, e em muitos casos pode distorcer os resultados, tornando-se assim, indesejvel como medida de posio. Exemplo: Considere as espessuras (em mm) de 5 fios de fibras ticas de um certo laboratrio de estudo: 18 19 19 20 55

23 Nesta situao, usando a mdia aritmtica como um indicador de posio desses dados, obtm: x = 26,2 = 26 mm de espessura. Assim, esse valor, no muito representativo para o referido conjunto de dados. O valor 26 ficou muito afastado dos valores tpicos: 18,19, 19, 20. A mdia nesse caso ficou muito afetada pelo valor extremo 55. A seguir, vamos definir um tipo de medida de posio que no tem esse inconveniente, na presena de valores extremos. 2. Mediana A mediana, de um conjunto finito, ordenado de valores, um valor que divide o conjunto de dados em duas partes iguais, de modo que o nmero de observaes maiores ou iguais a esse valor igual ao nmero de observaes menores ou iguais ao mesmo. Para um conjunto de dados dispostos em ordem crescente de grandeza, a mediana ser o valor central, se o nmero de dados for mpar, e ser definida como a mdia dos dois valores centrais, se o nmero de dados for par. Mais precisamente, se x1 x2 ... xn so os valores observados de uma varivel X, e se Me designa a mediana desse conjunto ento: Me = x(n + 1)/2 se n for mpar; (xn/2 + xn/2 + 1) / 2 Exemplo: Consideremos as espessuras do exemplo anterior 18 19 19 20 55 Esse conjunto de dados j est ordenado. Logo, a mediana ser (n mpar) Me = x3 = 19 mm de espessura. Como podemos perceber, este valor um bom representante do referido conjunto de espessuras pois, ele est entre os valores tpicos do conjunto. Portanto na presena de valores atpicos (valores extremos), a mediana um indicador de posio melhor do que a mdia aritmtica. Exemplo: Os dados a seguir designam o comprimento (em cm) de fios de fibras ticas que sero utilizados na fabricao de telefones celulares: 3,1 3,6 3,8 3,2 5,1 5,5 se n for par.

Calcular o nvel mediano dos comprimentos dos fios.

24 SOLUO: Ordenando os dados temos: 3,1 3,2 3,6 3,8 5,1 5,5

Como n par (n = 6), ento a mediana ser: Me = (x3 +x4) / 2 = (3,6 +3,8) / 2 = 3,7 A mediana de uma distribuio de freqncia ser definida pela seguinte frmula: (4) Me = am + Cm * (n/2 Fa) / fm

onde: am = limite inferior da classe que contm a mediana (classe mediana) Cm = amplitude da classe mediana Fa = freqncia acumulada anterior freqncia acumulada da classe mediana fm = freqncia absoluta da classe mediana Calcular a mediana da seguinte distribuio de freqncia: Comprimentos de fios de fibras ticas (em cm), do laboratrio de Qumica da UAST,Serra Talhada 2007 Comprimentos(cm) Quantidade de fios 3,2 l3,5 4 3,5 l3,8 6 3,8 l4,1 10 4,1 l4,4 15 4,4 l4,7 30 4,7 l5,0 15 5,0 l5,3 10 5,3 l5,6 6 5,6 l5,9 4 Total 100 Fonte: Dept de Qumica da UAST

25 SOLUO: Observando as freqncias absolutas acumuladas da tabela acima, ns conclumos que a classe que contm a mediana a classe 4,4 l4,7 , 5 classe de freqncia acumulada F5 = 65, frequncia acumulada anterior F4 = 35, e freqncia absoluta f5 = 30. Assim substituindo esses valores na frmula (4), e considerando que: am = a5 = 4,4 e Cm = C5 = 0,3 temos, Me = 4,4 + 0,3 (50 35 ) / 30 = = 4,4 + 0,3(0,5) = = 4,4 + 0,15 = 4,45 3. Moda A moda de um conjunto de dados, por definio o valor que ocorre com a maior freqncia. Tal valor ser designado por Mo. Se todos os valores so distintos ento a moda no existe. De acordo com essa definio, podemos ter mais de uma moda para um mesmo conjunto de dados ou distribuio. A moda pode ser usada inclusive para dados qualitativos. Exemplo 1: Indivduos segundo o tipo de sangue Tipo de sangue Frequncia O 215 A 190 B 55 AB 20 Observe nesse conjunto, que o sangue tipo O o que aparece com maior freqncia. Assim, a moda o sangue tipo O. Exemplo 2: Os dados a marca) de carros: 0890 0895 1300 1400 2100 2350 seguir designam os pesos em gramas de 18 baterias (mesma 0925 1200 1230 1250 2100 2100 2100 2100 2352 2420 2430 2450

O dado que aparece com a maior freqncia, o valor 2100. Portanto, esse conjunto tem moda nica, isto e: Mo = 2100 gramas

26

Exemplo 3: Os dados a seguir representam pesos em gramas de 30 pilhas (utilizadas em rdio porttil) fabricadas pela empresa JJJ em Julho de 2000: 0,6 0,9 1,2 0,7 0,9 1,2 0,7 0,9 1,2 0,7 0,9 1,2 0,8 1.0 1,2 0,9 1,1 1,3 0,9 1,2 1,3 0,9 1,2 1,4 0,9 1,2 1,5 0,9 1,2 1,6

Obtenha a moda desse conjunto. SOLUO: Considere a seguinte tabela auxiliar Pesos(g) 0,6 0,7 0,8 0,9 1,0 1,1 1,2 1,3 1,4 1,5 1,6 Total Quantidade de pilhas 1 3 1 9 1 1 9 2 1 1 1 30

Nesse exemplo, observe que a freqncia mxima 9, est associada aos valores 0,9 e 1,2. Logo, temos precisamente duas modas: Mo = 0,9 gramas e Mo = 1,2 gramas , (BIMODAL)

No caso de uma distribuio de freqncia, a moda ser definida pela frmula (Frmula de CZUBER) (5) Mo = am + Cm * (1/ 1 + 2) Onde: 1 = fm fa ; 2 = fm fs ;

27 am = limite inferior da classe de maior freqncia (classe modal); Cm = amplitude da classe modal; fm = freqncia absoluta da classe modal. fa = freqncia absoluta de ordem imediatamente inferior freqncia absoluta da classe modal. fs = freqncia absoluta de ordem imediatamente superior freqncia absoluta da classe modal. Uma maneira simples de se obter um valor prximo da moda, tomar o ponto mdio da classe de maior freqncia. Alguns autores inclusive definem dessa maneira, a moda de uma distribuio de freqncia. Exemplo 4: Calcular a moda da distribuio de freqncia da tabela anterior. SOLUO: Vemos na referida tabela que: fm = 30 fa = 15 Por outro lado: 1 = fm fa = 30 15 = 15; 2 = fm fs = 30 15 = 15 1 + 2 = 30 Substituindo esses valores na frmula (5); obtemos Mo = 4,4 + (0,3) * (15 / 30) = Mo = 4,4 + (0,3)*(0,5) = 4,4 + 0,15 = 4,55 Observao: Nesse particular exemplo, a moda coincide com o ponto mdio da classe modal, isto : Y5 = (4,4 + 4,7) / 2 = 9,1 / 2 = 4,55 fs = 15 am = 4,4 Cm = 0,3

28

EXERCCIOS
1. Para os dados abaixo: a) Construir uma distribuio de frequncia com intervalos de mesma amplitude, e calcular a mdia aritmtica dessa distribuio (arredonde p/ uma casa decimal); b) Calcule a mediana e a moda dos dados; c) Com base nos dados, crie um ttulo coerente (inclua tambm a fonte); 2,3 2,7 3,1 3,5 2,4 2,8 3,1 3,5 2,5 2,9 3,2 3,5 2,5 3,0 3,2 3,6 2,5 3,0 3,3 3,6 2,6 3,0 3,3 3,6 2,6 3,0 3,4 3,6 2,6 3,0 3,5 3,6 2,6 3,1 3,5 3,6 2,6 3,1 3,5 3,6

2. Qual o indicador de posio mais adequado para representar o seguinte conjunto de Peso(mg) de p de chumbo? Obtenha seu valor. 18 26 19 27 21 28 22 28 22 29 23 70 25 112

29 8. MEDIDAS DE DISPERSO OU DE VARIABILIDADE Introduo Na maioria das situaes a medida de posio no suficiente para representar a distribuio dos dados. Fazse necessrio ento, definir indicadores que nos d idia de como esto distribudos os valores ao redor de tal medida de posio. So chamados indicadores ou medidas de disperso ou variabilidade. Medidas de disperso so indicadores descritivos do grau de concentrao ou disperso dos dados, em relao ao indicador de posio considerado. As medidas de disperso mais usadas so: Amplitude total, Desvio mdio, Varincia, Desvio padro e Coeficiente de variao. 1. Amplitude Total (A) Esta medida j foi definida anteriormente, quando estudamos Medida de posio (A = M m). a mais pobre medida de disperso, uma vez que s utiliza como informao dois valores do conjunto. Exemplo: Considere os trs seguintes grupos de dados: Grupo A: 1 93 1 94 2 94 3 95 5 97 6 98 6 98 7 100

Grupo B: 1 50 44 51 45 52 46 52 48 54 48 55 49 55 50 100

Grupo C: 1 52 8 62 11 70 14 72 28 84 30 91 37 92 48 100

Observe que em cada grupo, a mdia aritmtica a mesma (x = 50). O mesmo ocorre com a mediana (Me = 50), para cada grupo e a amplitude total a mesma (A = 99) para as trs situaes. Claramente, observamos que as trs distribuies de dados so completamente diferentes e, no entanto, a amplitude total no reflete de maneira alguma essas diferenas. As medidas que definiremos a seguir refletem, melhor essas diferenas.

30 2. Varincia (S2) e 3. Desvio Padro (S) A varincia de um conjunto de dados definida como a mdia aritmtica dos quadrados, dos desvios com respeito mdia aritmtica. Assim, se x 1, x2,..., xn so os valores observados de uma varivel X, e designando por S2, a varincia desse conjunto de valores, temos: S2 = ( xi - x ) / n Suponha agora a situao em que os referidos valores so tais que f 1 deles so iguais a x1, f2 deles iguais a x2, ..., fk deles iguais a xk, com f1 + f2 + ... + fk = n. Ento a varincia desse conjunto de dados pode ser obtida atravs da frmula: S2 = ( ( xi - x)2 fi) / n onde:

k representa o nmero de valores distintos. No caso de uma distribuio de freqncia, a varincia definida por; S2 = ( ( yi - x)2 fi) / n onde:

K = n de intervalos Yi = ponto mdio do i-simo intervalo, i = 1,2,...,k. A raiz quadrada da varincia chamada de desvio padro. Tal medida fornece uma viso comparativa melhor do que a varincia, por se tratar de um valor que vem nas mesmas unidades da varivel. Tanto a varincia como o desvio padro, so indicadores do grau de concentrao ou disperso dos valores da varivel em relao mdia aritmtica. Valores grandes de S indicam muita disperso em torno de x. Conseqentemente, pequenos valores de S indicam muita concentrao em torno da mdia aritmtica. Exemplo1: Os dados a seguir representam os pesos (em Kg) de nove crianas 20 21 22 23 23 23 24 25 26

Calcule a mdia aritmtica, a varincia e o desvio padro desse conjunto de dados. SOLUO: a) Mdia Aritmtica x = xi / 9 = (20 + 21 + ... + 26) / 9 = 207 / 9 = 23 x = 23 Kg

31 b) Varincia S2 = ( (xi 23)2 ) / 9 = [( 20 23)2 + (21 23)2 + ... + (26 23)2 ] / 9 = = ( 9 + 4 +1 + 0 + 0 + 0 + 1 + 4 + 9 ) / 9 = 28 / 9 = 3.1111 S2 = 3,1111 (Kg) c) Desvio padro S = 3,1111 = 1.763831 1.76 S = 1,76 Kg Exemplo 2: Os dados a seguir representam os pesos de 50 crianas 20 22 23 23 24 20 22 23 23 24 21 22 23 23 24 21 22 23 24 25 21 22 23 24 25 21 22 23 24 25 21 22 23 24 25 22 23 23 24 25 22 23 23 24 26 22 23 23 24 26

Calcule a mdia aritmtica, a varincia e o desvio padro desse conjunto de dados. SOLUO: Considere a seguinte tabela auxiliar: xi fi xi fi ( xi - x )2 20 2 40 9 21 5 105 4 22 10 220 1 23 16 368 0 24 10 240 1 25 5 125 4 26 2 52 9 Total 50 1150 a) Mdia aritmtica x = xi fi / n = 1150 / 50 = 23, isto x = 23 Kg b) Varincia S2 = ( ( xi 23)2 fi ) / 50 = 96 /50 = 1.92 isto S2 = 1.92 (Kg)2 ( xi - x )2 fi 18 20 10 0 10 20 18 96

32 c) Desvio padro S = 1,92 = 1,3856406 isto S 1,39 Kg Exemplo 3: Calcular a mdia aritmtica, a varincia e o desvio padro da seguinte distribuio de freqncia . Intervalos 3.1 l3.3 3.3 l3.5 3.5 l3.7 3.7 l3.9 3.9 l4.1 4.1 l4.3 4.3 l4.5 4.5 l4.7 4.7 l4.9 Total Fonte: LLLLLL SOLUO: Considere a seguinte tabela auxiliar Yi fi yi fi 3.2 3 9.6 3.4 7 23.8 3.6 10 36.0 3.8 16 60.8 4.0 28 112.0 4.2 16 67.2 4.4 10 44.0 4.6 7 32.2 4.8 3 14.4 Total 100 400 ( yi 4)2 0.64 0.36 0.16 0.04 0.00 0.04 0.16 0.36 0.64 ( yi 4)2 fi 1.92 2.52 1.6 0.64 0.00 0.64 1.60 2.52 1.92 13.36 fi 3 7 10 16 28 16 10 7 3 100

a) Mdia aritmtica x = ( yi fi ) / n = 400 / 100 = 4 , isto x = 4 b) Varincia S2 = ( ( yi 4 )2 fi ) / n S2 = 13,36 / 100 = 0,1336, isto S2 = 0,1336 c) Desvio padro S = 0,1336 = 0,3655 isto , S 0,36

33 4. Coeficiente de Variao ou Disperso Relativa Para comparar a variabilidade de duas distribuies de mdias distintas, numa mesma unidade padro de medida, ou at mesmo, comparar duas distribuies expressas em unidades de medidas diferentes, necessitamos definir uma medida independente da unidade padro de medida. Uma tal medida ser o chamado COEFICIENTE DE VARIAO, o qual ser designado por CV, e definido por: CV = S / x , ou na forma percentual CV = (S / x ) * 100 Exemplo: Qual das duas distribuies concentrao em torno de sua mdia ? Comprimento mdio (cm) Grupo A Grupo B 4 4,5 a seguir apresenta maior

Desvio padro (cm) Grupo A Grupo B 0,36 0,52

SOLUO: Observe que; CVA = ( 0,36 / 4 ) * 100 = ( 0.09) * 100 = 9% CVA = 9% CVB = ( 0,52 / 4.5 ) * 100 = ( 0,1155) * 100 11,55% CVB = 11,55% Assim, como CVA < CVB, conclumos que os dados do grupo A esto mais concentrados em torno de sua mdia, do que os dados do grupo B com relao a sua mdia.

34 EXERCCIOS 1 1.Considere o seguinte conjunto de dados: 21 34 26 36 27 38 23 39 24 40 25 41 26 42 28 43 30 44 32 45

a) Calcule a mdia aritmtica; b) Calcule o desvio padro 2. Considere o seguinte conjunto de dados: Vida til (em anos) de lmpadas, na MML de So Paulo, 2008 Vida til (anos) fi 10 15 11 10 12 8 13 9 14 4 15 5 16 11 17 14 18 15 Total 91 Fonte: MML Calcule todas as medidas de disperso estudadas. 3. Considere a seguinte distribuio de freqncia. Vida til (em anos) de lmpadas, na MML de So Paulo, 2007/ 2008 Vida til (anos) fi 2007 2008 30 l35 20 18 35 l40 40 40 40 l45 60 90 45 l50 32 42 50 l55 28 30 55 l60 20 25 Total 200 245 Fonte: MML a) Calcule o desvio padro (2007, 2008)

35 b) Qual das duas distribuies apresenta maior concentrao em torno de sua mdia ? 8.1 MEDIDAS DE DISPERSO OU DE VARIABILIDADE (INTERPRETAO) * A variabilidade se refere a quanto os valores podem diferir entre si e pode ser medida por nmeros especficos (que so os nmeros calculados atravs das medidas de disperso estudadas nessa disciplina). * Os nmeros relativamente prximos uns dos outros tm baixas medidas de variao, enquanto os valores mais dispersos tm maiores medidas de variao. ** O desviopadro uma medida de variao particularmente importante. De modo geral, esta medida a mais importante e mais til medida de variao, pois leva em conta todos os valores do conjunto de dados, porm essa vantagem torna o clculo mais trabalhoso. ** O desviopadro em geral um recurso criticamente importante para controlar a qualidade de bens e servios. ** Quanto mais os dados se dispersam, maior o valor do desviopadro, conseqentemente, quanto menos os dados se dispersam, menor o desvio padro. *** A varincia no expressa nas mesmas unidades dos dados originais, dificultando assim uma melhor interpretao dos dados. Ex: Kilogramas quadrados, dlares quadrados, centmetros quadrados, etc. **** O coeficiente de variao compara a variabilidade de duas distribuies de mdias distintas, numa mesma unidade padro de medida, ou at mesmo em unidade de medidas diferentes. Deve-se verificar apenas dentre duas distribuies quem tem menor ou maior concentrao em torno de suas mdias. Nota-se que um CV de menor valor indica maior concentrao do conjunto de dados em relao a sua prpria mdia, significa que aqueles dados esto variando menos. Vejamos o exemplo abaixo: Muitos bancos costumavam exigir que os clientes formassem filas separadas para os diversos guichs, mas recentemente passaram a adotar fila nica. Qual o motivo dessa modificao ? O tempo mdio de espera no se modifica, porque a fila de espera no afeta a eficincia dos caixas. A adoo de fila nica se deveu, ao fato de os clientes preferirem tempos de espera mais consistentes com menor variao. Assim que milhares de bancos efetuaram uma modificao que resultou em uma variao menor (e clientes mais satisfeitos), mesmo que a mdia no tenha sido afetada.

36 EXERCCIO 2

1) Dois grupos diferentes de uma turma de estatstica fazem o mesmo teste-surpresa, com as notas relacionadas a seguir. Calcule a amplitude e o desvio-padro para cada grupo. Que concluses sobre a variao nos dois grupos os valores da amplitude sugerem ? Por que razo a amplitude enganosa neste caso ? Que concluses nos dois grupos o desvio-padro sugere ? Grupo A: Grupo B: 1 2 20 3 20 4 20 5 20 6 20 14 20 15 20 16 20 17 20 18 20 19

2) O conjunto de dados abaixo, representa os tempos (em segundos) decorridos entre a formulao do pedido e a entrega do prato na lanchonete Amaznia Mix. Determine: 2.1) A mdia aritmtica, mediana e a moda; 2.2) O desvio-padro e a varincia; 2.3) Comente os resultados. 30 24 30 20 21 26 25 21 31 22 22 30 23 32 31 23 30 31 23 30 29 23 30 29 32 30 29

37 UNIVERSIDADE FEDERAL RURAL DE PERNAMBUCO UFRPE UNIDADE ACADMICA DE SERRA TALHADA - UAST DISCIPLINA: ESTATSTICA B PROFESSORA: VERIDIANA SANTOS ALUNO(A): LISTA DE EXERCCIOS 1) Sabe-se que as tabelas ou sries estatsticas so classificadas em dois grupos: tabelas simples e conjugadas. As tabelas simples so de 3 tipos e as conjugadas so de 4 tipos. Sendo assim, construa uma tabela de cada tipo, respeitando as regras estabelecidas pelo IBGE (consulte os livros). Construa as tabelas usando, preferencialmente, exemplos em sua rea de estudo (LQ). 2) Os dados abaixo representam os salrios ( em dolar - $) dos funcionrios dos qumicos da Empresa Bebite. Para tanto, deseja-se saber qual o salrio mdio destes funcionrios. Continuando o estudo, responda: Qual o percentual de funcionrios que ganham na menor faixa salarial; Qual o percentual de funcionrios que ganham na maior faixa salarial; Represente a distribuio dos salrios atravs do histograma de frequncia; Agora calcule e analise: d) Supondo que o salrio mdio da Empresa Mulambo seja de $ 412,00 e o desvio padro seja de $ 204,3. Compare os resultados dos coeficientes de variao das duas empresas. Melhor dizendo, calcule os dois coeficientes e, em seguida, comente os resultados com base no que diz o conceito de medida de disperso.

Salrios(em dolar - $) dos funcionrios da Empresa Bebite/So Paulo, em novembro de 2008


Salrios ($) 200 l--------- 400 400 l--------- 600 600 l--------- 800 800 l--------- 1000 1000 l--------- 1200 1200 l--------- 1400 Total Fonte: Bebite N de funcionrios(fi) 40 60 64 55 50 31 300

3) Os dados abaixo representam os preos( em dolar - $) do saco de potssio, vendidos em Petrolina, no perodo de janeiro a dezembro de 2008. Com esses dados calcule o preo mdio do saco de potssio e determine tambm o quadro geral de freqncia.

38 Preo (em dolar - $) do saco de potssio, em Petrolina no perodo de janeiro a dezembro de 2008. Preos ($) N de sacos de fpotssio (fi) 1,00 l--------- 1,50 20 1,50 l--------- 2,00 26 2,00 l--------- 2,50 35 2,50 l--------- 3,00 22 3,00 l--------- 3,50 31 3,50 l--------- 4,00 24 Total 158 Fonte: IBGE 4) A tabela abaixo representa os preos ( em reais - R$) e a quantidade de tubos de ensaios vendidos nas lojas da cidade de Serra Talhada, em dezembro de 2008. Sabendo disso calcule o preo mdio dos tubos de ensaios vendidos nas lojas de Serra Talhada. Continuando o estudo, responda: a) Qual o percentual de tubos que custam entre R$ 4,00 e R$ 16,00? b) Qual o percentual de tubos que custam entre R$ 22,00 e R$ 28,00? c) Represente a distribuio dos preos atravs do histograma e do polgono de frequncia; Agora calcule e analise: d) Supondo que o preo mdio dos tubos de ensaios vendidos nas lojas da cidade de Olinda seja de R$ 23,00 e o coeficiente de variao seja de 29% (ou CV = 0,29), estime o desvio padro dos preos dos tubos nas duas cidades e comente os resultados. Preos ( em reais - R$) dos tubos de ensaios escolares vendidos nas papelarias da cidade de Serra Talhada, em dezembro de 2008. Preos (R$) N de tubos(fi) 4 l--------- 10 12 10 l--------- 16 14 16 l--------- 22 20 22 l--------- 28 21 28 l--------- 34 07 Total 74 Fonte: Sindicato das vidrarias de Pernambuco 5) No Estado de Pernambuco, observou-se que a regio do Vale do So Francisco, tem se destacado no setor de agronegcio. O principal produto tem sido a uva, que alm de abastecer todo o Estado e outras regies brasileiras, produto certo para a exportao. A tabela abaixo representa a produo (em toneladas) de uvas exportadas em relao ao nmero de fazendas produtoras. Com esses dados, determine: a) a quantidade mdia, mediana e modal de uvas exportadas.

39 b) Sabendo-se que a produo mdia das uvas para exportao produzidas pelo Rio Grande do Sul de 19 toneladas e, o desvio padro de 4,5 toneladas, calcule e analise os coeficientes de variao das duas localidades. Produo de uvas (toneladas) do Vale do So Francisco em Pernambuco, em agosto de 2008 Produo de uvas (toneladas) N de fazendas 10 -------l 13 30 13 -------l 16 20 16 -------l 19 27 19 -------l 22 13 22 -------l 25 16 25 -------l 28 24 Total 130 Fonte: EMBRAPA Agora responda tambm: C) qual o percentual de fazendas cuja produo de uvas, varia de 16 a 19 toneladas? Qual o total de fazendas cuja produo de uvas varia de 13 a 22 toneladas? Construa o histograma de freqncia.