Sie sind auf Seite 1von 69

Regina Maria Sigolo Bernardinelli

Estatstica

APrEsENTaO
com satisfao que a Unisa Digital oferece a voc, aluno(a), esta apostila de Estatstica, parte integrante de um conjunto de materiais de pesquisa voltado ao aprendizado dinmico e autnomo que a educao a distncia exige. O principal objetivo desta apostila propiciar aos(s) alunos(as) uma apresentao do contedo bsico da disciplina. A Unisa Digital oferece outras formas de solidificar seu aprendizado, por meio de recursos multidisciplinares, como chats, fruns, aulas web, material de apoio e e-mail. Para enriquecer o seu aprendizado, voc ainda pode contar com a Biblioteca Virtual: www.unisa.br, a Biblioteca Central da Unisa, juntamente s bibliotecas setoriais, que fornecem acervo digital e impresso, bem como acesso a redes de informao e documentao. Nesse contexto, os recursos disponveis e necessrios para apoi-lo(a) no seu estudo so o suplemento que a Unisa Digital oferece, tornando seu aprendizado eficiente e prazeroso, concorrendo para uma formao completa, na qual o contedo aprendido influencia sua vida profissional e pessoal. A Unisa Digital assim para voc: Universidade a qualquer hora e em qualquer lugar!

Unisa Digital

SUMRIO

INTRODUO................................................................................................................................................ 5 1 NOES BSICAS.................................................................................................................................. 7


1.1 Arredondamento de Dados..................................................................................................................................... 8 1.2 Populao e Amostra................................................................................................................................................. 9 1.3 Resumo do Captulo.................................................................................................................................................11 1.4 Atividade Proposta...................................................................................................................................................12

2 ORGANIZAO DE DADOS........................................................................................................... 13
2.1 Tipos de Variveis......................................................................................................................................................13 2.2 Distribuio de Frequncias..................................................................................................................................16 2.3 Resumo do Captulo.................................................................................................................................................18 2.4 Atividade Proposta...................................................................................................................................................18

3 GRFICOS ESTATSTICOS................................................................................................................ 21

3.1 Grfico de Setores ou Disco ou Pizza ou Diagrama Circular......................................................................21 3.2 Grfico de Colunas ou Barras................................................................................................................................22 3.3 Histograma..................................................................................................................................................................23 3.4 Polgono de Frequncias........................................................................................................................................23 3.5 Resumo do Captulo.................................................................................................................................................24 3.6 Atividades Propostas...............................................................................................................................................25 4.1 Medidas de Posio..................................................................................................................................................27 4.2 Medidas de Disperso.............................................................................................................................................31 4.3 Resumo do Captulo.................................................................................................................................................35 4.4 Atividades Propostas...............................................................................................................................................35

4 MEDIDAS.................................................................................................................................................... 27

5 PROBABILIDADES................................................................................................................................ 39
5.1 Fenmeno Determinstico.....................................................................................................................................39 5.2 Fenmeno Aleatrio ou Probabilstico..............................................................................................................39 5.3 Espao Amostral (S)..................................................................................................................................................40 5.4 Evento (E).....................................................................................................................................................................40 5.5 Probabilidade.............................................................................................................................................................40 5.6 Propriedades...............................................................................................................................................................40 5.7 Varivel Aleatria Discreta......................................................................................................................................41 5.8 Funo Discreta de Probabilidade......................................................................................................................41 5.9 Varivel Aleatria Contnua...................................................................................................................................42 5.10 Funo Contnua de Probabilidade..................................................................................................................42 5.11 Resumo do Captulo..............................................................................................................................................42 5.12 Atividade Proposta.................................................................................................................................................42

6 VARIVEIS ALEATRIAS CONTNUAS.................................................................................... 45


6.1 Modelo Normal ou Distribuio Normal..........................................................................................................45 6.2 Resumo do Captulo.................................................................................................................................................47 6.3 Atividade Proposta...................................................................................................................................................48

7 ESTIMAO.............................................................................................................................................. 49
7.1 Estimao por Intervalo..........................................................................................................................................49 7.2 Resumo do Captulo.................................................................................................................................................55 7.3 Atividade Proposta...................................................................................................................................................56

8 CORRELAO.......................................................................................................................................... 57

8.1 Correlao Linear Simples......................................................................................................................................57 8.2 Resumo do Captulo.................................................................................................................................................62 8.3 Atividades Propostas...............................................................................................................................................62

RESPOSTAS COMENTADAS DAS ATIVIDADES PROPOSTAS...................................... 67 REFERNCIAS.............................................................................................................................................. 75

INTRODUO

Prezado(a) aluno(a), esta apostila rene os principais tpicos de Estatstica, de forma condensada e objetiva, com a finalidade de orient-lo(a), aluno(a) do Curso de Ensino a Distncia (EaD), no desenvolvimento do contedo desta disciplina. Em sua elaborao, no tive a pretenso de demonstrar as diversas frmulas matemticas nela existentes, mas de mostrar suas aplicaes nos diversos assuntos abordados. , portanto, um guia indispensvel para acompanhar as aulas web. A disciplina de Estatstica tem por objetivo fornecer ao() aluno(a) subsdios que o(a) auxiliem nas demais disciplinas do Curso de EaD, bem como desenvolver-lhe a capacidade de utilizar os diversos mtodos estatsticos e o raciocnio necessrio para a interpretao e anlise de pesquisas na rea a que se destina.

Profa. Regina Maria Sigolo Bernardinelli1

Apostila revisada e adaptada em novembro/2011 pelo professor Antonio Fernando Silveira Alves.

Unisa | Educao a Distncia | www.unisa.br

1 NOES BSICAS
Prezado(a) aluno(a), voc conhece a origem da palavra estatstica? Conhece algumas aplicaes desta cincia? Vamos iniciar este texto abordando esses pontos. A palavra estatstica, de origem latina, significou por muito tempo cincia dos negcios do Estado. Os que governavam, sentindo necessidade de informaes, organizavam departamentos, que tinham a responsabilidade de fazer essas investigaes. 4. A pesquisa realizada pelas indstrias, entre os consumidores, para o lanamento de um novo produto; 5. As pesquisas eleitorais, fornecendo elementos para que os candidatos direcionem suas campanhas; 6. As pesquisas utilizadas pelas emissoras de TV, mostrando a preferncia dos espectadores, para organizar sua programao.
Dicionrio
A palavra estatstica surge da expresso em latim statisticum collegium ou palestra sobre os assuntos do Estado, de onde surgiu a palavra em lngua italiana statista, que significa homem de estado, ou poltico, e a palavra alem Statistik, designando a anlise de dados sobre o Estado. A palavra adquiriu um significado de coleta e classificao de dados, no incio do sculo 19. Fonte: http://pt.wikiversity.org

A realizao de uma pesquisa envolve muitas etapas, tais como: a escolha da amostra, a coleta e a organizao dos dados, o resumo e a apresentao desses dados e, tambm, a interpretao dos resultados para a obteno de concluses e tomada de decises razoveis. Todas essas etapas so trabalhadas com mtodos cientficos pela Estatstica.

O tratamento estatstico de um conjunto de dados pode envolver dois processos distintos, isto , a descrio dos dados e o estabelecimento de concluses sobre a populao a partir dos dados As sociedades modernas acumulam grande obtidos por amostragem. quantidade de dados numricos relativos a eventos sociais, econmicos, cientficos, esportivos etc. Ateno Desse modo, notamos que o uso da pesquisa bastante comum nas vrias atividades humanas. O tratamento estatstico pode envolver a descrio dos dados e o estabelecimento de concluses a partir da amostragem. Exemplos: 1. O ndice de analfabetismo no Brasil; 2. A mortalidade infantil no Nordeste brasileiro; 3. A porcentagem de crianas vacinadas na ltima campanha de vacinao;

Para tanto, temos: Estatstica descritiva: utiliza mtodos numricos e grficos para mostrar os padres de comportamento dos dados,

Unisa | Educao a Distncia | www.unisa.br

Regina Maria Sigolo Bernardinelli

para resumir a informao contida nesses dados e para apresentar a informao de forma conveniente;
Saiba mais

Inferncia estatstica: utiliza dados de amostras para obter estimativas sobre a populao.

A Estatstica uma rea do conhecimento que utiliza teorias probabilsticas para explicao de eventos, estudos e experimentos. Tem por objetivo obter, organizar e analisar dados, determinar as correlaes que apresentem, tirando delas suas consequncias para descrio e explicao do que passou e previso e organizao do futuro. Em suma, estatstica a cincia que estuda os dados. Dentro dela, existem duas subdivises: a estatstica descritiva (que estuda mtodos e ferramentas de coleta de dados e modelos matemticos para descrev-los e interpret-los) e a estatstica inferencial (sistemas e tcnicas utilizadas para tomar boas decises baseadas nos dados). A estatstica tambm uma cincia e prtica de desenvolvimento de conhecimento humano atravs do uso de dados empricos. Baseia-se na teoria estatstica, um ramo da matemtica aplicada. Na teoria estatstica, a aleatoriedade e incerteza so modeladas pela teoria da probabilidade. Algumas prticas estatsticas incluem, por exemplo, o planejamento, a sumarizao e a interpretao de observaes. Porque o objetivo da estatstica a produo da melhor informao possvel a partir dos dados disponveis, alguns autores sugerem que a estatstica um ramo da teoria da deciso.
Fonte: http://pt.wikiversity.org

1.1 Arredondamento de Dados

Como na maioria das vezes, os dados disponveis no so nmeros inteiros, para efetuar os clculos estatsticos, necessrio efetuar o arredondamento desses dados. A seguir, apresentamos os critrios utilizados para efetuar o arredondamento. De acordo com o Instituto Brasileiro de Geografia e Estatstica (IBGE)2, o arredondamento feito da seguinte forma: a. Quando o primeiro algarismo a ser abandonado 0, 1, 2, 3 ou 4, fica inalterado o ltimo algarismo a permanecer. Exemplo: aproximao de uma casa decimal: 53,24 passa a 53,2. b. Quando o primeiro algarismo a ser abandonado 6, 7, 8 ou 9, aumenta-se em uma unidade o algarismo a permanecer.

Exemplos: aproximao de uma casa decimal: 42,87 passa a 42,9; 25,08 passa a 25,1; 53,99 passa a 54,0. c. Quando o primeiro algarismo a ser abandonado 5, h duas solues: se ao 5 seguir, em qualquer casa, um algarismo diferente de zero, aumenta-se uma unidade ao algarismo a permanecer. Exemplos: aproximao de uma casa decimal: 2,352 passa a 2,4; 25,6501 passa a 25,7; 76,25002 passa a 76,3. se o 5 for o ltimo algarismo ou se ao 5 s se seguirem zeros, o ltimo

Em conformidade com a Resoluo n 886/66 da Fundao IBGE, Adaptado de CRESPO, 1991.

Unisa | Educao a Distncia | www.unisa.br

Estatstica

Prezado(a) aluno(a), para iniciar o estudo da Estatstica, necessrio que voc conhea, compreenda e se aproprie do significado de alguns terExemplos: aproximao de uma casa mos que sero utilizados. decimal: 24,75 passa a 24,8; Analise cuidadosamente cada termo definido a seguir. 24,65 passa a 24,6; 24,75000 passa a 24,8; 24,6500 passa a 24,6.

algarismo a ser conservado s ser aumentado de uma unidade se for mpar.

1.2 Populao e Amostra

Populao o conjunto de todos os elementos envolvidos no fenmeno a ser estudado. Amostra

e Propaganda de uma determinada universidade: Populao: todos os alunos do curso de Publicidade e Propaganda; Amostra: uma classe do primeiro ano do curso de Publicidade e Propaganda.

Quando so obtidos dados de toda uma po o conjunto de elementos retirados da populao para a realizao do estudo. , portanto, pulao, dizemos que foi feito um recenseamento e a este conjunto de dados damos o nome de censo. um subconjunto da populao. Quando os dados so obtidos de parte da populao, foi feita uma amostragem. Exemplos: 1. Queremos obter informaes sobre a audincia de certo programa de TV, na A escolha da amostra Grande So Paulo: Os mtodos de escolha da amostra devem Populao: o conjunto de todos os domiclios da Grande So Paulo que possuem TV; garantir a representatividade do grupo. necesAmostra: o conjunto dos domiclios que srio escolher, no mnimo, 10% do nmero total dos elementos da populao e garantir, por meio sero visitados. de um critrio de seleo, que nenhum elemento tenha maior chance de ser escolhido do que outro. 2. Estudar a procedncia dos candidatos a Desse modo, podemos recorrer a diferentes formas uma determinada universidade: de amostragem: amostragem aleatria simples, Populao: conjunto de todos os candida- amostragem sistemtica e amostragem estratitos referida universidade; ficada proporcional. Amostra: conjunto dos candidatos que seAteno ro entrevistados. 3. Queremos fazer um estudo sobre a idade dos alunos do curso de Publicidade
Os mtodos de escolha da amostra devem garantir a representatividade do grupo.

Unisa | Educao a Distncia | www.unisa.br

Regina Maria Sigolo Bernardinelli

Vejamos o procedimento atravs de dois exemplos: Exemplo 1: suponhamos uma pesquisa sobre o nvel de escolaridade de um grupo de oitocentas pessoas. Vamos escolher uma amostra com, no mnimo, oitenta pessoas (10% de 800), selecionadas atravs de: a. Amostragem aleatria simples: em primeiro lugar, elaboramos uma lista com os oitocentos nomes dos elementos da populao numerados de 1 a 800, para serem submetidos a um sorteio. Bolas ou cartes, tambm numerados de 1 a 800, so colocados em uma urna e bem misturados. Em cada etapa do sorteio, todo nmero ainda no escolhido

tem a mesma probabilidade de ser sorteado. Esse processo no muito prtico para grandes populaes, quando pode1 mos ento trabalhar com uma numerao de 0 a 9, sorteando 10 os nmeros por meio de blocos de trs algarismos e tomando o cuidado de repor na urna todo algarismo dela retirado. Como temos dez algarismos, cada um deles tem de probabilidade de aparecer em determinada posio. Sempre que um bloco de algarismos indicar um elemento j selecionado, ou um elemento que no exista na populao, ser descartado.

Suponhamos que os seguintes algarismos foram obtidos no sorteio: 2 4 3 5 6 4 7 2 0 0 3 5 8 1 1 0 0 5 1 9 8 6 4 3 5 2 4 7 8 9 7 7 6 5 4 2 2 3 0 1 2 1 1 6 7 8 9 1 0 3 4 5 6 7 2 2 8 8 1 9 0 0 6 0 7 2 1 0 5 6 4 3 Agrupando-os em blocos de trs, teremos os nmeros: 243 121 564 167 720 035 811 005 198 643 524 789 776 542 230

891 034 567 228 819 006 072 105 643.

Observem que devemos descartar 811, 891 e 819, porque no pertencem populao, e 643, porque j foi selecionado. Continuamos o sorteio, at completarmos os 80 elementos da amostra. b. Amostragem sistemtica: sorteamos um nmero de 1 a 10, ao acaso. Supondo que tenha sido obtido o nmero 6, ele ser o primeiro elemento da amostra e os demais sero determinados em intervalos de dez unidades. Nossa amostra, ento, ser: 6 16 26 36 46 56 66 76 86 96 106 . . . 796 Este tipo de amostragem simples de ser realizado e aconselhvel no caso de amostras muito grandes.

10

Unisa | Educao a Distncia | www.unisa.br

Estatstica

Exemplo 2: na escola Sapequinha, quer fazer-se um estudo sobre o peso dos alunos de 7 anos de idade. Existem 120 crianas na faixa de 7 anos de idade, distribudas em cinco classes, do seguinte modo: a primeira srie A tem 20 alunos com 7 anos, a primeira B tem 15, a C tem 35, a D, 30 e a E tem 20. Vamos escolher uma amostra com, no mnimo, 12 crianas (10% de 120), selecionadas atravs de: c. Amostragem estratificada proporcional: sorteamos os nomes das crianas em quantidades proporcionais ao nmero de crianas com 7 anos de cada classe, que constituem os estratos da amostra. Vamos, agora, determinar a porcentagem de crianas com 7 anos, em cada classe, em relao populao (120 crianas):

De modo anlogo, determinamos as porcentagens para as classes C, D e E, obtendo: C: c = 29,2% D: d = 25% E: e = 16,7%

Para calcularmos quantas crianas de cada classe sero sorteadas, para uma amostra de 12 crianas, fazemos: A: 16,7% de 12 = 16,7/100 . 12 = 0,167 . 12 = 2,004 = 2 B: 12,5% de 12 = 0,125 . 12 = 1,5 = 2 C: 29,2% de 12 = 0,292 . 12 = 3,504 =3 (nesse caso, arredondamos para 3, ao invs de 4, porque o total de crianas da amostra 12) D: 25% de 12 = 0,25 . 12 = 3 E: 16,7% de 12 = 0,167 . 12 = 2,004 = 2 Desse modo, obtivemos a quantidade de elementos de cada estrato e o total da amostra.

1.3 Resumo do Captulo

Prezado(a) aluno(a), vimos neste captulo que a palavra estatstica, de origem latina, significou por muito tempo cincia dos negcios do Estado. Estudamos tambm que a Estatstica Descritiva utiliza mtodos numricos e grficos para mostrar os padres de comportamento dos dados, para resumir a informao contida nesses dados e para apresentar a informao de forma conveniente, e que a Inferncia Estatstica utiliza dados de amostras para obter estimativas sobre a populao. Aprendemos ainda sobre arredondamentos e amostra.

Unisa | Educao a Distncia | www.unisa.br

11

Regina Maria Sigolo Bernardinelli

1.4 Atividade Proposta

1. Faa o arredondamento dos seguintes nmeros para uma casa decimal: a. 2,36. b. 3,57. c. 4,62. d. 8,81. e. 4,451. f. 5,501. g. 5,55. h. 5,65. 2. Arredonde cada um dos numerais abaixo, conforme a preciso pedida. a. para o dcimo mais prximo: 23,40 234,7832 45,09 48,85002 78,85 12,35 120,4500 129,98 199,97 b. para o centsimo mais prximo: 46,727 c. para a unidade mais prxima: 26,6 128,5 68,2 67,5 49,98 39,49 d. para a dezena mais prxima: 42,3 59 446,4 265,31 265,0 265 295 302,7 2995,000 28,255 299,951 253,65 123,842 37,485

12

Unisa | Educao a Distncia | www.unisa.br

2 ORGANIZAO DE DADOS
Prezado(a) aluno(a), falaremos agora sobre a organizao de dados. Vamos l! Dado um conjunto de dados, vamos estudar como devemos tratar os valores, numricos ou no, a fim de extrair informaes a respeito de uma ou mais caractersticas de interesse. Suponhamos, por exemplo, que um questionrio foi aplicado a alunos do 1 ano de uma escola fornecendo as seguintes informaes: Id: identificao do aluno; Turma: A ou B; Sexo: Feminino (F) ou Masculino (M); Idade: em anos; Alt: altura em metros; Peso: em quilogramas; Filhos: n de filhos na famlia; O conjunto de informaes, aps a tabulao do questionrio ou pesquisa de campo, denominado tabela de dados brutos e contm os dados da maneira que foram coletados inicialmente (Tabela 1). Cine: n de vezes que vai ao cinema por semana; Op Cine: opinio a respeito das salas de cinema na cidade: (B) regular a Boa; (M) Muito boa; TV: horas gastas assistindo TV, por semana; Op TV: opinio a respeito da qualidade da programao na TV: (R) ruim; (M) mdia; (B) boa; (N) no sabe.

Cada uma das caractersticas perguntadas aos alunos, como o peso, a idade, a altura etc., Fuma: hbito de fumar: Sim (S) ou No denominada varivel e, como podemos observar, (N); tem naturezas diferentes quanto aos possveis va Toler: tolerncia ao cigarro: (I) Indiferen- lores que podem assumir. te; (P) incomoda Pouco; (M) incomoda Muito; Exerc.: horas de atividade fsica, por semana;

2.1 Tipos de Variveis

Existem dois tipos de variveis: qualitativas (variveis no numricas) e quantitativas (variveis numricas) .

Variveis qualitativas Seus valores representam uma qualidade (ou atributo) do indivduo pesquisado. Exemplos: sexo, turma, estado civil, grau de instruo, hbito de fumar etc.

Unisa | Educao a Distncia | www.unisa.br

13

Regina Maria Sigolo Bernardinelli

Entre as variveis qualitativas, ainda existem dois tipos: a. Varivel qualitativa nominal: no existe ordenao em seus possveis resultados. Exemplos: sexo, turma, hbito de fumar; b. Varivel qualitativa ordinal: existe certa ordem em seus possveis resultados. Exemplos: tamanho (P, M, G), classe social (baixa, mdia, alta), grau de instruo (1 grau, 2 grau, grau superior), estado civil. Variveis quantitativas Seus valores so numricos e resultantes de uma contagem ou mensurao. Exemplos: nmero de filhos, salrio, peso, altura etc. Entre as variveis quantitativas, ainda existem dois tipos:

a. Variveis quantitativas discretas: seus possveis valores formam um conjunto finito ou enumervel de nmeros que resultam frequentemente de uma contagem. Exemplos: nmero de filhos, idade (em anos), cine (nmero de vezes que vai ao cinema por semana); b. Variveis quantitativas contnuas: seus possveis valores formam um intervalo de nmeros reais que resultam, normalmente, de uma mensurao. Exemplos: peso, altura, salrio.

Ateno
A Estatstica permite que dados qualitativos sejam apresentados de maneira quantitativa.

Figura 1 Classificao de uma varivel. ESQUEMA

14

Unisa | Educao a Distncia | www.unisa.br

Estatstica

Tabela 1 Informaes de questionrio estudantil Dados brutos.

Unisa | Educao a Distncia | www.unisa.br

15

Regina Maria Sigolo Bernardinelli

2.2 Distribuio de Frequncias

Notao: A partir da tabela de dados brutos (Tabela 1), vamos construir uma nova com as informaes resumidas, para cada varivel, denominada tabela de frequncia, que conter os valores da varivel e suas respectivas contagens, as quais so denominadas frequncias absolutas ou, simplesmente, Para efeito de comparao com outros grufrequncias. pos ou conjuntos de dados, conveniente trabaNo caso de variveis qualitativas ou quantita- lharmos com a frequncia relativa, definida por tivas discretas, a tabela de frequncia consiste em listar os valores possveis da varivel, numricos ou no, e fazer a contagem na tabela de dados brutos do nmero de suas ocorrncias. Exemplos Tabela de Frequncia para a Varivel Sexo (extrada da Tabela 1)
Tabela 2 Varivel Sexo.

Sexo: varivel qualitativa nominal.

Note que, para variveis cujos valores possuem ordenao natural (qualitativas ordinais e quantitativas em geral), inclumos na tabela de frequncia uma coluna contendo as frequncias acumuladas (fac), quando o nmero de valores i for maior do que 2. A frequncia acumulada at certo valor obtida pela soma das frequncias de todos os valores da varivel menores ou iguais ao valor considerado. Tabela de Frequncia para a Varivel Toler (extrada da Tabela 1)
Tabela 3 Varivel Toler.

Toler: varivel qualitativa ordinal.

16

Unisa | Educao a Distncia | www.unisa.br

Estatstica

A varivel Peso, classificada como quantitativa contnua, apresenta valores que podem ser qualquer nmero real num certo intervalo. Pela Tabela 1, verificamos que os valores variam entre 44,0 kg e 95,0 kg e, como existe um grande nmero de valores diferentes, vamos construir faixas ou classes de valores e contar o nmero de ocorrncias em cada faixa. No existe uma regra formal para determinar o nmero de faixas ou classes a serem utilizadas.

Entretanto, deve-se observar que, com um pequeno nmero de classes, perde-se informao e, com um nmero grande de classes, o objetivo de resumir os dados fica prejudicado. No geral, conveniente trabalharmos com 5 a 8 faixas de mesma amplitude, devendo ressaltar que faixas de tamanho desigual podem ser convenientes para representar valores nas extremidades da tabela. Para a varivel Peso, usaremos faixas de amplitude 10 e iniciaremos com 40,0 kg.

Tabela de Frequncia para a Varivel Peso (extrada da Tabela 1)


Tabela 4 Varivel Idade.

Peso: varivel quantitativa contnua.

Observe, pela fac, que 76% dos alunos pesam menos que 70,0 kg e 100 88 = 12% tm peso maior ou igual a 80,0 kg. Na Tabela 5, temos 6 faixas ou classes ou intervalos. Consideremos, por exemplo, a 1 classe ou intervalo: 40,0 50,0, onde temos: Limite inferior (li): 40,0 Ponto Mdio (PM) = Limite superior (ls): 50,0 Amplitude ou tamanho do intervalo (h): h = ls li; (h = 50,0 40,0 = 10,0) O smbolo indica que o intervalo fechado esquerda e aberto direita (40,0 faz parte dessa classe, mas 50,0 no; 50,0 est na 2 classe). Na Tabela 1, a varivel TV (quantitativa discreta) tem valores inteiros entre 0 e 30 e uma tabela representando tais valores e respectivas frequncias seria muito extensa e pouco prtica. Por esse motivo, trataremos essa varivel como quantitativa contnua, criando, por exemplo, faixas de amplitude 6 para representar seus valores.

Unisa | Educao a Distncia | www.unisa.br

17

Regina Maria Sigolo Bernardinelli

Tabela de Frequncia para a Varivel TV (extrada da Tabela 1)


Tabela 5 Varivel TV.

TV: varivel quantitativa discreta, que foi tratada como contnua.

Observe que, na ltima classe, o intervalo fechado esquerda e direita, incluindo, portanto, o valor 30 e no tendo, assim, que abrir mais uma classe por causa de um nico valor. Outra sugesto seria usar uma amplitude maior nessa ltima classe, por exemplo, 24 36, que inclui o valor 30.

2.3 Resumo do Captulo

Prezado(a) aluno(a), neste captulo estudamos sobre variveis e suas frequncias. O conjunto de informaes, aps a tabulao do questionrio ou pesquisa de campo, denominado de tabela de dados brutos. Cada uma das caractersticas perguntadas aos alunos, tais como o peso, a idade, a altura etc., denominada de varivel, e, como podemos observar, possuem naturezas diferentes quanto aos possveis valores que podem assumir.

2.4 Atividade Proposta

1. Monte a tabela com as distribuies de frequncia da varivel Idade de acordo com os dados da Tabela 1. 2. Na Escola So Leopoldo, para estudar a preferncia em relao a refrigerantes, sortearam-se 150 estudantes, entre os 1.000 matriculados. Responda: a. Qual a populao envolvida na pesquisa? b. Que tipo de amostragem foi utilizado e qual a amostra considerada? 3. A populao envolvida em uma pesquisa sobre a incidncia de crie dentria em escolares da cidade de Morro Grande apresentada na Tabela 6.

18

Unisa | Educao a Distncia | www.unisa.br

Estatstica

Tabela 6 Incidncia de crie em escolares.

Baseando-se nesses dados, estratifique uma amostra com 200 elementos. 4. Em uma cidade com 30.000 habitantes, deseja-se fazer uma pesquisa sobre a preferncia por tipo de lazer entre pessoas de 20 anos de idade, levando em conta o sexo a que pertencem. a. Qual a populao envolvida na pesquisa? b. Supondo que, na cidade, haja 5.500 mulheres e 6.000 homens com 20 anos, determine uma amostra com 1.200 pessoas. 5. Em uma fbrica, foram testadas 400 lmpadas; a durao delas aparece na distribuio por frequncia da Tabela 7:
Tabela 7 Durao de lmpadas.

a. Complete a tabela dada com as demais colunas que voc conhece. b. Qual a amplitude de cada classe? c. Qual o limite inferior da 3 classe? d. Qual o limite superior da 8 classe? e. Qual o ponto mdio da 5 classe? f. Qual a frequncia relativa da 6 classe? g. Qual a porcentagem de lmpadas com durabilidade mxima de 500 horas? h. Qual a porcentagem de lmpadas com durabilidade de 900 horas ou mais? Unisa | Educao a Distncia | www.unisa.br

19

3 GRFICOS ESTATSTICOS
Muitas vezes, a informao contida nas taPrezado(a) aluno(a), neste captulo, iremos estudar sobre grficos. A organizao dos dados belas pode ser mais facilmente visualizada atravs em tabelas de frequncia proporciona um meio de grficos. Vamos definir quatro tipos bsicos de eficaz de estudo do comportamento de caracters- grficos: setores ou pizza, colunas ou barras, histograma e polgono de frequncias. ticas de interesse.

Ateno
A utilizao de tabelas e grficos so frequentes na Estatstica. As tabelas servem para organizar e tabular os dados, j os grficos transmitem as informaes com clareza e transparncia, contribuindo para uma leitura objetiva.

3.1 Grfico de Setores ou Disco ou Pizza ou Diagrama Circular

Adapta-se muito bem s variveis qualitati- cada valor da varivel. Se, ao contrrio, formos travas, mas tambm pode ser usado para as variveis ar o grfico com o auxlio de compasso e transferidor, precisamos determinar a medida em graus de quantitativas discretas. Fazendo uso do computador para o traa- cada setor correspondente aos valores da varivel, do do grfico, basta conhecer as porcentagens de lembrando que o disco todo mede 360. Exemplo: grfico de setores para a varivel Toler (Tabela 3): I: 20% P:42% M: 38%

Procedemos de maneira anloga para os valores de P e M.

Unisa | Educao a Distncia | www.unisa.br

21

Regina Maria Sigolo Bernardinelli

Grfico 1 Setores.

3.2 Grfico de Colunas ou Barras

Adapta-se melhor s variveis discretas ou qualitativas ordinais.

Utiliza o plano cartesiano com os valores da varivel no eixo das abscissas e as frequncias ou porcentagens no eixo das ordenadas.

Exemplo: grfico de colunas para a varivel Idade (Tabela 4):


Grfico 2 Colunas.

22

Unisa | Educao a Distncia | www.unisa.br

Estatstica

3.3 Histograma

utilizado para variveis quantitativas contnuas. Consiste em retngulos contguos ou adjacentes, nos quais a base, colocada no eixo das abscissas, corresponde aos intervalos das classes e a altura, colocada no eixo das ordenadas, dada pela frequncia absoluta ou relativa das classes.
Dicionrio

Observao: A rea de um histograma proporcional soma das frequncias absolutas. No caso de trabalharmos com as frequncias relativas, a rea ser igual constante de proporcionalidade.

Um histograma uma representao grfica da distribuio de frequncias de uma massa de medies, normalmente um grfico de barras verticais. O histograma um grfico composto por retngulos justapostos em que a base de cada um deles corresponde ao intervalo de classe e a sua altura respectiva frequncia. A construo de histogramas tem carter preliminar em qualquer estudo e um importante indicador da distribuio de dados.

Exemplo: histograma para a varivel Peso (Tabela 5):


Grfico 3 Histograma.

3.4 Polgono de Frequncias

tambm utilizado para variveis quantitati- correspondente) em relao a cada intervalo, estes so ligados entre si por meio de segmentos de revas contnuas. Para construir o polgono de frequncias, ad- tas, sendo que o primeiro e o ltimo so ligados ao mitem-se, como representantes de cada classe, os eixo das abscissas, na metade de classes hipottipontos mdios de cada intervalo que as definem. cas, imediatamente anterior primeira e posterior Aps obter os pontos (ponto mdio, frequncia ltima. Unisa | Educao a Distncia | www.unisa.br

23

Regina Maria Sigolo Bernardinelli

Exemplo: polgono de frequncias para a varivel Peso (Tabela 5):


Grfico 4 Polgono de frequncias.

Saiba mais
Voc poder obter esses grficos, utilizando o Excel. Abaixo segue o link onde voc poder obter informaes, caso ainda no as saiba, de quais grficos so possveis construir com o Excel e como constru-los. Porm importante voc observar que essa apenas uma dica. O fato de poder utilizar o Excel para a construo de grficos no o exime do dever de saber construir esses grficos manualmente, ou seja, sem o auxlio desta ferramenta, pois certamente voc precisar desenvolver essas atividades nas avaliaes presenciais. Confira as dicas em: http://office.microsoft.com/pt-br/excel-help/tipos-de-graficos-disponiveis-HA001233737.aspx

3.5 Resumo do Captulo

Muitas vezes, a informao contida nas tabelas pode ser mais facilmente visualizada atravs de grficos. Nesse sentido, definimos, neste captulo, quatro tipos bsicos de grficos: setores ou pizza, colunas ou barras, histograma e polgono de frequncias. E, por fim, vimos que o histograma utilizado para variveis quantitativas contnuas.

24

Unisa | Educao a Distncia | www.unisa.br

Estatstica

3.6 Atividades Propostas

1. Com relao s variveis: Turma, Alt, Filhos, Fuma, Exerc, Cine, Op Cine, Op TV, da Tabela 1: a. Classifique essas variveis. b. Faa a distribuio de frequncia para cada uma delas. c. A varivel Exerc poderia ser tratada de forma diferente com relao sua classificao? Justifique sua resposta e, em caso afirmativo, construa a nova distribuio de frequncia. d. Construa os grficos que melhor se adaptam a cada uma das variveis apresentadas. 2. Quinze pacientes de uma clnica de ortopedia foram entrevistados quanto ao nmero de meses previstos de fisioterapia, se haver (S) ou no (N) sequelas aps o tratamento e o grau de complexidade da cirurgia realizada: alto (A), mdio (M) ou baixo (B). Os dados so apresentados na Tabela 8:
Tabela 8 Levantamento em clnica de ortopedia.

a. Classifique cada uma das variveis. b. Para cada varivel, construa a tabela de frequncia e faa uma representao grfica. c. Para o grupo de pacientes que no ficaram com sequelas, faa um grfico de barras para a varivel Fisioterapia. Voc acha que essa varivel se comporta de modo diferente nesse grupo? 3. Os dados da Tabela 9 referem-se ao salrio (em salrios-mnimos) de 20 funcionrios administrativos em uma indstria.
Tabela 9 Salrios de funcionrios administrativos (em salrios-mnimos).

a. Construa uma tabela de frequncia agrupando os dados em intervalos de amplitude 2, a partir de 1. b. Construa o histograma.

Unisa | Educao a Distncia | www.unisa.br

25

Regina Maria Sigolo Bernardinelli

4. Um grupo de estudantes do ensino mdio foi submetido a um teste de Matemtica resultando em:
Tabela 10 Teste de Matemtica.

a. Construa o histograma. b. Se a nota mnima para aprovao 5, qual ser a porcentagem de aprovao?

26

Unisa | Educao a Distncia | www.unisa.br

4 MEDIDAS
Prezado(a) aluno(a), agora falaremos sobre o, por exemplo, representando a tendncia cenmedidas. tral dos dados ou a maneira pela qual esses dados Nosso interesse caracterizar o conjunto de esto dispersos. dados atravs de medidas que resumam a informa-

4.1 Medidas de Posio

Se estivermos numa parada de nibus e nos pedirem alguma informao sobre a demora em passar um determinado nibus, ningum imagina que poderamos dar como resposta uma tabela de frequncias que coletamos no ltimo ms. Quem perguntou deseja uma resposta breve e rpida, Exemplo: calcular a mdia aritmtica dos vaque sintetize a informao que dispomos, e no uma completa descrio dos dados. para isso que lores: 9, 12, 8, 6, 14, 11, 5. servem as medidas de posio.
Ateno
As medidas de posio ou medidas de tendncia central para um conjunto de dados qualquer (populao ou amostra) so: a mdia, a mediana e a moda.

Para calcularmos a mdia quando os dados esto agrupados em classes, representamos todos os valores de cada classe pelo ponto mdio da classe (visto no captulo 2). Mediana (md)

Medidas de posio para um conjunto de dados Seja uma varivel X, com observaes representadas por Mdia aritmtica ou, simplesmente, mdia ( ) a soma dos valores da varivel dividida pelo nmero total de observaes. o valor da varivel que ocupa a posio central dos dados ordenados. Para o clculo da mediana, temos duas consideraes a fazer: a. o nmero de observaes (n) mpar: a mediana ser o valor da varivel que ocupa a posio de ordem .

Unisa | Educao a Distncia | www.unisa.br

27

Regina Maria Sigolo Bernardinelli

Exemplo: calcular a mediana dos valores: 9, 12, 8, 6, 14, 11, 5. Em primeiro lugar, vamos montar o Rol, ou seja, organizar os dados em ordem crescente: 5, 6, 8, 9, 11, 12, 14 Observe que n = 7 (mpar)

Para calcularmos a mediana quando os dados esto agrupados em classes, no levamos em considerao se n par ou mpar e procedemos do seguinte modo: 1) Calcula-se ;

2) Pela frequncia acumulada, identifica-se a classe que contm a mediana; 3) Aplica-se a frmula:

Dicionrio
Rol a sequncia de dados obtida aps a ordenao dos dados (crescente ou decrescente).

onde: limd = limite inferior da classe md n = n total de elementos da amostra fac = frequncia acumulada da classe anterior classe md h = amplitude da classe md nimd = frequncia da classe md Moda (mo)

Logo, a medida ser dada pelo elemento que divide o Rol em duas partes iguais.

o valor da varivel mais frequente da distrib. o nmero de observaes (n) par: no existe, portanto, um valor que ocupe o buio. centro; convencionou-se que a mediana ser a mdia aritmtica dos valores que Exemplo: calcular a moda para o seguinte ocupam as posies de ordem conjunto de dados: 65, 87, 49, 58, 65, 65, 67, 83, 87, 79, 87. Exemplo: calcular a mediana dos valores j ordenados: 6, 8, 9, 11, 12, 14. n = 6 (par) Observe que, mo = 65 (aparece 3 vezes) e mo = 87 (aparece 3 vezes).

Temos ento duas modas, portanto a distribuio bimodal. Quando a distribuio no apreA mediana ser dada pela mdia aritmtica sentar moda, ser chamada amodal; se tiver uma entre o 3 e 4 elementos da sequncia: s moda, recebe o nome de unimodal e, se apresentar vrias modas, ser multimodal. Para calcularmos a moda quando os dados esto agrupados em classes, usaremos o seguinte processo:

28

Unisa | Educao a Distncia | www.unisa.br

Estatstica

1) Identifica-se a classe modal (a que possuir maior frequncia); 2) Aplica-se a frmula:

onde: limo = limite inferior da classe modal = diferena entre a frequncia da classe modal e a imediatamente anterior = diferena entre a frequncia da classe modal e a imediatamente posterior h = amplitude da classe modal

Exemplos: 1. Calcule mdia, mediana e moda para a varivel Idade (Tabela 11) (Ver Tabela 23):
Tabela 11 Varivel Idade.

n = 50 par, portanto, a mediana ser a mdia aritmtica dos dois valores centrais

Pela fac, observamos que o valor da frequncia acumulada at 18 igual a 31 e, portanto, o 25 elemento igual ao 26 elemento e ambos correspondem ao valor da varivel igual a 18

Para o clculo de mo, olhamos a maior frequncia (22), que corresponde idade de 18 anos.

2. Calcule mdia, mediana e moda para a varivel Peso (Tabela 12) (Ver Tabela 4):

Unisa | Educao a Distncia | www.unisa.br

29

Regina Maria Sigolo Bernardinelli

Tabela 12 Varivel Peso.

Pela fac (30), a 2 classe contm a mediana, isto , o intervalo 50,0 60,0.

Saiba mais
As medidas de posio podem ser utilizadas em conjunto para auxiliar a anlise dos dados, mas existem situaes em que uma pode ser mais conveniente do que a outra. Por exemplo, quando existe um ou mais valores muito discrepantes, a mdia muito influenciada por este valor e se torna inadequada para representar o conjunto de dados, sendo melhor trabalhar com a mediana. Por outro lado, para conjuntos de dados muito numerosos, a ordenao custosa e a mediana se torna difcil de calcular.

30

Unisa | Educao a Distncia | www.unisa.br

Estatstica

4.2 Medidas de Disperso

Prezado(a) aluno(a), como visto, efetuar uma anlise dos dados, utilizando-se somente as medidas de posio, pode levar-nos a concluses equivocadas. Para nos auxiliar na tarefa da anlise de dados, utilizaremos tambm as medidas de disperso. Observe o exemplo a seguir.

suficientes para fazer a mdia atingir um patamar comparvel s melhores economias do mundo, porm a discrepncia entre os diversos valores deve ser muito grande. O que podemos estar esquecendo a variabilidade dos valores da varivel e isso no captado pela mdia, mas pelas medidas de disperso.

As medidas de disperso ou de variabiliUm bairro nobre da capital paulista inclui dade servem para quantificar a variabilidade dos uma das maiores favelas de So Paulo. O que pode- valores da varivel, isto , a disperso dos dados, ou mos dizer da renda mdia do bairro? Certamente, a forma como os valores de cada conjunto se espaos altos rendimentos de alguns residentes sero lham ao redor das medidas de tendncia central. Medidas de disperso para um conjunto de dados Sejam os valores assumidos por uma varivel X.

Consideremos, por exemplo, as sries: A: 10, 10, 11, 12, 12, 13, 14, 14, 14, 15 B: 7, 7, 8, 9, 12, 13, 13, 16, 17, 23 com com = 12,5 e md = 12,5 = 12,5 e md = 12,5

Observamos que essas sries no so homogneas, apesar de ambas terem o mesmo valor para a mdia e a mediana. preciso, pois, calcular as constantes de disperso, que medem os afastamentos dos valores dessas sries em torno do valor central. Entre as medidas de disperso ou de variabilidade mais usadas, temos: amplitude total, varincia, desvio padro e coeficiente de variao. Amplitude total (R) a diferena entre o maior e o menor valor de um conjunto de dados.

Exemplos: Para a srie A: R = 15 10 = 5. Para a srie B: R = 23 7 = 16. Unisa | Educao a Distncia | www.unisa.br

31

Regina Maria Sigolo Bernardinelli

A utilizao da amplitude total como medida de disperso muito limitada, pois s leva em considerao dois valores de todo o conjunto de dados. Varincia ( Para medir a disperso dos valores de uma varivel em torno da mdia, interessante estudar o comportamento dos desvios de cada valor em relao mdia, isto ,
n n

. Na determinao de cada

desvio d i , estaremos medindo a disperso entre cada x i e a mdia x . Porm, se somarmos todos os desvios, teremos

di = ( x i x ) = 0 . Para contornar o problema, resolveu-se considerar o quadrado


i =1 i =1

de cada desvio ( x i x ) 2 . Assim, defini-se: Varincia a mdia aritmtica dos quadrados dos desvios.

A seguir, esto outras frmulas que podem ser usadas para facilitar o clculo da varincia populacional e amostral.

2= 2=

1 N 2 1 n x i 2 (dados no agrupados) S 2 = x i2 ( x ) 2 (dados no agrupados) N i =1 n i =1


n 1 N 2 1 2 2 ( n x ) = S (dados agrupados) i i ( n i x i2 ) ( x )2 (dados agrupados) n i =1 N i =1

32

Unisa | Educao a Distncia | www.unisa.br

Estatstica

Exemplos:

Desvio Padro (

O desvio padro a raiz quadrada da varincia. assim definido para que a unidade original da varivel, se houver, seja mantida, pois, pela frmula do clculo da varincia, a unidade elevada ao quadrado.

= S=

2 (desvio padro populacional) S 2 (desvio padro amostral)

Exemplos: Para a srie A: Para a srie B: Observao: O desvio padro define, em torno da mdia populacional ou amostral, um intervalo [ , + ] ou [ x S , x + S ] de amplitude 2 ou 2S, respectivamente, chamado zona de normalidade.

Coeficiente de Variao (CV) O coeficiente de variao uma medida relativa da disperso que serve para comparar o grau de concentrao em torno da mdia de conjuntos de dados distintos.

Exemplos: Para a srie A: Para a srie B: Vemos, portanto, que h maior variao na srie B do que na A, pois o CV, na srie B, bem maior que na srie A. Unisa | Educao a Distncia | www.unisa.br

33

Regina Maria Sigolo Bernardinelli

Exemplos: 1. Calcule amplitude total, varincia, desvio padro e coeficiente de variao para a varivel Idade (Tabela13) (Ver Tabela 11):
Tabela 13 Varivel Idade.

R = 25 17 = 8 (amplitude total)

2) Calcule amplitude total, varincia, desvio padro e coeficiente de variao para a varivel Peso (Tabela 14) (Ver Tabela 12):
Tabela 14 Varivel Peso.

34

Unisa | Educao a Distncia | www.unisa.br

Estatstica

4.3 Resumo do Captulo

Prezado(a) aluno(a), vimos neste captulo que as medidas de posio ou medidas de tendncia central para um conjunto de dados qualquer (populao ou amostra) so: a mdia, a mediana e a moda. Tambm foram apresentadas as medidas de disperso. Entre as medidas de disperso ou de variabilidade mais usadas, temos: amplitude total, varincia, desvio padro e coeficiente de variao, que complementaro as informaes necessrias para a anlise dos dados.

4.4 Atividades Propostas

1. Vinte e cinco residncias de certo bairro foram sorteadas e visitadas por um entrevistador, que, entre outras questes, perguntou sobre o nmero de televisores. Os dados foram os seguintes: 2, 2, 2, 3, 1, 2, 1, 1, 1, 1, 0, 1, 2, 2, 2, 2, 3, 1, 1, 3, 1, 2, 1, 0 e 2. Organize os dados numa tabela de frequncia e determine todas as medidas de posio e de disperso. 2. Num experimento, 15 coelhos foram alimentados com uma nova rao e seu peso avaliado no fim de um ms. Os dados referentes ao ganho de peso (em quilogramas) foram os seguintes: 1,5; 1,6; 2,3; 1,7; 1,5; 2,0; 1,5; 1,8; 2,1; 2,1; 1,9; 1,8; 1,7; 2,5 e 2,2.

Unisa | Educao a Distncia | www.unisa.br

35

Regina Maria Sigolo Bernardinelli

a. Utilizando os dados brutos, determine as medidas de posio e de disperso desse conjunto. b. Organize uma tabela de frequncia com faixas de amplitude 0,2 a partir de 1,5. c. Calcule, a partir da tabela de frequncia e com o ponto mdio como representante de cada faixa, as medidas de posio e de disperso. Comente as diferenas encontradas com o item (a). d. Se ao invs de 15, fossem 500 coelhos, qual seria o procedimento mais conveniente: o de (a) ou o de (c)? Justifique. 3. As pulsaes de 10 estudantes no incio de uma prova de Estatstica foram as seguintes (em batimentos por minuto): 80, 91, 84, 86, 93, 88, 80, 89, 85 e 86. Calcule as medidas de posio e de disperso desse conjunto de dados. 4. Num estudo sobre consumo de combustvel, 200 automveis do mesmo ano e modelo tiveram o seu consumo observado durante 1000 quilmetros. A informao obtida apresentada na Tabela 15, em km/litro.
Tabela 15 Consumo de combustvel.

Determine as medidas de posio e de disperso do consumo. 5. Se a mdia das alturas de um grupo de pessoas 175 cm e o desvio padro 20 cm, uma pessoa com estatura de 150 cm est dentro da normalidade? Por qu? 6. Numa escola, duas turmas conseguiram os seguintes resultados:

Responda: a. Qual a turma mais homognea? Por qu? b. Um aluno com mdia 40 considerado normal na turma A? E na turma B? Por qu?

36

Unisa | Educao a Distncia | www.unisa.br

Estatstica

7. Na aplicao de um teste de motricidade, conseguiram-se os resultados da Tabela 16.


Tabela 16 Motricidade.

Responda: a. Qual a mdia aritmtica? b. Qual o desvio padro? c. Qual a zona considerada de normalidade? d. Uma criana que obteve 28 pontos considerada com motricidade normal? Por qu? 8. Na pesagem de 20 crianas de quinta srie, obtiveram-se os seguintes resultados, em kg: 38 40 45 42 45 40 43 38 45 45 40 41 41 38 46 32 48 46 42 43 44 50 38 40 Nesse grupo de crianas, um menino com 35 kg seria considerado com peso normal? Por qu?

Unisa | Educao a Distncia | www.unisa.br

37

5 PROBABILIDADES
Prezado(a) aluno(a), neste captulo, no ser conceitos que sero necessrios para o estudo da efetuado um estudo completo sobre a teoria das Estatstica e aplicados posteriormente. probabilidades, mas sero apresentados alguns

5.1 Fenmeno Determinstico

aquele em que repetindo um experimento, nas mesmas condies, o resultado esperado sempre o mesmo. Exemplo: se um corpo percorre uma distncia de 120 km, com velocidade mdia de 60 km/h,

podemos determinar, pelas leis da Fsica, que ele gastar 2 horas para percorrer o referido espao e isso sempre ocorrer, desde que sejam mantidas as mesmas condies.

5.2 Fenmeno Aleatrio ou Probabilstico

Veremos que modelos podem ser estabele aquele cujo resultado no pode ser previsto com certeza, ainda que mantidas as mesmas con- cidos para quantificar as incertezas das diversas ocorrncias. dies de realizao. Exemplo: no lanamento de um dado, no podemos dizer, com certeza, qual ser o resultado. S podemos saber que provvel que ocorra o resultado 1 ou 2 ou 3 ou 4 ou 5 ou 6.
Ateno
A maioria dos fenmenos tratada pela Estatstica de natureza aleatria ou probabilstica. Observe que durante a escolha da amostra, temos um fenmeno probabilstico.

Unisa | Educao a Distncia | www.unisa.br

39

Regina Maria Sigolo Bernardinelli

5.3 Espao Amostral (S)

o conjunto de todos os resultados possveis de certo fenmeno aleatrio.

5.4 Evento (E)

Exemplo: um experimento consiste em retirar uma lmpada de um lote e medir seu tempo Exemplo: lanamos uma moeda duas vezes. de vida antes de se queimar. Um espao amostral conveniente : S = {t: t 0}, isto , o conjunto de toSe C indica cara e R, coroa, temos: dos os nmeros reais no negativos. Seja o evento S = {(C, C); (C, R); (R, C); (R, R)} (espao amoso tempo de vida da lmpada inferior a 20 horas, tral) temos: E = {t: 0 t < 20}. Este um exemplo de esSeja o evento obteno de faces iguais, te- pao amostral contnuo, enquanto os outros antemos: E = {(C, C); (R, R)} (evento) riores so discretos. Seja o evento obteno de cara no 1 lanamento, temos: E = {(C, C); (C, R)} (evento) um subconjunto do espao amostral.

5.5 Probabilidade

a relao entre o nmero de possveis resultados de E e todos os possveis resultados do experimento. Indicamos: P(E).

No caso dos dois eventos anteriores, P(E) =

2 1 = . 4 2

5.6 Propriedades

Sendo o modelo probabilstico um modelo terico para as frequncias relativas, podemos verificar algumas das propriedades a seguir: Como toda frequncia relativa um nmero entre 0 e 1, temos que: 0 P(E) 1,

para qualquer evento E; Considerando o espao todo S e o conjunto vazio como eventos, temos: P(S) = 1 (evento certo) e P() = 0 (evento impossvel)

40

Unisa | Educao a Distncia | www.unisa.br

Estatstica

Saiba mais
Um pouco de Histria Os primeiros estudos envolvendo probabilidades foram motivados pela anlise de jogos de azar. Sabe-se que um dos primeiros matemticos que se ocupou com o clculo das probabilidades foi Cardano (1501-1576). Data dessa poca a expresso que utilizamos at hoje para o clculo da probabilidade de um evento (nmero de casos favorveis dividido pelo nmero de casos possveis). Com Fermat (1601-1665) e Pascal (1623-1662), a teoria das probabilidades comeou a evoluir e ganhar mais consistncia, passando a ser utilizada em outros aspectos da vida social, como, por exemplo, auxiliando na descoberta da vacina contra a varola no sculo XVIII. Atualmente, a teoria das probabilidades muito utilizada em outros ramos da Matemtica (como o Clculo e a Estatstica), da Biologia (especialmente nos estudos da Gentica), da Fsica (como na Fsica Nuclear), da Economia, da Sociologia etc.

5.7 Varivel Aleatria Discreta

Uma quantidade X, associada a cada possvel resultado do espao amostral S, denominada varivel aleatria discreta se assume valores num conjunto enumervel de pontos do conjunto real, com certa probabilidade de ocorrncia.

5.8 Funo Discreta de Probabilidade

A funo que atribui a cada valor x1 , x 2 , x 3 , , x n da varivel aleatria X sua probabilidade de ocorrncia p1 , p 2 , p3 , , p n , respectivamente, denominada funo discreta de probabilidade ou, simplesmente, funo de probabilidade. Notao:
p ( x i ) = P ( X = x i ) = pi , i = 1, 2, 3,

Uma funo de probabilidade satisfaz:


0 pi 1 e

pi = 1 .

ou, ainda,

Unisa | Educao a Distncia | www.unisa.br

41

Regina Maria Sigolo Bernardinelli

5.9 Varivel Aleatria Contnua

Exemplos: renda, salrio, tempo de uso de Uma quantidade X, associada a cada possvel resultado do espao amostral S, denominada va- um equipamento, rea atingida por certa praga rivel aleatria contnua se assume valores num agrcola. intervalo do conjunto dos nmeros reais, com certa probabilidade de ocorrncia.

5.10 Funo Contnua de Probabilidade

Funo contnua de probabilidade ou funo densidade de probabilidade para uma varivel aleatria contnua X toda funo f (X) que satisfaz a duas condies:

a. f (X) 0, para todo X ( , + ) ; b. a rea definida por f (X) igual a 1.

5.11 Resumo do Captulo

Prezado(a) aluno(a), neste captulo, apresentamos alguns conceitos fundamentais sobre Probabilidade, entre eles a definio de Espao Amostral (S), Evento (E), Probabilidade, Varivel Aleatria Discreta, Funo Discreta de Probabilidade, Varivel Aleatria Contnua e Funo Contnua de Probabilidade. O clculo das probabilidades pertence ao campo da Matemtica, entretanto a maioria dos fenmenos de que trata a Estatstica so de natureza aleatria ou probabilstica. O conhecimento dos aspectos fundamentais do clculo das probabilidades uma necessidade essencial para o estudo da Estatstica Indutiva ou Inferncia.

5.12 Atividade Proposta

1. U m nmero escolhido ao acaso entre os 50 inteiros compreendidos entre 1 e 50. Qual a probabilidade do nmero: a. Ser mltiplo de 9? b. Ser mltiplo de 3 e de 4? c. Ser mltiplo de 3 ou de 4? d. Ser um nmero primo?

42

Unisa | Educao a Distncia | www.unisa.br

Estatstica

2. Numa caixa esto guardadas peas nas cores e formatos conforme a tabela abaixo:

Ao sortear-se ao acaso uma das peas, qual a probabilidade de ocorrer uma pea: a. Circular Amarela? b. Retangular? c. No Triangular?

Unisa | Educao a Distncia | www.unisa.br

43

6 VARIVEIS ALEATRIAS CONTNUAS


Entre os principais modelos tericos para tatura, QI, orientao poltica, desgaste dos pisos variveis aleatrias contnuas, estudaremos o etc., aproximam-se, na prtica, muito bem desse modelo normal, pois vrios fenmenos, como es- modelo.

6.1 Modelo Normal ou Distribuio Normal

Dizemos que uma varivel aleatria contnua X tem distribuio normal com parmetros e 2 , respectivamente a mdia e a varincia da Notao: X ~ N( , 2 ) , significa: X tem distridistribuio, , se a sua buio normal com parmetros e 2 . funo densidade de probabilidade dada por:
Grfico 5 Curva normal.

Observando-se o grfico, temos: a. f ( X ) simtrica em relao a , isto , f ( + X ) = f ( X ), para todo X, < X < + ; b. f ( X ) 0 quando X ; c. o valor mximo de f ( X ) se d para X = , isto , a curva normal unimodal e

mdia ( ), mediana ( Md ) e moda (Mo) coincidem; d. E ( X ) = (valor esperado ou mdia); e. Var ( X ) = 2 (varincia);

Unisa | Educao a Distncia | www.unisa.br

45

Regina Maria Sigolo Bernardinelli

Saiba mais
Modelo Normal O modelo normal, ou Gaussiano, certamente o mais importante dos modelos para variveis aleatrias contnuas. Isto se justifica pelo grande nmero de aplicaes que a utilizam e pela sua capacidade de aproximar outros modelos. Nesta distribuio, a mdia, mediana e moda so valores coincidentes. O clculo de probabilidades na distribuio normal feito mediante o conhecimento da mdia e desvio-padro da varivel aleatria. Dada a importncia desta distribuio, estas duas medidas so consideradas as mais importantes para verificar tendncia central e disperso, respectivamente.

Como calcular P (a X b)?


Grfico 6 Probabilidade.

As probabilidades para o modelo normal so Desse modo, se X ~ N( , 2 ) , definimos uma calculadas com o auxlio de tabelas e, para evitar- nova varivel Z = X , para qual se demonstra mos a multiplicao desnecessria de tabelas para 2 ( Z ) = 1. que ( Z ) = 0 e cada par de valores ( , 2 ) , utiliza-se uma transLogo Z ~ N( , 2 ) e denominada Normal formao que conduz sempre ao clculo de probabilidades com uma varivel de parmetros (0, 1), padro ou Normal reduzida. isto , = 0 (mdia) e 2 = 1 (varincia).
Grfico 7 Normal padro ou normal reduzida.

46

Unisa | Educao a Distncia | www.unisa.br

Estatstica

Agora, para calcularmos P ( a X b), fazemos a seguinte transformao:

Os valores P ( 0 Z z ), z 0 so tabelados. Pela simetria da curva normal, podemos calcular valores de probabilidades em outros intervalos e, tambm, temos que a probabilidade de estar direita (ou esquerda) de zero 0,5. Como a probabilidade sempre um nmero compreendido entre 0 e 1, a tabela contm apenas a parte decimal.

a b ), Z P ( a X b) = P (
onde X ~ N( , 2 ) . Portanto, quaisquer que sejam os valores de e , utilizamos a normal padro para obter probabilidades com a distribuio normal.
Dicionrio

Simetria Matemtica: disposio de duas figuras que se correspondem ponto por ponto de tal sorte que os dois pontos correspondentes de uma e da outra estejam a igual distncia de um ponto, de uma reta ou de um plano dado. Eixo de simetria, reta comum a todos os planos de simetria. Note que temos um eixo central na curva normal. Se pegarmos um ponto pertencente a curva normal direita do eixo central, teremos um ponto correspondente esquerda deste eixo que estar mesma distncia do eixo central.

6.2 Resumo do Captulo

Prezado(a) aluno(a), neste captulo, vimos como criar um modelo probabilstico e o que uma funo densidade de probabilidade. De modo geral, podemos dizer que as variveis aleatrias, cujos valores resultam de mensuraes ou medies, so variveis aleatrias contnuas. A construo de modelos probabilsticos para variveis aleatrias contnuas envolve a ideia da generalizao do histograma, fazendo o nmero de classes e o nmero de valores tenderem para o infinito, que significa construir intervalos de classes extremamente pequenos, nfimos. A forma do histograma sofre uma modificao, passando a apresentar uma curva suave, ou seja, uma linha contnua, como visto no Grfico 5. Esta curva contnua a representao grfica de uma funo da varivel aleatria X, chamada de funo densidade de probabilidade

Unisa | Educao a Distncia | www.unisa.br

47

Regina Maria Sigolo Bernardinelli

6.3 Atividade Proposta

1. As alturas de 10.000 alunos tm distribuio aproximadamente normal, com mdia 170 cm e desvio padro 5 cm. Qual a probabilidade de termos: a. Alunos com alturas entre 165 cm e 170 cm. b. Entre 165 cm e 180 cm. c. Entre 168 cm e 185 cm. d. Menores que 160 cm. e. Maiores que 180 cm. f. Qual o nmero esperado de alunos com altura superior a 165 cm?

48

Unisa | Educao a Distncia | www.unisa.br

7 ESTIMAO
Prezado(a) aluno(a), neste captulo iremos abordar aspectos relacionados Inferncia Estatstica. At o presente momento, voc aprendeu a descrever uma amostra por meio de medidas de tendncia central e medidas de disperso, que compem a Estatstica Descritiva. A partir de agora, voc ir aprender a utilizar a Inferncia Estatstica para inferir indutivamente propriedades de uma populao, com base nos resultados obtidos com uma amostra.
Dicionrio
Inferir: Tirar uma concluso a partir de um fato, de um princpio. Concluir, deduzir.

cidir se uma determinada droga eficiente para o tratamento de uma doena entre outros.
Ateno
A estimao faz parte da Inferncia Estatstica, que tem por objetivo fazer generalizaes sobre uma populao com base em dados de uma amostra.

Existem dois tipos de estimao: por ponto e por intervalo. Na estimao por ponto, proposto um nico valor para substituir o parmetro (dado da populao). Assim, o estimador por ponto da mdia aritmtica populacional a mdia aritmtica amostral x ; o estimador por ponto da varincia populacional 2 a varincia amostral S2 .

A Inferncia Estatstica nos permitir tomar decises sobre populaes com base nas informaes obtidas em amostras das mesmas. Por exemplo, com base nos dados amostrais, podemos de-

7.1 Estimao por Intervalo

A estimao faz parte da Inferncia Estatsti- de sua variabilidade. ca, que tem por objetivo fazer generalizaes soUm intervalo de confiana determinado bre uma populao com base em dados de uma por dois valores, que so os seus limites, chamados amostra. limites de confiana, que com certa probabiliA estimao por ponto no permite julgar dade incluem o verdadeiro valor do parmetro da qual a possvel magnitude do erro que estamos co- populao. metendo ao substituir o parmetro por um nico Logo, a estimao por intervalo consiste na valor. Da surge a ideia de construir intervalos de fixao de dois valores tais que seja a probabilidaconfiana, que so baseados na distribuio amos- de de que o intervalo, por eles determinado, contetral do estimador pontual, incorporando estima- nha o verdadeiro valor do parmetro. tiva pontual do parmetro informaes a respeito Unisa | Educao a Distncia | www.unisa.br

49

Regina Maria Sigolo Bernardinelli

chamado de coeficiente de confiana ou Intervalo de Confiana (IC) para a Mdia Populacional (varincia conhecida) nvel de confiabilidade. 1 o nvel de significncia ou nvel de incerteza ou, ainda, grau de desconfiana. Portanto, a partir de informao de amostra, devemos calcular os limites de um intervalo, que, em % dos casos, inclua o valor do parmetro a estimar e, em (1 )% dos casos, no inclua o valor do parmetro. Consideremos, inicialmente, o interva-

lo de confiana para a mdia (desconhecida) de certa populao normal, com varincia conhecida 2 . Supondo uma amostra X de tamanho n, com 2valores X1 , X 2 , , X n , temos que X ~ N ( , ) , onde X a mdia amostral. n

Fixado um valor tal que 0 < <1, definimos o intervalo de confiana para , com coeficiente de confiana , como: IC ( , ) = X z . X ; X + z . X = X z . X X + z . X , onde: X a mdia amostral. 2 2 2 2
z obtido da tabela da normal padro, localizando o valor de
2

no corpo da tabela e obtendo o 2

valor z nas margens correspondentes.


2

X =

o desvio padro da mdia amostral. n anteriormente so os nmeros obtidos por

Os limites de confiana citados X z . X e X + z . X .


2 2

A expresso IC ( , ) envolve a quantidade X , que uma varivel aleatria e, sendo assim, o intervalo obtido tambm aleatrio, com probabilidade de conter o verdadeiro valor da mdia populacional . Assim, uma interpretao conveniente para o intervalo de confiana : se obtivermos vrias amostras de mesmo tamanho e, para cada uma delas, calcularmos os correspondentes intervalos de confiana com coeficiente de confiana , esperamos que a proporo de intervalos que contenham o valor de seja igual a . Exemplo: Suponha que os comprimentos de jacars adultos de certa raa sigam o modelo normal com mdia desconhecida e varincia igual a 0,01 m 2 . Uma amostra de dez animais foi sorteada e forneceu mdia 1,69 m. Desejamos uma estimativa para o parmetro desconhecido , com coeficiente de confiana de 95%.

50

Unisa | Educao a Distncia | www.unisa.br

Estatstica

Identificando os dados do problema, temos: 2 = 0,01; n = 10; X = 1,69; = 95%;

X ~ N ( ,

2 ) n

IC ( , ) = [ X z . X ; X + z . X ]
2 2

IC ( , 95% ) = [ 1,63 ; 1,75 ] Concluindo, podemos dizer que, em 100 intervalos construdos, 95 contm a verdadeira mdia e, de modo geral, admitimos que o intervalo calculado um dos que contm a verdadeira mdia . Por essa razo, alm de informar o intervalo obtido, devemos tambm fornecer o ndice de confiana utilizado. Observaes: A amplitude do intervalo de confiana dada pela diferena entre o extremo superior e inferior, isto , X + z . X (X z . X ) = 2 z . X
2 2 2

A semiamplitude, ou seja, z . X nos fornece o erro envolvido na estimao;


2

Se a populao for finita e de tamanho N conhecido e se a amostra de tamanho n dela retirada for sem reposio, ento: = . N n X N 1 n Exemplo: De uma populao de 1000 elementos com distribuio aproximadamente normal com 2 = 400 , tira-se uma amostra de 25 elementos, obtendo-se X = 150 . Fazer um IC para , ao nvel de 5%. Identificando os dados do problema, temos: N = 1000; 2 = 400 ; n = 25; X = 150 ; 1 = 5%.

Unisa | Educao a Distncia | www.unisa.br

51

Regina Maria Sigolo Bernardinelli

Esquema para melhor compreenso

52

Unisa | Educao a Distncia | www.unisa.br

Estatstica

Figura 2 Intervalo de Confiana Mdia Populacional.

Intervalo de confiana para a proporo Quando o tamanho da amostra ( n ) for grande, temos: tral e q = 1 p. Consideramos uma amostra grande quando n > 30.
a proporo amos, onde p

Fixado um valor tal que 0 < <1, definimos o intervalo de confiana para p, com coeficiente de confiana , como:
z . p + z . p p z . p + z . p IC (p , ) = [ p p p , onde: ;p ]=
2 2 2 2

a proporo amostral. p

z obtido da tabela da normal padro, localizando o valor de

valor z nas margens correspondentes.


2

no corpo da tabela e obtendo o 2

p =

.q p = 1 p . o desvio padro da proporo amostral, com q n

Exemplo: Suponha que, em n = 400 provas, obtemos k = 80 sucessos. Vamos obter um intervalo de confiana para p, com coeficiente de confiana = 90%.

= Identificando os dados do problema, temos: p


n = 400; = 90%

8 0 = 1 p = 1 0,2 = 0,8 ; = 0,2 q 400

Unisa | Educao a Distncia | www.unisa.br

53

Regina Maria Sigolo Bernardinelli

IC (p , 90%) = [0,2 1,64 . 0,02 ; 0,2 + 1,64 . 0,02] IC (p , 90%) = [ 0,167 ; 0,233 ] Observao: Para a proporo, o erro envolvido na estimao dado por: z . p
2

Intervalo de Confiana (IC) para a Mdia Populacional (varincia desconhecida) Para estimarmos a mdia de uma populao normal com varincia desconhecida, quando o tamanho (n) da amostra for grande, n > 30, substitumos 2 pela varincia amostral S2 e usamos a distribuio normal. Fixado um valor tal que 0 < <1, definimos o intervalo de confiana para , com coeficiente de confiana , como: IC ( , ) = [ X z . X ; X + z . X ] , onde:
2 2

X a mdia amostral.
z obtido da tabela da normal padro, localizando o valor de
2

valor z nas margens correspondentes.


2

no corpo da tabela e obtendo o 2

X =

S o desvio padro da mdia amostral, com n S = S2 e S2 = 1 { x i2 n 1 i =1


n

( x i )2
i =1

} o u

S2 =

2 1 n 2 { x i n X } n 1 i =1

Exemplo: 1. De uma populao normal com parmetros desconhecidos, tiramos uma amostra de tamanho 100, obtendo-se X = 112 e S = 11. Fazer um IC para ao nvel de 10%. Identificando os dados do problema, temos: n = 100; X = 112 ; S = 11; 1 = 10% = 0,10

54

Unisa | Educao a Distncia | www.unisa.br

Estatstica

IC ( , ) = [ X z . X ; X + z . X ]
2 2

IC ( , 90%) = [112 1,64 . 1,1 ; 112 + 1,64 . 1,1] IC ( , 90%) = [110,20 ; 113,80]

Saiba mais
Qual a vantagem de uma amostra ser aleatria, frente a amostras no aleatrias, escolhidas por critrios subjetivos e ao gosto do pesquisador? Em primeiro lugar, uma amostra escolhida por critrios rigorosamente objetivos, tende a no introduzir vieses que ocorrem quando a seleo obtida por critrios discutveis. Um pesquisador de campo pode selecionar apenas domiclios que possuem menos quantidade de pessoas para facilitar o seu trabalho e pode tambm evitar os domiclios de difcil acesso. Mas a principal vantagem de uma amostra probabilstica (frente a uma amostra subjetivista) que, atravs de seus resultados, possvel realizar clculos probabilsticos. Uma boa amostra deve apresentar trs virtudes: 1) deve ser aleatria 2) deve ser precisa e 3) deve ser representativa e no geradora de vieses para as suas estimativas de parmetros da populao. A preciso de uma amostra ir depender de seu tamanho. Geralmente, quanto maior o tamanho de uma amostra, maior ser a sua preciso. A representatividade da amostra depender no de seu tamanho, mas da maneira como os elementos so selecionados da populao. Por exemplo, se tivermos uma populao constituda de 30% de mulheres e 70% de homens e estivermos interessados em estimar a quantidade mdia de horas de estudo. Se selecionarmos uma amostra com 50% de homens e 50% de mulheres, a quantidade mdia de horas de estudo desta amostra no ser um bom estimador da quantidade mdia de horas de estudo da populao, se a quantidade de horas de estudo for uma varivel que depende do sexo da pessoa. Se as mulheres tenderem a estudar mais do que os homens, esta amostra no representativa ir conduzir a um valor superestimado da quantidade mdia de horas de estudo. J uma amostra que tenha o mesmo percentual de homens e de mulheres que existe na populao, ser considerada representativa desta populao e a mdia de horas estudo obtida desta amostra ser uma estimativa no viesada da mdia de horas de estudo da populao.

7.2 Resumo do Captulo

Prezado(a) aluno(a), aprendemos que a estimao faz parte da Inferncia Estatstica, que tem por objetivo fazer generalizaes sobre uma populao com base em dados de uma amostra. Existem dois tipos de estimao: por ponto e por intervalo, sendo esta ltima mais precisa.

Unisa | Educao a Distncia | www.unisa.br

55

Regina Maria Sigolo Bernardinelli

7.3 Atividade Proposta

1. A altura dos homens de uma cidade apresenta distribuio normal. Para estimar a altura mdia dessa populao, levantou-se uma amostra de 150 indivduos obtendo-se . Ao nvel de 2%, determinar um IC para a altura mdia dos homens da cidade.

56

Unisa | Educao a Distncia | www.unisa.br

8 CORRELAO
as medidas de tendncia central, disperso, assimetria etc. Com duas ou mais variveis alm destas medidas individuais tambm de interesse conhecer se elas possuem algum relacionamento entre si, isto , se valores altos (baixos) de uma das variveis implicam em valores altos (ou baixos) da outra Observou? varivel. Por exemplo, pode-se verificar se existe associao entre a taxa de desemprego e a taxa de criminalidade em uma grande cidade, entre verba Dicionrio investida em propaganda e retorno nas vendas, veCorrelao: Podemos desmembr-la em co + relao, rificar a relao entre o peso e a idade das pessoas, que nos leva a investigar, compreender a relao exisse o consumo das famlias pode estar relacionado tente entre dois termos ou objetos. com sua renda, se as vendas de uma empresa e os gastos promocionais podem relacionar-se, bem Portanto, correlao o estudo da existncia como a demanda de um determinado produto e e do grau de relao entre variveis, tendo por ob- seu preo. A anlise de correlao fornece um nmero jetivo medir e avaliar o grau de relao existente que resume o grau de relacionamento linear entre entre duas variveis aleatrias. Ao se estudar uma varivel o interesse eram as duas variveis Prezado(a) aluno(a), neste captulo, iremos abordar a correlao. Voc sabe o que significa a palavra correlao? Antes de ler o prximo pargrafo, observe a formao da palavra correlao e pense a respeito.

8.1 Correlao Linear Simples

Procura medir a relao entre as variveis X e Y atravs da disposio dos pontos (X, Y) em torno de uma reta. Coeficiente de correlao de Pearson o instrumento de medida da correlao linear. onde:

Unisa | Educao a Distncia | www.unisa.br

57

Regina Maria Sigolo Bernardinelli

n = nmero de observaes e;

Correlao linear positiva A correlao ser positiva quando valores crescentes de X estiverem associados a valores crescentes de Y ou valores decrescentes de X estiverem associados a valores decrescentes de Y.

Grfico 8 Correlao linear positiva

Quando todos os pontos pertencerem reta, a correlao chamada correlao linear perfeita positiva e Correlao linear negativa A correlao ser negativa quando valores crescentes de X estiverem associados a valores decrescentes de Y ou valores decrescentes de X estiverem associados a valores crescentes de Y.
Grfico 9 Correlao linear negativa

Quando todos os pontos pertencerem reta, a correlao chamada correlao linear perfeita negativa e

58

Unisa | Educao a Distncia | www.unisa.br

Estatstica

Correlao nula A correlao ser nula quando no houver relao entre as variveis X e Y, ou seja, quando as variaes de X e Y ocorrerem independentemente, no existe correlao entre elas.
Grfico 10 Correlao nula

Ateno
A correlao ser tanto mais forte quanto mais prximo estiver o resultado de + 1 ou de 1 e ser tanto mais fraca quanto mais prximo o resultado estiver de zero.

Exemplos: 1. Calcular o coeficiente de correlao linear entre as variveis X e Y, usando os dados da Tabela 17. Observao: Para maior facilidade, construiremos uma tabela na qual, a partir dos valores de X e Y, determinaremos todas as somas necessrias (Tabela 18).
Tabela 17 Dados de X e Y.

Tabela 18 Somas conforme valores de X e Y.

Unisa | Educao a Distncia | www.unisa.br

59

Regina Maria Sigolo Bernardinelli

A correlao linear entre as variveis X e Y positiva, porm baixa.

2. A Tabela 19 mostra os resultados de uma pesquisa com 10 famlias de uma determinada regio.

Tabela 19 Informaes de famlias da regio.

Calcular o coeficiente de correlao linear entre Poupana e Nmero de filhos das dez famlias.

60

Unisa | Educao a Distncia | www.unisa.br

Estatstica

Tabela 20 Correo linear entre Poupana e Nmero de filhos.

A correlao linear entre as variveis X e Y forte e negativa, isto , famlias com poupana alta tm menor nmero de filhos.

Saiba mais
Correlao no o mesmo que causa e efeito. Duas variveis podem estar altamente correlacionadas e, no entanto, no haver relao de causa e efeito entre elas. Se duas variveis estiverem amarradas por uma relao de causa e efeito elas estaro, obrigatoriamente, correlacionadas. O estudo de correlao pressupe que as variveis X e Y tenham uma distribuio normal. A palavra simples que compe o nome correlao linear simples, indica que esto envolvidas no clculo somente duas variveis.

Unisa | Educao a Distncia | www.unisa.br

61

Regina Maria Sigolo Bernardinelli

8.2 Resumo do Captulo

Prezado(a) aluno(a), neste captulo, estudamos a correlao e vimos que a correlao procura entender como duas variveis esto inter-relacionadas do ponto de vista estatstico. Uma das possibilidades de se efetuar este estudo medir a relao entre as variveis X e Y atravs da disposio dos pontos (X, Y) em torno de uma reta. Vimos tambm que a correlao ser positiva quando valores crescentes de X estiverem associados a valores crescentes de Y, ou valores decrescentes de X estiverem associados a valores decrescentes de Y, ou seja, a correlao ser positiva quando um atributo tender a aumentar, o outro tambm tender a aumentar. A correlao ser negativa quando valores crescentes de X estiverem associados a valores decrescentes de Y ou valores decrescentes de X estiverem associados a valores crescentes de Y, ou seja, quando um atributo tender a aumentar, o outro tender a diminuir. A correlao ser nula quando no houver relao entre as variveis X e Y, ou seja, quando as variaes de X e Y ocorrerem independentemente, no existir correlao entre elas. Podemos dizer ainda que, no h um padro definido de tendncia. Tambm ocorre quando ao aumentar um atributo no h mudana significativa nos valores do outro atributo. Para medir a correlao, iremos utilizar o Coeficiente de correlao de Pearson. Este um ndice que varia de -1 a 1.

8.3 Atividades Propostas

1. Seja X ~ N (4 , 1), determine: a. P (X 4). b. P (4 < X < 5). c. P (2 X < 5). d. P (5 X 7). e. P (X 1). f. P (0 X 2). 2. Para X ~ N (90 , 100), obtenha: a. P (X 115). b. P (X 80). c. P (X 75). d. P (-10 X 90 10). e. O valor de a tal que P (90 a X 90 + a) = , = 0,95.

62

Unisa | Educao a Distncia | www.unisa.br

Estatstica

3. Para X ~ N (-5 , 10), calcule: a. P (-5 < X -2). b. P (X + 5 < -2) + P (X + 5 > 2). 4. Uma clnica de emagrecimento recebe pacientes adultos com peso seguindo uma distribuio normal de mdia 130 kg e desvio padro 20 kg. Para efeito de determinar o tratamento mais adequado, os 25% pacientes de menor peso so classificados de magros, enquanto os 25% de maior peso de obesos. Determine os valores que delimitam cada uma dessas classificaes. 5. Por analogia a produtos similares, o tempo de reao de um novo medicamento pode ser considerado como tendo distribuio normal com desvio padro igual a 2 minutos (a mdia desconhecida). Vinte pacientes foram sorteados, receberam o medicamento e tiveram seu tempo de reao anotado. Os dados foram os seguintes (em minutos): 2,9; 3,4; 3,5; 4,1; 4,6; 4,7; 4,5; 3,8; 5,3; 4,9; 4,8; 5,7; 5,8; 5,0; 3,4; 5,9; 6,3; 4,6; 5,5 e 6,2. Obtenha um intervalo de confiana para o tempo mdio de reao. Use = 96%. 6. Uma amostra aleatria de 625 donas de casa revela que 70% delas preferem a marca X de detergente. Construir um intervalo de confiana para p = proporo das donas de casa que preferem X com coeficiente de confiana = 90%. 7. Um fabricante afirma que seus cigarros contm no mais que 30 mg de nicotina. Uma amostra de 25 cigarros fornece mdia de 31,5 mg e desvio padro de 3 mg. Construa um intervalo de confiana para a mdia populacional com coeficiente de confiana = 95%. 8. Deseja-se fazer uma pesquisa para saber a aceitao de um novo produto no mercado. Qual o nmero de pessoas que deve ser entrevistado com 7% de erro e 95% de segurana? 9. Deseja-se fazer uma pesquisa junto a uma empresa para saber o interesse dos funcionrios em realizar cursos no exterior. Existem 3 mil funcionrios, sendo 1,8 mil com mais de dez anos de empresa e 1,2 mil com menos. Qual deve ser o tamanho da amostra probabilstica estratificada sabendo-se que, em cursos semelhantes, 5% dos funcionrios acima de dez anos e 10% dos com menos de dez anos de empresa participaram. Considerar 2% de erro e 95,5% de segurana. 10. Com relao Tabela 19, calcule: a. O coeficiente de correlao linear entre Renda familiar e Poupana. b. O coeficiente de correlao linear entre Renda familiar e Nmero de filhos. c. O coeficiente de correlao linear entre Mdia dos anos de estudo e Nmero de filhos. d. O coeficiente de correlao linear entre Renda familiar e Mdia dos anos de estudo.

Unisa | Educao a Distncia | www.unisa.br

63

Regina Maria Sigolo Bernardinelli

11. A Tabela 21 mostra o volume de vendas (em 1000 unidades) e os gastos promocionais (em 100000 reais). Calcular a correlao entre as duas variveis.
Tabela 21 Volume de vendas e gastos promocionais.

12. Querendo se estimar a mdia de uma populao X com distribuio normal, levantou-se uma amostra de 100 observaes, obtendo-se X = 30 e S = 4. Ao nvel de 90%, determinar o limite de confiana para a verdadeira mdia da populao. 13. Um pesquisador deseja estabelecer o peso mdio dos jovens entre 14 e 20 anos. Apesar de desconhecer a mdia e o desvio padro populacional, sabe por literatura da rea que a distribuio dos pesos aproximadamente normal. Retira-se uma amostra casual simples de 60 jovens, obtendo peso mdio de 67 kg e desvio padro de 9 kg. a. Ao nvel de 5% de significncia, estabelecer um IC para o peso mdio populacional. b. Qual o tamanho da amostra que o pesquisador deveria tomar para ter uma probabilidade de 95% de certeza de cometer um erro de 1,5 kg?

64

Unisa | Educao a Distncia | www.unisa.br

Estatstica

Tabela 22 Normal padro.

Unisa | Educao a Distncia | www.unisa.br

65

RESPOSTAS COMENTADAS DAS ATIVIDADES PROPOSTAS

Captulo 1 1. Seguindo as regras de arredondamento, importante sabermos em quantas casas decimais o nmero ser arredondado. Seguem as respostas: 2,36 = 2,4 3,57 = 3,6 4,62 = 4,6 8,81 = 8,8 4,451 = 4,5 5,501 = 5,6 5,55 = 5,6 5,650 = 5,6 2. a. 23,4; 48,9; 120,4; 234,8; 78,8; 130,0; 45,1; 12,4; 200,0 b. 46,73; 253,65; 28,26; 123,84; 299,95; 37,48 c. 27; 68; 128; 50; 68; 39 d. 40; 270; 300; 60; 260; 300; 450; 260; 3000

Unisa | Educao a Distncia | www.unisa.br

67

Regina Maria Sigolo Bernardinelli

Captulo 2 1. Tabela de Frequncia para a varivel Idade (extrada da Tabela 1) Tabela 23 Varivel idade.

Idade: varivel quantitativa discreta.

Observe, atravs da fac, que 90% dos alunos tm idades at 21 anos. 2. a. Populao: 1.000 alunos matriculados. b. Amostragem aleatria simples; Amostra: 150 alunos sorteados 3. Considerando que 200 elementos representam 13% da populao temos que: A: 65; B: 32; C: 57; D: 46; Obs.: Arredondamos para baixo o valor do ltimo item para a soma dar 200, pois se utilizssemos o critrio de arredondamento visto, teramos 201 elementos na amostra. 4. a. Populao: pessoas de 20 anos b. Observe que temos 11.500 pessoas na populao em estudo. As 5.500 mulheres representam 47,8% da populao com 20 anos e os 6.000 homens representam 52,2% da populao com 20 anos. Dessa forma, calculando a quantidade de homens e mulheres de acordo as propores acima descritas e arredondando os dados conforme os critrios estabelecidos, temos: M: 574; H: 626.

68

Unisa | Educao a Distncia | www.unisa.br

Estatstica

5. a. PM: 350; 450; 550; 650; 750; 850; 950; 1050; 1150 fac: 14; 60; 118; 194; 262; 324; 372; 394; 400
f i : 0,04; 0,11; 0,14; 0,19; 0,17; 0,16; 0,12; 0,05; 0,02 f i . 100%: 4; 11; 14; 19; 17; 16; 12; 5; 2

b. 100 horas; c. li = 500; d. ls = 1100; e. PM = 750; f. f i = 0,16; g. 15%; h. 19% Captulo 3 1. a. Qualitativa nominal; Quantitativa contnua; Quantitativa discreta; Qualitativa nominal. b. Quantitativa discreta; Quantitativa discreta; Qualitativa ordinal; Qualitativa ordinal. c. Sim, como quantitativa contnua, pois existe um nmero grande de valores diferentes. Sugesto: iniciar em 0, com amplitude de classe igual a 2. d. Setores; Histograma e Polgono de frequncia; Colunas; Setores; Colunas ou Histograma e Polgono de frequncias; Colunas; Setores ou Colunas; Setores ou Colunas. 2. a. Fisioterapia: quantitativa discreta; Sequelas: qualitativa nominal; Cirurgia: qualitativa ordinal. b. Fisioterapia: grfico de colunas; Sequelas: grfico de setores; Cirurgia: grfico de colunas; c. Grfico de colunas. O nmero de meses de Fisioterapia diminuiu para os pacientes sem sequelas. 4. b. 34% Captulo 4 1. Mdia: 1,56; Mediana: 2; Moda:1 e 2. 2. a. Mdia: 1,88; Mediana:1,8; Moda: 1,5. c. Mdia: 1,93; Mediana:1,8; Moda:1,6 e 1,8. As diferenas no foram grandes. A soluo (a) mais exata. d. O de (c), pois, sem o computador, praticamente impossvel organizar 500 dados brutos.

Unisa | Educao a Distncia | www.unisa.br

69

Regina Maria Sigolo Bernardinelli

3. Mdia: 86,20 bat/min; Varincia: 16,36 (bat/min)2; Desvio padro: 4,04 bat/min. 4. Mdia: 9,85; Varincia: 1,88; Desvio padro: 1,37. 5. No, porque a zona de normalidade est entre 155 cm e 195 cm. 6. a. B, pois o desvio padro menor. b. considerada normal em A, pois a zona de normalidade est entre 35 e 55. Em B, no, pois a zona de normalidade est entre 41,5 e 48,5. 7. a. Mdia: 21,9; b. Desvio Padro:6,34; c. Zona de normalidade: 15,56 a 28,24; d. Sim, pois 28 est dentro da zona de normalidade. 8. No, pois est fora da zona de normalidade. Captulo 5 1. a. Nmeros de casos possveis de E = 5 Mltiplos de 9 entre 1 e 50: (9,18,27,36,45) Nmeros de resultados possveis na experincia: 50 Logo: P(E) = b. Mltiplos de 3 e de 4 (simultaneamente, ao mesmo tempo) , implica ser mltiplo de 12, pois 12 o m.m.c. (menor mltiplo comum) entre 3 e 4. Nmeros de casos possveis de E = 4 Mltiplos de 12 entre 1 e 50: (12, 24, 36, 48) Logo: P(E) =

c) Observe a diferena entre este item e o anterior. Ambos se diferenciam pela partcula OU. Ser mltiplo de 3 ou de 4 significa que servem todos os mltiplos de 3 OU todos os mltiplos de 4. Observe que nesta situao, no h a necessidade de serem mltiplos simultaneamente. Atendendo a uma das condies (ser mltiplo de 3 ou de 4 ) ser suficiente. Ento temos: Mltiplos de 3 entre 1 e 50: (3, 6, 9, 12, 15, 18, 21, 24, 27, 30, 33, 36, 39, 42, 45, 48)

70

Unisa | Educao a Distncia | www.unisa.br

Estatstica

Mltiplos de 4 entre 1 e 50: (4, 8, 12, 16, 20, 24, 28, 32, 36, 40, 44, 48) Nmeros de casos possveis de E = 25 (Observe para no contar os valores em negrito duas vezes) Logo: P(E) =

d) Nmeros primos (nmeros que possuem apenas dois divisores, 1 e ele mesmo) entre 1 e 50: (2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, 37, 41, 43, 47) Nmeros de casos possveis de E = 15 Logo: P(E) =

2. Observe que inicialmente temos na caixa, um total de 200 peas Ento temos a) P(E) = b) P(E) = c) P(E) =

Captulo 6 1. Resoluo: Varivel X: altura, com X ~N ( 170, 25 ); = 170 cm e 2 = 25. a b ) Z P ( a X b) = P (

170 170 165 170 ) = P ( -1< Z < 0 ) (na tabela no exis<Z< a. P ( 165 < X < 170 ) = P ( 5 5 tem valores negativos; pela simetria da curva normal, a rea representada por P ( -1 < Z < 0 ) igual rea representada por P ( 0 < Z < 1 ) = 0,3413 (Tabela da Normal Reduzida) P ( 165 < X < 170 ) = 34,13%.
b. P ( 165 < X < 180 ) = P (

180 170 165 170 ) = P ( -1 < Z < 2 ) = P ( -1 < Z < 0 ) + <Z< 5 5 P (0 < Z < 2 ) = P (0 < Z < 1 ) + P ( 0 < Z < 2 ) (Tabela da Normal Reduzida) = 0,3413 + 0,4772
= 0,8185 P ( 165 < X < 180 ) = 81,85%. Unisa | Educao a Distncia | www.unisa.br

71

Regina Maria Sigolo Bernardinelli

c. P ( 168 < X < 185 ) = P (

185 170 168 170 ) = P ( - 0,4 < Z < 3 ) = P (- 0,4 < Z < 0 ) <Z< 5 5 + P ( 0 < Z < 3 ) = P ( 0 < Z < 0,4 ) + P ( 0 < Z < 3 ) (Tabela da Normal Reduzida) = 0,1554 +
0,4987 = 0,6541 P ( 168 < X < 185 ) = 65,41%

d. P ( X < 160 ) = P ( Z <

160 170 ) = P ( Z < - 2 ) = P ( Z > 2 ) (pela simetria da Normal) 5 P ( Z > 2 ) = 0,5 P ( 0 < Z < 2 ) = 0,5 0,4772 = 0,0228 P ( X < 160 ) =2,28%

180 170 ) = P ( Z > 2 ) = 0,5 P ( 0 < Z < 2 ) = 0,5 0,4772 = 0,0228 e. P ( X > 180 ) = P ( Z > 5 P ( X > 180 ) = 2,28%
f. P ( X > 165 ) = P ( Z >

165 170 ) = P ( Z > - 1 ) = P ( Z < 1 ) (pela simetria da Normal) 5 P ( Z < 1 ) = 0,5 + P ( 0 < Z < 1 ) = 0,5 + 0,3413 = 0,8413 P ( X > 165 ) = 84,13%.

Como so 10.000 alunos, teremos: 10000 . 0,8413 = 8413 alunos o nmero esperado de alunos com altura superior a 165 cm. Captulo 7 Vamos, inicialmente, determinar a mdia e a varincia amostrais. Temos: n = 150

IC ( , ) = [ X z . X ; X + z . X ]
2 2

IC ( , 98%) = [172 2,32 . 0,33 ; 172 + 2,32 . 0,33] IC ( , 98%) = [171,23 cm ; 172,77 cm] = [1,71 m ; 1,73 m] Logo, podemos afirmar com uma certeza de 98% que, apesar de os parmetros populacionais serem desconhecidos, a altura mdia dos homens dessa cidade est compreendida entre 1,71 m e 1,73 m.

72

Unisa | Educao a Distncia | www.unisa.br

Estatstica

Captulo 8 1. a. 0,5000; b. 0,3413; c. 0,8185; d. 0,1574; e. 0,0013; f. 0,0228. 2. a. 0,9938; b. 0,8413; c. 0,0668; d. 0,6826; e. 19,6. 3. a. 0,3289; b. 0,5286. 4. Magros: 116,6 kg; Obesos: 143,4 kg. 5. Mdia: 4,745; [ 3,828; 5,662 ]. 6. [ 0,677; 0,732 ]. 7. IC ( , 95%) = [ 30,26 ; 32,74 ]. 8. 196. 9. 377; 515. 10. a. 0,9835; b. -0,7586; c. -0,736; d. 0,947. 11. 0,9817. 12. IC (, 90%) = [29,34; 30,66]. 13. a. IC (, 95%) = [64,723; 69,278]; b. n = 139.

Unisa | Educao a Distncia | www.unisa.br

73

REFERNCIAS

BUSSAB, W. O.; MORETTIN, P. A. Estatstica bsica. 4. ed. So Paulo: Atual, 1987. CARVALHO, L. R. Apostila de bioestatstica. Botucatu: UNESP, 2000. MAGALHES, M. N.; LIMA, A. C. P. Noes de probabilidade e estatstica. 6. ed. So Paulo: Edusp, 2004. MORETTIN, L. G. Estatstica bsica: inferncia. So Paulo: Pearson Makron Books, 2000. v. 2. NAZARETH, H. R. S. Curso bsico de estatstica. 4. ed. So Paulo: tica, 1991. TOLEDO, G. L.; OVALLE, I. I. Estatstica bsica. 2. ed. So Paulo: Atlas, 1985.

Unisa | Educao a Distncia | www.unisa.br

75

Das könnte Ihnen auch gefallen