Sie sind auf Seite 1von 2

Distribuies (de Probabilidades) Contnuas: baseada na funo de densidade de probabilidade contnua.

Responde perguntas do tipo Quanto tempo vai demorar at o fornecedor entregar a encomenda que fizemos hoje?. A Distribuio Normal (de Gauss) X~(^2): simtrica e tem formato de sino, implicando que a maior parte dos valores tende a se concentrar em torno da mdia aritmtica (=mediana = moda; devido ao seu formato simtrico, as suas medidas de tendncia central so =). Os valores podem se estender de , no entanto, o seu formato torna bem improvvel que ocorram valores extremamente grandes (ou pequenos). Calcular a probabilidade de que vrios valores ocorram dentro de determinadas amplitudes (intervalos). A probabilidade exata de um valor especfico zero ( distribuies discretas). Quando , temos o ponto de mximo. Quando eu aumento , o grfico desloca-se para a direita ( ). Quando eu aumento , o grfico fica mais espalhado. A esperana E(X)= e a varincia V(X)= . O que caracteriza a normal so os parmetros: mdia ( ) e varincia ( ). Ento cuidado, pois o parmetro utilizado pelo Excel o desvio padro ( ). Uso da funo DIST.NORM.N (X; cumulativo) para quando se d o ponto e queremos a rea. Em Cumulativo, se colocar FALSO, calcula o valor da funo; e colocar VERDADEIRO, calcula a rea at aquele ponto (=Integral). Uso da funo INV.NORM.N (probabilidade; ) para quando se d a rea e pedimos o ponto. Outra forma de pensar utilizando a padronizao ( ). Substitumos a primeira funo por DIST.NORMP (Z) e a segunda por Z= INV.NORMP (probabilidade), sendo que como queremos saber X, substitumos o Z encontrado em . Na padronizao temos a varivel aleatria padronizada Z com e . EXERCCIO 1) Na minha fbrica, os macaces esto associados ao peso. Para qual intervalo de peso eu vou ter que fazer macaco, para poder garantir que 90% do pessoal consiga vestir um macaco? A mdia 85Kg e o desvio padro 5Kg. Devemos lembrar que a curva simtrica. Eu tenho que descobrir menor (Xmn) e maior (Xmx) valor de uniforme que eu tenho que fazer. Eu escolho o simtrico, pois o valor menor. Eu poderia aumentar uma ponta e diminuir a outra, mas apesar de dar uma rea de 90%, o intervalo seria maior (=maior custo). Fazendo INV.NORM (5%; 85; 5) e INV.NORM (95%; 85; 5), ento o intervalo de peso ter que ser de [76,78; 93,22]. Outro modo de fazer seria INV.NORM.P (5%)=-1,64 e em seguida X=85-(1,64*5)=76,78. EXERCCIO 2) Qual a probabilidade de ter algum com 100 Kg ou mais? Fao 1-DIST.NORM(100; 85; 5; verdadeiro) = 0,13%. Outro modo de fazer seria Z= (100-85)/5=3 e em seguida 1- DIST.NORMP (3)=0,13%. EXERCCIO 3) a) Encontre a probabilidade de que um domiclio gaste menos do que $25. Possibilidade de no comprar + (a possibilidade de comprar x gastar menos do que 25). b) Encontre a probabilidade de que um domiclio gaste mais do que $50. Probabilidade de comprar x gastar mais do que 50. c) Que proporo dos domiclios gastou entre $30 e $40? d) 99% dos domiclios gastaram menos de qual montante? Para ser menor do que X eu tenho duas opes: no comprar + (comprar x gastar menos do que X) = 99, sendo assim, . Colocando P em evidncia, temos que:
( )

Distribuio Uniforme (ou retangular): cada um dos valores possui igual probabilidade de ocorrncia dentro de . simtrica e consequentemente a mdia aritmtica = mediana = . A rea total dentro do retngulo igual base (1,0) vezes a altura
( )

(1,0)=1, ou seja , a rea abaixo de qualquer funo de densidade de probabilidade igual a 1. A varincia

. Ex.: A P(0,1<X<0,3)=(0,2)(1)=0,2.

Distribuio Exponencial: assimtrica direita, fazendo com que a mdia aritmtica > mediana. A amplitude estende-se de - s possui valores positivos -, e seu formato torna improvvel a ocorrncia de valores extremamente grandes. amplamente utilizada na teoria das filas para modelar a extenso do tempo decorrido entre chegadas em processos que seguem uma distribuio de Poisson. As distribuies exponencial e de Poisson correspondentes possuem o mesmo parmetro. Podemos associar a exponencial a uma distribuio de Poisson, em que o parmetro lambda (), ou seja, numa Poisson, ele corresponde mdia (o tempo entre chegadas). A Poisson tem o significado de ser o nmero de pessoas que chegam em mdia, o valor esperado e a varincia . A exponencial tem o significado de ser o tempo entre a chegada de duas pessoas, a esperana E(T)=1/e a varincia Var(T)=1/(^2). Uso da funo do Excel DISTEXPON (X,, cumulativo), cuidado para no confundir a esperana com o lambda. Ela uma distribuio sem memria, ou seja, a ocorrncia ou no de um evento no afeta a probabilidade de eventos futuros. O tempo que j passou no levado em considerao. EXERCCIO 1) Recebo 20 e-mails por dia e 20% so SPAM (ou seja, 4 SPAMS por dia). Se eu recebo 4 SPAMS por dia, qual o tempo de chegada de SPAM por dia na minha caixa? . Eu recebo SPAMS na minha caixa a cada 6 horas. Qual probabilidade de receber dois ESPAMS e o tempo de . chegada entre eles seja menor do que 6 horas? Pela DISTEXPON (6; 1/6; verdadeiro). *Pensar na POISSON correspondente se a mdia de chegada de 1,2 horas/ chegada. Em um dia em vou ter EXERCCIO 2) A durao de vida de uma lmpada tem distribuio exponencial com durao esperada de 1.000h. Qual a probabilidade de ela durar mais do que 1.000h? P(X>1000) = 1-DISTEXPON (1000; 1/1000; verdadeiro)=37%. EXERCCIO 3) A durao de vida de uma lmpada tem distribuio exponencial com durao esperada de 1.000h. Se ela j durou 1.000h, qual a probabilidade de ela durar mais 1.000h? Tambm ser de 37% (distribuio sem memria). EXERCCIO 4) O tempo de chegada entre clientes de 20 minutos e o tempo de assar de 10 minutos. Qual a probabilidade entre chegadas de clientes seja de 10 a 25 minuto P(10x25)? Fazemos DISTEXPON (25; 1/25; verdadeiro) DISTEXPON (10; 1/25; verdadeiro)=30%. EXERCCIO 5) Se um cozinheiro dormiu no ponto e no colocou os pes de queijo para assar. Dado que se passaram 5 minutos e no chegou ningum, qual a probabilidade de colocar a minha fornada e o prximo cliente chegar entre 10 a 25 minutos? P(10x25/5min) - uma probabilidade condicional, pois dado que no chegou nenhum cliente nos primeiros 5 minutos, qual a probabilidade do cliente chegar entre 10 e 25 minutos? Tambm de 30%. EXERCCIO 6) Qual a probabilidade de chegar um cliente nos primeiros 5 minutos? Fazemos DISTEXPON (5; 1/25/ verdadeiro)=18%. INFERNCIA (=adivinhar) ESTATSTICA: A partir da amostra eu quero identificar coisas da populao (PARMETRO), antes, calculvamos da prpria amostra (ESTATSTICA DESCRITIVA). Pegar os dados da amostra e jogar numa frmula, o estimador, para calcular os dados da populao. O parmetro tem um valor real fixo na populao, mas o estimador deste parmetro segue uma distribuio de probabilidades. Amostra no-probabilstica: voc seleciona os itens ou os indivduos sem conhecer suas respectivas probabilidades de seleo convenincia, velocidade e baixo custo, carecem de preciso (vieses de seleo); *Amostra probabilstica: voc seleciona os itens com base em probabilidades conhecidas permite inferncias isentas de vis amostras sistemtica e simples. Erros em pesquisa: erro de cobertura (vis de seleo incluso/excluso de grupos), erro por falha de resposta

(vis por isso), erro de amostragem (a margem de erro, podemos reduzir com amostras maiores) e erro de medio (orientado pelo conveniente e no pelo que necessrio). A distribuio de amostragens da mdia aritmtica corresponde distribuio das mdias aritmticas de todas as amostras possveis, caso voc selecione todas as possveis de um determinado tamanho. Caractersticas de um bom estimador: Ausncia de vis ()-> a gente quer que o estimador no seja viesado (no tendencioso). Ou seja, um estimador que em mdia ou erra para mais ou para menos. Consistncia (preciso) ( ) -> o meu estimador se torna mais preciso media que o tamanho da minha amostra aumenta dados mais concentrados. O valor do desvio padro de todas as possveis mdias aritmticas de amostras erro padro da mdia expressa o modo como as mdias de amostra variam de amostra para amostra. medida que aumento o tamanho da minha amostra, o erro padro da mdia decresce e o grfico/histograma torna-se cada vez mais normal. Distribuio da mdia amostral: encontrando Z populao (estimador no viesado). O Teorema do Limite Central - ( ) isso acontece quando, (a) se X no normal, n>=30 (precisamos de pelo menos 30 dados para dizer que normal) e (b) X normal. Respeitando isso temos: pelo fato de a mdia aritmtica da amostra ser isenta de vis, a mdia aritmtica de qualquer distribuio de amostragens sempre igual mdia aritmtica da populao. Quaisquer que sejam as distribuies, a soma (e consequentemente a mdia) dessas variveis segue uma distribuio normal. *A inferncia estatstica s vale se sua amostra aleatria. EXERCCIO 1) Suponha que uma grande turma de estatstica tenha normalmente distribudas em torno da mdia 72 e desvio padro 9. (a) Determine a probabilidade de que um estudante selecionado ao acaso tenha nota superior a 80 varivel aleatria -. 1-DIST.NORM.N (80; 72; 9; verdadeiro)=18,7%.(b) Determine a probabilidade de que em uma amostra aleatria de 10 alunos tenha nota mdia superior a 80. 1-DIST.NORM.N (80; 72; 9/raiz(10); verdadeiro)=0,25%. * Quando n=1 no tem diferena entre X e Xbarra, desde que o Teorema de Limite Central valha . EXERCCIO 2) Um telefrico tem capacidade limite de carga de 18.000 libras (esse peso para 100 pessoas), anunciando uma capacidade de 100 passageiros (ento excede a capacidade quando o peso mdio maior do que 180 18000/100). Se os pesos de todas as pessoas que utilizam o telefrico tm mdia de 175 libras e desvio padro de 30 libras, determine a probabilidade de um grupo de 100 pessoas excederem o limite de carga . 1-DIST.NORM.N (180; 175; 30/raiz(100); verdadeiro)=4,8%. EXERCCIO 3) A mquina de empacotar um determinado produto o faz segundo uma distribuio normal com mdia e desvio padro 10g. (a) Em quanto deve ser regulado o peso mdio para que apenas 10% dos pacotes tenham menos do que 500g ? INV.NORMP (10%)=1,28 500=-1,28*10 -> = 500 (1,28*10)=512,8. (b) Com a mquina assim regulada, qual a probabilidade de que o peso total de 4 pacotes escolhidos ao acaso seja inferior a 2 quilos ( 2000/4 = 500 -> olhar o exemplo do telefrico)? P(Xbarra<=500)=DIST.NORM.N (500; 512,8; 10/raiz(4); verdadeiro)=0,518%. *P(X<2000g) = P(Xbarrra<500g). TESTE DE HIPTESES - A hiptese de que o parmetro da populao igual especificao da empresa hiptese nula (Ho) corresponde ao status quo. Embora estejam disponveis apenas informaes oriundas da amostra, a Ho escrita em termos da populao. Se ela for falsa, alguma outra afirmativa deve ser verdadeira hiptese alternativa (Ha) corresponde ao oposto da Ho. Se voc rejeita a Ho, voc tem comprovao estatstica de que a Ha est correta. Se voc no rejeita Ho, voc no conseguiu comprovar a Ha. O fato de no conseguir comprovar a Ha no significa que voc tenha comprovado a Ho. A Ho sempre se refere a um valor especificado para o parmetro da populao (ex.: ) e no a uma estatstica amostral (ex.: Xbarra). A declarao de Ho sempre tem um sinal de igualdade (Ho: m=?) e a Ha nunca (Ha: m>;<; ). Regies de Rejeio: consiste nos valores para a estatstica do teste que so improvveis ocorrer caso a Ho seja verdadeira. Esses valores so mais propensos a ocorrer se a Ho for falsa. Sendo assim, se um valor da estatstica do teste se posiciona nessa regio, voc rejeita a Ho, uma vez que esse valor improvvel caso a Ho seja verdadeira. Para tomar essa deciso quanto a Ho temos que determinar os valores crticos. Se for raro de acontecer eu falo que no devo aceitar a Ho (nvel de confiana do meu teste). ERRO TIPO 1 a Ho (que choveu) verdadeira, s que eu a rejeitei por no ter achado as evidncias corretas ou no foram suficientes. ERRO TIPO 2 eu posso achar que choveu, mas no ) ter chovido de fato; no rejeitamos a Ho, apesar de ser falsa. O nvel de confiana dado por ( . Ho: =368g / Ha: 368g Fonte de evidncias (valor P): Uma probabilidade baixa nos leva a suspeitar que h algo errado. Ou tivemos muita falta de sorte (e pegamos uma amostra incomum) ou H0 est errada! O nvel de significncia ( ) usualmente 5%. Regra de deciso: Valor p < -> rejeita-se H0. Valor p -> no se rejeita H0. Se rejeitarmos H0, qual a probabilidade de cometermos um erro (Tipo I)? Valor P! Teste (Z): Calcula-se um valor crtico (Zc) associado ao nvel de significncia que define a regio de rejeio e no rejeio de H0. Se Zo > Zc -> rejeita-se H0; Se Zo Zc -> no se rejeita H0. Teste unicaudal: se Ha: >o -> a rejeio ser Zo > Zc; se Ha: < o -> a rejeio ser Zo < Zc. Teste bicaudal: Ha: a rejeio ser Zo<Zc1 ou Zo>Zc2. *Nos testes bicaudais, o nvel de significncia (a), dividido entre as caudas. Assim, para a=5%, em um teste bicaudal, os valores crticos so -1,96 e 1,96. INTERVALO DE CONFIANA (IC): Tempos dois tipos de estimao: por ponto e por intervalo. A pergunta que naturalmente surge refere-se a qual valor da . Se sortearmos mdia populacional? No temos uma resposta exata, mas podemos obter uma estimativa intervalar: , em que muitas amostras e calcularmos, para cada uma delas, um intervalo definido por: 95% dos intervalos contero a mdia da populao ().Os intervalos assim obtidos se denominam Intervalos de Confiana. O valor somado e subtrado da media denominado margem de erro (E). uma incerteza sobre a mdia. Eu no estou estimando o X e sim a mdia. A mdia dada vai ser sempre da amostra, caso contrrio no precisaramos do nvel de confiana. O que significa dizer que o intervalo de confiana [1,68; 1,72]? No significa dizer que a altura mdia da populao tem 95% de probabilidade de estar neste intervalo. Significa dizer que, tomando-se vrias amostras e calculando-se intervalos de confiana a partir delas, como fizemos, 95% contero o valor real do parmetro. O meu Z tem haver com a confiana que eu vou ter no meu intervalo. Todo intervalo tem uma coisa chamada de Grau de Confiana ( ). Em que quanto menor o alfa maior o grau de confiana. Podemos diminuir o grau de confiana e dar uma resposta mais PRECISA (pega menos margem de erro, ou seja, o intervalo menor). *Se a varincia for conhecida, usamos a Distribuio Normal, caso no conhea, utilizo a t de Student. A frmula geral igual a da normal. Em vez de Z passamos chamar de t.
( )

e encontrando Xbarra

. O valor esperado dessa distribuio a mdia da

EXERCCIO: Uma amostra de 16

elementos com mdia de 30 e desvio padro (nesse caso da amostra) de 40. Calcule o intervalo de confiana com 95% de confiana. 30+/-t40/raiz(16) INVT(5%;15). O valor do Z e do t no o mesmo. Qual a distribuio mais gorda? A t de Student, pois eu utilizo quando eu tenho que estimar, eu tenho a maior incerteza ( agora eu no conheo nem o nem o z). O intervalo tem que ser mais largo a um mesmo nvel de confiana. *Quanto maior o grau de liberdade, mais o t se aproxima do real.

Das könnte Ihnen auch gefallen