You are on page 1of 55

Unidade IV

ESTATÍSTICA

Profa. Cristiane Aragão


Noções de teoria de conjuntos

 Conjunto – qualquer coleção de objetos (em matemática:


elementos).
 Elementos pertencem a uma mesma classe (têm algo em
comum, uma característica comum).
 Exemplos: conjuntos de números, pessoas, alunos, letras etc.
 Os conjuntos são representados por uma letra maiúscula e os
seus elementos são apresentados entre chaves {...}.
 Exemplos:
 A = {0, 2, 4, 6, 8, 10}.
 B = {a, e, i, o, u} – conjunto das vogais.
 Um elemento pode pertencer (∈) ou não (∉) a um conjunto:
 𝟎 ∈ 𝑨, 𝐢 ∈ 𝑩, 𝐞 ∉ 𝑨, 𝟖 ∉ 𝑩.
Conjunto vazio, subconjuntos e diagramas de Venn

 Conjunto vazio: sem elementos. Notação: F = { } ou F = ∅.


 Subconjuntos: quando todos os elementos do conjunto A
também pertencem ao conjunto B, dizemos que A é um
subconjunto de B. Exemplo:
 B = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10}.
 A = {1, 3, 5, 7, 9}.
 Diagrama de Venn: figura utilizada para representar um
conjunto (facilita a visualização dos conjuntos e dos
subconjuntos). Exemplo: o diagrama de Venn do conjunto
A = {0, 2, 4, 6, 8} é A
0 2
4 6
8
Operações com conjuntos – diferença

 Diferença: (por exemplo, A = {0, 1, 2, 3} e B = {3, 4, 5, 6}).


 B – A = {4, 5, 6}.
Operações com conjuntos – diferença

 Por exemplo, para A = {0, 1, 2, 3} e B = {3, 4, 5, 6}.


 A – B = {0, 1, 2}.
Operações com conjuntos – interseção
(elementos que pertencem a A e a B)

 Por exemplo, para A = {0, 1, 2, 3} e B = {3, 4, 5, 6}.


 𝑨 ∩ 𝑩 = {𝟑}.
Operações com conjuntos – união
(elementos que pertencem a A ou a B)

 Por exemplo, para A = {0, 1, 2, 3} e B = {3, 4, 5, 6}.


 𝑨 ∪ 𝑩 = {𝟎, 𝟏, 𝟐, 𝟑, 𝟒, 𝟓, 𝟔} (o 3 aparece apenas uma vez).
Conjuntos disjuntos
Conjuntos com elementos comuns

 Se os conjuntos não possuem elementos comuns, eles são


disjuntos. Por exemplo, A = {2, 4, 6, 8} e B = {1, 3, 5, 7}.
 Nesse caso, a união de A com B será um conjunto com 8
elementos 𝑨 ∪ 𝑩 = 𝟏, 𝟐, 𝟑, 𝟒, 𝟓, 𝟔, 𝟕, 𝟖 , ou seja, o número de
elementos de 𝑨 ∪ 𝑩 será:
 𝒏𝑨∪𝑩 = 𝒏𝑨 + 𝒏𝑩 .
 Se os conjuntos possuem elementos comuns, precisamos
descontar os elementos repetidos. Por exemplo, para
A = {0, 2, 4} e B = {0, 1, 3}, a união será 𝑨 ∪ 𝑩 = 𝟎, 𝟏, 𝟐, 𝟑, 𝟒 .
 Então,
 𝒏𝑨∪𝑩 = 𝒏𝑨 + 𝒏𝑩 − 𝒏𝑨∩𝑩 (princípio aditivo).
Diagrama de Venn com os elementos

 A = {0, 2, 4, 6} e B = {0, 1, 2, 3}.

 Conjunto universo ou universo – reúne todos os


elementos considerados no problema.
Diagrama de Venn com os elementos (3 conjuntos)
Exemplo 1
Diagrama de Venn – número grande de elementos

 A construção e a leitura do diagrama perdem a função


prática (excesso de elementos – difícil visualização).
 Muitas vezes, é suficiente indicar o número de elementos em
cada região do diagrama, sem inserir cada um deles no
gráfico. Por exemplo, no cálculo de probabilidades basta
saber a quantidade de elementos.
 Vamos rever o diagrama de Venn do exemplo 1, indicando
apenas a quantidade de dados em cada região, ou seja,
vamos fazer o diagrama com contagem dos elementos.
Diagrama de Venn com contagem de elementos
Diagrama de Venn – aplicação

 Uma pesquisa realizada com estudantes de EAD verificou que


100 alunos possuem e-mail do Gmail, 80 do Hotmail, 20 alunos
possuem Gmail e Hotmail e 40 alunos não possuem nenhum
dos dois. Quantos estudantes participaram da pesquisa? Qual
a probabilidade de um aluno possuir os dois e-mails (Gmail e
Hotmail)?
 Para resolver o exercício, vamos construir o diagrama de
Venn correspondente.
 Primeiro passo: colocar o número de estudantes que
possuem os dois e-mails (elementos comuns). A partir
daí, completamos as outras regiões.
Aplicação – pesquisa sobre e-mails
100 – Gmail (G), 80 – Hotmail (H), 20 – comuns, 40 –
nenhum dos dois

Número de participantes: 80 + 20 + 60 +40 = 200.


𝟐𝟐
Probabilidade P(G e H) = = 0,1 ou 10%.
𝟐𝟐𝟐
Diagrama de Venn – aplicação com 3 conjuntos

 Uma pesquisa realizada com estudantes de EAD verificou que


170 alunos possuem e-mail do Gmail (G), 150 do Hotmail (H),
160 do Yahoo (Y), 40 alunos possuem os três (G, H e Y), 50
possuem G e H, 50 possuem G e Y, 60 possuem Y e H.
Finalmente, 40 alunos não possuem nenhum dos três.
Quantos estudantes participaram da pesquisa? Qual a
probabilidade de um aluno possuir os três e-mails (Gmail,
Hotmail e Yahoo)?
 Para resolver o exercício, vamos construir o diagrama de
Venn correspondente.
 Primeiro passo: colocar o número de estudantes que
possuem os três e-mails (elementos comuns). A partir
daí, completamos as outras regiões.
Aplicação – pesquisa sobre e-mails (2)
170 – G, 150 – H, 160 – Y, 40 – G, H e Y, 50 – G e H,
50 – G e Y, 60 – Y e H, 40 alunos nenhum dos três

Total: 110 + 10 + 10 + 40 + 20 + 80 + 90 + 40 = 400.


𝟒𝟎
Probabilidade P(G, H e Y) = = 0,1 ou 10%.
𝟒𝟎𝟎
Interatividade

Uma pesquisa feita com universitários constatou que 110


alunos acessam as redes sociais por meio do computador, 130
estudantes utilizam seus smartphones com esse propósito, 50
alunos utilizam computador e smartphone e 10 alunos não
utilizam nenhum dos dois. Quantos universitários participaram
da pesquisa? Qual a probabilidade de um aluno utilizar apenas o
smartphone para acessar as redes sociais?
a) 200 e 0,3.
b) 200 e 0,4.
c) 200 e 0,25.
d) 300 e 0,3.
e) 300 e 0,4.
Propriedades das probabilidades

 Eventos complementares – os eventos E e E’ (“E linha”) são


complementares quando o evento E’ engloba todos os
resultados possíveis em um espaço amostral que não fazem
parte do evento E.
 Quando os eventos são complementares:
 P(E) + P(E’) = 1 ou P(E) + P(não E) = 1.
 Chamando P(E) = p (probabilidade de ocorrência ou sucesso)
e P(não E) = q (probabilidade de não ocorrência ou
insucesso): p + q = 1 ou seja, q = 1 – p.
 Exemplo: Lançamento de um dado – probabilidade de dar um
número ≥ 5 é p = 2/6 (E = {5, 6}). A probabilidade de não dar
𝟐 𝟒
um número ≥ 5 (ou seja, dar um número < 5) é q = 1 - = .
𝟔 𝟔
(E’ = {1, 2, 3, 4}).
Regra da adição – P(A ou B)

 Probabilidade de que ocorra o evento A ou o evento B,


P(A ou B), é dada por:
 P(A ou B) = P(A) + P(B) – P(A e B).
 Se A e B são eventos mutuamente exclusivos, isto é, não
podem ocorrer ao mesmo tempo, P(A e B) = 0. Nesse caso:
 P(A ou B) = P(A) + P(B).
 mutuamente exclusivos não mutuamente exclusivos
Regra da adição – aplicação (pesquisa sobre e-mails)
100 – Gmail (G), 80 – Hotmail (H), 20 – comuns, 40 –
nenhum dos dois. Total: 200 participantes (já visto)

 Qual é a probabilidade de um estudante ter e-mail do Gmail ou


do Hotmail?
 Eventos não são mutuamente exclusivos (há elementos
comuns). Então,
 P(G ou H) = P(G) + P(H) – P(G e H)
𝟏𝟏𝟏 𝟖𝟖 𝟐𝟐 𝟏𝟏𝟏
 P(G ou H) = + − = , ou seja, P(G ou H) = 0,8.
𝟐𝟐𝟐 𝟐𝟐𝟐 𝟐𝟐𝟐 𝟐𝟐𝟐
 Como sabemos o número de alunos:
𝟐𝟐𝟐−𝟒𝟒 𝟏𝟏𝟏
 P(G ou H) = = .
𝟐𝟐𝟐 𝟐𝟐𝟐
 Porém: precisamos utilizar essa propriedade quando temos
apenas as probabilidades (sem o número total).
Regra da multiplicação – P(A e B)

 A probabilidade de que dois eventos A e B ocorram (em


sequência) é:
 P(A e B)= P(A).P(B|A)
 com P(A)>0 e P(B|A) é a probabilidade condicional
(probabilidade do evento B ocorrer, dado que A já ocorreu).
 Para calcular P(B|A), procedemos como se os resultados
pertencentes ao evento A formassem um novo espaço
amostral, ou seja, precisamos levar em conta apenas os
resultados do evento B que fazem parte do evento A. Quando
A e B são eventos independentes, a ocorrência do evento A
não afeta a probabilidade do evento B. Ou seja, quando A e B
são independentes P(B|A) = P(B). Nesse caso,
 P(A e B) = P(A).P(B).
Regra da multiplicação – aplicação

 A biblioteca de um campus da UNIP constatou que apenas um


aluno a cada 10 estudantes retira um livro emprestado para
seus estudos. Verificou também que 60% dos estudantes que
consultam a biblioteca são mulheres. Qual a probabilidade de
um estudante que utiliza a biblioteca seja homem e retire um
livro?
 Os eventos são independentes.
 P(H) = 1 – P(M), então, P(H) = 1 – 0,6, ou seja, P(H) = 0,4
 P(1 livro) = 1/10 ou P(1 livro) = 0,1.
 Probabilidade de que seja homem e retire um livro:
 P(H e 1 livro) = P(H).P(1 livro). Portanto, P(H e 1 livro) = 0,4*0,1
 P(H e 1 livro) = 0,04 ou 4%.
Análise combinatória
Princípio Fundamental da Contagem

 Análise combinatória – realiza a contagem do número de


eventos em um dado acontecimento. Estuda o número de
possibilidades, modos, maneiras de uma dada situação
ocorrer.
Princípio da multiplicação ou Princípio Fundamental da
Contagem:
 Se um evento é composto de k etapas sucessivas e
independentes umas das outras, sendo 𝒏𝒊 o número de modos
da etapa i acontecer, o número de maneiras do evento
acontecer é dado por
𝒏𝟏 . 𝒏𝟐 . 𝒏𝟑 . 𝒏𝟒 . … . 𝒏𝒌 .
Exemplo: senha de acesso

 Uma senha de acesso a um cofre consiste em uma letra e três


dígitos. Quantas senhas podemos formar?
 4 etapas – posições:
____ ____ ____ ____
Letra nº nº nº

 26 letras (de A a Z, incluindo K, Y e W)


 nº: de 0 a 9 (10 possibilidades)
 Usando o Princípio Fundamental da Contagem:
26 . 10 . 10 . 10 = 26.000
Permutações

 Agrupamentos em que todos os elementos de um conjunto


são utilizados e em que a ordem é importante, ou seja,
mudando um elemento de posição, temos um novo
agrupamento.
 Exemplo: anagramas. Um anagrama de uma palavra é
qualquer ordenação de suas letras. Quantos anagramas tem a
palavra livro?
 Temos cinco letras, sem repetição. Cada uma delas ocupará
uma das cinco posições do anagrama. Na primeira, temos
cinco opções (l, i, v, r, o). Uma vez escolhida a primeira letra,
restam 4 para a segunda posição. Do mesmo modo, tendo
escolhido a letra da segunda posição, sobram 3 para a terceira
posição, 2 para a quarta posição e 1 para a quinta.
Permutações – fatorial de um número

 Ou seja,
____ ____ ____ ____ ____
5 4 3 2 1
 𝑷𝟓 = 𝟓. 𝟒. 𝟑. 𝟐. 𝟏 = 𝟏𝟏𝟏.
 Fatorial de um número (inteiro e positivo) – indicado por um
ponto de exclamação após o número:
 n! = n.(n - 1).(n - 2).(n - 3). ... .1.
 Exemplo anterior: 5! = 5.4.3.2.1 = 120.
 4! = 4.3.2.1 = 24.
 0! = 1 (a partir das propriedades).
 Assim, o número de permutações é 𝑷𝒏 = 𝒏!.
𝒏!
 Para permutações com repetições: 𝑷𝒂,𝒃,𝒄…
𝒏 = .
𝒂!𝒃!𝒄!…
Arranjos

 Agrupamentos em que alguns elementos do conjunto são


utilizados e em que a ordem é importante.
 Dez ciclistas participam de uma corrida. De quantas maneiras
eles podem terminar em primeiro, segundo ou terceiro lugar?
____ ____ ____
10 9 8
 10.9.8 = 720 maneiras.
𝒏!
 Número de arranjos: 𝑨𝒏,𝒑 = , sendo n o número total de
𝒏−𝒑 !
elementos e p o número de posições do agrupamento. Para o
exemplo dado:
𝟏𝟏! 𝟏𝟏.𝟗.𝟖.𝟕!
 𝑨𝟏𝟏,𝟑 = ⇒ 𝑨𝟏𝟏,𝟑 =
𝟏𝟏−𝟑 ! 𝟕!
 𝑨𝟏𝟏,𝟑 = 𝟏𝟏. 𝟗. 𝟖 ⇒ 𝑨𝟏𝟏,𝟑 = 𝟕𝟕𝟕.
Combinações

 Agrupamentos em que alguns elementos do conjunto são


utilizados e em que a ordem não é importante.
𝒏!
 Número de combinações: 𝑪𝒏,𝒑 = .
𝒑! 𝒏−𝒑 !
 Uma turma de ADS possui 20 alunos. Quantos grupos de 5
alunos podemos formar para o PIM? A ordem não é
importante, portanto, temos combinações.
𝟐𝟐! 𝟐𝟐! 𝟐𝟐.𝟏𝟏.𝟏𝟏.𝟏𝟏.𝟏𝟏.𝟏𝟏!
 𝑪𝟐𝟐,𝟓 = ⇒ 𝑪𝟐𝟐,𝟓 = ⇒ 𝑪𝟐𝟐,𝟓 =
𝟓! 𝟐𝟐−𝟓 ! 𝟓!𝟏𝟏! 𝟓!𝟏𝟏!
𝟐𝟐.𝟏𝟏.𝟏𝟏.𝟏𝟏.𝟏𝟏
 𝑪𝟐𝟐,𝟓 = ⇒ 𝑪𝟐𝟐,𝟓 = 𝟏𝟏. 𝟓𝟓𝟓 grupos.
𝟓.𝟒.𝟑.𝟐.𝟏
Interatividade

Uma senha de acesso a um cofre consiste em uma letra (de A a


Z, incluindo K, Y e W) e três dígitos distintos. Quantas senhas
podemos formar?
a) 18.720.
b) 26.000.
c) 23.000.
d) 16.560.
e) 78.
Distribuições de probabilidade
Variáveis aleatórias

 Distribuições de probabilidade – modelos estatísticos –


descrever como as probabilidades se distribuem, podendo
estar associadas a cada valor da variável aleatória ou a
intervalos de valores (universo ou espaço amostral – conjunto
de todos os resultados possíveis do experimento).
 Distribuição de probabilidades – modelo probabilístico
apresentado em termos de uma variável aleatória.
 A variável x é aleatória quando é determinada pelo acaso
(experimentos aleatórios). Exemplos: números sorteados,
lançamento de moeda, número de acessos a um site etc.
 A variável aleatória pode ser discreta ou contínua.
 Variável aleatória discreta – conseguimos enumerar todos os
seus possíveis resultados (número finito). Exemplo:
número de mensagens na caixa de entrada de e-mail.
Variáveis aleatórias – tipos de distribuições

 Variável aleatória contínua – não conseguimos enumerar


os seus possíveis resultados (número incontável – conjunto
infinito). Exemplo: perda de peso durante uma dieta alimentar.
 Quando a variável aleatória é discreta, a distribuição de
probabilidades também será discreta (probabilidades
associadas a cada um dos valores possíveis). Há vários
tipos de distribuições discretas, estudaremos apenas a
distribuição binomial.
 Quando a variável aleatória é contínua, a distribuição de
probabilidades também será contínua (probabilidades
associadas aos intervalos possíveis). Veremos, neste curso,
a distribuição normal.
Distribuição binomial

Utilizamos a distribuição binomial quando a variável aleatória é


discreta e o experimento possui as seguintes características:
 é repetido n vezes (há n eventos);
 os eventos são independentes entre si (a ocorrência de um
não altera a probabilidade do outro);
 há somente dois resultados possíveis e complementares para
cada evento: sucesso (ou sim) e insucesso (ou
não/fracasso/falha);
 Para um evento: P(sucesso) = p, P(insucesso) = q
 p + q = 1, logo, q = 1 – p;
 a probabilidade p é a mesma para cada evento;
 a variável aleatória x = número de sucessos nos n eventos.
Distribuição binomial

 Fórmula geral de probabilidade binomial:


𝒏!
𝑷 𝒙 = . 𝒑𝒙 . 𝒒𝒏−𝒙 ,
𝒙! 𝒏−𝒙 !
𝒏!
sendo 𝑪𝒏,𝒙 = , o número de combinações (a ordem não
𝒙! 𝒏−𝒙 !
importa). 𝑪𝒏,𝒙 também pode ser representado pelo binômio de
Newton (daí o nome da distribuição):
𝒏 𝒏!
= .
𝒙 𝒙! 𝒏 − 𝒙 !
Substituindo q = 1 - p, temos:
𝒏
𝑷 𝒙 = . 𝒑𝒙 . (𝟏 − 𝒑)𝒏−𝒙 .
𝒙
� = 𝒏. 𝒑; desvio padrão: 𝝈 = 𝒏. 𝒑. 𝒒.
Média: 𝒙
Distribuição binomial – aplicação

 Uma equipe de TI verificou que 10% dos 10 computadores de


uma empresa apresentam problemas recorrentes. Qual é a
média dos computadores com problemas? Qual é a
probabilidade de não haver computadores com problemas
acima da média?
� = 𝒏. 𝒑 ⇒ 𝒙
 n = 10, p = 0,1, portanto, 𝒙 � = 𝟏𝟏. 𝟎, 𝟏 ⇒ 𝒙
� = 𝟏.
 p = 0,1 (sucesso), logo, q = 1 – p será q = 1 – 0,1, ou seja,
q = 0,9 (insucesso).
 Para que não haja computadores com problemas acima da
média (𝒙� = 𝟏), x pode ser 0 ou 1, ou seja, precisamos calcular
P(0) e P(1), usando 𝑷 𝒙 = 𝒏𝒙 . 𝒑𝒙 . (𝟏 − 𝒑)𝒏−𝒙 e somar as
probabilidades obtidas.
Distribuição binomial – aplicação (continuação)

 n = 10; p = 0,1; q = 0,9.


𝒏! 𝟏𝟏!
 𝑷 𝒙 = . 𝒑𝒙 . 𝒒𝒏−𝒙 ⇒ 𝑷 𝒙 = 𝟎, 𝟏𝒙 . 𝟎, 𝟗𝟏𝟏−𝒙 .
𝒙! 𝒏−𝒙 ! 𝒙! 𝟏𝟏−𝒙 !
𝟏𝟏!
 𝑷 𝟎 = . 𝟎, 𝟏𝟎 . 𝟎, 𝟗𝟏𝟏−𝟎 ⇒ 𝑷 𝟎 = 𝟎, 𝟗𝟏𝟏 = 𝟎, 𝟑𝟑𝟑𝟑.
𝟎! 𝟏𝟏−𝟎 !
𝟏𝟏!
 𝑷 𝟏 = . 𝟎, 𝟏𝟏 . 𝟎, 𝟗𝟏𝟏−𝟏 ⇒ 𝑷 𝟏 = 𝟎, 𝟗𝟗 = 𝟎, 𝟑𝟑𝟑𝟒.
𝟏! 𝟏𝟏−𝟏 !
 P(0) + P(1) = 0,3487 + 0,3874 = 0,7361 ou, aproximadamente,
74% de probabilidade do número de computadores com
problema não ser maior do que a média (𝒙 � = 𝟏). Ou seja, há
uma probabilidade de quase 26% de haver um número de
computadores com problema maior do que a média.
Distribuição de probabilidade binomial – gráfico
(alto grau de segurança: máximo de 3 computadores)

Distribuição de probabilidades
0,45
0,4
0,35
0,3
0,25
P(x)

0,2 Distribuição de
0,15 probabilidades

0,1
0,05
0
0 1 2 3 4 5 6 7 8 9 10
Número de computadores com problemas (x)
Distribuição uniforme de probabilidades

 Para um número n muito grande, podemos aproximar a


distribuição binomial (variável discreta) por uma distribuição
normal (variável contínua).
 f(x) é uma função contínua de probabilidade para a variável
aleatória contínua X se:
 a área total sob f(x) é igual a 1;
 𝒇 𝒙 ≥ 𝟎, para todo 𝒙 ∈ (−∞, ∞).
 Para calcular a probabilidade de X estar em um dado intervalo,
precisamos calcular a área sob a função de probabilidade.
 Quando a distribuição de probabilidades é uniforme, todos os
valores têm a mesma probabilidade de ocorrer.
Distribuição uniforme – gráfico

 Área = 0,25 . 4 = 1 (base*altura do retângulo).


Distribuição normal de probabilidades
(distribuição gaussiana)

 Uma das mais importantes em Estatística.


 Variável aleatória contínua (intervalos de valores).
 Propriedades:
 a distribuição depende somente da média (𝒙 �) e do desvio-
padrão (σ). A média indica a posição central da curva e é o
valor mais provável, o desvio-padrão indica como a
distribuição varia;
 curva chamada normal, tem forma de sino e é simétrica em
torno da média;
 área total sob a curva é igual a 1;
 conforme a curva se distancia da média, ela se aproxima cada
vez mais do eixo x, mas nunca o toca.
Distribuição normal

∑ 𝒙𝒊 𝟐 ∑(𝒙−𝒙� )𝟐 𝟐
�=
 𝒙 ; 𝝈 = ; 𝝈= 𝝈𝟐 .
𝑵 𝑵
 A função de probabilidade normal (função densidade) é dada
por
� )𝟐
−(𝒙−𝒙
𝟏
 𝒇 𝒙 = 𝒆 𝟐𝝈𝟐 .
𝝈 𝟐𝟐
�, e σ = 1):
 Distribuição normal padrão (𝒛 = 𝟎 quando 𝐱 = 𝒙
utiliza a variável z dada por

𝒙−𝒙
 𝒛= (indica o número de desvios-padrão de um
𝝈
valor a partir da média).
 Substituindo em f(x):
−𝒛 𝟐
𝟏
 𝒇 𝒛 = 𝒆𝟐 .
𝟐𝟐
Distribuição normal padrão – gráfico (curva gaussiana)
Interatividade

Analise as seguintes afirmações feitas sobre a distribuição


normal de probabilidades:
I. É uma distribuição discreta, pois a variável aleatória é
discreta.
II. Para obter a probabilidade, é necessário calcular um
binômio de Newton.
III. Depende somente da média e do desvio-padrão.
IV. O desvio-padrão indica a posição central da curva e a média
indica como a distribuição varia.
V. A curva é chamada de normal, tem forma de sino e é
simétrica em torno da média.
Interatividade

Estão corretas:
a) I, II e III.
b) III, IV e V.
c) III e V.
d) I e II.
e) I e V.
Distribuição normal padrão (ou padronizada)

 Utilizar o valor z e a tabela normal padrão (dá a área sob a


gaussiana em função do valor de z) para obter a área da curva
no intervalo de interesse. A probabilidade corresponde à área
obtida.
 Observação: a tabela a seguir apresenta a área da curva
normal reduzida de 0 a z (ou seja, a área correspondente ao
intervalo entre 0 e o valor de z obtido).
Tabela da distribuição normal reduzida de 0 a z

Z 0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09


0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359
0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753
0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141
0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517
0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879
0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224
0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549
0,7 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852
0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133
0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389
1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621
1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830
1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015
1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177
1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319
1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441
1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545
1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633
1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706
1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767
Tabela (continuação)

2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817
2,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857
2,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890
2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916
2,4 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936
2,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952
2,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964
2,7 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974
2,8 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981
2,9 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986
3,0 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990
3,1 0,4990 0,4991 0,4991 0,4991 0,4992 0,4992 0,4992 0,4992 0,4993 0,4993
3,2 0,4993 0,4993 0,4994 0,4994 0,4994 0,4994 0,4994 0,4995 0,4995 0,4995
3,3 0,4995 0,4995 0,4995 0,4996 0,4996 0,4996 0,4996 0,4996 0,4996 0,4997
3,4 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4998
3,5 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998
3,6 0,4998 0,4998 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,7 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,8 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,9 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,0050
Exemplo – troca de celular entre 1 ano e 1 ano e meio

 Exemplo: Uma pesquisa feita com os estudantes de EAD


revelou que, em média, um estudante troca seu celular a cada
1 ano e meio, com desvio-padrão de 0,5. Qual a probabilidade
de que um aluno troque seu celular entre um ano e um ano e
meio de uso?
𝒙−𝒙�
 𝒛= � = 𝟏, 𝟓 e 𝝈 = 𝟎, 𝟓. Para os valores 𝒙𝟏 = 𝟏 e
com 𝒙
,
𝝈
𝒙𝟐 = 𝟏, 𝟓 temos, respectivamente,
𝟏−𝟏,𝟓 𝟏,𝟓−𝟏,𝟓
 𝒛𝟏 = ⇒ 𝒛𝟏 = −𝟏 e 𝒛𝟐 = ⇒ 𝒛𝟐 = 𝟎.
𝟎,𝟓 𝟎,𝟓
 O gráfico a seguir indica os dois valores de z na gaussiana.
Gaussiana do exemplo – troca de celular entre 1 ano e
1 ano e meio (𝒛𝟏 = −𝟏 e 𝒛𝟐 = 𝟎)

 Por simetria, a área


entre z = -1 e z = 0 é
igual à área entre
z = 0 e z = 1.
 Utilizando a tabela
vista anteriormente,
obtemos a área para
z = 1:
 A(1,0) = 0,3413.
 Para z = 0, A(0) = 0.
 A área é 0,3413 e a
probabilidade é
P = 0,3413.
Inferência e estimação – definições úteis

 População – é o conjunto com todos os elementos estudados


pelo pesquisador.
 Amostra – é um conjunto formado por uma parte da
população e é estudado para se conhecer características da
população. Precisa representar bem a população.
 População finita (número limitado de elementos) ou infinita
(número ilimitado de elementos).
 Censo – estudo realizado com a população. Vantagem:
precisão. Desvantagens: custos e tempo (geralmente).
 Amostragem – estudo realizado com uma amostra da
população. Vantagens: custos e tempo, variedade e
profundidade das informações coletadas em relação ao censo,
testes destrutivos, testes de novos tratamentos na medicina.
Técnicas de amostragem

 Amostras probabilísticas – os elementos são escolhidos de


maneira aleatória (sorteio). Estudos econômicos e sociais.
 Amostras não probabilísticas (não aleatórias) – elementos
escolhidos intencionalmente. Estudos médicos.
Técnicas probabilísticas:
 Amostragem aleatória simples – sortear os elementos
aleatoriamente (mesma probabilidade).
 Amostragem estratificada – leva em conta diferenças entre os
estratos, mantendo proporções presentes na população
também na amostra que a representa.
Técnicas não probabilísticas:
 Amostragem acidental – exemplo: pesquisas de opinião (rua).
 Amostragem intencional – critérios preestabelecidos.
Distribuições amostrais

 Distribuição amostral – conjunto completo com todas as


amostras possíveis para um dado número de elementos.
 A média da distribuição amostral (𝝁𝒙� ) é igual à média da
população (𝝁), ou seja, 𝝁𝒙� = 𝝁. Quando o número de dados é
muito grande, a distribuição dos valores das médias das
amostras aproxima-se da curva normal e a distribuição fica
em torno da média populacional.
 O desvio-padrão das médias é dado por
𝝈
 𝝈𝒙� =
𝒏
 o que significa que quanto maior a dispersão na população,
maior será o desvio-padrão das médias. Por outro lado,
quanto maior for a amostra, menor será 𝝈𝒙� .
Estimação

 Como estimar a confiabilidade de valores obtidos por meio de


uma amostragem?
 Exemplo: média.
 (média obtida) – (média para a população) = erro, ou seja,
�−𝝁=𝒆⇒𝝁=𝒙
 𝒙 � − 𝒆.
 O erro estimado é
𝒛.𝝈
 𝒆=
𝒏
 e z é a grandeza que usamos para determinar áreas sob a
curva gaussiana (distribuição normal padrão). Antes, a partir
do valor encontrado para z, encontrávamos a área
correspondente com o auxílio da tabela, agora, escolhemos a
probabilidade (a área) e obtemos o valor de z associado.
Intervalos de confiança

 Tendo encontrado z, substituímos seu valor na expressão do


𝒛.𝝈
erro 𝒆 = e, então, encontramos o intervalo.
𝒏
 Aplicação: Uma pesquisa verificou que os funcionários de
uma empresa levam, em média, 2h para ir de casa para o
trabalho, com desvio-padrão de 0,5h, a partir de uma amostra
com n = 100.
 O erro é dado por e = 0,05*z. A tabela a seguir apresenta os
resultados.
Confiança z e Intervalo
90% 1,65 0,0825 1,9175 a 2,0825
95% 1,96 0,0980 1,9020 a 2,0980
99% 2,58 0,1290 1,8710 a 2,1290
Interatividade

Uma pesquisa sobre e-mails constatou que cada usuário recebe,


em média, 20 mensagens de spam por dia, com desvio-padrão
de 5, a partir de uma amostra com n = 100. Podemos afirmar
que:
a) O erro é dado por 𝒆 = 𝒛⁄𝟐 e quanto maior a confiança, menor
será o seu valor.
b) O erro é dado por 𝒆 = 𝟐 ∗ 𝒛 e quanto maior a confiança, maior
será o seu valor.
c) O erro é dado por 𝒆 = 𝟐 ∗ 𝒛 e quanto maior a confiança,
menor será o seu valor.
d) O erro é dado por 𝒆 = 𝒛⁄𝟐 e quanto maior a confiança, maior
será o seu valor.
e) Nenhuma das alternativas anteriores.
ATÉ A PRÓXIMA!