Sie sind auf Seite 1von 39

Probabilidade e Estatstica

AULA -04
Bolsa de Nova York 10/06/2011

O que ESTATSTICA
Segundo Velleman Estatstica a Cincia de obter concluses a partir de dados. Paul F. Velleman um professor de estatstica na Universidade de Cornell. Professor Paul Velleman tem uma reputao internacional para a educao estatsticas atravs de tcnicas inovadoras.

A Estatstica envolve tcnicas para coletar, organizar, descrever, analisar e interpretar dados, ou provenientes de experimentos, ou vindos de estudos observacionais. Dados => Informaes => Decises

O que ESTATSTICA
Parte de perguntas/desafios do mundo REAL:
Estatsticas financeiras; econmicas aplicadas a econometria um poltico quer saber qual o percentual de eleitores que pretende votar nele nas prximas eleies. a Ford quer verificar a qualidade de um lote inteiro de peas fornecidas atravs de uma pequena amostra. Um produto lanado no mercado esta tendo aceitao?

Mudana de enfoque:
Atividade de estado para aplicao em pesquisa cientfica em geral.

Por que usar Estatstica?


Por que a natureza apresenta VARIABILIDADE:
Variaes de indivduo para indivduo; Variaes no mesmo indivduo;

A Estatstica estuda como controlar, minimizar e observar a variabilidade INEVITVEL de todas as medidas e observaes.Sem Mtodos Estatsticos, sem validade cientfica!
4

Por que usar Estatstica

Tomada de decises Governos Mundiais

Pesquisas de opinio, pesquisas de mercado

Empresas

Previses de curto, mdio e longo prazo Duas disciplinas de Estatstica

Medidas de localizao central: Mdia


Mdia: Numa amostra de n observaes, x1, x2, , xn

x1 x2 ... xn x n

x x
i 1 i

Se os dados estiverem agrupados (k valores distintos)


* * * x1 f1 x2 f 2 ... xn fn x n * x i fi i 1 k

x n

* i i

onde fi designa a frequncia absoluta de xi* (ou a frequncia absoluta da classe com marca xi* no caso de dados agrupados em classes)

Medidas de localizao central: Mdia


A mdia pode ser pensada como o centro de massa dos valores das observaes, ie, o ponto de equilibrio aps dispormos as observaes sobre uma rgua.

Pontos afastados ou erros nas observaes podem afastar a mdia do grosso das observaes.
7

Tendncia Central: Mdia Aritmtica


Clculo da mdia Aritmtica

Medidas de localizao central: Moda


A moda o valor mais frequente de uma amostra. Ao contrrio do que acontece com a mediana e a mdia, uma amostra pode possuir mais do que uma moda.

Moda

Conceito de Populao e Amostra


Populao: conjunto de indivduos com pelo menos uma caracterstica observvel

X1

X2

X3 ...

Se todos podem ser pesquisados: CENSO Se no, pesquisa-se uma Amostra: subconjunto finito da populao.
10

Medidas amostrais mais utilizadas


Localizao relativa:
Mnimo o valor minimo da amostra Mximo o valor maximo da amostra No caso seguinte temos

11

Conceitos de Estatstica Descritiva


Na estatstica descritiva , um quartil qualquer um dos trs valores que divide o conjunto ordenado de dados em quatro partes iguais, e assim cada parte representa 1/4 da amostra ou populao. Assim, no caso duma amostra ordenada, primeiro quartil (designado por Q1/4) = quartil inferior = o valor aos 25% da amostra ordenada = 25 percentil segundo quartil (designado por Q2/4) = mediana = o valor at ao qual se encontra 50% da amostra ordenada = 50 percentil , ou 5 decil . terceiro quartil (designado por Q3/4) = quartil superior = valor a partir do qual se encontram 25% dos valores mais elevados = valor aos 75% da amostra ordenada = 75 percentil diferena entre os quartis superior e inferior chamase amplitude inter-quartil.

Anlise do Coeficiente de Variao


O coeficiente de variao geralmente expresso em percentagem. O C.V. independente das unidades adotadas. Por essa razo, vantajosa para a comparao de distribuies cujas unidades podem ser diferentes. Uma desvantagem do C.V. que ele deixa de ser til quando a mdia esta prximo de zero.
Baixa disperso: CV 15%

Mdia disperso: CV 15-30%


Alta disperso: CV 30%

Conceitos Fundamentais Estatstica Descritiva


Dada uma amostra a amplitude Amplitude = X(mximo)-X(mnimo) = 8- 2 =6

Quartis Disperso
Os Quartis dividem a distribuio dos dados em quatro partes iguais, correspondendo cada uma delas a 25% do total dos dados ordenados, esta separao feita por trs valores Q1,Q2 eQ3 o valor de Q1 esta abaixo dos 25% dos valores da amostra o valor de Q2 coincide com a mediana o valor de Q3 localiza-se abaixo dos 75%.

Exemplo de Quartil
Exemplo 1: Amostra: 6, 47, 49, 15, 42, 41, 7, 39, 43, 40, 36 Amostra ordenada: 6, 7, 15, 36, 39, 40, 41, 42, 43, 47, 49 Q1/4 = 15 Q2/4 = 40 Q3/4 = 43

Graficos Boxplot
Exemplos de Grficos tipo Boxplot

Subdivises da Estatstica
AMOSTRAGEM: tcnicas para obter uma amostra representativa, suficiente e que possa ser generalizada para a populao. ANLISE EXPLORATRIA DE DADOS: tcnicas para resumir, organizar e interpretar os dados, de uma amostra ou da populao, para obter informaes. INFERNCIA ESTATSTICA: tcnicas para generalizar estatisticamente os resultados de uma amostra para a populao. PROBABILIDADE: tcnicas que permitem calcular a confiabilidade das concluses de Inferncia Estatstica.

18

Variveis
So caractersticas observveis em cada elemento pesquisado: medidas, controladas ou manipuladas em uma pesquisa. Cada varivel, para cada elemento pesquisado pode assumir APENAS UM valor em determinado momento Classificao por nvel de mensurao: quantidade de informao.
Qualitativas: nominais, ordinais. Quantitativas: discretas, contnuas.

Classificao por nvel de manipulao: quais so manipuladas (independentes) e quais apenas observadas (dependentes).
19

Objetivos das pesquisas


Em ltima anlise os objetivos das pesquisas consistem em estudar o relacionamento entre variveis na POPULAO. Magnitude e confiabilidade do relacionamento. O nmero de variveis envolvidas, o seu nvel de mensurao, quais so as independentes e as dependentes, o tipo de pesquisa (levantamento, experimento, censo ou amostragem) influenciaro na escolha das tcnicas:
para coletar os dados; para apresentar os dados;
20

Tendncia Central: Mdia Harmnica


Mdia Harmnica de dados agrupados

Clculo da mdia harmnica dos seguintes valores { 2,4,5,7,8,9,12,15}

Tendncia Central: Mdia Harmnica


Mdia Harmnica: O nmero de observaes divido pela soma do inverso dos valores. Para dados no agrupados;

Clculo da mdia harmnica no Excel valores: { 2,4,5,7,8,9,12,15}

Tendncia Central: Mdia Geomtrica


A mdia geomtrica dada tirando se a raiz de ordem n da multiplicao dos valores.

A mdia geomtrica dados agrupados

Calcule a mdia geomtrica dos seguintes valores { 2,4,5,7,8,9,12,15}

Tendncia Central: Mediana


Assim como a mdia, a mediana tambm visa calcular uma tendncia central, A mediana o termo que ocupa a posio central de um conjunto de n Dados ordenados. Exemplo do calculo da mediana com Excel:

Relao entre as Mdias Aritmticas Geomtricas e Harmnica


Para um conjunto de nmeros positivos vale a seguinte relao: Usamos a mdia geomtrica
quando os dados esto em uma progresso geomtrica. exemplo { 2,4,8,16,32,64....1024} o prximo valor o anterior multiplicado por 2 (dois), por exemplo. Mdia Harmnica quando as variveis so inversamente proporcionais tempo e velocidade.

Tendncia Central Mediana


Em teoria da probabilidade e em estatstica, a mediana uma medida de tendncia central, um nmero que caracteriza as observaes de uma determinada varivel de tal forma que este nmero (a mediana) de um grupo de dados ordenados separa a metade inferior da amostra, populao ou distribuio de probabilidade, da metade superior Quando os dados esto ordenados em ordem crescente, e o numero de amostras impar. A mediana dada: Mediana= (N+1)/2

Probabilidade e Estatstica
Medidas de tendncia central fornecem um resumo parcial das informaes de um conjunto de dados. A necessidade de uma medida de variao aparente, para que nos permita, por exemplo, comparar conjuntos diferentes de valores. Algumas caracterstica desta medida devem ser atendidos como veremos a seguir

Mdidas de Disperso
As medidas de tendncia central pouco ou nada informam a respeito da disperso dos dados. O conceito de medida de disperso relativamente difcil

Medidas de Disperso
O critrio geralmente utilizado aquele que mede a concentrao dos dados em torno da mdia, e algumas medidas so as mais usadas: desvio mdio, varincia, desvio padro e Coeficiente de Variao. Ex: 3, 4, 5, 6, 7 (mdia 5), os desvios xi-x, so: -2, -1, 0, 1 ,2. 1, 3, 5, 7, 9 (mdia 5), os desvios xi-x, so: -4, -2, 0, 2, 4. fcil observar que a soma dos desvios igual a zero, o que torna invivel esta medida. As opes so: a)Considerar o total dos desvios em valor absoluto (mdulo) ou, b)Considerar o total dos quadrados dos desvios. Assim teramos: Para a amostra: 3, 4, 5, 6, 7 = 2 + 1 + 0 + 1 + 2 = 6 (a)
2

= 4 + 1 + 0 + 1 + 4 = 10 (b)

Conceito de Disperso
As medidas de disperso indicam como os valores de um conjunto distribuem-se (dispersam) em relao a seu ponto central (mdia). Quanto maior apresentar-se o intervalo entre os valores extremos de um conjunto, menor a representatividade estatstica da mdia, pois os valores em observao distanciam-se desta medida central. As principais medidas de disperso a serem estudadas neste item, que apresentam larga aplicao prtica na avaliao de risco, so odesvio-padro, a varincia e o coeficiente de variao

Desvio padro e Varincia


Desvio e varincia so as mais importantes e utilizadas medidas de disperso. O desviopadro representado por (sigma), quando calculado de dados de uma populao, e por S, quando obtido da amostra (estimativa mdia da populao). Essa medida visa medir estatisticamente a variabilidade (grau de disperso) de um conjunto de valores em relao a sua mdia.

Coeficiente de Variao
Enquanto o desvio-padro (e a varincia) mede o grau de disperso absoluta dos valores em torno da mdia, o coeficiente de variao, geralmente expresso em porcentagem, indica a disperso relativa, ou seja, o risco por unidade. Essa medida obtida pela simples relao entre o desvio-padro e a mdia aritmtica da amostra (ou populao), ou seja:

Neste caso vamos considerar o desvio Amostral e no populacional

Calcule a mdia e o desvio

Repita a mesma tabela

Medida da Varincia
Para as amostras 3, 4, 5, 6, 7 e 1, 3, 5, 7, 9 As varincias seriam: S12 = (3-5)2+ (4-5)2 + (5-5)2+ (6-5)2+ (7-5)2/4 S12 =2,5

S22 = (1-5)2+ (3-5)2+ (5-5)2+ (7-5)2+ (9-5)2/4 =10 A amostra 3, 4, 5, 6, 7 mais homognea.

S22

Medida de Disperso Varincia


A medida que contempla os aspectos da disperso a varincia 2 (letra grega sigma) para populao e s2 para uma amostra. As frmulas para a varincia da populao e da amostra so apresentadas abaixo.

A varincia uma medida que expressa um desvio quadrtico mdio. A unidade da varincia portanto o quadrado dos dados originais. Ex: para dados expressos em centmetros a varincia ser expressa em centmetros quadrados.

Clculo da Varincia de Desvio Padro


Na amostra a raiz da varincia igual ao desvio padro.

Clculos de Varincia de Desvio


Calcule a Varincia e o Desvio da Seguinte Amostra ou Populao ? { 3,5,6,8,9,10,13,16}

Desvio Mdio

O desvio mdio (DM) refere-se mdia dos desvio em valor absoluto, como na frmula a seguir, aplicada a amostra 3, 4, 5, 6, 7.
DM(x) = 6/5 = 1,2

Para a amostra 1, 3, 5, 7, 9 teramos:


DM(x) = 12/5 = 2.4

Medidas de Disperso: Desvio Padro


O desvio padro define-se como a raiz quadrada da varincia. definido desta forma de maneira a dar-nos uma medida da disperso que: seja um nmero no-negativo; use a mesma unidade de medida dos dados fornecidos inicialmente. Faz-se uma distino entre o desvio padro (sigma) do total de uma populao ou de uma varivel aleatria, e o desvio padro s de um subconjunto em amostra. O termo desvio padro foi introduzido na estatstica por Karl Pearson no seu livro de 1894: "Sobre a disseco de curvas de frequncia assimtricas".

Das könnte Ihnen auch gefallen