Beruflich Dokumente
Kultur Dokumente
AULA -04
Bolsa de Nova York 10/06/2011
O que ESTATSTICA
Segundo Velleman Estatstica a Cincia de obter concluses a partir de dados. Paul F. Velleman um professor de estatstica na Universidade de Cornell. Professor Paul Velleman tem uma reputao internacional para a educao estatsticas atravs de tcnicas inovadoras.
A Estatstica envolve tcnicas para coletar, organizar, descrever, analisar e interpretar dados, ou provenientes de experimentos, ou vindos de estudos observacionais. Dados => Informaes => Decises
O que ESTATSTICA
Parte de perguntas/desafios do mundo REAL:
Estatsticas financeiras; econmicas aplicadas a econometria um poltico quer saber qual o percentual de eleitores que pretende votar nele nas prximas eleies. a Ford quer verificar a qualidade de um lote inteiro de peas fornecidas atravs de uma pequena amostra. Um produto lanado no mercado esta tendo aceitao?
Mudana de enfoque:
Atividade de estado para aplicao em pesquisa cientfica em geral.
A Estatstica estuda como controlar, minimizar e observar a variabilidade INEVITVEL de todas as medidas e observaes.Sem Mtodos Estatsticos, sem validade cientfica!
4
Empresas
x1 x2 ... xn x n
x x
i 1 i
x n
* i i
onde fi designa a frequncia absoluta de xi* (ou a frequncia absoluta da classe com marca xi* no caso de dados agrupados em classes)
Pontos afastados ou erros nas observaes podem afastar a mdia do grosso das observaes.
7
Moda
X1
X2
X3 ...
Se todos podem ser pesquisados: CENSO Se no, pesquisa-se uma Amostra: subconjunto finito da populao.
10
11
Quartis Disperso
Os Quartis dividem a distribuio dos dados em quatro partes iguais, correspondendo cada uma delas a 25% do total dos dados ordenados, esta separao feita por trs valores Q1,Q2 eQ3 o valor de Q1 esta abaixo dos 25% dos valores da amostra o valor de Q2 coincide com a mediana o valor de Q3 localiza-se abaixo dos 75%.
Exemplo de Quartil
Exemplo 1: Amostra: 6, 47, 49, 15, 42, 41, 7, 39, 43, 40, 36 Amostra ordenada: 6, 7, 15, 36, 39, 40, 41, 42, 43, 47, 49 Q1/4 = 15 Q2/4 = 40 Q3/4 = 43
Graficos Boxplot
Exemplos de Grficos tipo Boxplot
Subdivises da Estatstica
AMOSTRAGEM: tcnicas para obter uma amostra representativa, suficiente e que possa ser generalizada para a populao. ANLISE EXPLORATRIA DE DADOS: tcnicas para resumir, organizar e interpretar os dados, de uma amostra ou da populao, para obter informaes. INFERNCIA ESTATSTICA: tcnicas para generalizar estatisticamente os resultados de uma amostra para a populao. PROBABILIDADE: tcnicas que permitem calcular a confiabilidade das concluses de Inferncia Estatstica.
18
Variveis
So caractersticas observveis em cada elemento pesquisado: medidas, controladas ou manipuladas em uma pesquisa. Cada varivel, para cada elemento pesquisado pode assumir APENAS UM valor em determinado momento Classificao por nvel de mensurao: quantidade de informao.
Qualitativas: nominais, ordinais. Quantitativas: discretas, contnuas.
Classificao por nvel de manipulao: quais so manipuladas (independentes) e quais apenas observadas (dependentes).
19
Probabilidade e Estatstica
Medidas de tendncia central fornecem um resumo parcial das informaes de um conjunto de dados. A necessidade de uma medida de variao aparente, para que nos permita, por exemplo, comparar conjuntos diferentes de valores. Algumas caracterstica desta medida devem ser atendidos como veremos a seguir
Mdidas de Disperso
As medidas de tendncia central pouco ou nada informam a respeito da disperso dos dados. O conceito de medida de disperso relativamente difcil
Medidas de Disperso
O critrio geralmente utilizado aquele que mede a concentrao dos dados em torno da mdia, e algumas medidas so as mais usadas: desvio mdio, varincia, desvio padro e Coeficiente de Variao. Ex: 3, 4, 5, 6, 7 (mdia 5), os desvios xi-x, so: -2, -1, 0, 1 ,2. 1, 3, 5, 7, 9 (mdia 5), os desvios xi-x, so: -4, -2, 0, 2, 4. fcil observar que a soma dos desvios igual a zero, o que torna invivel esta medida. As opes so: a)Considerar o total dos desvios em valor absoluto (mdulo) ou, b)Considerar o total dos quadrados dos desvios. Assim teramos: Para a amostra: 3, 4, 5, 6, 7 = 2 + 1 + 0 + 1 + 2 = 6 (a)
2
= 4 + 1 + 0 + 1 + 4 = 10 (b)
Conceito de Disperso
As medidas de disperso indicam como os valores de um conjunto distribuem-se (dispersam) em relao a seu ponto central (mdia). Quanto maior apresentar-se o intervalo entre os valores extremos de um conjunto, menor a representatividade estatstica da mdia, pois os valores em observao distanciam-se desta medida central. As principais medidas de disperso a serem estudadas neste item, que apresentam larga aplicao prtica na avaliao de risco, so odesvio-padro, a varincia e o coeficiente de variao
Coeficiente de Variao
Enquanto o desvio-padro (e a varincia) mede o grau de disperso absoluta dos valores em torno da mdia, o coeficiente de variao, geralmente expresso em porcentagem, indica a disperso relativa, ou seja, o risco por unidade. Essa medida obtida pela simples relao entre o desvio-padro e a mdia aritmtica da amostra (ou populao), ou seja:
Medida da Varincia
Para as amostras 3, 4, 5, 6, 7 e 1, 3, 5, 7, 9 As varincias seriam: S12 = (3-5)2+ (4-5)2 + (5-5)2+ (6-5)2+ (7-5)2/4 S12 =2,5
S22 = (1-5)2+ (3-5)2+ (5-5)2+ (7-5)2+ (9-5)2/4 =10 A amostra 3, 4, 5, 6, 7 mais homognea.
S22
A varincia uma medida que expressa um desvio quadrtico mdio. A unidade da varincia portanto o quadrado dos dados originais. Ex: para dados expressos em centmetros a varincia ser expressa em centmetros quadrados.
Desvio Mdio
O desvio mdio (DM) refere-se mdia dos desvio em valor absoluto, como na frmula a seguir, aplicada a amostra 3, 4, 5, 6, 7.
DM(x) = 6/5 = 1,2