Sie sind auf Seite 1von 60

ESTADSTICA

Laestadsticaes unaciencia formaly


una herramienta que estudia el uso y
los anlisis provenientes de una
muestra representativa de datos,
busca explicar las correlaciones y
dependencias de un fenmeno fsico o
natural, de ocurrencia en
formaaleatoriaocondicional .

La Estadstica se divide en dos


grandes reas:

Estadstica

descriptiva.
Estadstica
Inferencial.

Estadstica Descriptiva
Se dedica a la descripcin,
visualizacin y resumen de datos
originados a partir de los
fenmenos de estudio. Los datos
pueden ser resumidos numrica o
grficamente. Ejemplos bsicos
deparmetros estadsticos son:
lamediay ladesviacin estndar.
Algunos ejemplos grficos
son:histograma,pirmide

Estadstica Inferencial

comprende los mtodos y


procedimientos que por
medio de la induccin
determina propiedades de
unapoblacin estadstica,
a partir de unapequea
partede la misma.

Algunos trminos utilizados


Poblacin: conjunto de todos los

individuos (personas, objetos,


animales, entre otros) que
aporten informacin sobre el
fenmeno que se estudia.
Muestra: subconjunto de la
poblacin seleccionado de
acuerdo con un criterio, y que sea
representativo de la poblacin.

Algunos trminos utilizados


Variable: fenmeno que puede tomar

diversos valores. Y pueden ser de dos


tipos:
Variables cualitativas o por atributos.
stas no se pueden medir
numricamente.
Variables cuantitativas. stas tienen
un valor numrico.
stas se clasifican en Discretas y
Continuas.

Algunos trminos utilizados


Datos: caractersticas o

nmeros que son


recolectados por
observacin.
Datos cualitativos
Datos cuantitativos
Datos cronolgicos
Datos geogrficos

Distribucin de frecuencias
Se le llama as a la agrupacin de datos
en categoras mutuamente excluyentes
que indican el nmero de observaciones
en cada categora.1Esto proporciona un
valor aadido a la agrupacin de datos. La
distribucin de frecuencias presenta las
observaciones clasificadas de modo que
se pueda ver el nmero existente en cada
clase. Estas agrupaciones de datos suelen
estar agrupadas en forma de tablas.

Distribucin de frecuencias para


datos agrupados
Es una ordenacin tabulada de los
datos recopilados en una
investigacin o estudio, de acuerdo
a la clase o intervalo a que
pertenece y con el nmero de
veces o frecuencias que se repite.
Una distribucin de frecuencias se
represente por medio de tablas de
frecuencia y grficas.

Pasos para elaborar una


distribucin de frecuencias
1. Ordenar los datos de forma ascendente o
2.
3.

4.
5.

6.

viceversa.
Determinar el rango de la serie de datos, R
R= Xn X1
Encontrar el nmero de clases o intervalos
de clases K, segn la frmula de Sturges:
K = 1 + 3.322(log N)
Determinar la amplitud de la clase C
C = R/K
Hacer la tabla
Grficar

Medidas de ms empleo en el
anlisis estadstico:

Medidas de tendencia

central.
Medidas de dispersin.
Medidas de agudez y
asimetra

Medidas de tendencia central


Corresponden a valores que
generalmente se ubican en la parte
central de un conjunto de datos.
Ellas permiten analizar los datos
entorno a un valor central. Entre
stas estn:
La media aritmtica
La moda
La Mediana

Medidas de dispersin
Llamadas tambin medidas de
variabilidad, muestran la
variabilidad de una distribucin,
indicando por medio de un
nmero, si las diferentes
puntuaciones de una variable
estn alejadas de la media.

Entre ellas se tiene:


Rango o recorrido
Desviacin media
Varianza
Desviacin tpica

Medidas de asimetra
Son indicadores que permiten
establecer elgrado de simetra(o
asimetra) que presenta
unadistribucin de probabilidad de
unavariable aleatoriasin tener que
hacer su representacin grfica.

Regresin y correlacin

Probabilidad
Es la posibilidad de que ocurra
determinado evento, y sirve para
tomar decisiones en una situacin
de incertidumbre.

Espacio Muestral

Es el conjunto de todos
los resultados posibles
de un experimento
estadstico y se le
representa por el
smbolo S.

Ejemplo:

Conteo de puntos muestrales


Regla de la multiplicacin o

principio fundamental del conteo:


S una operacin puede realizarse
en n1 formas, y si por cada una de
estas una segunda operacin
puede llevarse a cabo en n2
formas, entonces las dos
operaciones pueden realizarse
juntas en n1*n2 formas.

Probabilidad de un evento
La probabilidad de un evento A es la

suma de los pesos (probabilidades) de


todos los puntos muestrales de A. Por
lo tanto,
0 P(A) 1 ,
P() = 0 y
P(S) = 1

Teorema
Si un experimento puede tener

cualquiera de N resultados
diferentes igualmente factibles, y si
exactamente n de estos resultados
corresponden al evento A, entonces
la probabilidad de este ltimo es:
P (A) = n/N

Reglas aditivas
A veces es ms fcil calcular la probabilidad
de algn evento a partir de otros, s el evento
en cuestin puede representarse como la
unin o complemento de otro evento.
S A y B son dos eventos cualquiera,
entonces
P(A B) = P(A) + P(B) P(A B )
S A y B so mutuamente excluyentes,
entonces
P ( A B ) = P (A ) + P ( B ) ,
De igual forma si hubiese ms de dos eventos

Para 3 eventos A, B y C

P ( A B C ) =
P(A) + P (B) + P ( C ) P (A B ) P
(A C ) P (B C) + P (A B
C )

Eventos complementarios
S A y A` son eventos
complementarios entonces
P (A) + P(A`) = 1

Probabilidad condicional
Sea A la probabilidad de que un evento

B se d cuando se sabe que algn otro


evento A se ha presentado se llama
probabilidad condicional y se escribe
P(B A). Esta expresin comnmente se
lee la probabilidad de que B ocurra
dado que ocurri A, o simplemente la
probabilidad de B, dado A.
Y se define:
P(B A) = P(A B) / P(A) , s P(A) 0

Variables aleatorias y Distribuciones


de probabilidad
Variables aleatoria. Es una funcin que asocia

un nmero real a cada elemento del espacio


muestral. Y se puede utilizar una letra
mayscula, por ejemplo X para designar una
variable aleatoria y su correspondiente letra
minscula, para uno de sus valores.
Ejemplo:
Se sacan dos pelotas en sucesin, sin reemplazo,
de una urna que contiene 4 pelotas rojas y 3
negras. Los resultados posibles y los valores y
de la variable aleatoria Y, donde Y es el
nmero de pelotas roja, son:

Espacio
muestral
RR
RN
NR
NN

y
2
1
1
0

Espacio muestral discreto


S un espacio muestral

contiene un nmero finito de


posibilidades o una secuencia
interminable con tantos
elementos como nmeros
naturales existen, se le llama
espacio muestral discreto.

Espacio muestral continuo

S un espacio muestral

contiene un nmero
infinito de posibilidades
igual al nmero de
puntos en un segmento
de lnea, se le llama
espacio muestral

Variable aleatoria discreta


Si se puede contar su conjunto
de resultados posibles.
Ejemplo:
Numero de artculos

defectuosos
El nmero de accidentes por
ao en una va rpida
El nmero de huevos que pone
una gallina.

Variable aleatoria continua


Cuando una variable aleatoria
puede tomar valores en una escala
continua.
Ejemplo:
Altura
Peso
Temperatura
Distancia
Perodos de vida

Distribuciones discretas de
probabilidad
El conjunto de pares ordenados (x, f(x))
es una funcin de probabilidad, funcin
masa de probabilidad o distribucin de
probabilidad de la variable aleatoria
discreta X si, para cada resultado posible
x:
1. f(x) 0
f(x) = 1
3. P(X = x ) = f(x)

Ejemplo:
Un embarque de 8
microcomputadoras similares que
se enva a un distribuidor contiene
3 aparatos defectuosos. Si una
escuela realiza un compra aleatoria
de 2 computadoras, encuentre la
distribucin de probabilidad para el
nmero de microcomputadoras
defectuosas.

Distribuciones continuas de
probabilidad
La funcin f(x) es una funcin de

densidad de probabilidad para la


variable aleatoria continua X,
definida en el conjunto de los
nmero reales, s
1. f(x) 0

xR
f(x) dx = 1, donde Linf =-
Lsup = +
3. P(a x b ) = f(x) dx, Linf = a,

Distribuciones empricas
Las utilizamos cuando no

conocemos la funcin masa de


probabilidad o la funcin de
densidad de probabilidad.
Los datos estadsticos generados
en gran cantidad, pueden ser muy
tiles al estudiar el
comportamiento de la distribucin
si se presentan en una forma
tabular y grfica, a la cual se le
llama diagrama de tronco y hojas.

Ejemplo:

Distribuciones de probabilidad
conjunta
Para variable discreta
La funcin f(x, y) es una distribucin

probabilidad conjunta o funcin masa de


probabilidad de las variables aleatorias
discretas X y Y, si
1. f(x, y) 0
(x, y) R
2. f(x, y) = 1
3. P(X = x, Y = y) = f(x,y) para cualquier
regin A en el plano xy, P[(X,Y) A) =
f(x, y)
A

Para variable continua


La funcin f(x, y) es una funcin de densidad

de probabilidad de las variables aleatorias


continuas X y Y, si
1. f(x, y) 0
(x, y) R
2. f(x, y) dx dy = 1, donde Linf = - Lsup =
+
3. P[(X,Y) A) = f(x, y) dx dy, para cualquier
A
regin en el
plano xy

Esperanza Matemtica
Llamada tambin media de la

distribucin de probabilidad de X, o
valor esperado.
Def. Sea una variable aleatoria con
distribucin de probabilidad f(x). La
media o valor esperado de X es:
= E (X) = x f(x) , s X es discreta,
y
= E (X) = x f(x), s X es continua.

Teorema
Sea X una variable aleatoria con

distribucin de probabilidad f(x).


La media o valor esperado de la
variable aleatoria g(x) est dada
por:
g(X) = E [g(X)] = g(x) f(x) , s X
es discreta, y
g(X) = E [g(X)] = g(x) f(x)dx , si
X es continua

Esperanza matemtica de un
distribucin de probabilidad conjunta
Sean X y Y variables aleatorias con distribucin de

probabilidad conjunta f(x,y). La media o valor


esperado de la variable aleatoria g(X,Y) es:

g(X,Y) = E [g(X,Y)] =

g(x,y)f(x,y) , s X y Y son discretas, y


g(X,Y) = E [g(X,Y)] =
g(x,y)f(x,y)dxdy
s X y Y son continuas.
Nota: la definicin de la esperanza matemtica de funciones de varias
variables es semejante a sta.

Variancia y Covariancia
Sea X una variable aleatoria con
distribucin de
probabilidad f (X) y media . La
variancia de X es:
2 = E [ ( X - )2 ]= ( X - )2 f(x) ,
s X es discreta, y
2 = E [ ( X - )2 ] = ( X - )2 f(x)
dx s X es continua.
Nota: la raz cuadrada positiva de la

Teorema
Sea X una variable aleatoria con
distribucin de probabilidad f(x). La
variancia de la variable aleatoria
g(X) est dada por:
2g(X) = E [ ( g(X) - g(x) )2 ]= (g(X) g(x) )2 f(x) ,
s X es discreta, y

= E [ ( g(X) - g(x) )2 ]= (g(X) g(x) )2 f(x) dx s X es continua.


2

g(X)

Algunas distribuciones discretas de


probabilidad
El comportamiento de una variable aleatoria queda
descrito por su distribucin discreta de probabilidad
sin importar que sta se represente grficamente
por un histograma, en forma tabular o por medio de
una frmula.
Con frecuencia las observaciones que se generan
en diferentes experimentos estadsticos tienen el
mismo tipo de comportamiento en trminos
generales. En consecuencia, las variables aleatorias
discretas que se asocian con estos experimentos
pueden describirse, por la misma distribucin de
probabilidad y por lo tanto se representa por una
frmula.

Algunas distribuciones discretas de


probabilidad
Distribucin discreta uniforme:

(sta es la ms simple de todas)


Si la variable aleatoria X asume los valores x1, x2, . . .
, xk con iguales probabilidades, entonces la
distribucin discreta uniforme es
f(x; k) = 1/k, x= x1, x2, . . . , xk
Nota:
1. Es aquella en la cual la variable aleatoria asume c/u
de sus valores con idntica probabilidad.
2. Es la ms simple de todas las distribuciones
discretas de probabilidad.
3. Se ha utilizado la notacin f(x; k) en lugar de f(x)
para indicar que la distribucin uniforme depende
del parmetro k.

Teorema: la media y la variancia


de la distribucin uniforme
discreta f(x; k), estn dadas por:

Distribucin binomial y
multinomial
Frecuentemente un experimento

consiste en ensayos repetidos


independientemente, cada uno con
dos posibles resultados que
pueden llamarse xito y fracaso.
Este proceso se conoce como
proceso de Bernoulli. Cada intento
se llama experimento de
Bernoulli.

Distribucin binomial
Un experimento de Bernoulli puede
resultar en un xito con una
probabilidad p y un fracaso con una
probabilidad de q 1 . Entonces la
distribucin de probabilidad de la
variable aleatoria binomial X, el
nmero de xitos en n
experimentos independientes, es:

Experimentos multinomiales

El experimento binomial
se convierte en un
experimento multinomial
si cada intento tiene ms
de 2 resultados posibles.

Distribucin multinomial
S un intento determinado puede
resultar en cualquiera de los k
resultados E1 , E2 , , Ek con
probabilidades p1, p2, , pk ,
entonces la distribucin de
probabilidad X1, X2,, Xk , que
representan el nmero de
ocurrencias para E1 , E2 , , Ek en n
intentos independientes es:

Algunas distribuciones continuas de


probabilidad
Distribucin Normal
La distribucin continua de probabilidad
ms importante en todo el campo de la
estadstica es la distribucin normal.
Su grfica recibe el nombre curva
normal, es la curva en forma de
campana, la cual describe en forma
aproximada muchos fenmenos que
ocurren.

Los errores en las mediciones cientficas


se aproximan hasta lmites
extremadamente pequeos gracias a la
distribucin normal.
Frecuentemente se le llama distribucin
gaussiana, en honor de Karl Friedrich
Gauss (1777 1855), quin tambin
deriv su ecuacin de un estudio de
errores en mediciones repetidas

Definicin:

La funcin de densidad de la variable aleatoria normal X, con media y variancia 2 , es

Das könnte Ihnen auch gefallen