Sie sind auf Seite 1von 52

CURSO: ESTADISTICA Y PROBABILIDADES

Tema: ESTADGRAFOS BASICOS


Docente: EDIDSON FUENTES
2017-2B
II
I
ESTADGRAFOS DE POSICIN

Se suele pensar en un conjunto de datos numricos presentada de forma ordenada y


sistemtica. Esta idea es debida a la influencia de nuestro entorno, ya que hoy da es casi
imposible que cualquier medio de comunicacin, peridico, radio, televisin, etc, no nos aborde
diariamente con cualquier tipo de informacin estadstica.
Orientaciones
Dar a conocer los conceptos bsicos de la estadstica como parte de la metodologa cientfica.
Entender el significado de probabilidad e identificar las caractersticas bsicas de los
experimentos aleatorios.
A travs de ellos el alumno podr al final del curso tomar decisiones apoyndose en la
estadstica inferencial. Los temas que se desarrollan son: Estadstica Descriptiva,
Probabilidades, Variables Aleatorias, Modelos Probabilsticos de Variables Aleatorias Continuas,
Propiedades del Modelo Probabilstico Normal y Distribuciones Muestrales, Estimacin de
Parmetros, Pruebas de Hiptesis.
ESTADGRAFOS
Tema 1 Introduccin a la estadstica
Tema 2 Estadgrafos Bsicos
ESTADIGRAFOS O MEDIDAS DE RESUMEN
Despus de haber ordenado y
descrito un conjunto de datos,
an el anlisis resulta todava
un tanto incompleto; es
necesario entonces resumir la
informacin y facilitar as su
anlisis e interpretacin
utilizando ciertos indicadores.

A estos indicadores se les


denomina tambin Medidas de tendencia central:
ESTADIGRAFOS o MEDIDAS DE Media, mediana, moda
RESUMEN, permiten hallar un Medidas de posicin:
valor numrico, el mismo que Deciles, cuartiles,
representa a toda la poblacin o
percentiles
muestra en estudio.
Medidas de dispersin:
Desviacin standard, varianza,
coeficiente de variacin.
Tema 1:
INTRODUCCIN A LA ESTADSTICA
MTODO CIENTFICO Y ESTADSTICA

Plantear Disear
hiptesis experimento

Obtener Recoger datos


conclusiones y analizarlos
DEFINICIN DE ESTADSTICA
Es un conjunto de teoras y mtodos que han sido desarrollados para tratar la
recopilacin, organizacin, presentacin, anlisis, interpretacin y
descripciones de datos muestrales con el fin de extraer conclusiones tiles de
ellos.
DEFINICIN DE ESTADSTICA DESCRIPTIVA
Es la parte de la Estadstica que se ocupa de la recopilacin de datos y el
tratamiento y anlisis de los mismos.
DEFINICIN DE ESTADSTICA INFERENCIAL
Es la parte de la Estadstica que trata de inducir o inferir, a travs de la
muestra obtenida, que ley, distribucin o modelo sigue la poblacin de la
cual se ha extrado aquella
FASES O ETAPAS DE LOS MTODOS ESTADSTICOS

Recoleccin
Organizacin
Presentacin
Anlisis
Interpretacin
CONCEPTOS CLAVES
Muestra: es parte de una poblacin de objetos, personas,
empresas o cosas, que es representativa del total de
elementos que conforman el universo.

Poblacin: es la totalidad de las posibles observaciones o


medidas que se estn considerando en alguna investigacin,
de cuyo conjunto se toma una muestra.

Parmetro: es una medida que describe alguna caracterstica


de la poblacin.

Estadgrafo o estadstico: es una medida que describe


alguna caracterstica de la muestra.
Conceptos claves
Tema 2:
Estadgrafos Bsicos
Un brevsimo resumen sobre estadsticos
Centralizacin o Tendencia central o promedios
Indican valores con respecto a los que los datos parecen
agruparse.
Media, mediana y moda
Posicin
Dividen un conjunto ordenado de datos en grupos con la misma
cantidad de individuos.
Cuantiles, percentiles, cuartiles, deciles, quintiles...
Forma
Asimetra
Apuntamiento o curtosis
Dispersin o Variabilidad
Indican la mayor o menor concentracin de los datos con
respecto a las medidas de centralizacin.
Desviacin tpica, coeficiente de variacin, rango, varianza
La media aritmtica [=promedio(rango)]

La media aritmtica de una variable se define como la suma ponderada


de los valores de la variable por sus frecuencias relativas y lo
denotaremos por

x
y se calcula mediante las expresiones, segn el caso:
Para TDNA TF TI
n n n
xi xi ni ci ni
x
i 1 n i 1 n i 1 n
xi representa el valor de la variable; ci representa la marca de clase.
La media como punto de equilibrio
La mediana
[=mediana(rango)]
La mediana de un conjunto de nmeros ordenados en magnitud es o el
valor central o la media de los dos valores centrales.

Clculo de la mediana en el caso de variables discretas

n 1
Tendremos en cuenta el tamao de la muestra. X
Si N es Impar, hay un trmino central, el trmino 2
que ser el valor de la mediana.

Ejemplo: El conjunto de nmeros 3,4,4,5,6,8,8,8 y 10


tiene mediana 6.
La mediana
Clculo de la mediana en el caso de variables discretas

n n
Si N es Par, hay dos trminos centrales, X y X 1
2 2
la mediana ser la media de esos dos valores

n n
X X 1
2 2
2
Ejemplo: El conjunto de nmeros 5,5,7,9,11,12,15 y18 tiene mediana 10
Ejemplo con variables continuas
Peso M. frec Fr.
Clase acum.

40 50 45 5 5
50 60 55 10 15
60 70 65 21 36
70 - 80 75 11 47
80 - 90 85 5 52
90 - 100 95 3 55
100 130 115 3 58

En el histograma se identifica unidad de rea con


individuo.

Para calcular la media es necesario elegir un punto


representante del intervalo: La marca de clase.

La media se desplaza hacia los valores extremos.


No coincide con la mediana. Es un punto donde el
histograma estara en equilibrio si tuviese masa.
Ejemplo (continuacin)
x
xn
i i i

45 5 55 10 115 3
69,3
Peso M. Clase Fr. Fr. ac.
n 58
40 50 45 5 5
50 60 55 10 15
0,5 58 Ni1
60 70 65 21 36 Mediana C0,5 Li1 (ai )
70 - 80 75 11 47 ni
80 - 90 85 5 52 0,5 5815
90 - 100 95 3 55 60 (10) 66,6
21
100 130 115 3 58
58

0,75 58 N i 1 43,5 36
P75 C0, 75 Li 1 (ai ) 70 (10) 76,8
ni 11

Moda = marca de clase de (60,70] = 65


Altura mediana
La moda
[=moda(rango)]

La moda es el valor de la variable que tenga mayor frecuencia absoluta,


la que ms se repite, es la nica medida de centralizacin que tiene
sentido estudiar en una variable cualitativa, pues no precisa la
realizacin de ningn clculo.

Por su propia definicin, la moda no es nica, pues puede haber dos o


ms valores de la variable que tengan la misma frecuencia siendo esta
mxima. En cuyo caso tendremos una distribucin bimodal o polimodal
segn el caso.
La moda
Estadgrafos de Posicin
Se define el cuantil de orden como un valor de la variable por debajo del cual
se encuentra una frecuencia acumulada .

Casos particulares son los percentiles, cuartiles, deciles, quintiles,...


Cuantil de orden
[=percentil(rango;k)]

Los cuantiles son generalizaciones de la mediana.


Los cuartiles dividen a los datos en cuatro partes iguales,
los deciles en diez, los quintiles en cinco, los percentiles en cien.

X
r
C r n
k k
X
3
Q3 42 31,5
4 4
Cuartiles (Q): Dividen a la muestra en 4 grupos con frecuencias similares.
Primer cuartil = Percentil 25 = Cuantil 0,25
Segundo cuartil = Percentil 50 = Cuantil 0,50 = mediana
Tercer cuartil = Percentil 75 = Cuantil 0,75

Quintiles (K): Dividen a la muestra en 5 grupos con frecuencias similares.


Primer quintil = Percentil 20 = Cuantil 0,20
Segundo quintil = Percentil 40 = Cuantil 0,40
Tercer quintil = Percentil 60 = Cuantil 0,60
Cuarto quintil = Percentil 80 = Cuantil 0,80

Deciles (D): Dividen a la muestra en 10 grupos con frecuencias similares.


Tercer decil = Percentil 30 = Cuantil 0,30
Quinto decil = Percentil 50 = Cuantil 0,50 = mediana
Sptimo decil = Percentil 70 = Cuantil 0,70

Percentiles (P) : Dividen a la muestra en 100 grupos con frecuencias similares.


La mediana es el percentil 50
El percentil de orden 15 deja por debajo al 15% de las observaciones. Por encima queda
el 85%
Ejemplo
Qu peso no llega a alcanzar el 25% de los
individuos?
Primer cuartil = percentil 25 = 60 Kg.

Qu peso es superado por el 25% de los individuos?


Tercer cuartil= percentil 75= 80 kg.
50%
Entre qu valores se encuentra el 50% de los
individuos con un peso ms normal?
Entre el primer y tercer cuartil = entre 60 y 80 kg.
Obsrvar que indica cmo de dispersos estn los
individuos que ocupan la parte central de la muestra. Ver 100
ms adelante rango intercuartlico.
Los diagramas de caja (boxplot) sintetizan esta
informacin (y algo ms). 90

80

70

Estadsticos
60
PESO
Percentiles 25 60,00 50
50 70,00
75 80,00 40
Ejemplo

50%
Medidas de variabilidad

Rango
Rango Intercuartlico
Desviacin Media
Varianza
Desviacin Estndar
Coeficiente de Variacin
Estadgrafos de Variabilidad o dispersin
Los estudiantes de Metodologa de la Investigacin obtienen diferentes
calificaciones en la asignatura (variabilidad). A qu puede deberse?
Diferencias individuales en el conocimiento de la materia.

Podra haber otras razones (fuentes de variabilidad)?

Por ejemplo supongamos que todos los alumnos poseen el mismo nivel de
conocimiento. Las notas seran las mismas en todos? Seguramente No.

Dormir poco el da de la prueba, el caf estaba con somnfero...


Diferencias individuales en la habilidad para hacer un examen.

El examen no es una medida perfecta del conocimiento.


Variabilidad por error de medida.

En alguna pregunta difcil, se duda entre varias opciones, y al azar se elige la


mala
Variabilidad por azar, aleatoriedad.
Medidas de dispersin
Miden el grado de dispersin (variabilidad) de los
datos, independientemente de su causa.

Amplitud o Rango
[=max(rango)-min(rango)]
La diferencia entre las observaciones extremas.
2,1,4,3,8,4. El rango es 8-1=7
Es muy sensible a los valores extremos.

Rango intercuartlico
[=CUARTIL(rango;3)-CUARTIL(rango;1)]
Es la distancia entre el primer y tercer cuartil.
Rango intercuartlico = Q3 Q1 = P75 - P25 = C0.75 C0,25
Parecida al rango, pero eliminando las observaciones ms extremas
inferiores y superiores.

No es tan sensible a valores extremos.


Muestra de edades de cinco nios
En una muestra de cinco nios se observa que stos tienen las
siguientes edades:
1, 1, 4, 8 y 9 .
En promedio tienen 4.6 aos.
Cunta variabilidad hay en las edades de los nios?
A qu distancia quedan las edades observadas de la media
muestral 4.6 aos?
Diferencias de valores observados a la media muestral

Distribucion de cinco observaciones

3
Media
muestral
-3.6
Frecuencia

4.4
1 -3.6
-.6 3.4

0
1 2 3 4 5 6 7 8 9 More

Edades observadas
Desviacin Absoluta Media
[=desvprom(rango)]
-3.6 + -3.6 + -.6 + 3.4 + 4.4 = 0
|-3.6| + |-3.6| + |-.6| + |3.4| + |4.4| = 15.6
Distancia promedio = 15.6 / 5 = 3.12
En general:
n
1
DAM
n
|x
i 1
i x|

n
| xi x |
DAM i 1 n
Otra medida: Varianza

3
3.6x3.6 Media
Muestral
2
F re c ue n c ia

4.4x4.4
.6x.6
1

0 3.6x3.6 3.4x3.4
1 2 3 4 5 6 7 8 9 More
Are a o bs e rv a da
Varianza
[=var(rango)]

-3.6 + -3.6 + -.6 + 3.4 + 4.4 = 0


3.6(3.6) + 3.6(3.6) + .6(.6) + 3.4(3.4) + 4.4(4.4) = 57.2
rea promedio = 57.2 / 4 = 14.3
En general: n
1
s
2

n 1 i1
(xi x)2

( xi x)
n 2
s
2

i 1 n 1
Grados de libertad

Por qu calculamos la varianza dividiendo por n - 1, en lugar


de dividir por n?
Como la suma de las desviaciones es 0, la ltima desviacin es
una combinacin lineal de las n - 1 desviaciones restantes.
Por lo tanto, no estamos calculando el promedio de n nmeros
independientes (los desvos). Solo n -1 de las desviaciones al
cuadrado pueden variar libremente y por ello, promediamos la
suma de los desvos al cuadrado dividiendo por n -1.
Al numero n -1 se lo denomina grados de libertad de la
varianza o de la desviacin tpica.
Desviacin estndar
[=desvest(rango)]

s s 2

As s = 3.78
Desviacin estndar

2=
S 14.3 aos 2

S
S=3.78 aos
Medidas de forma.
Asimetra y Curtosis
En los temas anteriores hemos visto las medidas de tendencia
central, de posicin y las medidas de variabilidad.
Si bien la obtencin de tales medidas es clave para describir
una muestra y efectuar inferencias sobre la poblacin de origen,
es tambin fundamental saber obtener una caracterizacin
adecuada de los datos.
Asimetra
Si bien es fcil tener una idea de si la distribucin es simtrica o
no tras ver la representacin grfica, es importante cuantificar la
posible asimetra de una distribucin.
Recordemos que cuando la distribucin de los datos es simtrica,
la media, la mediana y la moda coinciden. (Y la distribucin tiene
la misma forma a la izquierda y la derecha del centro)
ndices de asimetra
1. ndice de asimetra de Pearson
Muy sencillo de calcular. Est basado en la relacin entre la
media y la moda en distribuciones simtricas y asimtricas:

__
X Mo
A S

Sx
Si la distribucin es simtrica As ser 0
Si la distribucin es asimtrica positiva, As ser mayor que 0
Si la distribucin es asimtrica negativa, As ser menor que 0
ndices de asimetra
2. ndice de asimetra de Fisher
Est basado en la diferencia de los datos sobre la media, como la
varianza, si bien esta vez se elevan los coeficientes al cubo
n __

i
( x X ) 3
n
AS i 1
3
s x
Si la distribucin es simtrica As ser 0
Si la distribucin es asimtrica positiva, As ser mayor que 0
Si la distribucin es asimtrica negativa, As ser menor que 0
Desventaja: Muy influida por puntuaciones atpicas (ya lo
volveremos a comentar en el ltimo punto de este tema).
ndices de asimetra
3. Expresin en Excel
En el software Excel, la funcin
=COEFICIENTE.ASIMETRIA(A3:A14) se basa en la siguiente
expresin:
__


n

( x i X )3
A s
( n 1) ( n 2 ) 3
s x

Si la distribucin es simtrica As ser 0


Si la distribucin es asimtrica positiva, As ser mayor que 0
Si la distribucin es asimtrica negativa, As ser menor que 0
Desventaja: Muy influida por puntuaciones atpicas (ya lo
volveremos a comentar en el ltimo punto de este tema).
Asimetra hacia la derecha
Asimetra
Asimetra hacia la izquierda
(asimetra positiva) (asimetra negativa)

Al ser positiva significa que la Al ser negativa significa que la


grfica es asimtrica por la grfica es asimtrica por la
derecha de la media y por izquierda de la media y por
tanto los valores mayores que tanto los valores menores que
ella estn ms dispersos que ella estn ms dispersos que
los menores. los mayores.
Curtosis o apuntamiento
La curtosis representa la elevacin o achatamiento de una
distribucin, comparada con la distribucin normal. Una curtosis
positiva indica una distribucin relativamente elevada, mientras
que una curtosis negativa indica una distribucin relativamente
plana.
El estndar es la distribucin normal: distribucin mesocrtica.
Si la distribucin es ms apuntada que la distribucin normal
tenemos una distribucin leptocrtica.
Si la distribucin es ms achatada que la distribucin normal
tenemos una distribucin platicrtica.
ndice de curtosis
Para una distribucin normal (mesocrtica) sabemos que
n __

(xi X )4 n
i 1
4
3
s x

Y esta va a ser la referencia para el ndice de curtosis que vamos


a emplear
n __

(x X ) i
4
n
Cr i 1
4
3
s x

Si la distribucin es normal (mesocrtica), el ndice vale 0


Si la distribucin es leptocrtica, el ndice es superior a 0
Si la distribucin es platicrtica, el ndice es inferior a 0
ndice de curtosis
En el software Excel, la funcin =CURTOSIS(A3:A14) se basa en
la siguiente expresin:

__
4
n(n 1) ( xi X ) 3(n 1) 2

Cr (n 1)(n 2)(n 3) 4

(n 2)(n 3)
sx
Si la distribucin es normal (mesocrtica), el ndice vale 0
Si la distribucin es leptocrtica, el ndice es superior a 0
Si la distribucin es platicrtica, el ndice es inferior a 0
Leptocrtica Curtosis Platicrtica

Al ser negativa significa


Al ser positiva significa que que la grfica es menos
la grfica es ms apuntada apuntada que la grfica de
que la grfica de la la distribucin normal y por
distribucin normal y por tanto los valores alrededor
tanto los valores alrededor de la media estn menos
de la media estn mas concentrados que en la
concentrados que en la Distribucin Normal.
Distribucin Normal.
Bibliografa

Estadstica descriptiva e inferencial i, fascculo 1.


antecedentes histricos de la estadstica y sus funciones
autores: Hugo Garca Mancilla y Juan Matus Parra.
Matemtica 3 de secundaria, Felipe Eduardo Doroteo, Rubn
Hildebrando Glvez Paredes.
Matemtica 5 de secundaria, Alfonso Rojas Puemape.
http://www.conevyt.org.mx/bachillerato/material_bachillere
s/cb6/5sempdf/edin1/edin1_f1.pdf
http://maralboran.org/wikipedia/index.php/Tablas_de_datos
http://www.angelfire.com/sc/matasc/EyD/bioesta/medidas.
htm

Das könnte Ihnen auch gefallen