Sie sind auf Seite 1von 89

Estadstica

Aplicada a la
Educacin.
Sesin 2
Mtro. Alan Ivn Ruiz Cetina
1
Criterios de Evaluacin y
Acreditacin.
Asistencia 10%
Participacin 20%
Ejercicio en Clase/Examen 20%
Ejercicios prcticos 50%


Se contemplar la puntualidad de la entrega de
los ejercicios prcticos para efectos de
evaluacin.

2
Criterios de Evaluacin y Acreditacin.
Tarea (Ejercicios Prcticos).

Enviarlo con el siguiente asunto:

Ejercicio prctico Sesin 2, Grupo, Apellidos y
Nombre del alumno

El archivo(s) adjunto llevar el siguiente nombre:

Ej2_1_Gr_ApellidosyPrimerNombre (Archivo Excel)








3
Anlisis Descriptivo con
una variable.
Distribucin de frecuencias
agrupadas
4
El estudio descriptivo, se encarga de describir la realidad por
medio de la distribucin de frecuencias, recordemos el
ejemplo trabajado la Sesin 1.

5
Recapitulando.
0
2
4
6
8
10
12
0 1 2 3 4 5 6 7
F
r
e
c
u
e
n
c
i
a


Nmero de Hijos
Nmero de hijos por familia
6
Recapitulando.
0
2
4
6
8
10
12
0 1 2 3 4 5 6 7
F
r
e
c
u
e
n
c
i
a


Nmero de Hijos
Nmero de hijos por familia
Por que distribuciones de frecuencia?
Las distribucin de frecuencia
organiza los datos en un formato que
facilita su anlisis e interpretacin.

El utilizar frecuencias relativas, permite
hacer comparaciones valiosas y
significativas

7
La utilizacin de distribuciones de frecuencias
en intervalos de clase:

Resume y condensa la informacin presente en
los datos.
Se pierde informacin individual pero se gana
en capacidad de anlisis de caractersticas
globales.
El uso de grficos permite una rpida
visualizacin de estas caractersticas globales.

8
Por que distribuciones de frecuencia?
En esta sesin abordaremos los siguientes
estadsticos:
Medidas de tendencia central
o Valores que describen a un conjunto en su totalidad al representar lo promedio o
tpico de ese conjunto.
Moda, Mediana y Media.

Medidas de dispersin.
o Cuantifican el grado de variacin o dispersin entre el conjunto
de valores de una distribucin.
Rango, Varianza, Desviacin Estndar.

Medidas de Posicin.
o Dividen un conjunto ordenado de datos en grupos con la misma
cantidad.
Percentiles, Cuartiles.

9
10
El investigador social, debe de ser capaz de describir la
distribucin de frecuencia del fenmeno estudiado.

Agrupacin de datos en
intervalos de clase
11
Cuando utilizar datos agrupados?
Datos agrupados en intervalos de clase:
Cuando se tiene un rango de valores grande, una distribucin de
frecuencia no agrupada extiende tanto los valores que la forma de
la distribucin no es fcilmente apreciable, esto sucede a menudo
cuando tenemos una gran cantidad de datos.


Cuando los valores se extienden sobre un amplio rango la
distribucin de frecuencia resulta muy larga y difcil de leer.


Ante esta situacin, es conveniente tratar los datos mediante una
tabla de distribucin de frecuencia de datos agrupados en
intervalos de clase.


12
Datos agrupados en intervalos de clase
En una distribucin de frecuencias agrupada se agrupan los valores en
intervalos, que tengan la misma amplitud denominados clases. A cada
clase se le asigna una frecuencia correspondiente.

13
fi % Fi %Acum Xi Xi fi
16 28.57% 16 28.57% 44.5 712
17 30.36% 33 58.93% 53.5 909.5
15 26.79% 48 85.71% 62.5 937.5
3 5.36% 51 91.07% 71.5 214.5
2 3.57% 53 94.64% 80.5 161
3 5.36% 56 100.00% 89.5 268.5
56 Xi fi= 3203
85 - 94
n=
Intervalo de clase
40 - 49
49 - 58
58 - 67
67 - 76
76 - 85
Datos agrupados en intervalos de clase
Pasos para realizar una tabla de distribucin de frecuencia
agrupada.


14
Paso 5
Contar los valores para obtener las frecuencias del intervalo
Paso 4
Especificar los limites inferior y superior del intervalo.
Paso 3
Determinar el ancho del intervalo o amplitud de clase
Paso 2
Definir el nmero de intervalos
Paso 1
Calcular el Rango
Datos agrupados en intervalos de clase
Pasos para realizar una tabla de distribucin de frecuencia
agrupada.


15
fi % Fi %Acum
5 11.11% 5 11.11%
10 22.22% 15 33.33%
15 33.33% 30 66.67%
10 22.22% 40 88.89%
5 11.11% 45 100.00%
45
38 - 40
40 - 42
n=
Intervalo de clase
32 - 34
34 - 36
36 -38
Paso 2, No.
de Intervalos,
en este caso
son 5.
Paso 1, Determinar el rango, en este
caso es 10
Paso 3, ancho de clase en este
caso el ancho es 2
Paso 5, determinar
las frecuencias
Paso 4, Especificar Limites inferior y superior
de los intervalos
Datos agrupados en intervalos de clase
Para estudiar las tablas de distribucin de frecuencia de datos
agrupados considere el siguiente ejemplo:

Se registraron 56 calificaciones de alumnos de tercer ao de una
secundaria, tendiendo como la calificacin mas baja de 40 y la mas
alta de 94, se realizar una tabla de distribucin de frecuencia
agrupada para su anlisis estadstico.
16

A lo largo de la sesin, trabajaremos con este ejemplo
utilizando el Software Excel
Trabajemos en Excel
Propuesta Grupal
17
Rango
Rango.
Es la diferencia entre el valor mas alto (

) y el valor
mas bajo observado en los datos(

).

Se obtiene mediante la formula:

=




Ejemplo. Determine el rango del sig. conjunto de datos:
56, 35, 42, 52, 58, 24, 36, 34, 22, 46


18
Respuesta:
Rango= 58-22
Rango= 36


min max
X X R =
Definir el nmero de intervalos
Para presentar datos por intervalos en una distribucin de
frecuencia agrupada, el investigador social debe considerar el
numero de categoras, los textos generalmente aconseja usar
de 5 a 15 intervalos.

Se puede determinar el Nmero de intervalos a realizar por
medio de la siguiente formula:



Siendo:
K= No. De intervalos
n= numero de datos de la muestra



19
n k log 3 . 3 1+ =
Determinar la amplitud de intervalo
El ancho de clase o amplitud de intervalo:
Se define como la diferencia entre el limite superior e inferior de la
clase. Este puede ser un nmero decimal.

Esta se obtiene mediante la siguiente formula:



Donde:
a= Amplitud de clase.
R= Rango
K=No. de intervalos



20
k
R
a =
Intervalo de clase
40 -
Determinar los limites de clase.
Para determinar los limites de clase:
1. Colocamos el valor del dato ms chico como nuestro primer lmite inferior .
2. A nuestro primer lmite inferior de clase (Li) le sumamos el ancho de clase (a)
y obtenemos el primer limite superior (Ls).
3. Nuestro primer lmite superior(Ls), se convierte en el lmite inferior (Li) del
siguiente intervalo y volvemos a sumarle el ancho para obtener un nuevo
limite superior (Ls).
Ejemplo.
21
Limite
inferior (Li)
Intervalo de clase
40 - 49
Limite
inferior (Li)
Este es el dato mas
chico, en nuestro
ejemplo el dato ms
chico es 40.
Paso 1
Paso 2
Limite
Superior (Ls)
Para obtener el
limite superior (Ls),
se le suma el ancho
de clase al limite
inferior (Li)
40 + 9 = 49
Determinar los limites de clase.
22
Intervalo de clase
40 - 49
49 -
Limite inferior
(Li)
Paso 3
Limite
Superior (Ls)
Nuestro limite
superior (Ls)
calculado en el paso
2, se convierte en el
limite inferior (Li)
del siguiente
intervalo.
Intervalo de clase
40 - 49
49 - 58
Para obtener el
limite superior (Ls),
se le suma el ancho
de clase al limite
inferior (Li)
49 + 9 = 58
Limite
Superior (Ls)
Para determinar los limites de clase:
1. Colocamos el valor del dato ms chico como nuestro primer lmite inferior .
2. A nuestro primer lmite inferior de clase (Li) le sumamos el ancho de clase (a) y obtenemos el
primer limite superior (Ls).
3. Nuestro primer lmite superior(Ls), se convierte en el lmite inferior (Li) del siguiente intervalo y
volvemos a sumarle el ancho para obtener un nuevo limite superior (Ls).
Determinar los limites de clase.
4. Continuamos con el procedimiento hasta obtener el nmero de
intervalos deseados, es decir, el limite superior (Ls) del ltimo
intervalo de clase deber ser el dato mas alto.
Ejemplo.
23
Paso 4
Intervalo de clase
40 - 49
49 - 58
58 - 67
67 - 76
76 - 85
85 - 94
Limite
inferior (Li)
Limite
Superior (Ls)
El ultimo limite superior (Ls),
deber de ser el dato ms alto, si
no es as hubo un error de calculo.
fi Intervalo de clase
40 - 49
49 - 58
58 - 67
67 - 76
85 - 94
n=
76 - 85
Recapitulando
En una distribucin de frecuencias agrupada se agrupan los valores
en intervalos, que tengan la misma amplitud denominados clases. A
cada clase se le asigna una frecuencia correspondiente.
Ejemplo.
24
Frecuencia
6 Clases
Amplitud de 9
Frecuencias en datos agrupados.
Para datos agrupados, utilizaremos la
siguiente simbologa para las frecuencias.

Frecuencia (fi)
Porcentaje (%)
Frecuencia Acumulada (Fi)
Porcentaje Acumulado (%Acum)
Numero total de datos (n).








25
Frecuencia (fi)
Frecuencia.
Es el numero de veces que aparece un
determinado valor en un estudio estadstico.

Se representa por f
i
.

La suma de las frecuencias es igual al nmero
total de datos, que se representa por n.








26
Frecuencia (fi)
Al igual que la frecuencia absoluta en
datos no agrupados, para obtener los
valores de la frecuencia, se debe de
realizar una inspeccin de los datos y
registrar el numero de veces que
aparecen en el intervalo que
corresponda.








27
Frecuencia (fi)
Ejemplo.








28
fi
16
17
15
3
2
3
56
Intervalo de clase
40 - 49
49 - 58
58 - 67
67 - 76
76 - 85
85 - 94
n=
Frecuencia
(fi)
Suma de
frecuencias (n)
Porcentaje (%)
Porcentaje.
Es el cociente entre la frecuencia de un
determinado valor y el numero total de datos.

Se expresa en tantos por ciento y se representa
por el smbolo %.


La suma de los porcentajes es igual a 100.








29
fi %
16 28.57%
17 30.36%
15 26.79%
3 5.36%
2 3.57%
3 5.36%
56
Intervalo de clase
40 - 49
49 - 58
58 - 67
67 - 76
76 - 85
85 - 94
n=
Porcentaje (%)
Ejemplo:







30
Porcentaje (%)
16/56= .2857 x 100 = 28.57
15/56= .2679 x 100 = 26.79
2/56= .357 x 100 = 3.57
Frecuencia Acumulada (Fi)
Frecuencia Acumulada.
Es la suma de las frecuencias de todos lo
valores inferiores o iguales al valor
considerado.

Se representa por F
i
.








31
fi % Fi
16 28.57% 16
17 30.36% 33
15 26.79% 48
3 5.36% 51
2 3.57% 53
3 5.36% 56
56
Intervalo de clase
40 - 49
49 - 58
58 - 67
67 - 76
76 - 85
85 - 94
n=
Frecuencias Acumulada
Ejemplo:







32
Frecuencia Acumulada (Fi)
Primer dato, siempre
es la primer frecuencia,
en este caso 16.
17 + 16 = 33
3 + 48 = 51
3 + 53 = 56
Porcentaje Acumulado (%Acum)
Porcentaje Acumulado.
Es la suma de las porcentajes de todos lo
valores inferiores o iguales al valor considerado

Se representa por %Acum.






33
Porcentaje Acumulado (%Acum)
34
fi % Fi %Acum
16 28.57% 16 28.57%
17 30.36% 33 58.93%
15 26.79% 48 85.71%
3 5.36% 51 91.07%
2 3.57% 53 94.64%
3 5.36% 56 100.00%
56
Intervalo de clase
40 - 49
49 - 58
58 - 67
67 - 76
76 - 85
85 - 94
n=
Ejemplo:
Porcentaje Acumulado (%Acum)
Primer dato, siempre
es el primer porcentaje,
en este caso 28.57%.
30.36 + 28.57 = 58.93
5.36 + 85.71 = 91.07
5.36 + 94.64 = 100
Marcas de Clase
La marca de clase (Xi) es el punto medio de cada intervalo y es el
valor que representa a todo el intervalo para el clculo de algunos
parmetros.

Se obtiene mediante la siguiente formula:



Donde:

= Marca de clase.

=Limite del intervalo Inferior.

=Limite del intervalo Superior










35
2
s i
i
L L
X
+
=
fi % Fi %Acum Xi
16 28.57% 16 28.57% 44.5
17 30.36% 33 58.93% 53.5
15 26.79% 48 85.71% 62.5
3 5.36% 51 91.07% 71.5
2 3.57% 53 94.64% 80.5
3 5.36% 56 100.00% 89.5
56
Intervalo de clase
40 - 49
49 - 58
58 - 67
67 - 76
76 - 85
85 - 94
n=
Marcas de Clase
Ejemplo.










36
Marca de Clase (Xi)
40 + 49
2
= 44.5
85 + 94
2
= 89.5
Sntesis
Una distribucin de frecuencia agrupada consiste de los
siguientes datos







37
fi % Fi %Acum Xi Xi fi
16 28.57% 16 28.57% 44.5 712
17 30.36% 33 58.93% 53.5 909.5
15 26.79% 48 85.71% 62.5 937.5
3 5.36% 51 91.07% 71.5 214.5
2 3.57% 53 94.64% 80.5 161
3 5.36% 56 100.00% 89.5 268.5
56 Xi fi= 3203
85 - 94
n=
Intervalo de clase
40 - 49
49 - 58
58 - 67
67 - 76
76 - 85
Marca de Clase
(Xi)
Porcentaje
Acumulado
(%Acum)
Frecuencia
Acumulada (Fi) Frecuencia (fi)
Porcentaje (%)
Xi multiplicada
por fi (Xifi)
Sumatoria de Xifi
Nmero total de
datos
Limites de clase
(Li y Ls)
Medidas de Tendencia
Central
Moda , Mediana y Media,
38
Medidas de tendencia central
En la actualidad escuchamos como en investigaciones
utilizan el termino promedio.

Una forma til de describir a un conjunto en su totalidad es
encontrar un numero nico que represente lo promedio o
tpico de ese conjunto.

En la investigacin social, ese valor se conoce como una
medida de tendencia central, ya que esta generalmente
localizada hacia el medio o centro de una distribucin en la
que la mayora de las valores tienden a concentrarse.







39
Medidas de tendencia central

El investigador social , tiene una concepcin del
termino promedio mas preciso que la del uso popular,
ya que existen varias clases distintas de mediciones de
promedio o tendencia central.


Las tres medidas de tendencia central mas conocidas
son: La moda, la mediana y la media.





40
Moda, Mediana y Media
41
Moda
Moda (Mo):
Es el puntaje, categora o valor que ocurre mas
frecuentemente en una distribucin.

Ejemplo.
En el conjunto de datos

0, 1, 2, 3, 1, 1, 6, 5, 4, 1, 4, 4, 3,


La moda es:
42
1, ya que ocurre mas veces que
cualquier otro valor.
Mediana
Mediana (Me):
Cuando los datos o valores se organizan por orden de
tamao (menor a mayor o viceversa), la mediana es el
punto mas cercano al medio en una distribucin.

La mediana es la medida de tendencia central que corta la
distribucin en dos partes iguales.

La posicin del valor de la mediana puede localizarse por
inspeccin o con la formula:

=
+ 1
2



43
Mediana
Ejemplo:

11, 12, 13, 16, 17, 20, 25


44
Mediana
Si el nmero de casos es par, habr dos casos medios.
Para determinar su valor, se obtiene un promedio de estos
casos.

Ejemplo.

11, 12, 13, 16, 17, 20, 25, 26


=
16 +17
2
= 16.5
45
Media.
Media:
Es la suma de un conjunto de observaciones (x) dividida
entre el numero de observaciones (n).
Para fines estadsticos, la media de una muestra se
simboliza con

.

Este se expresa con la siguiente formula:





46
n
x
X

=
Media.
Ejemplo:

Se tiene el siguiente conjunto de valores:

8, 3, 7, 4, 11, 2, 9, 4, 10, 11, 4

La media se calcula:




47
7
11
77
= = =

n
x
X
Tipos de Distribuciones
Su relacin con las medidas de
tendencia central.
48
Relacin de las Medidas de Tendencia Central y los tipos de distribuciones.
49
A. Distribucin Normal.

B. Distribucin Bimodal

C. Distribucin
Rectangular.

D. Distribucin Asimtrica
Positiva

E. Distribucin Asimtrica
Negativa





Medidas de Tendencia
Central
Su obtencin en datos
agrupados.
50
Moda
Moda (Mo):
En una distribucin de frecuencia agrupada, la moda puede
ser calculada como el punto medio del intervalo de clase
que tiene mayor frecuencia.
Esta se obtiene con la siguiente formula.




Donde:
= Clase Modal.

=Limite del intervalo Inferior.

=Limite del intervalo Superior



51
2
s i
L L
Mo
+
=
Moda
Moda (Mo):
En una distribucin de frecuencia agrupada, la moda es el
punto medio del intervalo de clase que tiene mayor
frecuencia.
Ejemplo.


52
fi
16
17
15
3
2
3
56
85 - 94
n=
Intervalo de clase
40 - 49
49 - 58
58 - 67
67 - 76
76 - 85
Intervalo con
mayor
frecuencia
Obtenemos su
punto medio:
=
49 +58
2
= 53.5
= 53.5
Mediana
Mediana:
Para encontrar la Mediana en datos agrupados
debemos:

1. Encontrar la posicin de la Mediana.
2. Encontrar el intervalo de clase que contiene
la mediana.
3. Encontrar el valor exacto de la Mediana.





53
Mediana
Paso 1:
Para encontrar la posicin de la Mediana en una distribucin
agrupada, se puede utilizar la siguiente formula:


Ejemplo:




54
2
n
Mediana la de Posicion =
=
56
2
= 28
fi % Fi
16 28.57% 16
17 30.36% 33
15 26.79% 48
3 5.36% 51
2 3.57% 53
3 5.36% 56
56
85 - 94
n=
76 - 85
Intervalo de clase
40 - 49
49 - 58
58 - 67
67 - 76
fi % Fi
16 28.57% 16
17 30.36% 33
15 26.79% 48
3 5.36% 51
2 3.57% 53
3 5.36% 56
56
85 - 94
n=
76 - 85
Intervalo de clase
40 - 49
49 - 58
58 - 67
67 - 76
Mediana
Paso 2:
Buscamos la Posicin de la Mediana en la columna de frecuencia
acumulada (Fi).
Ejemplo:





55
=
56
2
= 28
En este intervalo se
encuentra la Media
A este intervalo le llamaremos:
Intervalo de la Mediana
Mediana
Paso 3:
Para encontrar el valor exacto de la mediana, aplicamos la
siguiente formula:




Donde:
Me=Valor de la Mediana
Li= es el limite inferior del Intervalo de la Mediana.
n= numero total de datos de la muestra

1
= Frecuencia Acumulada bajo el Intervalo de la Mediana.

= frecuencia en el Intervalo de la Mediana.


= amplitud de clase o intervalo.

56
i
i
i
i
a
f
F
n
L Me

+ =
1
2
Mediana
En nuestro ejemplo.
Sustituimos en la formula:





57
Intervalo de la Mediana:
49 - 58
i
i
i
i
a
f
F
n
L Me

+ =
1
2
9
17
16
2
56
49

+ = Me
9
17
16 28
49

+ = Me
9
17
12
49 + = Me
9 7058823529 . 49 + = Me
352941176 . 6 49+ = Me
35294118 . 55 = Me
35 . 55 = Me
fi % Fi
16 28.57% 16
17 30.36% 33
15 26.79% 48
3 5.36% 51
2 3.57% 53
3 5.36% 56
56
85 - 94
n=
76 - 85
Intervalo de clase
40 - 49
49 - 58
58 - 67
67 - 76
Media.
Media:
Para calcular la media de una distribucin de frecuencia agrupada,
puede utilizarse una versin modificada de la formula anteriormente
estudiada.

Esta formula es:





Donde:

= Media muestral.

=Marca de clase.

=frecuencia de la clase.
n= nmero de datos de la muestra.

=1



58
n
f X
X
n
i
i i
=

=
1
=La sumatoria de las multiplicaciones de Xi por fi hasta n.
Media.
En nuestro ejemplo:
Crearemos una nueva columna con la multiplicacin de la Marca
de clase (Xi) por la frecuencia (fi).







59
fi % Fi %Acum Xi Xi fi
16 28.57% 16 28.57% 44.5 712
17 30.36% 33 58.93% 53.5 909.5
15 26.79% 48 85.71% 62.5 937.5
3 5.36% 51 91.07% 71.5 214.5
2 3.57% 53 94.64% 80.5 161
3 5.36% 56 100.00% 89.5 268.5
56 Xi fi= 3203
85 - 94
n=
Intervalo de clase
40 - 49
49 - 58
58 - 67
67 - 76
76 - 85
Xi multiplicada por fi (Xifi)
Sumatoria de Xifi
Media.
En nuestro ejemplo:
Con nuestra distribucin agrupada realizada, solo sustituimos en
formula.




Sustituyendo:



60
fi % Fi %Acum Xi Xi fi
16 28.57% 16 28.57% 44.5 712
17 30.36% 33 58.93% 53.5 909.5
15 26.79% 48 85.71% 62.5 937.5
3 5.36% 51 91.07% 71.5 214.5
2 3.57% 53 94.64% 80.5 161
3 5.36% 56 100.00% 89.5 268.5
56 Xi fi= 3203
85 - 94
n=
Intervalo de clase
40 - 49
49 - 58
58 - 67
67 - 76
76 - 85
56
3203
= X
n
f X
X
n
i
i i
=

=
1
19642857 . 57 = X
1964 . 57 = X
Medidas de Dispersin
Rango, Varianza y Desviacin
Estndar
61
Medidas de dispersin.
Hemos visto como la moda, la mediana y la media pueden
usarse para resumir, en un solo valor, lo que es el promedio. Sin
embargo, el basarse solamente en estas medidas nos puede
llevar a conclusiones errneas o distorsionadas.

Supongamos que en Honolulu Hawaii y Sonora Mxico tienen la
misma temperatura media de 38 grados centgrados.


Podemos suponer que la temperatura es bsicamente igual en
ambas localidades?


62
Medidas de dispersin.
Analice la siguiente figura:








Como se muestra en la figura, la temperatura de Honolulu solo tiene
leves variaciones durante el ao fluctuando usualmente entre 32C y
42C.

Por contraste, la temperatura en Sonora puede diferir, de estacin en
estacin, de una mnima de cerca de 21C en enero a una mxima de
cerca de 45C en Julio y Agosto.


63
Medidas de dispersin.
El punto a subrayar es que las medidas de tendencia central
y las medidas de variabilidad son necesarias para describir
caractersticas importantes de las distribuciones.

Esto es, necesitamos conocer las medidas de dispersin o
variabilidad.

En nuestro ejemplo, la distribucin de temperatura en Sonora
tiene mayor variabilidad que la distribucin de temperatura
en Honolulu Hawaii.


En este curso trabajaremos con las siguiente medidas de
dispersin: Rango, Varianza y Desviacin Estndar.
64
Varianza.
El propsito de una medida e la variabilidad es
cuantificar el grado de variacin entre el conjunto de
valores de una distribucin.


Hemos estudiado la medida de dispersin llamada
Rango, donde se considera una diferencia la
diferencia entre Xmin y Xmax .


La varianza es una medicin refinada de la dispersin
que el rango.



65
Varianza.
La varianza se denota con la letra minscula griega sigma
al cuadrado:

Varianza:
2


Para obtener la varianza de un conjunto de datos se utiliza
la siguiente formula:

2
=


Donde:

2
= Varianza.
x= diferencia entre un valor observado y la media.

2
= Sumatoria de todas las diferencias valores observados
y la media al cuadrado.
N=Nmero total de valores observados o datos.
66
Varianza.
Para comprender lo que es la varianza consideremos el
siguiente ejemplo:


67
Considere a:

X= valor observado de la variable.
N= numero total de datos.

= Media de los valores observados.






1
2
4
6
8
9
X = 30
Obtenemos la media:

=
X

=
30
6
= 5


Varianza.
Ahora, encontremos las diferencias entre la media y cada
valor, a estos valores se les llama valores de desviacin.


68

1 -4
2 -3
4 -1
6 +1
8 +3
9 +4
X = 30 x = 0
Considere a:

x = Diferencia entre el valor
observado y la media.


4 5 = -1
8 5 = +3
Valor de la media:

= 5


Varianza.
Para evitar la diferencia de signos, elevamos al cuadrado las
diferencias entre los valores observado y la media, teniendo lo
siguiente:


69

2

1 -4 16
2 -3 9
4 -1 1
6 +1 1
8 +3 9
9 +4 16
X = 30 x = 0
2
=52
As, evitamos que la suma de los valores de desviacin nos de 0


(-4) (-4) = 16
(-1) (-1) = 1
(+3) (+3) = 9
Varianza.
Por ultimo, sustituimos en formula los datos obtenidos:


70

2

1 -4 16
2 -3 9
4 -1 1
6 +1 1
8 +3 9
9 +4 16
X = 30 x = 0
2
=52
Valor de la media:

= 5

2
=

2
=
52
6

2
= 8.6667

2
= 8.67
Desviacin Estndar.
La desviacin estndar () es simplemente la raz
cuadrada de la varianza.

La desviacin estndar () regresa a la medicin de los
valores originales, as tiene mas valor descriptivo directo.

La desviacin estndar () es la medida de dispersin mas
utilizada en procedimientos estadsticos avanzados.

La formula para su obtencin es la siguiente:

=

2
=
2





71
Desviacin Estndar.
En nuestro ejemplo:

Habamos calculado la varianza como:



Sustituimos para obtener la desviacin estndar:


72

2
= 8.67
=
2

= 8.67
= 2.944486373
= 2.9445
Medidas de Dispersin
Su obtencin en datos
agrupados.
73
Varianza
Varianza (
2
).
En datos agrupados, la varianza se obtiene mediante la siguiente formula.




2
= Varianza.
X= Marca de clase.
fi= frecuencia.
= Sumatoria de las multiplicaciones de Marca de clase al cuadrado por
la frecuencia.
n=Nmero total de datos de la muestra.

= Media muestral.



74
2
2
2
X
n
f X
i i
=

o
i i
f X
2
Varianza
75
En nuestro ejemplo:
Realizamos una nueva columna, con el resultado de la
multiplicacin de marca de clase (Xi) al cuadrado por
frecuencia (fi).





Xi al cuadrado multiplicada por fi (Xifi)
Sumatoria de Xi fi
fi % Fi %Acum Xi Xi fi Xi fi
16 28.57% 16 28.57% 44.5 712 31684
17 30.36% 33 58.93% 53.5 909.5 48658.25
15 26.79% 48 85.71% 62.5 937.5 58593.75
3 5.36% 51 91.07% 71.5 214.5 15336.75
2 3.57% 53 94.64% 80.5 161 12960.5
3 5.36% 56 100.00% 89.5 268.5 24030.75
56 Sumatorias= 3203 191264
Intervalo de clase
40 - 49
49 - 58
58 - 67
67 - 76
76 - 85
85 - 94
n=
Varianza
76
Sustituimos en formula:
Con los datos calculados, sustituimos en formula.





fi % Fi %Acum Xi Xi fi Xi fi
16 28.57% 16 28.57% 44.5 712 31684
17 30.36% 33 58.93% 53.5 909.5 48658.25
15 26.79% 48 85.71% 62.5 937.5 58593.75
3 5.36% 51 91.07% 71.5 214.5 15336.75
2 3.57% 53 94.64% 80.5 161 12960.5
3 5.36% 56 100.00% 89.5 268.5 24030.75
56 Sumatorias= 3203 191264
Intervalo de clase
40 - 49
49 - 58
58 - 67
67 - 76
76 - 85
85 - 94
n=
2
2
2
X
n
f X
i i
=

o
2 2
) 1964 . 57 (
56
191264
= o
1964 . 57 = X
Recordemos que la
media calculada es
de:





428173 . 3271
56
191264
2
= o
428173 . 3271 428571 . 3415
2
= o
0003984 . 144
2
= o
0004 . 144
2
= o
Desviacin Estndar
Desviacin Estndar ( ).
En datos agrupados, la desviacin estndar se obtiene mediante la siguiente
formula.





= Desviacin Estndar.
X= Marca de clase.
fi= frecuencia.
= Sumatoria de las multiplicaciones de Marca de clase al cuadrado por
la frecuencia.
n=Nmero total de datos de la muestra.

= Media muestral.



77
2
2
X
n
f X
i i
=

o
i i
f X
2
2
o o =



Desviacin Estndar.
En nuestro ejemplo:

Habamos calculado la varianza como:



Sustituimos para obtener la desviacin estndar:


78

2
= 144.0004
=
2

= 144.0004
= 12.00001667
= 12.00002
Medidas de Posicin
Percentiles
79
Medidas de Posicin.
Las medidas de posicin son unos estadsticos que
nos sintetizan la informacin sobre los datos que
analizamos, facilitando su manejo.
Una medida de posicin es un indicador que se usa
para sealar que porcentaje de datos dentro de la
muestra se encuentra a un lado y a otro del mismo.

En resumen, una medida de posicin es un valor de la
variable que nos informa del lugar que ocupa un dato
dentro del conjunto ordenado de valores, estos se
llaman percentiles y los denotaremos con P y un
subndice que indica el porcentaje de datos a la
izquierda de P.





80
Percentiles (

).
Ejemplo.
Percentil veinte se denotar como
20
.

Grficamente se entiende como:






81
Percentiles (

).
82
A ciertos percentiles se les han dado nombre especficos:

-Al percentil 25,

, se le llama primer cuartil y se le denota por


-Al percentil 50,

, se le llama segundo cuartil y se le denota por


Ntese que

es tambin por definicin la Mediana es decir:

=
-Al percentil 75,

, se le llama tercer cuartil y se le denota por


Los cuartiles dividen la distribucin en 4 reas que contienen cada una
el 25% de los datos:





Percentiles (

)
Percentiles (

):
Para encontrar los percentiles en datos agrupados
debemos.


1. Calcular la posicin del percentil.
2. Encontrar el intervalo de clase que contiene al
percentil.
3. Encontrar el valor exacto del percentil.

83
Percentiles (

)
Paso 1:
Para encontrar el intervalo de la clase que contiene al
percentil podemos utilizar la siguiente formula:


Ejemplo:
Suponga que quiere encontrar






84
fi % Fi
16 28.57% 16
17 30.36% 33
15 26.79% 48
3 5.36% 51
2 3.57% 53
3 5.36% 56
56
85 - 94
n=
76 - 85
Intervalo de clase
40 - 49
49 - 58
58 - 67
67 - 76

100


25
=
25
100
56

25
= .25 56

25
= 14
fi % Fi
16 28.57% 16
17 30.36% 33
15 26.79% 48
3 5.36% 51
2 3.57% 53
3 5.36% 56
56
85 - 94
n=
76 - 85
Intervalo de clase
40 - 49
49 - 58
58 - 67
67 - 76
Percentiles (

)
Paso 2:
Buscamos la Posicin del percentil en la columna de frecuencia
acumulada (Fi).
Ejemplo:





85
En este intervalo se
encuentra
25

A este intervalo le llamaremos:
Intervalo del Percentil

25
= 14
Percentiles (

)
Paso 3.
Para encontrar el valor exacto del percentil, se utiliza la
siguiente formula:





Donde:

= Percentil que se desea obtener.


= numero del porcentaje de datos.
= Limite inferior del intervalo del percentil.

= Frecuencia acumulada del intervalo que antecede al intervalo del percentil.

= frecuencia del intervalo del percentil

= amplitud de la clase.

86
i
i
i
i k
a
f
F n
k
L P

|
.
|

\
|
+ =
1
100
Tiempo de
Retroalimentacin
87
Ejercicio prctico
Ejercicio 2_1
88
Gracias por su Atencin!
89

Das könnte Ihnen auch gefallen