Beruflich Dokumente
Kultur Dokumente
APUNTES DOCENTES
ASIGNATURA: ESTADSTICA
VERSIN 11
FECHA: 2014
Pgina1
1.1.1
1.1.2
1.1.3
1.1.4
1.1.5
1.1.6
1.1.7
1.2
1.2.1
DATO...................................................................................................................................... 11
1.2.2
ELEMENTO ........................................................................................................................... 11
1.2.3
POBLACIN.......................................................................................................................... 12
1.2.4
1.2.5
1.2.6
1.2.6.1
1.2.6.2
1.2.7
1.2.7.1
1.2.7.2
1.2.8
CENSO................................................................................................................................... 14
1.2.9
MUESTRA ............................................................................................................................. 14
1.2.10
1.2.11
PARMETRO........................................................................................................................ 15
1.2.12
ESTADSTICO ...................................................................................................................... 15
1.2.13
1.2.14
1.2.15
ESTADSTICAS .................................................................................................................... 15
1.3
1.3.1
INTRODUCCIN .................................................................................................................. 16
VERSIN 11
FECHA: 2014
Pgina2
1.3.3
1.3.4
1.3.5
1.3.6
1.3.7
1.3.8
1.3.9
1.3.10
LA INTERPOLACIN........................................................................................................... 23
1.4.1
1.4.2
REPRESENTACIN GRFICA.......................................................................................... 25
1.4.2.1
HISTOGRAMA .................................................................................................... 25
1.4.2.2
1.4.2.3
OJIVA.................................................................................................................... 27
1.5
ARREGLO DE DATOS PARA VARIABLE DISCRETA EN CLASES DE AMPLITUD
CERO 28
1.6
2
2.1.1
2.1.2
2.1.3
2.1.4
2.1.5
2.1.6
2.1.7
VERSIN 11
FECHA: 2014
Pgina3
2.1.9
2.1.10
2.1.11
2.1.12
2.1.13
2.1.14
2.1.15
2.1.16
2.1.17
2.1.18
2.1.19
LA MEDIANA ......................................................................................................................... 38
2.1.20
2.1.21
2.1.22
2.1.23
2.1.24
2.1.26
LA MODA .............................................................................................................................. 46
2.1.27
2.2
2.2.1
DISTRIBUCIONES DE FRECUENCIAS DE VARIABLE DISCRETA CON
AMPLITUD IGUAL A CERO ............................................................................................................... 49
2.3
2.3.1
2.3.2
2.3.3
2.3.4
2.3.5
EL RANGO ............................................................................................................................ 53
2.3.6
VERSIN 11
FECHA: 2014
Pgina4
2.3.7
EL RANGO INTERCUARTLICO........................................................................................ 54
2.3.8
2.3.9
LA VARIANZA ....................................................................................................................... 56
2.3.10
2.3.11
2.3.12
DESIGUALDAD DE CHEBYSHEV..................................................................................... 62
3.1.1
INTRODUCCIN .................................................................................................................. 63
3.1.2
3.1.3
3.1.4
3.1.5
3.1.6
3.1.7
3.2
REGRESIN ................................................................................................................................. 63
LA CORRELACIN ...................................................................................................................... 72
3.2.1
3.2.2
EL COEFICIENTE DE DETERMINACIN........................................................................ 73
4.1.1
4.1.1.1
4.1.1.2
4.1.2
4.1.3
4.1.4
4.1.5
4.1.5.1
4.1.5.2
4.1.5.3
4.1.5.4
4.1.5.5
VERSIN 11
.......................................... 76
FECHA: 2014
Pgina5
4.1.6.1
4.1.6.2
4.1.6.3
4.1.7
Muestreo ................................................................................................................................ 77
4.1.7.1
4.1.8
Ensayos ................................................................................................................................. 78
4.1.9
4.1.9.1
4.1.10
4.1.12
4.1.14
BIBLIOGRAFA ..................................................................................................................................... 89
VERSIN 11
FECHA: 2014
Pgina6
VERSIN 11
FECHA: 2014
Pgina7
Introduccin
La estadstica es una herramienta de mxima utilidad para todos aquellos que tienen que tomar decisiones,
en condiciones de riesgo, porque suministra un mtodo cientfico para recolectar y luego extraer informacin
de los datos relacionados con una situacin o fenmeno que sea del inters de la persona o equipo de
personas que buscan optimizar el uso de los recursos de las unidades econmicas o sociales que dirigen.
Para facilitar y agilizar el proceso de enseanza-aprendizaje de la asignatura de Estadstica, es conveniente
contar con un material de apoyo cercano al desarrollo del programa institucional de esta asignatura y
ubicado en el contexto en el cual ejercern su actividad los egresados de los programas de tecnologa
La finalidad de estos Apuntes de Estadstica es reducir la dependencia exagerada de los notas que toman
los estudiantes en clase, suministrando un material de apoyo conceptual para la asignatura de Estadstica,
que sea gil, intuitivo y veraz, que se convierta en una gua clara y amigable para adquirir las competencias
de la asignatura.
Estos apuntes, se desarrollan de manera paralela al programa de la asignatura, por lo que. lo mismo que
ste, se compone de cuatro unidades: las tres primeras se refieren a la estadstica descriptiva y la cuarta a
los fundamentos del clculo de probabilidades.
VERSIN 11
FECHA: 2014
Pgina8
1.1.1
LOS FENMENOS
Un fenmeno es cualquier manifestacin de las actividades humanas o de la naturaleza que puede ser
percibido por los sentidos o la razn. Algunos ejemplos de fenmenos son los siguientes:
El crecimiento de una planta
El comportamiento del clima
Las ventas por periodo de una empresa
Las personas, por da, que son afectadas por una enfermedad
Los accidentes de trnsito en diferentes lugares de una ciudad
La variacin mensual del costo de vida
Palabras sinnimas de fenmeno son: suceso, hecho o acontecimiento
LOS FENMENOS PRODUCEN INFORMACIN
Por muchos motivos los seres humanos desean poseer informacin sobre el comportamiento de diversos
fenmenos y para ello realizan registros sobre el estado de estos fenmenos en diferentes momentos o
espacios.
Estos registros o mediciones generan diversos volmenes de datos y para que estos datos se conviertan en
informacin se deben procesar de diferentes maneras. Una de las formas como se pueden tratar los datos
para extraer la informacin que ellos contienen es utilizando las tcnicas estadsticas
1.1.2
DEFINICIN DE ESTADSTICA
Es una ciencia que estudia cmo debe emplearse informacin para facilitar la toma de decisiones en
situaciones prcticas que se manifiestan bajo incertidumbre
1.1.3
IMPORTANCIA DE LA ESTADSTICA
La actividad ms importante para las personas que trabajan en las organizaciones empresariales es la toma
de decisiones. Dado el enorme aumento de la disponibilidad de datos (gracias a los sistemas de
informacin), y dada la complejidad creciente de las operaciones empresariales, los procesos de decisin se
ven sometidos a presiones extraordinarias.
Una de las tcnicas ms valiosa que ayudan en los procesos de toma de decisiones es la Estadstica. Por lo
que es indispensable que los hombres y mujeres que dirigen organizaciones o que de alguna manera
participan en la toma de decisiones estn familiarizados con las tcnicas estadsticas para poder determinar
cuando se puede examinar un problema existente mediante la aplicacin del anlisis estadstico.
1.1.4
DIVISIN DE LA ESTADSTICA
ESTADSTICA DESCRIPTIVA
Son los conocimientos y mtodos que tratan de la recoleccin, organizacin y presentacin numrica y
DEPARTAMENTO DE CIENCIAS BSICAS
VERSIN 11
FECHA: 2014
Pgina9
INFERENCIA ESTADSTICA
1.1.7
1. Planeamiento
Fin de la investigacin
Definir la poblacin
Unidad de investigacin
Naturaleza o clase de los datos
Fuentes de la informacin
Procedimiento para recolectar los datos
Diseo de instrumentos
Presupuesto
2. Recoleccin de los datos
3. Crtica y codificacin
4. Tabulacin, grficas y medidas
5. Anlisis e interpretacin
VERSIN 11
FECHA: 2014
Pgina10
1.2.1
CONCEPTOS BSICOS
DATO
En trminos generales un dato es un registro o anotacin que se hace del estado de un fenmeno en un
momento determinado
1.2.2
ELEMENTO
Personas
Individuos
Otros seres
vivos
Elementos
Cosas
Sucesos
Ejemplos de sucesos:
Accidentes
Los viajes
Objetos tangibles
Entidades
intangibles
Pgina11
Ejemplos de elementos
En una investigacin sobre el comportamiento de los los salarios de trabajadores los elementos son los
trabajadores (personas), y la caracterstica que se observa a cada elemento es el valor de su salario.
En una investigacin sobre comportamiento de las ventas de una comercializadora los elementos
podran ser las facturas (un objeto), y la caracterstica observada es el valor de cada factura.
Tambin, En una investigacin sobre comportamiento de las ventas de una comercializadora los
elementos podran ser los meses (un suceso), y la caracterstica observada el valor de las ventas de
cada mes
En una investigacin sobre los accidentes de trnsito los elementos son los accidentes (un suceso), y la
caracterstica observada podra ser el nmero de personas lesionadas por accidente observado
Los fenmenos se producen cuando el estado de las caractersticas observadas vara, usualmente, de un
elemento a otro
1.2.3
POBLACIN
Las poblaciones se deben definir con toda claridad de tal manera que no exista confusin sobre si un
determinado elemento pertenece o no a la poblacin. Para facilitar esta definicin, en muchos casos, las
palabras que la componen se pueden ordenar de acuerdo a la siguiente sintaxis:
TODOS(AS) + DESCRIPCIN DEL ELEMENTO + CONDICIN RESTRICTIVA
Significa que una definicin de poblacin debe empezar por la palabra Todos o Todas seguida de una
descripcin del elemento que se est observando ms una restriccin al alcance de la palabra Todos(as)
Ejemplo: En un estudio del nivel salarial de los operarios del sector de confecciones de la ciudad, una
definicin de poblacin podra ser la siguiente:
Todos los operarios del sector de confecciones de la ciudad
1.2.5
Es el nmero total de elementos que componen una poblacin. El tamao de una poblacin se suele
representar por la letra N
EJEMPLO:
Para indicar que una poblacin tiene 670 elementos se indica as: N = 670
1.2.6
CLASES DE POBLACIONES
VERSIN 11
FECHA: 2014
Pgina12
A los elementos de una poblacin se les observan sus caractersticas o la intensidad con que se presenta
una magnitud.
De acuerdo con su comportamiento las caractersticas que se observan en los elementos de una poblacin
se pueden clasificar en constantes o variables
1.2.7.1 CARACTERSTICAS CONSTANTES
Una caracterstica es constante cuando el valor que presenta esta caracterstica no vara de un elemento a
otro o vara muy poco; por ejemplo, la estatura de una persona adulta observada en los ltimos 20 meses o
la profesin de un graduado universitario.
1.2.7.2
CARACTERSTICAS VARIABLES
Es una caracterstica que cambia frecuentemente de valor cuando se observa en algunos o en todos los
elementos de la poblacin.
Es un smbolo que puede tomar diversos valores dentro de un conjunto determinado de valores que
reciben el nombre de dominio de la variable.(Significado matemtico)
La estadstica solamente estudia las caractersticas variables Estas caractersticas variables, comnmente
denominadas variables, pueden ser de dos clases:
Variables cualitativas o categricas
Variables cuantitativas
Variables cualitativas o categricas: Son las que describen el estado de la caracterstica nicamente
mediante palabras. Se refieren a atributos, cualidades, actitudes o preferencias de los elementos que se
estn estudiando
EJEMPLOS:
VERSIN 11
FECHA: 2014
Pgina13
Las profesiones u ocupaciones de un grupo de personas: Abogado, maestro, panadero, ingeniero, etc.
El estado civil de un grupo de personas: Soltero, casado, unin libre, etc.
El sabor de las naranjas de una cosecha: dulce, inspido, cido
El color favorito de un grupo de individuos: Blanco, rojo, verde, etc.
Pasatiempos de un grupo de estudiantes: Deportes, lectura, reuniones sociales, labores manuales, etc.
La calidad de un producto: Bueno, regular o defectuoso
Como se puede observar, en los ejemplos, cada una de estas variables se expresa a travs de dos o ms
modalidades o categoras: soltero, casado, unin libre; bueno, regular, defectuoso.
Los datos que se registran cuando las variables son cualitativas o categricas corresponden a la cantidad o
proporcin de elementos que caen dentro de cada categora que toma la variable, por ejemplo: el nmero de
abogados o de maestros, el nmero de individuos que prefieren el color blanco, la proporcin de productos
defectuosos.
Las variables categricas se pueden a su vez subdividir en variables nominales y variables ordinales.
Variables Nominales: Son las que no tienen una forma particular de organizar sus categoras. Por ejemplo,
no existe una forma comn de ordenar los colores o el estado civil de las personas.
Variables ordinales: Cuando existe una forma comn de organizar las categoras que toma la variable. Por
ejemplo: las modalidades como se puede expresar la calidad de un producto se pueden ordenar como
bueno, regular, defectuoso o al contrario, en defectuoso, regular, bueno. Las categoras con las que se
califica el servicio que presta una EPS se pueden ordenar como psimo, malo, regular, bueno o excelente.
Variables cuantitativas: Son las que se describen por medio de nmeros, por ejemplo, la edad de los
empleados de una empresa, las personas que visitan por da un museo, los saldos de las cuentas por
cobrar de una empresa, el peso de los paquetes que moviliza una empresa transportadora, el nmero de
vehculos que vende un concesionario, etc.
Las variables cuantitativas se pueden clasificar, tambin, en discretas o continuas:
Variables cuantitativas discretas: Son las que nicamente pueden tomar valores enteros tales como el
nmero de vehculos que vende un concesionario o el nmero de personas que asisten a una sala de cine
Variables cuantitativas continuas: Son las que se refieren a mediciones de magnitudes fsicas o a
caractersticas apreciables en unidades monetarias y admiten valores fraccionarios o decimales tales como
el peso de los paquetes que moviliza una transportadora, los saldos de las cuentas de ahorro de una entidad
financiera o el tiempo que dura el recorrido de un bus urbano.
Variables cuantitativas categricas: Cuando se quiere facilitar el manejo de los datos o aumentar la
comprensin de un fenmeno, las variable cuantitativas se pueden convertir en categricas, como cuando
las personas que miden menos de 1.50 metros se clasifican como de estatura pequea, las personas que
miden entre 1.50 metros y menos de 1.70 se clasifican como de estatura mediana y las personas que miden
1.70 metros o ms se clasifican como de estatura alta.
1.2.8
CENSO
Es cuando se observa y registra el estado de una caracterstica examinado a todos los elementos de una
poblacin
Los censos rara vez se realizan debido al tiempo que demandan y a la cantidad de recursos que necesitan
por lo que se recurre a tomar datos del estado de la variable en algunos de los elementos de la poblacin
1.2.9
MUESTRA
VERSIN 11
FECHA: 2014
Pgina14
VERSIN 11
FECHA: 2014
Pgina15
1.3.1
INTRODUCCIN
Para visualizar las caractersticas de una situacin representada por un conjunto de datos o establecer el
patrn de comportamiento de esta situacin, los datos se deben organizar de alguna manera. La Estadstica
propone una metodologa que consiste en agrupar los datos recolectados en conjuntos de categoras o
clases estadsticas y con este conjunto construir una tabla que se llama Distribucin de Frecuencias
1.3.2
En general, una clase o categora es un conjunto de elementos que tienen una o varias caractersticas en
comn, por ejemplo, las personas que compiten en algn deporte pertenecen a la clase de los deportistas,
las personas mayores de 60 aos pertenecen a la clase de la tercera edad
1.3.3
En estadstica se llama clase, nicamente, a un conjunto de datos que estn dentro de un intervalo
determinado de valores. Por ejemplo, para datos correspondientes a ingresos de personas podemos crear
una clase de las personas que tienen ingresos entre $500.000 y $800.000. Toda clase estadstica tiene, por
lo tanto, un lmite inferior ( $500.000 ), y un lmite superior ( $800.000 )
1.3.4
AMPLITUD DE CLASE
Es la distancia o diferencia que hay entre los lmites de una clase. En el ejemplo anterior la amplitud de la
clase de ingresos es de $300.000. Es decir, que para calcular la amplitud de clase se resta del lmite
superior de la clase el lmite inferior.
Para expresar estas ideas en smbolos, llamamos A a la amplitud de la clase, LS al lmite superior de la clase
y LI al lmite inferior de la clase, expresando aritmticamente la amplitud de la clase as:
A = LS LI
Para el ejemplo: A = LS - LI = $800.000 - $500.000 = $300.000
Entonces, para visualizar las caractersticas de un conjunto de datos, la Estadstica propone que se agrupen
estos datos en intervalos de valores o clases
1.3.5
Un conjunto de clases o categoras es considerado como un conjunto de clases estadstico s todas las
clases, del conjunto, tienen, simultneamente, las siguientes tres caractersticas:
Amplitud constante
Mutuamente excluyentes
Exhaustivas
Amplitud constante se refiere a que la amplitud de todas las clases de un conjunto de clases en que se
agrupa un determinado grupo de datos debe ser la misma para todo el conjunto.
Conjunto de clases mutuamente excluyentes se refiere a que cualquier dato, de un grupo de datos en
estudio, debe corresponder nicamente a una sola clase
VERSIN 11
FECHA: 2014
Pgina16
NMERO DE CLASES
Una de las primeras inquietudes que surge cuando se van a agrupar un conjunto de datos en clases
estadsticas es en cuantas clases es conveniente o adecuado agrupar estos datos. Hay varios criterios para
resolver este problema:
El nmero de clases es determinado por una circunstancia deseable u obligante
Determinar el nmero de clases de clases orientndose por una norma emprica de la estadstica
Determinar el nmero de clases utilizando la expresin emprica: No.C = 2 K
Determinar el nmero de clases utilizando la expresin emprica: No.C = 1 + 3,3 log( n )
Otros criterios
El primer caso se presenta, por ejemplo, cuando el estudio actual se va a comparar con un estudio anterior o
un estudio realizado por otro investigador. Entonces, para facilitar las comparaciones entre los dos estudios,
es deseable que los datos del estudio actual se agrupen con el mismo nmero de clases del estudio anterior
La norma emprica de la estadstica indica que el nmero de clases en que se deben agrupar cualquier
conjunto de datos debe ser como mnimo 5 6 clases y como mximo alrededor de 20 clases
En la expresin No.C = 2K, No.C es abreviatura de nmero de clases y K indica las clases en que, segn
esta expresin, se deben agrupar los datos.
Por ejemplo, para un estudio contiene 155 datos esta expresin funciona as:
S K = 6 clases, entonces, No.C = 26 = 64 como 64 < 155 el nmero de clases igual a 6 no es conveniente
S K = 7 clases, entonces, No.C = 27 = 128 como 128< 155 el nmero de clases igual a 7 no es conveniente
S K = 8 clases, entonces, No.C = 28 = 256 como 256> 155 el nmero de clases igual a 8, segn este
procedimiento, es al ms adecuado para agrupar los 155 datos del estudio.
En la expresin No.C = 1 + 3,3 log( n ), No,C es tambin, abreviatura de nmero de clases, log se refiere
a logaritmo con base 10 y n es la cantidad de datos que se desean agrupar
Por ejemplo, para el estudio de 155 datos se tiene: No.C = 1 + 3,3 log(155) = 8,23, quiere decir que el
nmero conveniente de clases, para agrupar estos 155 datos es de 8 clases
Otros criterios pueden ser, por ejemplo, nmeros de clases que hacen que los lmites de las clases sean
muy fciles de establecer o que las clases automticamente queden mutuamente excluyentes.
1.3.7
EJEMPLO PRCTICO
La siguiente tabla se refiere a los galones de gasolina corriente que tanquearon la semana pasada, en un
autoservicio, una muestra de vehculos escogidos al azar
3,8
2,8
4,8
6,1
1,7
4,7
5,3
3,0
2,8
3,3
4,9
1,9
2,0
6,9
3,0
6,4
2,5
5,0
3,9
2,6
1,8
2,6
2,0
2,0
2,9
4,0
5,6
2,0
3,6
2,7
2,3
2,6
2,2
4,1
4,5
3,1
3,0
3,4
2,9
Este ejemplo es til para fines de aprendizaje, porque en situaciones reales, se suelen manejar volmenes
de datos muy superiores al del presente ejemplo
MTODO ESTADSTICO
VERSIN 11
FECHA: 2014
Pgina17
Norma emprica: Se puede escoger cualquier nmero de clases entre 6 y 20 dependiendo del criterio
o preferencia personal del analista y se hacen varios tanteos hasta encontrar un nmero de clases
satisfactorio
VERSIN 11
FECHA: 2014
Pgina18
= 6,9
= 1,7
= 5,2
=
6
A
= 0,86667 Xmin = 1,5
Amod =
0,9
Rmod =
5,4
Rmod-R =
0,2
TABLA No.3
Menor
FA
FAA
FR
FRA
Que
FRA
9
9
0,23
0,23
1,5
0
14
23
0,36
0,59
2,4
0,23
6
29
0,15
0,74
3,3
0,59
5
34
0,13
0,87
4,2
0,74
2
36
0,05
0,92
5,1
0,87
3
39
0,08
1,00
6,0
0,92
39
1,00
6,9
1,00
La tabla No.2 recibe el nombre de DISTRIBUCIN DE FRECUENCIAS o TABLA DE FRECUENCIAS y los
detalles de su construccin sern explicados por el docente en la exposicin que haga sobre este tema y el
significado de las columnas FA, FR y FRA se expone a continuacin
No.
1
2
3
4
5
6
1.3.8
CLASES
1,5
2,4
2,4
3,3
3,3
4,2
4,2
5,1
5,1
6,0
6,0
6,9
Los tipos de frecuencias que se presentan en la tabla No.2 son los siguientes:
Frecuencia Absoluta FA: Es la cantidad de datos de la muestra que corresponden a cada clase. Se
obtiene por conteo
Frecuencia Absoluta Acumulada FAA: Se obtiene, para cada clase, sumando la frecuencia absoluta de
la clase, FA, con la frecuencia absoluta de la clase anterior
Frecuencia Relativa FR: Se calcula, para cada clase, dividiendo la frecuencia absoluta de la clase, FA,
entre el total de datos de la muestra. Es prctico que los valores de la frecuencia relativa se tomen con
dos decimales y su suma se ajuste para que d exactamente uno
Frecuencia Relativa Acumulada FRA: Se calcula, para cualquier clase, sumando la frecuencia relativa
de la clase, FR, con la frecuencia relativa de la clase anterior
LECTURA DE LA DISTRIBUCIN DE FRECUENCIAS
Esta tabla permite describir la situacin histrica de la venta de gasolina en esta estacin de servicio, por
ejemplo, la mayora de los vehculos de la muestra, un 36%, tanquearon entre 2,4 y 3,3 galones de
gasolina, el 5% de los vehculos de la muestra tanquearon entre 5,1 y 6,0 galones de gasolina y fue la clase
con menor frecuencia de tanqueo. Solamente tres vehculos de la muestra tanquearon ms de 6,0 galones.
VERSIN 11
FECHA: 2014
Pgina19
Es una tabla auxiliar que se construye a partir de las distribuciones de frecuencias acumuladas, FAA y FRA,
con el fin de facilitar la descripcin de la situacin utilizando estas frecuencias. Esta tabla se encuentra al
lado de la tabla de distribucin de frecuencias y se utiliz, en este caso, la columna de frecuencia relativa
acumulada.
Observando esta tabla se puede ver que el 59% de los vehculos de la muestra tanquearon menos de 3,3
galones de gasolina o que el 13% de los vehculos de la muestra tanquearon mas de 5,1 galones
1.3.10 REPRESENTACIN GRFICA DE LA SITUACIN EN ESTUDIO
La Estadstica Descriptiva utiliza tres tipos de grficos para representar cualquier situacin o fenmeno en
estudio:
El histograma
El polgono de frecuencias
La ojiva
Estos grficos permiten visualizar de manera fcil y rpida los resultados que se presentan en la distribucin
de frecuencias
1.3.10.1 EL HISTOGRAMA
Es un grfico de frecuencia absoluta, FA o la frecuencia relativa, FR, donde las clases se representan
mediante rectngulos. El siguiente histograma se refiere al ejemplo prctico y se utiliz la frecuencia relativa
HISTOGRAMA
0,40
0,36
FRECUENCIA RELATIVA
0,35
0,30
0,25
0,23
0,20
0,15
0,13
0,15
0,08
0,10
0,05
0,05
0,00
1.5
2.4
3.3
4.2
5.1
6.0
6.9
GALONES
VERSIN 11
FECHA: 2014
Pgina20
= 1,95
Las marcas de clase se utilizan, tambin, cuando se requiere representar todos los valores de una clase por
un solo nmero. Por ejemplo, 1,95 galones representa todos los valores de la muestra que se encuentran
entre 1,5 galones y 2,4 galones
Se puede construir, entonces, con las marcas de clase, una tabla auxiliar de clculos que permita elaborar
fcilmente el polgono de frecuencias, como se presenta a continuacin:
TABLA AUXILIAR DE CLCULOS
Marca de
No.
CLASES
clase
FR
0
0,6
1,5
1,05
0,00
1
1,5
2,4
1,95
0,23
2
2,4
3,3
2,85
0,36
3
3,3
4,2
3,75
0,15
4
4,2
5,1
4,65
0,13
5
5,1
6,0
5,55
0,05
6
6,0
6,9
6,45
0,08
7
6,9
7,8
7,35
0,00
Obsrvese que la tabla tiene ahora 8 clases porque se han agregado dos clases, la nmero cero y la nmero
7. A estas clases se les llama clases falsas porque no hay observaciones para ellas; su finalidad es
presentar el polgono de frecuencias como una figura cerrada
POLGONO DE FRECUENCIAS
0,40
0,36
FRECUENCIA RELATIVA
0,35
0,30
0,23
0,25
0,20
0,15
0,15
0,13
0,08
0,10
0,05
0,05
0,00
0,00
0,00
1,05
1,95
2,85
3,75
4,65
5,55
6,45
7,35
GALONES
Tanto el histograma como el polgono de frecuencias permiten visualizar algunas de las caractersticas de la
situacin o fenmeno que se est estudiando, tales como:
El rango de los datos
VERSIN 11
FECHA: 2014
Pgina21
OJIVA
FRECUENCIA RELATIVA ACUMULADA
1,2
1,00
1
0,87
0,92
0,74
0,8
0,59
0,6
0,4
0,23
0,2
0
0
1,5
2,4
3,3
4,2
5,1
6,0
6,9
GALONES
Los detalles sobre la construccin de estos grficos sern explicados por el docente en la exposicin que
haga sobre este tema
VERSIN 11
FECHA: 2014
Pgina22
Y0 = 0,74
Y1= ?
Y2 = 0,87
(1 0 )
(Y2 - Y0)
(2 0 )
(
(
Esto quiere decir que el 83% de los vehculos de la muestra tanquearon menos de 4,8 galones, pero, como
se quiere saber es que porcentaje tanque ms de 4,8 galones, se debe restar el resultado anterior de 1
1 - 0,83 = 0,17 = 17% que es, entonces, porcentaje de vehculos de la muestra que tanquearon mas de
4,8 galones
VERSIN 11
FECHA: 2014
Pgina23
EJEMPLO PRCTICO
Una muestra de 41 das del nmero de transacciones que se realizan por da en un cajero automtico se
presenta en la siguiente tabla:
73
83
87
47
80
68
56
91
81
84
76
79
78
54
36
71
62
49
90
67
60
64
91
77
51
41
87
72
63
45
91
66
63
52
61
67
74
68
75
57
85
Norma emprica: Se puede escoger cualquier nmero de clases entre 5 y 20 dependiendo del criterio
o preferencia personal del analista y se hacen varios tanteos hasta encontrar un nmero de clases
satisfactorio
No.C = 1 + 3,3 log (41) = 6,3 que indica que un nmero conveniente de clases para esta cantidad de datos
es de 6 clases.
2. Tipo de variable: En este caso es una variable discreta
3. Construccin de las clases o categoras: Los pasos se presentan encuentran en la siguiente tabla y son
especficos para variable discreta
VERSIN 11
FECHA: 2014
Pgina24
Xmax =
Xmin =
R
=
No.C =
A
=
Amod =
91
36
55
6
9,16667
9
En el clculo anterior se puede observar que para construir la amplitud modificada, se borra toda la parte
decimal de la amplitud, A, calculada
Cuando la amplitud modificada es un nmero impar, las marcas de clase, que se utilizan para representar a
las clases, son valores fraccionarios, como ocurre en este ejemplo; esta situacin es incmoda porque no
refleja la realidad en los casos de variable discreta, por lo que se prefiere agrupar los datos en clases que
sean de amplitud par, como se presenta a continuacin, para el mismo ejemplo, donde la amplitud se cambi
de 9 transacciones por da a 8 transacciones por da, esto hace que el nmero de clases pase de 6 a 7
Amod = 8
4. Construccin de la Distribucin de Frecuencias: El resultado de este proceso se presenta en la tabla No.4:
TABLA No.4
TABLA No.5
Menor
No.
CLASES
FA
FR
FRA
Que
FRA
1
36
44
2
0,05
0,05
36
0
2
45
53
5
0,12
0,17
45
0,05
3
54
62
6
0,14
0,31
54
0,17
4
63
71
9
0,22
0,53
63
0,31
5
72
80
9
0,22
0,75
72
0,53
6
81
89
6
0,15
0,90
81
0,75
7
90
98
4
0,10
1,00
90
0,90
41
1,00
99
1,00
Se observa, tambin, que el lmite inferior de cada clase es igual al lmite inferior de la clase anterior ms
uno. Tambin se puede ver que el lmite superior de la ltima clase, (98), no coincide con el Xmax, (91), de
los datos y el lmite inferior de la primera clase es el Xmin (36), de los datos.
Las clases construidas de esta manera se llaman CLASES CERRADAS, porque en cada clase se
contabilizan todos los datos incluidos entre los dos lmites de la clase. Sin embargo, estas clases, como se
puede observar, son de amplitudes constantes, mutuamente excluyentes y exhaustivas.
Tambin se observa que la tabla MENOR QUE, se construye de manera un poco distinta a como se hizo
para el caso de variable continua, ntese que el ltimo valor de la columna Menor Que, no es igual al lmite
superior de la ltima clase, sino a se valor ms uno.
1.4.2
REPRESENTACIN GRFICA
1.4.2.1 HISTOGRAMA
Para el caso de variable discreta el histograma, recibe tambin el nombre de DIAGRAMA DE
FRECUENCIAS y en l las clases se encuentran separadas, como se ve en el siguiente grfico:
VERSIN 11
FECHA: 2014
Pgina25
DIAGRAMA DE FRECUENCIAS
Frecuencia Relativa
0,25
0,22
0,22
0,2
0,15
0,14
0,15
0,12
0,1
0,1
0,05
0,05
0
36 44
45 53
54 62
63 71
72 80
81 89
90 98
Nmero de transacciones
Con frecuencia, en lugar de identificar cada clase con sus lmites de clase, es ms prctico utilizar la marca
de clase, como se muestra en este grfico, a continuacin
Diagrama de Frecuencias
Frecuencia relativa
0,25
0,22
0,22
0,20
0,15
0,14
0,15
0,12
0,10
0,10
0,05
0,05
0,00
40
49
58
67
76
85
94
Nmero de transacciones
Ahora es mucho ms fcil leer el diagrama de frecuencias, por ejemplo, en el 14% de los das de la muestra
se realizaron 58 transacciones, el nmero de transacciones por da menos frecuente, en la muestra, fue de
40 transacciones por da
1.4.2.2 POLGONO DE FRECUENCIAS
Se construye de la misma manera, a partir del diagrama de frecuencias y las marcas de clase, como se hizo
en el caso de variable continua. Ntese que en esta grfica se presenta una distorsin debido a que las
clases no son adyacentes
VERSIN 11
FECHA: 2014
Pgina26
Polgono de Frecuencias
Frecuencia Relativa
0,25
0,22
0,22
0,2
0,15
0,14
0,15
0,12
0,10
0,1
0,05
0,05
0
0,00
0
31
40
49
58
67
76
85
94
103
Nmero de Transacciones
1.4.2.3 OJIVA
Cuando la variable es discreta, como en este caso, la ojiva se construye de forma diferente, porque la
variable slo toma valores enteros, aunque, aqu tambin, este grfico se construye a partir de la tabla
MENOR QUE
OJIVA
1,2
1,00
1
0,9
0,75
0,8
0,53
0,6
0,31
0,4
0,17
0,2
0,05
36
45
54
63
72
81
90
99
Nmero de transacciones
Los detalles sobre la construccin de este grfico sern explicados por el docente en la exposicin que haga
sobre este tema
VERSIN 11
FECHA: 2014
Pgina27
1.5
Cuando el intervalo de valores que toma la variable es reducido y la variable es discreta, es ms prctico
agrupar los datos en clases de amplitud cero, como se muestra en el siguiente caso. Aqu X simboliza los
valores que toma la variable que son al mismo tiempo las clases estadsticas. Estas clases cumplen con las
tres caractersticas de una clase estadstica: son de amplitud constante, son mutuamente excluyentes y son
exhaustivas
EJEMPLO
Se tom una muestra de 60 facturas registrando el nmero de errores por factura. Los resultados se
presentan en la siguiente tabla:
1
2
0
4
2
0
0
1
3
1
2
0
1
1
0
1
0
3
2
1
0
0
3
1
X
0
1
2
3
4
FA
25
19
10
4
2
60
FR
0,42
0,31
0,17
0,07
0,03
1,00
0
0
1
0
3
2
FAA
25
44
54
58
60
0
1
0
0
1
2
1
4
1
1
0
0
FRA
0,42
0,73
0,90
0,97
1,00
MENOR
QUE
0
1
2
3
4
5
0
0
2
0
2
1
0
0
2
0
2
1
1
0
0
1
0
1
FRA
0
0,42
0,73
0,90
0,97
1,00
Diagrama de Frecuencias
30
25
No. de facturas
25
19
20
15
10
10
4
0
0
No. de errores
VERSIN 11
FECHA: 2014
Pgina28
Cuando la variable es cualitativa, el arreglo y presentacin de datos estadstico es limitado. Slo se pueden
construir distribuciones de frecuencias con las frecuencias absolutas y relativas y diagramas de frecuencias.
Adicionalmente, se utilizan en estos casos otros tipos de grficos como se presenta en el siguiente ejemplo:
EJEMPLO
Se interrog a una muestra de clientes de una cafetera sobre el tipo de bebida gaseosa que prefieren
obtenindose los siguientes resultados:
Cocacola
Postobn
Quatro
Sprite
Cocacola
Quatro
Pepsicola
Link
Cocacola
Quatro
Pepsicola
Seven Up
Cocacola
Postobn
Pepsicola
No.
1
2
3
4
5
6
7
Cocacola
Pepsicola
Postobn
Cocacola
Link
Postobn
Cocacola
Pepsicola
Postobn
Cocacola
CLASES
Cocacola
Link
Pepsicola
Postobn
Quatro
Seven Up
Sprite
FA
10
3
6
8
4
1
3
35
Link
Cocacola
Sprite
Cocacola
Postobn
Postobn
Quatro
Pepsicola
Postobn
Sprite
FR
0,29
0,09
0,17
0,23
0,11
0,03
0,08
1,00
Diagrama de Frecuencias
Frecuencia Relativa
0,35
0,3
0,29
0,23
0,25
0,2
0,17
0,15
0,11
0,09
0,1
0,08
0,03
0,05
0
Cocacola
Link
VERSIN 11
Sprite
FECHA: 2014
Pgina29
Seven Up
0,03
0,08
Sprite
0,29
0,11
Coca cola
Quatro
Postobn
0,23
Link
Pepsicola
0,09
0,17
VERSIN 11
FECHA: 2014
Pgina30
2.1.1
Anteriormente se vio que los fenmenos o hechos se pueden describir con tablas y grficos pero, tambin se
pueden describir con nmeros
2.1.2
En estadstica se llama medida a un clculo u operacin que se realiza sobre un conjunto de datos para
extraer alguna informacin
EJEMPLOS
Calcular la estatura promedio de un grupo de personas
Hallar la diferencia entre el mayor y el menor valor de un conjunto de datos
Establecer el valor que ms se repite dentro de un conjunto de datos
2.1.3
PARMETROS Y ESTADSTICOS
En la unidad anterior se vio que los clculos o medidas que se realizan con los datos referidos a una
situacin pueden clasificarse de dos maneras:
Parmetros: Cuando el clculo se realiza con todos los datos de la poblacin. Los parmetros son valores
constantes
Estadsticos: Cuando el clculo se realiza con una parte de los datos de la poblacin, es decir, una
muestra. Los estadsticos son variables
2.1.4
Son tres valores, con cada uno de los cuales, se pretende describir, parcialmente, el comportamiento de una
muestra o de una poblacin.
Las medidas tendencia central, reciben este nombre porque al representar el resultado de un clculo en un
grfico de una distribucin de frecuencias (histograma o polgono de frecuencias), el valor calculado siempre
se sita hacia el centro de la grfica.
2.1.6
Las medidas de dispersin son clculos o valores que indican que tan concentrados estn los datos
alrededor de un valor especial que se toma como referencia
VERSIN 11
FECHA: 2014
Pgina31
Las medidas de tendencia central y de dispersin pueden clasificarse como Parmetros o Estadsticos,
segn sea que los datos utilizados correspondan a una poblacin o a una muestra.
Los clculos de las medidas de tendencia central y de dispersin para poblaciones, en algunos casos, son
diferentes de los clculos de las medidas de tendencia central y de dispersin para muestras, por lo que se
utilizan, en estos casos, smbolos diferentes para cada tipo de medida.
2.1.8
LA MEDIA ARITMTICA
Existen dos tipos de media aritmtica: la Media Aritmtica Simple y la Media Aritmtica Ponderada. A la
media aritmtica simple se le llama usualmente La Media y la forma de calcularla depende de s los datos
estn o no agrupados en clases.
2.1.10 MEDIA ARITMTICA PARA DATOS NO AGRUPADOS
La media aritmtica, para datos no agrupados, se calcula sumando los valores registrados de la variable en
estudio y dividiendo entre el total de estos valores registrados. La expresin matemtica de este clculo
tiene dos presentaciones: una s los datos registrados corresponden a una poblacin y otra s los datos
corresponden a una muestra, tal como se indica a continuacin.
Xi
N
Para Poblaciones
Xi Para Muestras
n
VERSIN 11
FECHA: 2014
Pgina32
MES
Ingresos
(Miles de $ )
Enero
Febrero
Marzo
Abril
Mayo
Junio
800
950
920
1000
830
900
800 9 0 9 0
= $900 miles
SOLUCIN:
MES
Ingresos
(Miles de $ )
Enero
Febrero
800
950
Marzo
Abril
Mayo
Junio
920
1000
830
900
Suma
= 5400
00
6
= $900
5400
XiFAi
N
Para Poblaciones
XiFAi
n
Para Muestras
N Es el tamao de la poblacin
n Es el tamao de la muestra
Es la marca de clase de cada una de las clases en que se han agrupado los datos
Es la frecuencia absoluta de cada una de las clases en que se han agrupado los datos
EJEMPLO
Una muestra del valor de las facturas, en miles de pesos, que se cancelan con tarjetas de crdito en una
cadena de almacenes de modas se presenta en la siguiente tabla:
VERSIN 11
FECHA: 2014
Pgina33
Ventas
No. de
(Miles de $) Facturas
30
36
25
36
42
48
54
60
42
48
54
60
66
38
49
51
32
29
Ventas
No. de
(Miles de $) Facturas
224
Calcular la media aritmtica
interpretar el significado
30
36
42
48
54
36
42
48
54
60
60
66
Xi
XiFAi
25
38
49
51
32
33
39
45
51
57
825
1.482
2.205
2.601
1.824
29
63
224
1.827
10.764
SOLUCIN:
El total de la cuarta columna es = 10.764 y el total de datos, n, es 224, por lo que la media aritmtica
buscada es:
=
0.76
= $48.054 miles
Interpretacin: El valor de promedio de cada factura pagada con tarjeta de crdito es de $48.054 miles, que
es como si cada factura fuera de este valor
2.1.12 SIGNIFICADO DE LA MEDIA ARITMTICA
La media aritmtica o promedio calculada para un conjunto de datos significa que al remplazar el valor
promedio por cada uno de los datos se obtiene el mismo resultado general
2.1.13 MEDIA ARITMTICA PONDERADA
Existen situaciones en las cuales los datos registrados sobre una situacin traen in formacin adicional que
indica que estos valores no tienen la misma importancia relativa, como se presenta en el siguiente caso:
EJEMPLO
Las notas obtenidas por un estudiante en 3 quices de un corte y las notas finales, del semestre, extradas del
polgrafo correspondiente, se presentan en la siguiente tabla:
PRUEBA
Quiz No.1
Quiz No.2
Quiz No.3
Promedio
NOTA
3.5
4.1
2.4
3.3
ASIGNATURA
A
B
C
NOTA
FINAL
4.9
3.1
3.0
CRDITOS
2
4
3
En el caso de los quices no existe ninguna informacin que permita pensar que estas tres notas tienen
diferente nivel de importancia, por lo que su promedio se puede calcular utilizando la frmula de la media
para datos no agrupados, lo que no ocurre para el caso del polgrafo donde, por ejemplo, la nota de la
asignatura B vale el doble que la nota de la asignatura A; en casos como este, para calcular el promedio, se
VERSIN 11
FECHA: 2014
Pgina34
X i Wi
Wi
Xi
4,9
3,1
3.0
Xi Wi = 31.2
CRDITOS
Wi
2
4
3
9
XiW i
9,8
12,4
9.0
31,2
Wi = 9
P = 3.47
S para este caso del polgrafo el promedio se calculara como media aritmtica simple, ignorando la
informacin de los crditos, este clculo dara 3.7 que es diferente del promedio ponderado que da un valor
de 3.47
2.1.14 PROPIEDADES DE LA MEDIA ARITMTICA
El clculo de la media aritmtica tiene en cuenta todos los valores de la variable en estudio registrados
A todas las variables cuantitativas se les puede calcular la media aritmtica
Un conjunto de datos slo tiene una media
La media permite hacer comparaciones entre poblaciones o muestras
La media se puede trabajar matemticamente
La media es afectada por los valores extremos
No se puede calcular la media en distribuciones de frecuencias que tienen clase de extremo abierto
2.1.15 LA MEDIA GEOMTRICA
En muchas situaciones los datos se presentan en valores relativos tales como porcentajes o proporciones.
En tales casos el procedimiento de clculo de la media, que se ha estado utilizando hasta ahora, puede
apartarse de los resultados reales s la variabilidad de los datos es alta.
2.1.16 CLCULO DE LA MEDIA GEOMTRICA
Existe, entonces, una expresin matemtica especial para calcular promedios en los casos en que los datos
provengan de tasas de inters, porcentajes o nmeros ndices, entre otros. A este expresin matemtica se
le llama la media geomtrica y se suele representar por la letra G
G =
VERSIN 11
FECHA: 2014
Pgina35
00
Como el valor en porcentaje se llama comnmente Tasa, la expresin, ms apropiada, para el Factor de
Crecimiento es:
FC = 1 +
00
EJEMPLO
La rentabilidad de un ttulo valor ha estado variando en las ltimas semanas como se presenta en la
siguiente tabla:
Semana
Rentabilidad
1
2
3%
1%
3
-2%
4
0,7%
5
1,5%
6
1%
A qu tasa promedio semanal ha estado
variando la rentabilidad de este ttulo?
Semana
Rentabilidad
FC
1
2
3
4
5
6
3%
1%
-2%
0,7%
1,5%
1%
1,03
1,01
0,98
1,007
1,015
1,01
00
====>Tasa = ( FC 1 )x100
Por lo tanto:
Tasa promedio = (1.00856 1 ) x 100 = 0.856% 0.9%
Respuesta: El ttulo ha estado aumentado a una tasa promedio del 0.9% semanal
Cuando los datos se presentan en valores absolutos, pero, se debe calcular un porcentaje promedio, los
factores de crecimiento se determinan como se indica en el siguiente ejemplo:
EJEMPLO
Las ventas anuales de una empresa, en millones de pesos, se presentan en la tabla No.1. A qu tasa
promedio anual estn variando las ventas de esta empresa?
VERSIN 11
FECHA: 2014
Pgina36
AO
Ventas
(Millone
s)
2001
2002
68
75
2003
2004
2005
2006
2007
TABLA No.2
32
59
73
92
108
AO
Ventas
(Millone
s)
2001
2002
2003
2004
2005
68
75
32
59
73
1,1029
0,4267
1,8438
1,2373
2006
2007
92
108
1,2603
1,1739
FC
Tambin se puede calcular la media geomtrica para el caso de valores que varan en funcin del tiempo y
slo se conocen los valores inciales y finales del periodo, como se puede ver en el siguiente ejemplo:
EJEMPLO
Una persona invirti $25 millones a 3 aos, recibiendo al final de este periodo la suma de $33,306 millones
A qu tasa promedio mensual creci esta inversin?
La expresin de la media geomtrica para casos como este es la siguiente:
G=
valor final
valor inicial
36 33.306
Como la tasa que se pide es mensual el nmero de periodos es 36, por lo tanto, el ndice de la raz es 36
Para calcular la tasa promedio se aplica la expresin:
Tasa = ( FC 1 )x100
VERSIN 11
FECHA: 2014
Pgina37
NOTA
4.3
1.7
3.8
4.8
3.5
ESTUDIANTE
L. Rueda
J. Zrate
G. Torres
Z. Bentez
NOTA
2.9
4.0
1.2
4.7
Ordenando estos datos de menor a mayor donde el menor est en el extremo izquierdo y el mayor en el
extremo derecho de la fila se tiene:
1.2
1.7
2.9
3.5
3.8
4.0
4.3
4.7
4.8
El nmero que ocupa la posicin central es 3.8 porque por debajo de l hay 4 datos y por encima otros 4, por
lo tanto, 3.8 es el valor mediano
2.1.20 INTERPRETACIN DE LA MEDIANA
El docente que tom la muestra podra describir el comportamiento de los estudiantes en la prueba diciendo
que la mitad de las notas de la muestra se encuentran por debajo de 3.8 o por encima de 3.8
Alternativamente, el docente podra haber utilizado el promedio o media aritmtica para describir el
comportamiento de los estudiantes en la muestra, como se vio anteriormente, pero, la mediana, entonces, es
otra manera de describir una situacin que es diferente de la media aritmtica
2.1.21 SMBOLO DE LA MEDIANA
El smbolo utilizado, en estas notas, para representar la mediana es:
una equis con una onda en la parte superior que se lee equis mediana
VERSIN 11
FECHA: 2014
Pgina38
Esta expresin indica que el valor mediano ocupa la posicin (n + 1)/2 cuando los datos estn ordenados en
orden ascendente
Para aplicar esta expresin es preciso ordenar, entonces, los datos en orden ascendente e indicar la
posicin u orden de cada dato como se muestra a continuacin:
X1
1.2
X2
1.7
X3
2.9
X4
3.5
X5
3.8
X6
4.0
X7
4.3
X8
4.7
X9
4.8
Los Xi indican la posicin de cada dato, por ejemplo, X 7 indica que 4.3 ocupa la sptima posicin cuando
los datos estn ordenados de forma ascendente
Como el nmero de datos es 9, entonces (n+1)/2 es igual a 5, esto quiere decir que el valor mediano es el
valor que ocupa la quinta posicin cuando los datos estn ordenados de menor a mayor
= X = 3.8
tal como se haba establecido anteriormente por simple inspeccin
Nmero par de datos
Cuando el nmero de datos sin agrupar es par, la expresin para calcular la mediana es la siguiente.
=
X n / 2 X n / 21
2
Esto quiere decir que el valor mediano es el resultado de promediar los valores que ocupan las posiciones
X n / 2 y X n / 21
Para explicar esta expresin veamos el siguiente ejemplo:
EJEMPLO
Una muestra de las estaturas, en metros, de 10 estudiantes de una clase se presentan en la siguiente tabla:
ESTUDIANTE
ESTATURA
ESTUDIANTE
ESTATURA
M. Rodrguez
1.75
G. Lpez
1.69
L. Snchez
1.68
H. Nez
1.57
D. Rojas
1.81
T. Garca
1.77
J. Acevedo
1.65
R. Orduz
1.62
F. Daz
1.73
P. Pinzn
1.71
Al ordenar estos datos de forma ascendente e indicar la posicin de cada uno de ellos se llega a la siguiente
tabla:
VERSIN 11
FECHA: 2014
Pgina39
X1
1.57
X2
1.62
X3
1.65
X4
1.68
X5
1.69
X6
1.71
X7
1.73
X8
1.75
X9
1.77
X10
1.81
Como se puede observar, en esta ocasin, no existe un valor nico que se localice en el centro del conjunto
de datos ordenado, los valores X5 y X6 ocupan el centro de este conjunto y la mediana se localiza en el
punto medio entre estos dos datos , por lo que para establecer su valor se promedian 1.69 y 1.71 as:
=
X5 X6
2
1.69 1.71
= 1.70
2
Este valor se interpreta como que la mitad de los estudiantes de esta muestra miden menos de 1.70 metros
se deja al lector de estas notas, que como ejercicio, verifique que la expresin de la mediana para nmero
par de datos produce el mismo resultado anterior
2.1.23 CLCULO MEDIANA PARA DATOS AGRUPADOS
Recordemos que cuando se habla de datos agrupados nos referimos a datos agrupados en clases
Se presentan dos casos para el clculo de la mediana
Primer Caso
La frecuencia absoluta acumulada, FAA, hasta alguna de las clases, de la distribucin de frecuencias,
coincide con la cantidad total de datos dividida entre 2, es decir, ( n / 2), como se puede ver en el siguiente
ejemplo:
EJEMPLO
Los ingresos en una semana, en millones de pesos, de una muestra de tabernas se presenta en la siguiente
tabla:
clase
No.
1
2
3
4
5
6
7
Ingresos
(Millones de $)
1,6
1,9
1,9
2,2
2,2
2,5
2,5
2,8
2,8
3,1
3,1
3,4
3,4
3,7
Suma
No. De
tabernas
6
11
18
25
29
20
11
120
FAA
6
17
35
60
89
109
120
Como se puede observar el nmero de datos de la muestra n es 120, por lo tanto, n/2 es 60 y este valor
coincide con la frecuencia absoluta acumulada, FAA, hasta la cuarta clase. En este caso la mediana es igual
al lmite superior de la cuarta clase, es decir:
= Lmite superior de la clase = $2.8 millones
Este valor se puede interpretar diciendo que la venta mnima de la mitad de las tabernas de la muestra fue
de $2.8 millones
Segundo caso
El clculo del total de datos de la muestra dividido entre 2, n/2, no coincide con el valor de la frecuencia
absoluta acumulada, FAA, de ninguna de las clases
VERSIN 11
FECHA: 2014
Pgina40
n / 2 FAAi 1
FAi
= + A
Clase
No.
1
2
3
4
5
6
7
8
9
SALDO
MENSUAL
(Miles de $)
0
300
300
600
600
900
900
1.200
1.200 1.500
1.500 1.800
1.800 2.100
2.100 2.400
Mas de 2.400
No. De
depsitos
25
36
51
42
37
30
22
19
17
FAA
25
61
112
154
191
221
243
262
279
clase i - 1
clase i
El nmero total de datos de la muestra es 279 depsitos, por lo tanto, n/2 es $139.5 miles. El valor, de la
frecuencia absoluta acumulada, FAA; inmediatamente superior a ste es $154 miles, es decir, que la clase
en la que se encuentra la mediana es la cuarta clase que va de $900 a $1.200 miles. Esta es entonces la
clase i. La clase anterior a sta es la tercera clase y su frecuencia absoluta acumulada hasta aqu es $112
miles.
Reemplazando estos datos en la expresin de la mediana se obtiene lo siguiente:
139.5 112
= $1.096 miles
42
= 900 + 300
esto quiere decir que la mitad de los clientes de la muestra tenan un saldo, al final del mes observado,
inferior a $1.096.000
VERSIN 11
FECHA: 2014
Pgina41
20
18
28
32
23
28
32
Q1
Q2
Q3
Como se puede observar los nmeros 8, 15 y 23 dividen el conjunto en cuatro partes iguales. Estos valores
reciben, respectivamente, los nombres de Primer Cuartil, Segundo Cuartil y Tercer Cuartil
CUARTILES PARA DATOS NO AGRUPADOS
Revise el material CUARTILES Y PERCENTILES PARA DATOS NO AGRUPADOS, de estos mismos
apuntes
CUARTILES PARA DATOS AGRUPADOS
Primer caso:
La frecuencia absoluta acumulada hasta alguna de las clases coincide con el valor de la operacin
Qi x n
Donde:
00
Qi es el valor del cuartil que se pretende calcular, es decir: 25, 50 o 75
n es el tamao de la muestra
En este caso el cuartil buscado es igual al lmite superior de la clase
VERSIN 11
FECHA: 2014
Pgina42
1400
1500
1600
1700
1800
1900
2000
No. DE
ACCIONE
S
FAA
100
175
230
190
150
130
125
100
275
505
695
845
975
1100
00
00
00
= 275
1100
Segundo caso:
La frecuencia absoluta acumulada, FAA, hasta cualquiera de las clases no coincide con el valor de la
operacin Qixn/100
En este caso, el clculo del cuartil se hace de manera parecida al segundo caso del clculo de la mediana.
La expresin que se utiliza es la siguiente:
FAi
= + A
No. DE
ACCIONE
S
FAA
1300
1400
1500
1600
1700
1800
1400
1500
1600
1700
1800
1900
100
175
230
190
150
130
100
275
505
695
845
975
1900
2000
125
1100
1100
00
00
00
= 825
Q3 = $1787
VERSIN 11
FECHA: 2014
Pgina43
No. de
en minutos
Llamadas
00
0,0
2,0
46
46
2,0
4,0
4,0
6,0
67
44
113
157
6,0
8,0
Mas de
8,0
10,0
10,0
31
25
17
230
188
213
230
0 30
00
= 46
Segundo caso:
La frecuencia absoluta acumulada, FAA, hasta cualquiera de las clases no coincide con el valor de la
operacin 00
En este caso, el clculo del percentil se hace de manera parecida al segundo caso del clculo de la
mediana. La expresin que se utiliza es la siguiente:
VERSIN 11
FECHA: 2014
Pgina44
FAi
Pi = + A
No. de
Llamadas
FAA
0,0
2,0
2,0
4,0
46
67
46
113
4,0
6,0
8,0
Mas de
6,0
8,0
10,0
10,0
44
31
25
17
157
188
213
230
230
00
Clase i 1
Clase i
70 30
00
= 161
6
3
VERSIN 11
FECHA: 2014
Pgina45
21
19
23
22
27
20
26
22
24
21
22
28
20
30
23
21
22
19
28
22
19
25
31
22
18
21
24
22
26
EJEMPLO
Los puntajes alcanzados, en una escala de 100 puntos, en las pruebas de ingreso, por los aspirantes a
trabajar en una empresa se presentan en la siguiente tabla:
71
36
57
68
68
51
85
39
70
57
50
45
55
68
49
57
57
40
68
25
Interpretacin: Cuando un conjunto de datos tiene ms de una moda, esta medida de tendencia central no
es til para describir el comportamiento de los datos
EJEMPLO
El tiempo, en horas, que gastan los buses de una empresa de transportes en realizar el viaje entre dos
ciudades determinadas, en una muestra de recorridos escogidos al azar, se presenta en la siguiente tabla:
6,8
5,7
7,0
6,5
5,5
6,3
7,4
6,7
6,1
5,6
6,6
5,8
6,4
5,1
6,0
5,9
6,2
6,9
5,4
7,5
VERSIN 11
FECHA: 2014
Pgina46
No. de
Semanas
0
1
2
3
4
5
6
1
3
5
12
19
16
10
ms de 6
No. de
Profesionales
Sony
Motorola
L. G.
18
32
15
Nokia
Samsung
iPhone
Otras marcas
47
30
10
5
Tercer caso: Datos de variable discreta o continua agrupados en clases de amplitud mayor que cero
Se aplica la frmula como se muestra en el siguiente ejemplo
EJEMPLO
Utilizando un radar de carretera los agentes de trnsito tomaron una muestra de la velocidad, en kilmetros
por hora, a la que se desplazan los vehculos al pasar por un puente. Los resultados estn en la siguiente
tabla:
VERSIN 11
FECHA: 2014
Pgina47
Velocidad
(Kmts / hora)
No. de
Vehculos
1
2
3
Hasta
40
50
40
50
60
7
36
44
4
5
6
7
60
70
80
Mas de
70
80
90
90
61
55
19
14
= 60 + 10[
7 6
= 61 55 = 6
Interpretacin: Lo ms comn es que los
vehculos de la muestra se desplacen por el
puente a 67.39 Kmts / hora
VERSIN 11
FECHA: 2014
Pgina48
Para calcular la mediana, cuando se tienen distribuciones de frecuencia con amplitud igual a cero y datos
correspondientes a variable discreta se tiene dos casos
PRIMER CASO
La frecuencia acumulada hasta cualquiera de las clases es diferente de n/2
Este caso se presenta cuando ninguno de los valores de la columna de frecuencias relativas acumuladas o
FAA coincide con el tamao de la muestra dividida entre 2, es decir, n/2
EJEMPLO
La siguiente tabla se refiere a una muestra del nmero de computadores que vendieron en un mes 112
tiendas de tecnologa del pas escogidos al azar
No. De unidades No. De
vendidas
tiendas
0
1
1
12
2
18
3
23
4
21
5
19
6
18
112
La distribucin de frecuencias acumuladas de este ejemplo se presenta en la siguiente tabla, donde se
encuentra que n/2 es igual a 112/2 = 56
No. De unidades No. De
vendidas
tiendas
FAA
0
1
1
1
12
13
2
18
31
3
23
54
4
21
75
5
19
94
6
18
112
112
Como se observa ningn valor de FAA coincide con n/2
en este caso la mediana se encuentra en la clase cuya FAA sea ms prxima por arriba a n/2. Este valor es
75, entonces, la mediana se encuentra en la clase 4 (LI=4 y LS=4),. Por lo tanto la mediana es 4, es decir:
= 4
SEGUNDO CASO
Algn valor de la frecuencia absoluta acumulada coincide con n/2
Este caso se da cuando en la distribucin de frecuencias de la frecuencia absoluta acumulada, FAA, algn
valor de esta columna, es igual al tamao de la muestra dividido por 2, es decir, n/2
VERSIN 11
FECHA: 2014
Pgina49
VERSIN 11
FECHA: 2014
Pgina50
MEDIDAS DE DISPERSIN
Se haba dicho anteriormente que el objetivo de las medias de tendencia central es describir (parcialmente),
el comportamiento de un conjunto de datos que pertenezcan a una muestra o a una poblacin. Sin embargo,
esta capacidad descriptiva de las medidas de tendencia central es parcial porque es necesario
complementarla con otra caracterstica de las muestras y poblaciones que es la dispersin.
Para introducir el concepto de dispersin se presenta el siguiente caso:
EJEMPLO
Las ventas mensuales, en millones de pesos, de dos empresas se presentan en las siguientes tablas:
CREACIONES ARMANY
DISEOS GALAXIA
VENTAS
VENTAS
MENSUALES
No. De
MENSUALES
No. De
(MILLONES)
MESES
(MILLONES)
MESES
6
10
14
10
14
11
10
14
13
14
18
32
14
18
16
18
22
19
18
22
11
22
26
12
22
26
10
26
30
7
26
30
10
30
34
5
30
34
7
86
34
38
5
86
35
30
Meses
25
20
15
ARMANY
10
GALAXIA
5
0
4
12 16 20 24 28 32 36 40
Millones de pesos
VERSIN 11
FECHA: 2014
Pgina51
CONCEPTO DE DISPERSIN
DISPERSIN Y VARIABILIDAD
La variabilidad hace referencia a qu tan diferentes son entre s los datos de una muestra o una poblacin.
La dispersin y la variabilidad son conceptos sinnimos como se puede ver en los siguientes ejemplos:
1
3,8
10
3,8
En este caso todas las notas son iguales, por lo tanto, no hay ninguna variabilidad y ninguna dispersin
1
3,8
10
3,8
Ahora hay una nota diferente a las dems, por lo tanto, existe una pequea variabilidad entre los datos y una
pequea dispersin con respecto a la primera muestra
1
3,0
10
1,9
En esta ltima muestra, hay un aumento notorio en la variabilidad entre los datos y en la dispersin con
respecto a la muestra anterior
Es preciso resaltar, que la dispersin es un concepto relativo, siempre se evala comparando una muestra o
poblacin con algn valor de referencia o con otra muestra o poblacin
2.3.3
IMPORTANCIA DE LA DISPERSIN
Para que una medida de tendencia central sea representativa de los datos que la originaron se requiere que
su valor sea similar a los datos de esa muestra o poblacin que pretende describir, como se puede ver en el
siguiente ejemplo:
MUESTRA DE BAJA DISPERSIN
NOTAS DE UNA MUESTRA DE 10
ESTUDIANTES
1
2
3
4
5
6
7
8
9 10
3,2 3,5 3,8 3,5 3,8 3,7 3,6 3,8 3,9 3,5
= 3,6
Como se puede observar, en la muestra de baja dispersin, el valor del promedio es similar o est cerca de
los valores de la muestra, en cambio, en la muestra de alta dispersin, ninguno de los valores de la muestra
es parecido al valor de la media. Por lo tanto, el promedio de la primera muestra es verdaderamente
representativo de los datos de esta muestra y el de la segunda muestra no lo es.
DEPARTAMENTO DE CIENCIAS BSICAS
VERSIN 11
FECHA: 2014
Pgina52
El concepto de dispersin, entonces, es importante porque entre mayor sea la dispersin de un conjunto de
datos, menor es la fuerza representativa que tiene la medida de tendencia central calculada con esos datos
2.3.4
Las medidas de dispersin que se van a estudiar en estos apuntes son las siguientes:
El Rango
El Rango Intercuartlico
La Desviacin Media
La Varianza
La desviacin Estndar
2.3.5
EL RANGO
Es la diferencia o distancia entre el mayor valor, de un conjunto de datos y el valor menor. Este concepto ya
se haba mencionado para agrupar los datos en clases estadsticas, por lo tanto se utilizar para enunciarlo
el mismo smbolo, es decir la letra R, es decir,
R = Xmax - Xmin
EJEMPLO
Calcular el rango de los siguientes conjuntos de datos
NOTAS DE UNA MUESTRA DE 10
NOTAS DE UNA MUESTRA DE 10
ESTUDIANTES
ESTUDIANTES
1
2
3
4
5
6
7
8
9 10
1
2
3
4
5
6
7
8
9 10
3,2 3,5 3,8 3,5 3,8 3,7 3,6 3,8 3,9 3,5
0,1 3,5 0,7 5,0 1,0 4,7 4,9 3,8 3,9 0,9
R = 3,9 - 3,2 = 0,7
La dispersin de la muestra de la izquierda, medida por el rango, es menor que la dispersin de la muestra
de la derecha
El clculo anterior se realiz con muestras de datos que no estn agrupados. Cuando los datos ya estn
agrupados en clases el rango se establece restando del valor del lmite superior de la clase mas alta el valor
del lmite inferior de la clase mas baja. En smbolos:
R = LS clase ms alta - LI clase ms baja
EJEMPLO
Una muestra de las facturas que se cancelan con tarjetas de crdito en una cadena de almacenes de modas
se presenta en la siguiente tabla
Ventas
No. de
(Miles de $) Facturas
30
36
42
48
36
42
48
54
25
38
49
51
54
60
32
60
66
29
224
VERSIN 11
FECHA: 2014
Pgina53
EL RANGO INTERCUARTLICO
Una de las desventajas del rango es que solamente se tienen en cuenta, para su clculo, los valores
mximo y mnimo, por lo que no indica como estn distribuidos internamente los datos. Esta desventaja se
puede corregir con el rango intercuartlico
Para simbolizar el rango intercuartlico se utiliza, en estas notas, RQ y se calcula restando la diferencia entre
el primero y el tercer cuartil, es decir:
RQ = Q3 - Q1
Este rango muestra la dispersin de la porcin ms central de los datos que abarca el 50% del total
EJEMPLO
Las distancias en kilmetros, recorrida en un da por dos muestras de vehculos se presentan en la siguiente
tabla
MUESTRA A
MUESTRA B
Distancia
No. De
(Kilmetros) Vehculos
Distancia
(Kilmetros)
No. De
Vehculos
25
35
45
55
35
45
55
65
3
7
12
15
25
35
45
55
35
45
55
65
3
7
11
19
65
75
75
85
10
6
65
75
75
85
7
6
53
R = Xmax - Xmin = 60 Kmts
Q1 = 47,7 Kmts
53
R = Xmax - Xmin = 60 Kmts
Q3 = 67,75 Kmts
RQ = 20,05Kmts
Q1 = 48,0 Kmts
Q3 = 64,9 Kmts
RQ = 16,9 Kmts
Como se ve, aunque las dos muestras tienen el mismo rango, R, el rango intercuartlico es diferente, lo que
indica que la muestra B es menos dispersa que la muestra A
2.3.8
LA DESVIACIN MEDIA
Es la diferencia promedio, en valor absoluto, de los datos de la muestra o poblacin con respecto a su propia
media. La forma de la expresin de clculo vara dependiendo de que se trate de datos no agrupados o
datos agrupados
El smbolo que se utiliza en estos apuntes para la desviacin media son las iniciales DM
Desviacin media para datos no agrupados
DEPARTAMENTO DE CIENCIAS BSICAS
VERSIN 11
FECHA: 2014
Pgina54
DM =
Dnde:
DM: Smbolo de la desviacin media
: Cada uno de los datos de la muestra
: La media aritmtica de la muestra
n: El nmero de datos
|
|
La razn por la cual se extrae el valor absoluto es porque los nmeros tienen una propiedad que consiste en
que la suma de las diferencias de un conjunto de nmeros con respecto a su media siempre da igual a cero
EJEMPLO
Una muestra, al azar, del tiempo, en minutos, que duran las llamadas que se hacen desde un telfono, se
presenta en la siguiente tabla
3
14 24
9
7
12
Hallar la desviacin media de esta muestra
= 11,5
3
14
24
9
7
12
-8,5
2,5
12,5
-2,5
-4,5
0,5
8,5
2,5
12,5
2,5
4,5
0,5
31
3
DM = 6
= 5,2 minutos
Interpretacin: En promedio, la diferencia de cada llamada con respecto a la media es de 5,2 minutos
Desviacin media para datos agrupados
Dnde:
DM : smbolo de la desviacin media
| |
: La marca de clase de la clase i
DM =
220
240
260
280
300
320
340
No. De
vivienda
s
12
15
23
22
20
18
15
Valor arriendo
(miles de
pesos)
200
220
240
260
280
300
320
125
= $271,92 miles
220
240
260
280
300
320
340
12
15
23
22
20
18
15
210
230
250
270
290
310
330
-61,920
-41,920
-21,920
-1,920
18,080
38,080
58,080
125
DM =
61,92
41,92
21,92
1,92
18,08
38,08
58,08
743,04
628,8
504,16
42,24
361,6
685,44
871,2
3836,48
3836 8
VERSIN 11
= $30,7 miles
FECHA: 2014
Pgina55
LA VARIANZA
La Varianza, al igual que la desviacin media utiliza, para medir la dispersin, las desviaciones de los datos
con respecto a la media, pero, en este caso, estas desviaciones se elevan al cuadrado. Por lo tanto, se
puede decir que la varianza es el promedio de las desviaciones, de los datos, con respecto a la media
elevadas al cuadrado.
Para el clculo de la varianza, lo mismo que para las medidas de dispersin estudiadas anteriormente, se
debe tener en cuenta s los datos estn o no agrupados, pero, adicionalmente, el clculo de la varianza es
ligeramente diferente segn se trate con poblaciones o muestras, por lo que se utilizan smbolos diferentes
para indicar cada una de estas dos situaciones
VARIANZA POBLACIONAL
Es la varianza que se calcula utilizando todos los datos de una poblacin
Smbolo:
Varianza poblacional para datos no agrupados
=
( )2
Dnde :
= Cada dato de la poblacin
= La media de la poblacin
N = El tamao de la poblacin
EJEMPLO
Los siguientes datos corresponden a los puntajes obtenidos por los aspirantes a un cargo en una empresa
Tabla de clculo
PUNTAJES
60
81
77
72
91
90
= 78,5 puntos
60
-18,5
342,25
81
77
72
91
90
2,5
-1,5
-6,5
12,5
11,5
6,25
2,25
42,25
156,25
132,25
68
6
=
113,58 puntos al
cuadrado
681,5
Varianza poblacional para datos agrupados
= Es la marca de clase de c/u de las clases en que se agrupa la
( )2
poblacin
=
= La media de la poblacin
VERSIN 11
FECHA: 2014
Pgina56
Kilogramos Empleados
39
49
5
44
-30,2
912,04
4560,20
39
49
5
49
59
11
54
-20,2
408,04
4488,44
49
59
11
59
69
50
64
-10,2
104,04
5202,00
59
69
50
69
79
31
74
-0,2
0,04
1,24
69
79
31
79
89
27
84
9,8
96,04
2593,08
79
89
27
89
99
18
94
19,8
392,04
7056,72
89
99
18
99 109
9
104
29,8
888,04
7992,36
99 109
9
151
31894,04
151
= 74,2 kilogramos
3 89 0
Ntese que si la poblacin es infinita no se puede calcular la varianza poblacional porque el valor de N sera
infinito.
VARIANZA MUESTRAL
Es la varianza que se calcula sobre los datos de una muestra. El clculo con respecto a la varianza
poblacional difiere en que, el divisor de la expresin ya no es N, el tamao de la poblacin, ahora es (n 1),
que es el tamao de la muestra, n, menos una unidad.
Smbolo:
Varianza muestral para datos no agrupados
Dnde:
( )2
: Es cada uno de los datos de la muestra
=
: Es la media de la muestra
n : Es el tamao de la muestra
La razn por la cual se divide entre n - 1 es porque, de esta manera, s2, es un estimador insesgado de la
varianza de la poblacin de la cual se extrajo la muestra. El concepto de estimador insesgado se estudia en
el curso de Estadstica Inferencial.
VERSIN 11
FECHA: 2014
Pgina57
62
234
532
200
Tabla de clculo
(
157
62
234
532
200
90
90
= $212,5 miles
-55,5
-150,5
21,5
319,5
-12,5
-122,5
3080,25
22650,25
462,25
102080,25
156,25
15006,25
3. 3
(6
= 28.687,10 miles de
pesos al cuadrado
143.435,50
Varianza muestral para datos agrupados
Dnde:
( )2
: Es la marca de clase de c/u de las clases en que se agrupa la muestra
=
( )
: Es la media aritmtica de la muestra
:Es la frecuencia absoluta de cada clase
n : Es el tamao de la muestra
EJEMPLO
Una muestra del tiempo, en horas, que demora el almacn de materiales de una fbrica en surtir los pedidos
que recibe:
Datos
Tabla de clculo
Tiempo
No. de
Tiempo
(Horas)
pedidos
(Horas)
0
2
2
4
10
16
0
2
2
4
10
16
1
3
-5,3
-3,3
28,09
10,89
280,90
174,24
4
6
8
10
6
8
10
12
33
45
26
10
4
6
8
10
6
8
10
12
33
45
26
10
5
7
9
11
-1,3
0,7
2,7
4,7
1,69
0,49
7,29
22,09
55,77
22,05
189,54
220,90
140
140
= 6,3 horas
=(
9 3 0
0
943,40
Como se puede observar, en los ejemplos anteriores, todas las unidades de la desviacin estndar estn
elevadas al cuadrado por lo que es difcil interpretar el significado del valor de la varianza; esta en una de las
razones por las cuales, para medir la dispersin, se prefiere otra medida que es la Desviacin Estndar
2.3.10 LA DESVIACIN ESTNDAR
Conocida tambin como Desviacin Tpica, la desviacin estndar es la raz cuadrada de la varianza. Los
smbolos que se utilizan son , para clculo de la dispersin en poblaciones y s, para el clculo de la
dispersin en muestras
VERSIN 11
FECHA: 2014
Pgina58
Datos agrupados
()2
= =
( )2
Datos agrupados
( )2
(
s= =
( )2
(
Las tablas de clculo para la desviacin estndar son idnticas a las que se utilizan para la varianza, con un
clculo adicional: extraer la raz cuadrada de la varianza
EJEMPLO
En un ejemplo anterior se vio que los puntajes de los aspirantes a un cargo, en una empresa fueron:
60
PUNTAJES
81 77 72 91
y se calcul que:
= 113,58 puntos al cuadrado
Por lo tanto,
= = 113 58 = 10,7 puntos
90
EJEMPLO
En otro caso se estableci que el tiempo, en horas, que demora el almacn de materiales de una fbrica en
surtir los pedidos que recibe
Tiempo
No. de
Y se calcul que:
(Horas)
pedidos
0
2
4
6
8
2
4
6
8
10
10
12
10
16
33
45
26
Por lo tanto:
s=
= 6 8 = 2,6 horas
10
140
Aunque es indispensable que se conozca, a ciencia cierta, como se obtienen la cifras de los clculos de la
media aritmtica y la desviacin estndar, en la prctica, la tecnologa disponible permite que estas
operaciones se hagan de forma ms rpida y segura utilizando las funciones estadsticas de las calculadoras
cientficas o de las hojas electrnicas de los programas de computador, por lo que se debe consultar, por lo
menos, en los manuales de las calculadoras, los detalles de la forma como se ejecutan estas funciones.
VERSIN 11
FECHA: 2014
Pgina59
= 4 Kilos
= 50 Kilos
S = 2 Kilos
S = 2 kilos
La primera impresin que se obtiene de una observacin desprevenida de estos resultados es que las dos
muestras tienen la misma dispersin porque sus desviaciones estndar son iguales. Sin embargo, si se
examina con ms atencin, se puede ver que en el caso de la seccin de materiales livianos, la desviacin
estndar equivale a la mitad del peso promedio de los materiales de la muestra. En cambio, en la seccin de
materiales pesados la desviacin estndar equivale nicamente a 1/25 del peso promedio de los paquetes.
Por lo que comparadas las dos desviaciones estndar con la magnitud de su respectivo promedio, es mucho
ms alta la dispersin de la seccin de materiales livianos.
De este anlisis se concluye que la desviacin estndar en casos como el del ejemplo, no permite comparar
la dispersin de dos muestras y se puede agregar que esta dificultad se presenta cuando las medias de las
muestras que se estn comparando son muy diferentes entre s.
Para resolver este inconveniente, la estadstica dispone de un indicador para medir la dispersin. Este
indicador es el Coeficiente de Variacin y se calcula con la siguiente expresin:
COEFICIENTE DE VARIACIN PARA
POBLACIONES
SMBOLO : CV
CV =
CV =
El coeficiente de variacin es un nmero sin dimensiones por lo que se puede expresar en fracciones
decimales o en porcentaje
EJEMPLO
Se tomaron muestras de las ventas diarias, en miles de pesos, de dos vendedores de una empresa. Cul
de las dos muestras es ms dispersa?
VENTAS DEL VENDEDOR A
500
450
390
600
290
400
80
25
= $438,6 miles
23
90
10
= $47,5 miles
S = $96,5 miles
CV = 0,22
57
$33,1 miles
CV = 0,70
VERSIN 11
FECHA: 2014
Pgina60
DISTRIMODA
VENTAS POR DA
(Millones de pesos)
Ventas
No. de
Ventas
No. de
por da
das
por da
das
0,9
1,1
1,3
1,5
1,7
1,9
2,1
1,1
1,3
1,5
1,7
1,9
2,1
2,3
3
9
16
23
29
20
11
9,2
10,3
11,4
12,5
13,6
14,7
10,3
11,4
12,5
13,6
14,7
15,8
12
16
25
19
10
9
91
111
Solamente se necesita establecer la marca de clase de ambas tablas y el resto de los clculos se realizan
directamente aplicando las funciones estadsticas de las calculadoras cientficas
JEANS AND BREECHES
VENTAS POR DA
(Millones de pesos)
DISTRIMODA
VENTAS POR DA
(Millones de pesos)
Ventas
No. de
por da
das
Xi
Ventas
No. de
por da
das
Xi
0,9
1,1
1,3
1,5
1,7
1,1
1,3
1,5
1,7
1,9
3
9
16
23
29
1,0
1,2
1,4
1,6
1,8
9,2
10,3
11,4
12,5
13,6
10,3
11,4
12,5
13,6
14,7
12
16
25
19
10
9,75
10,85
11,95
13,05
14,15
1,9
2,1
2,1
2,3
20
11
2,0
2,2
14,7
15,8
15,25
91
111
= 12,26428571
CV = 0,13255294
= 1,706306306
CV = 0,17868609
S = 1,62566714
S = 0,30489321
Respuesta: Es ms confiable el promedio diario de Distrimoda porque tiene el menor coeficiente de variacin
VERSIN 11
FECHA: 2014
Pgina61
VERSIN 11
FECHA: 2014
Pgina62
3.1.1
REGRESIN
INTRODUCCIN
CONCEPTO DE REGRESIN
Es un mtodo de clculo para establecer la relacin matemtica que existe entre dos o ms situaciones o
variables, que la observacin o el sentido comn indican que tienen comportamientos que estn
relacionados
3.1.3
IMPORTANCIA DE LA REGRESIN
Este mtodo aplicado al anlisis estadstico permite predecir matemticamente el comportamiento de una
variable a partir del comportamiento conocido de otra u otras variables. Esta relacin entre las variables se
establece a travs de una ecuacin que se llama Ecuacin de Regresin
3.1.4
Al establecer la relacin entre dos variables se encuentra que el comportamiento de una variable depende
del comportamiento de otra u otras variables o que la manifestacin de una variable ocurre primero que la
manifestacin de otra u otras variables. A la variable que ocurre primero o que determina el comportamiento
de otra se le llama Variable Independiente y se suele representar por la letra X y a la otra variable se le
llama Variable Dependiente y se suele representar por la letra Y
EJEMPLOS:
Tasa de desempleo y ventas del comercio: La variable independiente o variable x es la tasa de desempleo
y la variable dependiente o variable y es las ventas del comercio
Accidentes de trnsito y ventas de licor: La variable independiente es las ventas de licor y la variable
dependiente los accidentes de trnsito
El nmero de personas que se movilizan en bus puede depender de las ventas de motocicletas y del
estado del clima, por lo que el nmero de personas que utilizan el servicio de bus es la variable
dependiente y las otras dos son las variables independientes
VERSIN 11
FECHA: 2014
Pgina63
GRFICO DE DISPERSIN
Es la representacin grfica, en el plano cartesiano, en forma simultnea, de los valores que toman la
variable independiente (x) y la variable dependiente (y)
EJEMPLO
Se tomaron datos sobre el kilometraje recorrido por un vehculo y el consumo de gasolina, en galones, como
se presenta en la siguiente tabla:
Kilmetros
X
30
50
10
40
60
20
Galones
Y
5,95
8,55
2,35
9,25
13,85
6,75
La representacin grfica de los valores de esta tabla en el plano cartesiano, recibe el nombre de Grfico de
Dispersin como se muestra a continuacin:
Grfico de dispersin
Galones consumidos
16
14
12
10
8
6
4
2
0
0
10
20
30
40
50
60
70
Kilmetros recorridos
3.1.6
La relacin entre dos o ms variables que como dijimos anteriormente matemticamente recibe el nombre
de regresin se puede clasificar de dos formas:
VERSIN 11
FECHA: 2014
Pgina64
TIPOS DE REGRESIN
Regresin Univariada
Se presenta cuando slo interviene una variable independiente
Regresin Multivariada
Se presenta cuando interviene ms de una variable independiente
Regresin lineal
Se presenta cuando la representacin grfica de la ecuacin de regresin es una lnea recta.
Regresin Curvilnea
Se presenta cuando la representacin grfica de la ecuacin de regresin es una curva
Tanto la regresin lineal como la curvilnea tienen dos formas de manifestarse: en forma directa o en forma
inversa
Regresin Lineal Directa
Ocurre cuando al aumentar el valor de la variable independiente aumenta, proporcionalmente, el valor de la
variable dependiente. Por lo tanto, una recta parece describir de manera apropiada la relacin entre estas
variables, como se puede ver en el siguiente grfico
VERSIN 11
FECHA: 2014
Pgina65
Y
5
4
3
9
7
5
10
9
8
7
Variable Y
X
8
13
6
24
18
20
6
5
4
3
2
1
0
0
10
15
20
25
30
Variable X
10
9
8
variable Y
La curva de regresin
(una recta), que mejor
describe la relacin
entre estas dos
variables, se presenta
en la grfica de la
izquierda
6
5
4
3
2
1
0
0
10
15
20
25
30
Variable X
VERSIN 11
FECHA: 2014
Pgina66
Y
9
24
11
6
14
30
25
20
Variable Y
X
19
3
16
24
8
15
10
5
0
0
10
15
20
25
30
Variable X
La curva de regresin (una recta), que mejor describe la relacin entre estas dos variables, se presenta en la
siguiente grfica:
30
25
variable Y
20
15
10
5
0
0
10
15
20
25
30
Variable X
VERSIN 11
FECHA: 2014
Pgina67
Y
12
21
6
7
17
8
25
20
Variable Y
X
16
18
8
12
17
10
15
10
5
0
0
10
15
20
Variable X
La curva de regresin, que mejor describe la relacin entre estas dos variables, se presenta en la siguiente
grfica
25
Variable y
20
15
10
5
0
0
10
15
20
Variable X
VERSIN 11
FECHA: 2014
Pgina68
Y
2
9
7
18
2
20
18
16
14
Variable Y
X
14
5
10
2
20
12
10
8
6
4
2
0
0
10
15
20
25
Variable X
La curva de regresin, que mejor describe la relacin entre estas dos variables, se presenta en la siguiente
grfica:
20
18
16
Variable Y
14
12
10
8
6
4
2
0
0
10
15
20
25
Variable X
VERSIN 11
FECHA: 2014
Pgina69
12
10
Variable Y
X
13
2
15
5
4
7
0
0
10
12
14
16
Variable X
3.1.7
LA REGRESIN LINEAL
Cuando los puntos del grfico de dispersin se pueden relacionar con una recta que pase lo mas cerca
posible de todos ellos, a esta recta se le llama Recta de Mnimos Cuadrados, porque la suma de las
distancias al cuadrado, de los puntos del grfico a esta recta es mnima
Esta recta tiene por ecuacin Y = A + B X, donde A es el punto donde la recta corta al eje Y, y B es la
pendiente de la recta. El proceso para determinar el valor de los parmetros A y B es complejo, pero, el
estudiante interesado lo puede consultar en cualquier texto de estadstica. En el curso, se determinarn
utilizando las funciones de las calculadoras cientficas.
EJEMPLO
Se compar el tiempo total que realmente dura encendido, de forma intermitente, un celular, con la duracin
de su batera, obteniendo los valores que se presentan en la siguiente tabla:
celular
encendido
(segundos)
360
270
480
120
440
230
160
duracin
batera
(horas)
3,2
3,5
1,9
3,9
2,3
3,2
4,1
Como el tiempo de duracin de la batera depende del tiempo total, que de forma intermitente dura
encendido el celular, la variable dependiente es el tiempo de duracin de la batera y la variable
independiente el tiempo en segundos que dura encendido el celular, como se presenta a continuacin
VERSIN 11
FECHA: 2014
Pgina70
Y
duracin
batera
(horas)
3,2
3,5
1,9
3,9
2,3
3,2
4,1
4,0
3,5
3,0
2,5
2,0
1,5
1,0
0,5
0,0
0
100
200
300
400
500
600
Duracin de la batera en
horas
Trazando una recta que pase lo ms cerca posible de todos los puntos, el grfico queda as:
4,5
4,0
3,5
3,0
2,5
2,0
1,5
1,0
0,5
0,0
0
100
200
300
400
500
600
Entre ms tiempo dure el celular encendido menos tiempo durar la batera por lo que la relacin entre las
dos variables en inversa y la pendiente de la recta es, por lo tanto negativa. Adicionalmente, se observa que
la relacin entre las dos variables es de tipo lineal, donde los parmetros de la recta de regresin son:
VERSIN 11
FECHA: 2014
Pgina71
A =
B =
4,7764201
-0,0055024
COSTO DE
REPARACIN
DE VAS
KILOMETRAJE RECORRIDO
TIPO DE VEHCULO
MARCA
CONSUMO DE
COMBUSTIBLE
DE UN
VEHCULO
ESTADO MECNICO
ESTILO DE CONDUCCIN
TOPOGRAFA DE LA VA
EDAD DEL VEHCULO
VERSIN 11
FECHA: 2014
Pgina72
EL COEFICIENTE DE CORRELACIN
Es una medida del grado en que una variable independiente influye en una variable dependiente
Este grado de la relacin entre dos variables se mide con un indicador que recibe el nombre de coeficiente
de correlacin.
El coeficiente de correlacin es un nmero adimensional que se representa por la letra r y toma valores entre
-1 y +1. El significado de estos valores que toma r es el siguiente:
EL COEFICIENTE DE DETERMINACIN
VERSIN 11
FECHA: 2014
Pgina73
VERSIN 11
FECHA: 2014
Pgina74
PRINCIPIOS DE PROBABILIDAD
Tipos de fenmenos:
Cualquier accin que tenga varios resultados posibles conocidos de los cuales ocurre solo uno
Lanzar una moneda
Iniciar una empresa
Medir alguna caracterstica de las piezas que salen de produccin
Cuntas veces se avera una mquina en el mes
Qu va a responder una persona sobre un tema que se le pregunte
4.1.3
Definiciones de probabilidad:
4.1.4
Necesidad de la probabilidad:
4.1.5
VERSIN 11
FECHA: 2014
Pgina75
4.1.5.5
si x = cualquier suceso
La suma de las probabilidades de todos los resultados de s debe siempre dar exactamente 1
4.1.6
Mtodo Clsico
Mtodo Emprico o de la Frecuencia Relativa
Mtodo Subjetivo
Ejemplos :
VERSIN 11
FECHA: 2014
Pgina76
No. de
muestras
10
22
15
10
7
5
3
72
FR
0,14
0,30
0,21
0,14
0,10
0,07
0,04
1,00
???
Prctica: De una caja que contiene 10 fichas numeradas del cero al nueve se extrae una ficha al azar.
Cul e s la probabilidad de que la ficha seleccionada sea un nmero mayor que 6?
Muestreo
Concepto de muestra: Se examina el estado de la variable observando parte de los elementos de una
poblacin
Muestreo: Tcnicas para seleccionar las muestras
Muestreo: experimento aleatorio
VERSIN 11
FECHA: 2014
Pgina77
Ensayos
Concepto: Cada uno de los intentos o pruebas con los que se realiza un experimento aleatorio
Principio del muestreo : Simultneamente = En sucesin
4.1.9
Diagrama de rbol
A
A
A
A
A
A
Ejemplo: de una caja que tiene 4 fichas marcadas con las letras A, B, C y D se extraen 3 fichas sin
reemplazamiento
B
B
C
C
D
D
C
D
B
D
B
C
B
B
B
B
B
B
A
A
C
C
D
D
C
D
A
D
A
C
C
C
C
C
C
C
A
A
B
B
D
D
B
D
A
D
A
B
D
D
D
D
D
D
A
A
B
B
C
C
B
C
A
C
A
B
4.1.10.3 Combinaciones
Condicin: muestreo sin remplazamiento
Concepto de combinacin
Frmula para el clculo del nmero de combinaciones
VERSIN 11
FECHA: 2014
Pgina78
COMBINACIONES
A
Ms de un ensayo:
Sucesos independientes
Sucesos dependientes
Suma de probabilidades
Complemento
Multiplicacin o Probabilidad Conjunta
Divisin o Probabilidad Condicional
4.1.12.2 Complemento
S se tiene un suceso A cuya probabilidad de ocurrencia () se conoce, la probabilidad de que no ocurra
el suceso A es: () = 1 ()
Ejemplo: la probabilidad de que al lanzar un par de dados, la suma de las caras sea un nmero mayor
que 8 es:
A = Suma de las caras > 8 () = 8
() = 1
( ) = 1
3
8
VERSIN 11
FECHA: 2014
Pgina79
suceso B
( ) = () ()
4.1.12.4 Probabilidad condicional
Condicin: un solo ensayo
Significado: Para dos sucesos A y B cualquiera
La probabilidad de que ocurra el suceso A s el suceso B ya ocurri:
( ) =
( )
() ()
=
()
()
Ejemplo
Una fbrica tiene en existencia, repuestos comprados a 3 proveedores, con la calidad y cantidad que se
muestran en la siguiente tabla:
CALIDAD
Primera
Segunda
TOTAL
A
20
10
30
PROVEEDOR
B
12
8
20
C
6
4
10
TOTAL
38
22
60
S se escoge un repuesto al azar y sale de segunda Cul es la probabilidad de que sea del proveedor C?
4.1.13 Teorema de Bayes
VERSIN 11
FECHA: 2014
Pgina80
VERSIN 11
FECHA: 2014
Pgina81
Ejemplo:
Lanzar 2 monedas
ESPACIO
MUESTRAL
C C
C S
S C
S S
X =
No. de caras
2
1
1
0
Ejemplo:
Tiempo en minutos que demora un vehculo en recorrer un tramo de la autopista
si x = duracin del recorrido en minutos
VERSIN 11
FECHA: 2014
Pgina82
X
0
1
2
TOTAL
P(x)
1/4
2/4
1/4
4/4 =1
Ejemplo:
De una caja que tiene 4 fichas numeradas del cero al tres, se extraen al azar 2 fichas sin reemplazamiento.
S x = suma de los nmeros de las fichas extradas, establecer la distribucin de probabilidad de esta v.a.
VERSIN 11
FECHA: 2014
Pgina83
o ( )
Ejemplo:
Hallar el valor esperado del nmero de caras al lanzar 2 monedas
x
0
1
2
P(x)
1/4
2/4
1/4
TOTAL
xP(x)
0
2/4
2/4
4/4
Ejemplo:
Calcular la desviacin estndar de la v.a. x = Nmero de caras al lanzar 2 monedas
2
x
0
1
2
x
0
1
4
P(x)
1/4
2/4
1/4
suma
x P(x)
0
2/4
4/4
6/4
VERSIN 11
FECHA: 2014
Pgina84
Condiciones:
Los resultados se pueden dividir en 2 categoras: xito o Fracaso
Estos resultados son mutuamente excluyentes y estadsticamente independientes
La probabilidad p de xito permanece constante en todos los ensayos
Se conoce n, el nmero de ensayos
Ejemplo : lanzar una moneda n veces
Condiciones:
Es el nmero de veces que ocurre la variable aleatoria en un intervalo definido de tiempo o sector
definido de espacio (rea o volumen)
Los sucesos ocurren de manera completamente aleatoria
Los intervalos de tiempo o sectores de espacio no se superponen y son independientes
La probabilidad de que ocurra un evento es proporcional al tamao del intervalo de tiempo o sector del
espacio
Caractersticas:
Unimodal
DEPARTAMENTO DE CIENCIAS BSICAS
VERSIN 11
FECHA: 2014
Pgina85
Simtrica
Medidas de tendencia central sobre el eje de simetra
Rango : de - a +
Asinttica con respecto al eje x
rea total bajo la curva = 1 dividida en dos partes iguales
Ejemplo:
ir
0,25
0,2
0,15
0,1
0,05
4
4,4
4,8
5,2
5,6
6
6,4
6,8
7,2
7,6
8
8,4
8,8
9,2
9,6
10
10,4
10,8
11,2
11,6
12
12,4
12,8
13,2
13,6
14
14,4
14,8
15,2
15,6
16
Ejemplo:
VERSIN 11
FECHA: 2014
Pgina86
VERSIN 11
FECHA: 2014
Pgina87
VERSIN 11
FECHA: 2014
Pgina88
LEVIN, Richard, et al. Estadstica para Administracin y Economa Sptima edicin. PEARSON
EDUCATION. Mxico. 2004
MARTNEZ B, Ciro. Estadstica y Muestreo. Dcimo Tercera edicin. Editorial ECOE
LIND, Douglas; MARCHAL, William y WATHEN, Samuel. Estadstica Aplicada a los Negocios y la
Economa Dcimo Quinta edicin. Editorial McGraw Hill
ANDERSON, David; SWEENEY, Dennis y WILLIANS, Thomas. Estadstica para Administracin y
Economa. 11 edicin. Editorial CENGAGE LEARNING
VERSIN 11
FECHA: 2014
Pgina89