Sie sind auf Seite 1von 16

INTRODUCCION

La importancia esencial de la aplicacin de los mtodos de clculo de la probabilidad


reside en su capacidad para estimar o predecir eventos. Cuanto mayor sea la cantidad
de datos disponibles para calcular la probabilidad de un acontecimiento, ms preciso
ser el resultado calculado.
En cambio la estadstica recolecta y agrupa datos de diversos tipos para construir con
ellos informes estadsticos que nos den idea sobre diferentes y muy variados temas,
siempre desde un punto de vista cuantitativo y no cualitativo.
Es por ello que a continuacin veremos a grandes rasgos el concepto de estadstica y
su clasificacin, as como tambin analizaremos lo que son los polgonos de
frecuencia central, la relacin que hay entre la media, mediana y moda y las medidas
de dispersin, todo para un conjunto de datos y datos no agrupados y las diferentes
herramientas que se utilizaran en esta unidad

Tabla de contenido
INTRODUCCION................................................................................................ 1
UNIDAD I: ESTADISTICA DESCRIPTIVA..............................................................3
1.1 CONCEPTOS DE ESTADSTICA Y SU CLASIFICACIN...................................3
1.2 RECOPILACIN DE DATOS..........................................................................4
1.3 DISTRIBUCIN DE FRECUENCIAS...............................................................5
1.3.1 POLGONOS DE FRECUENCIA, HISTOGRAMAS Y OJIVAS...........................6
1.4 MEDIDAS DE TENDENCIA CENTRAL PARA UN CONJUNTO DE DATOS Y DATOS
AGRUPADOS..................................................................................................... 8
1.4.1 MEDIA MEDIA PONDERADA.....................................................................8
1.4.2 MEDIANA................................................................................................. 8
1.4.3 MODA...................................................................................................... 9
1.4.4 RELACIN ENTRE MEDIA MEDIANA Y MODA..........................................10
1.5 MEDIDAS DE DISPERSIN PARA UN CONJUNTO DE DATOS Y DATOS
AGRUPADOS................................................................................................... 11
1.5.1 RANGO.................................................................................................. 11
1.5.2 DESVIACIN MEDIA............................................................................... 12
1.5.3 VARIANZA.............................................................................................. 12
1.5.4 DESVIACIN ESTNDAR........................................................................13
CONCLUSION.................................................................................................. 14

UNIDAD I: ESTADISTICA DESCRIPTIVA

1.1 CONCEPTOS DE ESTADSTICA Y SU CLASIFICACIN.

El trmino estadstica se deriva de la palabra latina status (que significa "estado"). Los
primeros usos de la estadstica implicaron la compilacin de datos y la elaboracin de
grficas para describir diversos aspectos de un estado o de un pas. En 1662, John
Graunt public informacin estadstica acerca de los nacimientos y los decesos. Al
trabajo de Graunt siguieron estudios de tasas de mortalidad y de enfermedad, tamao
de poblaciones, ingresos y tasas de desempleo. Los hogares, gobiernos y negocios se
apoyan bastante en datos estadsticos para dirigir sus acciones. Por ejemplo, se
compilan datos cuidadosamente y con regularidad para establecer las tasas de
desempleo, las tasas de inflacin, los ndices del consumidor y las tasas de nacimiento
y muerte, y los lderes empresariales utilizan los datos resultantes para tomar
decisiones que afectan las futuras contrataciones, los niveles de produccin y la
expansin hacia nuevos mercados.
DEFINICIONES
Datos son las observaciones recolectadas (como mediciones, gneros. respuestas de
encuesta).
Estadstica es una coleccin de mtodos para planear experimentos, obtener datos, y
despus organizar, resumir, presentar, analizar, interpretar y llegar a conclusiones
basadas en los datos.
Poblacin es la coleccin completa de todos los elementos (puntuaciones, personas,
mediciones, etctera) a estudiar. Se dice que la coleccin es completa, pues incluye a
todos los sujetos que se estudiarn.
Censo es la coleccin de datos de cada uno de los miembros de la poblacin.
Muestra es un subconjunto de miembros seleccionados de una poblacin.
Conceptos clave:
Los datos mustrales deben reunirse de una forma adecuada, como en un proceso de
seleccin aleatoria. (Muestra aleatoria)
Si los datos mustrales no se renen de forma adecuada, resultaran tan intiles que
ninguna cantidad de tortura estadstica podra salvarlos. (Muestra sesgada)
Estadstica
La estadstica es una ciencia formal que estudia la recoleccin, anlisis e interpretacin
de datos de una muestra representativa, ya sea para ayudar en la toma de decisiones o
para explicar condiciones regulares o irregulares de algn fenmeno o estudio
aplicado, de ocurrencia en forma aleatoria o condicional. Sin embargo, la estadstica es
ms que eso, es decir, es la herramienta fundamental que permite llevar a cabo el
proceso relacionado con la investigacin cientfica.
Distribucin normal
3

Es transversal a una amplia variedad de disciplinas, desde la fsica hasta las ciencias
sociales, desde las ciencias de la salud hasta el control de calidad. Se usa para la toma
de decisiones en reas de negocios o instituciones gubernamentales.
La estadstica se divide en dos grandes reas:
La estadstica descriptiva, se dedica a la descripcin, visualizacin y resumen de
datos originados a partir de los fenmenos de estudio. Los datos pueden ser resumidos
numrica o grficamente. Ejemplos bsicos de parmetros estadsticos son: la media y
la desviacin estndar. Algunos ejemplos grficos son: histograma, pirmide
poblacional, grfico circular, entre otros.
La estadstica inferencial, se dedica a la generacin de los modelos, inferencias y
predicciones asociadas a los fenmenos en cuestin teniendo en cuenta la
aleatoriedad de las observaciones. Se usa para modelar patrones en los datos y
extraer inferencias acerca de la poblacin bajo estudio. Estas inferencias pueden tomar
la forma de respuestas a preguntas si/no (prueba de hiptesis), estimaciones de unas
caractersticas numricas (estimacin), pronsticos de futuras observaciones,
descripciones de asociacin (correlacin) o modelamiento de relaciones entre variables
(anlisis de regresin). Otras tcnicas de modelamiento incluyen anova, series de
tiempo y minera de datos.
Ambas ramas (descriptiva e inferencial) comprenden la estadstica aplicada. Hay
tambin una disciplina llamada estadstica matemtica, la que se refiere a las bases
tericas de la materia. La palabra estadsticas tambin se refiere al resultado de
aplicar un algoritmo estadstico a un conjunto de datos, como en estadsticas
econmicas, estadsticas criminales, entre otros.
1.2 RECOPILACIN DE DATOS.

Tcnicas Para Hallar Datos


Los analistas utilizan una variedad de mtodos a fin de recopilar los datos sobre una
situacin existente, como entrevistas, cuestionarios, inspeccin de registros (revisin
en el sitio) y observacin. Cada uno tiene ventajas y desventajas. Generalmente, se
utilizan dos o tres para complementar el trabajo de cada una y ayudar a asegurar una
investigacin completa.
La Entrevista
Las entrevistas se utilizan para recabar informacin en forma verbal, a travs de
preguntas que propone el analista. Quienes responden pueden ser gerentes o
empleados, los cuales son usuarios actuales del sistema existente, usuarios
potenciales del sistema propuesto o aquellos que proporcionarn datos o sern
afectados por la aplicacin propuesta. El analista puede entrevistar al personal en
forma individual o en grupos algunos analistas prefieren este mtodo a las otras
tcnicas que se estudiarn ms adelante. Sin embargo, las entrevistas no siempre son
la mejor fuente de datos de aplicacin.
Qu Es Una Encuesta?

Se ha dicho que Estados Unidos ya no es una "sociedad industrial", sino una "sociedad
de informacin". Esto es, nuestros mayores problemas y tareas ya no giran
principalmente en la produccin de bienes y servicios necesarios para nuestra
supervivencia y comodidad.
Nuestra "sociedad", requiere un rpido y preciso flujo de informacin sobre las
preferencias, necesidades y comportamiento de sus miembros. Es en respuesta a esta
necesidad crtica de informacin por el gobierno, el comercio y las instituciones sociales
que tanta confianza se pone en las encuestas.
Hoy en da la palabra "encuesta" se usa ms frecuentemente para describir un mtodo
de obtener informacin de una muestra de individuos. Esta "muestra" es usualmente
slo una fraccin de la poblacin bajo estudio.
Cuestionario
Los cuestionarios proporcionan una alternativa muy til para la entrevista; si embargo,
existen ciertas caractersticas que pueden ser apropiada en algunas situaciones e
inapropiadas en otra. Al igual que la entrevistas, deben disearse cuidadosamente para
una mxima efectividad.
La Observacin
Otra tcnica til para el analista en su progreso de investigacin, consiste en observar
a las personas cuando efectan su trabajo. Como tcnica de investigacin, la
observacin tiene amplia aceptacin cientfica. Los socilogos, siclogos e ingenieros
industriales utilizan extensamente sta tcnica con el fin de estudiar a las personas en
sus actividades de grupo y como miembros de la organizacin. El propsito de la
organizacin es mltiple: permite al analista determinar que se est haciendo, como se
est haciendo, quien lo hace, cuando se lleva a cabo, cuanto tiempo toma, dnde se
hace y por qu se hace.
Diagrama de Flujo
Es una representacin pictrica de los pasos en proceso. til para determinar cmo
funciona realmente el proceso para producir un resultado. El resultado puede ser un
producto, un servicio, informacin o una combinacin de los tres. Al examinar cmo los
diferentes pasos es un proceso se relacionan entre s, se puede descubrir con
frecuencia las fuentes de problemas potenciales. Los diagramas de flujo se pueden
aplicar a cualquier aspecto del proceso desde el flujo de materiales hasta los pasos
para hacer la venta u ofrecer un producto. Con frecuencia este nivel de detalle no es
necesario, pero cuando se necesita, el equipo completo de trabajo ms pequeo puede
agregar niveles segn sea necesario durante el proyecto.
Diccionario De Datos
Los diccionarios de datos son el segundo componente del anlisis del flujo de datos. En
s mismos los diagramas de flujo de datos no describen por completo el objeto de la
investigacin. El diccionario de datos proporciona informacin adicional sobre el
sistema. Esta seccin analiza que es un diccionario de datos, por qu se necesita en el
5

anlisis de flujo de datos y como desarrollarlo. Se utilizar el ejemplo del sistema de


contabilidad para describir los diccionarios de datos.
Un diccionario de datos es una lista de todos los elementos incluido en el conjunto de
los diagramas de flujo de datos que describen un sistema. Los elementos principales
en un sistema, estudiados en las secciones anteriores, son el flujo de datos, el
almacenamiento de datos y los procesos. El diccionario de datos almacena detalles y
descripciones de estos elementos.
El diccionario de dato se desarrolla durante el anlisis de flujo de datos y ayuda el
analista involucrado en la determinacin de los requerimientos de sistemas. Sin
embargo, como se ver ms adelante, tambin el contenido del diccionario de datos se
utiliza durante el diseo del sistema.
.

1.3 DISTRIBUCIN DE FRECUENCIAS.

En estadstica, se le llama distribucin de frecuencias a la agrupacin de datos en


categoras mutuamente excluyentes que indican el nmero de observaciones en cada
categora.1 Esto proporciona un valor aadido a la agrupacin de datos. La distribucin
de frecuencias presenta las observaciones clasificadas de modo que se pueda ver el
nmero existente en cada clase. Estas agrupaciones de datos suelen estar agrupadas
en forma de tablas.
Caractersticas
Una distribucin de frecuencias es un formato tabular en la que se organizan los datos
en clases, es decir, en grupos de valores que describen una caracterstica de los
[datos] y muestra el nmero de observaciones del conjunto de datos que caen en cada
una de las clases.
La tabla de frecuencias ayuda a agrupar cualquier tipo de dato numrico. En principio,
en la tabla de frecuencias se detalla cada uno de los valores diferentes en el conjunto
de datos junto con el nmero de veces que aparece, es decir, su Frecuencia. Se puede
complementar la frecuencia absoluta con la denominada frecuencia relativa, que indica
la frecuencia en porcentaje sobre el total de datos. En variables cuantitativas se
distinguen por pudin otra parte la frecuencia simple y la frecuencia acumulada.
La tabla de frecuencias puede representar grficamente en un histograma (Diagrama
De Barras). Normalmente en el eje vertical se coloca las frecuencias y en el horizontal
los intervalos de valores.
La distribucin de frecuencias o tabla de frecuencias es una ordenacin en forma de
tabla de los datos estadsticos, asignando a cada dato su frecuencia correspondiente
1.3.1 POLGONOS DE FRECUENCIA, HISTOGRAMAS Y OJIVAS.

Histograma
Concepto
6

Un histograma es un conjunto de rectngulos, cada uno de los cuales representa un


intervalo de agrupacin. Sus bases son iguales al intervalo de clase empleada en la
distribucin de frecuencias y las alturas son proporcionales a la frecuencia absoluta ni o
relativa fi de la clase
El histograma es apropiado para datos continuos, medidos con una misma escala y se
lo emplea cuando un diagrama de tallo y hojas es tedioso de construir.
Igualmente puede ayudar a detectar observaciones atpicas y cualquier brecha entre
los datos
Especialmente se utiliza para analizar la dispersin que presentan unos datos
Histograma 1
Corresponde a la forma de campana habitual que representa la variabilidad debida a
causas aleatorias. A su lado podemos apreciar una curva de frecuencias simtricas o
en forma de campana, se caracteriza porque las observaciones equidistantes del
mximo central tienen la misma frecuencia. En este caso corresponde con la curva de
la normal o Gaussiana.
Histograma 2
Con dos mximos diferenciados, responde a una distribucin denominada bimodal y se
presenta cuando estn mezclados datos de distinto origen centrados en valores
distintos. De igual manera la curva de frecuencia bimodal tiene dos mximos, ya que
representan a la misma coleccin de datos.
Histograma 3
Se denomina, por su forma, sesgado a la derecha, y responde a la variabilidad que
presenta ciertas variables que no siguen una ley normal, como los tiempos de vida. En
las curvas de frecuencias poco asimtricas, o segadas, la cola de la curva a un lado del
mximo central es ms larga que al otro lado. Si la cola mayor est a la derecha, la
curva se dice asimtrica a la derecha o de asimtrica positiva.
Histograma 4
Parece faltarle una parte y por ello se le llama censurado o sesgado (en este caso, a la
izquierda). No representa una variabilidad natural y por tanto hay que sospechar que se
han eliminado algunos valores. Igual ocurre con las curvas de frecuencias poco
asimtricas o sesgadas a la izquierda o de asimetra negativa.
Histogramas 5 y 6,

En los cuales aparecen datos que no siguen el patrn de comportamiento general


(anomalas, errores, etc...). Su variabilidad puede atribuirse a alguna causa asignable
que deber ser identificada y eliminada.
POLIGONO DE FRECUENCIA
Concepto:
Un polgono de frecuencia es un grfico que se obtiene uniendo con segmentos de
recta los puntos que tienen proporcionalmente como abscisa a la marca de clase y
como ordenada la frecuencia respectiva.
Se cierra en ambos extremos en las marcas adyacentes con frecuencia cero.
Caractersticas de los polgonos de frecuencias
No muestran frecuencias acumuladas.
Se prefiere para el tratamiento de datos cuantitativos.
El punto con mayor altura representa la mayor frecuencia.
El rea bajo la curva representa el 100% de los datos. El polgono de frecuencia est
diseado para mantener la misma rea de las columnas.
Analicemos una porcin del grfico para probar esta afirmacin:
Observe que cada lnea corta una porcin de la columna, pero a su vez, agrega una
porcin adicional. Ambas porciones son iguales (triangulo rectngulos iguales),
manteniendo el rea global en el grfico.
OJIVA
Concepto:
La ojiva es un polgono de frecuencias acumuladas, es decir, en las abscisas se
colocan los lmites superiores de cada intervalo de clase y en las ordenadas se coloca
la frecuencia acumulada (absoluta o relativa) de la clase.
La ojiva es til para:
Calcular el nmero o el porcentaje de observaciones que corresponden a un intervalo
determinado de la variable
Calcula los percentiles de la distribucin de los datos

Caractersticas de las ojivas:


Muestran frecuencias acumuladas.
Se prefiere para el tratamiento de datos cuantitativos.
El punto de inicio equivale a una frecuencia de 0.
El punto final equivale al 100% de los datos.
Interpretando la informacin en las ojivas
Dada su ventaja de representar frecuencias acumuladas, las ojivas se convierten en
una herramienta vital para el anlisis estadstico.
1.4 MEDIDAS DE TENDENCIA CENTRAL PARA UN CONJUNTO DE DATOS Y DATOS
AGRUPADOS.

Medidas de tendencia central


Al describir grupos de observaciones, con frecuencia es conveniente resumir la
informacin con un solo nmero. Este nmero que, para tal fin, suele situarse hacia el
centro de la distribucin de datos se denomina medida o parmetro de tendencia
central o de centralizacin. Cuando se hace referencia nicamente a la posicin de
estos parmetros dentro de la distribucin, independientemente de que sta est ms o
menos centrada, se habla de estas medidas como medidas de posicin.1 En este caso
se incluyen tambin los cuantiles entre estas medidas.
Entre las medidas de tendencia central tenemos:
Media .
Media ponderada.
Media geomtrica.
Media armnica.
Mediana.
Moda.
Se debe tener en cuenta que existen variables cualitativas y variables cuantitativas, por
lo que las medidas de posicin o medidas de tendencia se usan de acuerdo al tipo de
variable que se est observando, en este caso se observan variables cuantitativas.
1.4.1 MEDIA MEDIA PONDERADA.

La media ponderada es una medida de tendencia central, que es apropiada cuando en


un conjunto de datos cada uno de ellos tiene una importancia relativa (o peso) respecto
de los dems datos. Se obtiene del cociente entre la suma de los productos de cada
dato por su peso o ponderacin y la suma de los pesos.
1.4.2 MEDIANA.

La mediana es un valor de la variable que deja por debajo de s a la mitad de los datos,
una vez que stos estn ordenados de menor a mayor.4 Por ejemplo, la mediana del
nmero de hijos de un conjunto de trece familias, cuyos respectivos hijos son: 3, 4, 2, 3,
2, 1, 1, 2, 1, 1, 2, 1 y 1, es 2, puesto que, una vez ordenados los datos: 1, 1, 1, 1, 1, 1,
2, 2, 2, 2, 3, 3, 4, el que ocupa la posicin central es 2:

En caso de un nmero par de datos, la mediana no correspondera a ningn valor de la


variable, por lo que se conviene en tomar como mediana el valor intermedio entre los
dos valores centrales. Por ejemplo, en el caso de doce datos como los siguientes:

Se toma como mediana

Existen mtodos de clculo ms rpidos para datos ms. Del mismo modo, para
valores agrupados en intervalos, se halla el "intervalo mediano" y, dentro de ste, se
obtiene un valor concreto por interpolacin.
Clculo de la mediana para datos agrupados
Primero hallamos las frecuencias absolutas acumuladas Fi (ver tabla del margen
derecho).
As, aplicando la formula asociada a la mediana para n impar, obtenemos X(39+1)/2 =
X20 y basndonos en la frmula que hace referencia a las frecuencias absolutas:
Ni-1< n/2 < Ni = N19 < 19.5 < N20
Por tanto la mediana ser el valor de la variable que ocupe el vigsimo lugar. En
nuestro ejemplo, 21 (frecuencia absoluta acumulada para Xi = 5) > 19.5 con lo que Me
= 5 puntos (es aconsejable no olvidar las unidades; en este caso como estamos
hablando de calificaciones, sern puntos)
La mitad de la clase ha obtenido un 5 o menos, y la otra mitad un 5 o ms.
Calculemos la Mediana:
Primero hallamos las frecuencias absolutas acumuladas Fi (ver tabla margen derecho).
Si volvemos a utilizar la frmula asociada a la mediana para n par, obtenemos X(38/2)
= X19 y basndonos en la frmula que hace referencia a las frecuencias absolutas -->
Ni-1< n/2 < Ni = N18 < 19 < N19
Con lo cual la mediana ser la media aritmtica de los valores de la variable que
ocupen el decimonoveno y el vigsimo lugar.

10

En nuestro ejemplo, el lugar decimonoveno lo ocupa el 5 y el vigsimo el 6, (desde el


vigsimo hasta el vigsimo octavo) con lo que Me = (5+6)/2 = 5,5 puntos.
1.4.3 MODA.

La moda se refiere al dato ms repetido, el valor de la variable con mayor frecuencia


absoluta.2 En cierto sentido la definicin matemtica corresponde con la locucin "estar
de moda", esto es, ser lo que ms se lleva.
Su clculo es extremadamente sencillo, pues slo necesita un recuento. En variables
continuas, expresadas en intervalos, existe el denominado intervalo modal o, en su
defecto, si es necesario obtener un valor concreto de la variable, se recurre a la
interpolacin.
Por ejemplo, el nmero de personas en distintos vehculos en una carretera: 5-7-4-6-95-6-1-5-3-7. El nmero que ms se repite es 5, entonces la moda es 5.
Hablaremos de una distribucin bimodal de los datos, cuando encontremos dos modas,
es decir, dos datos que tengan la misma frecuencia absoluta mxima. Cuando en una
distribucin de datos se encuentran tres o ms modas, entonces es multimodal. Por
ltimo, si todas las variables tienen la misma frecuencia diremos que no hay moda.
Cuando tratamos con datos agrupados en intervalos, antes de calcular la moda, se ha
de definir el intervalo modal. El intervalo modal es el de mayor frecuencia absoluta.
La moda, cuando los datos estn agrupados, es un punto que divide el intervalo modal
en dos partes de la forma p y c-p, siendo c la amplitud del intervalo, que verifiquen que:

Siendo
la frecuencia absoluta del intervalo modal y
y
absolutas de los intervalos anterior y posterior, respectivamente, al

las frecuencias

Las calificaciones en la asignatura de Matemticas de 39 alumnos de una clase viene


dada por la siguiente tabla (debajo):
Calificaciones

Nmero de alumnos

Propiedades

Sus principales propiedades son:

Clculo sencillo.
11

Interpretacin muy clara.


Al depender slo de las frecuencias, puede calcularse para variables
cualitativas. Es por ello el parmetro ms utilizado cuando al resumir una poblacin
no es posible realizar otros clculos, por ejemplo, cuando se enumeran en medios
periodsticos las caractersticas ms frecuentes de determinado sector social.

Su valor es independiente de la mayor parte de los datos, lo que la hace muy sensible
a variaciones mustrales. Por otra parte, en variables agrupadas en intervalos, su valor
depende excesivamente del nmero de intervalos y de su amplitud.

Usa muy pocas observaciones, de tal modo que grandes variaciones en los
datos fuera de la moda, no afectan en modo alguno a su valor.
No siempre se sita hacia el centro de la distribucin.
Puede haber ms de una moda en el caso en que dos o ms valores de la
variable presenten la misma frecuencia (distribuciones bimodales o multimodales).

1.4.4 RELACIN ENTRE MEDIA MEDIANA Y MODA.

Media: la media es el promedio de cierto nmero de datos, es como cuando sumas las
calificaciones de todas tus materias y las divides entre el nmero de materias para ver
tu promedio con los datos 4,3,2,1 la media es (4+3+2+1)/4 = 10/4 = 5/2 =2.5
Moda: la moda es el valor que ms se repite en cierto nmero de datos, por ejemplo si
t ves tus calificaciones y son: 10, 9, 6, 9, 9, 9, 8, 10,7 la moda es 9, ya que es el valor
que ms se repite.
Mediana: es cuando acomodas tus datos del mayor a menor y tomas el valor de en
medio, por ejemplo si tienes: 5, 6, 2, 3, 1, 4,7.
Los acomodas y te quedan: 1, 2, 3, 4, 5, 6, 7, entonces el valor de en medio es el 4 y
esa es tu mediana.
La relacin que pueden tener, es que si tu moda, mediana, y media es la misma se dice
que los datos siguen una distribucin normal, es decir que tienen un comportamiento
regular y puedes analizarlos estadsticamente de una manera ms cmoda.
1.5 MEDIDAS DE DISPERSIN PARA UN CONJUNTO DE DATOS Y DATOS AGRUPADOS.

Al igual que sucede con cualquier conjunto de datos, la media, la mediana y la moda
slo nos revelan una parte de la informacin que necesitamos acerca de las
caractersticas de los datos. Para aumentar nuestro entendimiento del patrn de los
datos, debemos medir tambin su dispersin, extensin o variabilidad.
La dispersin es importante porque:
12

Proporciona informacin adicional que permite juzgar la confiabilidad de la medida de


tendencia central. Si los datos se encuentran ampliamente dispersos, la posicin
central es menos representativa de los datos.
Ya que existen problemas caractersticos para datos ampliamente dispersos, debemos
ser capaces de distinguir que presentan esa dispersin antes de abordar esos
problemas.
Quiz se desee comparar las dispersiones de diferentes muestras. Si no se desea
tener una amplia dispersin de valores con respecto al centro de distribucin o esto
presenta riesgos inaceptables, necesitamos tener habilidad de reconocerlo y evitar
escoger distribuciones que tengan las dispersiones ms grandes.
Pero si hay dispersin en la mayora de los datos, y debemos estar en capacidad de
describirla. Ya que la dispersin ocurre frecuentemente y su grado de variabilidad es
importante, cmo medimos la variabilidad de una distribucin emprica?. Vamos a
considerar slo algunas medidas de dispersin absolutas: el rango, la varianza, la
desviacin estndar y el coeficiente de variacin.
1.1.- EL RANGO O RECORRIDO ( R ):
Es la medida de variabilidad ms fcil de calcular. Para datos finitos o sin agrupar, el
rango se define como la diferencia entre el valor ms alto (Xn Xmax.) y el mas bajo
(X1 Xmin) en un conjunto de datos.
Rango para datos no agrupados;
R = Xmx.-Xmn = Xn-X1
1.5.1 RANGO.

En estadstica descriptiva se denomina rango estadstico (R) o recorrido estadstico, a


la diferencia entre el valor mximo y el valor mnimo; por ello, comparte unidades con
los datos. Permite obtener una idea de la dispersin de los datos, cuanto mayor es el
rango, ms dispersos estn los datos de un conjunto.
Por ejemplo, para una serie de datos de carcter cuantitativo, como lo es la estatura
medida en centmetros, tendramos:
es posible ordenar los datos como sigue:
donde la notacin x(i) indica que se trata del elemento i-simo de la serie de
datos. De este modo, el rango sera la diferencia entre el valor mximo (k) y el
mnimo; o, lo que es lo mismo:
En nuestro ejemplo, con cinco valores, nos da que R = 185-155 = 30

1.5.2 DESVIACIN MEDIA.

13

En estadstica la desviacin absoluta promedio o, sencillamente desviacin media o


promedio de un conjunto de datos es la media de las desviaciones absolutas y es un
resumen de la dispersin estadstica. Se expresa, de acuerdo a esta frmula:

La desviacin absoluta respecto a la media,


, la desviacin absoluta respecto a
la mediana,
, y la desviacin tpica, , de un mismo conjunto de valores
cumplen la desigualdad:
Siempre ocurre que

donde el Rango es igual a:

El valor:

ocurre cuando los datos son exactamente iguales e iguales a la media aritmtica. Por
otro lado:

cuando solo hay dos valores en el conjunto de datos.

1.5.3 VARIANZA.

En teora de probabilidad, la varianza (que suele representarse como \sigma^2) de una


variable aleatoria es una medida de dispersin definida como la esperanza del
cuadrado de la desviacin de dicha variable respecto a su media.
Est medida en unidades distintas de las de la variable. Por ejemplo, si la variable mide
una distancia en metros, la varianza se expresa en metros al cuadrado. La desviacin
estndar es la raz cuadrada de la varianza, es una medida de dispersin alternativa
expresada en las mismas unidades de los datos de la variable objeto de estudio. La
varianza tiene como valor mnimo 0.
Hay que tener en cuenta que la varianza puede verse muy influida por los valores
atpicos y no se aconseja su uso cuando las distribuciones de las variables aleatorias
tienen colas pesadas. En tales casos se recomienda el uso de otras medidas de
dispersin ms robustas.
El trmino varianza fue acuado por Ronald Fisher en un artculo de 1918 titulado The
Correlation Between Relatives on the Supposition of Mendelian Inheritance.
14

1.5.4 DESVIACIN ESTNDAR.

La desviacin estndar o desviacin tpica (denotada con el smbolo o s,


dependiendo de la procedencia del conjunto de datos) es una medida de dispersin
para variables de razn (variables cuantitativas o cantidades racionales) y de intervalo.
Se define como la raz cuadrada de la varianza. Junto con este valor, la desviacin
tpica es una medida (cuadrtica) que informa de la media de distancias que tienen los
datos respecto de su media aritmtica, expresada en las mismas unidades que la
variable.
Para conocer con detalle un conjunto de datos, no basta con conocer las medidas de
tendencia central, sino que necesitamos conocer tambin la desviacin que presentan
los datos en su distribucin respecto de la media aritmtica de dicha distribucin, con
objeto de tener una visin de los mismos ms acorde con la realidad al momento de
describirlos e interpretarlos para la toma de decisiones.

15

BIBLIOGRAFA
Mendenhall, W. R. (s.f.). introduccion a la Probabilidad y Estadstica. En Introduccion
a la Probabilidad y Estadstica. Brooks/Cole.
Morales, G. A. (s.f.). Estadistca y Probabilidades. En G. A. Morales, Estadistca y
Probabilidades.
Probabilidades, E. y. (s.f.). Probabilidad y Estadstica Basic para Ingenieros. En E. y.
Probabilidades. MATLAB.

16