Sie sind auf Seite 1von 47

Variable Estadstica

Una variable estadstica es una caracterstica que puede fluctuar y cuya variacin es
susceptible de adoptar diferentes valores, los cuales pueden medirse u observarse.

Las variables adquieren valor cuando se relacionan con otras variables, es decir, si
forman parte de una hiptesis o de una teora. En este caso se las denomina constructos
o construcciones hipotticas.

Existen diferentes tipos de variables:

Cualitativa Nominal
Cualitativa Ordinal

Cuantitativa Continua
Cuantitativa Discreta

Variables cualitativas

Son el tipo de variables que como su nombre lo indica expresan distintas cualidades,
caractersticas o modalidad. Cada modalidad que se presenta se denomina atributo o
categora, y la medicin consiste en una clasificacin de dichos atributos.
Las variables cualitativas pueden ser dicotmicas cuando slo pueden tomar dos valores
posibles, como s y no, hombre y mujer o ser politmicas cuando pueden adquirir tres o
ms valores. Dentro de ellas podemos distinguir:

Variable cualitativa ordinal o variable casi cuantitativa: La variable puede tomar


distintos valores ordenados siguiendo una escala establecida, aunque no es necesario
que el intervalo entre mediciones sea uniforme, por ejemplo: leve, moderado, fuerte.

Variable cualitativa nominal: En esta variable los valores no pueden ser sometidos a
un criterio de orden, como por ejemplo los colores.

Variables cuantitativas

Son las variables que toman como argumento cantidades numricas, son variables
matemticas. Las variables cuantitativas adems pueden ser:

Variable discreta: Es la variable que presenta separaciones o interrupciones en la


escala de valores que puede tomar. Estas separaciones o interrupciones indican la
ausencia de valores entre los distintos valores especficos que la variable pueda
asumir. Ejemplo: El nmero de hijos (1, 2, 3, 4, 5).

Variable continua: Es la variable que puede adquirir cualquier valor dentro de un


intervalo especificado de valores. Por ejemplo la masa (2,3 kg, 2,4 kg, 2,5 kg,...) o la
altura (1,64 m, 1,65 m, 1,66 m,...), o el salario. Solamente se est limitado por la
precisin del aparato medidor, en teora permiten que exista un valor entre dos
variables.

Asignatura Calidad y Mejora Continua 1


Apunte 1 - Unidad N1 - 2017
Tabla de Distribucin de Frecuencias

En estadstica, se le llama distribucin de frecuencias a la agrupacin de datos en


categoras mutuamente excluyentes que indican el nmero de observaciones en cada
categora. Esto proporciona un valor aadido a la agrupacin de datos.

La distribucin de frecuencias presenta las observaciones clasificadas de modo que se


pueda ver el nmero existente en cada clase.

Tipos de frecuencias

Frecuencia Absoluta

La frecuencia absoluta es el nmero de veces que aparece un determinado valor


en un estudio estadstico.

La frecuencia absoluta se representa por fi.

La suma de las frecuencias absolutas es igual al nmero total de datos, que se


representa por N.

Para indicar resumidamente estas sumas se utiliza la letra griega (sigma mayscula)
que se lee suma o sumatoria.

Ejemplo

Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas
mximas:

32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30,
31, 30, 31, 34, 33, 33, 29, 29.

En la primera columna de la tabla colocamos la variable ordenada de menor a mayor y


en la segunda anotamos la frecuencia absoluta.

Asignatura Calidad y Mejora Continua 2


Apunte 1 - Unidad N1 - 2017
xi fi

27 1

28 2

29 6

30 7

31 8

32 3

33 3

34 1

31

Frecuencia Acumulada

La frecuencia acumulada es la suma de las frecuencias absolutas de todos


los valores inferiores o iguales al valor considerado.

La frecuencia acumulada se representa por Fi.

Ejemplo

Durante el mes de julio, en una ciudad se han registrado las siguientes


temperaturas mximas:

32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29,
30, 30, 31, 30, 31, 34, 33, 33, 29, 29.

xi fi Fi

27 1 1

28 2 3

29 6 9

30 7 16

31 8 24

Asignatura Calidad y Mejora Continua 3


Apunte 1 - Unidad N1 - 2017
32 3 27

33 3 30

34 1 31

31

Frecuencia Relativa

La frecuencia relativa es el cociente entre la frecuencia absoluta de un


determinado valor y el nmero total de datos.
La frecuencia relativa se puede expresar en tantos por ciento y se representa
por ni.

La suma de las frecuencias relativas es igual a 1.

Ejemplo

Durante el mes de julio, en una ciudad se han registrado las siguientes
temperaturas mximas:

32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29,
30, 30, 31, 30, 31, 34, 33, 33, 29, 29.

xi fi ni

27 1 0.032

28 2 0.065

29 6 0.194

30 7 0.226

31 8 0.258

32 3 0.097

33 3 0.097

34 1 0.032

31 1

Asignatura Calidad y Mejora Continua 4


Apunte 1 - Unidad N1 - 2017
Frecuencia Relativa Acumulada

La frecuencia relativa acumulada es el cociente entre la frecuencia


acumulada de un determinado valor y el nmero total de datos.
Se representa por Ni.

Se puede expresar en tantos por ciento.

Ejemplo

Durante el mes de julio, en una ciudad se han registrado las siguientes
temperaturas mximas:

32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29,
30, 30, 31, 30, 31, 34, 33, 33, 29, 29.

xi fi Fi Ni

27 1 1 0.032

28 2 3 0.097

29 6 9 0.290

30 7 16 0.0516

31 8 24 0.774

32 3 27 0.871

33 3 30 0.968

34 1 31 1

31

Asignatura Calidad y Mejora Continua 5


Apunte 1 - Unidad N1 - 2017
Grfico Estadstico

Un grfico estadstico es una representacin visual de una serie de datos


estadsticos. Es una herramienta muy eficaz, ya que un buen grfico:

Capta la atencin del lector


Presenta la informacin de forma sencilla, clara y precisa
No induce a error
Facilita la comparacin de datos y destaca las tendencias y las diferencias
Ilustra el mensaje, tema o trama del texto al que acompaa.

Entre la variedad de graficos disponibles en estadistica podemos destacar:

Grfico de Barras

Un grfico de barras es una representacin grfica en un eje cartesiano de las


frecuencias de una variable cualitativa o discreta.

Ejemplo:

En uno de los ejes se posicionan las distintas categoras o modalidades de la


variable cualitativa o discreta (en el ejemplo, el tipo de cereal) y en el otro el valor
o frecuencia de cada categora en una determinada escala (en el ejemplo, la
produccin en millones de toneladas de granos).

La orientacin del grfico puede ser:

Vertical: las distintas categoras estn situadas en el eje horizontal y las


barras de frecuencias crecen verticalmente.

Horizontal: las categoras se sitan en el eje vertical y las barras crecen


horizontalmente. (Esta modalidad suele usarse cuando hay muchas
categoras o sus nombres son demasiado largos).

Asignatura Calidad y Mejora Continua 6


Apunte 1 - Unidad N1 - 2017
Las categoras pueden ordenarse alfabticamente facilitando su bsqueda o por
sus frecuencias facilitando la comparacin de los datos.

Veamos el siguiente ejemplo del porcentaje habitantes usuarios de internet del


ao 2007 por pases. (Fuente: Unin Internacional de Telecomunicaciones)
.

Un grafico de barras se suele usar para:

Comparar magnitudes de varias categoras.

Ejemplo

Ver la evolucin en el tiempo de una magnitud concreta.

Ejemplo

Asignatura Calidad y Mejora Continua 7


Apunte 1 - Unidad N1 - 2017
Tipos de grficos de barras:

Sencillo
Agrupado
Apilado

Sencillo: Contiene una nica serie de datos.

Ejemplo:

Agrupado: Contiene varias series de datos y cada una se representa por


un tipo de barra de un mismo color o textura.

Ejemplo:

Apilado: Contiene varias series de datos. La barra se divide en segmentos


de diferentes colores o texturas y cada uno de ellos representa una serie.

Ejemplo

Asignatura Calidad y Mejora Continua 8


Apunte 1 - Unidad N1 - 2017
Histograma

Se usa para representar las frecuencias de una variable cuantitativa continua.

En uno de los ejes se posicionan las clases de la variable continua (los intervalos
o las marcas de clase que son los puntos medios de cada intervalo) y en el otro
eje las frecuencias. No existe separacin entre las barras.

Ejemplo:

Dentro de los Histogramas tambin existen aquellos llamados Bi-direccionales,


que tiene orientacin horizontal y contiene dos series de datos cuyas barras de
frecuencias crecen en sentidos opuestos.

Ejemplo:

Asignatura Calidad y Mejora Continua 9


Apunte 1 - Unidad N1 - 2017
Grfico de lneas

Un grfico de lneas es una representacin grfica en un eje cartesiano de la


relacin que existe entre dos variables reflejando con claridad los cambios
producidos.

Ejemplo:

En cada eje se representa cada una de las variables cuya relacin se quiere
observar (en el ejemplo, en el eje horizontal los meses y en el eje vertical la media
mensual del IPC correspondiente a esos meses).

Se suelen usar para presentar tendencias temporales.

En el eje horizontal se ha de posicionar la variable que indica las unidades de


tiempo y en el vertical se introduce la escala de la variable cuya variacin en el
tiempo queremos ver. Pueden aparecer varias variables para compararlas.

Ejemplo:

Asignatura Calidad y Mejora Continua 10


Apunte 1 - Unidad N1 - 2017
Casos particulares:

Si se unen los puntos medios de las bases superiores de las barras en los grficos
de barra se obtiene el polgono de frecuencias.

Ejemplo:

Grfico de sectores

Un grfico de sectores es una representacin circular de las frecuencias relativas


de una variable cualitativa o discreta que permite, de una manera sencilla y rpida,
su comparacin.

Ejemplo:

El crculo representa la totalidad que se quiere observar (en el ejemplo, total de


viajeros hospedados en hoteles) y cada porcin, llamadas sectores, representan la
proporcin de cada categora de la variable (en el ejemplo, tipo de hotel) respecto
el total. Suele expresarse en porcentajes.

Asignatura Calidad y Mejora Continua 11


Apunte 1 - Unidad N1 - 2017
Son tiles cuando las categoras son pocas. Si el grfico tuviera muchas variables,
no aportara casi informacin y sera prcticamente incomprensible.

Asignatura Calidad y Mejora Continua 12


Apunte 1 - Unidad N1 - 2017
Medidas de tendencia central

La medidas de centralizacin nos indican en torno a qu valor (centro) se


distribuyen los datos.

La medidas de centralizacin son:

Moda

La moda es el valor que tiene mayor frecuencia absoluta y se representa por


Mo.

Se puede hallar la moda para variables cualitativas y cuantitativas.

Ejemplo:
Hallar la moda de la distribucin: 2, 3, 3, 4, 4, 4, 5, 5 Mo = 4

Si en un grupo hay dos o varias puntuaciones con la misma frecuencia y esa


frecuencia es la mxima, la distribucin es bimodal o multimodal, es decir, tiene
varias modas.

Ejemplo:
1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9 Mo= 1, 5, 9

Cuando todas las puntuaciones de un grupo tienen la misma frecuencia, no hay


moda.

Ejemplo:
2, 2, 3, 3, 6, 6, 9, 9

Si dos puntuaciones adyacentes tienen la frecuencia mxima, la moda es el


promedio de las dos puntuaciones adyacentes.

Ejemplo:
0, 1, 3, 3, 5, 5, 7, 8 Mo = 4

Clculo de la moda para datos agrupados



1. Todos los intervalos tienen la misma amplitud.

Asignatura Calidad y Mejora Continua 13


Apunte 1 - Unidad N1 - 2017
Donde:

Li es el lmite inferior de la clase modal.


fi es la frecuencia absoluta de la clase modal.
fi--1 es la frecuencia absoluta inmediatamente inferior a la en clase
modal.
fi-+1 es la frecuencia absoluta inmediatamente posterior a la clase modal.
ai es la amplitud de la clase.

Tambin se utiliza otra frmula de la moda que da un valor aproximado de


sta:

Ejemplo

Calcular la moda de una distribucin estadstica que viene dada por la


siguiente tabla:
fi

[60, 63) 5

[63, 66) 18

[66, 69) 42

[69, 72) 27

[72, 75) 8

100

Asignatura Calidad y Mejora Continua 14


Apunte 1 - Unidad N1 - 2017
2. Los intervalos tienen amplitudes distintas.

En primer lugar tenemos que hallar las alturas.

La clase modal es la que tiene mayor altura.

La frmula de la moda aproximada cuando existen distintas amplitudes es:

Ejemplo
En la siguiente tabla se muestra las calificaciones (suspenso, aprobado,
notable y sobresaliente) obtenidas por un grupo de 50 alumnos. Calcular la
moda.

fi hi

[0, 5) 15 3

[5, 7) 20 10

[7, 9) 12 6

[9, 10) 3 3

50

Asignatura Calidad y Mejora Continua 15


Apunte 1 - Unidad N1 - 2017
Mediana

Es el valor que ocupa el lugar central de todos los datos cuando stos estn
ordenados de menor a mayor.

La mediana se representa por Me.

La mediana se puede hallar slo para variables cuantitativas.

Clculo de la mediana

1. Ordenamos los datos de menor a mayor.

2. Si la serie tiene un nmero impar de medidas la mediana es la puntuacin


central de la misma.

Ejemplo:
2, 3, 4, 4, 5, 5, 5, 6, 6 Me= 5

3. Si la serie tiene un nmero par de puntuaciones la mediana es la media entre


las dos puntuaciones centrales.

Ejemplo:
7, 8, 9, 10, 11, 12 Me= 9.5

Clculo de la mediana para datos agrupados

La mediana se encuentra en el intervalo donde la frecuencia acumulada llega


hasta la mitad de la suma de las frecuencias absolutas. Es decir tenemos que
buscar el intervalo en el que se encuentre N/2.

Donde:
Li es el lmite inferior de la clase donde se encuentra la mediana.
N/2 es la semisuma de las frecuencias absolutas.
Fi-1 es la frecuencia acumulada anterior a la clase mediana.
ai es la amplitud de la clase.

La mediana es independiente de las amplitudes de los intervalos.

Asignatura Calidad y Mejora Continua 16


Apunte 1 - Unidad N1 - 2017
Ejemplo:

Calcular la mediana de una distribucin estadstica que viene dada por la
siguiente tabla:
fi Fi

[60, 63) 5 5

[63, 66) 18 23

[66, 69) 42 65

[69, 72) 27 92

[72, 75) 8 100

100
100 / 2 = 50
Clase modal: [66, 69)

Media aritmtica

La media aritmtica es el valor obtenido al sumar todos los datos y dividir el


resultado entre el nmero total de datos.

es el smbolo de la media aritmtica.

Asignatura Calidad y Mejora Continua 17


Apunte 1 - Unidad N1 - 2017

Ejemplo

Los pesos de seis amigos son: 84, 91, 72, 68, 87 y 78 kg. Hallar el peso
medio.

Media aritmtica para datos agrupados

Si los datos vienen agrupados en una tabla de frecuencias, la expresin de la


media es:

Ejemplo de media aritmtica



En un test realizado a un grupo de 42 personas se han obtenido las
puntuaciones que muestra la tabla. Calcula la puntuacin media.

xi fi x i fi

[10, 20) 15 1 15

[20, 30) 25 8 200

[30,40) 35 10 350

[40, 50) 45 9 405

[50, 60 55 8 440

[60,70) 65 4 260

[70, 80) 75 2 150

42 1.820

Asignatura Calidad y Mejora Continua 18


Apunte 1 - Unidad N1 - 2017
Propiedades de la media aritmtica

1. La suma de las desviaciones de todas las puntuaciones de una
distribucin respecto a la media de la misma igual a cero.

Las suma de las desviaciones de los nmeros 8, 3, 5, 12, 10 de su


media aritmtica 7.6 es igual a 0:

Ejemplo:
8 7.6 + 3 7.6 + 5 7.6 +12 7.6 +10 7.6= 0. 4 4.6 2.6 + 4. 4 +
2. 4= 0

2. La media aritmtica de los cuadrados de las desviaciones de los


valores de la variable con respecto a un nmero cualquiera se hace
mnima cuando dicho nmero coincide con la media aritmtica.

3. Si a todos los valores de la variable se les suma un mismo nmero, la


media aritmtica queda aumentada en dicho nmero.

4. Si todos los valores de la variable se multiplican por un mismo nmero


la media aritmtica queda multiplicada por dicho nmero.

Observaciones sobre la media aritmtica



1. La media se puede hallar slo para variables cuantitativas.

2. La media es independiente de las amplitudes de los intervalos.

3. La media es muy sensible a las puntuaciones extremas.

Ejemplo

Si tenemos una distribucin con los siguientes pesos:


65 kg, 69kg , 65 kg, 72 kg, 66 kg, 75 kg, 70 kg, 110 kg.

Asignatura Calidad y Mejora Continua 19


Apunte 1 - Unidad N1 - 2017
La media es igual a 74 kg, que es una medida de centralizacin poco
representativa de la distribucin.

4. La media no se puede calcular si hay un intervalo con una amplitud


indeterminada.

Ejemplo:

xi fi

[60, 63) 61.5 5

[63, 66) 64.5 18

[66, 69) 67.5 42

[69, 72) 70.5 27

[72, ) 8

100

En este caso no es posible hallar la media porque no podemos calcular


la marca de clase de ltimo intervalo.

Medidas de dispersin

Las medidas de dispersin nos informan sobre cunto se alejan del centro los
valores de la distribucin.

Las medidas de dispersin son:

Rango o recorrido

El rango es la diferencia entre el mayor y el menor de los datos de una


distribucin estadstica.

Asignatura Calidad y Mejora Continua 20


Apunte 1 - Unidad N1 - 2017
Desviacin media

La desviacin respecto a la media es la diferencia entre cada valor de la


variable estadstica y la media aritmtica.

Di = x - x
La desviacin media es la media aritmtica de los valores absolutos de las
desviaciones respecto a la media.

La desviacin media se representa por

Ejemplo

Calcular la desviacin media de la distribucin: 9, 3, 8, 8, 9, 8, 9, 18

Desviacin media para datos agrupados

Si los datos vienen agrupados en una tabla de frecuencias, la expresin de la


desviacin media es:

Asignatura Calidad y Mejora Continua 21


Apunte 1 - Unidad N1 - 2017
Ejemplo

Calcular la desviacin media de la distribucin:



x i f i xi fi | - x| | - x| fi

[10, 15) 12.5 3 37.5 9.286 27.858
[15, 20) 17.5 5 87.5 4.286 21.430
[20, 25) 22.5 7 157.5 0.714 4.998
[25, 30) 27.5 4 110.0 5.714 22.856
[30, 35) 32.5 2 65.0 10.174 21.428
21 457.5 98.570

Varianza

La varianza es la media aritmtica del cuadrado de las desviaciones respecto


a la media de una distribucin estadstica.

La varianza se representa por .

Asignatura Calidad y Mejora Continua 22


Apunte 1 - Unidad N1 - 2017
Varianza para datos agrupados

Ejercicios de varianza
Calcular la varianza de la distribucin: 9, 3, 8, 8, 9, 8, 9, 18

Calcular la varianza de la distribucin de la tabla:

x i f i xi fi xi2 fi
[10, 20) 15 1 15 225
[20, 30) 25 8 200 5.000
[30,40) 35 10 350 12.250
[40, 50) 45 9 405 18.225
[50, 60 55 8 440 24.200
[60,70) 65 4 260 16.900
[70, 80) 75 2 150 11.250
42 1.820 88.050

Asignatura Calidad y Mejora Continua 23


Apunte 1 - Unidad N1 - 2017
Propiedades de la varianza

1. La varianza ser siempre un valor positivo o cero, en el caso de que las
puntuaciones sean iguales.

2. Si a todos los valores de la variable se les suma un nmero la varianza


no vara.

3. Si todos los valores de la variable se multiplican por un nmero la


varianza queda multiplicada por el cuadrado de dicho nmero.

4. Si tenemos varias distribuciones con la misma media y conocemos sus


respectivas varianzas se puede calcular la varianza total.

Si todas las muestras tienen el mismo tamao:

Si las muestras tienen distinto tamao:

Observaciones sobre la varianza



1. La varianza, al igual que la media, es un ndice muy sensible a las
puntuaciones extremas.

2. En los casos que no se pueda hallar la media tampoco ser posible hallar la
varianza.

3. La varianza no viene expresada en las mismas unidades que los datos, ya


que las desviaciones estn elevadas al cuadrado.

Desviacin tpica

La desviacin tpica es la raz cuadrada de la varianza.

Es decir, la raz cuadrada de la media de los cuadrados de las puntuaciones de


desviacin.

Asignatura Calidad y Mejora Continua 24


Apunte 1 - Unidad N1 - 2017
La desviacin tpica se representa por .

Desviacin tpica para datos agrupados



Para simplificar el clculo vamos a utilizar las siguientes expresiones que son
equivalentes a las anteriores.

Asignatura Calidad y Mejora Continua 25


Apunte 1 - Unidad N1 - 2017
Desviacin tpica para datos agrupados

Ejercicios de desviacin tpica



Calcular la desviacin tpica de la distribucin: 9, 3, 8, 8, 9, 8, 9, 18

Calcular la desviacin tpica de la distribucin de la tabla:

xi fi xi fi xi2 fi
[10, 20) 15 1 15 225
[20, 30) 25 8 200 5.000
[30,40) 35 10 350 12.250
[40, 50) 45 9 405 18.225
[50, 60) 55 8 440 24.200
[60,70) 65 4 260 16.900
[70, 80) 75 2 150 11.250
42 1.820 88.050

Asignatura Calidad y Mejora Continua 26


Apunte 1 - Unidad N1 - 2017
Propiedades de la desviacin tpica

1. La desviacin tpica ser siempre un valor positivo o cero, en el caso de
que las puntuaciones sean iguales.

2. Si a todos los valores de la variable se les suma un nmero la desviacin


tpica no vara.

3. Si todos los valores de la variable se multiplican por un nmero la


desviacin tpica queda multiplicada por dicho nmero.

4. Si tenemos varias distribuciones con la misma media y conocemos sus


respectivas desviaciones tpicas se puede calcular la desviacin tpica
total.

Si todas las muestras tienen el mismo tamao:

Si las muestras tienen distinto tamao:

Observaciones sobre la desviacin tpica

1. La desviacin tpica, al igual que la media y la varianza, es un ndice muy


sensible a las puntuaciones extremas.

2. En los casos que no se pueda hallar la media tampoco ser posible hallar la
desviacin tpica.

Asignatura Calidad y Mejora Continua 27


Apunte 1 - Unidad N1 - 2017
3. Cuanto ms pequea sea la desviacin tpica mayor ser la
concentracin de datos alrededor de la media.

Medidas de posicin

Las medidas de posicin dividen un conjunto de datos en grupos con el mismo


nmero de individuos.

Para calcular las medidas de posicin es necesario que los datos estn
ordenados de menor a mayor.

La medidas de posicin son:

Cuartiles

Los cuartiles son los tres valores de la variable que dividen a un conjunto de
datos ordenados en cuatro partes iguales.

Q1, Q2 y Q3 determinan los valores correspondientes al 25%, al 50% y al 75% de


los datos.

Q2 coincide con la mediana.

Clculo de los cuartiles



1. Ordenamos los datos de menor a mayor.

2. Buscamos el lugar que ocupa cada cuartil mediante la expresin

Nmero impar de datos:



2, 5, 3, 6, 7, 4, 9

Asignatura Calidad y Mejora Continua 28


Apunte 1 - Unidad N1 - 2017
Nmero par de datos

2, 5, 3, 4, 6, 7, 1, 9

Clculo de los cuartiles para datos agrupados

En primer lugar buscamos la clase donde se encuentra , en la tabla de las


frecuencias acumuladas.

Donde:

Li es el lmite inferior de la clase donde se encuentra la mediana.


N es la suma de las frecuencias absolutas.
Fi-1 es la frecuencia acumulada anterior a la clase mediana.
ai es la amplitud de la clase.

Ejercicio de cuartiles

Calcular los cuartiles de la distribucin de la tabla:

f i F i
[50, 60) 8 8

Asignatura Calidad y Mejora Continua 29


Apunte 1 - Unidad N1 - 2017
[60, 70) 10 18

[70, 80) 16 34

[80, 90) 14 48

[90, 100) 10 58

[100, 110) 5 63

[110, 120) 2 65

65


Clculo del primer cuartil

Clculo del segundo cuartil


Asignatura Calidad y Mejora Continua 30


Apunte 1 - Unidad N1 - 2017
Clculo del tercer cuartil

Deciles

Los deciles son los nueve valores que dividen la serie de datos en diez partes
iguales.

Los deciles dan los valores correspondientes al 10%, al 20%... y al 90% de los
datos.

D5 coincide con la mediana.

Clculo de los deciles

En primer lugar buscamos la clase donde se encuentra, en la tabla de las


frecuencias acumuladas.

Donde:
Li es el lmite inferior de la clase donde se encuentra la mediana.
N es la suma de las frecuencias absolutas.
Fi-1 es la frecuencia acumulada anterior a la clase mediana.
ai es la amplitud de la clase.

Asignatura Calidad y Mejora Continua 31


Apunte 1 - Unidad N1 - 2017
Ejercicio de deciles

Calcular los deciles de la distribucin de la tabla:

f i F i
[50, 60) 8 8

[60, 70) 10 18

[70, 80) 16 34

[80, 90) 14 48

[90, 100) 10 58

[100, 110) 5 63

[110, 120) 2 65

65

Clculo del primer decil


Clculo del segundo decil


Asignatura Calidad y Mejora Continua 32


Apunte 1 - Unidad N1 - 2017
Clculo del tercer decil

Clculo del cuarto decil


Clculo del quinto decil


Clculo del sexto decil


Asignatura Calidad y Mejora Continua 33


Apunte 1 - Unidad N1 - 2017
Clculo del sptimo decil

Clculo del octavo decil


Clculo del noveno decil

Percentiles

Los percentiles son los 99 valores que dividen la serie de datos en 100 partes
iguales.

Los percentiles dan los valores correspondientes al 1%, al 2%... y al 99% de los
datos.

P50 coincide con la mediana.

Asignatura Calidad y Mejora Continua 34


Apunte 1 - Unidad N1 - 2017
Clculo de los percentiles

1. En primer lugar buscamos la clase donde se encuentra

, en la tabla de las frecuencias acumuladas.

Donde:

Li es el lmite inferior de la clase donde se encuentra la mediana.


N es la suma de las frecuencias absolutas.
Fi-1 es la frecuencia acumulada anterior a la clase mediana.
ai es la amplitud de la clase.

Ejercicio de percentiles
Calcular el percentil 35 y 60 de la distribucin de la tabla:

f i F i
[50, 60) 8 8

[60, 70) 10 18

[70, 80) 16 34

[80, 90) 14 48

[90, 100) 10 58

[100, 110) 5 63

[110, 120) 2 65

65

Asignatura Calidad y Mejora Continua 35


Apunte 1 - Unidad N1 - 2017
Percentil 35

Percentil 60

Asignatura Calidad y Mejora Continua 36


Apunte 1 - Unidad N1 - 2017
Distribuciones para la asignacin de valores aleatorios

Distribucin uniforme
Distribucin de entero
Distribucin normal
Distribucin exponencial
Distribucin Poisson
Distribucin Gamma
Distribucin binomial
Distribucin geomtrica
Distribucin binomial negativa

Estas son las distribuciones disponibles para distintas herramientas que crean
valores aleatorios. Las distribuciones transforman los valores aleatorios de 0-1 que
se crearon a partir de la transmisin especfica (identificada a nivel mundial en el
entorno de anlisis o a nivel local con la herramienta) en la distribucin especfica.

Distribucin uniforme

La distribucin uniforme es una distribucin de probabilidad continua donde todos
los valores de un intervalo especfico tienen la misma probabilidad.

Una distribucin de entero es una versin discreta de la distribucin uniforme (vea


a continuacin). La distribucin uniforme se utiliza al modelar las concentraciones
de un gas en un modelo de simulacin o del tiempo entre accidentes en una
interseccin, como tambin para ubicar los puntos en la herramienta Crear puntos
aleatorios.

Con frecuencia, la distribucin uniforme se utiliza para modelar eventos aleatorios


cuando cada instancia o resultado potencial tiene la misma probabilidad de
ocurrencia.

Asignatura Calidad y Mejora Continua 37


Apunte 1 - Unidad N1 - 2017
La frmula para la distribucin uniforme es la siguiente:

Donde
a es el valor mnimo para el intervalo con igual probabilidad.
b es el valor mximo para el intervalo con igual probabilidad.
x son las observaciones.

Los valores aleatorios seleccionados se encuentran entre el mnimo y el mximo


(ambos exclusivos). El mnimo debe ser menor que el mximo. Si no se
proporciona un valor mnimo o mximo, se producen variables uniformes entre 0,0
y 1,0.

Distribucin de entero

La distribucin de entero es una distribucin de probabilidad donde todos los
valores discretos de un intervalo especfico tienen la misma probabilidad.
La distribucin de entero es la versin discreta de la distribucin uniforme (vea
arriba). La distribucin de entero se utiliza para modelar la probabilidad de
ocurrencia de cada nmero al tirar un dado (cada nmero tiene una probabilidad
de ocurrencia de un sexto), para modelar eventos aleatorios en un modelo de
simulacin, o seleccionar ubicaciones de muestra para un estudio biolgico.

Con frecuencia, la distribucin de entero se utiliza para modelar eventos aleatorios


cuando cada instancia o resultado potencial tiene la misma probabilidad de
ocurrencia.

Asignatura Calidad y Mejora Continua 38


Apunte 1 - Unidad N1 - 2017
Aqu se muestra la frmula para la distribucin de entero:

Donde
a es el valor mnimo para el intervalo con igual probabilidad.
b es el valor mximo para el intervalo con igual probabilidad.
x son las observaciones.

Los valores aleatorios seleccionados se encuentran entre el mnimo y el mximo


(ambos exclusivos). El mnimo debe ser menor que el mximo. Si no se
proporciona un valor mnimo o mximo, se producen valores uniformes entre 1 y
100.

Distribucin normal

La distribucin normal modela variables aleatorias continuas que ocurren con
frecuencia.

La distribucin normal se utiliza ampliamente y se aplica a muchas aplicaciones.

Se construye en el teorema del lmite central, basado en el principio de que la


suma de las variables aleatorias se distribuye normalmente si hay un gran nmero
de observaciones. Por ejemplo, la cantidad de veces en que sale "cara" en una
secuencia de tiros de una moneda se aproxima a la normalidad cuando la moneda
se tira muchas veces. Como ejemplos de distribuciones normales se encuentra la
altura de las personas en un pas, los valores de elevacin de un estado, y las
puntuaciones de exmenes de matemticas para estudiantes de 12 aos de edad.

Asignatura Calidad y Mejora Continua 39


Apunte 1 - Unidad N1 - 2017
La frmula para la distribucin normal es la siguiente:

Donde
es el valor medio.
es la desviacin estndar (un nmero positivo).

La distribucin normal es simtrica en relacin al valor medio, al modo y a la


mediana, que son iguales a .

Con frecuencia, las distribuciones binomial y Poisson modelan eventos futuros


discretos, independientes, aleatorios, verdaderos o falsos (por ejemplo, la cantidad
de veces que aparece "cara" al tirar una moneda) a travs de una pequea
cantidad de observaciones, mientras que la distribucin normal modela variables
continuas (por ejemplo, la altura, el peso y la cantidad) a travs de una gran
cantidad de observaciones. Las distribuciones binomial y Poisson estn basadas
en la probabilidad, mientras que la distribucin normal representa la cantidad de
observaciones que cumplen con la cantidad o la magnitud.

Distribucin exponencial

La distribucin exponencial es una distribucin de probabilidad continua.

En general, se utiliza para modelar el tiempo entre los eventos que ocurren a una
tasa promedio constante, o la distribucin se puede utilizar para modelar la
ocurrencia de eventos en una distancia por unidad. El tiempo hasta que ocurre el
prximo accidente automovilstico en una interseccin, el tiempo entre que se ven
dos estrellas fugaces en el cielo y la distancia entre dos baches en una calle,
representan ejemplos de cmo se puede utilizar la distribucin exponencial. Con
cada uno de estos ejemplos, a medida que el tiempo o la distancia aumenta, hay
una probabilidad exponencialmente mayor de que cambie el estado u ocurra el
evento. Las ocurrencias de los eventos son independientes entre s.

Asignatura Calidad y Mejora Continua 40


Apunte 1 - Unidad N1 - 2017
La frmula para la distribucin exponencial es la siguiente:

Donde:
e es el logaritmo natural.
x es la cantidad de posibles ocurrencias para el evento (valores enteros
positivos).

La distribucin exponencial modela los procesos de Poisson en donde el


fenmeno se encuentra en un estado inicial. La distribucin exponencial es la
versin continua de la distribucin geomtrica. Si el proceso para cambiar del
estado A al estado B se puede dividir en varias tareas independientes puede ser
mejor modelarlo con una distribucin Gamma. La distribucin Gamma modela la
suma de mltiples variables independientes, distribuidas exponencialmente. Se
puede ver como un caso especial de distribucin exponencial.

Distribucin Poisson

La distribucin Poisson es una distribucin de probabilidad discreta.

La distribucin Poisson modela la probabilidad de la cantidad de eventos que


ocurren en un perodo de tiempo fijo a partir de un valor medio conocido. Los
eventos son independientes de la ltima vez que ocurrieron. En el eje x se
representan los valores discretos para los eventos 0, 1, 2, 3, 4, y as
sucesivamente (con frecuencia, representan la cantidad de veces que ocurri el
evento), y en el eje y se representa la probabilidad de que el fenmeno ocurra
tantas veces dado un valor medio conocido. Los eventos pueden comprender la
cantidad de accidentes en una interseccin, la cantidad de defectos de nacimiento,
o la cantidad de alces en un kilmetro cuadrado.

La distribucin Poisson modela las ocurrencias extraas. A veces, la distribucin


se denomina la ley de los nmeros pequeos porque el evento no ocurre con
frecuencia, pero s hay muchas oportunidades de que ocurra.

Asignatura Calidad y Mejora Continua 41


Apunte 1 - Unidad N1 - 2017
La frmula de la Distribucin Poisson es :

Donde:
e es el logaritmo natural.
k es la cantidad de posibles ocurrencias para el evento (valores enteros
positivos).
k! es un factorial de k.
(o el valor medio) es un nmero positivo que representa la cantidad
esperada de ocurrencias en un intervalo especfico. Si el evento ocurre
cada 10 minutos en una hora (60 minutos), la lambda ser de 6.

La distribucin Poisson es similar a la distribucin binomial; sin embargo, la


distribucin Poisson modela la ocurrencia de un evento extrao sin conocer la
informacin sobre la cantidad total de ocurrencias posibles. La distribucin
Poisson examina la cantidad de accidentes en una interseccin, mientras que la
distribucin binomial modela la cantidad de accidentes en relacin a la cantidad de
autos que pasan por la interseccin.

Distribucin Gamma

La distribucin Gamma es una distribucin de probabilidad continua.

La distribucin Gamma modela la suma de mltiples variables independientes,


distribuidas exponencialmente. Se puede ver como un caso especial de
distribucin exponencial.

Asignatura Calidad y Mejora Continua 42


Apunte 1 - Unidad N1 - 2017
La frmula para la distribucin Gamma es la siguiente:

Esta es otra manera de parametrizar la distribucin Gamma:

Para un valor de alfa 1, la distribucin Gamma equivale a la distribucin


exponencial. Cuando el valor de alfa es un nmero entero, la distribucin Gamma
se convierte en la distribucin Erlang. Para un valor de alfa entero y uno de beta
equivalente a 2, la distribucin Gamma se convierte en distribucin de chi-
cuadrado con 2 grados de libertad de alfa.

Las variables resultantes son mayores o iguales a 0,0. Los valores de alfa y beta
deben ser superiores a 0,0.

Distribucin binomial

La distribucin binomial modela la cantidad de ocurrencias de un evento al
observar una secuencia de productores potenciales del evento. Por ejemplo, la
distribucin binomial captura la cantidad de personas de un estudio clnico que
fallecieron por una enfermedad coronaria, la cantidad de personas que descienden
en el segundo piso de un ascensor repleto, o la cantidad de animales de una
poblacin con un rasgo gentico determinado.

Asignatura Calidad y Mejora Continua 43


Apunte 1 - Unidad N1 - 2017
La distribucin binomial describe ocurrencias, no la magnitud. Puede modelar
cuntos participantes terminaron una carrera, no cun veloces fueron los
participantes.

La frmula para la distribucin binomial es la siguiente:

Donde:
n es la cantidad de observaciones.
p es la probabilidad de ocurrencia.
x es la cantidad de xitos que varan de 0 a n.

Un ejemplo comn del uso de la distribucin binomial es la determinacin de la


probabilidad de la cantidad de veces que aparece "cara" al tirar una moneda 10
veces (n = 10). Puede haber 0 caras de 10, 1 de 10, y as sucesivamente; por lo
tanto, x = 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10. Y p es la probabilidad para cada x.

Todos los ensayos son independientes, y cada ensayo tiene un resultado de xito
o error.

La distribucin binomial se aproxima a la distribucin Poisson por una n grande y


una p pequea. En este caso, ser ms fcil utilizar la distribucin Poisson.

La distribucin binomial devuelve una variable aleatoria para la cantidad de xitos


de un total de n ensayos en donde la probabilidad de xito en cada ensayo es p
(por ejemplo, la probabilidad de que salga cara es p).

Distribucin geomtrica

La distribucin geomtrica es una distribucin de probabilidad discreta.
Existen dos tipos principales de fenmenos que modela:
(1) la probabilidad de la cantidad de veces que conlleva un xito (por ejemplo, la
cantidad de veces que se tira el dado para que salga el nmero 6)
(2) la probabilidad de la cantidad de errores antes del xito (por ejemplo, la
cantidad de senderos que hay en un camino hasta ver un venado).

La probabilidad de no ver un venado en el primer sendero del camino es (1 - p).


Para el segundo sendero, la probabilidad de no ver un venado es (1 - p) (1 - p).

Asignatura Calidad y Mejora Continua 44


Apunte 1 - Unidad N1 - 2017
Con ms senderos en el camino, la probabilidad de no ver un venado disminuye
exponencialmente, y finalmente se ver uno. Los eventos son independientes
entre s.

La frmula para la distribucin geomtrica es la siguiente:

Donde:
p es la probabilidad de xito.
n es la cantidad de ensayos.

La distribucin geomtrica es la versin discreta de la distribucin exponencial


(vea arriba). La distribucin geomtrica es un caso especial de distribucin Pascal
o binomial negativa, con r en la distribucin Pascal que equivale a 1 (vea debajo).

Distribucin binomial negativa

La distribucin binomial negativa es una distribucin de probabilidad discreta.

La distribucin binomial negativa est basada en ensayos de Bernoulli. Los


ensayos de Bernoulli modelan eventos en los cuales los ensayos tienen uno o dos
resultados (xito y error); tienen una probabilidad de xito, p (p es la misma para
cada ensayo); y son independientes entre s. La accin de tirar una moneda es un
ensayo de Bernoulli. Por ejemplo, la distribucin binomial negativa puede modelar
cuntos tiros de una moneda se necesitan para que ocurran cinco caras
sucesivas. Entonces, la distribucin binomial negativa modela la cantidad de
errores antes de un xito. Cuando r es un nmero entero, la distribucin binomial
negativa se convierte en un caso particular denominado distribucin Pascal.

Asignatura Calidad y Mejora Continua 45


Apunte 1 - Unidad N1 - 2017
La frmula para la distribucin binomial negativa es la siguiente:

Donde:
r es la cantidad de errores.
p es la probabilidad de xito.
k es la cantidad de xitos que varan de 0 a n.

Cuando la distribucin binomial negativa representa la accin de tirar una moneda,


se devuelve un valor aleatorio para la cantidad de veces que lleva que aparezca
cara.

Asignatura Calidad y Mejora Continua 46


Apunte 1 - Unidad N1 - 2017
Bibliografa

Instituto de Tecnologas Educativas. Ministerio de Educacin de Espaa


Instituto Nacional de Estadstica. Portugal
Instituto Nacional de Estadstica. Espaa
http://www.vitutor.net/2/11/medidas_dispersion.html
http://www.ditutor.com/estadistica/medidas_centralizacion.html
http://www.ditutor.com/estadistica/medidas_posicion.html

Asignatura Calidad y Mejora Continua 47


Apunte 1 - Unidad N1 - 2017

Das könnte Ihnen auch gefallen