You are on page 1of 31

Elementos de

Estadstica

Esquema del proceso de obtener


conclusiones a partir de los datos
OBJETIVO
Materia Prima
DATOS
Procesamiento
ORGANIZACION Y
ANALISIS
Producto
CONCLUSIONES
2

El caso de anlisis
Una empresa dedicada a la produccin de
aceite de girasol , tiene fbricas en 4
localidades diferentes. Todos las fbricas
tienen las mismas caractersticas, los costos
de produccin son idnticos. Se dispone de
informacin sobre la produccin aceite de
girasol en los ltimos 12 aos de las 4
fbricas. Usted es el asesor de la empresa en
el rea de produccin y se le pide que, a partir
de dicha informacin, realice las
recomendaciones
3

Objetivos del anlisis de


los datos
Para producir la recomendacin pedida, deber analizar
los datos de modo de contestar la siguiente pregunta
general:
Cmo fue la produccin de aceite de girasol de los
ltimos 12 aos en cada una de las cuatro empresas?
En relacin con esta pregunta general, interesar
establecer y documentar, mediante grficos y medidas,
los siguientes puntos para cada localidad:
La produccin fue alta o baja?
La produccin fue pareja entre aos?
Los resultados econmicos negativos fueron frecuentes
o raros?
Los resultados econmicos sobresalientes fueron
frecuentes o raros?
4

Clasificacin de la
estadstica moderna

Representacin de datos

Descriptiva

Cuadros
Tablas
Grficos

Reduccin de datos

Promedio
Dispersiones

Trabajo en base

Inferencial

las

a muestra

Predice, Infiere
Decide sobre
poblaciones
5

Variables
CUALITATIVAS O CATEGORICAS

Indican una cualidad o caracterstica no medible o contable,


a) Ordinales: Correspondencia lgica entre los valores de la
variable y los nmeros naturales.
Ejemplo: x= Satisfaccin del cliente: No satisfecho,
Satisfecho o muy satisfecho
b) Nominal: caso contrario al anterior.
Ejemplo : x= Tipo de mquina:
6

Variables
CUANTITATIVAS

Las que indican caractersticas medibles o contables,


a) Discretas : aquellas cuyos valores se interrumpen o
separan.
Ejemplo : x= nmero de defectos de un producto en una
fbrica. Los valores posibles son 0, 1, 2,...
b) Continuas: aquellas cuyos valores posibles no tienen
interrupcin.
Ejemplo : x= Dimetro de las botellas de la produccin de
una fbrica Entre 120 y 130 mm podemos tener infinitos
valores.

TAREA ESTADISTICA
1. Recopilacin de datos
2. Presentacin de datos
3. Anlisis de datos
4. Interpretacin de resultados

Definiciones bsicas
Poblacin es un conjunto de elementos definidos en el
tiempo y en el espacio, sobre los cuales se realizarn
las observaciones en el caso de una encuesta
exhaustiva o censo, o a los cuales se referirn los
resultados de la investigacin en el caso de un estudio
por muestreo.
Muestra es el subconjunto de unidades seleccionadas
de la poblacin definida. En esta recae la realizacin de
las observaciones.
Valores poblacionales Parmetros
Estimadores Estadsticos
9

Anlisis de datos
Los datos recopilados para cada sujeto , unidad de observacin,
experimental pueden provenir de distintos tipos de variables y
escalas de medicin:

V a r ia b le s

C u a lit a t iv a o A t r ib u t o
E s c a la d e m e d ic i n

C u a n t it a t iv a o N m e r ic a

E s c a la d e m e d ic i n

T ip o

N o m in a l

I n t e r v a lo

D is c r e t a

O r d in a l

R azn

C o n t in u a
10

Presentaciones visuales, reduccin de


datos
Tablas, Grficos y Distribuciones
Qu representacin mental le sugiere la palabra
estadstica a la mayor parte de la gente ?
Una tabla es una ordenacin de datos en filas y
columnas utilizada para documentar o comunicar
informacin. Desde este punto de vista de su uso,
existen dos tipos de tablas a saber : Tablas
generales o de Referencia y Tablas Especficas o de
Resumen
11

Distribucin de una variable


cuantitativa discreta
Veamos con un ejemplo la tabla de distribucin de
frecuencias.
En 20 productos se cont la cantidad de reclamos :
X
1
2
3
4
5
6
8
10

F
4
4
3
3
3
1
1
1
20

FR
.20
.20
0.15
015
0.15
0.05
0.05
0.05
1.0
12

Distribucin de una variable


cuantitativa continua
Ahora si lo que nos interesa son los ndices de
Productividad ponderado de esos 20 productos
estamos frente a una variable cuantitativa
continua. En este caso los valores individuales
carecen de inters, por la propia naturaleza de
dicha variable, por lo tanto se los agrupa en los
llamados intervalos de clase.

13

Distribucin de una variable


cuantitativa continua
El lmite inferior del primer intervalo debe ser algo
menor que el valor ms pequeo de la variable, y el
lmite superior del ltimo intervalo algo mayor al dato
ms grande.
Definiendo:
xmx= valor extremo superior de la variable
xmn= valor extremo inferior de la variable
La diferencia entre estos dos valores nos da la
amplitud total
A=xmx-xmn
Si creemos que la cantidad de intervalos conveniente
es h entonces la amplitud de los intervalos 14 ser

Distribucin de una variable


cuantitativa continua
Veamos por ejemplo...
X= valor de ndice de Productividad de 20 productos

Vemos cul es el valor extremo inferior


xmn=40,5
y el extremo superior,
xmx=59,2
15

Distribucin de una variable


cuantitativa continua
Para obtener a= amplitud del intervalo.
59.2- 40.5
---------------- =
5

3.7

Los intervalos se construyen de tal forma que sean


mutuamente excluyentes, esto es, un valor no puede estar
contenido en dos intervalos.
Intervalos
41 - 44
45 - 48
49 52
53 56
57 - 60

Frecuencia
3
4
6
4
3

Distribucin de una variable


cuantitativa continua
La representacin grfica correspondiente a la distribucin de
frecuencias simples o relativas de una variable cuantitativa
continua es el
HISTOGRAMA

17

Medidas que resumen informacin


Medidas de tendencia central

Frmulas para media y


varianza
m e d ia x

S
2

x i
X

n 1

( Fi. Xi)
n

n 1

Ejemplos

Utilizando el ejemplo de los pagos de condominios cuya


distribucin es la siguiente
Pagos

Nmero
unidades(Fi)

de Frecuencia
acumulada

Punto medio(Xi)

Fi. Xi

$600

799

699.5

2098.5

800

999

10

899.5

6296.5

1000

- 1199

11

21

1099.5

12094.5

1200

- 1399

22

43

1299.5

28589.0

1400

- 1599

40

83

1499.5

59980.0

1600

- 1799

24

107

1699.5

40788.0

1800

- 1999

116

1899.5

17095.5

2000

- 2199

120

2099.5

8398.0

120

175340.0

Clculos
( Fi. Xi ) 175340

$1461.17
n

120

2 FA
60 43
me L
(200) $1484.5
w 1399.5
fm
40

Moda

d1
18
w) 1399.5
mo L
(200) $1505.38

18 16
d1 d 2

22

Varianza y desviacin
estndar

Ejemplo
Las capacidades de algunos recipientes metlicos son: 38, 20, 37, 64, y 27 litros,
Cul es la amplitud total de esos valores, Cul es la desviacin estndar?

n 1

(186) 2
8038
1118 .8
5

16.72litros
4
4

23

Coeficiente de Variacin

Si el CV 5% ----> datos muy homogneos, Media aritmtica


muy representativa
Si el 5% CV 20% ----> datos con homogeneidad aceptable.
La media aritmtica es representativa
Si el CV 20% ----> datos heterogneos, la media aritmtica es
poco representativa

Relacin entre Media y desviacin


estndar
Una forma de apreciar claramente el significado de la
desviacin estndar como medida de dispersin en
torno a la media, es a travs de la relacin entre la
media y la desviacin estndar, la cual est dada por
la desigualdad de Chebyshev y la regla emprica. Dos
hechos particulares que afirma la desigualdad de
Chebyshev,1 es que entre X2S y X+2S estn por lo
menos 75% de los datos de la muestra, y que entre X
3S estn por lo menos 89% de stos.
En cuanto a la regla emprica se afirma que en muchos
de los datos que surgen en la prctica se ha observado
por la experiencia que:
Entre X 1S y X+ 1S est 68% de los datos de la
muestra.
Entre X2S y X+2S est 95%.

25

Los intervalos anteriores son vlidos slo para los


datos muestrales y no necesariamente para toda
la poblacin o proceso.
Si los intervalos se calculan con la media y la
desviacin estndar del proceso o poblacin,
entonces sern vlidos para toda la poblacin.
En la medida que se tengan muestras aleatorias
grandes y representativas, los intervalos
anteriores podrn dar una idea aproximada de lo
que pasa en el proceso

Al aplicar la regla emprica a los


datos de un proceso, se puede la
variacin de las mediciones
Al comparar estos lmites de
variacin con las especificaciones
(EI =1.10 y ES =1.30), se puede
apreciar si el proceso tiene
capacidad para cumplir con
especificaciones

27

Lmites reales o naturales


Los lmites reales o naturales de un
proceso indican los puntos entre los
cuales vara la salida de un proceso y,
por lo general, se obtienen de la
siguiente manera:
Lmite real inferior (LRI) = 3 y
Lmite real superior (LRS) = +3

28

Capacidad de un proceso
Lmites reales o naturales
Indican los puntos entre los cuales vara la salida de un
proceso y por lo general, se obtienen de la siguiente manera:
Lmite real inferior (LRI) = 3 y Lmite real superior (LRS)
= +3
En un estudio de capacidad, estos lmites reales se comparan
con las especificaciones para la caracterstica de calidad. Por
ejemplo, si las especificaciones para una caracterstica de
calidad son que sta debe tener dimensiones de 800 5;
luego, la especificacin inferior es EI =795, y la superior es
ES =805. Si adems se sabe que la media y la desviacin
estndar de tal caracterstica de calidad son =800.6 y
=1.2, respectivamente, entonces los lmites reales son:
LRI =800.6 3(1.2) =797.0 y LRS =800.6 + 3(1.2) =804.2
29

Ejemplo

Por lo tanto, se espera que esta caracterstica de


calidad vare de 797.0 a 804.2, con una media de
800.6.

Al comparar esto con las especificaciones se


aprecia que los lmites reales caen dentro de las
mismas, entonces se concluye que el proceso es
capaz de cumplir con tales especificaciones

30

Estadstico
Medidas
tendencia
central: x=0.59
Mediana =2
Moda =2

Anlisis y comentarios

Conclusiones

de Las medidas de tendencia central son Proceso centrado con


relativamente similares y muy cercanas a 0, 0.5
por lo que la tendencia central del proceso es
adecuada.
50% de las 150 mediciones fue mayor o
igual a 2 micras.
El dimetro ms frecuente fue de 2 micra
Desviacin estndar: En forma aproximada se espera que el La variacin real
S =10.5
dimetro de las punteras vare entre 0.59 del proceso es
Lmites
reales 31.5 (30.9 a 32.1 micras). La amplitud de demasiada, por lo que
aproximados
estos lmites es mayor a la variacin tolerada se est fabricando
(X3S):
(25).
producto fuera de
LRinf = 33.3
Ambos lmites estn fuera de las especificaciones
LRsup =34.5
especificaciones, por lo que se estn haciendo
punteras que no cumplen con especificaciones
Grfica de capacidad La distribucin se ajusta de forma razonable Hay mucha variacin
(histograma,
vase a la normal, y no se observa ningn en el proceso
figura
comportamiento especial.
2.4)
La tendencia central se ubica alrededor de 0
y el cuerpo del histograma est centrado con
respecto a especificaciones, pero no cabe
dentro de las especificaciones. Por lo tanto,
cualquier ajuste que slo desplace el
histograma empeorar las cosas.
Conclusiones finales:
Para reducir la variabilidad se debe encontrar que aspectos de las 6M estn
contribuyendo ms al exceso de variacin. Esto se realiza estratificando (separando) los
datos por turno, por lote, por condicin de proceso, etc.; al hacer el anlisis es preciso
ver si hay diferencias importantes de un estrato a otro. De ser as, se deben tomar las
medidas necesarias para hacer ms homogneos los estratos.
Otra posibilidad es analizar a detalle los patrones de comportamiento del31proceso