Sie sind auf Seite 1von 90

Estadstica Bsica

17- 30 de noviembre 2010


Ing. Irina Verkovitch, MSc. iverkovitch@puce.edu.ec

Reglas de Oro

Ser parte activa Mente abierta y positiva Respeto

Intervencin Uso de la computadora

Resultado observable

Al finalizar el curso los participantes estarn en la capacidad de recopilar, organizar, graficar, procesar los datos de punto de vista de estadstica descriptiva e inferencial y posteriormente interpretar informacin obtenida, con el propsito de aplicar los conocimientos adquiridos en su trabajo diario integrando el conocimiento en el rea de Estadstica con los conocimientos de Administracin de Procesos y utilizacin del paquete computacional Excel

Metodologa

Exposicin de temas Talleres prcticos Intervencin activa de los participantes


Textos sugeridos:

LEVINE David, KREHBIEL Timothy, Estadstica para Administracin, cuarta edicin, 2006 Folleto Power Point proporcionado por el facilitador.

Temas a tratar

Introduccin

Mtodos de recopilacin de la informacin. Elaboracin de la encuesta y el procesamiento de los resultados.

Construccin e interpretacin de las grficas. Procesamiento de datos cualitativos univariados y bivariados.

Graficas: pastel, barras, Pareto Tablas de contingencia Distribucin de frecuencias. Graficas: histograma, polgono de frecuencias, ojiva. Presentacin grfica de los datos utilizando Excel Resolucin del caso prctico

Datos cuantitativos univariados y bivariados.


Temas a tratar

Calculo e interpretacin de las estadsticas descriptivas

Medidas de tendencia central: promedio, mediana, moda, media geometra, media ponderada Medidas de dispersin: rango, desviacin estndar. Uso de mas medidas de dispersin para la toma de decisiones Medidas de posicin y su utilizacin. Resolucin del caso prctico
Probabilidad Bsica. Reglas de adicin y de multiplicacin. Distribuciones probabilsticas: discretas y continuas Resolucin del caso prctico

Probabilidad

El ciclo PHVA

Tomar acciones/ Estandarizar

A V
Verificar los resultados del trabajo

P
H

Estadstica Bsica

Recoleccin de datos

Check - list

Presentacin de datos

Tablas y grficas

Descripcin de datos

Media aritmtica =

X
n

Fuentes de datos estadsticos


Entrevistas Encuestas Bases de datos Experimento Observacin

Recoleccin de datos
Fuentes Primarias
Recoleccin de datos

Fuentes Secundarias
Creacin de Bases de datos

Fuente impresa o electrnica Observacin Encuesta

Experimento
Ver archivo

Trminos utilizados en Estadstica


Poblacin
a b cd

Muestra
b gi o r y c n u

ef gh i jk l m n

o p q rs t u v w
x y z

Tipos de datos
DATOS

Cualitativos o de atributos (tipo de auto que posee)

Cuantitativos o numricos

discretos (nmero de hijos)

continuos (tiempo para resolver el examen)

Fuentes de datos estadsticos


Entrevistas Encuestas Bases de datos Experimento Observacin

Anlisis de datos cualitativos


Recoleccin: Bases de datos Presentacin grafica


Pastel Barras Pareto

Ejemplo de presentacin de barras


Nmero de las infracciones
Contravenciones leves de primera clase 560 30,30%

Contravenciones leves de segunda clase


Contravenciones leves de tercera clase Contravenciones graves de primera clase Contravenciones graves de segunda clase Contravenciones graves de tercera clase Contravencin muy grave Delitos TOTAL

423
288 267 154 86 52 18 1848

22,89%
15,58% 14,45% 8,33% 4,65% 2,81% 0,97% 100,00%

Delitos Contravencin muy grave Contravenciones graves de tercera clase Contravenciones graves de segunda clase Contravenciones graves de primera clase Contravenciones leves de tercera clase Contravenciones leves de segunda clase Contravenciones leves de primera clase 0.00% 5.00% 10.00% 15.00% 20.00% 25.00% 30.00% 35.00%

Contravencin muy grave 3% Delitos Contravenciones 1% graves de tercera clase 5% Contravenciones graves de segunda clase 8%

Infracciones de trnsito

Contravenciones graves de primera clase 14%

Contravenciones leves de primera clase 30%

Contravenciones leves de tercera clase 16%

Contravenciones leves de segunda clase 23%

Construccin de los grficos: Taller 1


Construir Pastel y Barras

Archivo Taller 1

Encuesta

Tcnica cuantitativa que consiste en una investigacin realizada sobre una muestra de sujetos, representativa de un colectivo ms amplio que se lleva a cabo en el contexto de la vida cotidiana, utilizando procedimientos estandarizados de interrogacin con el fin de conseguir mediciones cuantitativas sobre una gran cantidad de caractersticas objetivas y subjetivas de la poblacin Ventajas: - Tcnica ms utilizada y que permite obtener informacin de casi cualquier tipo de poblacin - Permite obtener informacin sobre hechos pasados de los encuestados - Gran capacidad para estandarizar datos, lo que permite su tratamiento informtico y el anlisis estadstico - Relativamente barata para la informacin que se obtiene con ello Inconvenientes: - No permite analizar con profundidad temas complejos (recurrir a grupos de discusin) Tiene un grado de subjetividad, ya que mide la percepcin de los encuestados sobre un hecho

Cmo estructurar una Encuesta?

Definir el objetivo

Enlistar los factores que se quiere evaluar (atencin en el servicio, preferencia sobre un producto, satisfaccin sobre el tiempo de entrega del producto) Explicitar, que se pretende a concluir segn los factores identificados Definir las preguntas de la encuesta Decidir por el mtodo de procesamiento de la informacin obtenida Disear una aplicacin informtica para el procesamiento de las encuestas

Satisfaccin del cliente Marketing

Preguntas para validar una encuesta

La pregunta formulada responde al objetivo de la encuesta? La respuesta a la pregunta proporciona informacin suficiente para realizar la conclusin? La conclusin es coherente con el objetivo de la investigacin? Es posible obtener la misma informacin desde alguna base de datos?

Ejemplo
FACTOR SUBFACTOR PREGUNTA RESULTADO Cunto tiempo se demora entregarle el informe? Tiempo Promedio El tiempo en que le entregan el informe es: Muy aceptable (5); Medianamente aceptable(4); Aceptable(3); Poco Aceptable(2); Inaceptable(1) Puntaje promedio Validacin Se puede obtener esta informacin desde la base de datos y no cumple con el objetivo de la encuesta

Tiempo de entrega

Entrega del informe

Ver ejemplo de la grfica

La persona que le entreg % de SI y NO. el informe lo realiz Presentacin grafica Competencia del personal adecuadamente? SI NO "pastel" que elabora el informe La persona que le entreg el informe lo realiz: cumpliendo todos los requisitos(4); cumpliendo todo menos 1(3); cumpli parcialmente (2); no se ajusto a los requisitos(1) Puntaje promedio

Mide satisfaccin con el tiempo de entrega Puede existir la dificultad en contestacin a la pregunta y formulacin de la conclusin, especialmente si se pretende realizar las mediciones posteriores

Taller 2

Parte 1

Estructurar la encuesta Procesar los resultados Construir las graficas pertinentes Conclusiones Toma de decisiones

Principio Pareto 20/80


Datos iniciales
Factores Frecuencia 1Amabilidad del personal 11 Competencia del personal 2que le atendi 16 Tiempo de espera para la 3atencin 43 Existencia de los 4formularios 12 Rapidez de solucin del 5problema 56 Cumplimiento de los 6requerimientos legales 14 7Lugar de atencin 3 Confianza que inspira el 8personal que le atendi 15 Claridad en los tramites que hay que realizar 9despus de la denuncia 87 Asistencia legal 10proporcionada 6

Grfica Pareto

120.00%
100.00% 80.00% 60.00% 40.00% 20.00% 0.00%
Series 1

Ver archivo Ejemplo Pareto

Principio Pareto 20/80

Realizar el anlisis de la situacin actual (diagrama causa efecto) Estructurar registro de recoleccin de datos Fijar las frecuencias Ordenar de mayor a menor Calcular frecuencias relativas Calcular frecuencias relativas acumulativas Construir la grafica Pareto Interpretar los resultados

Taller 3

Construir grafica Pareto

(archivo taller 3)

Organizacin de los datos cuantitativos


Datos cuantitativos

Ordenamiento de datos

Distribucin de frecuencias

Presentacin tallo - hoja

Histograma

Poligono

Ojiva

Ordenamiento de datos

Datos recolectados:

24, 26, 24, 21, 27, 27, 30, 41, 32, 38

Datos ordenados de menor a mayor: 21, 24, 24, 26, 27, 27, 30, 32, 38, 41

Presentacin tallo - hojas


Datos ordenados:
21, 24, 24, 26, 27, 27, 30, 32, 38, 41

Se utilizan los decimales:


Tallo Hojas

21 32

2 3

1 2

41

Ejemplo
Datos ordenados:
21, 24, 24, 26, 27, 27, 30, 32, 38, 41

Diagrama tallo - hojas:


Tallo Hojas

2 3 4

1 4 4 6 7 7 0 2 8 1

Ejemplo con la utilizacin de datos con las centecimas

Datos:

613, 632, 658, 717, 722, 750, 776, 827, 841, 859, 863, 891, 894, 906, 928, 933, 955, 982, 1034, 1047,1056, 1140, 1169, 1224

Tallo 6 7 8

Hojas 136 2258 346699

9
10 11 12

13368
356 47 2

Anlisis de datos cuantitativos


Recoleccin de datos Distribucin de frecuencias Graficas

Histograma Polgono de frecuencias Ojiva (frecuencias acumulativas) Caja - Brazos

Recoleccin de datos

Ejemplo: archivo Auto 2010

Distribucin de frecuencias

Distribucin de frecuencias: agrupamiento de datos en categoras que muestran el nmero de observaciones en cada categora mutuamente excluyente

Sugerencias para elaborar una distribucin de frecuencias

Los intervalos de clase usados en la distribucin de frecuencias deben ser iguales El intervalo de clase sugerido se determina con la frmula:

i = (valor ms alto - valor ms bajo) nmero de clases

Ejemplo de la distribucin de frecuencias


Ejemplo: Distancias que recore el camin de distribucin durante el dia
24, 35, 17, 21, 24, 37, 26, 46, 58, 30, 32, 13, 12, 38, 41, 43, 44, 27, 53, 27

Ejemplo de la distribucin de frecuencias (continued)

Ordenar los datos de menor a mayor:


12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58

Encontrar el rango:

58 - 12 = 46 5 ( se recomienda entre 5 y 15)

Seleccionar el nmero de clases: Calcular el intervalo de clase


superior)

10 (46/5 se redondear al nmero


10, 20, 30, 40, 50, 60

Determinar los limites de clases:


25, 35, 45, 55

Calcular los puntos medios de clases (marcas de clase):


Contar numeros de observaciones dentro de cada clase

15,

Ejemplo de la distribucin de frecuencias


Datos ordenados:

12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58
Clases 10 pero 20 pero 30 pero 40 pero 50 pero menor que 20 menor que 30 menor que 40 menor que 50 menor que 60 Total Frecuencia 3 6 5 4 2 20 Frecuencia relativa .15 .30 .25 .20 .10 1.00 Porcentaje 15 30 25 20 10 100

Frecuencias Acumulativas
Datos ordenados:

12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58
Clases Frecuencias Porcentaje Frecuencia Porcentaje acumulativa acumulativo

10 pero menor que 20 3 20 pero menor que 30 6 30 pero menor que 40 5

15 30 25

3 9 14

15 45 70

40 pero menor que 50 4


50 pero menor que 60 2 Total 20

20
10 100

18
20

90
100

Ejemplo de histograma
Clases 10 pero menor 20 20 pero menor 30 30 pero menor 40 40 pero menor 50 50 pero menor 60 Punto medio Frecuencias 15 25 35 45 55 3 6 5 4 2

6
Frecuencias
5

4
3

2 1
0

No existe la distancia entre las barras

15

25 35 45 55 Marcas de clases

65

Polgono de frecuencias
Clases 10 pero menor 20 20 pero menor 30 30 pero menor 40 40 pero menor 50 50 pero menor 60 Punto medio Frecuencias 15 25 35 45 55 3 6 5 4 2

En el polgono de frecuencias de los porcentajes, el eje vertical debe mostrar los porcentajes correspondientes a cada clase

7 6 5 4 3 2 1 0 5 15 25 35 45 55 65

Frecuencias

Marcas de clases

Grfico de las frecuencias acumulativas o OJIVA


Clases
Frecuencias Porcentaje acumulativas acumulativo

Porcentaje acumulativo

Menor que 10 10 pero menor 20 20 pero menor 30 30 pero menor 40 40 pero menor 50 50 pero menor 60

0 10 20 30 40 50

0 15 45 70 90 100

100

80 60
40

20 0 10 20 30 40 50 60

Limites de clases (no marcas de clases)

Ejemplo de construccin de las graficas


Archivo Auto 2010, variable Horsepower

Taller 4
Objetivo:

Construir graficas: histograma, polgono de frecuencias, ojiva para datos cuantitativos archivo Auto 2010, variable MPG (consumo por galn)

Anlisis comparativo de las graficas para las variables cualitativas y cuantitativas

Tablas de contingencia

Se construye a base de los atributos bivariados

Graficas para datos bivariados cuantitativos


Diagramas de dispersin Graficas de control

Diagrama de dispersin
Volumen por da 23 24 26 Costo por da 131 120
250 Costo por da 200 150 100 50 0 0 20 40 Volumen por da 60 80

Volumen por da vs. costo por da

140

29
33 38 41

151
160 167 185

42
50 55 60

170
188 195 200

Grfica de control
LSC Promedio LIC

Tiempo

Resumen de estadisticas
Datos numericos

Medias de tendencia central Media aritmetica Mediana

Cuartiles Percentiles

Medias de dispercin Rango Rango intercuartil Varianza Desviacin estandar

Forma
Caja - Brazos

Moda Media Geomtrica

Coeficiente de variacin

Resumen estadstico con el Excel


Columna1 Media Error tpico Mediana Moda 19,0066667 0,97812785 18,3 18,3

Desviacin estndar
Varianza de la muestra Curtosis Coeficiente de asimetra Rango

5,3574269
28,702023 0,85381172 0,91447766 23,5

Mnimo Mximo
Suma Cuenta

10,3 33,8
570,2 30

Medidas de tendencia central


Medidas de tendencia central

Media aritmtica

Mediana

Moda

Media Geomtrica

X
i 1

XG ( X1 X 2 Xn )1/ n

Punto medio de valores

Dato de mayor frecuencia

Media aritmtica

Media, promedio: es la medida ms utilizada


n

X
Tamao de la muestra

X
i1

X1 X 2 Xn n
Valores observados

Media aritmtica

Es afectada por los valores extremos

0 1 2 3 4 5 6 7 8 9 10

0 1 2 3 4 5 6 7 8 9 10

Media = 3

Media = 4

1 2 3 4 5 15 3 5 5

1 2 3 4 10 20 4 5 5

Mediana

Mediana: es el punto medio de los valores despus de ordenarlos de menor a mayor, o de mayor a menor. La misma cantidad de valores se encuentra por arriba de la mediana que por debajo de ella Nota: para un conjunto con un nmero par de nmeros, la mediana ser el promedio aritmtico de los dos nmeros medios

Mediana

En los datos ordenados la mediana es la posicion media (50% por encima, 50% por debajo)
0 1 2 3 4 5 6 7 8 9 10 Mediana = 3

0 1 2 3 4 5 6 7 8 9 10

Mediana = 3

No es afectada por los valores extremos

Buscando la mediana

La posicin de la mediana:

n 1 Posicin 2

Si el nmero de datos es impar, la mediana se ubica en el nmero obtenido Si el nmero de datos es par, la mediana se busca como el promedio de los valores

n 1 Atencin: 2

no es el valor de la mediana, es su

posicin en el conjunto de datos ordenados.

Moda

Es la medida de tendencia central El valor que ms ocurre No es afectada por los valores extremos Pueden existir los casos cuando no existe Moda Pueden existir varias modas
0 1 2 3 4 5 6 No hay Moda

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14

Moda = 9

Ejemplo

Cinco casas cerca de la playa


$2,000 K

Precios de casas: $2,000,000 500,000 300,000 100,000 100,000

$500 K $300 K

$100 K $100 K

Ejemplo: Clculo de las medidas de tendencia central


Precios de las casas:
$2,000,000 500,000 300,000 100,000 100,000 Sum $3,000,000

Media:

($3,000,000/5) = $600,000

Mediana: como el valor de la posicn media de los datos ordenados = $300,000 Moda: el valor que ms se repite = $100,000

Distribucin simtrica
sesgo cero moda = mediana = media

Distribucin con asimetra positiva

moda < mediana < media

Media ponderada

La media ponderada de un conjunto de nmeros X1, X2, ..., Xn, con las ponderaciones correspondientes w1, w2, ...,wn, se calcula con la frmula:

Xw ( w1 X 1 w2 X 2 ... wn X n ) /( w1 w2 ...wn ) Xw ( w * X ) / w

Media geomtrica

La media geomtrica (MG) de un conjunto de n nmeros positivos se define como la raz n-sima del producto de los n valores. Su frmula es:

MG n ( X 1)( X 2)( X 3)...(Xn)


La media geomtrica se usa para encontrar el promedio de porcentajes, razones, ndices o tasas de crecimiento
Archivo media geomtrica

Cuartiles

Los cuartiles dividen los datos ordenados en 4 segmentos con el numero igual de datos por segmento
25% 25% 25% 25%

Q1

Q2

Q3

Formulas de los cuartiles


Para encontrar el valor de un cuartil primero se ordenan los datos, despus se busca la posicin del cuartil acorde a las formulas que se presentan a continuacin:
Q1 = (n+1)/4 Q2 = (n+1)/2 (posicin de la mediana)

Q3 = 3(n+1)/4
donde n es el nmero de los valores observados

Cuartiles

Ejemplo: Buscar el primer cuartil

Datos ordenados: 11 12 13 16 16 17 18 21 22
(n = 9) Posicin de Q1 (9+1)/4 = 2.5

Q1 = 12.5

Percentiles
Pregunta clave: Cmo establecer polticas en una organizacin?

Pk=(n+1)*k/100

Taller 5
Objetivo:

Encontrar las medias de tendencia central, y posicin. Interpretar los resultados archivo Auto 2010, variable MPG (consumo por galn)

Medidas de dispersin
Dispersin Rango Rango intercuartil Varianza Desviacin estandar Coeficiente de variacin

El mismo centro, pero diferente variacin

Rango

Una medida de variacin de datos simple Es la diferencia entre el valor mximo y mnimo:
Rango = Xmaximo Xminimo

Ejemplo:
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14

Rango = 14 - 1 = 13

Desventajas del Rango

Ignora como estan distribuidos los datos


7 8 9 10 11 12 Rango = 12 - 7 = 5 7 8 9 10 11 12

Rango = 12 - 7 = 5

Sencible a los valores extremos


1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,5

Rango = 5 - 1 = 4
1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,120

Rango = 120 - 1 = 119

Rango intercuartil
Ejemplo:
X Q1 Mediana (Q2) 25% Q3 25% X

minimum
25%

maximum

25%

12

30

45

52

70

Rango intercuartil = 57 30 = 27

Variancia muestral
( X X ) Frmula conceptual= S = n 1 (X ) 2 2 X n Frmula operativa = S 2 = n 1
2 2

Desviacin estandar

Una de las medias ms utilizadas Muestra la variacin refente a la media Es la raiz cuadrada de la varianza Tiene las mismas unidades de medida que los datos originales

Desviacin estandar de la muestra:

(Xi X)2
i1

n -1

Ejemplo del clculo de la desviacin estandar


10 12 14 15 17 18 18 24

n=8

Mean = X = 16

(10 X)2 (12 X)2 (14 X)2 (24 X)2 n 1 (10 16)2 (12 16)2 (14 16)2 (24 16)2 8 1 130 7
La medida de la distancia promedio referente a la media

4.3095

Midiendo la variacin
Desviacin estandar pequea Desviacin estandar grande

Comparando las desviaciones estandares


Datos A Media = 15.5 11 21 12 13 14 15 16 17 18 19 20

S=

3.338

Datos B Media = 15.5


11 12 20 21 13 14 15 16 17 18 19

S=

0.926

Datos C Media = 15.5


11 21 12 13 14 15 16 17 18 19 20

S=

4.567

Dispersin relativa

El coeficiente de variacin es la razn de la desviacin estndar a la media aritmtica, expresada como porcentaje

s CV (100%) X

Asimetra

Asimetra (sesgo) es la medida de la falta de simetra en una distribucin. El coeficiente de asimetra se calcula mediante la siguiente frmula conceptual:

3(media - mediana) desviacin estndar

Pregunta clave

Que proporcin de datos se ubica en el intervalo entre A y B?


Histograma Ojiva Teorema de Chebyshev Regla emprica Solucin a travs de las funciones

Teorema de Chebyshev

Para cualquier conjunto de observaciones, la proporcin mnima de valores que est dentro de k desviaciones estndar desde la media es al menos 1 - 1/k , donde k2 es una constante mayor que 1

Regla emprica

3
2001 Alfaomega Grupo Editor

2 1

1 2 3

Anlisis comparativo de varias poblaciones


Promedio Dispersin Graficas

Polgono de frecuencias Caja -Brazos

Diagrama Caja-Brazos

Resumen de cinco nmeros:


Lmin Q1= (n+1)/4 Mediana Q3 Lmax

Diagrama Caja-Brazos
Lmin Lmax
25% 25% 25%

Valor atpico

25%

Q1 Mediana

Q3

Formulas importantes

Pk=(n+1)*k/100 Q1 =(n+1)/4 Mediana=(n+1)/2 Q3=(n+1)*3/4 Valor atpico (min)=Q1-1,5*(Q3-Q1) Valor atpico (max)= Q3+1,5*(Q3-Q1)

Percentiles
Pregunta clave: Cmo establecer polticas en una organizacin?

Pk=(n+1)*k/100

Uso de la medidas de posicin


Diagrama de Caja Brazos Establecer polticas dentro de la organizacin

Taller 6
Objetivo:

Encontrar las medias de dispersin y posicin. Interpretar los resultados Construir la presentacin caja brazos. Concluir archivo Auto 2010, variable MPG (consumo por galn)

Das könnte Ihnen auch gefallen