Sie sind auf Seite 1von 42

Introduccin y Estadstica Descriptiva

Organizacin y Representacin de Datos


Luceny Guzmn Acua
22 de enero de 2013
Luceny Guzmn Acua () Introduccin y Estadstica Descriptiva 22 de enero de 2013 1 / 42
Organizacin de Datos
Tipos de datos
A la informacin utilizada en estadstica le llamamos datos, estos pueden
clasicarse de la siguiente manera:
1
Datos cuantitativos: se reeren a informacin numrica (Representan
todo lo que se puede contar o medir)
Los datos discretos son los obtenidos de un proceso de conteo.
Los datos continuos son los obtenidos de un proceso de medicin.
2
Datos cualitativos: se reeren a categoras o atributos que pueden
clasicarse de acuerdo con determinado criterio.
1
Algunos datos cualitativos son expresados como nmeros, por
ejemplo: los cdigos de estudiantes y los grados de escolaridad.
2
Algunos datos se pueden representar de los dos tipos, por ejemplo
estatura y calicacin.
Luceny Guzmn Acua () Introduccin y Estadstica Descriptiva 22 de enero de 2013 2 / 42
Organizacin de Datos
Tipos de datos
Luceny Guzmn Acua () Introduccin y Estadstica Descriptiva 22 de enero de 2013 3 / 42
Organizacin y Representacin de Datos
Escalas de medicin
Las escalas de medicin indican qu clculos se pueden realizar para
resumir y presentar los datos y qu pruebas estadsticas pueden llevarse a
cabo.
1. Nominal: Se utilizan para datos cualitativos (tipos de autos,
gnero, empresas de servicio de agua, etc.) Las observaciones
se pueden clasicar o contar no existe un orden particular
para las clases o categoras, no se realizan operaciones ni
relaciones matemticas. nica medida es la moda.
2. Ordinal: Son datos medidos en una escala nominal, pero,
ordenada de alguna manera (calicaciones por letra,
clasicacin de productos, grados de escuela, etc). Se pueden
establecer relaciones de orden (mayor, menor) o contar
elementos. Las operaciones matemticas no tienen sentido.
Luceny Guzmn Acua () Introduccin y Estadstica Descriptiva 22 de enero de 2013 4 / 42
Organizacin y Representacin de Datos
Escalas de medicin
3. De intervalo: Son datos medidos en una escala ordinal, pero
de tipo cuantitativo, la distancia entre valores tiene sentido.
Se pueden realizar operaciones suma y resta. Esta escala no
siempre tiene un punto cero, que indique ausencia de
medida. (temperatura (

C), puntaje en un examen, etc), por


tanto este punto se puede considerar en cualquier posicin.
4. De razn: Son datos medidos en una escala de intervalo,
pero, la posicin del valor cero no es arbitrario y este indica
ausencia de medida. Se pueden establecer razones entre
valores (velocidad, tiempo, peso, dinero, etc).
Luceny Guzmn Acua () Introduccin y Estadstica Descriptiva 22 de enero de 2013 5 / 42
Organizacin y Representacin de Datos
Tipos de tablas o distribuciones de frecuencia
1
No agrupadas (Datos cualitativos y cuantitativos discretos cuando el
rango de valores no es muy amplio).
2
Agrupadas (Cuantitativos continuos y discretos cuando el rango de
valores es muy amplio)
3
Acumuladas (Cuantitativos).
4
Bivariadas (Cualitativos)
Luceny Guzmn Acua () Introduccin y Estadstica Descriptiva 22 de enero de 2013 6 / 42
Organizacin y Representacin de Datos
Tipos de grcos
1
Diagrama de barras univariados y bivariados, circular (Datos
cualitativos y cuantitativos discretos de tablas no agrupadas)
2
Diagrama de puntos (Datos cuantitativos discretos de tablas no
agrupadas)
3
Histograma (Datos cuantitativos de tablas agrupadas o no agrupadas)
4
Polgono (Datos cuantitativos de tablas agrupadas o no agrupadas)
5
Ojiva (Datos cuantitativos de tablas acumuladas)
6
Diagrama de tallo y hojas (Datos cuantitativos)
7
Diagrama de pareto (Datos cualitativos)
8
Diagrama de cajas (Datos cuantitativos)
Luceny Guzmn Acua () Introduccin y Estadstica Descriptiva 22 de enero de 2013 7 / 42
Organizacin y Representacin de Datos
Tabla o distribucin de frecuencias no agrupadas
Ejemplo 1 (Datos cualitativos)
Se pidi a un grupo de clientes de un banco clasicar la atencin prestada
como excelente (E), buena (B), regular (R) o mala (M), los resultados se
muestran a continuacin.
E R B B M R B B
B B E B B M B B
B B R R B E R R
M M B B M R M B
R E E M B R M R
construya una tabla de frecuencias no agrupadas.
Luceny Guzmn Acua () Introduccin y Estadstica Descriptiva 22 de enero de 2013 8 / 42
Organizacin y Representacin de Datos
Tabla o distribucin de frecuencias no agrupadas
Ejemplo 1 (Datos cualitativos)
Calicacin f f
r
%
E 5 0; 125 12; 5
B 17 0; 425 42; 5
R 10 0; 25 25
M 8 0; 20 20
Total (n) 40 1 100
Donde: f : frecuencia absoluta o frecuencia representa el nmero de veces
que aparece un dato.
f
r
: frecuencia relativa f
r
=
f
n
:
% : porcentaje, % = f
r
100 %:
Luceny Guzmn Acua () Introduccin y Estadstica Descriptiva 22 de enero de 2013 9 / 42
Organizacin y Representacin de Datos
Ejemplo 1 (Diagrama de barras)
Luceny Guzmn Acua () Introduccin y Estadstica Descriptiva 22 de enero de 2013 10 / 42
Organizacin y Representacin de Datos
Ejemplo 1 (Diagrama circular)
Se considera que el nmero total de datos se distribuye de manera
uniforme en un giro completo (360

);se determina qu ngulo ocupa


cada categora.
Calicacin f Angulo =
360f
n
= 9f
E 5 45
B 17 153
R 10 90
M 8 72
Total (n) 40 360
Luceny Guzmn Acua () Introduccin y Estadstica Descriptiva 22 de enero de 2013 11 / 42
Organizacin y Representacin de Datos
Ejemplo 1 (Diagrama circular)
Luceny Guzmn Acua () Introduccin y Estadstica Descriptiva 22 de enero de 2013 12 / 42
Organizacin y Representacin de Datos
Tabla o distribucin de frecuencias no agrupadas
Ejemplo 2 (Datos cuantitativos discretos )
Al nal de un semestre se contabiliz el nmero de fallas de un grupo de
estudiantes en una asignatura, los resultados se muestran a continuacin:
7 4 3 0 9 3 5 3
0 0 2 2 7 3 0 3
1 2 0 4 0 4 0 4
5 3 4 4 0 0 2 0
6 4 1 5 4 1 3 0
construya una tabla de frecuencias no agrupadas.
Luceny Guzmn Acua () Introduccin y Estadstica Descriptiva 22 de enero de 2013 13 / 42
Organizacin y Representacin de Datos
Tabla o distribucin de frecuencias no agrupadas
Ejemplo 2 (Datos cuantitativos discretos )
# de fallas f f
r
%
0 11 0; 275 27; 5
1 3 0; 075 7; 5
2 4 0; 1 10
3 7 0; 175 17; 5
4 8 0; 2 20
5 3 0; 075 7; 5
6 1 0; 025 2; 5
7 2 0; 05 5
8 0 0 0
9 1 0; 025 2; 5
Total(n) 40 1 100
Luceny Guzmn Acua () Introduccin y Estadstica Descriptiva 22 de enero de 2013 14 / 42
Organizacin y Representacin de Datos
Ejemplo 2 (Diagrama de puntos)
Luceny Guzmn Acua () Introduccin y Estadstica Descriptiva 22 de enero de 2013 15 / 42
Organizacin y Representacin de Datos
Ejemplo 2 (Diagrama de barras)
Luceny Guzmn Acua () Introduccin y Estadstica Descriptiva 22 de enero de 2013 16 / 42
Organizacin y Representacin de Datos
Ejemplo 2 (Histograma)
Luceny Guzmn Acua () Introduccin y Estadstica Descriptiva 22 de enero de 2013 17 / 42
Organizacin y Representacin de Datos
Ejemplo 2 (Polgono de frecuencias o grco lineal)
Luceny Guzmn Acua () Introduccin y Estadstica Descriptiva 22 de enero de 2013 18 / 42
Organizacin y Representacin de Datos
Tabla o distribucin de frecuencias agrupadas (Datos cuantitativos
continuos y discretos )
Ejemplo 3
Los clculos en millas por galn en 50 cargas del tanque de cierto tipo de
automvil nuevo se resumen en la siguiente tabla. Construya una tabla de
frecuencias absolutas, relativas, en porcentajes; una tabla de frecuencias
acumuladas (absoluta, relativa y en porcentaje)
20;5 26;5 27;6 28;3 28;7 28;9 29;2 30;0 30;4 31;5
23;7 26;6 27;8 28;4 28;7 28;9 29;2 30;2 30;5 31;9
25;8 26;6 28;1 28;4 28;7 29;0 29;3 30;3 30;8 32;0
26;3 27;1 28;3 28;4 28;8 29;2 29;3 30;3 31;2 32;6
26;4 27;4 28;3 28;5 28;8 29;2 29;5 30;3 31;5 38;6
Luceny Guzmn Acua () Introduccin y Estadstica Descriptiva 22 de enero de 2013 19 / 42
Organizacin y Representacin de Datos
Ejemplo 3
1. Se determina el nmero de clases C a utilizar.
Acuerdos:Utilizar la Ley de Sturges: C = 3; 3 log n + 1 y aproximar al
entero ms cercano. n es el nmero de datos a agrupar.
Para n = 50; se obtiene C = 6; 606, C = 7:
2. Se calcula el rango R:
R = Dato mayor Dato menor = 38;6 20;5 = 18;1:
3. Se determina la precisin P; P = 0;1:
La precisin la determina el instrumento de medicin.
4. Se calcula la amplitud A:
Acuerdo: Siempre vamos a aproximar por arriba, teniendo en cuenta la
precisin
A =
R
C
=
18;1
7
= 2;58, A = 2;6:
Luceny Guzmn Acua () Introduccin y Estadstica Descriptiva 22 de enero de 2013 20 / 42
Organizacin y Representacin de Datos
Ejemplo 3
5. Se calculan lmites tericos (Lmites de clase) y lmites
prcticos (Fronteras de clase) para las clases.
Los de la primera clase sern:
Lmite inferior: LI
1
= Dato menor = 20;5:
Lmite superior: LS
1
= LI
1
+AP = 20;5 + 2;6 0;1 = 23:
Frontera inferior:FI
1
= LI
1

P
2
= 20;5 0; 05 = 20;45:
Frontera superior: FS
1
= LS
1
+
P
2
= 23 + 0; 05 = 23;05
Para las siguientes clases se tiene: LI
i
= LI
i1
+A; LS
i
= LS
i1
+A;
FI
i
= FI
i1
+A; FS
i
= FS
i1
+A:
Caractersticas de las tablas agrupadas
1
Uniformidad: Todas las clases deben tener la misma amplitud.
2
Unicidad: Las clases no deben traslaparse.
3
Completez: Cada dato debe pertenecer a alguna clase.
Luceny Guzmn Acua () Introduccin y Estadstica Descriptiva 22 de enero de 2013 21 / 42
Organizacin y Representacin de Datos
Ejemplo 3
Clase Lmites Fronteras f f
r
% m
i
1 20;5 23;0 20;45 23;05 1 0;02 2 21;75
2 23;1 25;6 23;05 25;65 1 0;02 2 24;35
3 25;7 28;2 25;65 28;25 11 0;22 22 26;95
4 28;3 30;8 28;25 30;85 30 0;60 60 29;55
5 30;9 33;4 30;85 33;45 6 0;12 12 32;15
6 33;5 36;0 33;45 36;05 0 0;00 0 34;75
7 36;1 38;6 36;05 38;65 1 0;02 2 37;35
Total 50 1 100
m
i
: Es el punto medio de cada clase, se denomina marca de clase.
Luceny Guzmn Acua () Introduccin y Estadstica Descriptiva 22 de enero de 2013 22 / 42
Organizacin y Representacin de Datos
Ejemplo 3 (Histograma)
Luceny Guzmn Acua () Introduccin y Estadstica Descriptiva 22 de enero de 2013 23 / 42
Organizacin y Representacin de Datos
Ejemplo 3 (Polgono)
Luceny Guzmn Acua () Introduccin y Estadstica Descriptiva 22 de enero de 2013 24 / 42
Organizacin y Representacin de Datos
Tabla o distribucin de frecuencias acumuladas
Ejemplo 2 (Nmero de fallas)
# de fallas f f
acum
f
racum
= f
acum
=n %acum = 100f
racum
0 11 11 0; 275 27; 5
1 3 14 0; 35 35
2 4 18 0; 45 45
3 7 25 0; 625 62; 5
4 8 33 0; 825 82; 5
5 3 36 0; 90 90
6 1 37 0; 925 92; 5
7 2 39 0; 975 97; 5
8 0 39 0; 975 97; 5
9 1 40 1 100
Luceny Guzmn Acua () Introduccin y Estadstica Descriptiva 22 de enero de 2013 25 / 42
Organizacin y Representacin de Datos
Ojiva para Ejemplo 2 (Nmero de fallas)
Luceny Guzmn Acua () Introduccin y Estadstica Descriptiva 22 de enero de 2013 26 / 42
Organizacin y Representacin de Datos
Tabla o distribucin de frecuencias acumuladas
Ejemplo 3 (Rendimiento)
Fronteras f Frontera f
acum
f
racum
=
f
acum
50
%acum
20;45 0 0;00 0
20;45 23;05 1 23;05 1 0;02 2
23;05 25;65 1 25;65 2 0;04 4
25;65 28;25 11 28;25 13 0;26 26
28;25 30;85 30 30;85 43 0;86 86
30;85 33;45 6 33;45 49 0;98 98
33;45 36;05 0 36;05 49 0; 98 98
36;05 38;65 1 38;65 50 1 100
Luceny Guzmn Acua () Introduccin y Estadstica Descriptiva 22 de enero de 2013 27 / 42
Organizacin y Representacin de Datos
Ejemplo 3 (Rendimiento)
ojiva
Luceny Guzmn Acua () Introduccin y Estadstica Descriptiva 22 de enero de 2013 28 / 42
Organizacin y Representacin de Datos
Ejemplo 4: Tabla o distribucin de frecuencias bivariadas
La siguiente tabla muestra los resultados de una prueba de conocimientos
a un grupo de empleados de tres compaas A; B; C, en el campo que se
desempean. Los resultados se clasicaron como excelente(E), bueno (B),
regular (R), malo(M). Construya una tabla de frecuencias bivariadas.
Empleado 1 2 3 4 5 6 7 8 9 10
Calicacin E B E M R M B B B E
Compaa A B A C A B B C C A
Empleado 11 12 13 14 15 16 17 18 19 20
Calicacin B E R R B B M B B M
Compaa B B C C A B A C A B
Empleado 21 22 23 24 25 26 27 28 29 30
Calicacin E E B M R E R E E B
Compaa B B A A B C A C B B
Luceny Guzmn Acua () Introduccin y Estadstica Descriptiva 22 de enero de 2013 29 / 42
Organizacin y Representacin de Datos
Ejemplo 4
CompaanCalicacin E B R M Total
A 3 3 2 2 10
B 4 5 1 2 12
C 2 3 2 1 8
Total 9 11 5 5 Gran total 30
Calcular el porcentaje de los empleados
1
De la compaa C, que tienen un desempeo excelente.
2
Con mal desempeo, que pertenece a la compaa B.
3
Que tienen un desempeo excelente.
4
Que son de la compaa C y tienen un desempeo bueno.
Luceny Guzmn Acua () Introduccin y Estadstica Descriptiva 22 de enero de 2013 30 / 42
Organizacin y Representacin de Datos
Diagrama de barras bivariadas
Ejemplo 4 (Compaa-Calicacin)
Compaa
F
r
e
c
u
e
n
c
i
a
Di agrama de Barras Bi vari ado
B
E
M
R
0
1
2
3
4
5
A B C
Luceny Guzmn Acua () Introduccin y Estadstica Descriptiva 22 de enero de 2013 31 / 42
Organizacin y Representacin de Datos
Diagrama de barras bivariadas
Ejemplo 4 (Compaa-Calicacin)
Luceny Guzmn Acua () Introduccin y Estadstica Descriptiva 22 de enero de 2013 32 / 42
Organizacin y Representacin de Datos
Ejemplo 5 (Diagrama de tallo y hojas)
Una de las principales formas de medir la calidad del servicio que
proporciona una organizacin es evaluar la rapidez con la que responde a
las quejas de los clientes. Una empresa de telfonos obtuvo 50 quejas el
ltimo mes. Los datos siguientes representan el nmero de das entre el
recibimiento de la queja y su solucin. Construya un diagrama de tallo y
hojas.
5 10 15 20 30 35 45 60 60 90
5 10 15 20 30 35 45 60 75 95
5 10 15 25 30 40 45 60 90 100
5 10 15 25 30 40 50 60 90 120
5 15 15 25 30 40 55 60 90 120
Luceny Guzmn Acua () Introduccin y Estadstica Descriptiva 22 de enero de 2013 33 / 42
Organizacin y Representacin de Datos
Ejemplo 5 (Diagrama de tallo y hojas)
Luceny Guzmn Acua () Introduccin y Estadstica Descriptiva 22 de enero de 2013 34 / 42
Organizacin y Representacin de Datos
Ejemplo 3 (Diagrama de tallo y hojas)
Luceny Guzmn Acua () Introduccin y Estadstica Descriptiva 22 de enero de 2013 35 / 42
Organizacin y Representacin de Datos
Ejemplo 3 (Diagrama de tallo y hojas)
Luceny Guzmn Acua () Introduccin y Estadstica Descriptiva 22 de enero de 2013 36 / 42
Organizacin y Representacin de Datos
Diagrama de pareto
Una forma especial de grco de barras verticales de datos obtenidos sobre
un problema, que separa las causas ms importantes de las menos
importantes, estableciendo un orden de prioridades, se le conoce como la
regla 80=20:
Fue creado por el economista italiano Vilfredo Pareto, l observ que en
italia el 20 % de los ciudadanos posean el 80 % de las propiedades. El
grco est sustentado sobre el principio segn el cual un pequeo
porcentaje de las causas ( 20 %) originan un alto porcentanje de las
veces que se presenta el problema ( 80 %). El objetivo es de identicar
ese pequeo porcentaje de causas vitales para actuar prioritariamente
sobre l.
Luceny Guzmn Acua () Introduccin y Estadstica Descriptiva 22 de enero de 2013 37 / 42
Organizacin y Representacin de Datos
Diagrama de pareto
Los pasos para realizar un diagrama de Pareto son:
1
Determinar el problema a estudiar.
2
Investigar los factores o causas que provocan ese problema.
3
Anotar la magnitud (unidades monetarias, nmero de defectos,
volumen, etc.) de cada causa.
4
Si existen causas que tienen una magnitud muy pequea comparada
con la de las otras causas se agrupan dentro de una categora llamada
Otros.
Luceny Guzmn Acua () Introduccin y Estadstica Descriptiva 22 de enero de 2013 38 / 42
Organizacin y Representacin de Datos
Ejemplo 6 (Pareto)
Un fabricante de computadores personales encontr un aumento de
disconformidad en los productos terminados . Se reunieron los datos y se
clasicaron en reas pertinentes, segn muestra la tabla, Tapas mal
atornilladas (T), Regulador de excitacin daado (R), Tornillos faltantes
(TF), Marco con raspaduras (M), Altavoz daado (A),
Unidad de disco duro daada (UD), Unidad de disco daada (U), Cubierta
daada (C). Realizar el diagrama de pareto.
Causa Frecuencia Causa Frecuencia
M 5 R 26
C 1 UD 3
T 30 U 2
TF 5 A 2
Luceny Guzmn Acua () Introduccin y Estadstica Descriptiva 22 de enero de 2013 39 / 42
Organizacin y Representacin de Datos
Ejemplo 6(Pareto)
Problema: Disconformidad con el producto. Se observa que el 25 % de las
causas (2 de 8 ) origina el 75;68 % de las devoluciones.
Causa f f
acum
% acum
T 30 30 40;54
R 26 56 75;68
TF 5 61 82;43
M 5 66 89;19
UD 3 69 93;24
A 2 71 95;95
U 2 73 98;65
C 1 74 100
Total 74
Luceny Guzmn Acua () Introduccin y Estadstica Descriptiva 22 de enero de 2013 40 / 42
Organizacin y Representacin de Datos
Ejemplo 6 (Pareto)
Luceny Guzmn Acua () Introduccin y Estadstica Descriptiva 22 de enero de 2013 41 / 42
Organizacin y Representacin de Datos
Diagrama de pareto
Utilizar para tareas, proyectos, metas.
1
Meta: Aumentar rentabilidad
80 % de los ingresos provienen del 20 % de los clientes.
2
Meta: Aumentar poblacin de estudiantes
80 % de los estudiantes provienen del 20 % de los colegios de la
ciudad.
3
Proyecto: Optimizar la productividad de una empresa.
80 % del xito en la productividad es debida al 20 % de las tareas.
Luceny Guzmn Acua () Introduccin y Estadstica Descriptiva 22 de enero de 2013 42 / 42

Das könnte Ihnen auch gefallen