Beruflich Dokumente
Kultur Dokumente
ESTADÍSTICA 2
1
4/05/2017
Actitudinal (EA)
Tolerancia 5 min
2
4/05/2017
CONSULTAS
Objetivo de la sesión:
-Reconocer la importancia de la estadística en el proceso de investigación.
Etimología Definición
3
4/05/2017
Características Generales
Toma de Decisiones
• La estadística constituye una ciencia y tecnología tal igual como
Datos: Observaciones específicas a través de otras especialidades.
mediciones o conteos. • Nos ayuda a comprender fenómenos e investigaciones, en
Información: Datos procesados y resumidos para administración, medicina, ingeniería, sociología, educación, etc.
producir hechos y generar ideas. • Nos ayuda a desarrollar una investigación rigurosa, por eso se dice
que la estadística participa en la solución de problemas.
Conocimiento: Información seleccionada y • La estadística constituye una ciencia auxiliar y
organizada que proporciona entendimiento, complementaria que nos ofrece técnicas, métodos y modelos
recomendaciones y el sustento para las decisiones. para aplicarlos en el análisis cuantitativo y cualitativos de los
fenómenos o hechos.
Lic. Adm. Martin Romeo Yurivilca Oscanoa
• La estadística se divide en dos ramas que no son independientes; • Se encarga de la recolección, clasificación y descripción de
por el contrario, son complementarias y entre ambas dan la datos muestrales o poblacionales, para su interpretación y análisis.
suficiente ilustración sobre una posible realidad futura, con el fin
de que quien tenga poder de decisión, tome las medidas • Su finalidad es obtener información, analizarla, elaborarla
necesarias para transformar ese futuro o para mantener las y simplificarla y presentándolos en forma clara; eliminando la
condiciones existentes. confusión característica de los datos preliminares lo necesario
para que pueda ser interpretada cómoda y rápidamente y, por
• En atención a su metodología, por sus procedimientos y alcances bien tanto, pueda utilizarse eficazmente para el fin que se desee.
definidos, la ciencia estadística se clasifica en descriptiva e
inferencial. • Recopilar, resumir y presentar los datos
Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa
• Permite la elaboración de cuadros, gráficos e indicadores • La estadística inferencial sobre la base de la muestra estudiada
bien calculados; suficientemente claros, como para disipar las saca conclusiones, o sea, hace inferencia o inducción, en cuanto al
dudas y la oscuridad de los datos masivos. universo o población, de donde se obtuvo dicha muestra basándose
• El análisis se limita en sí mismo a los datos coleccionados y en los datos simplificados y analizados; detectando las interrelaciones
no se realiza generalizaciones acerca de la totalidad de donde que pueden unirlos, las leyes que los rigen y eliminando las
provienen esas observaciones (población). influencias del azar; llegando más allá de las verificaciones físicas
posibles.
• La Estadística Descriptiva no es más que el trabajo preliminar para el
Estadística Inferencial. • Sacar conclusiones acerca de una población basándose únicamente
en los datos de la muestra.
Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa
4
4/05/2017
• Recopilar datos
• ¿Cómo se selecciona la muestra?, ¿cómo se realiza la inferencia?, y
¿qué grado de confianza se puede tener en ella? son aspectos • Ejem. Encuesta
fundamentales de la estadística inferencial, para cuyo estudio se
requiere un alto nivel de conocimientos de estadística, probabilidad • Presentar datos
y matemáticas. • Ejem. Tablas y graficos
• Comprende la la teoría de estimación y prueba de hipótesis.
• Resumir datos
• Ejem. Media muestra = X i
n
Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa
Objetivos
Estadística Inferencial o Inductiva
Estimación: • DESCRIPCIÓN de grandes colecciones de datos empíricos.
-Ej. Estimar el peso promedio de la • ANÁLISIS estadístico de datos experimentales y de los fenómenos
población usando el peso promedio de
la muestra. observados.
Prueba de Hipótesis : • PREDICCIÓN o comportamiento de los fenómenos en el futuro.
- Ej. Probar que el peso promedio de la
población es 65 kg.
5
4/05/2017
Recolección Datos
Estadística inferencial
Estimación/P. Hipótesis
Conclusiones /
Recomendaciones
Términos básicos:
Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa
6
4/05/2017
Estadígrafo o Estadístico
Parámetro y Estimador
• Es un número que describe alguna característica de la muestra o Parámetro:
Valor representativo de una población (N).
medida de resumen de una muestra y la toma de decisión contiene Se simboliza con letras griegas.
un grado de incertidumbre. Sólo hay un parámetro en cada población.
• Estimador.
Población (N)
Parámetro y Estimador
• Es la totalidad de todas las posibles mediciones y observaciones bajo
consideración en una situación dada de un problema, cada situación
diferente implica una población diferente.
• La población debe estar perfectamente definida en el tiempo y en el
espacio, de modo que ante la presencia de un potencial integrante de
la misma, se pueda decidir si forma parte o no de la población bajo
estudio.
• Por lo tanto, al definir una población, se debe cuidar que el conjunto de
elementos que la integran quede perfectamente delimitado.
• Es un conjunto de datos individuales, personas o cosas acerca de los cuales
se desea información. Es el conjunto de todas las mediciones de interés al
muestrista.
Lic. Adm. Martin Romeo Yurivilca Oscanoa
7
4/05/2017
Muestra (n)
Población vs. MUESTRA
• Existen diversos métodos para calcular el tamaño de la muestra y Muestra
Población
también para seleccionar los elementos que la conforman, pero
es importante que sea representativa de la población y sus
elementos escogidos al azar para asegurar la objetividad de la
investigación.
Población Estadística
Registro de una característica EN TODOS los elementos del
marco poblacional.
Tiene tantos datos como elementos el marco poblacional.
Habrán tantas poblaciones como características que se deseen
registrar en un marco poblacional.
8
4/05/2017
Marco Muestral
Subconjunto del marco poblacional.
Comprende los elementos o estratos del marco poblacional (es
representativo).
En contraste con el marco poblacional es más conveniente porque
se obtienen los datos en menor tiempo y reduciendo los costos.
Muestra
Registro de una característica EN TODOS los elementos del
marco muestral.
Tiene tantos datos como elementos el marco muestral.
Habrán tantas muestras como características se deseen registrar
en un marco muestral.
Unidades estadísticas: Son los elementos de la población que puede ser • Unidad de análisis (elementos): Está definida como el elemento que se
examina y del que se busca la información dentro de la unidad de
algo con existencia real, como un automóvil o una casa, o algo más investigación.
abstracto como la temperatura, un voto, o un intervalo de tiempo. • Unidad de observación: Se denomina a la unidad a través de la cual se
Estas pueden ser: obtiene la información, esta puede o no coincidir con la unidad de análisis.
También se denomina unidad respondiente.
• Unidad de investigación(estudio): Es la unidad mínima que mantiene Se refiere a la dimensión por variable.
la integridad de los datos que interesan estudiar y analizar. Es • Unidades de muestreo: Son aquellas que contienen las unidades de
decir, el ente que contiene las partes que se van a analizar. análisis de la población y que se utilizarán para confeccionar o seleccionar
la muestra. Es el elemento o elementos disponibles para su selección en
Puede ser individual o colectiva. alguna etapa del proceso de muestreo.
Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa
9
4/05/2017
Unidad de Unidad de
• Unidad de información: Es la entidad que nos brinda información de experimentación observación
Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa
Términos básicos:
Variables: Cualitativa
Por su
• Son las características o lo que se estudia de cada individuo de la naturaleza
Discreta
Cuantitativa
muestra. Ej: sexo, edad, peso, estatura, color de ojos, estado civil, Continua
temperatura, cantidad de nacimientos, diámetro, etc.
Variable
Dicotómica
Datos: estadística
Nominal
• Es el valor, respuesta o registro que adquiere una característica o Politómica
10
4/05/2017
Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa
Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa
• El nivel de medición nominal se caracteriza por datos que consisten • El nivel de medición de intervalo se parece al nivel ordinal, pero con la
exclusivamente en nombres, etiquetas o categorías. Los datos no se propiedad adicional de que la diferencia entre dos valores de datos
pueden acomodar en un esquema de orden (como del más bajo al cualesquiera tiene un significado. Sin embargo, los datos en este nivel
más alto). no tienen punto de partida cero. natural inherente (donde la cantidad
• Los datos están en el nivel de medición ordinal cuando pueden que está presente corresponde a nada).
acomodarse en algún orden, aunque las diferencias entre los valores • El nivel de medición de razón es similar al nivel de intervalo, pero con
de los datos (obtenidas por medio de una resta) no pueden calcularse la propiedad adicional de que sí tiene un punto de partida cero
o carecen de significado. natural (donde el cero indica que nada de la cantidad está presente).
Para valores en este nivel, tanto las diferencias como las razones
tienen significado.
Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa
11
4/05/2017
Razón
Intervalo Temperatura ( ° C)
Intervalo Origen
Ordinal Grado Académico (Bachiller, Maestría, Doctorado)
Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa
Recolección de Datos
Fuentes Fuentes
Primarias
Secundarias
Objetivo de la sesión:
-Reconocer la técnica de recolección de datos.
-Conocer la fuente que se utiliza.
Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa
Distribuciones de Frecuencia
Objetivo de la sesión:
-Elaborar tablas de frecuencia.
12
4/05/2017
Unidimensional.- Cuando nos permite apreciar o distinguir una Bidimensional.- Cuando nos permite apreciar dos variables.
sola variable. Ejemplo Número de alumnos de un Centro Educativo Ejemplo: Número de alumnos de un Centro Educativo por Grados
por Grados de Estudio. de Estudio y Sexo
Tabla 1
Tabla 2
Grado de Estudio Número de Alumnos
Grado de Estudios Sexo Total
Primer 180
M F
Segundo 150
Primer 100 80 180
Tercer 120
Segundo 75 75 150
Cuarto 95 Tercer 55 65 120
Quinto 80 Cuarto 45 50 95
quinto 32 48 80
TOTAL 625
TOTAL 307 318 625
Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa Tablas de Contingencia
13
4/05/2017
Una de los primeros pasos que se realizan en cualquier estudio estadístico es la tabulación • Frecuencia absoluta: Es el número de veces que aparece en la muestra dicho valor de la variable, la
de resultados, es decir, recoger la información de la muestra resumida en una tabla en la representaremos por ni o fi.
que a cada valor de la variable se le asocian determinados números que representan el • Frecuencia relativa: Es el cociente entre la frecuencia absoluta y el tamaño de la muestra. La
número de veces que ha aparecido, su proporción con respecto a otros valores de la denotaremos por fi o hi.
variable, etc. Estos números se denominan frecuencias: Así tenemos los siguientes tipos de • Porcentaje Simple: Esta medida resulta de multiplicar la frecuencia relativa por 100. La denotaremos
por %pi.
frecuencia:
• Frecuencia Absoluta Acumulada: Para poder calcular este tipo de frecuencias hay que tener en cuenta
• Frecuencia absoluta que la variable estadística ha de ser cuantitativa o cualitativa ordenable. En otro caso no tiene mucho
• Frecuencia relativa sentido el cálculo de esta frecuencia. La frecuencia absoluta acumulada de un valor de la variable, es el
número de veces que ha aparecido en la muestra un valor menor o igual que el de la variable y lo
• Porcentaje Simple representaremos por Ni o Fi.
• Frecuencia absoluta acumulada • Frecuencia Relativa Acumulada: Al igual que en el caso anterior la frecuencia relativa acumulada es la
• Frecuencia relativa acumulada frecuencia absoluta acumulada dividido por el tamaño de la muestra, y la denotaremos por Fi o Hi.
• Porcentaje acumulado • Porcentaje Acumulado: Análogamente se define el Porcentaje Acumulado y lo vamos a denotar por
%Pi como la frecuencia relativa acumulada por 100.
Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa
Ejemplo de una tabla de frecuencia por valores Ejemplo de una tabla de frecuencia por valores
distintos distintos
Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa
Procedimiento:
• Hallar del número de datos
• Hallar el valor mínimo • Sea el número de habitaciones con que cuenta 36 hoteles de la
• Hallar el valor máximo provincia de Huancayo: 11, 12, 13, 14, 15, 13, 12, 13, 11, 14, 11, 10,
• Hallar el Rango 09, 10, 11, 13, 15, 16, 10, 09, 11, 12, 11, 13, 11, 13, 14, 11, 10, 13, 11,
08, 10, 10, 09 y 12.
• Hallar el número de valores
Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa
14
4/05/2017
Ejemplo: Ejemplo:
• Hallar del número de datos : N = 36 VALORES TARJAS FRECUENCIA FREC/ABS. FRECUENCIA FREC/REL. PORCENTAJE PORC.
ABSOLUTA ACUMULADA RELATIVA ACUMULADA SIMPLE ACUM.
• Hallar el valor mínimo : Xmin = 8
ni Ni fi Fi %pi %Pi
• Hallar el valor máximo : Xmax = 16 X1 = 08 / n1 = 1 1 0,03 0,03 3 3
X2 = 09 /// n2 = 3 4 0,08 0,11 8 11
• Hallar el Rango : R=16-8=8 X3 = 10 ////\/ n3 = 6 10 0,17 0,28 17 28
• Hallar el número de valores : Nº Valores = R+1=9 X4 = 11
X5 = 12
////\////
////
n4 = 9
n5 = 4
19
23
0,25
0,11
0,53
0,64
25
11
53
64
X6 = 13 ////\// n6 = 7 30 0,19 0,83 19 83
X7 = 14 /// n7 = 3 33 0,08 0,91 8 91
X8 = 15 // n8 = 2 35 0,06 0,97 6 97
X9 = 16 / n9 = 1 36 0,03 1,00 3 100
N = 36 =1,00 =100
Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa
Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa
Ejemplo: Ejemplo:
44; 13; 47; 27; 55; 41; 58; 35; 58; 48; 37; 45; 55; 32; 45; 48; 54; 78; 66; 58; 66; 57; 30; 72; 57;
81; 79; 45; 82; 36; 45; 51; 24; 79; 26; 33; 60; 53; 41; 58; 35; 66; 58; 48; 37; 45; 55; 64; 68 y
80.
15
4/05/2017
Ejemplo: Ejemplo:
Frecuencia
76.00%
8
6 6 60.00%
6 5
63 72 67.5 6 44 0.12 0.88 12% 88% 50.00%
40.00%
4
28.00%
1 20.00%
73 82 77.5 6 50 0.12 1 12% 100% 2
12.00% 0
0 2.00% 0.00%
22 32 42 52 62 72 82 y mayor...
50 1 100% Clase
Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa
Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa
Recordar: Recordar:
< 20 [ – 20 ) Menos de 20
20 – 25 [ 20 – 25 ) Desde 20 hasta menos de 25
25 – 30 [ 25 – 30 ) Desde 25 hasta menos de 30
30 – 35 [ 30 – 35 ) Desde 30 hasta menos de 35
20 25 30 35
> 35 [ 35 – ] Desde 35 a más
Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa
16
4/05/2017
Ejemplo: Ejemplo:
Li – LS Tarjas Xi ni Ni fi Fi %pi %Pi
• En un estudio realizado respecto al número colocaciones realizadas por un grupo de entidades financieras se
obtuvo el siguiente resultado: 44; 25; 47; 27; 55; 41; 58; 66; 58; 66; 57; 30; 72; 57; 81; 79; 45; 82; 36; 45; 51;
24; 79; 26; 33; 60; 53; 35; 22; 18; 58; 47; 35; 64; 68; 41; 29; 35; 58; 37; 45; 98; 90; 20; 40; 27; 60; 76; 60; 64;
66; 68; 68; 44; 17; 47; 27; 55; 41; 30; 35; 58; 48; 37,9; 45; 55; 64; 68,5; 60; 76; 60; 64; 66; 68; 78; 44; 99; 44;
19 y 80,7. Elabore la tabla de frecuencia correspondiente.
Ejercicio 2 Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa
Ejemplo: Ejemplo:
Histograma
Li Ls Xi ni Ni fi Fi %pi %Pi 16 120.00%
15
17.00 26.22 21.61 8 8 0.10 0.10 10% 10% 14 13
100.00% 100.00%
100.00%
26.22 35.44 30.83 11 19 0.14 0.24 14% 24% 12
95.00% 97.50%
11 11
85.00%
35.44 44.67 40.06 11 30 0.14 0.38 14% 38% 10 80.00%
10
Frecuencia
Ejemplo: Ejemplo:
Li Ls Xi ni Ni fi Fi %pi %Pi
• Sean las siguientes calificaciones en el exámenes en Métodos Cuantitativos en el 13.00 22.56 17.78 5 5 0.06 0.06 6% 6%
22.56 32.11 27.33 7 12 0.09 0.15 9% 15%
sistema centesimal obtenidos por un grupo de estudiantes de la UNCP:
32.11 41.67 36.89 14 26 0.18 0.33 18% 33%
44; 13; 47; 27; 55; 41; 58; 35; 58; 48; 37; 45; 55; 32; 45; 48; 54; 78; 66; 58; 66; 41.67 51.22 46.44 15 41 0.19 0.51 19% 51%
57; 30; 72; 57; 81; 79; 45; 82; 36; 45; 51; 24; 79; 26; 33; 60; 53; 35; 22; 18; 58; 47; 51.22 60.78 56.00 19 60 0.24 0.75 24% 75%
60.78 70.33 65.56 10 70 0.13 0.88 13% 88%
35; 64; 68; 41; 58; 35; 58; 37; 45; 98; 90; 20; 40; 27; 60; 76; 60; 64; 66; 68; 68; 44; 70.33 79.89 75.11 5 75 0.06 0.94 6% 94%
13; 47; 27; 55; 41; 58; 35; 58; 48; 37; 45; 55; 64; 68,5 y 80,7. Elabore la tabla de 79.89 89.44 84.67 3 78 0.04 0.98 4% 98%
89.44 99.00 94.22 2 80 0.03 1.00 3% 100%
frecuencia correspondiente. 80 1 100%
Ejercicio 3 Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa
17
4/05/2017
Gráficas Estadísticas • Si selecciona el tipo de gráfico mas eficaz, los datos quedarán más
claros, más sólidos y más informativos.
• Las gráficas son herramientas excelentes para describir, explorar y
comparar datos.
Objetivo de la sesión:
-Elaborar gráficas estadísticas.
Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa
Datos
Categóricos Sexo de los participantes Una gráfica circular presenta datos cualitativos como si
fueran rebanadas de un pastel, donde el tamaño de
cada rebanada es proporcional al conteo de frecuencia
Tablas Gráficas Femenino
de la categoría.
40.0
Masculino
60.0
Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa
Grado académico de los participantes Una gráfica de barras utiliza barras del mismo ancho 100% Una gráfica de Pareto es una gráfica de barras
1000
40.0 90%
35.0
35.0
30.0
para mostrar las frecuencias de categorías de datos 80%
para datos cualitativos, donde las barras se
800
30.0
cualitativos. El eje vertical representa frecuencias o 70% acomodan en orden descendente de acuerdo
Frecuencia(%)
25.0
20.0
20.0
15.0
600
60%
con las frecuencias. Las escalas verticales de las
15.0 frecuencias relativas; el eje horizontal identifica las 50% Frecuencia
gráficas de Pareto representan tanto frecuencias
40% % Acumulado
10.0 400
5.0 diferentes categorías de los datos cualitativos. 30%
80-20
como frecuencias relativas. La escala horizontal
0.0
Pregrado Bachiller Maestría Doctorado
Es ideal para variables politómicas y ordinales.
200 20%
10%
identifica las diferentes categorías de datos
0 0% cualitativos. La altura de las barras disminuye de
izquierda a derecha.
Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa
18
4/05/2017
Datos
Numéricos
Histograma Un histograma es una gráfica con barras de la
14 13
12 11 misma anchura, dibujadas una junto a la otra (sin
10
Gráficas 8
Frecuencia
8
Tablas 6 5
6 6
espacios entre sí). La escala horizontal representa
4
2 1
0
0
clases de valores de datos cuantitativos, en tanto
Histogramas Polígono de Ojiva 22 32 42 52 62 72 82 y
mayor...
Un polígono de frecuencias utiliza segmentos Una ojiva es una gráfica lineal que
lineales conectados a puntos que se localizan describe frecuencias acumuladas y utiliza
directamente por encima de los valores de las fronteras de clase a lo largo de la escala
marcas de clase. El polígono de frecuencias se
horizontal, y frecuencias acumuladas a lo
construye a partir de una distribución de
largo del eje vertical.
frecuencias.
Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa
Límite superior
Gráfico basado en cuartiles, compuesto por un
Una gráfica de puntos es aquella donde se rectángulo, la "caja", y dos brazos, los "bigotes".
Q1 P75
marca cada valor de un dato como un punto a
Q2 P50 (mediana)
lo largo de una escala de valores. Los puntos Es un gráfico que suministra información sobre los
Q3 P25
que representan valores iguales se apilan. valores mínimo y máximo, los cuartiles Q1, Q2 o
mediana y Q3, y sobre la simetría de la distribución.
Límite inferior
Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa
19
4/05/2017
Series de Tiempo
n
X i
X i1
n
Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa
Descriptivos
• Una medida de tendencia central es un valor que se encuentra en el
Medidas de tendencia central centro o a la mitad de un conjunto de datos.
Medidas de resumen
Medidas de dispersión
Medidas de posición
Medidas de forma
Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa
20
4/05/2017
Tendencia Central
• La media aritmética o media de un conjunto de datos es la medida de
tendencia central que se calcula al sumar los datos y dividir el total
entre el número de datos.
Media aritmética Mediana Moda
σ𝑥 es la media de un conjunto de datos
𝑥ҧ = muestrales
n
𝑛
X i
X i1
σ𝑥
n Valor Valor es la media de un conjunto de datos
intermedio presentado
µ= de una población
𝑁
con mas
Lic. Adm. Martin Romeo Yurivilca Oscanoa frecuencia Lic. Adm. Martin Romeo Yurivilca Oscanoa
σ(𝑥𝑖 . 𝑛𝑖 )
Media = 3 Media = 4 𝑥ҧ =
σ𝑛
1 2 3 4 5 15 1 2 3 4 10 20
3 4
5 5 5 5 Suma de frecuencias
Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa
• La mediana de un conjunto de datos es la medida de tendencia • La mediana no es afectada por valores extremos.
central que implica el valor intermedio, cuando los datos originales se
presentan en orden de magnitud creciente (o decreciente). La
mediana suele denotarse con 𝑥 (y se lee “x con tilde”).
0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10
21
4/05/2017
Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa
Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa
22
4/05/2017
• Cuando se asignan valores con diferentes grados de importancia, • Para calcularla se divide el número de valores n entre la suma de los
podemos calcular la media ponderada. recíprocos de todos los valores, de la siguiente forma:
σ(𝑤. 𝑥) 𝑛
𝑥ҧ = 1
σ𝑤 σ
𝑥
Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa
Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa
Sesgo
Xinf Xsup Xi ni Ni fi Fi %pi %Pi
aproximadamente una imagen especular de su mitad derecha). 73 82 77.5 6 50 0.12 1 12% 100%
83 50 1 100%
𝑁 𝑛𝑗 − 𝑛𝑗−1
σ(𝑥𝑖 . 𝑛𝑖 ) − 𝑁𝑗−1 𝑀𝑜 = 𝐿𝑖 + .𝐶
Me = 𝐿𝑖 + 2 𝑥𝐶 2𝑛𝑗 − 𝑛𝑗−1 − 𝑛𝑗+1
𝑥ҧ = 𝑛𝑗
σ𝑛
Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa
23
4/05/2017
Medidas de Variación
53.89 63.11 58.50 15 55 0.19 0.69 19% 69%
63.11 72.33 67.72 13 68 0.16 0.85 16% 85%
72.33 81.56 76.94 8 76 0.10 0.95 10% 95%
81.56 90.78 86.17 2 78 0.03 0.98 3% 98%
90.78 100.00 95.39 2 80 0.03 1.00 3% 100%
80 1 100%
Objetivo de la sesión:
𝑁 𝑛𝑗 − 𝑛𝑗−1
σ(𝑥𝑖 . 𝑛𝑖 ) − 𝑁𝑗−1 𝑀𝑜 = 𝐿𝑖 + .𝐶
𝑥ҧ = Me = 𝐿𝑖 + 2 𝑥𝐶 2𝑛𝑗 − 𝑛𝑗−1 − 𝑛𝑗+1 -Calcular medidas de variación.
σ𝑛 𝑛𝑗
Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa
Descriptivos
• Miden que tanto se dispersan las observaciones alrededor de su
media.
Medidas de tendencia central
Medidas de resumen
Medidas de dispersión
Medidas de posición
Medidas de forma
Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa
Example:
σ(𝑥−𝑥)ҧ 2 𝑛 σ(𝑥 2 )−(σ 𝑥)2
𝑠= 𝑠=
𝑛−1 𝑛(𝑛−1)
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Range = 14 - 1 = 13
Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa
24
4/05/2017
σ(𝑥−𝑥)ҧ 2
Comparando desviaciones estándar 𝑠=
𝑛−1
Data A
Mean = 15.5
11 12 13 14 15 16 17 18 19 20 21
S = 3.338
Data B
Mean = 15.5
11 12 13 14 15 16 17 18 19 20 21 S = 0.926
Data C
Mean = 15.5
11 12 13 14 15 16 17 18 19 20 21 S = 4.567
Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa
σ(𝑥 − 𝜇)2
Small standard deviation 𝜎=
𝑁
Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa
𝑛 σ(𝑓. 𝑥 2) − σ 𝑓. 𝑥 2
ҧ 2. 𝑛𝑖
σ(𝑥𝑖 − 𝑥) 𝑠= La varianza de un conjunto de valores es una medida de variación igual al cuadrado
𝑠= 𝑛(𝑛 − 1)
𝑛−1 de la desviación estándar
Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa
25
4/05/2017
Regla empírica para datos con distribución Regla empírica para datos con distribución
normal (o 68-95-99.7) normal (o 68-95-99.7)
• Aproximadamente el 68% de todos los valores están dentro de una • Aproximadamente el 95% de todos los valores están dentro de 2
desviación estándar de la media. desviaciones estándar de la media.
68%
95%
μ
μ 2σ
μ 1σ
Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa
normal (o 68-95-99.7) µ ± 2σ :
µ ± 3σ :
95,45%
99,73%
ó
ó
95,5%
99,7%
F(x)
Y
• Aproximadamente el 99.7% de todos los valores están dentro de 3 CURVA NORMAL
Área Área
99.7%
0,5 ó 50% 0,5 ó 50%
μ 3σ -3 -2 -1 0
Media 1 2 3 X
Mediana
Moda
Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa
26
4/05/2017
-Al menos 3/4 ( o el 75%) de todos los valores están dentro de 2 desviaciones estándar de
la media.
-Al menos 8/9 ( o el 89%) de todos los valores están dentro de 3 desviaciones estándar de
la media.
(1 - 1/12) x 100% = 0% ……..... k=1 (μ ± 1σ)
(1 - 1/22) x 100% = 75% …........ k=2 (μ ± 2σ)
(1 - 1/32) x 100% = 89% ………. k=3 (μ ± 3σ)
Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa
Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa
Descriptivos
Medidas de dispersión
Medidas de posición
Objetivo de la sesión:
Medidas de forma
-Calcular medidas de posición.
Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa
27
4/05/2017
Puntuaciones Z Puntuaciones Z
Muestra Población
𝑥 − 𝑥ҧ 𝑥−𝜇
𝑧= 𝑧=
𝑠 𝜎
Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa
• Los percentiles son medidas de ubicación, que se denotan con P1, P2,
… , P99, las cuales dividen un conjunto de datos en 100 grupos con
aproximadamente 1% de los valores en cada grupo.
𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑣𝑎𝑙𝑜𝑟𝑒𝑠 𝑚𝑒𝑛𝑜𝑟𝑒𝑠 𝑞𝑢𝑒 𝑥
• Son un tipo de cuantiles o fractiles. 𝑝𝑒𝑟𝑐𝑒𝑛𝑡𝑖𝑙 𝑑𝑒𝑙 𝑣𝑎𝑙𝑜𝑟 𝑥 = 𝑥 100
𝑛ú𝑚𝑒𝑟𝑜 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑣𝑎𝑙𝑜𝑟𝑒𝑠
Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa
𝑘
𝑃𝑘 = .𝑛
100
𝑘
𝐿= .𝑛
100
Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa
28
4/05/2017
12 30 45 57 70
25% 25% 25% 25%
Q1 Q2 Q3 Interquartile range
= 57 – 30 = 27
Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa
Cuartiles: Son 3 valores que dividen al conjunto de datos ordenados en cuatro partes
• Deciles (D1, D2 , D3 ,… y D9).- Divide a la distribución en diez partes iguales.
iguales, son un caso particular de percentiles.
N 2N 3N
N j 1 N j 1 N j 1
25% 25% 25% 25% D1 Li 10
nj
.C ; D2 Li 10
nj
.C ; D3 Li 10
nj
.C ; etc.
Q1 Q2 Q3
Deciles: Son 9 valores que dividen al conjunto de datos ordenados en diez partes iguales, • Percentiles (P1, P2 , P3 ,… y P99).- Divide a la distribución en cien partes iguales.
son también un caso particular de los percentiles. N
N j 1
2N
N j 1
3N
100 N j 1
P1 Li 100 .C ; D2 Li 100 .C ; D3 Li .C ; etc.
nj nj nj
Lic. Adm. Martin Romeo Yurivilca Oscanoa Martin Romeo
Lic. Adm.
Yurivilca Oscanoa
29
4/05/2017
Gráfica de Caja (diagrama de caja y bigotes) Gráfica de Caja (diagrama de caja y bigotes)
Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa
Medidas de Forma
Q1 Q2 Q3 Q1 Q2 Q3 Q1 Q2 Q3
Objetivo de la sesión:
-Calcular medidas de forma.
Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa
Medidas de dispersión
Medidas de posición
30
4/05/2017
Asimetria Asimetria
Interpretación:
Si As = 0, La distribución es simétrica, esto es:
𝑋ത = 𝑀𝑒 = 𝑀𝑜
3(𝑋ത − 𝑀𝑒)
𝐴𝑠 = Si As > 0, La distribución es asimétrica positiva,
𝑠 esto es:
𝑀𝑜 < 𝑀𝑒 < 𝑋ത
Si As < 0, La distribución es asimétrica
negativa, esto es:
𝑋ത < 𝑀𝑒 < 𝑀𝑜
Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa
P75 P25
K
2 P90 P10 Al igual que el caso de los coeficientes de asimetría de una distribución, los que representan a curtosis
o apuntamiento se utilizan para ayudar a describir las características de una distribución y no
precisamente como medidas, ya que a veces el valor de la curtosis se contradice con la realidad por
estar relacionado con la distribución normal (distribución teórica). Este coeficiente solo se calcula para
distribuciones simétricas o ligeramente asimétricas.
Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa
Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa
31
4/05/2017
Ya sea que realicemos un análisis estadístico con datos que hemos • La distribución
reunido, o que examinemos uno realizado por alguien más, no
debemos aceptar a ciegas los cálculos matemáticos; es necesario tomar • Los valores atípicos
en cuenta los siguientes factores: • Los patrones de cambio con el paso del tiempo
• El contexto de los datos • Las conclusiones
• La fuente de los datos • Las implicaciones prácticas
• El método de muestreo
• Las medidas de tendencia central
• Las medidas de variación La significancia estadística de un estudio difiere de su
significancia práctica.
Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa
32