Sie sind auf Seite 1von 32

4/05/2017

ESTADÍSTICA 2

Lic. Adm. Martin Romeo


Yurivilca Oscanoa

LIC. ADM. MARTIN ROMEO YURIVILCA OSCANOA

Lic. Adm. Martin Romeo Yurivilca Oscanoa

Martín Romeo Yurivilca Oscanoa

• Licenciado Colegiado en Administración.


• Especialista en Estadística.
• Especialista en Investigación.
• Docente Universitario-Investigador.
Sílabo
-Objetivo de la sesión:
El estudiante conoce la metodología de trabajo y los contenidos del curso
a desarrollar.

Agenda Semestral Competencias a desarrollar

• Probabilidad. Teoremas probabilísticos Competencia General


 Toma decisiones probabilísticamente de un fenómeno que se presenta en la vida real
• Funciones probabilísticas discretas y continuas. en condiciones de certidumbre e incertidumbre.
• Inferencia estadística. Distribuciones de Competencia por Unidades
 Obtiene e interpreta la probabilidad aplicando la definición de probabilidad,
muestreo. probabilidad condicional, independencia, Bayes, etc.
• Prueba de hipótesis.  Describe hechos relacionados a la Administración mediante una función probabilística
según las condiciones del experimento.
• Tópicos de muestreo  Aplica correctamente la distribución muestral de las estadísticas más usuales a un
hecho real, para que realice estimaciones puntuales e interválicas.
 Prueba si una estadística muestral respecto a una variable cuantitativa es el
correspondiente al de la población bajo cierta confiabilidad.
 Establece el muestreo adecuado en una investigación específica.
 Muestra interés y práctica la perseverancia, pertinencia, responsabilidad y equidad.

1
4/05/2017

Metodología Sistema de evaluación


Conferencia o clase magistral o exposición, Método de
proyectos, Método de casos, Método de preguntas, CRITERIOS PROMEDIO PARCIAL PROMEDIO FINAL
Simulación y juegos, Aprendizaje basado en problemas, Juego Conceptual (EC)
de roles, Análisis de lecturas, Dinámica grupal, Seminarios,
Proyectos de investigación, Panel de discusión, Focus group, Procedimental 0.5EC + 0.3 EP + 0.2EA
P1 + P2 + P3
(Participación y Prácticas P= --------------------------------- PF = -------------------
Lluvia de ideas, Otras. calificadas) (EP)* 3 3

Actitudinal (EA)

REQUISITOS DE BIBLIOGRAFÍA ADICIONAL


APROBACIÓN
REQUISITOS DE APROBACIÓN
Triola, M. F. (2013). Estadística (11va. ed.). México: Pearson
• Presentar, exponer y aprobar un trabajo integrador.
Educacion.
• Asistencia por lo menos al 70% de las clases teóricas y prácticas.
• Aprobar las evaluaciones y obtener promedio final mínimo de ONCE (11) en
el sistema vigesimal.
• Rendir las prácticas, así como presentar los trabajos encargados en las fechas
y horas establecidas.
FECHAS DE ENTREGA Y EXAMEN PARCIAL
• Primer consolidado: 08/05/17 – 12/05/17
• Segundo consolidado: 19/06/17 – 23/06/17
• Tercer consolidado: 24/07/17 – 31/07/17

REGLAS DE URBANIDAD Software a utilizar

Tolerancia 5 min

2
4/05/2017

CONSULTAS

yurivilca2@hotmail.com Introducción a la Estadística


Cel. # 985001051

Objetivo de la sesión:
-Reconocer la importancia de la estadística en el proceso de investigación.

Lic. Adm. Martin Romeo Yurivilca Oscanoa

Etimología Definición

• La Estadística es una ciencia que tiene por objeto la recopilación


• El origen etimológico de la palabra “estadística” no está bien de datos, su organización, el análisis e interpretación de dichos
determinado, supuesto que existen distintas opiniones y datos referente a un fenómeno no estudiado.
referencias. • La estadística ha alcanzado niveles bastante superiores
• Para algunos viene de la voz griega STATERA que significa “balanza”, gracias al cálculo de probabilidades, análisis matemático y en la toma
otros sostienen que deriva del latín STATUS que significa “situación” de decisiones.
mientras que algunos autores afirman que procede del alemán • Se aplica en pruebas de hipótesis, diseño de experimentos, control de
STAAT que significa “estado” pues era función principal de los producción y control de calidad por métodos estadísticos.
gobiernos de los estados establecer registros de población,
nacimientos, defunciones, etc.
Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa

Estadística - Definición Estadística - Definición


Diferentes significados según la persona que la analice.
Ideas comunes :
Observación y Estudio de determinadas características de los DATOS
recolectados.
Definición formal :
Teoremas, métodos, técnicas y herramientas que nos permiten:
1) Recolectar, seleccionar y clasificar datos.
2) Analizar e interpretar los datos.
3) Deducir y evaluar conclusiones en base a datos muestrales.
¿Porqué este Análisis ?
TOMA DE DECISIONES

3
4/05/2017

Características Generales
Toma de Decisiones
• La estadística constituye una ciencia y tecnología tal igual como
Datos: Observaciones específicas a través de otras especialidades.
mediciones o conteos. • Nos ayuda a comprender fenómenos e investigaciones, en
Información: Datos procesados y resumidos para administración, medicina, ingeniería, sociología, educación, etc.
producir hechos y generar ideas. • Nos ayuda a desarrollar una investigación rigurosa, por eso se dice
que la estadística participa en la solución de problemas.
Conocimiento: Información seleccionada y • La estadística constituye una ciencia auxiliar y
organizada que proporciona entendimiento, complementaria que nos ofrece técnicas, métodos y modelos
recomendaciones y el sustento para las decisiones. para aplicarlos en el análisis cuantitativo y cualitativos de los
fenómenos o hechos.
Lic. Adm. Martin Romeo Yurivilca Oscanoa

Ramas de la Estadística Estadística descriptiva o deductiva

• La estadística se divide en dos ramas que no son independientes; • Se encarga de la recolección, clasificación y descripción de
por el contrario, son complementarias y entre ambas dan la datos muestrales o poblacionales, para su interpretación y análisis.
suficiente ilustración sobre una posible realidad futura, con el fin
de que quien tenga poder de decisión, tome las medidas • Su finalidad es obtener información, analizarla, elaborarla
necesarias para transformar ese futuro o para mantener las y simplificarla y presentándolos en forma clara; eliminando la
condiciones existentes. confusión característica de los datos preliminares lo necesario
para que pueda ser interpretada cómoda y rápidamente y, por
• En atención a su metodología, por sus procedimientos y alcances bien tanto, pueda utilizarse eficazmente para el fin que se desee.
definidos, la ciencia estadística se clasifica en descriptiva e
inferencial. • Recopilar, resumir y presentar los datos

Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa

Estadística descriptiva o deductiva Estadística Inferencial o Inductiva

• Permite la elaboración de cuadros, gráficos e indicadores • La estadística inferencial sobre la base de la muestra estudiada
bien calculados; suficientemente claros, como para disipar las saca conclusiones, o sea, hace inferencia o inducción, en cuanto al
dudas y la oscuridad de los datos masivos. universo o población, de donde se obtuvo dicha muestra basándose
• El análisis se limita en sí mismo a los datos coleccionados y en los datos simplificados y analizados; detectando las interrelaciones
no se realiza generalizaciones acerca de la totalidad de donde que pueden unirlos, las leyes que los rigen y eliminando las
provienen esas observaciones (población). influencias del azar; llegando más allá de las verificaciones físicas
posibles.
• La Estadística Descriptiva no es más que el trabajo preliminar para el
Estadística Inferencial. • Sacar conclusiones acerca de una población basándose únicamente
en los datos de la muestra.
Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa

4
4/05/2017

Estadística Inferencial o Inductiva Estadística descriptiva o deductiva

• Recopilar datos
• ¿Cómo se selecciona la muestra?, ¿cómo se realiza la inferencia?, y
¿qué grado de confianza se puede tener en ella? son aspectos • Ejem. Encuesta
fundamentales de la estadística inferencial, para cuyo estudio se
requiere un alto nivel de conocimientos de estadística, probabilidad • Presentar datos
y matemáticas. • Ejem. Tablas y graficos
• Comprende la la teoría de estimación y prueba de hipótesis.
• Resumir datos
• Ejem. Media muestra = X i

n
Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa

Estadística Inferencial o Inductiva


Estadística descriptiva o deductiva

Sacar conclusiones sobre una población


sobre la base de resultados de la
muestra.

Lic. Adm. Martin Romeo Yurivilca Oscanoa

Objetivos
Estadística Inferencial o Inductiva
Estimación: • DESCRIPCIÓN de grandes colecciones de datos empíricos.
-Ej. Estimar el peso promedio de la • ANÁLISIS estadístico de datos experimentales y de los fenómenos
población usando el peso promedio de
la muestra. observados.
Prueba de Hipótesis : • PREDICCIÓN o comportamiento de los fenómenos en el futuro.
- Ej. Probar que el peso promedio de la
población es 65 kg.

Extraer conclusiones y/o tomar decisiones concernientes a


una población basándose en los resultados de una
muestra.
Lic. Adm. Martin Romeo Yurivilca Oscanoa

5
4/05/2017

¿Qué podemos hacer con los datos? Definición Problema


Variable / Atributo
Definición
Población o Muestra

Recolección Datos

Fases del Plan Censal / Muestral


Organización y
análisis Presentación de Datos

estadístico Medidas Estadísticas


Parámetros/Estimador

Estadística inferencial
Estimación/P. Hipótesis

Conclusiones /
Recomendaciones

Términos básicos:

• Datos son el conjunto de información recolectada (como mediciones,


géneros, respuestas de encuestas).

Términos básicos • Estadística es la ciencia que se encarga de planear estudios y


experimentos, obtener datos y luego organizar, resumir, presentar, analizar
e interpretar la información para extraer conclusiones basadas en los
datos.
• Población es el conjunto completo de todos los elementos (puntuaciones,
personas, mediciones, etcétera) que se someten a estudio. El conjunto es
completo porque incluye a todos los sujetos que se estudiarán.
Objetivo de la sesión:
• Censo es el conjunto de datos de cada uno de los miembros de la
-Conocer las principales conceptos utilizados en la estadística. población.
• Muestra es un subconjunto de miembros seleccionados de una población.
Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa

Términos básicos: Parámetros Estadísticos

• Es un numero que describe alguna característica de la población o


• Parámetro es una medición numérica que describe algunas medida de resumen de una población.
características de una población.
• Se considera como un valor verdadero de la característica estudiada y
• Estadístico es una medición numérica que describe algunas para determinar su valor es necesario utilizar la información
características de una muestra . poblacional completa, y por lo tanto la decisión se toman con
certidumbre total.

Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa

6
4/05/2017

Estadígrafo o Estadístico
Parámetro y Estimador
• Es un número que describe alguna característica de la muestra o Parámetro:
Valor representativo de una población (N).
medida de resumen de una muestra y la toma de decisión contiene Se simboliza con letras griegas.
un grado de incertidumbre. Sólo hay un parámetro en cada población.
• Estimador.

Lic. Adm. Martin Romeo Yurivilca Oscanoa

Parámetro y Estimador Parámetro y Estimador


Estimador
Valor representativo de una muestra (n).
Se simboliza por letras latinas.
Existen tantos estimadores como muestras se
extraigan de una población.

Población (N)
Parámetro y Estimador
• Es la totalidad de todas las posibles mediciones y observaciones bajo
consideración en una situación dada de un problema, cada situación
diferente implica una población diferente.
• La población debe estar perfectamente definida en el tiempo y en el
espacio, de modo que ante la presencia de un potencial integrante de
la misma, se pueda decidir si forma parte o no de la población bajo
estudio.
• Por lo tanto, al definir una población, se debe cuidar que el conjunto de
elementos que la integran quede perfectamente delimitado.
• Es un conjunto de datos individuales, personas o cosas acerca de los cuales
se desea información. Es el conjunto de todas las mediciones de interés al
muestrista.
Lic. Adm. Martin Romeo Yurivilca Oscanoa

7
4/05/2017

Población (N) Muestra (n)

Según su tamaño puede ser:


• Población Finita: Cuando se conoce el número de elementos. • Es un subconjunto de la población a la cual se le efectúa la medición
n
 5% con el fin de estudiar las propiedades de la población de la cual es
N obtenida.
• Población Infinita: Cuando el número de elementos es
• Una muestra debe ser representativa, esto es, guarda las mismas
indeterminado o tan grande que pudiesen considerarse infinitos,
características de la población de donde fue seleccionada y debe
es decir, no pueden alcanzarse por conteo.
ser adecuada en cuanto a la cantidad de elementos que debe
n tener con respecto a la población.
 5%
N

• Comprende: Elementos, unidad de muestreo, lugar y tiempo.


Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa

Muestra (n)
Población vs. MUESTRA
• Existen diversos métodos para calcular el tamaño de la muestra y Muestra
Población
también para seleccionar los elementos que la conforman, pero
es importante que sea representativa de la población y sus
elementos escogidos al azar para asegurar la objetividad de la
investigación.

Los valores calculados, usando los Los valores computados de los


datos de la población son datos de una muestra se les
llamados parámetros. llama estadísticos o
estimadores.

Lic. Adm. Martin Romeo Yurivilca Oscanoa

Población Estadística
Registro de una característica EN TODOS los elementos del
marco poblacional.
Tiene tantos datos como elementos el marco poblacional.
Habrán tantas poblaciones como características que se deseen
registrar en un marco poblacional.

8
4/05/2017

Marco Muestral
Subconjunto del marco poblacional.
Comprende los elementos o estratos del marco poblacional (es
representativo).
En contraste con el marco poblacional es más conveniente porque
se obtienen los datos en menor tiempo y reduciendo los costos.

Muestra
Registro de una característica EN TODOS los elementos del
marco muestral.
Tiene tantos datos como elementos el marco muestral.
Habrán tantas muestras como características se deseen registrar
en un marco muestral.

Unidades Estadísticas Unidades Estadísticas

Unidades estadísticas: Son los elementos de la población que puede ser • Unidad de análisis (elementos): Está definida como el elemento que se
examina y del que se busca la información dentro de la unidad de
algo con existencia real, como un automóvil o una casa, o algo más investigación.
abstracto como la temperatura, un voto, o un intervalo de tiempo. • Unidad de observación: Se denomina a la unidad a través de la cual se
Estas pueden ser: obtiene la información, esta puede o no coincidir con la unidad de análisis.
También se denomina unidad respondiente.
• Unidad de investigación(estudio): Es la unidad mínima que mantiene  Se refiere a la dimensión por variable.
la integridad de los datos que interesan estudiar y analizar. Es • Unidades de muestreo: Son aquellas que contienen las unidades de
decir, el ente que contiene las partes que se van a analizar. análisis de la población y que se utilizarán para confeccionar o seleccionar
la muestra. Es el elemento o elementos disponibles para su selección en
 Puede ser individual o colectiva. alguna etapa del proceso de muestreo.

Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa

9
4/05/2017

Unidades Estadísticas Unidad de


información

Unidad de Unidad de
• Unidad de información: Es la entidad que nos brinda información de experimentación observación

la unidad de estudio, ya sea de manera directa o indirecta. Unidad de


estudio

Puede haber más de una unidad de información


(investigación)

• Unidad de experimentación: Es la unidad que experimenta las


Unidad de
variaciones frente a un estímulo, donde cada medida refleja el efecto muestreo
Unidad de
análisis

de la de la manipulación por parte del investigador.

Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa

Términos básicos:

• Los datos cuantitativos (o numéricos) consisten en números que


representan conteos o mediciones.
• Los datos categóricos (o cualitativos o de atributo) consisten en nombres
Variables y tipos de variables o etiquetas que no son números y que, por lo tanto, no representan
conteos ni mediciones.
• Los datos discretos resultan cuando el número de valores posibles es un
número finito o un número que “puede contarse” (es decir, el número de
valores posibles es 0, 1, 2, etcétera).
Objetivo de la sesión:
• Los datos continuos (numéricos) resultan de un número infinito de
-Identificar la naturaleza de las variables.
posibles valores, que corresponden a alguna escala continua que cubre un
-Reconocer los niveles de medición. rango de valores sin huecos, interrupciones o saltos.
Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa

Datos y Variables Clasificación de las variables

Variables: Cualitativa
Por su
• Son las características o lo que se estudia de cada individuo de la naturaleza
Discreta
Cuantitativa
muestra. Ej: sexo, edad, peso, estatura, color de ojos, estado civil, Continua
temperatura, cantidad de nacimientos, diámetro, etc.
Variable
Dicotómica
Datos: estadística
Nominal
• Es el valor, respuesta o registro que adquiere una característica o Politómica

variable asociado a un elemento de la población o muestra, como Por su


Ordinal

resultado de la observación, entrevista o recopilación en general. escala


Intervalo
Puede ser un número, una palabra o un símbolo.
Razón
Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa

10
4/05/2017

Según la Naturaleza de la Variable Según la Naturaleza de la Variable

 Variables Cualitativas  Variables Cuantitativas


 Cuando expresan una cualidad, característica o atributo, sus datos se  Cuando el valor de la variable se expresa por una cantidad, es de
expresan mediante una palabra, no es numérico. carácter numérico.
 Por ejemplo: estado civil, los colores, lugar de nacimiento, profesiones,  El dato o valor puede resultar de la operación de contar o medir
actividad económica, causas de accidentes, etc.
 Por ejemplo: edad, número de hijos por familia, ingresos, viviendas
por centro poblado, niveles de desempleo, producción, utilidades
de empresas, etc.

Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa

Variables Cuantitativas Variables Cuantitativas

Variable Discreta: Variable Continua


• Cuando el valor de la variable resulta de la operación de • Cuando la variable es susceptible de medirse, es toda variable
contar, su valor esta representado solo por números naturales cuyo valor se obtiene por medición o comparación con una unidad
(enteros positivos). o patrón de medida. Las variables continuas pueden tener cualquier
• Ejemplos: hijos por familia, número de accidentes por día, valor dentro de su rango o recorrido, por tanto se expresa por
trabajadores por empresa, población por distritos, habitaciones por cualquier número real.
vivienda, etc.
• Ejemplos: ingresos monetarios, peso, estatura, etc.

Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa

Niveles de medición (por su escala) Niveles de medición (por su escala)

• El nivel de medición nominal se caracteriza por datos que consisten • El nivel de medición de intervalo se parece al nivel ordinal, pero con la
exclusivamente en nombres, etiquetas o categorías. Los datos no se propiedad adicional de que la diferencia entre dos valores de datos
pueden acomodar en un esquema de orden (como del más bajo al cualesquiera tiene un significado. Sin embargo, los datos en este nivel
más alto). no tienen punto de partida cero. natural inherente (donde la cantidad
• Los datos están en el nivel de medición ordinal cuando pueden que está presente corresponde a nada).
acomodarse en algún orden, aunque las diferencias entre los valores • El nivel de medición de razón es similar al nivel de intervalo, pero con
de los datos (obtenidas por medio de una resta) no pueden calcularse la propiedad adicional de que sí tiene un punto de partida cero
o carecen de significado. natural (donde el cero indica que nada de la cantidad está presente).
Para valores en este nivel, tanto las diferencias como las razones
tienen significado.
Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa

11
4/05/2017

Niveles de medición (por su escala) Niveles de medición (por su escala)

Razón Peso (Kilogramos)

Razón
Intervalo Temperatura ( ° C)

Intervalo Origen
Ordinal Grado Académico (Bachiller, Maestría, Doctorado)

Ordinal Distancia Distancia

Nominal Estado Civil (Soltero, Casado, Conviviente)


Orden Orden Orden
Nominal

Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa

Recolección de Datos
Fuentes Fuentes
Primarias
Secundarias

Técnicas de recolección de datos Encuesta Observación Experimentación


Base de
datos

Objetivo de la sesión:
-Reconocer la técnica de recolección de datos.
-Conocer la fuente que se utiliza.

Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa

Métodos y técnicas de recolección de datos

Distribuciones de Frecuencia

Objetivo de la sesión:
-Elaborar tablas de frecuencia.

Lic. Adm. Martin Romeo Yurivilca Oscanoa

12
4/05/2017

Características de los datos Definición

Características de los datos


1. Centro: Valor promedio o representativo que indica la localización de la Una distribución de frecuencias (o tabla de frecuencias) indica cómo un
mitad del conjunto de los datos. conjunto de datos se divide en varias categorías (o clases) al listar todas
2. Variación: Medida de la cantidad en que los valores de los datos varían las categorías junto con el número de valores de los datos que hay en
entre sí. cada una.
3. Distribución: La naturaleza o forma de la distribución de los datos sobre
el rango de valores (como en forma de campana, distribución uniforme o
sesgada).
4. Valores atípicos: Valores muestrales que están muy alejados de la vasta
mayoría de los demás valores de la muestra.
5. Tiempo: Características cambiantes de los datos a través del tiempo.
“Cuidado con los Virus que Destruyen el Valioso Trabajo”. CVDVT
Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa

Tablas de Frecuencias Tablas de Frecuencias

Unidimensional.- Cuando nos permite apreciar o distinguir una Bidimensional.- Cuando nos permite apreciar dos variables.
sola variable. Ejemplo Número de alumnos de un Centro Educativo Ejemplo: Número de alumnos de un Centro Educativo por Grados
por Grados de Estudio. de Estudio y Sexo
Tabla 1
Tabla 2
Grado de Estudio Número de Alumnos
Grado de Estudios Sexo Total
Primer 180
M F
Segundo 150
Primer 100 80 180
Tercer 120
Segundo 75 75 150
Cuarto 95 Tercer 55 65 120
Quinto 80 Cuarto 45 50 95
quinto 32 48 80
TOTAL 625
TOTAL 307 318 625

Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa Tablas de Contingencia

Tablas de frecuencia para distintos tipos de


Tablas de Frecuencias
variable
Multidimensional.- Cuando nos permite apreciar tres o más
variables. Ejemplo Número de alumnos de un Centro Educativo por V.C. Discreta V.C. Discreta V.C. Continua
Valores Puntuales Agrupación en Agrupación en Intervalos
Grados de Estudio, Sexo, aprobados y desaprobados. (Hasta 20 valores) Intervalos
Nº Autos Posibles Posibles Habitaciones: Ingresos por familia en
Tabla 3 dólares
Grado de Estudio Sexo TOTAL 0 [10, 19] [100, 300
Hombres Mujeres
1 [20, 29] [300, 500
A D A D
Primer 80 20 75 5 180 2 [30, 39] [500, 700
Segundo 70 5 65 10 150
Tercer 45 10 60 5 120
3 [40, 49] [700, 900]
Cuarto 45 0 50 0 95
Quinto 30 2 45 3 80
TOTAL 270 37 295 23 625
Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa

13
4/05/2017

Tipos de Frecuencia Tipos de Frecuencia

Una de los primeros pasos que se realizan en cualquier estudio estadístico es la tabulación • Frecuencia absoluta: Es el número de veces que aparece en la muestra dicho valor de la variable, la
de resultados, es decir, recoger la información de la muestra resumida en una tabla en la representaremos por ni o fi.
que a cada valor de la variable se le asocian determinados números que representan el • Frecuencia relativa: Es el cociente entre la frecuencia absoluta y el tamaño de la muestra. La
número de veces que ha aparecido, su proporción con respecto a otros valores de la denotaremos por fi o hi.
variable, etc. Estos números se denominan frecuencias: Así tenemos los siguientes tipos de • Porcentaje Simple: Esta medida resulta de multiplicar la frecuencia relativa por 100. La denotaremos
por %pi.
frecuencia:
• Frecuencia Absoluta Acumulada: Para poder calcular este tipo de frecuencias hay que tener en cuenta
• Frecuencia absoluta que la variable estadística ha de ser cuantitativa o cualitativa ordenable. En otro caso no tiene mucho
• Frecuencia relativa sentido el cálculo de esta frecuencia. La frecuencia absoluta acumulada de un valor de la variable, es el
número de veces que ha aparecido en la muestra un valor menor o igual que el de la variable y lo
• Porcentaje Simple representaremos por Ni o Fi.
• Frecuencia absoluta acumulada • Frecuencia Relativa Acumulada: Al igual que en el caso anterior la frecuencia relativa acumulada es la
• Frecuencia relativa acumulada frecuencia absoluta acumulada dividido por el tamaño de la muestra, y la denotaremos por Fi o Hi.
• Porcentaje acumulado • Porcentaje Acumulado: Análogamente se define el Porcentaje Acumulado y lo vamos a denotar por
%Pi como la frecuencia relativa acumulada por 100.

Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa

Ejemplo de una tabla de frecuencia por valores Ejemplo de una tabla de frecuencia por valores
distintos distintos

Valor o marca Frecuencia Frecuencia Frecuencia Frecuencia Frecuencia Frecuencia


de clase absoluta relativa porcentual absoluta relativa porcentual
acumulada acumulada acumulado

• Variable: Número de hijos


• Variable cuantitativa discreta Xi ni fi pi Ni Fi Pi
1 16 16/50 32% 16 16/50 32%
2 20 20/50 40% 36 36/50 72%
3 9 9/50 18% 45 45/50 90%
4 5 5/50 10% 50 50/50 100%
Total N = 50 Σ=1 Σ=100%

Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa

Tabla de Frecuencia para una variable


cuantitativa discreta (Valores puntuales)
Ejemplo:

Procedimiento:
• Hallar del número de datos
• Hallar el valor mínimo • Sea el número de habitaciones con que cuenta 36 hoteles de la
• Hallar el valor máximo provincia de Huancayo: 11, 12, 13, 14, 15, 13, 12, 13, 11, 14, 11, 10,
• Hallar el Rango 09, 10, 11, 13, 15, 16, 10, 09, 11, 12, 11, 13, 11, 13, 14, 11, 10, 13, 11,
08, 10, 10, 09 y 12.
• Hallar el número de valores

Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa

14
4/05/2017

Ejemplo: Ejemplo:

• Hallar del número de datos : N = 36 VALORES TARJAS FRECUENCIA FREC/ABS. FRECUENCIA FREC/REL. PORCENTAJE PORC.
ABSOLUTA ACUMULADA RELATIVA ACUMULADA SIMPLE ACUM.
• Hallar el valor mínimo : Xmin = 8
ni Ni fi Fi %pi %Pi
• Hallar el valor máximo : Xmax = 16 X1 = 08 / n1 = 1 1 0,03 0,03 3 3
X2 = 09 /// n2 = 3 4 0,08 0,11 8 11
• Hallar el Rango : R=16-8=8 X3 = 10 ////\/ n3 = 6 10 0,17 0,28 17 28
• Hallar el número de valores : Nº Valores = R+1=9 X4 = 11
X5 = 12
////\////
////
n4 = 9
n5 = 4
19
23
0,25
0,11
0,53
0,64
25
11
53
64
X6 = 13 ////\// n6 = 7 30 0,19 0,83 19 83
X7 = 14 /// n7 = 3 33 0,08 0,91 8 91
X8 = 15 // n8 = 2 35 0,06 0,97 6 97
X9 = 16 / n9 = 1 36 0,03 1,00 3 100
N = 36  =1,00  =100

Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa

Tabla de Frecuencia para una variable


Conceptos previos cuantitativa discreta (Agrupación en intervalos)
• Rango: Procedimiento:
R Diferencia entre el dato máximo y mínimo del conjunto de datos. • Hallar el número de datos.
R = Máximo (Xmax) - Mínimo (Xmin) • Hallar el valor mínimo.
• Hallar el valor máximo.
• Clase: • Hallar el Rango: R
K Conjunto de individuos que tienen una característica en común. • Hallar el número de valores: R+1
• Límites de Clase: • Determinar el Número intervalos de Clases: K
Valores máximo y mínimo de una clase; es decir, se refiere al límite superior e inferior de cada clase. • El valor de K debe estar entre 5 y 10 (5K  10).
• Marca de clase o punto medio (Xi) • Siendo "N" el número de observaciones se sugiere que cuando N sea mayor a 25 entonces K = N.
• Método de Sturges.: Se emplea la siguiente fórmula:
Semisuma de los límites de clase. K = 1 + 3,322 logN si N  50
• Amplitud de Clase o Ancho de Clase (C) • Método de Portugal
La anchura de clase es la diferencia entre dos límites inferiores de clase consecutivos o dos fronteras K = 1,8914 + 3,991 logN si 50 < N  100
inferiores de clase consecutivas en una distribución de frecuencias. K = 2,756 + 5,8154 logN si N > 100
• Hallar la amplitud de clase. C=(R+1)/K redondear o C=R/K redondear

Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa

Ejemplo: Ejemplo:
44; 13; 47; 27; 55; 41; 58; 35; 58; 48; 37; 45; 55; 32; 45; 48; 54; 78; 66; 58; 66; 57; 30; 72; 57;
81; 79; 45; 82; 36; 45; 51; 24; 79; 26; 33; 60; 53; 41; 58; 35; 66; 58; 48; 37; 45; 55; 64; 68 y
80.

XiNF – XSUP Tarjas Xi ni Ni fi Fi %pi %Pi


• Sean las siguientes datos correspondiente al número de trabajadores que tiene un grupo de
empresas del departamento de Junín: 44; 13; 47; 27; 55; 41; 58; 35; 58; 48; 37; 45; 55; 32; 45; 48;
54; 78; 66; 58; 66; 57; 30; 72; 57; 81; 79; 45; 82; 36; 45; 51; 24; 79; 26; 33; 60; 53; 41; 58; 35; 66;
58; 48; 37; 45; 55; 64; 68 y 80. Elabore la tabla de frecuencia correspondiente.

Ejercicio 1 Lic. Adm. Martin Romeo Yurivilca Oscanoa N=50

15
4/05/2017

Ejemplo: Ejemplo:

Xinf Xsup Xi ni Ni fi Fi %pi %Pi

13 22 17.5 1 1 0.02 0.02 2% 2%


23 32 27.5 5 6 0.1 0.12 10% 12%
33 42 37.5 8 14 0.16 0.28 16% 28% Histograma
14 13 120.00%
43 52 47.5 11 25 0.22 0.5 22% 50% 12 11 100.00%
100.00% 100.00%
10 88.00%
53 62 57.5 13 38 0.26 0.76 26% 76% 8 80.00%

Frecuencia
76.00%
8
6 6 60.00%
6 5
63 72 67.5 6 44 0.12 0.88 12% 88% 50.00%
40.00%
4
28.00%
1 20.00%
73 82 77.5 6 50 0.12 1 12% 100% 2
12.00% 0
0 2.00% 0.00%
22 32 42 52 62 72 82 y mayor...
50 1 100% Clase

Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa

Tabla de Frecuencia para una variable


cuantitativa continua (Agrupación en intervalos)
Recordar:

Procedimiento: Clases de intervalos


• Hallar el número de datos.
• Hallar el valor mínimo.
• Hallar el valor máximo. Acotados No acotados
• Hallar el Rango: R
• Hallar el número de valores: R+1
• Determinar el Número intervalos de Clases: K
• El valor de K debe estar entre 5 y 10 (5K  10).
• Siendo "N" el número de observaciones se sugiere que cuando N sea mayor a 25 entonces K = N.
• Método de Sturges.: Se emplea la siguiente fórmula:
K = 1 + 3,322 logN si N  50
• Método de Portugal
K = 1,8914 + 3,991 logN si 50 < N  100
K = 2,756 + 5,8154 logN si N > 100
• Hallar la amplitud de clase. C=(R+1)/K redondear o C=R/K redondear

Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa

Recordar: Recordar:

Intervalos de clase Intervalos de clase

Expresión numérica Nomenclatura Interpretación

< 20 [   – 20 ) Menos de 20
20 – 25 [ 20 – 25 ) Desde 20 hasta menos de 25
25 – 30 [ 25 – 30 ) Desde 25 hasta menos de 30
30 – 35 [ 30 – 35 ) Desde 30 hasta menos de 35
20 25 30 35
> 35 [ 35 –  ] Desde 35 a más

Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa

16
4/05/2017

Ejemplo: Ejemplo:
Li – LS Tarjas Xi ni Ni fi Fi %pi %Pi

• En un estudio realizado respecto al número colocaciones realizadas por un grupo de entidades financieras se
obtuvo el siguiente resultado: 44; 25; 47; 27; 55; 41; 58; 66; 58; 66; 57; 30; 72; 57; 81; 79; 45; 82; 36; 45; 51;
24; 79; 26; 33; 60; 53; 35; 22; 18; 58; 47; 35; 64; 68; 41; 29; 35; 58; 37; 45; 98; 90; 20; 40; 27; 60; 76; 60; 64;
66; 68; 68; 44; 17; 47; 27; 55; 41; 30; 35; 58; 48; 37,9; 45; 55; 64; 68,5; 60; 76; 60; 64; 66; 68; 78; 44; 99; 44;
19 y 80,7. Elabore la tabla de frecuencia correspondiente.

Ejercicio 2 Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa

Ejemplo: Ejemplo:

Histograma
Li Ls Xi ni Ni fi Fi %pi %Pi 16 120.00%
15
17.00 26.22 21.61 8 8 0.10 0.10 10% 10% 14 13
100.00% 100.00%
100.00%
26.22 35.44 30.83 11 19 0.14 0.24 14% 24% 12
95.00% 97.50%
11 11
85.00%
35.44 44.67 40.06 11 30 0.14 0.38 14% 38% 10 80.00%
10
Frecuencia

44.67 53.89 49.28 10 40 0.13 0.50 13% 50% 8 68.75% 8


8 60.00%
53.89 63.11 58.50 15 55 0.19 0.69 19% 69% 50.00%
6
63.11 72.33 67.72 13 68 0.16 0.85 16% 85% 37.50%
40.00%
4
72.33 81.56 76.94 8 76 0.10 0.95 10% 95% 23.75% 2 2 20.00%
2
81.56 90.78 86.17 2 78 0.03 0.98 3% 98% 10.00%
0
0 0.00%
90.78 100.00 95.39 2 80 0.03 1.00 3% 100% 26.22 35.44 44.67 53.89 63.11 72.33 81.56 90.78 100.00 y mayor...
Clase
80 1 100%
Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa

Ejemplo: Ejemplo:

Li Ls Xi ni Ni fi Fi %pi %Pi
• Sean las siguientes calificaciones en el exámenes en Métodos Cuantitativos en el 13.00 22.56 17.78 5 5 0.06 0.06 6% 6%
22.56 32.11 27.33 7 12 0.09 0.15 9% 15%
sistema centesimal obtenidos por un grupo de estudiantes de la UNCP:
32.11 41.67 36.89 14 26 0.18 0.33 18% 33%
44; 13; 47; 27; 55; 41; 58; 35; 58; 48; 37; 45; 55; 32; 45; 48; 54; 78; 66; 58; 66; 41.67 51.22 46.44 15 41 0.19 0.51 19% 51%
57; 30; 72; 57; 81; 79; 45; 82; 36; 45; 51; 24; 79; 26; 33; 60; 53; 35; 22; 18; 58; 47; 51.22 60.78 56.00 19 60 0.24 0.75 24% 75%
60.78 70.33 65.56 10 70 0.13 0.88 13% 88%
35; 64; 68; 41; 58; 35; 58; 37; 45; 98; 90; 20; 40; 27; 60; 76; 60; 64; 66; 68; 68; 44; 70.33 79.89 75.11 5 75 0.06 0.94 6% 94%
13; 47; 27; 55; 41; 58; 35; 58; 48; 37; 45; 55; 64; 68,5 y 80,7. Elabore la tabla de 79.89 89.44 84.67 3 78 0.04 0.98 4% 98%
89.44 99.00 94.22 2 80 0.03 1.00 3% 100%
frecuencia correspondiente. 80 1 100%

Ejercicio 3 Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa

17
4/05/2017

Gráficas Estadísticas • Si selecciona el tipo de gráfico mas eficaz, los datos quedarán más
claros, más sólidos y más informativos.
• Las gráficas son herramientas excelentes para describir, explorar y
comparar datos.
Objetivo de la sesión:
-Elaborar gráficas estadísticas.

Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa

Datos Categóricos/Cualitativos (Nominal-


Ordinal)
Gráficas Circulares

Datos
Categóricos Sexo de los participantes Una gráfica circular presenta datos cualitativos como si
fueran rebanadas de un pastel, donde el tamaño de
cada rebanada es proporcional al conteo de frecuencia
Tablas Gráficas Femenino
de la categoría.
40.0
Masculino
60.0

Tablas de Gráficas Gráficas Gráficas Es ideal para variables dicotómicas o politómicas de


Frecuencia de Barras de Pareto Circulares cuatro o menos categorías.

Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa

Gráficas de Barras Gráficas de Pareto

Grado académico de los participantes Una gráfica de barras utiliza barras del mismo ancho 100% Una gráfica de Pareto es una gráfica de barras
1000
40.0 90%
35.0
35.0
30.0
para mostrar las frecuencias de categorías de datos 80%
para datos cualitativos, donde las barras se
800
30.0
cualitativos. El eje vertical representa frecuencias o 70% acomodan en orden descendente de acuerdo
Frecuencia(%)

25.0
20.0
20.0
15.0
600
60%
con las frecuencias. Las escalas verticales de las
15.0 frecuencias relativas; el eje horizontal identifica las 50% Frecuencia
gráficas de Pareto representan tanto frecuencias
40% % Acumulado
10.0 400
5.0 diferentes categorías de los datos cualitativos. 30%
80-20
como frecuencias relativas. La escala horizontal
0.0
Pregrado Bachiller Maestría Doctorado
Es ideal para variables politómicas y ordinales.
200 20%

10%
identifica las diferentes categorías de datos
0 0% cualitativos. La altura de las barras disminuye de
izquierda a derecha.

Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa

18
4/05/2017

Datos Numéricos/Cuantitativos (Intervalo-


Razón)
Histogramas

Datos
Numéricos
Histograma Un histograma es una gráfica con barras de la
14 13
12 11 misma anchura, dibujadas una junto a la otra (sin
10
Gráficas 8

Frecuencia
8
Tablas 6 5
6 6
espacios entre sí). La escala horizontal representa
4
2 1
0
0
clases de valores de datos cuantitativos, en tanto
Histogramas Polígono de Ojiva 22 32 42 52 62 72 82 y
mayor...

frecuencias Clase que la escala vertical representa frecuencias. Las


Tablas de Puntos Diagramas de
Frecuencia dispersión alturas de las barras corresponden a los valores de
Diagrama de
Tallo y hojas
caja y bigotes Series de frecuencia.
Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa
tiempo

Polígono de frecuencias Ojiva

Un polígono de frecuencias utiliza segmentos Una ojiva es una gráfica lineal que
lineales conectados a puntos que se localizan describe frecuencias acumuladas y utiliza
directamente por encima de los valores de las fronteras de clase a lo largo de la escala
marcas de clase. El polígono de frecuencias se
horizontal, y frecuencias acumuladas a lo
construye a partir de una distribución de
largo del eje vertical.
frecuencias.

Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa

Puntos Diagrama de Caja y Bigotes

Límite superior
Gráfico basado en cuartiles, compuesto por un
Una gráfica de puntos es aquella donde se rectángulo, la "caja", y dos brazos, los "bigotes".
Q1 P75
marca cada valor de un dato como un punto a
Q2 P50 (mediana)
lo largo de una escala de valores. Los puntos Es un gráfico que suministra información sobre los
Q3 P25
que representan valores iguales se apilan. valores mínimo y máximo, los cuartiles Q1, Q2 o
mediana y Q3, y sobre la simetría de la distribución.
Límite inferior

Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa

19
4/05/2017

Tallo y Hojas Diagrama de dispersión

1000.0 Un diagrama de dispersión es una gráfica de


900.0
Una gráfica de tallo y hojas representa datos 800.0 datos cuantitativos pareados (x, y), con un eje

INGRESO PER CAPITA


700.0 y = 1139.1x
cuantitativos separando cada valor en dos partes: el 600.0
500.0
R² = 0.677
x horizontal y un eje y vertical. El eje horizontal
tallo (el dígito ubicado en el extremo izquierdo) y la 400.0
300.0
se utiliza para la primera variable (x), y el eje
hoja (el dígito del extremo derecho). 200.0
100.0 vertical para la segunda variable. El patrón de
0.0
0.0000 0.1000 0.2000 0.3000
IDH
0.4000 0.5000 0.6000 0.7000
los puntos graficados suele ser útil para
ING PER CAPITA MENSUAL Lineal (ING PER CAPITA MENSUAL)
determinar si existe una relación entre las dos
variables.
Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa

Series de Tiempo
n

X i
X i1
n

Una gráfica de series de tiempo incluye


Medidas de Tendencia Central
datos de series de tiempo, los cuales se
reúnen en diferentes momentos.
Objetivo de la sesión:
-Calcular medidas de tendencia central.

Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa

Describiendo Datos Numéricos Medidas de tendencia central

Descriptivos
• Una medida de tendencia central es un valor que se encuentra en el
Medidas de tendencia central centro o a la mitad de un conjunto de datos.
Medidas de resumen

Medidas de dispersión

Medidas de posición

Medidas de forma

Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa

20
4/05/2017

Medidas de tendencia central Media Aritmética (Promedio/Media)

Tendencia Central
• La media aritmética o media de un conjunto de datos es la medida de
tendencia central que se calcula al sumar los datos y dividir el total
entre el número de datos.
Media aritmética Mediana Moda
σ𝑥 es la media de un conjunto de datos
𝑥ҧ = muestrales
n
𝑛
X i
X i1
σ𝑥
n Valor Valor es la media de un conjunto de datos
intermedio presentado
µ= de una población
𝑁
con mas
Lic. Adm. Martin Romeo Yurivilca Oscanoa frecuencia Lic. Adm. Martin Romeo Yurivilca Oscanoa

La media a partir de una distribución de


Media Aritmética (Promedio/Media) frecuencias
• La media es afectada por valores extremos
• Media de la distribución de frecuencias:
Primero multiplique cada
frecuencia y marca de clase; luego
sume los productos
0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10

σ(𝑥𝑖 . 𝑛𝑖 )
Media = 3 Media = 4 𝑥ҧ =
σ𝑛
1  2  3  4  5 15 1  2  3  4  10 20
 3  4
5 5 5 5 Suma de frecuencias

Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa

Mediana (Me) Mediana (Me)

• La mediana de un conjunto de datos es la medida de tendencia • La mediana no es afectada por valores extremos.
central que implica el valor intermedio, cuando los datos originales se
presentan en orden de magnitud creciente (o decreciente). La
mediana suele denotarse con 𝑥෤ (y se lee “x con tilde”).
0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10

1. Si el número de valores es impar, la mediana es el número que se Mediana = 3 Mediana = 3


localiza exactamente a la mitad de la lista.
2. Si el número de valores es par, la mediana se obtiene calculando la
media de los dos números que están a la mitad.
Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa

21
4/05/2017

La mediana a partir de una distribución de


frecuencias
Moda (Mo)

• La moda de un conjunto de datos es el valor que se presenta con


𝑁 mayor frecuencia.
− 𝑁𝑗−1
Me = 𝐿𝑖 + 2 𝑥𝐶 • Cuando dos valores se presentan con la misma frecuencia y esta es la
𝑛𝑗 más alta, ambos valores son modas, por lo que el conjunto de datos
es bimodal.
• Cuando más de dos valores se presentan con la misma frecuencia y
Al limite inferior se le puede reducir en 0.5 por ajuste. esta es la más alta, todos los valores son modas, por lo que el
conjunto de datos es multimodal.
• Cuando ningún valor se repite, se dice que no hay moda.
Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa

La moda a partir de una distribución de


Moda frecuencias

• No es afectada por valores extremos.


• La moda es la única que puede usarse con datos de nivel de medición
nominal.
𝑛𝑗 − 𝑛𝑗−1
𝑀𝑜 = 𝐿𝑖 + .𝐶
2𝑛𝑗 − 𝑛𝑗−1 − 𝑛𝑗+1

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 0 1 2 3 4 5 6 Al limite inferior se le puede reducir en 0.5 por ajuste.


No Moda
Moda = 9

Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa

La moda a partir de una distribución de


frecuencias
Mitad del rango

𝑑1 • La mitad del rango es la medida de tendencia central que constituye


𝑀𝑜 = 𝐿𝑖 + 𝐴
𝑑1 + 𝑑2 el valor que se encuentra a la mitad, entre la puntuación más alta y la
más baja, en el conjunto original de datos. Se calcula sumando el
Donde: valor máximo con el valor mínimo y luego dividiendo la suma entre 2,
𝑑1 = 𝑓𝑗 − 𝑓𝑗−1 de acuerdo con la siguiente fórmula:
𝑑2 = 𝑓𝑗 − 𝑓𝑗+1
𝑣𝑎𝑙𝑜𝑟 𝑚á𝑥𝑖𝑚𝑜 − 𝑣𝑎𝑙𝑜𝑟 𝑚í𝑛𝑖𝑚𝑜
Al limite inferior se le puede reducir en 0.5 por ajuste. 𝑚𝑖𝑡𝑎𝑑 𝑑𝑒𝑙 𝑟𝑎𝑛𝑔𝑜 =
2

Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa

22
4/05/2017

Media ponderada Media armónica

• Cuando se asignan valores con diferentes grados de importancia, • Para calcularla se divide el número de valores n entre la suma de los
podemos calcular la media ponderada. recíprocos de todos los valores, de la siguiente forma:

σ(𝑤. 𝑥) 𝑛
𝑥ҧ = 1
σ𝑤 σ
𝑥

Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa

Media geométrica Media cuadrática

• La media geométrica es la n-ésima raíz de su producto.


• La media cuadrática de un conjunto de valores se obtiene elevando al
𝑁 cuadrado cada valor, sumando los resultados, dividiendo el resultado
𝑀𝐺 = 𝑋1. 𝑋2. … 𝑋𝑁 entre el número de valores n y después sacando la raíz cuadrada del
resultado, como se indica a continuación:
σ 𝑥2
𝑚𝑒𝑑𝑖𝑎 𝑐𝑢𝑎𝑑𝑟á𝑡𝑖𝑐𝑎 =
𝑛

Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa

Sesgo
Xinf Xsup Xi ni Ni fi Fi %pi %Pi

13 22 17.5 1 1 0.02 0.02 2% 2%

23 32 27.5 5 6 0.1 0.12 10% 12%

33 42 37.5 8 14 0.16 0.28 16% 28%

43 52 47.5 11 25 0.22 0.5 22% 50%


• Una distribución de datos está sesgada si no es simétrica y se
53 62 57.5 13 38 0.26 0.76 26% 76%
extiende más hacia unlado que hacia el otro. (Una distribución de
datos es simétrica si la mitad izquierda de su histograma es 63 72 67.5 6 44 0.12 0.88 12% 88%

aproximadamente una imagen especular de su mitad derecha). 73 82 77.5 6 50 0.12 1 12% 100%

83 50 1 100%

𝑁 𝑛𝑗 − 𝑛𝑗−1
σ(𝑥𝑖 . 𝑛𝑖 ) − 𝑁𝑗−1 𝑀𝑜 = 𝐿𝑖 + .𝐶
Me = 𝐿𝑖 + 2 𝑥𝐶 2𝑛𝑗 − 𝑛𝑗−1 − 𝑛𝑗+1
𝑥ҧ = 𝑛𝑗
σ𝑛

Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa

23
4/05/2017

Ejemplo: Calcule la media, mediana y


moda
Li Ls Xi ni Ni fi Fi %pi %Pi
17.00 26.22 21.61 8 8 0.10 0.10 10% 10%
26.22 35.44 30.83 11 19 0.14 0.24 14% 24%
35.44 44.67 40.06 11 30 0.14 0.38 14% 38%
44.67 53.89 49.28 10 40 0.13 0.50 13% 50%

Medidas de Variación
53.89 63.11 58.50 15 55 0.19 0.69 19% 69%
63.11 72.33 67.72 13 68 0.16 0.85 16% 85%
72.33 81.56 76.94 8 76 0.10 0.95 10% 95%
81.56 90.78 86.17 2 78 0.03 0.98 3% 98%
90.78 100.00 95.39 2 80 0.03 1.00 3% 100%
80 1 100%
Objetivo de la sesión:
𝑁 𝑛𝑗 − 𝑛𝑗−1
σ(𝑥𝑖 . 𝑛𝑖 ) − 𝑁𝑗−1 𝑀𝑜 = 𝐿𝑖 + .𝐶
𝑥ҧ = Me = 𝐿𝑖 + 2 𝑥𝐶 2𝑛𝑗 − 𝑛𝑗−1 − 𝑛𝑗+1 -Calcular medidas de variación.
σ𝑛 𝑛𝑗

Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa

Describiendo Datos Numéricos Medidas de Variación (Dispersión)

Descriptivos
• Miden que tanto se dispersan las observaciones alrededor de su
media.
Medidas de tendencia central
Medidas de resumen

Medidas de dispersión

Medidas de posición

Medidas de forma

Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa

Rango Desviación Estándar de una Muestra

• El rango de un conjunto de datos es la diferencia entre el valor


máximo y el valor mínimo. • La desviación estándar de un conjunto de valores muestrales,
denotada con s, es la medida de variación de los valores con respecto
a la media.
𝑅𝑎𝑛𝑔𝑜 = 𝑣𝑎𝑙𝑜𝑟 𝑚á𝑥𝑖𝑚𝑜 − (𝑣𝑎𝑙𝑜𝑟 𝑚í𝑛𝑖𝑚𝑜)

Example:
σ(𝑥−𝑥)ҧ 2 𝑛 σ(𝑥 2 )−(σ 𝑥)2
𝑠= 𝑠=
𝑛−1 𝑛(𝑛−1)
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14

Range = 14 - 1 = 13
Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa

24
4/05/2017

σ(𝑥−𝑥)ҧ 2
Comparando desviaciones estándar 𝑠=
𝑛−1

Data A
Mean = 15.5

11 12 13 14 15 16 17 18 19 20 21
S = 3.338

Data B
Mean = 15.5

11 12 13 14 15 16 17 18 19 20 21 S = 0.926
Data C
Mean = 15.5

11 12 13 14 15 16 17 18 19 20 21 S = 4.567

Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa

Comparando desviaciones estándar Desviación Estándar de una Población

σ(𝑥 − 𝜇)2
Small standard deviation 𝜎=
𝑁

Large standard deviation

Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa

Desviación estándar a partir de una distribución


Varianza de una muestra y de una población
de frecuencias

𝑛 σ(𝑓. 𝑥 2) − σ 𝑓. 𝑥 2
ҧ 2. 𝑛𝑖
σ(𝑥𝑖 − 𝑥) 𝑠= La varianza de un conjunto de valores es una medida de variación igual al cuadrado
𝑠= 𝑛(𝑛 − 1)
𝑛−1 de la desviación estándar

Donde: • Varianza muestral: s2 el cuadrado de la desviación estándar s.


x representa la marca de clase. • Varianza poblacional: σ2 el cuadrado de la desviación estándar poblacional σ.
f representa la frecuencia.
n representa la muestra.

Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa

25
4/05/2017

Regla práctica de las desviaciones Propiedades de la desviación estándar

1. La desviación estándar mide la variación entre los valores de los datos.


1. Valor mínimo común=(media)-2 x (desviación estándar) 2. Los valores cercanos tienen una desviación estándar menor, y los valores
con una variación mucho mayor tienen una desviación estándar más
2. Valor máximo común=(media)-2 x (desviación estándar) grande.
3. La desviación estándar tiene las mismas unidades de medición (como
minutos, gramos o dólares) de los datos originales.
4. Para muchos conjuntos de datos, un valor es inusual si difiere de la
media por más de dos desviaciones estándar.
5. Cuando se compara la variación de dos conjuntos de datos diferentes,
solo se comparan las desviaciones estándar si los conjuntos de datos
utilizan la misma escala y las mismas unidades, y si sus medias son
aproximadamente iguales.
Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa

Regla empírica para datos con distribución Regla empírica para datos con distribución
normal (o 68-95-99.7) normal (o 68-95-99.7)

• Aproximadamente el 68% de todos los valores están dentro de una • Aproximadamente el 95% de todos los valores están dentro de 2
desviación estándar de la media. desviaciones estándar de la media.

68%
95%

μ
μ  2σ
μ  1σ
Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa

Regla empírica para datos con distribución µ± σ : 68,27% ó 68,3%

normal (o 68-95-99.7) µ ± 2σ :
µ ± 3σ :
95,45%
99,73%
ó
ó
95,5%
99,7%
F(x)

Y
• Aproximadamente el 99.7% de todos los valores están dentro de 3 CURVA NORMAL

desviaciones estándar de la media.

Área Área
99.7%
0,5 ó 50% 0,5 ó 50%

μ  3σ -3 -2 -1 0
Media 1 2 3 X
Mediana
Moda

Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa

26
4/05/2017

Regla empírica para datos con distribución


normal (o 68-95-99.7) Teorema de Chebyshev
La proporción (o fracción) de cualquier conjunto de datos que está dentro de K
desviaciones estándar a partir de la media siempre es al menos 1-1 / k^2 , donde K es
cualquier número positivo mayor que 1. Para K=2 y K=3 tenemos las siguientes
afirmaciones:

-Al menos 3/4 ( o el 75%) de todos los valores están dentro de 2 desviaciones estándar de
la media.
-Al menos 8/9 ( o el 89%) de todos los valores están dentro de 3 desviaciones estándar de
la media.
(1 - 1/12) x 100% = 0% ……..... k=1 (μ ± 1σ)
(1 - 1/22) x 100% = 75% …........ k=2 (μ ± 2σ)
(1 - 1/32) x 100% = 89% ………. k=3 (μ ± 3σ)
Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa

Comparación de la variación en diferentes


Desviación media absoluta (DMA) poblaciones

El coeficiente de variación (o CV) de un conjunto de datos muestrales o


Es la distancia media de los datos con respecto a la media. poblacionales sin valores negativos, expresado como porcentaje,
describe la desviación estándar en relación con la media. El coeficiente
de variación está dado de la siguiente forma:
σ 𝑥 − 𝑥ҧ
𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑚𝑒𝑑𝑖𝑎 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑎 =
𝑛
Muestra Población
σ 𝑥 − 𝑥ҧ . 𝑛𝑖
Datos agrupados 𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑚𝑒𝑑𝑖𝑎 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑎 = 𝑠 𝜎
𝑛 𝐶𝑉 = 𝐶𝑉 =
𝑥ҧ 𝜇

Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa

Describiendo Datos Numéricos


Minimum 1st Median 3rd Maximum
Quartile Quartile

Descriptivos

Medidas de Posición Medidas de tendencia central


Medidas de resumen

Medidas de dispersión

Medidas de posición

Objetivo de la sesión:
Medidas de forma
-Calcular medidas de posición.

Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa

27
4/05/2017

Puntuaciones Z Puntuaciones Z

• Valores comunes:-2z puntuación≤2


• Una puntuación z (o valor estandarizado) es el número de
desviaciones estándar que un valor x se encuentra por arriba o por • Valores inusuales: z puntuación < -2 o z puntuación > 2
debajo de la media. Se calcula utilizando las siguientes expresiones:

Muestra Población

𝑥 − 𝑥ҧ 𝑥−𝜇
𝑧= 𝑧=
𝑠 𝜎

Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa

Percentil Percentil de un dato

• Los percentiles son medidas de ubicación, que se denotan con P1, P2,
… , P99, las cuales dividen un conjunto de datos en 100 grupos con
aproximadamente 1% de los valores en cada grupo.
𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑣𝑎𝑙𝑜𝑟𝑒𝑠 𝑚𝑒𝑛𝑜𝑟𝑒𝑠 𝑞𝑢𝑒 𝑥
• Son un tipo de cuantiles o fractiles. 𝑝𝑒𝑟𝑐𝑒𝑛𝑡𝑖𝑙 𝑑𝑒𝑙 𝑣𝑎𝑙𝑜𝑟 𝑥 = 𝑥 100
𝑛ú𝑚𝑒𝑟𝑜 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑣𝑎𝑙𝑜𝑟𝑒𝑠

Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa

Transformación de un percentil en un valor Percentil

𝑘
𝑃𝑘 = .𝑛
100

𝑘
𝐿= .𝑛
100

Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa

28
4/05/2017

Cuartil Rango Intercuartil

𝑟𝑎𝑛𝑔𝑜 𝑖𝑛𝑡𝑒𝑟𝑐𝑢𝑎𝑟𝑡𝑖𝑙 𝑅𝐼𝐶 = 𝑄3 − 𝑄1

• Los cuartiles son medidas de ubicación, que se denotan por Q1, Q2 y


Q3, y dividen un conjunto de datos ordenado en cuatro partes Example:
iguales, con aproximadamente el 25% de los valores en cada grupo. X
Median X
minimum Q1 (Q2) Q3 maximum

25% 25% 25% 25%

12 30 45 57 70
25% 25% 25% 25%

Q1 Q2 Q3 Interquartile range
= 57 – 30 = 27
Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa

Los cuantiles a partir de una distribución de


Medidas de posición (Cuantiles) frecuencias
• Cuartiles (Q1, Q2 y Q3).- Divide a la distribución en cuatro partes iguales.
Percentiles: Son 99 valores que dividen en cien partes iguales el conjunto de datos N  N   3N 
  N j 1    N j 1    N j 1 
Q1  Li   4 .C ; Q2  Li   2 .C y Q3  Li   4 .C
 nj   nj   nj 
ordenados.      

Cuartiles: Son 3 valores que dividen al conjunto de datos ordenados en cuatro partes
• Deciles (D1, D2 , D3 ,… y D9).- Divide a la distribución en diez partes iguales.
iguales, son un caso particular de percentiles.
N   2N   3N 
  N j 1    N j 1    N j 1 
25% 25% 25% 25% D1  Li   10
nj
.C ; D2  Li   10
nj
.C ; D3  Li   10
nj
.C ; etc.
     
     

Q1 Q2 Q3
Deciles: Son 9 valores que dividen al conjunto de datos ordenados en diez partes iguales, • Percentiles (P1, P2 , P3 ,… y P99).- Divide a la distribución en cien partes iguales.
son también un caso particular de los percentiles.  N


 N j 1 
 2N


 N j 1 
 3N 
 100  N j 1 
P1  Li   100 .C ; D2  Li   100 .C ; D3  Li   .C ; etc.
 nj   nj   nj 
Lic. Adm. Martin Romeo Yurivilca Oscanoa    Martin Romeo
Lic. Adm.  
Yurivilca Oscanoa 

Ejemplo: Calcule la media, DS, Q1, D7, P27.


Li Ls Xi ni Ni fi Fi %pi %Pi Gráfica de Caja (diagrama de caja y bigotes)
17.00 26.22 21.61 8 8 0.10 0.10 10% 10%
26.22 35.44 30.83 11 19 0.14 0.24 14% 24%
35.44 44.67 40.06 11 30 0.14 0.38 14% 38%
44.67 53.89 49.28 10 40 0.13 0.50 13% 50%
58.50 55 0.19 0.69 19% 69% Límite superior
53.89 63.11 15
63.11 72.33 67.72 13 68 0.16 0.85 16% 85% • Una gráfica de caja (o diagrama de caja y
72.33 81.56 76.94 8 76 0.10 0.95 10% 95% bigotes) es una gráfica de un conjunto de
81.56 90.78 86.17 2 78 0.03 0.98 3% 98% Q3 P75 datos consistente en una línea que se
90.78 100.00 95.39 2 80 0.03 1.00 3% 100% extiende desde el valor mínimo hasta el
80 1 100%
N  N   3N 
Q2 P50 (mediana)
valor máximo, y un caja con líneas trazadas
  N j 1    N j 1    N j 1 
en el primer cuartil, Q1, la mediana y el
σ(𝑥𝑖 . 𝑛𝑖 ) Q1  Li   4 .C ; Q2  Li   2 .C y Q3  Li   4 .C Q1 P25
𝑥ҧ =  nj   nj   nj 
σ𝑛       tercer cuartil, Q3.
 N   2N   3N 
  N j 1    N j 1    N j 1 
ҧ 2. 𝑛𝑖
σ(𝑥𝑖 − 𝑥) P1  Li   100 .C ; D2  Li   100 .C ; D3  Li   100 .C ; etc.
𝑠=  nj   nj   nj 
𝑛−1       Límite inferior
N   2N   3N 
  N j 1   10  N j 1    N j 1 
D1  Li   10 .C ; D2  Li   .C ; D3  Li   10 .C ; etc.
 n j Lic. Adm.
 Martin Romeo Yurivilca
 nOscanoa
j   nj  Lic. Adm. Martin Romeo Yurivilca Oscanoa
     

29
4/05/2017

Gráfica de Caja (diagrama de caja y bigotes) Gráfica de Caja (diagrama de caja y bigotes)

Minimum -- Q1 -- Median -- Q3 -- Maximum

Minimum 1st Median 3rd Maximum


Minimum Quartile
1st Median Quartile
3rd Maximum
Quartile Quartile

Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa

Gráfica de Caja (diagrama de caja y bigotes)

Left-Skewed Symmetric Right-Skewed

Medidas de Forma
Q1 Q2 Q3 Q1 Q2 Q3 Q1 Q2 Q3

Objetivo de la sesión:
-Calcular medidas de forma.

Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa

Describiendo Datos Numéricos Medidas de forma


Son medidas que resultan útiles para cuantificar la semejanza que tiene la distribución de
los datos con respecto a la distribución simétrica y unimodal conocida como “distribución
Descriptivos normal”.

Asimetría: El Coeficiente de Asimetría de Pearson.


Medidas de tendencia central
Medidas de resumen

Medidas de dispersión

Medidas de posición

Medidas de forma Apuntamiento o Curtosis: Se mide con el coeficiente de curtosis.

Lic. Adm. Martin Romeo Yurivilca Oscanoa

30
4/05/2017

Asimetria Asimetria
Interpretación:
 Si As = 0, La distribución es simétrica, esto es:

𝑋ത = 𝑀𝑒 = 𝑀𝑜
3(𝑋ത − 𝑀𝑒)
𝐴𝑠 =  Si As > 0, La distribución es asimétrica positiva,
𝑠 esto es:

𝑀𝑜 < 𝑀𝑒 < 𝑋ത
 Si As < 0, La distribución es asimétrica
negativa, esto es:

𝑋ത < 𝑀𝑒 < 𝑀𝑜
Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa

Coeficiente de curtosis Coeficiente de curtosis

• Coeficiente de curtosis: Compara la dispersión de los datos Interpretación:


observados cercanos al valor central con la dispersión de los datos
cercanos a ambos extremos de la distribución. Se calcula mediante:

P75  P25
K
2  P90  P10  Al igual que el caso de los coeficientes de asimetría de una distribución, los que representan a curtosis
o apuntamiento se utilizan para ayudar a describir las características de una distribución y no
precisamente como medidas, ya que a veces el valor de la curtosis se contradice con la realidad por
estar relacionado con la distribución normal (distribución teórica). Este coeficiente solo se calcula para
distribuciones simétricas o ligeramente asimétricas.

Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa

Medidas de forma Pensamiento Estadístico:

El Pensamiento estadístico es la capacidad para observar el panorama,


para tomar en cuenta factores relevantes como el contexto, la fuente
Media < mediana: negativa o sesgada hacia la izquierda de los datos y el método de muestreo, y también para obtener
Media=mediana: simétrica o sin sesgo conclusiones e identificar implicaciones prácticas. El pensamiento
Media > mediana: positiva o segada hacia la derecha estadístico incluye el pensamiento crítico y la capacidad de interpretar
los resultados. También podría implicar el hecho de determinar si los
resultados son estadísticamente significativos.

Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa

31
4/05/2017

Pensamiento Estadístico: Pensamiento Estadístico:

Ya sea que realicemos un análisis estadístico con datos que hemos • La distribución
reunido, o que examinemos uno realizado por alguien más, no
debemos aceptar a ciegas los cálculos matemáticos; es necesario tomar • Los valores atípicos
en cuenta los siguientes factores: • Los patrones de cambio con el paso del tiempo
• El contexto de los datos • Las conclusiones
• La fuente de los datos • Las implicaciones prácticas
• El método de muestreo
• Las medidas de tendencia central
• Las medidas de variación La significancia estadística de un estudio difiere de su
significancia práctica.
Lic. Adm. Martin Romeo Yurivilca Oscanoa Lic. Adm. Martin Romeo Yurivilca Oscanoa

32

Das könnte Ihnen auch gefallen