Sie sind auf Seite 1von 78

Estadística para la investigación

Modulo: Inferencia Estadística


Ms. Sc. Lic. Jorge Luis Medrano llano
Universidad publica de el alto

1
¿De que se trata el modulo?

Análisis descriptivo e inferencial, mediante una serie de


técnicas e instrumentos para evaluar estadísticamente la
información necesaria para una investigación.

Competencias buscadas
Conoce y usa procedimientos estadísticos para la
realización de pruebas estadísticas paramétricas y no
paramétricas y análisis multivariados.

2
Programa mínimo
1. Estadísticas y Parámetros
2. Análisis exploratorio de datos
3. Principios de inferencia estadística
4. Variables aleatorias: Distribución Normal
5. Estimación puntual e intervalos de confianza
6. Contraste de Hipótesis
7. Comparación de grupos
8. Análisis de Varianza
9. Regresión y Correlación

Organización de la asignatura
Clases teóricas:
Fundamentos teóricos de la estadística y la inferencia estadística
Clases prácticas con SPSS y Excel:
Desarrollo de casos de aplicación

3
Bibliografía
-Gorgas – Cardiel - Zamorano: Estadística Básica para Estudiantes de
Ciencias. UCM, Madrid-España. 2011..

- Córdova, Manuel. Estadística. 5ta. Ed. Moshera. Lima-Perú, 2003.

Bibliografía Complementaria
- Ritchey, Ferris J.: Estadística para las Ciencias Sociales. 2da. Ed. Mc. Graw
Hill. México, 2006.

- Lázaro, C. Moisés: Inferencia Estadística. Moshera.Lima-Perú,2007

4
INTRODUCCIÓN

¿Qué es la estadística?
Estadística es la ciencia de recolectar,
organizar, presentar, analizar e interpretar
datos con el propósito de ayudar a una toma
de decisiones más efectiva.

Es una herramienta para generar


conocimiento.

5
EJEMPLOS DE APLICACIÓN

1) En Administración de Empresas: la estadística se utiliza para evaluar un producto


antes de comercializarlo.

2) En Economía: para medir la evolución de los precios mediante números índice o para
estudiar los hábitos de los consumidores a través de encuestas de presupuestos
familiares.

3) En Ciencias Políticas: para conocer las preferencias de los electores antes de una
votación mediante sondeos y así orientar las estrategias de los candidatos.

4) En Sociología: para estudiar las opiniones de los colectivos sociales sobre temas de
actualidad.

5) En Psicología: para elaborar las escalas de los test y cuantificar aspectos del
comportamiento humano (por ejemplo los test que se aplican a los candidatos para un
cargo en una empresa).

6) En Medicina: uno entre muchos usos de la estadística, es para determinar el estado de


salud de la población.

En general en las Ciencias Sociales, la estadística se emplea para medir las relaciones
entre variables y hacer predicciones sobre ellas.

6
ESTADISTICA DESCRIPTIVA E INFERENCIAL

Estadística Descriptiva: Estadística Inferencial:

Conjunto de técnicas y Conjunto de métodos


métodos que permiten utilizados para saber “algo”
organizar, resumir y
acerca de una población
presentar datos.
basándose en una muestra.

Se usa para transformar Se usa para transformar


datos en información. información en
conocimiento.
Contribuyen a la toma de decisiones

7
INFERENCIA ESTADÍSTICA

Extraer conclusiones y/o


tomar decisiones
concernientes a una
población basándose en
los resultados de una
muestra.

ESTIMACIÓN: PRUEBA DE HIPOTESIS:


En una muestra de 300 Probar que el 40% de hombres
personas se estima que el de 18 a 24 años tiene ese nivel
40% de hombres de 18 a 24 de consumo de cerveza.
consumen cerveza al menos
una vez a la semana.
8
ETAPAS DE UN ESTUDIO ESTADÍSTICO

Aplicando el método científico:

1) Planteamiento del problema: consiste en definir el objetivo de la


investigación y precisar el universo o población.

2) Recogida de la información: consiste en recolectar los datos necesarios


relacionados al problema de investigación.

3) Análisis descriptivo: consiste en resumir los datos disponibles para


extraer la información relevante en el estudio.

4) Inferencia estadística: consiste en suponer un modelo para la población


e interpretación de los datos a la luz del modelo para obtener conclusiones
generales.

5) Diagnóstico: consiste en verificar la validez de los supuestos del modelo


que nos han permitido interpretar los datos y llegar a conclusiones sobre la
población

9
Esquema de las etapas de un estudio estadístico

AREA DE INTERES DATOS

ORGANIZACIÓN
Y RESUMEN
Tema de Investigación ESTADÍSTICA
-Antecedentes Previos DESCRIPTIVA
-Objetivos INTERPRETACIÓN
-Preguntas de Investigación Muestra
-Posibles Hipótesis ¿Población o Muestra?
-Unidad de Análisis INFERENCIA
Población
-Población ESTADISTÍCA
-Variables
CONCLUSIONES
Probabilidad
INFORMACIÓN

10
Del Problema a la Respuesta al Problema

Problema de investigación
Antecedentes
Herramientas estadísticas
Objetivo
Análisis descriptivo
INFORMACION
Pregunta de Inv.
Análisis exploratorio
Hipótesis
Tablas de Continngencia
Población
Regresión y correlación
Unidad de Análisis
Variables
Pruebas paramétricas
Pruebas no paramétricas
Respuesta al
Análisis de varianza problema de
Investigación

11
EJEMPLOS DE ANÁLISIS

1. Determinar la prevalencia de una enfermedad en cierto grupo poblacional.

2. Determinar el perfil de los consumidores de ropa en la ciudad de El Alto.

3. Comparar el gasto de consumo entre los habitantes de la ciudad de El Alto y la


ciudad de La Paz.

4. Determinar la calidad de un producto alimenticio, desde la perspectiva de un


estándar de calidad.

5. Establecer el nivel de efectividad de un tratamiento para una enfermedad.

6. Determinar el efecto de implementar un programa de alimentación en niños.

7. Determinar las causas para la discriminación institucional en personas con


diferente orientación sexual.

8. Determinar el efecto de implementar un programa de educación basado en


competencias en estudiantes del área rural..

12
POBLACIÓN Y MUESTRA

MUESTRA
PARTE “representativa” de la
Población.
Un ESTADÍSTICO describe
a una Muestra.

POBLACIÓN
TODOS los posibles individuos,
objetos, mediciones y conteos

Un PARÁMETRO describe a una


Población.

13
CONCEPTOS IMPORTANTES

¿QUIÉNES VAN A SER MEDIDOS?: Los


sujetos u objetos o UNIDADES DE
ANÁLISIS de una Población o una Muestra

VARIABLE: es lo que se va a medir y representa una característica


de la UNIDAD DE ANÁLISIS.

14
MUESTREO

El total de elementos de la población serán N y los de la muestra n


La muestra se genera a través de
algún tipo de muestreo

PROBABILISTICO NO PROBABILISTICO

 Todas las unidades de la población tienen alguna


probabilidad de ser seleccionadas.
 Para obtener la muestra se requiere tener
identificados los elementos de la población. Muestreo aleatorio simple
 Los elementos de la población se identifican a través Muestreo sistemático
de un listado de elementos, denominado marco Muestreo estratificado
muestral.
Muestreo por conglomerados
 Para obtener una muestra se requiere de datos previos
acerca de la población.
 Una de sus ventajas es que puede medirse el tamaño
del error en las predicciones. 15
MUESTREO

El total de elementos de la población serán N y los de la muestra n


La muestra se genera a través de
algún tipo de muestreo

PROBABILISTICO NO PROBABILISTICO

 Es un muestreo dirigido
 Suponen un procedimiento de selección informal y un
poco arbitrario.
Muestra de sujetos voluntarios  La elección de los elementos no depende de la
Muestra de expertos probabilidad, sino de causas relacionadas con las
Muestra de sujetos-tipo características del investigador.
Muestra por cuotas  Son utilizadas en algunas investigaciones y a partir de
ellas se hacen inferencias hacia la población.
 La muestra dirigida selecciona sujetos típicos, con la
esperanza de que serán casos representativos de una
16
población determinada.
CARACTERISTICAS DE LA POBLACIÓN
Variables Cuantitativas Variables Cualitativas
NUMERICAS ATRIBUTOS
CONTINUA DISCRETA NOMINAL ORDINAL
Medición Conteo

Toma valores enteros Característica o cualidad


 Número de Hijos cuyas categorías no tienen
 Número de empleados de una un orden preestablecido.
empresa  Sexo
 Idioma
Tipos de escala
Intervalo o Razón
 Ocupación

Característica o cualidad cuyas


Toma cualquier valor dentro de un intervalo categorías tienen un orden
 Edad, peso, estatura (escala de Razón) preestablecido.
 Ingreso, gasto, salario (escala de Razón)  Preferencia por una
 Temperatura, coeficiente intelectual (Escala marca
de Intervalo)  Años de escolaridad

17
Cualitativas
Si se expresan de forma
nominal u ordinal
Variable
Cuantitativas
Si se expresan con las
escalas intervalar y de razón
Números • MUTUAMENTE EXCLUYENTE: UN INDIVIDUO, OBJETO
O ARTÍCULO, AL SER INCLUIDO EN UNA CATEGORÍA,
DEBE EXCLUIRSE DE LAS DEMÁS.

Categorías • COMPLETAMENTE INCLUYENTE: CADA INDIVIDUO,


OBJETO O ARTÍCULO DEBE CLASIFICARSE EN AL
MENOS UNA CATEGORÍA.

18
PARAMETROS Y ESTADISTICOS

PARAMETROS ESTADISTICOS (ESTADIGRAFOS)


• Son las medidas de las • Son las medidas de las
características de la población: características de la muestra:

N = Tamaño poblacional n = Tamaño muestral


 = Media poblacional 𝒙 = Media muestral
 = Desv. estándar poblacional s = Desv. estándar muestral
P = Proporción poblacional p = Proporción muestral

Los estadísticos o estadígrafos permiten estimar los


parámetros poblacionales.
PARAMETROS Y ESTADISTICOS

La media muestral es el estimador de La estimación puede ser:


la media poblacional.
𝝁=𝒙
Puntual:
Es cuando se usa un valor
La varianza muestral es el estimador de único para estimar el
la varianza poblacional. parámetro.
𝝈𝟐 = 𝒔𝟐
Por intervalos:
La proporción muestral es el estimador Es cuando se determina un
de la proporción poblacional. rango o intervalo para el valor
𝑷=𝒑 del parámetro.
¿Qué es lo que se quiere hacer?

Lo que se quiere hacer: Inferencia estadística


Probar que el valor del Métodos de estimación
estadístico o estadígrafo
calculado en la muestra
refleja el valor del Métodos de pruebas
parámetro de la
población y de esta (docimasia) de Hipótesis
forma se pueden tomar
decisiones estadísticas. Métodos de predicción.
ESTIMACIÓN

• Se quiere determinar el grado de aceptación de un nuevo producto


dietético en un segmento de mercado de la ciudad de La Paz. Se
encuentra en una muestra de 100 personas que el 40% esta dispuesto a
comprar el producto al menos dos veces por año.
• ¿Se debe lanzar el producto al mercado?

• Se ha encontrado en una muestra de 10 escuelas del área rural, que 3 de


cada 5 estudiantes de secundaria, logran un aprendizaje efectivo de la
matemática con juegos lúdicos.
• ¿Se debe aplicar estas técnicas en las escuelas rurales?

• Se ha visto en una muestra de 100 mujeres de 15 a 24 años, que el


número promedio de hijos es de 4.
• ¿Se debe programar el costo de un bono alimenticio con
este promedio ? 22
PRUEBAS DE HIPOTESIS

La hipótesis estadísticas son suposiciones o afirmaciones


tentativas sobre el valor de los parámetros poblacionales.

• Un grupo de veterinarios esta probando dos tipos de


vacunas para prevenir la propagación de un virus entre el
ganado auquénido. En una prueba realizada en 40 alpacas se
encontró mayor efectividad de la vacuna tipo 1, pero en otra
prueba realizada en 50 llamas se encontró mas efectividad
de la vacuna tipo 2.
• Si el gobierno esta interesado en subvencionar las vacunas a
los municipios de Oruro.
• ¿Debe comprar la vacuna tipo 2, porque existe
mayor probabilidad de efectividad? 23
PREDICCIÓN

La predicción es la formulación de conjeturas sobre sucesos


que aun no han ocurrido, pero podrían ocurrir bajo ciertos
supuestos.
• Si se espera que la tasa de crecimiento económico para e
2016 sea inferior al 5%, no se lograra pagar el Doble
Aguinaldo
• ¿El gobierno debe anticipar la posibilidad de conflictos
sociales?

• Se planea implementar en el país una terapia preventiva,


antes de la exposición al riesgo de transmisión del VIH,
llamada Profilaxis Pre – Exposición en población vulnerable.
• ¿Es posible esperar una reducción de la incidencia del
VIH? 24
Resumiendo:

25
La investigación estadística
Una visión esquemática
¿Qué se quiere conocer?
Una cantidad  Estimación de un promedio
Estimación de la varianza
Consumo promedio de chispitas nutricionales.
Años de escolaridad de la población ayorea migrante.
Consumo promedio de leche en niños de las áreas periurbanas.

Un porcentaje  Estimación de una proporción

Proporción de hombres y mujeres que consumen cerveza


Proporción de personas que mantienen la preferencia por el gobierno
actual.
Proporción de municipios que implementan y ejecutan practicas
vinculadas con la defensa de derechos sexuales y reproductivos.
26
La investigación estadística
Una visión esquemática
¿Cuál es la población que se quiere estudiar?
¿Cuál es la unidad de análisis?
Consumo promedio de chispitas Hogares con niños menores
nutricionales. de dos años.
Niños menores de dos años

Proporción de municipios que Municipios


implementan y ejecutan practicas SLIM
vinculadas con la defensa de derechos.. DNA

Años de escolaridad de la población Hombres y mujeres ayoreos


ayorea migrante. migrantes en Santa Cruz

IDENTIFIQUE SI ES UNA POBLACIÓN FINITA O INFINITA


27
La investigación estadística
Una visión esquemática
¿Qué características se quiere conocer de la población
estudiada? ¿Cuáles son las variables?
Si se trata de estimar una cantidad Debe incluir variables
cuantitativas
Consumo promedio de chispitas Cantidad recibida
nutricionales. Cantidad consumida
Frecuencia de consumo

Si se trata de estimar una proporción Debe incluir variables


cualitativas (dicotómicas)

Proporción de hombres y mujeres que Consume/No consume


consumen cerveza Frecuencia de consumo
28
La investigación estadística
Una visión esquemática
¿Cómo se colectara, analizara la información?
¿Cómo se seleccionara la muestra?
• Encuesta
Cues- • Entrevista
tionario • Grupos

• Censo
Colecta • Encuesta

• MAS
• MASIS
Muestreo • MAE
• MAPC

Tamaño
de la
muestra 29
Determinación del tamaño de la muestra
Referencial
• Estimación de proporciones • Estimación de promedios
Población Infinita Población Infinita

2 2
𝑍1−𝛼/2 ·𝑝·𝑞 𝑍1−𝛼/2 · 𝑆2
𝑛= 𝑛=
𝑒2 𝑒2

Población Finita Población Finita


2
𝑍1−𝛼/2 ·𝑝·𝑞·𝑁 2
𝑛= 𝑍1−𝛼/2 · 𝑆2 · 𝑁
𝑍 2 · 𝑝 · 𝑞 + (𝑁 − 1)𝑒 2 𝑛=
𝑍 2 · 𝑆 2 + (𝑁 − 1)𝑒 2
¿Qué tipo de diseño de investigación se
realizará?
Según el propósito del estudio

Experimentales Observacionales

Según la cronología de las observaciones

Prospectivos Retrospectivos

Según el número de mediciones

Longitudinales Transversales 31
ESTADISTICA DESCRIPTIVA
Un breve recorrido

32
ORDENAMIENTO DE DATOS

Datos Numéricos

Arreglo Distribución de Frecuencias


de Datos Distribución Acumulada

Histograma Ojiva

Tablas Polígono
DISTRIBUCIÓN DE FRECUENCIAS

Frecuencia: desde un conjunto de unidades, corresponde al


Número o Porcentaje de veces que se presenta una variable

Frecuencia
Tabla para datos cualitativos absoluta

Nivel educacional ni fi %fi


i
Primaria 10 0.303 30.3

Secundaria 11 0.333 33.3

Superior 12 0.363 36.3

Total 33 1 100
Frecuencia
Tabla para datos cuantitativos discretos acumulada

Número de ni fi %fi Ni Fi %Fi


dependientes i
Frecuencia
0 15 0.357 35.7 15 0.357 25.7 relativa

1 17 0.404 40.4 32 0.761 76.1

2 10 0.238 23.8 42 1 100

Total 42 1 100

Tabla de frecuencias para datos cuantitativos continuos


Limites Peso ni mi fi %fi Ni Fi %Fi
inferior y
superior 55 - 65 8 60 0.32 32 8 0.32 32

65 – 75 5 70 0.2 20 13 0.52 52

75 – 85 7 80 0.28 28 20 0.8 80

85 - 95 5 90 0.2 20 25 1 100
Intervalos Total 25 1 100
de clase
Marcas
de clase
Frecuencias

Frecuencias absolutas: Frecuencia Relativa:

• Para estudiar las características • Se llama frecuencia relativa de la


de una variable se ordenan los clase ci a la proporción de
valores observados de la muestra individuos que pertenecen a la
en k clases denominadas c1, c2, .. clase sobre el total de individuos
ck. o tamaño de la muestra. Se de
nota por fi. Se puede verificar
• Se llama frecuencia absoluta de la que:
clase al número total de 𝑛𝑖
𝑓𝑖 =
individuos u observaciones que 𝑛
pertenece a dicha clase y se
denota por ni. 𝑘

𝑓𝑖 = 1
𝑖=1
𝑛= 𝑘 ∙ 𝑛𝑖
36
REPRESENTACIONES GRAFICAS

VARIABLES

Cualitativa Discreta Continua

Gráfico DE BARRAS • Histograma


• Polígono de
frecuencias.

OJIVA

GRAFICO CIRCULAR
Tipos de Gráficos

Distribución de las unidades de


análisis de acuerdo a variable 1
1. Gráfico de Sectores Circulares (Torta, Pie)
D
10% A
Distribución de las unidades de análisis de 20%

acuerdo a variable 1 C
40% B
30%

D A
10% 20%

Distribución de las unidades de


análisis de acuerdo a variable 1

D A
C B 10% 20%
40% 30%
C
B
40%
30%

Se usa generalmente para expresar


frecuencias relativas de una
variable cualitativa o categorica. 38
Tipos de Gráficos

2. Gráfico de Columnas/Barras

Numero de unidades de análisis Proporción de unidad de análisis de acuerdo a


variable 1
de acuerdo a variable 1

D
500

variable 1
400 C
300

B
200

100 A
0
A B C D 0 0,2 0,4 0,6 0,8 1
variable 1 Proporción de unidad de análisis

Porcentaje de unidad de análisis de acuerdo a


variable 1
Se usa generalmente para expresar
D
frecuencias (absolutas o relativas)
variable 1

C
de una variable cualitativa o
B

A
cuando la variable cuantitativa se
0 20 40 60 80 100
muestra en categorías o grupos.
% unidad de análisis

39
Tipos de Gráficos

3. Histograma
Permite la representación
15
de la frecuencia de una
variable Cuantitativa, cada
barra representa la
Frecuencia

10

frecuencia de la variable en
la población en estudio (o

la muestra).
0

7 8 9 10 11 12 13 14

edad El histograma se puede


Distribución de los años de estudio de los
empleados de una empresa construir desde los datos de
la tabla de frecuencia de la
variable en estudio o
categorizando la variable
cuantitativa 40
Tipos de Gráficos

4. Polígono de frecuencias y Ojivas


9 El polígono, se aplica a
8 4.4

7
variables cuantitativas, se
Frecuencia absoluta

6 4.0
5.2
basa en el histograma. Los
5

4
4.8
puntos que permiten la
3

2
unión de las líneas
1
5.6
representa el centro o
0 0 0
marcas de clase marca de clase.
30

La ojiva, es un gráfico el
FRECUENCIA ACUMULADA

25
25
24
20
19
polígono acumulado que
15

10
14 permite ver cuántas
5 6 observaciones se
0
4,2 4,6 5 5,4 5,8
encuentran por encima o
LIMITE SUPERIOR INTERVALO DE CLASE
debajo de ciertos valores.41
Tipos de Gráficos

5. Diagrama de tallos y hojas


Los diagramas de tallos y
hojas se utilizan para
describir variables
cuantitativas.

Permiten una vista global


de los datos, pero
manteniendo su
individualidad, se puede
usar en datos que no tienen
una dispersión muy grande.

42
Tipos de Gráficos

6. Diagrama de cajas
El diagrama de cajas es una
100
representación gráfica
90

80
construida con los cuartiles
70
Q1 y Q3 (Percentiles 25 y
60
75), establece los limites
mediante el rango
Edad

50

40 intercuartil.
30

20 Se utiliza para ver la


10 dispersión de los datos y
0
N= 584 1473
los datos atípicos de una
Mujeres Hombres población o muestra.

43
Gráficos para variables cuantitativas discreta
35
Ramos n %f N %F
30 Gráfico de BARRAS
2 1 4 1 4
3 3 12 4 16 25

4 8 32 12 48 20

%
5 3 12 15 60 15

6 4 16 19 76 10
7 3 12 22 88 5
8 3 12 25 100 0
25 100 2 3 4 5 6 7 8
Ramos
2
8
4% 3
12%
12%
30
7
12%
25
OJIVA
20

15
N

6 4
16% 32%
10

5 5
12%
0
Gráfico Circular 2 3 4 5 6 7 8
ramos 44
Resumiendo
Tablas de
frecuencias
Cualitativa
Barras
Gráficos
Sectores Circulares

Variable Tablas de frecuencias

Discreta Gráfico de barras,


circulares

Cuantitativa
Tabla de frecuencias
Continua por intervalos de clase
Histogramas
CARACTERISTICAS DE LAS VARIABLES

Medidas de
posición
Medidas de tendencia central, que resumen la localización alrededor de la cual se distribuyen los datos: Media
(promedio), mediana y la moda y otros promedios ponderados.
Medidas de orden, que informan las características a partir de la ordenación de variables: cuartiles, quintiles,
percentiles.

Dispersión
(Variación)
Resumen la variabilidad que presentan los datos alrededor de una medida de centralización: Rango, rango
intercuartilico, varianza, desviación estándar y coeficiente de variación.

Medidas de forma

Describen la forma del comportamiento de la distribución de los datos: Índices de simetría y curtosis
Medidas de tendencia central

La media aritmética o promedio es el valor 𝑛


𝑖=1 𝑥𝑖
característico de una serie de datos cuantitativos, 𝑥=
que parte del principio de la esperanza matemática 𝑛
o valor esperado.
𝑛
Cuando el conjunto de datos es una muestra
𝑖=1 𝑥𝑖 ∙ 𝑓𝑖
aleatoria recibe el nombre de media muestral y si 𝑥=
se trata de la población media poblacional. 𝑛

En estadística la Esperanza Matemática (también


llamada esperanza, valor esperado, media poblacional o media)
de una variable aleatoria, es el número que formaliza la idea
de valor medio de un fenómeno aleatorio.
𝑛

𝐸 𝑋 = 𝑋𝑖 ∙ 𝑃(𝑋𝑖 )
47
𝑖=1
Medidas de tendencia central

Otros promedios:
 Media geométrica: Es la raíz n-ésima del producto (multiplicación) de
un conjunto de datos, se usa para promediar porcentajes, tasas, índices,…
𝑛
𝑀𝐺 = 𝑥1 ∙ 𝑥2 … 𝑥𝑛
 Media armónica: Es el recíproco, o inverso, de la media aritmética de los
recíprocos de dichos valores, y es recomendada para promediar otros
promedios como la velocidad, la tasa global de fecundidad, etc.
𝑛
𝐻=
𝑛 1
𝑖=1 𝑥
𝑖
 Medias ponderadas: Es un promedio que se obtiene asignado ciertos
pesos (ponderaciones) a ciertas variables o a un conjunto de variables, que
tienen importancia relativa diferente.
𝑛
𝑖=1 𝑥𝑖 ∙ 𝑤𝑖
𝑥= 𝑛
𝑖=1 𝑤𝑖 48
Medidas de tendencia central

 La medina (Me) o media posicional: Es el valor que parte a la mitad el


conjunto de datos. Es decir la mitad (50%) se encuentra por debajo de la
mediana y la otra mitad (50%) se encuentra por encima de la mediana.

La mediana corresponde al percentil 50, trata de eliminar los sesgos de la


media aritmética, pues no toma los valores extremos. Suele usarse para
trabajar con edades o en casos con muchos valores atípicos (outliers)

 La Moda (Mo): Es el valor (dato) que mas veces se repite en un conjunto


de datos, es particularmente útil cuando se analizan variables cuantitativas
discretas.

49
Medidas de posición

Se trata de medidas que dan cuenta de una determinada posición


dentro de la distribución. Por ejemplo la mediana es también una
medida de posición. Porque asume valores que informan sobre una
posición en la distribución de valores de la variable.
Los cuartiles son los tres valores que dividen al conjunto de
datos ordenados en cuatro partes porcentualmente iguales.

 Q1 que se ubica en el lugar (n/4), es el primer cuartil, deja el 25% de las


unidades por debajo y el 75% por encima;

 Q2 que se ubica en el lugar (2*n/4) , es el segundo cuartil, deja 50% por


debajo y el otro 50% por encima. Q2 es igual a la mediana;

 Q3 que se ubica en el lugar, es el tercer cuartil, deja el 75% por debajo y el


25% por encima
50
Medidas de posición: Cuantiles

En general hablamos de cuantiles o n-tiles, como aquellos valores de la


variable, que ordenados de menor a mayor, dividen a la distribución en
partes, de tal manera que cada una de ellas contiene el mismo número de
unidades.

CUARTILES Divide la distribución en 4 partes iguales de 25%


QUINTILES Divide la distribución en 5 partes iguales de 20%
DECILES Divide la distribución en 10 partes iguales de 10%
PERCENTILES Divide la distribución en 100 partes iguales 1%

Los quintiles y deciles se utilizan frecuentemente al estudiar


distribuciones de ingresos o salarios, que suelen ser bastante
asimétricas y heterogéneas.

Los percentiles se aplican, por ejemplo, en variables


biométricas, como la altura, el peso, etc.
51
DISPERSIÓN DE LAS VARIABLES

Muestra la variabilidad de los


Dispersión datos en torno a cierto valor

Varianza Desviación Estándar Coeficiente


de Variación
Rango Varianza de Desviación
la Población Estándar de
la Población
Varianza de
la Muestra Desviación
Estándar de
Rango Intercuartil la Muestra

Diapositiva 52
Medidas de dispersión

 Rango: Máximo Valor – Mínimo Valor

 Rango Intercuartilico:Q3 – Q1 = P75 – P25


𝑛
𝑥𝑖 −𝑋 2
 Varianza (V, s2): 𝑠2 = 𝑖=1
𝑛−1

𝑛 𝑥𝑖 −𝑋 2
 Desviación estándar s = 𝑖=1
𝑛−1

La desviación típica muestra que tan alejados se encuentran los datos del
promedio.
𝑠
 Coeficiente de variación 𝐶𝑉 =
𝑥
Permite la comparación de la variabilidad de variables medidas en escala o
en diferentes unidades de medida.

53
Medidas de forma: Asimetría

Asimetría positiva

Moda Media
Mediana

Asimetría negativa

Media Moda
Mediana 54
El índice de asimetría

Índice de Pearson: Índice de Fisher:

X  Mo n

As   i
( X  X ) 3
n
sx As  i 1

sx3

 Si la distribución es simétrica As será 0


 Si la distribución es asimétrica positiva, As será mayor que 0
 Si la distribución es asimétrica negativa, As será menor que 0

55
Medidas de forma: Curtosis

La curtosis mide la agrupación de una distribución alrededor del


valor central (generalmente la media) e indica que tan apuntada o
achatada se encuentra una distribución respecto a un
comportamiento normal (distribución normal).
n

 Si los datos están muy concentrado (X i  X )4 n


C r i 1
3
sx4
hacia la media, la distribución es
leptocúrtica (curtosis mayor a 0).

 Si los datos están muy dispersos, la


distribución es platicúrtica (curtosis
menor a 0).

 El comportamiento normal exige que


la curtosis sea igual a 0 (distribución
mesocúrtica).
56
Tipos de Distribuciones

Distribución Simétrica

Medidas de Forma  Page 46


57
Tipos de Distribuciones

Distribución Simétrica

Medidas de Forma  Page 46


58
La Distribución Normal

Medidas de Forma  Page 59


59
Características de la Distribución Normal

 La curva normal tiene forma de campana y una sola cima en el centro


de la distribución.
 La media aritmética, la mediana y la moda de la distribución son
iguales y se ubican en el centro.
 La mitad del área bajo la curva se encuentra a la derecha de este
punto central y la otra mitad está a la izquierda de dicho punto.
 Es simétrica en torno a su promedio. Si se corta Ia curva normal de
manera vertical por el valor central, las dos mitades serán como
imágenes en un espejo.
 La curva normal desciende suavemente en ambas direcciones a partir
del valor central.
 Es asintótica, Ia curva se acerca cada vez más al eje de X pero jamás
llega a tocarlo. Es decir, las “colas” de Ia curva se extienden de
manera indefinida en ambas direcciones.
Medidas de Forma  Page 60
60
VARIABLES ALEATORIAS
La distribución normal

61
La Variable Aleatoria

 Una variable es una característica de la población que puede ser


medida y puede tomar diferentes valores. Dichos valores son
aleatorios, es decir una variable puede adoptar cualquier valor entre
un conjunto de posibles valores.

 Sexo: 1, 2, 2, 1, 1, 1, 2, 1, 2, 1,…
 Edad 18, 20, 22, 21, 24, 25, 25, 25, 18, 20, 22, 24
 Lengua materna: Q, Q, A, C, C, C, Q, G, C, C, A, C, C
 Control de calidad: B, B, B, M, B, B, B, B, B, B, M, B, B, M, B, B, M
 Ingresos mensuales:2.000, 1500, 2500, 2300, 2500, 3.000, 1800, …
 Número de hijos: 0, 0, 1, 2, 2, 2, 0, 1, 3, 2, 2, 3, 2, 5, 2, 3, 2, 1, 1, 0

62
Probabilidad de los valores de la Variable Aleatoria

 Dada una variable aleatoria X que toma valores xi .Se define la


probabilidad como la frecuencia relativa que esperaríamos que tomara
xi en una muestra de la variable X, de tamaño infinito.

Tabla de frecuencias de jóvenes de 14 a 24 años, en municipios que han participado de un


programa de inducción sobre el ejercicio de derechos sexuales y reproductivos.

 La probabilidad de que una persona seleccionada sea hombre es de 50,1%.


 La probabilidad que sea de Sucre es de 58,4%

63
Características de la probabilidad

• Cualquier valor de probabilidad tomará necesariamente un valor


entre 0 y 1, es decir entre 0% y 100%.
• La suma de las probabilidades siempre será igual a 1.
Variables Cualitativas
• En el caso de las variables cuantitativas categóricas la frecuencia relativa
tomara valores entre 0 y 1.
Variables Cuantitativas
• En el caso de las variables cuantitativas discretas la frecuencia relativa de un
valor especifico tomara un valor entre 0 y 1, aunque puede haber un número
bastante grande de frecuencias relativas.
• En el caso de las variables cuantitativas continuas, estas pueden tomar
cualquier valor, por lo que la probabilidad de un valor especifico tiende a 0.
Cuando se trata de variables cuantitativas se debe trabajar como conjuntos de
valores, por ejemplo se puede determinar la probabilidad que un salario sea
menor a 2.000 Bs. o que este entre 2.000 y 5.000 Bs.

64
Distribución de probabilidades

Las distribuciones de probabilidad son idealizaciones de los


polígonos de frecuencias. En el caso de una variable
estadística continua a partir de un histograma de
frecuencias relativas se comprueba que al aumentar el
número de datos y las clases el histograma tiende a
estabilizarse convirtiéndose en la gráfica de una función.

Función de probabilidad o
densidad

65
La función de probabilidad

Las distribuciones de probabilidad de variable continua se


definen mediante una función y=f(x) llamada función de
probabilidad o función de densidad.

Así como en el histograma la frecuencia viene dada por el


área, en la función de densidad la probabilidad viene dada
por el área bajo la curva, por lo que:
 El área encerrada bajo la totalidad de la curva es 1.
 Para obtener la probabilidad P(aXb) obtenemos la
proporción de área que hay bajo la curva desde a hasta
b.
 La probabilidad de sucesos puntuales es 0, P(X=a)=0

66
Parámetros de una función de probabilidad

Por analogía con las variables estadísticas podemos definir también aquí
la media  y la desviación típica  de la variable aleatoria.
La media La desviación estándar
 
La media o esperanza La desviación estándar es una
matemática, es un valor medida de la dispersión de los
representativo de todos los valores que toma la variable
valores que toma la variable aleatoria de la media.
aleatoria X. Será más pequeña o más grande
Es como una cuña de la figura de según la gráfica de la función de
distribución que hará que la densidad sea más estrecha o más
función de densidad quede en ancha en torno a la media.
equilibrio.

67
La función de probabilidad

Una distribución de probabilidad es un modelo matemático que


asocia valores de una variable aleatoria con sus respectivas
probabilidades, es decir: Probabilidad de x = Función de x
Las distribuciones se caracterizan por una fórmula que determina
el tipo de distribución y por un conjunto de parámetros.
La distribución puede describirse:

 Mediante una función de probabilidad, que para cada valor de xi


de la variable X determina la probabilidad de ser asumido
 Mediante una función de distribución de probabilidad
acumulada o simplemente función de distribución, la que, para
cada valor provee la probabilidad de no ser superado.
68
Ejemplo de distribución de una variable
Horas de TV que miran los jóvenes de 14 a 24 años en municipios de Chuquisaca

69
La Distribución Normal

70
La Distribución Normal

Se llama normal por ser la La presión ejercida por un


más frecuente en la
brazo robot en manufactura
naturaleza, esto es porque
muchas variables siguen El peso del equipaje en un
esta distribución de
avión
frecuencias.
El tiempo para procesar una
orden de compra

Peso de mujeres y hombres


adultos
Presión arterial

71
Características de la Distribución Normal

 La curva normal tiene forma de campana y una sola cima en el centro


de la distribución.
 La media aritmética, la mediana y la moda de la distribución son
iguales y se ubican en el centro.
 La mitad del área bajo la curva se encuentra a la derecha de este
punto central y la otra mitad está a la izquierda de dicho punto.
 Es simétrica en torno a su promedio. Si se corta Ia curva normal de
manera vertical por el valor central, las dos mitades serán como
imágenes en un espejo.
 La curva normal desciende suavemente en ambas direcciones a partir
del valor central.
 Es asintótica, Ia curva se acerca cada vez más al eje de X pero jamás
llega a tocarlo. Es decir, las “colas” de Ia curva se extienden de
manera indefinida en ambas direcciones.
72
La distribución normal

• La distribución normal
básicamente dice que hay
pocos valores extremos y
que la mayor frecuencia se
encuentra en los valores
centrales.

• Esto además coincide con la


media, la moda y la
mediana, su índice de
asimetría es 0

73
Familia de distribuciones normales

No existe una sola


distribución de probabilidad
normal, sino más bien se
trata de toda una “familia” de
ellas.
Cada una de las
distribuciones puede tener
una media distinta () y
desviación estándar distinta
(ơ).
Por tanto, el número de
distribuciones normales es
ilimitado.

74
Propiedades de la Distribución Normal

 Queda definida por dos parámetros que son la media  y la


desviación estándar 
 Diremos que una variable aleatoria X, cuantitativa continua tiene
distribución normal: X  N (, )
 Los valores de una variable con esta distribución alcanzan su máxima
frecuencia alrededor de la media  donde: Mediana = Moda = Media.
 Es una distribución completamente simétrica: Asimetria = 0
 En el intervalo:
 ( - ,  + ), se encuentra alrededor de 69% de los valores
 ( - 2,  + 2), alrededor de 95% de los valores
 ( - 3,  + 3), alrededor de 99% de los valores

75
Distribución normal estándar o tipficada

Cada caso de distribución Se utiliza un solo “miembro” de


puede tener una media (µ) la familia de distribuciones
o una desviación estándar normales, aquella cuya media
distinta (σ). es 0 y desviación estándar 1
que es la que se conoce como
Por tanto, el número de distribución estándar normal
distribuciones normales es Todas las distribuciones
ilimitado y sería normales pueden convertirse a
imposible proporcionar la estándar, aplicando un
una tabla de proceso de estandarización.
probabilidades para cada
combinación de µ y σ.
76
Distribución normal estándar o tipficada

La distribución normal Una variable X (, )


estándar se caracteriza Se puede estandarizar o
por: tipificar a la distribución normal
estándar:
=0
𝑋−𝜇
=1 𝑍=
𝜎

Esta familia de curva normal Con la variable estandarizada se


varia aproximadamente entre - puede hacer estimaciones de
3 y 3 (poco mas 99% de los probabilidad y definir intervalos
casos) de confianza.
77
78

Das könnte Ihnen auch gefallen