Beruflich Dokumente
Kultur Dokumente
1
¿De que se trata el modulo?
Competencias buscadas
Conoce y usa procedimientos estadísticos para la
realización de pruebas estadísticas paramétricas y no
paramétricas y análisis multivariados.
2
Programa mínimo
1. Estadísticas y Parámetros
2. Análisis exploratorio de datos
3. Principios de inferencia estadística
4. Variables aleatorias: Distribución Normal
5. Estimación puntual e intervalos de confianza
6. Contraste de Hipótesis
7. Comparación de grupos
8. Análisis de Varianza
9. Regresión y Correlación
Organización de la asignatura
Clases teóricas:
Fundamentos teóricos de la estadística y la inferencia estadística
Clases prácticas con SPSS y Excel:
Desarrollo de casos de aplicación
3
Bibliografía
-Gorgas – Cardiel - Zamorano: Estadística Básica para Estudiantes de
Ciencias. UCM, Madrid-España. 2011..
Bibliografía Complementaria
- Ritchey, Ferris J.: Estadística para las Ciencias Sociales. 2da. Ed. Mc. Graw
Hill. México, 2006.
4
INTRODUCCIÓN
¿Qué es la estadística?
Estadística es la ciencia de recolectar,
organizar, presentar, analizar e interpretar
datos con el propósito de ayudar a una toma
de decisiones más efectiva.
5
EJEMPLOS DE APLICACIÓN
2) En Economía: para medir la evolución de los precios mediante números índice o para
estudiar los hábitos de los consumidores a través de encuestas de presupuestos
familiares.
3) En Ciencias Políticas: para conocer las preferencias de los electores antes de una
votación mediante sondeos y así orientar las estrategias de los candidatos.
4) En Sociología: para estudiar las opiniones de los colectivos sociales sobre temas de
actualidad.
5) En Psicología: para elaborar las escalas de los test y cuantificar aspectos del
comportamiento humano (por ejemplo los test que se aplican a los candidatos para un
cargo en una empresa).
En general en las Ciencias Sociales, la estadística se emplea para medir las relaciones
entre variables y hacer predicciones sobre ellas.
6
ESTADISTICA DESCRIPTIVA E INFERENCIAL
7
INFERENCIA ESTADÍSTICA
9
Esquema de las etapas de un estudio estadístico
ORGANIZACIÓN
Y RESUMEN
Tema de Investigación ESTADÍSTICA
-Antecedentes Previos DESCRIPTIVA
-Objetivos INTERPRETACIÓN
-Preguntas de Investigación Muestra
-Posibles Hipótesis ¿Población o Muestra?
-Unidad de Análisis INFERENCIA
Población
-Población ESTADISTÍCA
-Variables
CONCLUSIONES
Probabilidad
INFORMACIÓN
10
Del Problema a la Respuesta al Problema
Problema de investigación
Antecedentes
Herramientas estadísticas
Objetivo
Análisis descriptivo
INFORMACION
Pregunta de Inv.
Análisis exploratorio
Hipótesis
Tablas de Continngencia
Población
Regresión y correlación
Unidad de Análisis
Variables
Pruebas paramétricas
Pruebas no paramétricas
Respuesta al
Análisis de varianza problema de
Investigación
11
EJEMPLOS DE ANÁLISIS
12
POBLACIÓN Y MUESTRA
MUESTRA
PARTE “representativa” de la
Población.
Un ESTADÍSTICO describe
a una Muestra.
POBLACIÓN
TODOS los posibles individuos,
objetos, mediciones y conteos
13
CONCEPTOS IMPORTANTES
14
MUESTREO
PROBABILISTICO NO PROBABILISTICO
PROBABILISTICO NO PROBABILISTICO
Es un muestreo dirigido
Suponen un procedimiento de selección informal y un
poco arbitrario.
Muestra de sujetos voluntarios La elección de los elementos no depende de la
Muestra de expertos probabilidad, sino de causas relacionadas con las
Muestra de sujetos-tipo características del investigador.
Muestra por cuotas Son utilizadas en algunas investigaciones y a partir de
ellas se hacen inferencias hacia la población.
La muestra dirigida selecciona sujetos típicos, con la
esperanza de que serán casos representativos de una
16
población determinada.
CARACTERISTICAS DE LA POBLACIÓN
Variables Cuantitativas Variables Cualitativas
NUMERICAS ATRIBUTOS
CONTINUA DISCRETA NOMINAL ORDINAL
Medición Conteo
17
Cualitativas
Si se expresan de forma
nominal u ordinal
Variable
Cuantitativas
Si se expresan con las
escalas intervalar y de razón
Números • MUTUAMENTE EXCLUYENTE: UN INDIVIDUO, OBJETO
O ARTÍCULO, AL SER INCLUIDO EN UNA CATEGORÍA,
DEBE EXCLUIRSE DE LAS DEMÁS.
18
PARAMETROS Y ESTADISTICOS
25
La investigación estadística
Una visión esquemática
¿Qué se quiere conocer?
Una cantidad Estimación de un promedio
Estimación de la varianza
Consumo promedio de chispitas nutricionales.
Años de escolaridad de la población ayorea migrante.
Consumo promedio de leche en niños de las áreas periurbanas.
• Censo
Colecta • Encuesta
• MAS
• MASIS
Muestreo • MAE
• MAPC
Tamaño
de la
muestra 29
Determinación del tamaño de la muestra
Referencial
• Estimación de proporciones • Estimación de promedios
Población Infinita Población Infinita
2 2
𝑍1−𝛼/2 ·𝑝·𝑞 𝑍1−𝛼/2 · 𝑆2
𝑛= 𝑛=
𝑒2 𝑒2
Experimentales Observacionales
Prospectivos Retrospectivos
Longitudinales Transversales 31
ESTADISTICA DESCRIPTIVA
Un breve recorrido
32
ORDENAMIENTO DE DATOS
Datos Numéricos
Histograma Ojiva
Tablas Polígono
DISTRIBUCIÓN DE FRECUENCIAS
Frecuencia
Tabla para datos cualitativos absoluta
Total 33 1 100
Frecuencia
Tabla para datos cuantitativos discretos acumulada
Total 42 1 100
65 – 75 5 70 0.2 20 13 0.52 52
75 – 85 7 80 0.28 28 20 0.8 80
85 - 95 5 90 0.2 20 25 1 100
Intervalos Total 25 1 100
de clase
Marcas
de clase
Frecuencias
𝑓𝑖 = 1
𝑖=1
𝑛= 𝑘 ∙ 𝑛𝑖
36
REPRESENTACIONES GRAFICAS
VARIABLES
OJIVA
GRAFICO CIRCULAR
Tipos de Gráficos
acuerdo a variable 1 C
40% B
30%
D A
10% 20%
D A
C B 10% 20%
40% 30%
C
B
40%
30%
2. Gráfico de Columnas/Barras
D
500
variable 1
400 C
300
Nº
B
200
100 A
0
A B C D 0 0,2 0,4 0,6 0,8 1
variable 1 Proporción de unidad de análisis
C
de una variable cualitativa o
B
A
cuando la variable cuantitativa se
0 20 40 60 80 100
muestra en categorías o grupos.
% unidad de análisis
39
Tipos de Gráficos
3. Histograma
Permite la representación
15
de la frecuencia de una
variable Cuantitativa, cada
barra representa la
Frecuencia
10
frecuencia de la variable en
la población en estudio (o
Nº
la muestra).
0
7 8 9 10 11 12 13 14
7
variables cuantitativas, se
Frecuencia absoluta
6 4.0
5.2
basa en el histograma. Los
5
4
4.8
puntos que permiten la
3
2
unión de las líneas
1
5.6
representa el centro o
0 0 0
marcas de clase marca de clase.
30
La ojiva, es un gráfico el
FRECUENCIA ACUMULADA
25
25
24
20
19
polígono acumulado que
15
10
14 permite ver cuántas
5 6 observaciones se
0
4,2 4,6 5 5,4 5,8
encuentran por encima o
LIMITE SUPERIOR INTERVALO DE CLASE
debajo de ciertos valores.41
Tipos de Gráficos
42
Tipos de Gráficos
6. Diagrama de cajas
El diagrama de cajas es una
100
representación gráfica
90
80
construida con los cuartiles
70
Q1 y Q3 (Percentiles 25 y
60
75), establece los limites
mediante el rango
Edad
50
40 intercuartil.
30
43
Gráficos para variables cuantitativas discreta
35
Ramos n %f N %F
30 Gráfico de BARRAS
2 1 4 1 4
3 3 12 4 16 25
4 8 32 12 48 20
%
5 3 12 15 60 15
6 4 16 19 76 10
7 3 12 22 88 5
8 3 12 25 100 0
25 100 2 3 4 5 6 7 8
Ramos
2
8
4% 3
12%
12%
30
7
12%
25
OJIVA
20
15
N
6 4
16% 32%
10
5 5
12%
0
Gráfico Circular 2 3 4 5 6 7 8
ramos 44
Resumiendo
Tablas de
frecuencias
Cualitativa
Barras
Gráficos
Sectores Circulares
Cuantitativa
Tabla de frecuencias
Continua por intervalos de clase
Histogramas
CARACTERISTICAS DE LAS VARIABLES
Medidas de
posición
Medidas de tendencia central, que resumen la localización alrededor de la cual se distribuyen los datos: Media
(promedio), mediana y la moda y otros promedios ponderados.
Medidas de orden, que informan las características a partir de la ordenación de variables: cuartiles, quintiles,
percentiles.
Dispersión
(Variación)
Resumen la variabilidad que presentan los datos alrededor de una medida de centralización: Rango, rango
intercuartilico, varianza, desviación estándar y coeficiente de variación.
Medidas de forma
Describen la forma del comportamiento de la distribución de los datos: Índices de simetría y curtosis
Medidas de tendencia central
𝐸 𝑋 = 𝑋𝑖 ∙ 𝑃(𝑋𝑖 )
47
𝑖=1
Medidas de tendencia central
Otros promedios:
Media geométrica: Es la raíz n-ésima del producto (multiplicación) de
un conjunto de datos, se usa para promediar porcentajes, tasas, índices,…
𝑛
𝑀𝐺 = 𝑥1 ∙ 𝑥2 … 𝑥𝑛
Media armónica: Es el recíproco, o inverso, de la media aritmética de los
recíprocos de dichos valores, y es recomendada para promediar otros
promedios como la velocidad, la tasa global de fecundidad, etc.
𝑛
𝐻=
𝑛 1
𝑖=1 𝑥
𝑖
Medias ponderadas: Es un promedio que se obtiene asignado ciertos
pesos (ponderaciones) a ciertas variables o a un conjunto de variables, que
tienen importancia relativa diferente.
𝑛
𝑖=1 𝑥𝑖 ∙ 𝑤𝑖
𝑥= 𝑛
𝑖=1 𝑤𝑖 48
Medidas de tendencia central
49
Medidas de posición
Diapositiva 52
Medidas de dispersión
𝑛 𝑥𝑖 −𝑋 2
Desviación estándar s = 𝑖=1
𝑛−1
La desviación típica muestra que tan alejados se encuentran los datos del
promedio.
𝑠
Coeficiente de variación 𝐶𝑉 =
𝑥
Permite la comparación de la variabilidad de variables medidas en escala o
en diferentes unidades de medida.
53
Medidas de forma: Asimetría
Asimetría positiva
Moda Media
Mediana
Asimetría negativa
Media Moda
Mediana 54
El índice de asimetría
X Mo n
As i
( X X ) 3
n
sx As i 1
sx3
55
Medidas de forma: Curtosis
Distribución Simétrica
Distribución Simétrica
61
La Variable Aleatoria
Sexo: 1, 2, 2, 1, 1, 1, 2, 1, 2, 1,…
Edad 18, 20, 22, 21, 24, 25, 25, 25, 18, 20, 22, 24
Lengua materna: Q, Q, A, C, C, C, Q, G, C, C, A, C, C
Control de calidad: B, B, B, M, B, B, B, B, B, B, M, B, B, M, B, B, M
Ingresos mensuales:2.000, 1500, 2500, 2300, 2500, 3.000, 1800, …
Número de hijos: 0, 0, 1, 2, 2, 2, 0, 1, 3, 2, 2, 3, 2, 5, 2, 3, 2, 1, 1, 0
62
Probabilidad de los valores de la Variable Aleatoria
63
Características de la probabilidad
64
Distribución de probabilidades
Función de probabilidad o
densidad
65
La función de probabilidad
66
Parámetros de una función de probabilidad
Por analogía con las variables estadísticas podemos definir también aquí
la media y la desviación típica de la variable aleatoria.
La media La desviación estándar
La media o esperanza La desviación estándar es una
matemática, es un valor medida de la dispersión de los
representativo de todos los valores que toma la variable
valores que toma la variable aleatoria de la media.
aleatoria X. Será más pequeña o más grande
Es como una cuña de la figura de según la gráfica de la función de
distribución que hará que la densidad sea más estrecha o más
función de densidad quede en ancha en torno a la media.
equilibrio.
67
La función de probabilidad
69
La Distribución Normal
70
La Distribución Normal
71
Características de la Distribución Normal
• La distribución normal
básicamente dice que hay
pocos valores extremos y
que la mayor frecuencia se
encuentra en los valores
centrales.
73
Familia de distribuciones normales
74
Propiedades de la Distribución Normal
75
Distribución normal estándar o tipficada