Sie sind auf Seite 1von 74

INTRODUCCIÓN A

LA INFERENCIA
ESTADÍSTICA
¿Porqué la estadística es
importante?
¿Ventas
¿Qué variedad de mensuales?
PRODUCTO Pruebas de control de
elegiré?, ¿porqué calidad del producto
razón?
¿Mejor resistencia?
Estudios
¿tasa de interés?
interlaboratorios
¿Fenómenos
ambientales?
La estadística
herramienta
fundamental
en la toma
de decisiones
Definiciones utilizadas

¿Qué es Estadística ?
RECOLECTAR

Es una ciencia que nos ORGANIZAR

proporciona diversas técnicas y


ANALIZAR
métodos para :Recolectar,
ANALIZAR

organizar, analizar, interpretar INTERPRETAR

los datos, sacar conclusiones y


hacer recomendaciones para DATOS
tomar buenas decisiones.

A esta secuencia se llama proceso


estadístico.
Población
Es un conjunto de
elementos, (personas,
objetos, etc..), que tienen
una o más características
observables que se pueden
medir en ellos.
Ejercicios.
En cada uno de los ejemplos definir la
población requerida.
Opinión de los estudiantes de ingeniería
industrial sobre el servicio de atención en la
cafetería.
Estudiar el voltaje requerido para provocar
fallas en un dispositivo eléctrico.
Edad promedio de los consumidores de café.
 
    
        
         
            
    


 

Muestra
Variable
Se denomina muestra a una
parte de la población Es una característica
seleccionada de acuerdo definida en la
con un plan o regla, con el población y que
fin de obtener información puede tomar dos o
acerca de la población de la más valores o
cual proviene. modalidades.
SUBDIVISIONES DE LA ESTADÍSTICA
Nº trabajadores que
X  ( X  ) iR X
i 2
Nº días
se ausentaron X , S
n n 1
0-4
5-9
4
10
Estadística Descriptiva:
10-14 8
Conjunto de métodos
estadísticos que se
50
45
40 relacionan con el resumen
y descripción de datos,
35
30 Industrial
25 Sistemas

como tablas, gráficas y el


20 Civil
15 Electrónica
10

análisis mediante algunos


5
0
Ciclo 1 Ciclo2

cálculos.
Estadística Inferencial.- Conjunto de métodos cuya
finalidad es hacer generalizaciones o inferencia sobre
una población, utilizando la información de una parte
de ella
Ejercicios.
¿Qué campo de la estadística será necesario
utilizar?.
1“Un material que se fabrica continuamente, antes
de ser cortado y enrrollado en grandes rollos,
debe ser vigilado en cuanto a su espesor
(mediante un calibrador). Se registró diez
mediciones de papel, en mm, y el promedio
resultó 30.1 ”.
2 “Un lote de 1000 CDs debe pasar por control de
calidad, se elige al azar 30 CDs para decidir si el
lote pasa o no el control de calidad y pueda
estar listo para su distribución ”.
Variable
Es una característica definida en la
población y que puede tomar dos o
más valores o modalidades.
Clasificación de variables
Cualitativa Cuantitativa
Es la característica Es la característica
cuyos valores se
expresan en escala cuyos valores se
nominal u ordinal. expresan en escala de
Ej.. intervalos o de razón.
Sexo Se dividen en:
Cursos del primer –Discretas
ciclo
–Continua
Tipos de envase
Clasificación de las variables
cuantitativas
Discreta Continua
Cuando toma sólo ciertos Es aquella variable que
valores en el intervalo puede tomar cualquier
considerado y no admite valor en el intervalo
valores intermedios entre considerado.
dos valores consecutivos. Ej.:Temperatura de
Ej.: Número de artículos ignición de un gas,
defectuosos tiempo de corte de un
torno corriente.
Escala de medición
Nominal Ordinal
Ej.Profesión Ej.Nivel de
estudio

Intervalar Razón
Ej. Ej. Peso
Temperatura
Ejercicio1.-Revisar todos los artículos fabricados que
salen de una línea de ensamble con el fin de
detectar defectos sería un procedimiento costoso
que demandaría mucho tiempo. Un método
económico y eficaz para determinar la cantidad de
artículos defectuosos implica la selección y examen
de una fracción de los artículos por parte de un
ingeniero de control de calidad. Se calcula el
porcentaje de los artículos examinados que salieron
defectuosos y esta cifra se usa para estimar el
porcentaje de todos los artículos fabricados en la
línea que tienen defectos. Identifique la población,
la muestra y el tipo de inferencia estadística que
puede hacerse para este problema.
Ejercicio2.-En una revista especializada, se informó de las
dimensiones de desempeño de redes de distribución de
agua en el área de Trujillo. En una parte del estudio
recabaron los siguientes datos para una muestra de
secciones de tuberías de agua. Identifique los datos
como cuantitativos o cualitativos.
1. Diámetro de la tubería (pulgadas)
2. Material de la tubería.
3. Edad (año de instalación)
4. Ubicación.
5. Longitud de la tubería (pies)
6. Estabilidad del suelo circundante (inestable,
moderadamente estable o estable)
7. Corrosividad del suelo circundante (corrosivo o no
corrosivo)
MÉTODOS GRÁFICOS
PARA DESCRIBIR UNA
VARIABLE
CUALITATIVA
Ejemplo.
En una planta embotelladora se
registraron 28 accidentes y de acuerdo
con la parte del cuerpo lesionada, dedos
(D), ojos (O), brazos (B) y piernas (P); se
registró lo siguiente:
D, D, D, D, D, D, D, D, D, D, D, D, D, D,
D, D, D, D, D, D, O, O, O, O, O, O, O, O,
B, B, B, B, P, P, P, P, P, P, P, P
Se pide organizar los datos.
Frecuencias
Frecuencia de categoría o frecuencia
absoluta (fi)
Representa el número de observaciones que
caen en esa categoría

Frecuencia de categoría relativa o frecuencia


relativa (hi)  f 
hi  
i

 n
Es la proporción del número total de observaciones
que caen en esa categoría.
También se expresa en porcentajes.
Distribución de los accidentes según
la parte del cuerpo lesionada

Frecuenci Frecuencia
Lesión %
a (fi) relativa (hi)
Dedos
Ojos
Brazos
Piernas
Para representar gráficamente la distribución de
frecuencias de una variable cualitativa se
utilizan las barras y los sectores circulares.
Nota:
Si trabajamos con variables nominales las
categorías pueden ser colocadas en cualquier
orden. En el caso de escala ordinal las
categorías deberán ser colocadas en orden.
Accidentes de trabajo según la
parte lesionada

25
fi
20
15
10 20

5 8 8
4
0
Dedos Ojos Brazos Piernas
Accidentes de trabajo según la
parte lesionada

20%
10%
50%
20%

Dedos Ojos Brazos Piernas


Ejercicio.
Completa la tabla de frecuencias y a partir de ella,
elabora el gráfico de barras y el sector circular.
Tipo de falla fi hi
(%)

Orificios no abiertos 6
Orificios demasiado grandes 22
Conexiones deficientes 13
Chips de tamaño incorrecto 2
Otros 5
Ejemplo. En La Libertad ingenieros civiles
están diseñando caminos con los más modernos
métodos de construcción orientados hacia la
seguridad en respuesta al hecho de que en 2017
más personas murieron en La libertad a causa de
caminos en malas condiciones que por armas de
fuego. Un total de 135 accidentes de tráfico
ocurridos durante un año han sido atribuidos a
caminos mal construidos (La Industria, 14 de
noviembre de 2017). En la tabla que sigue se
muestra un desglose de las malas condiciones de
los caminos que causaron los accidentes.
Construya e interprete un diagrama conveniente
para estos datos.
N° de
Mala condición del camino deceso
s
Obstrucciones sin advertencia 7
Reparaciones/construcción del camino 39
Material superficial suelto 13
Orillas del camino blandas o bajas 20
Agujeros, surcos, etc. 8
Agua estancada 25
Superficie desgastada 6
Otros 17
Total 135
Proporció
N° de Frecuencia n
Mala condición del camino
decesos relativa acumulad
a
Reparaciones/construcción
39 0.29 0.29
del camino
Agua estancada 25 0.19 0.47
Orillas del camino blandas o
20 0.15 0.62
bajas
Material superficial suelto 13 0.10 0.72
Agujeros, surcos, etc. 8 0.06 0.78
Obstrucciones sin
7 0.05 0.83
advertencia
Superficie desgastada 6 0.04 0.87
Otros 17 0.13 1.00
Total 135 1.00
MÉTODOS GRÁFICOS
PARA DESCRIBIR DATOS
CUANTITATIVOS
1. DISCRETOS
Ejemplo:
Construir la distribución de frecuencias del número de
trabajadores que se ausentaron en 25 días laborables:

2 3 3 0 1 2
1 2 2 1 3 3
2 1 0 1 2 3
4 3 2 4 2 1
0
Frecuencias
Frecuencia de categoría acumulada (Fi)
Representa el número de observaciones que
caen hasta esa categoría

Frecuencia de categoría relativa acumulada


(Hi)
 Fi 
 Hi  
 n
Es la proporción del número total de observaciones
que caen hasta esa categoría.
También se expresa en porcentajes.
Distribución del número de
trabajadores que se ausentaron
Conte
x fi hi Fi Hi
o
0

4
¿Que porcentaje de los 25 días faltaron 3
trabajadores?

¿Que porcentaje de los días faltaron 2 ó menos


trabajadores?

¿Cuántos días no faltó ningún trabajador?


Representación gráfica
N° de trabajadores que se ausentaron

10
N° días

8
8
6 6
6

4 3
2
2

0
0 1 2 3 4

N°trabajadores
MÉTODOS GRÁFICOS
PARA DESCRIBIR DATOS
CUANTITATIVOS
2. CONTINUOS
Ejemplo. Los siguientes datos representan el tiempo (en
segundos) que 30 trabajadores estuvieron al control de la
unidad central de procesos (CPU) de una computadora
mainframe grande.

0.02 0.75 1.16 1.38 1.94 3.07


0.15 0.82 1.17 1.4 2.01 3.53
0.19 0.84 1.19 1.42 2.16 3.76
0.47 0.92 1.22 1.59 2.41 4.50
0.71 0.96 1.23 1.61 2.59 4.75
PROCEDIMIENTO
1º Calcule el rango (R) o recorrido
R = Obs.máx. - Obs.mín.

R = 4.75 - 0.02 = 4.73


2º Determine el número de intervalos (K).
K = 1 + 3.3 Log(n) = 1+3.3Log(30)
K =5.875
K = 6 (siempre es un número entero,
se aproxima por exceso)
3º Determine el Tamaño del Intervalo de
Clase (w).

w = R/K

w = 0.79 (por exceso)


4°Elabore la tabla de frecuencias a partir
de la información anterior.
Marca de clase

Es el promedio de los límites inferior y


superior de una determinada clase o
intervalo

Lím . inf i  Lím . sup i


x 
'
i
2
Tabla de frecuencias de los
tiempos de control CPU

K Intervalo Conteo fi hi Fi Hi
x i'
1 [0.02 , 0.81[
2 [0.81 , 1.60[
3
4
5
6
Representaciones gráficas

Polígono

Histograma Ojiva
Histograma de los tiempos

13 hi
fi 12 0.40
11
10
9 0.30
8
7
6 0.20
5
4
3 0.10
2
1
0 -0.01
-0.38 0.42 1.21 2.00 2.79 3.58 4.37 5.16
Tiempos
Ojiva de los tiempos

30
Fi 27
24
21
18
15
12
9
6
3
0
0.02 0.81 1.60 2.39 3.18 3.97 4.76
Tiempos
Población y Muestra

Población: Es el conjunto total de elementos (individuos,


objetos o eventos) que tienen las mismas características y
sobre el que estamos interesados en obtener conclusiones.

Muestra: Es una parte de la población (subconjunto)


seleccionada convenientemente de tal manera que represente
a la población (Representativo)
Marco Poblacional
Conjunto de todas las unidades
elementales (personas, procesos o cosas)
al que se circunscribe el estudio
estadístico.
Ejemplos :
 Los Ingenieros Industriales del Perú.
 Los trabajadores asegurados en una EPS
 Los Procesos en una fábrica de producción de azúcar
en la Libertad.

MARCO POBLACIONAL

(1200 trabajadores de una fábrica)


Población Estadística

Registro de una característica EN TODOS los


elementos del marco poblacional.

Tiene tantos datos como elementos tenga el


marco poblacional.

Habrán tantas poblaciones como características se


deseen registrar en un determinado marco
poblacional.
MARCO POBLACIONAL
(1200 trabajadores en una fábrica)

Características
de interés
Estado Años de Servicio
Edad Peso
Civil

Población Población Población


Registro
de la
caracte- P1 P2 P3 ... Pn
rística (1200 datos) (1200 datos)
Marco Muestral

Subconjunto del marco poblacional.


Comprende los elementos o estratos del marco
poblacional (es representativo).
En contraste con el marco poblacional es más
conveniente porque se obtienen los datos en menor
tiempo y reduciendo los costos.

Ejemplo :
85 Trabajadores de una
Fábrica.
Marco Poblacional Técnicas Marco Muestral
de muestreo

(1200 Trabajadores de una (85 Trabajadores de una fábrica )


fábrica)
Característica
Edad Peso Estado civil Años de Servicio.

Registro
de la POBLACIÓN POBLACIÓN POBLACIÓN POBLACIÓN
carac-
terística.

...
P1 P2 P3 Pn
Muestra
Registro de una característica en todos los elementos del
marco muestral.

Tiene tantos datos como elementos el marco muestral.

Habrán tantas muestras como características se deseen


registrar en un marco muestral.

Las características no extraen de la población, sino del


marco muestral
MARCO POBLACIONAL Técnicas MARCO MUESTRAL
(1200Trabajadoresdeunafábrica) de muestreo ( 85Trabajadores de una fábrica)
Temp.

Característica
Edad Peso Estado Serv.
civil

Edad Peso Estado . Tiemp


civil Servicio MUESTRA MUESTRA MUESTRA MUESTRA

m1 m2 m3 mn

85 datos

Registro
de la POBLACIÓN POBLACIÓN POBLACIÓN POBLACIÓN
carac-
terística.

...
P1 P2 P3 Pn
Parámetro y Estimador
Parámetro
Medida resumen de una población. Valor representativo
de una población. Se simboliza por letras griegas. Sólo
hay un parámetro en cada población.
Estimador, Estadígrafo o Estimador

Medida resumen de una muestra. Valor representativo de una muestra.


Se llama también estadígrafo o estadístico. Se simboliza por letras latinas.
Existen tantos estimadores como muestras se extraigan de una
población.
MUESTRA ESTIMADOR
n1
x1

n2 x2
POBLACIÓN
n3 x3
.
.
nm
xm
PARÁMETRO

DIFERENTES MUESTRAS GENERAN DIFERENTES


VALORES DEL ESTIMADOR
Muestreo

Procedimiento por el cual se extrae, de


un conjunto de unidades que
constituyen el objeto de estudio (
población), un número de casos
reducido (muestra) elegidos con
criterios tales que permitan la
generalización a toda la población de los
resultados obtenidos al estudiar la
muestra.
Razones de Muestreo

Disminución de costos ( tiempo,


personal, material)
Al disminuir el número de casos
disminuyen también los errores
asociados a la manipulación de los
datos.
Puede confiarse en la generalización de
los resultados si se ha tenido cuidado al
seleccionar la muestra.
Criterios importantes para la
selección de la muestra

Salvo en poblaciones muy pequeñas y


accesibles nunca se observan a todas las
unidades de la población.
Se debe diseñar una muestra que
constituya una representación a pequeña
escala de la población a la que pertenece.
Cualquier diseño muestral comienza con la
búsqueda de la información que ayude a
la identificación de las características de la
población bajo estudio.
Condiciones que debe cumplir una
“buena” muestra
Que comprendan parte de la población y
no la totalidad de ésta. ( salvo en los casos antes
explicados )

Aunque el sentido común pareciera


indicar que poblaciones más grandes
deben producir muestras mayores, esto no
es siempre cierto ya que:
 El tamaño de la población NO es el único elemento que influye en el
tamaño de la muestra.
Condiciones que debe cumplir una
“buena” muestra
La ausencia de distorsión en la elección de
los elementos de la muestra.
Si esta elección presenta alguna anomalía, la
muestra resultará por este mismo hecho
viciada.
Que sea representativa o reflejo fiel de la
población, de tal modo que reproduzca
sus características básicas en orden a la
investigación.
Condiciones que debe
cumplir una “buena”
muestra
Si hay sectores diferenciados en la
población que se supone ofrecen
características especiales la muestra
también deberá comprenderlos en la
misma proporción.
Tamaño de la muestra

Es el número de unidades a incluir en la


muestra.
Existen varios factores que influyen en el:
Tiempo y recursos disponibles
Modalidad de Muestreo
Tipo de Análisis Previsto
Varianza o heterogeneidad de la población
Margen de Error máximo admisible
Nivel de confianza de la estimación muestral
Modalidad de Muestreo
Seleccionada
La selección de las modalidades de
muestreo ( probabilísticos y no
probabilísticos) se halla determinada por la
confluencia de varios factores: los
objetivos, los recursos, la accesibilidad de
la población y el tiempo.
Los diseños no probabilísticos demandan
un tamaño muestral menor.
Tipos de Muestreos
PROBABILÍSTICOS NO PROBABILISTICOS

•Todas las unidades tienen igual •Cada unidad NO tiene igual


probabilidad de participar en probabilidad de participar en
la muestra. la muestra.
•La elección de cada unidad •No se puede calcular el error
muestral es independiente de las muestral
demás •Alto riesgo de invalidez
•Se puede calcular el error muestral producido por la introducción de
sesgos
Usos de cada tipo de muestreo
Muestreo Probabilísticos Muestreos No
Estimación de Probabilísticos
Parámetros Estudios Pilotos
Comprobación de Estudios Cualitativos
Hipótesis Investigaciones en
poblaciones de difícil
registro o localización
( Ej. Marginales,
prostitutas, enfermos
de VIH, etc…)
Ejemplo: ¿Muestreo
Probabilístico?

Se realiza un muestreo entre los


alumnos que van a clases de la Materia
Metodología, eligiéndolos al azar a la
entrada del salón.

Este diseño es NO probabilístico porque aquellos que


no van a clases NO PUEDEN ser elegidos
Ejemplo: ¿Muestreo
Probabilístico?

Se utiliza la lista de propietarios de


líneas telefónicas para elegir a aquellos
que serán encuestados.

Este diseño es NO Probabilístico porque aquellos que


no tienen teléfono NO PUEDEN ser elegidos
Ejemplo: ¿Muestreo
Probabilístico?

Un investigador toma muestras del


carbón extraído de una mina, tomando
al azar trozos de carbón de la parte
superior de cada carro.
Este diseño es NO probabilístico
porque solo se toma carbón
de la parte superior
Factores que influyen en el tamaño de la
muestra :Tipo de análisis de datos previsto

La técnica de análisis influye en el tamaño


de la muestra:
Comparación de Medias
Estimación de Proporciones ( parámetros)
Análisis Univariables
Análisis Multivariables
Heterogeneidad poblacional
Cuanto mas heterogénea sea la población
mayor será su varianza poblacional lo que
implicará mayores tamaños muestrales.
Cuando se desconoce el valor de la
varianza poblacional se recurre al
supuesto mas desfavorable, asumiendo
una varianza poblacional igual a 0,5.
0,5 significa que una unidad seleccionada
tiene 50 % de posibilidades de pertenecer
o no a un grupo específico dentro de la
población
Tipos de Muestreos:
PROBABILÍSTICOS NO PROBABILISTICOS

•Todas las unidades tienen igual •Cada unidad NO tiene igual


probabilidad de participar en probabilidad de participar en
la muestra. la muestra.
•La elección de cada unidad •No se puede calcular el error
muestral es independiente de las muestral
demás •Alto riesgo de invalidez
•Se puede calcular el error muestral producido por la introducción de
sesgos
Tipos de muestreo
Probabilístico:

Por
Simple Sistemático Estratificado
Conglomerados
Tipos de muestreos NO Probabilísticos:

“ Bola
Por
de
Cuotas
Nieve”

Criterio Racimo

Das könnte Ihnen auch gefallen