Beruflich Dokumente
Kultur Dokumente
TEMARIOS
Profesor
Objetivos
Reglas
Contenidos a desarrollar en el curso
Políticas
Objetivos :
CURSO
INSTITUCIONAL
Syllabus ESTG1001
Sistema de Calificación
TEORÍA PRÁCTICA
Primer Parcial Segundo Parcial Tercer Parcial Califiación Única
Actividades Examen Actividades Examen Examen Actividades
TEORÍA + PRÁCTICA =
CALIFICACIÓN
Propuesta de la
estructura en Estadística
3 / 1 / 5
Component Compone
e nte
Teórico Práctico
80% 20%
1er 2do Actividades -
Actividades Parcial Parcial Mejoramiento 50%
Talleres
Examen 50% 50% 100% Proyecto 50%
Control de 100%
lectura 15% 15%
Lecciones 25% 25%
Deberes 10% 10%
100% 100% 100%
Calificaciones -
Estudiante
Carácter Obligatorio
Revisar el syllabus
Realizar las lecturas del material que se va a desarrollar en clase.
Lecciones diarias sobre la lecturas programadas.
Estadística Descriptiva
Estadística
Estadística Inferencial
1-16
Técnicas Estadísticas
Técnicas descriptivas
Recolección, presentación y descripción de datos
Técnicas inferenciales
Establecer conclusiones y/o tomar decisiones concernientes a la población
considerando solamente los datos muestrales
Diagramas
Estadística Descriptiva
Tablas
Medidas numéricas
1-18
Técnicas Descriptivas
Recolección de datos
ej., Encuesta, Observación,
Experimento
Presentación de datos
ej., Cuadros y Gráficos
Caracterización de datos
ej., Media muestral=
x i
n
Estadística Inferencial
Establecer conclusiones y/o tomar decisiones concernientes a la
población basados en resultados muestrales.
Estimación
ej., Estimar el peso promedio poblacional usando el peso promedio
muestral
Prueba de Hipótesis
ej., Usar la muestra para evaluar si el peso promedio poblacional
es120 libras.
1-20
Técnicas Inferenciales
Comprender el comportamiento de la población a través del análisis de la muestra
1-21
Estadística - Aplicaciones
Población y Muestra
Población y muestra
Población: Conjunto
bien definido de N-
entes, cuyas
*características nos
proponemos a
Muestra investigar
Población
Muestra:
subconjunto de la
población
La información obtenida
de la muestra nos permite
Unidad de
inferir las propiedades o
investigación características de toda la
población, con errores
Observación
medibles y acotables
Definiciones Claves
1-25
¿Por qué muestrear?
Dato
Cualitativo Cuantitativo
(Categórico) (Numérico)
Ejemplos:
Estado civil Discreto Continuo
Partido político
Color de ojos
(Categorías definidas) Ejemplos: Ejemplos:
Número de hijos Peso
Defectos por hora Voltaje
(Valores contados) (Medidas de
carácterísticas)
1-31
Tipos de Datos
Dato
Cualitativo Cuantitativo
(Categórico) (Numérico)
Discreto Continuo
1-32
Tipos de Datos
Datos Transversales
Datos observados en un solo punto del tiempo
1-33
Tipos de Datos
Datos Transversales
1-34 Datos de Serie de Tiempo
http://www.eluniverso.com/noticias/2015/11/01/nota/5215826/sales-carnes-procesadas-
pueden-generar-cancerigenos
1-35 Datos Transversales
Datos observados en un solo punto del tiempo
http://www.eluniverso.com/noticias/2015/11/01/nota/5215826/sales-carnes-procesadas-
pueden-generar-cancerigenos
1-36
Niveles de Medición de Datos
1-37
Niveles de Medición de Datos
ESCALA - NOMINAL
ESCALA - ORDINAL
1-38
Niveles de Medición de Datos
ESCALA - INTERVALO
ESCALA - RAZÓN
1-39
Escala de medición
1-40
Muestra:
subconjunto de la
población
La información obtenida
de la muestra nos permite
Unidad de
inferir las propiedades o
investigación características de toda la
población, con errores
Observación
medibles y acotables
Datos e información
Procesamiento
de la información
Dato Información
Tabulación
Mediciones no de datos
procesadas Gráficos
- Numéricas Medidas
- Categóricas
Tipo de datos y Escalas
de medición
1-45
Tipos de Datos
Dato
Cualitativo Cuantitativo
(Categórico) (Numérico)
Ejemplos:
Estado civil Discreto Continuo
Partido político
Color de ojos
(Categorías definidas) Ejemplos: Ejemplos:
Número de hijos Peso
Defectos por hora Voltaje
(Valores contados) (Medidas de
carácterísticas)
1-46
Tipos de Datos
Datos Transversales
Datos observados en un solo punto del tiempo
1-47
Tipos de Datos
Datos Transversales
1-48 Datos de Serie de Tiempo
http://www.eluniverso.com/noticias/2015/11/01/nota/5215826/sales-carnes-procesadas-
pueden-generar-cancerigenos
1-49
Escala de medión
1-50
Niveles de Medición de Datos
ESCALA - NOMINAL
ESCALA - ORDINAL
1-51
Niveles de Medición de Datos
ESCALA - INTERVALO
ESCALA - RAZÓN
Procesamiento de los datos
a) Ordenamiento de datos – Estadístico de Orden
𝑋 1 = min 𝑋1 ,𝑋2 , … . , 𝑋𝑛
𝑋 𝑛 = m𝑎𝑥 𝑋1 ,𝑋2 , … . , 𝑋𝑛
1-52
Procesamiento de los datos
b) Tabulación de los datos
Procesamiento de los datos
b) Tabulación de los datos
Condiciones
Exhaustivos
Mutuamente excluyentes
Igual longitud
1-55
Procesamiento de los datos
b) Tabulación de los datos
Histogramas
Polígono de frecuencias
Ojiva: Distribución de
frecuencias acumulada
Histogramas
Polígono de frecuencias
Ojiva: Distribución de
frecuencias acumulada
Cuantiles y Medidas de
tendencia central y
dispersión
Datos sueltos
Medidas de Resumen
x i
x i 1
Condiciones
n
N
xi w i 1
i 1 0 wi 1
N
**Media
Cortada
Medidas de tendencia Central
Para datos agrupados
n
M W wi xi
x i
x i 1
Condiciones
n
w
Punto medio Punto de mayor
N 1
x frecuencia i
i
i 1 0 wi 1
N
Punto de
equilibrio
**Media
Acotada
Medidas de Posición - Cuantiles
Son números que dividen al grupo de datos ordenados, en grupos de
aproximadamente igual cantidad de datos con el propósito de resaltar su ubicación
Percentiles
Cuartiles
Deciles
Medidas de Posición - Cuantiles
Percentiles
Los cuartiles dividen a los datos ordenados en cuatro grupos iguales:
Deciles
Medidas de Posición - Cuantiles
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
% % % % % % % % % % % % % % % % % % % % % % % % % % %
Percentiles
P1 P2 P99
10% 10% 10% 10% 10% 10% 10% 10% 10% 10%
Deciles
D1 D2 D3 D4 D5 D6 D7 D8 D9
Diagrama de Caja
* *
Valores “Valor más pequeño” “Valor más grande”
Atípicos (Límite Inferior) Q1 Q2 Q3
(Límite Superior)
Datos B
Media = 15.5
11 12 13 14 15 16 17 18 19 20 21 s = 0.9258
Datos C
Media = 15.5
11 12 13 14 15 16 17 18 19 20 21 s = 4.57
3-75
Variación
Varianza
Muestral Desviación
Estándar
Muestral
Variación
Intercuartílico σ2 i1
σ σ2
N
RI Q3 Q1 Varianza
Muestral Desviación
Estándar
n Muestral
i
(x x ) 2
s s2
s 2 i 1
n -1
Variación
Valor pequeño
Menos variación
Valor grande
Más variación
Mismo centro,
diferente variación
3-78
Medidas de Variación
El presidente de la corporación solicita al gerente de producción información sobre la
producción de los últimos 5 días de las plantas A y B. Se registran los siguientes
resultados:
A 15 25 35 20 30
B 23 26 25 24 27
Media Mediana
A 3-79 25 25
B 25 25
Cuantiles y Medidas de
tendencia central y
dispersión
Datos agrupados
Medidas y desviación para datos agrupados
K
Media
Y i fi Varianza K
i
(Y y ) 2
fi
y i 1
s2 i 1
n n -1
Yi = i-ésima marca de
clase
Coeficiente de Variación
σ s
CV
μ
100% CV
x 100%
3-82
Comparación de Coeficientes de
Variación
Acción A:
Precio promedio del año pasado = $50
Desviación estándar = $5
s $5
CVA * 100% * 100% 10%
x $50 Ambas acciones tienen
la misma desviación
estándar, pero la
Acción B: Acción B es menos
variable relativo a su
Precio promedio del año pasado = $100 precio
Desviación estándar
s = $5 $5
CVB * 100% * 100% 5%
x $100
3-83
Coeficiente de variación
Deberes
1,-Ejercicios Propuestos
1,1 primera muestra 1,53
1,3,1,4 1,5, 1,6 1,54
1,17 1,55
1,24 1,56
1,41
3-87
Valores Estandarizados Poblacionales
x μ
z
σ
Donde:
x = valor original del dato
μ = media poblacional
σ = desviación estándar poblacional
z = valor estandarizado
3-88
Valores Estandarizados Muestrales
xx
z
s
Donde:
x = valor original del dato
x = media muestral
s = desviación estándar muestral
z = valor estandarizado
(número de desviaciones estándar en que x difiere de x )
3-89
Valor Estandarizado: Ejemplo
3-90
Regla Empírica
Si la distribución de los datos tiene forma de campana,
entonces el intervalo ( μ 1σ ) contiene alrededor del 68%
de los valores de la población:
68%
μ
μ 1σ
La media y la mediana son iguales
3-91
Regla Empírica
contiene alrededor del 95% de los
μ 2σ
valores de la población
95% 99.7%
μ 2σ μ 3σ
3-92
Teorema de Chebyshev
Sin considerar como esten distribuidos los datos, al menos (1 -
1/k2) de los valores caerán dentro del intervalo μ ± kσ
Ejemplos:
Al menos Dentro
3-93
Valores Estandarizados
3-94
Matriz de covarianzas y
correlación
Covarianzas y Correlación
Coeficiente de correlación
Indicador de relaciones lineales entre dos variables X y Y de una misma muestra
( x x )( y y ) ( x x )( y y ) rxy
s xy
rxy n 1
[ ( x x ) ][ ( y y ) ]
2 2 r sx s y
( x x ) 2
( y y ) 2
n 1 n 1
Características de r
x
x
y
y
x
x
Coeficiente de Correlación
Estatura Peso
Matriz de covarianzas y Correlación
Matrices de datos,
covarianzas
** Revisar el apartado de vectores de medias y Matriz de varianzas y
covarianzas pg 40-43
MATRIZ DE VARIANZAS Y COVARIANZAS
MATRIZ DE CORRELACIÓN
Es una representación ordenada de los coeficientes de correlación de cada
variable con otra variable y consigo misma
Series temporales
1-104
Serie de tiempo
Medición de una variable aleatoria X, con igual esparcimiento en el tiempo t
durante un periodo finito T o lapso abierto.
Distribución de Frecuencias
Ejemplo
Género – Preferencia de marca de Cola
*Observacione
s de los debers
Métodos de Enumeración,
función de probabilidades y
Eventos.
Objetivo cuantificar las incertidumbres relacionadas a los eventos.
Nociones básicas
Experimento
Experimento Estadístico
Conjunto de
acciones para Experimento que cumple:
conseguir
algún tipo de Se conoce todos los resultados
observación o posibles antes de realizar el
medida experimento
Espacio muestral
Eventos
Nociones básicas
Experimento Estadístico
Espacio muestral
Nociones básicas
Identificación de los elementos de un experimento.
Experimento Estadístico
Eventos
Espacio de eventos
𝑷: ℓ → 𝟎 , 𝟏 Si y solamente si:
𝑃 𝛺 =1
0 ≤ 𝑃 𝐸 ≤ 1 ∀E∊ ℓ
𝑃 𝐸1 𝑈𝐸2 = 𝑃 𝐸1 + 𝑃 𝐸2 𝑠iempre que 𝐸1 ∩ 𝐸2 = Ø
Si P es una función de probabilidad tenemos los siguiente teoremas
𝑷 𝑬 = 1 − 𝑃 𝐸𝐶
𝑷 𝜴 =1 y 𝑷(Ø) = 0
𝐸1 ∩ 𝐸2 𝑷 𝐸2 ∩ 𝐸1 𝐶 = 𝑃 𝐸2 - 𝑃 𝐸1 ∩ 𝐸2
𝐸1 𝐸2
𝑷 𝑬𝟏 𝑼𝑬𝟐 = 𝑃 𝐸1 + 𝑃 𝐸2 - 𝑃 𝐸1 ∩ 𝐸2
𝑷 𝑬𝟏 𝑼𝑬𝟐 ≤ 𝑃 𝐸1 + 𝑃 𝐸2
𝜴
Ejercicio,-
Actividad – En clases
El docente seleccionará n-grupos para exponer y decidirá que subtema expondrá
cada miembro de forma aleatoria
RÚBRICA HOLÍSTICA
LECCIÓN 2
𝜴= 1,2,3,4,5,6
E= 𝑁ú𝑚𝑒𝑟𝑜 𝑚𝑎𝑦𝑜𝑟𝑒𝑠 𝑞𝑢𝑒 4 = 5,6
𝑁 𝐸 2 1
𝑷 𝑬 = = =
𝑁(Ω) 6 3
Así como determinar alguna medida para espacios muestrales continuos – infinitos
¿ Cuál es la probabilidad que el dardo caiga en la corona
circular interior ?
𝜴= 2 2
𝑥, 𝑦 ∈ 𝑅 𝑥 + 𝑦 ≤ 1 2
Regla de la multiplicación
Permutación
Combinación
Regla de la multiplicación
Sea 𝐸1 𝑦 𝐸2 𝑑𝑜𝑠 𝑒𝑣𝑒𝑛𝑡𝑜𝑠 𝑐𝑎𝑑𝑎 𝑢𝑛𝑜 𝑐𝑜𝑛 𝑐𝑎𝑟𝑑𝑖𝑛𝑎𝑙𝑖𝑑𝑎𝑑 𝑛1 𝑦 𝑛2 el número de opciones posibles a elegir es igual a
𝑛1 ∗ 𝑛2
Regla de la multiplicación
Terminal
Combinación
El número de muestras de tamaño n, de un conjunto N
El orden no es relevante
N=
Combinación
𝑁 𝑁!
Resultados posibles
de tomar muestras =
n=2 𝑛 𝑁 − 𝑛 ! 𝑛!
Permutación
El número de muestras de tamaño n, de un conjunto N
El orden SI es relevante
N= a; b; c; d;
PERMUTACIONES
𝑁 𝑁 𝑁!
Permutaciones 𝑃𝑛 = 𝑛! =
posibles de 𝑛 𝑁−𝑛 !
muestras
n=2
El coeficiente Multinomial
Tenemos 6 Estaciones: 2HP, 2 IBM 2 Aple, de cuantas maneras se
puede ubicar las 6 estaciones en uno de los salones del laboratorio
Combinaciones
Distinguibles
𝑁 𝑁!
=
𝑛1 , 𝑛2 . . 𝑛𝑘 𝑛1 ! 𝑛2 !. . 𝑛𝑘!
Técnicas de Conteo
En un grupo de 15 personas, 7 leen la revista A, 5 leen la revista B y 6 ninguna revista.
a) ¿Cuál es la probabilidad que al elegir al azar una persona, ésta lea al menos una revista?
b) La probabilidad que al elegir al azar 3 personas, 2 lean ambas revistas y una no lea revistas.
Probabilidad Condicional
Sin reponer
“Probabilidad de que ocurra 𝑬𝟐 dado que ya ocurrió 𝑬𝟏 ”
Dado un experimento Estadístico, consideremos dos eventos uno 𝑬𝟏 y otro 𝑬𝟐 , tales que el primero
ha ocurrido mientras que el segundo, 𝑬𝟐 , está por ocurrir.
La probabilidad de que ocurra 𝑬𝟐 dado que ha ocurrido 𝑬𝟏 se define como:
𝑃 𝑬𝟏 ∩ 𝑬𝟐
𝑃 𝑬𝟐 ⃓𝑬𝟏 =
𝑃 𝑬𝟏
Probabilidad Condicional
Sin reponer
“Probabilidad de que ocurra 𝑬𝟐 dado que ya ocurrió 𝑬𝟏 ”
𝑬𝟏 =
𝐸1 ∩ 𝐸2
𝐸1 𝐸2 𝑬𝟐 =
𝜴
Probabilidad Condicional
Si la probabilidad de que un sistema de comunicación tenga alta fidelidad es 0,8 y la
probabilidad de que tenga alta fidelidad y alta selectividad es 0,18 ¿Cuál es la
probabilidad de que un sistema con alta fidelidad tenga también alta selectividad¡?
Eventos independientes
“Probabilidad de que ocurra
𝑬𝟏 𝒚 𝑬𝟐 𝐞𝐬 𝐢𝐠𝐮𝐚𝐥 𝐚 𝐥𝐚 𝐦𝐮𝐥𝐭𝐢𝐩𝐥𝐢𝐜𝐚𝐜𝐢𝐨𝐧 𝐝𝐞 𝐬𝐮𝐬 𝐩𝐫𝐨𝐛𝐚𝐛𝐢𝐥𝐢𝐝𝐚𝐝𝐞𝐬 𝑃 𝑬𝟏 *𝑃 𝑬𝟐 ”
𝑃 𝑬𝟏 ∩ 𝑬𝟐
𝑃 𝑬𝟐 ⃓𝑬𝟏 =
𝑃 𝑬𝟏
Eventos independientes
Se lanzan dos monedas, 𝑬𝟏 : 𝒔𝒂𝒍𝒆 𝒄𝒂𝒓𝒂 𝒆𝒏 𝒆𝒍 𝒑𝒓𝒊𝒎𝒆𝒓 𝒍𝒂𝒏𝒛𝒂𝒎𝒊𝒆𝒏𝒕𝒐 y
𝑬𝟐 ; 𝒔𝒂𝒍𝒆 𝒄𝒂𝒓𝒂 𝒆𝒏 𝒆𝒍 𝒔𝒆𝒈𝒖𝒏𝒅𝒐 𝒍𝒂𝒏𝒛𝒂𝒎𝒊𝒆𝒏𝒕𝒐 y
𝑬𝟑 : 𝒆𝒍 𝒍𝒂𝒅𝒐 𝒒𝒖𝒆 𝒔𝒂𝒍𝒆 𝒆𝒏 𝒆𝒍 𝒑𝒓𝒊𝒎𝒆𝒓 𝒍𝒂𝒏𝒛𝒂𝒎𝒊𝒆𝒏𝒕𝒐 𝒆𝒔 𝒆𝒍 𝒎𝒊𝒔𝒎𝒐 𝒒𝒖𝒆 𝒆𝒍 𝒍𝒂𝒅𝒐 𝒒𝒖𝒆 𝒔𝒂𝒍𝒆 𝒆𝒏 𝒆𝒍 𝒔𝒆𝒈𝒖𝒏𝒅𝒐 𝒍𝒂𝒏𝒛𝒂𝒎𝒊𝒆𝒏𝒕
Son estos tres eventos estocásticamente independientes ?
B, en términos de intersección de A y B
𝑩={ }
𝑃 𝑩 =
Teorema de Probabilidad Total
𝑃 𝑩 = 𝑃 𝑩/𝑨𝒊 𝑃 𝑨𝒊
𝑖=1
Teorema de Probabilidad Total
En una planta de ensamblado recibe sus reguladores de voltaje de tres diferentes proveedores: 60%
del proveedor IBM, 30% XYZ Y 10% de Doll. Si 95% de los reguladores de voltaje que provienen de IBM,
80% de los reguladores del proveedor XYZy el 65% de los reguladores proporcionados por Doll tienen
un rendimiento de acuerdo con las especificaciones, nos gustaría saber la probabilidad de que
cualquier regulador de voltaje recibido por la planta dé un rendimiento según las especificaciones.
Teorema de Bayes
𝑘
Es espacio muestral es particionado en k, eventos 𝐴𝐼 = Ω
Los k-eventos son Exhaustivos 𝑖=1
𝑃 𝑩 ∩ 𝑨𝒊
𝑃 𝑨𝒊 ⃓𝐵 =
𝑃 𝑩
Teorema de Bayes
Teorema de Probabilidad Total
𝑛
𝑃 𝑩 = 𝑃 𝑩/𝑨𝒊 𝑃 𝑨𝒊
𝑖=1
Teorema de Bayes
𝑃 𝑩∩𝑨𝒊 𝑃 𝑩/𝑨𝒊 𝑃 𝑨𝒊
𝑃 𝑨𝒊 /𝑩 = =
𝑃 𝑩 𝑛
𝑖=1 𝑃 𝑩/𝑨𝒊 𝑃 𝑨𝒊
Probabilidad a
Posteriori Probabilidad a Priori
Teorema de Bayes
Considerando el problema anterior, Suponga que queremos conocer la probabilidad de
que un regulador de voltaje específico, cuyo rendimiento corresponde a las
especificaciones, provenga del proveedor Doll
Teorema de Bayes
Los cuatro ayudantes de un gasolinera deben limpiar el parabrisas de los autos de los clientes, Juan
quien atiende el 20% de todos los autos, no cumple su cometido una vez cada 20 autos; Tomás
quien atiende el 60% de los autos, no limpia el parabrisas una vez cada 10 autos; Jorge quien
atiende al 15% de ellos no cumple su cometido una vez cada 10 autos; y Pedro quien atiende a solo
el 5% de los autos, no limpia el parabrisas una vez cada 20 autos, Si un cliente se queja de que su
parabrisas no fue lavado