Beruflich Dokumente
Kultur Dokumente
ESTADISTIA
Estudiante:
Espinoza Espinosa Felipe De Jesus
Profesor:
Juan Ramírez Reyes
Probabilidad y estadistica
› Manejo de la información
› Medidas de tendencia central
› Medidas de dispersión
› Medidas de forma
› Medidas de correlación
› Teoría de conjuntos
› Técnicas de conteo
› Probabilidad para eventos
Manejo de la información
• Elementos básicos
• Frecuencia
• Distribución de frecuencias
• Representación grafica e
interpretación
Elementos Básicos
› La investigación cuya finalidad es: el análisis o
experimentación de situaciones para el descubrimiento de
nuevos hechos, la revisión o establecimiento de teorías y
las aplicaciones prácticas de las mismas, se basa en los
principios de observación y razonamiento donde se
necesita, en su carácter científico, el análisis técnico de
Datos para obtener de ellos información confiable y
oportuna.
Muestreo (elemento básico)
› El muestreo es por lo tanto una herramienta de la
investigación científica, cuya función básica es determinar
que parte de una población debe examinarse, con la
finalidad de hacer inferencias sobre dicha población. La
muestra debe lograr una representación adecuada de la
población, en la que se reproduzca de la mejor manera los
rasgos esenciales de dicha población que son importantes
para la investigación. Para que una muestra sea
representativa, y por lo tanto útil, debe de reflejar las
similitudes y diferencias encontradas en la población, es
decir ejemplificar las características de ésta.
Frecuencia
› La frecuencia es el número de veces que el valor de una variable se repite.
Se distinguen dos tipos principales de frecuencia: relativa y absoluta.
› Frecuencia de clase: Es el numero de mediciones que se pueden agrupar en
una clase en una tabla o distribución de frecuencia
› Clase: Es un intervalo o subconjunto de una escala que se utiliza para
comparar mediciones o características que pertenecen a un elemento
muestral y determinar cuales por su magnitud o cualidad le pertenece
› Frecuencia relativa: Es el resultado de la división entre el valor de la
frecuencia absoluta (ni) y el tamaño de la muestra (N). Se suele representar
de esta forma: fi . Puede aparecer de forma decimal, como fracción o como
un porcentaje.
› Frecuencia relativa acumulada: Es la suma de la frecuencia relativa de todas
las clases anteriores a la clase
Distribución de frecuencias
Una distribución de frecuencias o tabla de
frecuencias es una ordenación en forma de tabla de
los datos estadísticos, asignando a
cada dato su frecuencia correspondiente.
Tipos de frecuencias
› Frecuencia absoluta
› Amplitud de la clase
La amplitud de la clase es la diferencia entre el límite
superior e inferior de la clase.
› Marca de clase
La marca de clase es el punto medio de cada intervalo y es
el valor que representa a todo el intervalo para el cálculo de
algunos parámetros.
Representación grafica e interpretación
› Gráfico o diagrama de barras
› Media
› Mediana
› Moda
› Cuantiles
Media
En matemáticas y estadística, la media aritmética, también llamada
promedio o media, de un conjunto infinito de números es el valor
característico de una serie de datos cuantitativos, objeto de estudio
que parte del principio de la esperanza matemática o valor esperado,
se obtiene a partir de la suma de todos sus valores dividida entre el
número de sumandos.
Hay una relación de orden de las medias obtenidas de una misma
colección de valores H ≤ G ≤ A ≤ Q, donde H es la media armónica; G,
la media geométrica; A, la media aritmética; Q, la media cuadrática.
La media aritmética es el valor obtenido por la suma de todos sus
valores dividida entre el número de sumadores. Se le llama también
promedio o, simplemente, media.
𝑛
1 𝑥1 + 𝑥2 + ⋯ + 𝑥𝑛
𝑥ҧ = 𝑥𝑖 =
𝑛 𝑛
𝑖=1
Se utiliza la letra x con una barra horizontal sobre el símbolo para
representar la media de una muestra, mientras que la letra µ (mu) se
usa para la media aritmética de una población, es decir, el valor
esperado de una variable.
Se interpreta como "punto de equilibrio" o "centro de masas" del
conjunto de datos, ya que tiene la propiedad de equilibrar las
desviaciones de los datos respecto de su propio valor
La media geométrica de una cantidad arbitraria de números (por
decir n números) es la raíz n-ésima del producto de todos los
números; es recomendada para datos de progresión geométrica, para
promediar razones, interés compuesto y números índices.
𝑛
𝑛
𝑛
𝐺= ෑ 𝑥𝑖 = 𝑥1 ∗ 𝑥2 … 𝑥𝑛
𝑖=1
2
𝑥12 +𝑥22 +⋯+𝑥𝑁
› 𝑥𝑅𝑀𝑆 =
𝑁
1 𝑇2
› 𝑥𝑟𝑚𝑠 = [𝑓(𝑡)] 2 𝑑𝑡
𝑇2 −𝑇1 𝑇1
Mediana
› 𝑀𝑒 = 𝑥(𝑛+1)
2
𝑥𝑛 +𝑥𝑛
2 +1
› 𝑀𝑒 = 2
2
Método de cálculo general
𝑁𝑀
− 𝑁𝑖−1
𝑀𝑒 = 𝑥𝑖1 + 2 ∗ (𝑥𝑖2 − 𝑥𝑖1 )
𝑓𝑖
Donde
𝑥𝑖1 Es el límite inferior de la clase de la mediana.
𝑁𝑀
› 2
Es la posición de la mediana.
457.5
𝑥ҧ = = 21.786
21
Desviación Estándar
La desviación estándar es la medida de dispersión más común,
que indica qué tan dispersos están los datos con respecto a la
media. Mientras mayor sea la desviación estándar, mayor será la
dispersión de los datos.
El símbolo σ (sigma) se utiliza frecuentemente para representar
la desviación estándar de una población, mientras que s se
utiliza para representar la desviación estándar de una muestra.
La variación que es aleatoria o natural de un proceso se conoce
comúnmente como ruido.
La desviación estándar se puede utilizar para establecer un valor
de referencia para estimar la variación general de un proceso.
La desviación estándar (o desviación típica) es una medida de
dispersión para variables de razón (ratio o cociente) y de intervalo, de
gran utilidad en la estadística descriptiva. Es una medida (cuadrática)
de lo que se apartan los datos de su media, y por tanto, se mide en las
mismas unidades que la variable.
Para conocer con detalle un conjunto de datos, no basta con conocer
las medidas de tendencia central, sino que necesitamos conocer
también la desviación que representan los datos en su distribución, con
objeto de tener una visión de los mismos más acorde con la realidad a
la hora de describirlos e interpretarlos para la toma de decisiones.
fue descubierta e interpretada por el británico William Sealy Gosset
Ejemplos:
Paso 1: calcular la media.
Paso 2: calcular el cuadrado de la distancia a la media para cada
dato.
Paso 3: sumar los valores que resultaron del paso 2.
Paso 4: dividir entre el número de datos.
Paso 5: sacar la raíz cuadrada.
= media aritmética.
Md = Mediana.
S = desviación típica
Apuntamiento o curtosis:
La curtosis (también conocida como medida de apuntamiento) es una medida
estadística, que determina el grado de concentración que presentan los valores
de una variable alrededor de la zona central de la distribución de frecuencias.
Existen algunas variables que presentan un mayor grado de concentración
(menor dispersión) de los valores en torno a su media y otras, por el contrario,
presentan un menor grado de concentración (mayor dispersión) de sus valores
en torno a su valor central. Por tanto, la curtosis nos informa de lo apuntada
(mayor concentración) o lo achatada (menor concentración) que es una
distribución.
Dependiendo del grado de curtosis, tenemos tres tipos de distribuciones:
1. Leptocúrtica: Existe una gran concentración de los valores en torno a su
media (g2>3)
› Nos permite formar un conjunto con todos los elementos del conjunto
de referencia o universal, que no están en el conjunto.
› El complemento de un conjunto se denota con un apostrofe sobre el
conjunto que se opera, A‘, en donde el conjunto A es el conjunto del
cual se hace la operación de complemento.
› Dado el conjunto Universal U={1,2,3,4,5,6,7,8,9} y el conjunto
A={1,2,9}, el conjunto A' estará formado por los siguientes elementos
A'={3,4,5,6,7,8}.
DIAGRAMA DE VENN
Teoría de Conjuntos
https://es.slideshare.net/anacely/probabilidad-diagramas-de-venn
http://probyestjevp.blogspot.com/2008/10/diagrama-de-venn.html
DEFINICIÓN
› Estos diagramas se usan para mostrar gráficamente la
agrupación de cosas elementos en conjuntos,
representando cada conjunto mediante un círculo o un
óvalo. La posición relativa en el plano de tales círculos
muestra la relación entre los conjuntos
VOCABULARIO
› Universo:
– La totalidad de datos o sucesos.
– Se representa con un cuadrado o rectángulo.
› Conjuntos:
– O cualidades, se representan por círculos u óvalos.
– Son datos agrupados por alguna característica.
EVENTOS
› En la figura vemos que:
– A ∩ B = regiones 1 y 2
– B ∩ C = regiones 1 y 3
– A U C = regiones 1, 2, 3, 4, 5 y 7
– B' ∩ A = regiones 4 y 7
– A ∩ B ∩ C = región 1
– (A U B) ∩ C' = regiones 2, 6 y 7
EJEMPLOS
› Una Escuela tiene maestros que › EXPLICACIÓN
enseñan en mas de un grado. El – Al colocar las cantidades de
total de maestros es 20. Siete cada conjunto le restamos las
enseñan en 7mo grado, ocho intersecciones. En este caso
enseñan en 8vo grado y 2 enseñan tanto a 7mo como a 8vo hay
en 7mo y 8vo. Haz un diagrama que que restarle 2. Así obtenemos
muestre cuántos maestros quedan que solamente 7mo es 5 y
solamente 8vo es 6. Para
en el universo que no enseñan ni en saber cuantos del universo
7mo ni en 8vo grado. quedan fuera de esos dos
conjuntos restamos todos los
elementos contenidos en ellos
. De ahí surge 7 como el
restante.
Técnicas De Conteo
• Elementos Básicos
• Diagramas De Árbol
• Principio De La Suma Y La Multiplicación
• Permutación Y Combinación
Elementos Básicos
› Conceptos de Estadística
› Población: Una población es el conjunto de todos los elementos a los que se
somete a un estudio estadístico.
› Individuo: Un individuo o unidad estadística es cada uno de los elementos que
componen la población.
› Muestra: Una muestra es un conjunto representativo de la población de
referencia, el número de individuos de una muestra es menor que el de la
población.
› Muestreo: El muestreo es la reunión de datos que se desea estudiar, obtenidos de
una proporción reducida y representativa de la población.
› Valor: Un valor es cada uno de los distintos resultados que se pueden obtener en
un estudio estadístico. Si lanzamos una moneda al aire 5 veces obtenemos dos
valores: cara y cruz.
› Dato: Un dato es cada uno de los valores que se ha obtenido al realizar un estudio
estadístico. Si lanzamos una moneda al aire 5 veces obtenemos 5 datos: cara,
cara, cruz, cara, cruz.
› Definición de variable: Una variable estadística es cada una de las
características o cualidades que poseen los individuos de una población
Diagrama de Árbol
› Los diagramas en árbol son especialmente útiles para
resolver problemas con experimentos compuestos, es
decir, aquellos donde realizamos más de un experimento
aleatorio. Algunos ejemplos de experimentos compuestos
son: tirar dos monedas al aire, y mirar si salen dos caras,
contar si hay dos mujeres de entre tres hijos, sacar dos
bolas de una urna, y mirar si hay una roja y una azul.
Ejemplo
Principios de suma y la
multiplicación
Principio de la suma
› Supongamos que un suceso E1 puede ocurrir de “m”
maneras y el segundo suceso
E2 puede ocurrir de “n” maneras, y supongamos que
ambos sucesos no pueden ocurrir simultáneamente.
Entonces E1 o E2 puede ocurrir de (m + n) maneras.
› Este principio se puede extender a tres o más sucesos.
Recordando el lema de teoría de conjuntos que dice.
Supónganos que A y B son conjuntos distintos.
Entonces n(A B) = n(A) + n(B), este también es principio
de las suma.
Principio de la multiplicación
Supongamos que un suceso E1 puede ocurrir de “m”
maneras y el segundo suceso E2 puede ocurrir de “n”
maneras, (sucesos independientes). Entonces las
combinaciones de E1 y de E2 pueden ocurrir de (m) (n)
maneras.
Determina:
› a) ¿Cuántas opciones puedes escoger uno de los
cursos?
› b) ¿De cuántas maneras distintas puedes escoger un
curso de cada materia?
Solución:
› a) n = 3 + 4 + 2 = 9 (son 9 maneras)
› b) n = (3)(4)(2) = 24 (son 24 maneras)
Combinaciones y
permutaciones
P (B)
P (B / A) = P (A / B) ·
P (A)
(Teorema de Bayes)
Ejemplos:
Una mujer es portadora de la enfermedad de Duchenne ¿Cuál es la probabilidad de
que su próximo hijo tenga la enfermedad?
Según las leyes de Mendel, todos los posibles genotipos de un hijo de una madre
portadora (xX) y un padre normal (XY) son xX, xY, XX, XY y tienen la misma
probabilidad. El espacio muestral es W = {xX, xY, XX, XY}
el suceso A={hijo enfermo} corresponde al genotipo xY, por tanto, según la definición
clásica de probabilidad
p (A) = 1/4 = 0,25
La mujer tiene el hijo y es varón ¿qué probabilidad hay de que tenga la enfermedad?
Se define el suceso B = {ser varón} = {xY, XY}
la probabilidad pedida es p(A | B) y aplicando la definición anterior
p (B) = 0,5; A Ç B = {xY}; p(A Ç B) = 0,25; p(A | B) = 0,25/0,5 = 0,5
Si sabemos que es varón, el espacio muestral ha cambiado, ahora es B. Por lo tanto
se puede calcular p(A|B) aplicando la definición clásica de probabilidad al nuevo
espacio muestral
p(A|B) = 1/2 = 0,5
Consideremos una población en la que cada individuo es clasificado según dos
criterios: es o no portador de HIV y pertenece o no a cierto grupo de riesgo que
denominaremos R. La correspondiente tabla de probabilidades es:
En esta población, la probabilidad de que un individuo sea portador es P (A)
=0.006 y la probabilidad de que sea portador y pertenezca al grupo de riesgo R
es P (A ∩ B) =0.003.
Dado que una persona seleccionada al azar pertenece al grupo de riesgo R,
¿cuál es la probabilidad de que sea portador?
P (A ∩B) 0.003
P (A | B) = P (B) =0.020 =0.150
es decir que 150 de cada 1000 individuos del grupo de riesgo R, son
“probablemente” portadores de HIV.
Calculemos ahora la probabilidad de que una persona sea portadora de HIV,
dado que no pertenece al grupo de riesgo R.
P (A ∩ Bꜥ) 0.003
P (A | Bꜥ) = P (Bꜥ) =0.980 =0.00306
es decir que sólo 3 de cada 1000 individuos no pertenecientes al grupo de riesgo
R, son “posibles” portadores de HIV.
EVENTOS INDEPENDIENTES
Eventos dependientes:
Dos o más eventos serán dependientes cuando la ocurrencia o no
ocurrencia de uno de ellos afecta la probabilidad de ocurrencia del
otro. Cuando tenemos este caso, empleamos entonces, el concepto
de probabilidad del evento relacionado. La expresión P (A / B) indica la
probabilidad de ocurrencia del evento A si el evento B ya ocurrió.
Tamaño del espacio del evento
Probabilidad de que un evento ocurra =
Tamaño del espacio muestral
› Ejemplos:
Existen 6 resultados posibles para el primer tiro, y para cada uno de ellos, hay 6
resultados posibles para el segundo tiro. Hay 6 • 6, o 36, resultados posibles:
Espacio muestral: {(1,1), (1,2), (1,3), (1,4), (1,5), (1,6), (2,1), (2,2), (2,3), (2,4),
(2,5), (2,6), (3,1), (3,2), (3,3), (3,4), (3,5), (3,6), (4,1), (4,2), (4,3), (4,4), (4,5),
(4,6), (5,1), (5,2), (5,3), (5,4), (5,5), (5,6), (6,1), (6,2), (6,3), (6,4), (6,5), (6,6)}
El espacio muestral consiste en todos los resultados para los cuales el
primero tiro no fue 6, y el segundo tiro fue 6. Para el primer
lanzamiento existían 5 resultados posibles que no son 6. Para cada
uno de ellos, existía sólo un posible resultado que era 6. Entonces hay
5 • 1 o 5 resultados en el espacio de eventos:
Maneras de aplicación
¿Qué es?
› El teorema de Bayes es utilizado › Donde B es el suceso sobre el
para calcular la probabilidad de un que tenemos información previa
suceso, teniendo información de y A(n) son los distintos sucesos
antemano sobre ese suceso. condicionados, numerador
tenemos la probabilidad
Podemos calcular la probabilidad de condicionada y en la parte de
Un suceso, sabiendo además que abajo la probabilidad total.
ese A cumple cierta característica
que condiciona su probabilidad.
Selecciones al azar con o
sin reemplazo
Con Reemplazo
Con reemplazo se refiere a que tomas una muestra de un
conjunto reemplazandola por otra o volviéndola a regresar
› EJEMPLO: Supon que tienes un bolsa con 10 pelotas 3 rojas 3
negras y 4 blancas, tu tomas una pelota y dependiendo de lo que
busques tienes un 30% de sacar una negra 30% de una roja y 40%
de una blanca la devuelves la pelota y sacas otra, como es CON
REEMPLAZO tu estas regresando la pelota y la probabilidad no se
ve afectada .
Sin Reemplazo
Sin reemplazo se refiere a que después de tomar una
muestra no la devuelves y la apartas del conjunto de donde
la tomaste.
› Ejemplo: En el mismo ejemplo tu sacas una pelota y tienes 30% de
roja y negra y 40% de una blanca, en este caso después de sacar la
pelota la apartas y dependiendo del color puedes ver que ya no
tienes 10 si no 9 por lo tanto la probabilidad va disminuyendo .