Probabilidad y Estadistia

PROBABILIDAD Y
ESTADISTIA
Estudiante:
Espinoza Espinosa Felipe De Jesus
Profesor:
Juan Ramírez Reyes
Probabilidad y estadistica
› Manejo de la información
› Medidas de tendencia central
› Medidas de dispersión
› Medidas de forma
› Medidas de correlación
› Teoría de conjuntos
› Técnicas de conteo
› Probabilidad para eventos
Manejo de la información
• Elementos básicos
• Frecuencia
• Distribución de frecuencias
• Representación grafica e
interpretación
Elementos Básicos
› La investigación cuya finalidad es: el análisis o
experimentación de situaciones para el descubrimiento de
nuevos hechos, la revisión o establecimiento de teorías y
las aplicaciones prácticas de las mismas, se basa en los
principios de observación y razonamiento donde se
necesita, en su carácter científico, el análisis técnico de
Datos para obtener de ellos información confiable y
oportuna.
Muestreo (elemento básico)
› El muestreo es por lo tanto una herramienta de la
investigación científica, cuya función básica es determinar
que parte de una población debe examinarse, con la
finalidad de hacer inferencias sobre dicha población. La
muestra debe lograr una representación adecuada de la
población, en la que se reproduzca de la mejor manera los
rasgos esenciales de dicha población que son importantes
para la investigación. Para que una muestra sea
representativa, y por lo tanto útil, debe de reflejar las
similitudes y diferencias encontradas en la población, es
decir ejemplificar las características de ésta.
Frecuencia
› La frecuencia es el número de veces que el valor de una variable se repite.
Se distinguen dos tipos principales de frecuencia: relativa y absoluta.
› Frecuencia de clase: Es el numero de mediciones que se pueden agrupar en
una clase en una tabla o distribución de frecuencia
› Clase: Es un intervalo o subconjunto de una escala que se utiliza para
comparar mediciones o características que pertenecen a un elemento
muestral y determinar cuales por su magnitud o cualidad le pertenece
› Frecuencia relativa: Es el resultado de la división entre el valor de la
frecuencia absoluta (ni) y el tamaño de la muestra (N). Se suele representar
de esta forma: fi . Puede aparecer de forma decimal, como fracción o como
un porcentaje.
› Frecuencia relativa acumulada: Es la suma de la frecuencia relativa de todas
las clases anteriores a la clase
Distribución de frecuencias
Una distribución de frecuencias o tabla de
frecuencias es una ordenación en forma de tabla de
los datos estadísticos, asignando a
cada dato su frecuencia correspondiente.
Tipos de frecuencias
› Frecuencia absoluta
› La frecuencia absoluta es el número de veces que aparece un

determinado valor en un estudio estadístico.
Se representa por fi.
› La suma de las frecuencias absolutas es igual al número total de

datos, que se representa por N.
› Para indicar resumidamente estas sumas se utiliza la letra griega Σ

(sigma mayúscula) que se lee suma o sumatoria.
Frecuencia acumulada
› La frecuencia acumulada es la suma de las frecuencias

absolutas de todos los valores inferiores o
iguales al valor considerado.
Se representa por Fi.
Frecuencia relativa acumulada
› La frecuencia relativa acumulada es el cociente entre

la frecuencia acumulada de un determinado valor y
el número total de datos. Se puede expresar en tantos
por ciento.
Ejemplo
Durante el mes de julio, en una ciudad se han registrado las
siguientes temperaturas máximas:
› 32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32,
31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29,
29.
› En la primera columna de la tabla colocamos la variable
ordenada de menor a mayor, en la segunda hacemos el
recuento y en la tercera anotamos la frecuencia absoluta.
Nota :
Este tipo de tablas de frecuencias se utiliza con variables discretas.
Distribución de frecuencias agrupadas
› La distribución de frecuencias agrupadas o tabla con

datos agrupados se emplea si las variables toman
un número grande de valores o la variable es continua.
Se agrupan los valores en intervalos que tengan la misma

amplitud denominados clases. A cada clase se le asigna
su frecuencia correspondiente.
› Límites de la clase
Cada clase está delimitada por el límite inferior de la clase y
el límite superior de la clase.
› Amplitud de la clase
La amplitud de la clase es la diferencia entre el límite
superior e inferior de la clase.
› Marca de clase
La marca de clase es el punto medio de cada intervalo y es
el valor que representa a todo el intervalo para el cálculo de
algunos parámetros.
Representación grafica e interpretación
› Gráfico o diagrama de barras
› El diagrama de barras se utiliza generalmente para datos

cualitativos, pero también para variables discretas. El valor que
representa cada barra se puede incluir opcionalmente.
› Por ejemplo, en el siguiente gráfico se muestra el promedio

general obtenido por cinco grupos de cuarto semestre, en
una evaluación parcial, se observa que son datos
cualitativos y se ha elegido realizar un diagrama de barras,
sobre las barras se ha colocado el valor que representa cada
una de ellas, pero hay que considerar que esto es opcional,
puede llevarla o no, depende del criterio de cada persona, o
bien, del impacto que desea lograr en el público a quien va
dirigido el gráfico.
Histograma o histograma de frecuencias.
› Consiste en una representación utilizando rectángulos con
las siguientes características: bases en el eje horizontal
(eje x), centros en las marcas de clase y de altura
proporcional a las frecuencias de clase.
› El histograma se suele utilizar principalmente paradato
s agrupados y para variables continuas.
Polígono de Frecuencias o diagrama de
frecuencia de puntos.
› Un polígono de frecuencias es un gráfico de trozos

de la frecuencia de clase con relación a la marca de
clase. Puede obtenerse conectando los puntos medios
de las partes superiores de los rectángulos del
histograma. Este tipo de gráfico se utiliza
generalmente para variables continuas, pero también para
datos agrupados.
Gráfico circular o diagrama de pastel.
› Como su nombre lo indica, es un gráfico circular, también
se les llama gráficas de 360%.
se utilizan generalmente para representar porcentajes
y proporciones. Se recomienda realizar el diagrama
de pastel si los tipos de datos son 5, 6 o más, y los
colores elegirlo.
› De acuerdo al tamaño de los datos, las frecuencias
mayores de color claro hasta terminar con las
frecuencias menores de color oscuro, o bien, alternar un
color caro y uno oscuro, esto para facilitar la
identificación en el gráfico.
Pictograma.
› Es un gráfico con dibujos alusivos a la información
que se está estudiando, y cuyo tamaño es proporcional
a la frecuencia que representan, generalmente se utilizan
para variables cualitativas, ya que no se acostumbra
indicar el valor que representa porque el tamaño del dibujo
indica la frecuencia.
Diagrama de árbol.
› Es una representación gráfica que organiza todos los
posibles resultados de un proceso
para facilitar su conteo. Para elaborar un diagrama de
árbol se inicia colocando una “rama” en forma de línea
para cada una de las posibilidades que resulten del
proceso que se está analizando, al final de cada “rama” se
colocan nuevas “ramas” de acuerdo a
las posibilidades de cada uno de los sucesos obtenid
os, y así sucesivamente.
Medidas De Tendencia Central
› Media
› Mediana
› Moda
› Cuantiles
Media
En matemáticas y estadística, la media aritmética, también llamada
promedio o media, de un conjunto infinito de números es el valor
característico de una serie de datos cuantitativos, objeto de estudio
que parte del principio de la esperanza matemática o valor esperado,
se obtiene a partir de la suma de todos sus valores dividida entre el
número de sumandos.
Hay una relación de orden de las medias obtenidas de una misma
colección de valores H ≤ G ≤ A ≤ Q, donde H es la media armónica; G,
la media geométrica; A, la media aritmética; Q, la media cuadrática.
La media aritmética es el valor obtenido por la suma de todos sus
valores dividida entre el número de sumadores. Se le llama también
promedio o, simplemente, media.
𝑛
1 𝑥1 + 𝑥2 + ⋯ + 𝑥𝑛
𝑥ҧ = ෍ 𝑥𝑖 =
𝑛 𝑛
𝑖=1
Se utiliza la letra x con una barra horizontal sobre el símbolo para
representar la media de una muestra, mientras que la letra µ (mu) se
usa para la media aritmética de una población, es decir, el valor
esperado de una variable.
Se interpreta como "punto de equilibrio" o "centro de masas" del
conjunto de datos, ya que tiene la propiedad de equilibrar las
desviaciones de los datos respecto de su propio valor
La media geométrica de una cantidad arbitraria de números (por
decir n números) es la raíz n-ésima del producto de todos los
números; es recomendada para datos de progresión geométrica, para
promediar razones, interés compuesto y números índices.
𝑛
𝑛
𝑛
𝐺= ෑ 𝑥𝑖 = 𝑥1 ∗ 𝑥2 … 𝑥𝑛
𝑖=1
Es menos sensible que la media aritmética a los valores extremos,

pero es de significado estadístico menos intuitivo que la media
aritmética.
La media armónica (designada usualmente mediante H) de una
cantidad finita de números es igual al recíproco, o inverso, de la media
aritmética de los recíprocos de dichos valores y es recomendada para
promediar velocidades.
𝑛 𝑛
›𝐻= 1 = 1 1
σ𝑛
𝑖=1𝑥1 +⋯+
𝑥1 𝑥𝑛
La inversa de la media armónica es la media aritmética de los inversos

de los valores de la variable.
En ciertos casos, es más representativa que la media aritmética, pero
tiene como desventaja la influencia de los valores pequeños y el
hecho de que no pueda ser determinada en distribuciones con valores
iguales a cero; por eso su empleo no es aconsejable en distribuciones
donde existan valores muy pequeños.
La media cuadrática o RMS es una medida estadística de la
magnitud de una cantidad variable. Puede calcularse para una serie
de valores discretos o para una función matemática de variable
continua. El nombre deriva del hecho de que es la raíz cuadrada de la
media aritmética de los cuadrados de los valores.
La media cuadrática para una colección de N valores de una variable
discreta viene dada por la fórmula:
2
𝑥12 +𝑥22 +⋯+𝑥𝑁
› 𝑥𝑅𝑀𝑆 =
𝑁
Para una función de variable continua viene dada por la expresión:
1 𝑇2
› 𝑥𝑟𝑚𝑠 = ‫׬‬ [𝑓(𝑡)] 2 𝑑𝑡
𝑇2 −𝑇1 𝑇1
Mediana
En el ámbito de la estadística, la mediana representa el valor de la

variable de posición central en un conjunto de datos ordenados.
Existen dos métodos para el cálculo de la mediana:
1. Considerando los datos en forma individual, sin agruparlos.
2. Utilizando los datos agrupados en intervalos de clase.
Sean {x1, x2,…,x3} los datos de una muestra ordenada en orden

creciente distinguimos dos casos:
a) Si n es impar, la mediana es el valor que ocupa la posición (n+1)/2
una vez que los datos han sido ordenados (en orden creciente o
decreciente), porque éste es el valor central. Entonces:
› 𝑀𝑒 = 𝑥(𝑛+1)
2
b) Si n es par, la mediana es la media aritmética de los dos valores

centrales. Cuando n es par, los dos datos que están en el centro de la
muestra ocupan las posiciones n/2 y (n/2) +1. Es decir:
𝑥𝑛 +𝑥𝑛
2 +1
› 𝑀𝑒 = 2
2
Método de cálculo general
𝑁𝑀
− 𝑁𝑖−1
𝑀𝑒 = 𝑥𝑖1 + 2 ∗ (𝑥𝑖2 − 𝑥𝑖1 )
𝑓𝑖
Donde
𝑥𝑖1 Es el límite inferior de la clase de la mediana.
𝑁𝑀
› 2
Es la posición de la mediana.
› 𝑁𝑖−1 Es la frecuencia acumulada de la clase premediana.

› 𝑓𝑖 Es la frecuencia absoluta de la clase de la mediana.
› (𝑥𝑖2 − 𝑥𝑖1 ) = 𝐴𝑖 Es la amplitud del intervalo de la clase de la
mediana.
MODA
› En estadística se denomina moda al dato que más se repite en una

muestra o estudio. Podemos obtener la moda haciendo uso
de calculadora de la moda de manera online, siendo el valor que
tiene mayor frecuencia absoluta en un conjunto de datos.
Podremos hallar la moda para variables cualitativas y cuantitativas.
¿QUÉ ES LA › Símbolo de la moda
MODA? La moda es una medida que se relaciona
con la frecuencia en la que aparece un
La moda es una medida de dato en un supuesto. La moda puede
tendencia central que aparecer tanto en datos cualitativos como
indica el valor que más se
repite en un grupo de cuantitativos. El símbolo de la moda es:
números. En un mismo
estudio puede haber más
de una moda, esto ocurre Mo
cuando dos (bimodal) o más
números (multimodal) se
repiten la misma cantidad de
veces siendo este es el
máximo número de veces
del conjunto. También puede
darse el caso a la inversa y
que en una muestra no haya
moda por la ausencia de
repetición de los datos, a
esto se le llama muestra
amodal.
Ejemplo
En los siguientes de moda, podremos calcular la moda de una serie de
números aprendiendo a indentificarla de manera clara y sencilla. A
continuación, os mostramos algunos ejemplos de cálculo de la
moda en estadística:
asándonos en la premisa de que la moda equivale al valor más
repetido en una muestra, y observando esta correlación de números:
4,3,2,7,7,7,9,5,9,9,1,9, podemos afirmar que la moda es 9.
En el siguiente ejemplo encontramos una muestra bimodal, ya que
los número 6 y 9 tienen las frecuencias más altas y se repiten las
mismas veces: 9,3,4,6,7,8,6,9,0,7,6,9,1,6,9.
Por último en el siguiente estudio tenemos una muestra amodal,
puesto que las cifras no se repiten con una frecuencia mayor que
los otros datos: 2,3,7,9,8,5,0.
Formula para hallar la moda de datos agrupados
CUANTILES
› Medidas de posición no central ( Cuantiles )

Los cuantiles son aquellos valores de la variable, que ordenados de
menor a mayor, dividen a la distribución en partes, de tal manera que
cada una de ellas contiene el mismo número de frecuencias
Formula
› Sin parte decimal: elegimos ese mismo sujeto. Por ejemplo, si el

conjunto tiene 19 elementos, (N+1)/4=(19+1)/4=20/4=5, por lo que el
primer cuartil será Q1=X5.
Con parte decimal: supongamos que el

elemento es un número con parte decimal
entre el sujeto i y el i+1. Sea un número de
la forma i,d donde i es la parte entera y d la
decimal. El cuartil será:
Ejemplo
› Ejemplo 1: Calcular el cuartil 1 (Q1) de las siguientes muestras
de notas en matemáticas de un aula (notas de 0 a 20): 16, 10,
12, 8, 9, 15, 18, 20, 9, 11, 1, 13, 17, 9, 10, 14
› Ordenamos de menor a mayor: 1, 8, 9, 9, 9, 10, 10, 11, 12, 13,
14, 15, 16, 17, 18, 20
› N = número de muestras = 16 muestras
› x = (N · i) / 4 = (16 · 1) / 4 = 4
› Como x = 4 es un número sin decimales, entonces el cuartil 1
es el valor de la muestra que ocupa la posición 4
› Q1 (cuartil 1) = 9
MEDIDIAS DE DISPERSION
› Rango
› Desviación Media
› Desviación Estándar
› Varianza
RANGO
› En estadística, el rango representa la diferencia entre el
valor máximo y el valor mínimo de un conjunto de datos. El
rango nos muestra la distribución de los valores en una
serie. Si el rango es un número muy alto, entonces los
valores de la serie están bastante distribuidos. En cambio,
si se trata de un número pequeño, quiere decir que los
valores de la serie están muy cerca entre sí.
› Por ejemplo, para una serie de datos de carácter cuantitativo, como
lo es la estatura medida en centímetros, tendríamos:
es posible ordenar los datos como sigue:
donde la notación x(i) indica que se trata del elemento i-ésimo de la

serie de datos. De este modo, el rango sería la diferencia entre el valor
máximo (k) y el mínimo; o, lo que es lo mismo:
En nuestro ejemplo, con cinco valores, nos da que R = 185-155 = 30.

problema
› Calcular el rango de edad de la defensa de un equipo de

football americano:
#92= 23 años, #43= 19 años, #29= 20 años, #27=24 años,
#41=27 años, #17= 18 años, #26=25 años, #25=19 años, #55=
25 años, #57= 18 años, #99= 22 años.
R= (27 años) – (18 años) = 9

DESVIACION MEDIA
› Se define la desviación media como el parámetro de
dispersión que sirve para calcular cuánto se desvían en
promedio los datos de la distribución de la media
aritmética. Se calcula como la media de los valores
absolutos de las diferencias entre la media aritmética y los
diferentes datos.
Ejemplo
› Paso 1: Calcular la desviación media o promedio de la
distribución. 9, 3, 8, 8, 9, 8, 9, 18
› Paso 2: Calculamos la media aritmética para poder hallar las

desviaciones respecto a la media
› Paso 3: Aplicamos la fórmula de la desviación media

Formula para datos agrupados
› Si los datos vienen agrupados en una tabla de frecuencias,

la expresión de la desviación media es:
Ejemplo
TABLA DE DATOS OBTENER LA MEDIA
OBTENER LA DESVIACION MEDIA
457.5
𝑥ҧ = = 21.786
21
Desviación Estándar
La desviación estándar es la medida de dispersión más común,
que indica qué tan dispersos están los datos con respecto a la
media. Mientras mayor sea la desviación estándar, mayor será la
dispersión de los datos.
El símbolo σ (sigma) se utiliza frecuentemente para representar
la desviación estándar de una población, mientras que s se
utiliza para representar la desviación estándar de una muestra.
La variación que es aleatoria o natural de un proceso se conoce
comúnmente como ruido.
La desviación estándar se puede utilizar para establecer un valor
de referencia para estimar la variación general de un proceso.
La desviación estándar (o desviación típica) es una medida de
dispersión para variables de razón (ratio o cociente) y de intervalo, de
gran utilidad en la estadística descriptiva. Es una medida (cuadrática)
de lo que se apartan los datos de su media, y por tanto, se mide en las
mismas unidades que la variable.
Para conocer con detalle un conjunto de datos, no basta con conocer
las medidas de tendencia central, sino que necesitamos conocer
también la desviación que representan los datos en su distribución, con
objeto de tener una visión de los mismos más acorde con la realidad a
la hora de describirlos e interpretarlos para la toma de decisiones.
fue descubierta e interpretada por el británico William Sealy Gosset
Ejemplos:
Paso 1: calcular la media.
Paso 2: calcular el cuadrado de la distancia a la media para cada
dato.
Paso 3: sumar los valores que resultaron del paso 2.
Paso 4: dividir entre el número de datos.
Paso 5: sacar la raíz cuadrada.
Supongamos que cada uno de tus amigos mide a sus perros en

milímetros hasta los hombros; Obten la media, varianza y desviación
estándar.
Calcular la desviación estándar de las siguientes puntuaciones de un
jugador de baloncesto en los últimos partidos:
12, 6, 7, 3, 15, 10, 18, 5
Varianza
La varianza es una medida de dispersión que representa la
variabilidad de una serie de datos respecto a su media. Formalmente
se calcula como la suma de los residuos al cuadrado divididos entre el
total de observaciones.
También se puede calcular como la desviación típica al cuadrado.
Dicho sea de paso, entendemos como residuo a la diferencia entre el
valor de una variable en un momento y el valor medio de toda la
variable.
Ronald Fisher, un matemático, físico, biólogo y estadístico inglés, en 1918
fue el primero en introducir el termino varianza, en uno de sus estudios
publicado sobre biometría. A su vez introdujo los estudios sobre el análisis
de varianza.
La varianza, junto con la desviación estándar, son medidas de dispersión
de datos u observaciones. La dispersión de estos datos indica la variedad
que estos presentan, es decir, si todos los valores en un conjunto de
datos son iguales, entonces no hay dispersión, pero en cambio, si no
todos son iguales entonces hay dispersión.
Esta dispersión puede ser grande o pequeña, dependiendo de qué tan
cercanos sean los valores a la media.
La varianza de una muestra se simboliza como S2, mientras que la
varianza de una población de simboliza como σ2.
La varianza de una muestra es utilizada para estimar la varianza de una
población, la cual en muchas ocasiones se desconoce. Es por esto que
S2 también es considerada comúnmente como un estadístico y σ2 como
un parámetro.
Monitorear la varianza es esencial en las industrias de manufactura y
control de calidad, porque con la reducción de la varianza del proceso
aumenta la precisión y disminuye el número de defectos.
La varianza en estadística es la raíz cuadrada de la desviación
estándar, siendo una media de las frecuencias con la media elevadas
al cuadrado. Para calcular la varianza seguiremos los pasos
enumerados a continuación:
Calcular la media realizando el promedio de los números
Restar la media a cada número anterior y elevarlo al cuadrado
Calcular la media de las diferencias al cuadrado obtenidas en el punto
anterior
Ejemplos:
Supongamos que se tienen los ingresos anuales de cinco empresas
distintas, pertenecientes a un mismo empresario, los cuales son:
Empresa A: 2.500 $
Empresa B: 1.800 $
Empresa C: 2.300 $
Empresa D: 3.000 $
Empresa E: 2.700 $
Entonces calculamos la media de los ingresos, simplemente sumando cada
cifra y dividiéndolo entre el número total de empresas, lo cual da como
resultado: 2.460$.
Ahora simplemente terminamos de calcular la varianza con la formula ya
expuesta, lo cual da como resultado una varianza de 162.400 $2.
Al sacar la raíz cuadrada a este resultado obtenemos la desviación estándar,
siendo ésta 403 $ de diferencia entre los ingresos de las cinco empresas.
Hallar la desviación media, la varianza y la desviación típica de la
series de números siguientes:
2, 3, 6, 8, 11.
Estadística
“Medidas De Reforma”
Asimetría o Sesgo:
http://www.geocities.ws/e_gomez_lara/MEDIDAS_FORMA.pdf
https://www.monografias.com/trabajos87/medidas-forma-asimetria-
curtosis/medidas-forma-asimetria-curtosis.shtml
Apuntamiento o curtosis:
https://www.universoformulas.com/estadistica/descriptiva/curtosis/
Asimetría o Sesgo:
El sesgo es el grado de asimetría o falta de asimetría, de una distribución, si el
polígono de frecuencias visualizado de una distribución tiene una cola más larga
a la derecha del máximo central que a la izquierda, se dice que la distribución
esta sesgada a la derecha o que tiene sesgo positivo(asimetría positiva) y si al
contrario se dice que tiene sesgo (asimetría negativa) en la asimetría
encontramos si es:
El Coeficiente de Pearson varía entre -3 y 3
Si As < 0 ? la distribución será asimétrica negativa.
Si As = 0 ? la distribución será simétrica.
Si As > 0 ? la distribución será asimétrica positiva.
Formula
= media aritmética.
Md = Mediana.
S = desviación típica
Apuntamiento o curtosis:
La curtosis (también conocida como medida de apuntamiento) es una medida
estadística, que determina el grado de concentración que presentan los valores
de una variable alrededor de la zona central de la distribución de frecuencias.
Existen algunas variables que presentan un mayor grado de concentración
(menor dispersión) de los valores en torno a su media y otras, por el contrario,
presentan un menor grado de concentración (mayor dispersión) de sus valores
en torno a su valor central. Por tanto, la curtosis nos informa de lo apuntada
(mayor concentración) o lo achatada (menor concentración) que es una
distribución.
Dependiendo del grado de curtosis, tenemos tres tipos de distribuciones:
1. Leptocúrtica: Existe una gran concentración de los valores en torno a su
media (g2>3)
2. Mesocúrtica: Existe una concentración normal de los valores en torno a su

media (g2=3).
3. Platicúrtica: Existe una baja concentración de los valores en torno a su

media (g2<3).
Formula:
En la fórmula se resta 3 porque es la curtosis de una distribución Normal.

Entonces la curtosis valdrá 0 para la Normal, tomándose a ésta como
referencia.
Cuando los datos están agrupados o agrupados en intervalos, la fórmula del
coeficiente de curtosis se convierte en:
EJEMPLO
Supongamos que queremos calcular la curtosis de la siguiente distribución:
8,5,9,10,12,7,2,6,8,9,10,7,7.
Primero calculamos la media aritmética (µ), que sería 7,69.
A continuación, calculamos la desviación típica, que sería 2,43.
Tras tener estos datos y para comodidad en el cálculo, se puede realizar una tabla
para calcular la parte del numerador (cuarto momento de la distribución). Para el
primer cálculo sería: (Xi-µ)^4 = (8-7,69)^4 = 0,009.
Una vez tenemos esta tabla hecha, simplemente tendríamos
que aplicar la formula expuesta con anterioridad para tener
la curtosis.
g2 = 1.518,27/13*(2,43)^4 = 3,34
En este caso dado que g2 es mayor que 3, la distribución sería
leptocurtica, presentando un mayor apuntamiento que la
distribución normal.
Exceso de curtosis
En algunos manuales la curtosis se presenta como exceso de curtosis.
En este caso esta se compara directamente con la de la distribución
normal. Dado que la distribución normal, tiene curtosis 3, para obtener el
exceso, solo habría restarle 3 a nuestro resultado.
Exceso de curtosis = g2-3 = 3,34-3 = 0,34.

La interpretación del resultado en este caso, sería la siguiente:
g2-3 > 0 -> distribución leptocúrtica.
g2-3 = 0 -> distribución mesocúrtica (o normal).
g2-3 < 0 -> distribución platicúrtica.
Medidas De correlación
• Coeficiente De Correlación
• Recta de Correlación
• Error Estándar De Estimación
COEFICIENTE DE
CORRELACION
¿QUE ES?
El coeficiente de correlación es una

medida que determina el grado al que
se asocian los movimientos de dos
variables.
Así, el coeficiente de correlación es un

número que cuantifica algún tipo de
relación y/o dependencia, es decir,
relaciones estadísticas entre dos o
más variables aleatorias o valores de
datos observados.
Para sacar el coeficiente de correlación existen dos métodos el de Pearson

y el de Spearman.
COEFICIENTE DE
CORRELACION DE
PEARSON
Fue Karl Pearson el primero en
describir, en 1896, el método estándar
de su cálculo y demostrar que es el
mejor posible.
COEFICIENTE DE
CORRELACION
DE SPEARMAN
El coeficiente de correlación de Spearman es un
estadístico de rango no paramétrico (sin distribución
de probabilidad asociada). Fue propuesto como una
medida de la fuerza de la asociación entre dos
variables. Es una medida de una asociación monótona
que se usa cuando la distribución de datos hace que
el coeficiente de correlación de Pearson sea
engañoso.
El coeficiente de Spearman no es una medida de la

relación lineal entre dos variables, como declaran
algunos «estadísticos». Evalúa en qué grado una
función monótona arbitraria puede describir la relación
entre dos variables.
COEFICIENTE DE
CORRELACION
LINEAL
En una distribución bidimensional
puede ocurrir que las dos variables
guarden algún tipo de relación entre si.
El coeficiente de correlación lineal

mide el grado de intensidad de esta
posible relación entre las variables.
Este coeficiente se aplica cuando la
relación que puede existir entre las
variables es lineal (es decir, si
representáramos en un gráfico los
pares de valores de las dos variables
la nube de puntos se aproximaría a
una recta).
RECTA DE REGRESION
¿QUE ES?
La regresión es una técnica estadística

utilizada para simular la relación
existente entre dos o más variables.
Por lo tanto se puede emplear para
construir un modelo que permita
predecir el comportamiento de una
variable dada.
Según sea la dispersión de los datos

(nube de puntos) en el plano
cartesiano, pueden darse alguna de las
siguientes relaciones, Lineal,
Logarítmica, Exponencial, Cuadrática,
entre otras.
RECTA DE
REGRESION
LINEAL
La regresión lineal simple es un

método estadístico con el que
podemos analizar y entender las
relaciones existentes entre dos
variables cuantitativas. A una de estas
variables se le denomina como
variable independiente o predictiva (x),
y a la otra se le denomina variable
dependiente (y).
RECTA DE
FORMULA DE REGRESION
REGRESION LOGARITMICA
LOGARITMICA Y=A+BLN(X)
Este modelo de regresión es una

alternativa cuando el modelo lineal no
logra un coeficiente de determinación
apropiado, o cuando el fenómeno en
estudio tiene un comportamiento que
puede considerarse potencial o
logarítmico. La forma más simple de
tratar de establecer la tendencia es a
través de un diagrama de dispersión o
nube de puntos.
RECTA DE REGRESION EXPONENCIAL Y
CUADRATICA
EXPONENCIAL CUADRATICA
Será aquella en la que la función de ajuste será una función La regresión cuadrática: es el proceso por el cuál encontramos
exponencial del tipo los parámetros de una parábola que mejor se ajusten a una serie
de datos que poseemos, ya sean mediciones hechas o de otro
y = a.bx tipo. El modelo de regresión cuadrática es una alternativa cuando
el modelo lineal no logra un coeficiente de determinación
La regresión exponencial aunque no es lineal es linealizable apropiado, o cuando el fenómeno en estudio tiene un
tomando logaritmos ya que haciendo el cambio de variable comportamiento que puede considerarse como parabólico.
v = log y tendremos que la función anterior nos generaría:
ERROR ESTANDAR DE
ESTIMACION.
¿Qué es el error estándar de estimación ?
› Uno de los conceptos más útiles en la práctica

estadística es justamente el de "error estándar". Este
término fue definido originalmente por el estadístico
británico Udny Yule a comienzos del siglo XX. El error
estándar de estimación es una cantidad que indica
que tan confiable es la recta de regresión elaborada
para un conjunto de datos en una dispersión
› El error de estimación es la desviación típica de los
residuos (Se) es decir, la desviación típica de las
distancias existentes entre las puntuaciones en la
variable dependiente y los pronósticos efectuados en la
recta de regresión
› Gráficamente, es posible tener una idea de dicha
confiabilidad al observar el comportamiento de
los puntos de dispersión ; si los puntos están muy
próximos a la recta de regresión, entonces esta
será una recta confiable. Por el contrario, si los
puntos se ubican en posiciones lejanas al lugar
donde se encuentra la recta de regresión,
entonces la recta no será confiable. Puesto que
dicho análisis es meramente cualitativo,
Caso donde los puntos se ubican en posiciones lejanas caso donde la ubicación de los puntos juntos
› El error estándar de estimación es también llamado
error estándar de regresión, permite cuantificar la
cercanía o lejanía de los puntos de la dispersión a la
recta de regresión
σ(𝑌−𝑌´)2
› Se calcula mediante la formula: 𝑆=
𝑁−2
› Donde Y es cada uno de los valores de la dispersión

ubicados en la coordenada y. Y 'es el valor calculado
para estos valores de acuerdo a la recta de regresión
y N es el numero total de datos
La determinante primaria de la exactitud es el grado
de dispersión de la población: cuanto mas dispersa
este menor será la exactitud de las estimaciones
La formula anterior no se utiliza por lo general en
cálculos reales , debido a que es mas fácil trabajar
con la formula simplificada (que se obtuvo al sustituir
por la ecuación de regresión y al completar el
cuadrado) , es decir:
PROBABILIDAD:
Teoría De Conjuntos;
• Elementos Básicos
• Operación con conjuntos
• Diagrama De Venn
ELEMENTOS
BASICOS
La probabilidad mide laprobabilidad de sucesos
frecuencia con la que sepotenciales y la mecánica
obtiene un resultado (osubyacente de sistemas
conjunto de resultados) alcomplejos
llevar a cabo un experimento
aleatorio, del que se conocen
todos los resultados posibles,
bajo condiciones
suficientemente estables. La
teoría de la probabilidad se
usa extensamente en áreas
como la estadística, la física,
la matemática, la ciencia y la
filosofía para sacar
conclusiones sobre la
› Para determinar sin describir directamente el
numero de resultados posibles de un experimento
en particular o el nuero de elementos de un
conjunto en especial se requieren e algunos
principios básicos que faciliten el proceso, entre
estos destacan: diagrama de árbol, principio
fundamental del conteo, notación factorial, teorema
del binomio, triangulo de pascal, permutaciones,
combinaciones.
TEORIA DE CONJUNTOS
› Rama de las matemáticas a las que el matemático Georg Ferdinand
Ludwing Philipp Cantor es el padre de la Teoría de Conjuntos, dio su primer
tratamiento formal en 1870. El concepto de conjunto es uno de los más
fundamentales en matemáticas, incluso más que la operación de contar,
pues se puede encontrar implícita o explícitamente, en todas las ramas de
las matemáticas puras y aplicadas. En su forma explícita, los principios y
terminología de los conjuntos se utilizan para construir proposiciones
matemáticas más claras y precisas y para explicar conceptos abstractos
como el infinito.
› La Teoría de Conjuntos es una teoría matemática, que estudia básicamente

a un cierto tipo de objetos llamados conjuntos y algunas veces, a otros
objetos denominados no conjuntos, así como a los problemas relacionados
con estos.
Hay dos los conceptos básicos de la Teoría
de Conjuntos:
› Conjunto: Colección de cualquier tipo de
objetos considerada como un todo, una
multiplicidad vista como unidad; entidad
completa bien determinada.
Los objetos que forman al conjunto son
nombrados elementos del
conjunto o miembros del conjunto. › Relación de Pertenencia: El ser elemento
Por colección entenderemos a una de es una relación binaria o de dos
agrupación que está determinada por una argumentos entre dos objetos de la Teoría
propiedad enunciada por medio de un de Conjuntos.
lenguaje preciso. Todo conjunto es una Esta relación va de un objeto a otro, donde
colección de objetos, pero no toda el segundo objeto es necesariamente un
colección de objetos es un conjunto. conjunto y el primero puede ser o no un
conjunto.
OPERACIONES CON
CONJUNTOS
Teoría de Conjuntos
https://www.conoce3000.com/html/espaniol/Libros/Matema
tica01/Cap10-03-OperacionesConjuntos.php
UNIÓN O REUNION DE CONJUNTOS
› Nos permite unir dos o más conjuntos para formar otro
conjunto que contendrá a todos los elementos pero sin que
se repitan.
› El símbolo que se usa para indicar la operación de unión
es: ∪.
› Dado un conjunto A={1,2,3,4,5,6,7,} y un conjunto
B={8,9,10,11}, la unión de los conjuntos A y B será otro
conjunto formado por todos los elementos de A y de B
INTERSECCIÓN DE CONJUNTOS
› Nos permite formar un conjunto, sólo con los elementos
comunes involucrados en la operación.
› El símbolo que se usa para indicar la operación de
intersección es: ∩.
› Dados dos conjuntos A={1,2,3,4,5} y B={4,5,6,7,8,9}, la
intersección de los conjuntos A y B, estará formado por los
elementos de A y B que sean comunes, los elementos no
comunes A y B, será excluidos.
DIFERENCIA DE CONJUNTOS
› Nos permite formar un conjunto, en donde de dos
conjuntos el conjunto resultante es el que tendrá todos los
elementos que pertenecen al primero pero no al segundo.
› El símbolo que se usa para esta operación es el mismo
que se usa para la resta o sustracción: -.
diferencia de los conjuntos entre A y B, estará formado por
todos los elementos de A que no pertenezcan a B.
DIFERENCIA DE SIMETRICA DE
CONJUNTOS
› Nos permite formar un conjunto, en donde de dos
conjuntos el conjunto resultante es el que tendrá todos los
elementos que no sean comunes en ambos conjuntos.
› El símbolo que se usa para indicar la operación de
diferencia simétrica es: △.
diferencia simétrica estará formado por todos los
elementos no comunes a los conjuntos A y B.
COMPLEMENTO DE UN CONJUNTO
› Nos permite formar un conjunto con todos los elementos del conjunto
de referencia o universal, que no están en el conjunto.
› El complemento de un conjunto se denota con un apostrofe sobre el
conjunto que se opera, A‘, en donde el conjunto A es el conjunto del
cual se hace la operación de complemento.
› Dado el conjunto Universal U={1,2,3,4,5,6,7,8,9} y el conjunto
A={1,2,9}, el conjunto A' estará formado por los siguientes elementos
A'={3,4,5,6,7,8}.
DIAGRAMA DE VENN
Teoría de Conjuntos
https://es.slideshare.net/anacely/probabilidad-diagramas-de-venn
http://probyestjevp.blogspot.com/2008/10/diagrama-de-venn.html
DEFINICIÓN
› Estos diagramas se usan para mostrar gráficamente la
agrupación de cosas elementos en conjuntos,
representando cada conjunto mediante un círculo o un
óvalo. La posición relativa en el plano de tales círculos
muestra la relación entre los conjuntos
VOCABULARIO
› Universo:
– La totalidad de datos o sucesos.
– Se representa con un cuadrado o rectángulo.
› Conjuntos:
– O cualidades, se representan por círculos u óvalos.
– Son datos agrupados por alguna característica.
EVENTOS
› En la figura vemos que:
– A ∩ B = regiones 1 y 2
– B ∩ C = regiones 1 y 3
– A U C = regiones 1, 2, 3, 4, 5 y 7
– B' ∩ A = regiones 4 y 7
– A ∩ B ∩ C = región 1
– (A U B) ∩ C' = regiones 2, 6 y 7
EJEMPLOS
› Una Escuela tiene maestros que › EXPLICACIÓN
enseñan en mas de un grado. El – Al colocar las cantidades de
total de maestros es 20. Siete cada conjunto le restamos las
enseñan en 7mo grado, ocho intersecciones. En este caso
enseñan en 8vo grado y 2 enseñan tanto a 7mo como a 8vo hay
en 7mo y 8vo. Haz un diagrama que que restarle 2. Así obtenemos
muestre cuántos maestros quedan que solamente 7mo es 5 y
solamente 8vo es 6. Para
en el universo que no enseñan ni en saber cuantos del universo
7mo ni en 8vo grado. quedan fuera de esos dos
conjuntos restamos todos los
elementos contenidos en ellos
. De ahí surge 7 como el
restante.
Técnicas De Conteo
• Elementos Básicos
• Diagramas De Árbol
• Principio De La Suma Y La Multiplicación
• Permutación Y Combinación
Elementos Básicos
› Conceptos de Estadística
› Población: Una población es el conjunto de todos los elementos a los que se
somete a un estudio estadístico.
› Individuo: Un individuo o unidad estadística es cada uno de los elementos que
componen la población.
› Muestra: Una muestra es un conjunto representativo de la población de
referencia, el número de individuos de una muestra es menor que el de la
población.
› Muestreo: El muestreo es la reunión de datos que se desea estudiar, obtenidos de
una proporción reducida y representativa de la población.
› Valor: Un valor es cada uno de los distintos resultados que se pueden obtener en
un estudio estadístico. Si lanzamos una moneda al aire 5 veces obtenemos dos
valores: cara y cruz.
› Dato: Un dato es cada uno de los valores que se ha obtenido al realizar un estudio
estadístico. Si lanzamos una moneda al aire 5 veces obtenemos 5 datos: cara,
cara, cruz, cara, cruz.
› Definición de variable: Una variable estadística es cada una de las
características o cualidades que poseen los individuos de una población
Diagrama de Árbol
› Los diagramas en árbol son especialmente útiles para
resolver problemas con experimentos compuestos, es
decir, aquellos donde realizamos más de un experimento
aleatorio. Algunos ejemplos de experimentos compuestos
son: tirar dos monedas al aire, y mirar si salen dos caras,
contar si hay dos mujeres de entre tres hijos, sacar dos
bolas de una urna, y mirar si hay una roja y una azul.
Ejemplo
Principios de suma y la
multiplicación
Principio de la suma
› Supongamos que un suceso E1 puede ocurrir de “m”
maneras y el segundo suceso
E2 puede ocurrir de “n” maneras, y supongamos que
ambos sucesos no pueden ocurrir simultáneamente.
Entonces E1 o E2 puede ocurrir de (m + n) maneras.
› Este principio se puede extender a tres o más sucesos.
Recordando el lema de teoría de conjuntos que dice.
Supónganos que A y B son conjuntos distintos.
Entonces n(A B) = n(A) + n(B), este también es principio
de las suma.
Principio de la multiplicación
Supongamos que un suceso E1 puede ocurrir de “m”
maneras y el segundo suceso E2 puede ocurrir de “n”
maneras, (sucesos independientes). Entonces las
combinaciones de E1 y de E2 pueden ocurrir de (m) (n)
maneras.
Este principio se puede extender a tres o más sucesos.
Recordando el teorema de teoría de conjuntos.

Supónganos que A y B son conjuntos finitos.
Entonces : n(A B) = n(A) n(B), este también es principio de
la multiplicación.
EJEMPLO
En la Universidad de Sonora te ofrecen tres cursos
diferentes de matemáticas, cuatro diferentes de física y
dos diferentes de administración.
Determina:
› a) ¿Cuántas opciones puedes escoger uno de los
cursos?
› b) ¿De cuántas maneras distintas puedes escoger un
curso de cada materia?
Solución:
› a) n = 3 + 4 + 2 = 9 (son 9 maneras)
› b) n = (3)(4)(2) = 24 (son 24 maneras)
Combinaciones y
permutaciones
Normalmente usamos la palabra

"combinación" descuidadamente, sin
pensar en si el orden de las cosas es
importante. En otras palabras:
› "Mi ensalada de frutas es una combinación
de manzanas, uvas y bananas": no importa en
qué orden pusimos las frutas, podría ser
"bananas, uvas y manzanas" o "uvas, manzanas
y bananas", es la misma ensalada.
› "La combinación de la cerradura es 472":
ahora sí importa el orden. "724" no funcionaría,
ni "247". Tiene que ser exactamente 4-7-2.
Permutación con repetición
Son las más fáciles de calcular. Si tienes n cosas para elegir y
eliges r de ellas, las permutaciones posibles son:
n × n × ... (r veces) = nr
(Porque hay n posibilidades para la primera elección, DESPUÉS
hay n posibilidades para la segunda elección, y así.)
Por ejemplo en la cerradura de arriba, hay 10 números para elegir
(0,1,...,9) y eliges 3 de ellos:
10 × 10 × ... (3 veces) = 103 = 1000 permutaciones
Permutación sin repetición
En este caso, se reduce el número de opciones en cada paso.
Por ejemplo, ¿cómo podrías ordenar 16 bolas de billar?

Después de elegir por ejemplo la "14" no puedes elegirla otra
vez.
Así que tu primera elección tiene 16 posibilidades, y tu siguiente
elección tiene 15 posibilidades, después 14, 13, etc. Y el total
de permutaciones sería:
16 × 15 × 14 × 13 ... = 20,922,789,888,000
La función factorial (símbolo: !) significa que se multiplican

números descendentes. Ejemplos
› 4! = 4 × 3 × 2 × 1 = 24
› 7! = 7 × 6 × 5 × 4 × 3 × 2 × 1 = 5040
› 1! = 1
›
Formulas
donde n es el número de cosas que puedes elegir, y eliges r de ellas

(No se puede repetir, el orden importa)
En lugar de escribir toda la fórmula, la gente usa otras notaciones como:

Combinación sin repetición
Así funciona la lotería. Los números se eligen de uno en uno, y si tienes los números
de la suerte (da igual el orden) ¡entonces has ganado!
› Volviendo a las bolas de billar, digamos que queremos saber qué 3 bolas se
eligieron, no el orden.
› Ya sabemos que 3 de 16 dan 3360 permutaciones.
› Pero muchas de ellas son iguales para nosotros, porque no nos importa el orden.
Lo podemos demostrar con la siguiente formula:
Combinación con repetición
Digamos que tenemos cinco sabores de helado: banana, chocolate, limón,
fresa y vainilla. Puedes tomar 3 paladas. ¿Cuántas variaciones hay?
Vamos a usar letras para los sabores: {b, c, l, f, v}. Algunos ejemplos son:
› {c, c, c} (3 de chocolate)
› {b, l, v} (uno de banana, uno de limón y uno de vainilla)
› {b, v, v} (uno de banana, dos de vainilla)
Lo podemos demostrar con la siguiente formula:
Probabilidad Para Eventos
› Probabilidad Condicional
› Eventos Independientes
› Teorema De Bayes
› Selecciones Al Azar, Con O Sin Reemplazo.
Probabilidad Condicional
› La probabilidad condicional es la probabilidad de algún evento A,

dada la ocurrencia de algún otro evento B. Esto está denotado
por P( A | B ) y se lee “la probabilidad de A, dado B ”. En otras
palabras, estamos calculando probabilidades condicionales al
conocer información adicional parcialmente a través del
experimento.
› {\displaystyle P(A\mid B)}(P(A/B) se puede interpretar como,
tomando los mundos en los que B se cumple, la fracción en los que
también se cumple A.)
Ejemplo:
Una maestra de matemáticas le da a su clase dos exámenes. El 30%
de la clase paso ambos exámenes y el 45% de la clase paso el primer
examen. ¿Qué porcentaje de aquellos que pasaron el primer examen
también pasaron el segundo?
Dos tercios o aproximadamente el 66.7% de la clase paso el segundo examen.

› INDEPENDENCIA DE SUCESOS
› Dos sucesos aleatorios A y B son independientes si y solo si:
› P(A ∩ B) = P(A) P(B).
› Si A y B son independientes, su probabilidad conjunta, P(A ∩ B)
o P(A,B), puede ser expresada como el producto de las
probabilidades individuales.
› Equivalentemente:
› P(A/B) = P(A)
› P(B/A) = P(B)
› En otras palabras, si A y B son independientes, la probabilidad
condicional de A dado B es simplemente la probabilidad de A y
viceversa.
EXCLUSIVIDAD MUTUA
(Los conjuntos A y B no intersecan. Son mutuamente excluyentes)
Dos sucesos A y B son mutuamente excluyentes si y solo si A ∩ B= ꜚᶿ,

entonces,
P (A ∩ B) = 0.
Si P (B) > 0 entonces P (A / B) es iguala 0.
La falacia de la probabilidad condicional
La falacia de la probabilidad condicional se basa en asumir que P (A /
B) es casi igual a P (B / A) .
El matemático John Allen Paulos analiza en su libro “El hombre
anomérico” este error muy común cometido por doctores, abogados y
otras personas que desconocen la probabilidad.
La verdadera relación entre P (A / B) y P (B / A) es la siguiente:
P (B)
P (B / A) = P (A / B) ·
P (A)
(Teorema de Bayes)
Ejemplos:
Una mujer es portadora de la enfermedad de Duchenne ¿Cuál es la probabilidad de
que su próximo hijo tenga la enfermedad?
Según las leyes de Mendel, todos los posibles genotipos de un hijo de una madre
portadora (xX) y un padre normal (XY) son xX, xY, XX, XY y tienen la misma
probabilidad. El espacio muestral es W = {xX, xY, XX, XY}
el suceso A={hijo enfermo} corresponde al genotipo xY, por tanto, según la definición
clásica de probabilidad
p (A) = 1/4 = 0,25
La mujer tiene el hijo y es varón ¿qué probabilidad hay de que tenga la enfermedad?
Se define el suceso B = {ser varón} = {xY, XY}
la probabilidad pedida es p(A | B) y aplicando la definición anterior
p (B) = 0,5; A Ç B = {xY}; p(A Ç B) = 0,25; p(A | B) = 0,25/0,5 = 0,5
Si sabemos que es varón, el espacio muestral ha cambiado, ahora es B. Por lo tanto
se puede calcular p(A|B) aplicando la definición clásica de probabilidad al nuevo
espacio muestral
p(A|B) = 1/2 = 0,5
Consideremos una población en la que cada individuo es clasificado según dos
criterios: es o no portador de HIV y pertenece o no a cierto grupo de riesgo que
denominaremos R. La correspondiente tabla de probabilidades es:
En esta población, la probabilidad de que un individuo sea portador es P (A)
=0.006 y la probabilidad de que sea portador y pertenezca al grupo de riesgo R
es P (A ∩ B) =0.003.
Dado que una persona seleccionada al azar pertenece al grupo de riesgo R,
¿cuál es la probabilidad de que sea portador?
P (A ∩B) 0.003
P (A | B) = P (B) =0.020 =0.150
es decir que 150 de cada 1000 individuos del grupo de riesgo R, son
“probablemente” portadores de HIV.
Calculemos ahora la probabilidad de que una persona sea portadora de HIV,
dado que no pertenece al grupo de riesgo R.
P (A ∩ Bꜥ) 0.003
P (A | Bꜥ) = P (Bꜥ) =0.980 =0.00306
es decir que sólo 3 de cada 1000 individuos no pertenecientes al grupo de riesgo
R, son “posibles” portadores de HIV.
EVENTOS INDEPENDIENTES
Eventos dependientes:
Dos o más eventos serán dependientes cuando la ocurrencia o no
ocurrencia de uno de ellos afecta la probabilidad de ocurrencia del
otro. Cuando tenemos este caso, empleamos entonces, el concepto
de probabilidad del evento relacionado. La expresión P (A / B) indica la
probabilidad de ocurrencia del evento A si el evento B ya ocurrió.
Tamaño del espacio del evento
Probabilidad de que un evento ocurra =
Tamaño del espacio muestral
› Ejemplos:
Una caja contiene 4 canicas rojas, 3 canicas verdes y 2 canicas

azules. Una canica es eliminada de la caja y no es reemplazada. Otra
canica se saca de la caja. ¿Cuál es la probabilidad de que la primera
canica sea azul y la segunda canica sea verde?
Ya que la primera canica no es reemplazada, el tamaño del espacio

muestral para la primera canica (9) es cambiado para la segunda
canica (8) así los eventos son dependientes.
P (azul, luego verde) = P (azul) · P (verde)

2 3 6 1
= · = =
9 8 72 12
Eventos Independientes:
Dos o más eventos son independientes cuando la ocurrencia o
no-ocurrencia de un evento no tiene efecto sobre la probabilidad
de ocurrencia del otro evento (o eventos). Un caso típico de
eventos independiente es el muestreo con reposición, es decir,
una vez tomada la muestra se regresa de nuevo a la población
donde se obtuvo.
Si A y B son eventos independientes, P (A / B) = P(A) • P(B).
En general, para cualquier número independiente de eventos, la

probabilidad de que todos los eventos sucedan es el producto de
las probabilidades de que los eventos individuales sucedan.
› Ejemplos:
Lanzas un dado dos veces. ¿Cuál es la probabilidad de sacar un 6 en
el segundo tiro pero no en el primero?
En este ejemplo, el dado es lanzado dos veces.
Existen 6 resultados posibles para el primer tiro, y para cada uno de ellos, hay 6
resultados posibles para el segundo tiro. Hay 6 • 6, o 36, resultados posibles:
Espacio muestral: {(1,1), (1,2), (1,3), (1,4), (1,5), (1,6), (2,1), (2,2), (2,3), (2,4),
(2,5), (2,6), (3,1), (3,2), (3,3), (3,4), (3,5), (3,6), (4,1), (4,2), (4,3), (4,4), (4,5),
(4,6), (5,1), (5,2), (5,3), (5,4), (5,5), (5,6), (6,1), (6,2), (6,3), (6,4), (6,5), (6,6)}
El espacio muestral consiste en todos los resultados para los cuales el
primero tiro no fue 6, y el segundo tiro fue 6. Para el primer
lanzamiento existían 5 resultados posibles que no son 6. Para cada
uno de ellos, existía sólo un posible resultado que era 6. Entonces hay
5 • 1 o 5 resultados en el espacio de eventos:
Espacio de eventos: {(1,6), (2,6), (3,6), (4,6), (5,6)}
Nota que el tamaño del espacio muestral para ambos lanzamientos es

el producto del tamaño del espacio muestral para cada lanzamiento.
De manera similar, el tamaño del espacio de eventos par dos
lanzamientos es el producto del tamaño de los espacios de eventos de
cada lanzamiento.
Teorema de Bayes
Maneras de aplicación
¿Qué es?
› El teorema de Bayes es utilizado › Donde B es el suceso sobre el
para calcular la probabilidad de un que tenemos información previa
suceso, teniendo información de y A(n) son los distintos sucesos
antemano sobre ese suceso. condicionados, numerador
tenemos la probabilidad
Podemos calcular la probabilidad de condicionada y en la parte de
Un suceso, sabiendo además que abajo la probabilidad total.
ese A cumple cierta característica
que condiciona su probabilidad.
Selecciones al azar con o
sin reemplazo
Con Reemplazo
Con reemplazo se refiere a que tomas una muestra de un
conjunto reemplazandola por otra o volviéndola a regresar
› EJEMPLO: Supon que tienes un bolsa con 10 pelotas 3 rojas 3
negras y 4 blancas, tu tomas una pelota y dependiendo de lo que
busques tienes un 30% de sacar una negra 30% de una roja y 40%
de una blanca la devuelves la pelota y sacas otra, como es CON
REEMPLAZO tu estas regresando la pelota y la probabilidad no se
ve afectada .
Sin Reemplazo
Sin reemplazo se refiere a que después de tomar una
muestra no la devuelves y la apartas del conjunto de donde
la tomaste.
› Ejemplo: En el mismo ejemplo tu sacas una pelota y tienes 30% de
roja y negra y 40% de una blanca, en este caso después de sacar la
pelota la apartas y dependiendo del color puedes ver que ya no
tienes 10 si no 9 por lo tanto la probabilidad va disminuyendo .

Probabilidad y Estadistia

Hochgeladen von

Dokumentinformationen

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

Probabilidad y Estadistia

Hochgeladen von

Copyright:

Verfügbare Formate

PROBABILIDAD Y

› La frecuencia absoluta es el número de veces que aparece un

› La suma de las frecuencias absolutas es igual al número total de

› Para indicar resumidamente estas sumas se utiliza la letra griega Σ

› La frecuencia acumulada es la suma de las frecuencias

› La frecuencia relativa acumulada es el cociente entre

› La distribución de frecuencias agrupadas o tabla con

Se agrupan los valores en intervalos que tengan la misma

› El diagrama de barras se utiliza generalmente para datos

› Por ejemplo, en el siguiente gráfico se muestra el promedio

› Un polígono de frecuencias es un gráfico de trozos

Es menos sensible que la media aritmética a los valores extremos,

La inversa de la media armónica es la media aritmética de los inversos

Para una función de variable continua viene dada por la expresión:

En el ámbito de la estadística, la mediana representa el valor de la

Existen dos métodos para el cálculo de la mediana:

1. Considerando los datos en forma individual, sin agruparlos.

2. Utilizando los datos agrupados en intervalos de clase.

Sean {x1, x2,…,x3} los datos de una muestra ordenada en orden

b) Si n es par, la mediana es la media aritmética de los dos valores

› 𝑁𝑖−1 Es la frecuencia acumulada de la clase premediana.

› En estadística se denomina moda al dato que más se repite en una

› Medidas de posición no central ( Cuantiles )

› Sin parte decimal: elegimos ese mismo sujeto. Por ejemplo, si el

Con parte decimal: supongamos que el

es posible ordenar los datos como sigue:

donde la notación x(i) indica que se trata del elemento i-ésimo de la

En nuestro ejemplo, con cinco valores, nos da que R = 185-155 = 30.

› Calcular el rango de edad de la defensa de un equipo de

R= (27 años) – (18 años) = 9

› Paso 2: Calculamos la media aritmética para poder hallar las

› Paso 3: Aplicamos la fórmula de la desviación media

› Si los datos vienen agrupados en una tabla de frecuencias,

Supongamos que cada uno de tus amigos mide a sus perros en

2. Mesocúrtica: Existe una concentración normal de los valores en torno a su

3. Platicúrtica: Existe una baja concentración de los valores en torno a su

En la fórmula se resta 3 porque es la curtosis de una distribución Normal.

Exceso de curtosis = g2-3 = 3,34-3 = 0,34.

El coeficiente de correlación es una

Así, el coeficiente de correlación es un

Para sacar el coeficiente de correlación existen dos métodos el de Pearson

El coeficiente de Spearman no es una medida de la

El coeficiente de correlación lineal

La regresión es una técnica estadística

Según sea la dispersión de los datos

La regresión lineal simple es un

Este modelo de regresión es una

› Uno de los conceptos más útiles en la práctica

› Donde Y es cada uno de los valores de la dispersión

› La Teoría de Conjuntos es una teoría matemática, que estudia básicamente

Este principio se puede extender a tres o más sucesos.

Recordando el teorema de teoría de conjuntos.

Normalmente usamos la palabra

Por ejemplo, ¿cómo podrías ordenar 16 bolas de billar?

La función factorial (símbolo: !) significa que se multiplican

donde n es el número de cosas que puedes elegir, y eliges r de ellas

En lugar de escribir toda la fórmula, la gente usa otras notaciones como:

› La probabilidad condicional es la probabilidad de algún evento A,

Dos tercios o aproximadamente el 66.7% de la clase paso el segundo examen.

Dos sucesos A y B son mutuamente excluyentes si y solo si A ∩ B= ꜚᶿ,

La verdadera relación entre P (A / B) y P (B / A) es la siguiente:

Una caja contiene 4 canicas rojas, 3 canicas verdes y 2 canicas

Ya que la primera canica no es reemplazada, el tamaño del espacio

P (azul, luego verde) = P (azul) · P (verde)