Beruflich Dokumente
Kultur Dokumente
PROYECTO DE ESTADISTICA
ESTADISTICA DESCRIPTIVA
ESTUDIANTES:
GUAYAQUIL
ECUADOR
2017-2018
1. INDICE
1. INTRODUCCIÓN ........................................................................................................................... 3
2. Objetivo general: ......................................................................................................................... 4
3. Metodología ................................................................................................................................ 4
4. MARCO TEÓRICO. ........................................................................................................................ 5
ESTADÍSTICA DESCRIPTIVA .................................................................................................. 5
Medidas de tendencia central:............................................................................................ 6
Medidas de tendencia no central: ...................................................................................... 7
Medidas de Dispersión: ....................................................................................................... 8
EXPERIMENTOS ALEATORIOS Y PROBABILIDAD .................................................................. 9
HISTOGRAMA ...................................................................................................................... 9
DISTRIBUCIÓN BINOMIAL.................................................................................................. 10
5. ANÁLISIS E INTERPRETACIÓN DE RESULTADO .......................................................................... 11
ANÁLISIS DE LA TABLA DE FRECUENCIA ............................................................................ 13
HISTOGRAMA .................................................................................................................... 13
................................................................................................................................................ 13
OJIVA ................................................................................................................................. 14
DIAGRAMA DE CAJA .......................................................................................................... 14
TABLA CON REGLA DE STURGES........................................................................................ 15
DIBUJO DEL HISTOGRAMA ................................................................................................ 16
ANÁLISIS DE LA OJIVA........................................................................................................ 17
DIAGRAMA DE CAJAS ........................................................................................................ 17
6. Análisis de probabilidad teórica y experimental ....................................................................... 18
ANÁLISIS DE LA DISTRIBUCIÓN DE LOS DATO. .................................................................. 20
Caso ideal .......................................................................................................................... 21
Caso experimental............................................................................................................. 22
7. Contrastes de hipótesis ............................................................................................................. 22
Hipótesis #1 ....................................................................................................................... 22
Hipótesis #2 ....................................................................................................................... 23
Hipótesis #3 ....................................................................................................................... 25
8. Conclusiones.............................................................................................................................. 26
9. IMÁGENES DE LOS LANZAMIENTOS .......................................................................................... 27
2. INTRODUCCIÓN
El presente proyecto estadístico tiene como objetivo evaluar los diferentes conceptos
adquiridos durante todo el curso de la materia de Estadísticas; con un grupo de cinco
estudiantes haciendo uso de una cancha de básquet en la Escuela Superior Politécnica
Superior realizando cuarenta rondas, cada una de cinco tiros y poder calcular el número de
aciertos al hacer canasta a una distancia de 6,25 metros, haciendo así una recolección de
datos, y convertir los mismos al lenguaje estadístico y hacer la respectiva interpretación de
los valores verificados en el análisis complementando el estudio bibliográfico en la teoría
expuesta.
Objetivos específicos:
Realizar la tabla de frecuencias con cada uno de los elementos que la conforman.
Dibujar el histograma, la ojiva y el diagrama de cajas.
Calcular la media, varianza, desviación estándar, cuartiles.
Realizar la interpretación de los gráficos realizados.
4. Metodología
Se va a realizar el lanzamiento de un balón de básquet hacia el aro de una cancha
reglamentaria desde una posición fija que cumpla con la condición de distancia al aro de
6.25 metros (3 puntos), mediante rondas de 5 tiros se van a registrar los aciertos que se
obtienen hasta completar los 250 lanzamientos y así obtener el porcentaje de acierto real.
Mediante los cálculos estudiados sobre estadística descriptiva se van a obtener los datos
para analizarlos.
5. MARCO TEÓRICO.
ESTADÍSTICA DESCRIPTIVA
La estadística descriptiva se la puede definir como el conjunto de familia en las
Matemáticas que juntan, presenta y caracteriza diversos datos (ejemplo, edades de países,
altura de las personas, kilómetros de carreteras, entre otros). Con la finalidad de dar a
conocer la caracterización de diverso conjunto. (Zamora, 2003)
A los diferentes factores de los valores numéricos en un conjunto que pactan un temple
cuantitativo se denomina como una variable estadística.
Tipos de variables:
Variables cuantitativas: son las que albergan patrones numéricos (edad, precio en
cifras, años entre otros. Tal que se diversifica de las variables cualitativas que son
las que expresan cualidades. (Zamora, 2003)
Discretas: sólo pueden tomar valores enteros (1, 2, 8, -4, etc.). Por ejemplo:
número de hermanos (puede ser 1, 2, 3...., etc., pero, por ejemplo, nunca podrá ser
3.45).
Continuas: pueden tomar cualquier valor real dentro de un intervalo. Por ejemplo,
la velocidad de un vehículo puede ser 90.4 km/h, 94.57 km/h...etc.
Percentiles: Los percentiles Pi son los que dividen al conjunto en 100 partes
iguales, es decir el mismo número de valores cada uno. El percentil P50 es la
mediana. Sea (𝑋1 , 𝑋2 , … . , 𝑋𝑛 ) una muestra de N elementos. El percentil Pi es:
Medidas de Dispersión:
Las medidas de dispersión muestran como varía un conjunto de datos, mostrando donde
están mayor o menormente concentrados los datos, con respecto a las medidas de
centralización.
Rango: El Rango (R) o recorrido, es la diferencia entre el valor máximo y el valor
mínimo de un conjunto de elementos:
Tiende a converger hacia cierta cantidad que se puede interpretar como la probabilidad de
ocurrir e:
P(E) = lim fn(e) 𝑠𝑖𝑒𝑚𝑝𝑟𝑒 𝑦 𝑐𝑢𝑎𝑛𝑑𝑜 𝑒𝑠𝑡𝑒 𝑡𝑒𝑛𝑔𝑎 𝑢𝑛𝑎 𝑐𝑜𝑡𝑎 𝑠𝑢𝑝𝑒𝑟𝑖𝑜.
n→∞
HISTOGRAMA
El histograma es una manera de interpretar conjuntos de datos por una gráfica. Donde se denomina
una clase especial de diagrama de barras, en la cual las barras van unidas unas de otras, lo que no
proporciona espacio entre barras. A su vez están representadas cada barra es un espacio de un
conjunto de datos (subconjunto de datos).
Aclarando, que mediante la gráfica de un histograma podemos enseñar las distribuciones y
características de variables cuantitativas u numéricas. Donde los datos son a grupos en tamaños
propiciados, conocidos como clases mostrando las acumulaciones o tendencias.
DISTRIBUCIÓN BINOMIAL
La estadística describe, la distribución binomial como un repartimiento de las diferentes
probabilidades discretas los que pactan el número de éxitos al realizar una secuencia de n
ensayos independientes entre sí, con un evento (p) que ocurra el triunfo del suceso.
Las variables discretas son las que tienen como característica fundamental tomar un número
finito de valores que siempre se encuentra en un intervalo de dos valores de diversas
características planteadas.
La función de probabilidad de la distribución binomial, también denominada función de la
distribución de Bernoulli, se expresa con la fórmula:
𝑁
𝑃(𝑋) = ( ) ∗ 𝑃 𝑋 ∗ 𝑄 𝑁−𝑋
𝑋
Dónde:
N= es el número de pruebas o ensayos.
X= es el número esperado de éxitos.
P= es la probabilidad porcentual de éxito.
Q= es la probabilidad porcentual de fracaso, que se obtiene siempre haciendo 1 – p.
6. ANÁLISIS E INTERPRETACIÓN DE RESULTADO
Datos de lanzamientos
Para el procedimiento de los lanzamientos se izó en una cancha de baloncesto en el cual se
lanzó 250 tiros en rondas de 5; desde una distancia de 6,25 metros desde el punto del aro al
punto del lanzador lo que dio 50 datos recolectados que están distribuidos de la siguiente
manera. Los resultados se tomarán como 1 es acierto del aro y 0 es falla del aro
#1) total=1 #2) total=2 #3) total=1 #4) total=1 #5) total=1 #6) total=0 #7) total=2 #8) total=2
0 0 0 1 0 0 0 1
0 1 0 0 0 0 1 0
0 0 1 0 0 0 1 0
0 0 0 0 1 0 0 0
1 1 0 0 0 0 0 1
1 17 25 0.34 0.5
2 16 41 0.32 0.82
3 8 49 0.16 0.98
4 1 50 0.02 1
5 0 50 0 1
HISTOGRAMA
El histograma
representar la frecuencia con sus respectivos aciertos por cada ronda de 5 y su respectiva
probabilidad esto quiere decir; que hubo 8 ocasiones donde no se hizo ningún acierto; que
tuvimos 17 ocasiones de 1 acierto; 16 ocasiones de 2 aciertos; 8 ocasiones de 3 aciertos; 1
ocasiones de 4 acierto y cero ocasiones de 5 aciertos lo que indica en la tabla de frecuencia.
OJIVA
DIAGRAMA DE CAJA
Tabla 3 tenemos la tabla completa con los datos que se izó en el experimento esto se realizó por el programa Python
DIBUJO DEL HISTOGRAMA
Representación del
histograma: en el histograma
planteado con nuestro experimento donde se encuentra una distribución con variables
cuantitativas lo que produce que se pueda contar, plasmándolo en un diagrama. Este
diagrama está caracterizado por la parte inferior o eje de las (x) que tienen sus intervalos,
los que indican hasta donde ingresan variables dependiendo de un rango a otro, en el que se
reflejan en la tabla de frecuencia, la parte de las (Y) se encuentra las frecuencias que son el
numero sucesos máximos que pueden tener un intervalo.
Se puede observar que el intervalo de [0 a 0.571) cuando en los lanzamientos no se obtuvo
ningún acierto de los 5 intentos, este llego a una frecuencia de 8 lo que representa la
acumulación de los lanzamientos no encestados. Así mismo se puede concluir que el
intervalo [0.571 a 1.143) están las veces que se acertaron” una vez” de los 5 lanzamientos
que esta llego a una frecuencia de 17; en los intervalos [1.143 a 1.714) se obtuvo un valor
de 0 esto se debe a que ningún lanzamiento tiene la probabilidad de que ingrese medio
balón por ende siempre tendrá un valor de 0 (todos los datos son enteros naturales);en los
intervalos[1.714 a 2.286) en este tenemos una acumulación de datos de 16 lo que se
manifiesta como un suceso con más aciertos que son dos “2”; [2.286 a 2.857) este caso es
igual al caso de los intervalos[1.143 a 1.714) no se puede definir ya que no ingresara
ningún valor de los aciertos;[2.857 a 3.429) en este intervalo tenemos una acumulación de
aciertos de 8 y en el intervalo [3.429 a 4] solo tenemos una frecuencia de aciertos de
1;Histograma de frecuencia de los aciertos por ronda aquí representa los aciertos con su
respectiva probabilidad
ANÁLISIS DE LA OJIVA
DIAGRAMA DE CAJAS
grafica 6 realizado por con Python grafica 7 diagrama de caja de R
Análisis de caja: En el diagrama de caja para construirlos tiene diferentes representaciones
en la parte posterior va el cuartil 25 % y en la parte superior va el cuartil 75% eso es lo que
se conoce como rango intercuartil lo que indica que diferencia hay entre los aciertos del
25% al 75% la línea de color amarillo es la mediana que es el 50% y los bigotes indican si
están los concentrados entre el 25% o 75 % por eso es que se encuentra los límites de
cuartiles en nuestro experimentos casi todos los valores entraron en la caja con exención de
un valor atipado o aberrante que es el 4 representado por el punto este valor implementa la
desconformidad o no parecer relacionada con los datos de los grupos.
𝑐𝑎𝑠𝑜𝑠 𝑓𝑎𝑣𝑜𝑟𝑎𝑏𝑙𝑒𝑠
𝑃𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 𝑟𝑒𝑎𝑙 =
𝑐𝑎𝑠𝑜𝑠 𝑡𝑜𝑡𝑎𝑙𝑒𝑠
77
𝑃𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 𝑟𝑒𝑎𝑙 = → 0.308
250
Analizando se puede manifestar que la probabilidad que se teorizo fue diversamente mayor de la
que salió de forma experimental por lo que se manifiesta que debió existir contrastes que
afectaron la probabilidad teórica (balón, tiempo de juego, experiencia, etc).
ANÁLISIS DE LA DISTRIBUCIÓN DE LOS DATO.
Se puede definir que la realización y análisis de la probabilidad de obtención de los datos se
verifica con un análisis de distribución multinomial; donde solo se verifican los resultados en el
cual se tiene aciertos ya que para los resultados de las rondas de 5 tiros las que no tienen aciertos
se contaran como 0. Esto indica que se tendrá la definición de análisis del caso binomial para así
concretar el con el caso multinomial.
𝑛
𝐵(𝑥; 𝑛, 𝑝) = ( ) 𝑝 𝑥 𝑞𝑛−𝑥
𝑥
Donde,
𝑛 = 𝑛𝑢𝑚𝑒𝑟𝑜 𝑑𝑒 𝑒𝑛𝑠𝑎𝑦𝑜𝑠
𝑥 = 𝑒𝑛𝑠𝑎𝑦𝑜
𝑝 = 𝑝𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 𝑑𝑒 𝑒𝑥𝑖𝑡𝑜
𝑞 = 𝑝𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 𝑑𝑒 𝑓𝑟𝑎𝑐𝑎𝑠𝑜
Es pertinente que el análisis del proyecto se abarque todos los casos de acierto por rondas de 5
para obtener su probabilidad dando como uso la distribución multinomial, ya que esta permite
una probabilidad que 𝐸1 ocurra 𝑥1 veces , 𝐸2 ocurra 𝑥2 veces y así sucesivamente donde,
𝑥1 + 𝑥2 + 𝑥3 + ⋯ + 𝑥𝑛 = 𝑛
Establecer el uso de la distribución conjunta
𝑓(𝑥1 , 𝑥2 , 𝑥3 , … , 𝑥𝑛 ; 𝑝1 , 𝑝2 , 𝑝3 , … , 𝑝𝑘 ; 𝑛)
Puesto que las repeticiones del experimento son independientes entonces
𝑛 𝑛!
(𝑥 𝑥 , … , 𝑥 ) =
1, 2 𝑛 𝑥1 ! 𝑥2 ! … 𝑥𝑛 !
Por lo que tenemos a la distribución en forma:
𝑛 𝑥 𝑥 𝑥
𝑓(𝑥1 , 𝑥2 , 𝑥3 , … , 𝑥𝑛 ; 𝑝1 , 𝑝2 , 𝑝3 , … , 𝑝𝑘 ; 𝑛) = (𝑥 𝑥 , … , 𝑥 ) 𝑝1 1 𝑝2 2 … 𝑝𝑛 𝑛
1, 2 𝑛
Caso ideal
Donde,
𝑥1 = 𝑥2 = 𝑥3 = 𝑥4 = 𝑥5 = 𝑥6 = 8.333
𝑝1 = 𝑝2 = 𝑝3 = 𝑝4 = 𝑝5 = 𝑝6 = 0,16667
𝑛 = 50
50! (0,16676.667 )6
𝑓(𝑥1 , 𝑥2 , 𝑥3 , … , 𝑥𝑛 ; 𝑝1 , 𝑝2 , 𝑝3 , … , 𝑝𝑘 ; 𝑛) = ( )
8.333!
Media y varianza Teóricas
𝐸{𝑋𝑖 } = 8.333/5
𝐸{𝑋𝑖 } = 1.666
𝑣𝑎𝑟(𝑋𝑖 ) = 6.94
¡Debido a que la factorial es un numero flotante (con decimales) 8.333! este se procederá a
calcular la función gamma.
∞
Γ(𝑧 + 1) = ∫ 𝑡 𝑧 𝑒 𝑡 𝑑𝑡
0
∞
Γ(6.667 + 1) = ∫ 𝑡 8.333 𝑒 𝑡 𝑑𝑡
0
Γ(𝑧 + 1) = 82779.33
Ahora si procedemos a usar ese valor para calcular la probabilidad
50!
(0.166678.333 )6 = 0.000117528
8.333!6
Caso experimental
Utilizando los parámetros experimentados es donde se comenzará a utilizar la probabilidad
multinomial; excluyendo las rondas de cero debido a que no existiría probabilidad de ronda de
cero.
𝑥1 = 8 , 𝑥2 = 17 , 𝑥3 = 16, 𝑥4 = 8, 𝑥5 = 1 𝑥6 = 0
𝑝1 = 0.16, 𝑝2 = 0.34, 𝑝3 = 0,32, 𝑝4 = 0.16, 𝑝5 = 0.02, 𝑝6 = 0
𝑛 = 50
50
𝑓(𝑥1 , 𝑥2 , 𝑥3 , … , 𝑥𝑛 ; 𝑝1 , 𝑝2 , 𝑝3 , … , 𝑝𝑘 ; 𝑛) = ( ) 0.168 0.3417 0.3216 0.168 0.021
8 17 16 8 1
𝑝 = 0.001215
8. Contrastes de hipótesis
Hipótesis #1
Se compara que la media teórica es mayor que la media que se obtuvo en el experimento con un
nivel de significancia de 0.05
𝐻𝑖𝑝𝑜𝑡𝑒𝑠𝑖𝑠 𝑛𝑢𝑙𝑎 = 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎 𝑒𝑥𝑝𝑒𝑟𝑖𝑚𝑒𝑛𝑡𝑎𝑙 𝑒𝑠 𝑖𝑔𝑢𝑎𝑙 𝑞𝑢𝑒 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎 𝑡𝑒𝑜𝑟𝑖𝑐𝑎
𝐻𝑖𝑝𝑜𝑡𝑒𝑠𝑖𝑠 𝑎𝑙𝑡𝑒𝑟𝑛𝑎 = 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎 𝑒𝑥𝑝𝑒𝑟𝑖𝑚𝑒𝑛𝑡𝑎𝑙 𝑚𝑎𝑦𝑜𝑟 𝑞𝑢𝑒 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎 𝑡𝑒𝑜𝑟𝑖𝑐𝑎
𝐻𝑜 : 𝜇 = 1.666
𝐻𝑜 : 𝜇 > 1.666
𝑐𝑜𝑛 (1 − 𝛼)% 𝑞𝑢𝑒 𝑠𝑒 𝑎𝑐𝑒𝑝𝑡𝑒 𝑙𝑎 ℎ𝑖𝑝𝑜𝑡𝑒𝑠𝑖𝑠 𝑛𝑢𝑙𝑎 𝑒𝑛 𝑓𝑎𝑣𝑜𝑟 𝑑𝑒 𝑙𝑎 ℎ𝑖𝑝𝑜𝑡𝑒𝑠𝑖𝑠 𝑎𝑙𝑡𝑒𝑟𝑛𝑎 𝑠𝑖:
𝑑𝑎𝑡𝑜𝑠.
𝑍0.05 = 1.645
𝜎 = √50(0.001215)(0.998785) = 0.2453
1.54−1.666
𝑍𝑝 = 0.2453 = −3.61
√50
explicación: El punto de corte es 1,645. Cualquier puntaje z inferior a 1,645 será aceptado.
Dado que -3,61 es menor que 1,645, aceptamos la hipótesis nula
0.2463
𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑑𝑒 𝑐𝑜𝑛𝑓𝑖𝑎𝑛𝑧𝑎 = (1.66 ± ( ) (1.96)) = (1.472; 1.608)
√50
Comentarios:
Se puede concluir que la media es menor a 1.666 con un nivel de significancia de 0.05
IC: verificando que la incertidumbre que se encuentra dispersa a partir de la media de las
muestras .se obtuvo una seguridad del 90% de que la verdadera media se encuentra entre
(1.472; 1.608) y una seguridad de 95% que es menor que 1.66.
Se puede ver que hay evidencia estadística para no rechazar la hipótesis nula a criterios de la
alternante es decir que la media experimental es mayor q la teórica.
Hipótesis #2
Se desea estimar la desviación estándar del experimento para la cual esta sea menor que a la
varianza teórica a un nivel de significancia de 0.05
𝐻𝑜 = 𝑙𝑎 𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖𝑜𝑛 𝑒𝑥𝑝𝑒𝑟𝑖𝑚𝑒𝑛𝑡𝑎𝑙 𝑒𝑠 𝑖𝑔𝑢𝑎𝑙 𝑞𝑢𝑒 𝑙𝑎 𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖𝑜𝑛 𝑡𝑒𝑜𝑟𝑖𝑐𝑎
𝐻𝑎 = 𝑙𝑎 𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖𝑜𝑛 𝑒𝑥𝑝𝑒𝑟𝑖𝑚𝑒𝑛𝑡𝑎𝑙 𝑒𝑠 𝑚𝑒𝑛𝑜𝑟 𝑞𝑢𝑒 𝑙𝑎 𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖𝑜𝑛 𝑡𝑒𝑜𝑟𝑖𝑐𝑎
(𝑛 − 1)𝑠 2 (5 − 1)(1.029)
𝑒𝑐𝑢𝑎𝑐𝑖ó𝑛 = = = 0.565
𝜎2 6.94
(𝒏 − 𝟏)𝒔𝟐 𝒙𝟐 ≤ 𝝈𝟐 ≤ (𝒏 − 𝟏)𝒔𝟐 𝒙𝟐
𝜶/𝟐 ;𝒏−𝟏 𝟏−𝜶/𝟐 ;𝒏−𝟏
Intervalo de confianza=(0.380;8.75)
Comentarios:
Prueba: no se hay suficiente evidencia para decir que la desviación estándar es menor que
6.94 con un nivel de significancia de 95%
IC:a pesar que la incertidumbre asociada en la estimación de lo que es la desviación con
los datos de las muestras que está en 90% de seguridad esto indica q la desviación
estándar verdadera se encuentra en el rango =(0.380;8.75) .
Esto queda de una manera indefinida ya que cae en la zona de incertidumbre 0.1<p <0,5 lo que
representa que es dudoso establecer las hipótesis planteadas anterior mente.
Hipótesis #3
En la hipótesis 3 se plantea la prueba de bondad para verificar si es el caso que la distribución
binomial se ajusta a una distribución normar con grados de significancias de 0.0.5
𝐻𝑜 = 𝑒𝑙 𝑛𝑢𝑚𝑒𝑟𝑜 𝑑𝑒 𝑎𝑐𝑖𝑒𝑟𝑡𝑜𝑠 𝑡𝑖𝑒𝑛𝑑𝑒 𝑎 𝑢𝑛𝑎 𝑑𝑖𝑠𝑡𝑖𝑏𝑢𝑐𝑖𝑜𝑛 𝑛𝑜𝑟𝑚𝑎𝑙
𝐻𝑎 = 𝑒𝑙 𝑛𝑢𝑚𝑒𝑟𝑜 𝑑𝑒 𝑎𝑐𝑖𝑒𝑟𝑡𝑜𝑠 𝑛𝑜 𝑡𝑖𝑒𝑛𝑑𝑒 𝑎 𝑢𝑛𝑎 𝑑𝑖𝑠𝑡𝑖𝑟𝑏𝑢𝑐𝑖𝑜𝑛 𝑛𝑜𝑟𝑚𝑎𝑙
𝑐𝑜𝑛 (1 − 𝛼)% 𝑟𝑒𝑐ℎ𝑎𝑐𝑒 𝑙𝑎 ℎ𝑖𝑝𝑜𝑡𝑒𝑠𝑖𝑠 𝑛𝑢𝑙𝑎 𝑒𝑛 𝑓𝑎𝑣𝑜𝑟 𝑑𝑒 𝑙𝑎 ℎ𝑖𝑝𝑜𝑡𝑒𝑠𝑖𝑠 𝑎𝑙𝑡𝑒𝑟𝑛𝑎 𝑠𝑖:
𝑋−𝑈
Probabilidad = 𝑒𝑠𝑡𝑎𝑛𝑑𝑎𝑟𝑖𝑧𝑎𝑑𝑜 𝑎 𝑙𝑎 𝑛𝑜𝑟𝑚𝑎𝑙
𝜎
Probabilidades:
0−1.666
1. 𝑝(0 < 𝑥) = 2.63
= 0.264
1−1.666
2. 𝑝(0 < 𝑥 ≤ 1) = 2.63
= 0.13601
2−1.666
3. 𝑝(1 < 𝑥 ≤ 2) = = 0.1504
2.63
3−1.666
4. 𝑝(2 < 𝑥 ≤ 3) = 2.63
= 0.1435
4−1.666
5. 𝑝(3 < 𝑥 ≤ 4) = 2.63
= 0.1185
5−1.666
6. 𝑝(4 < 𝑥 ≤ 5) = 2.63
= 0.085
(𝑜𝑖−𝑒𝑖)2
𝑥02 = ∑𝑘𝑘
𝑖=1 𝑒𝑖
=35.33
Estadístico de prueba:
2
Ecuación=𝑋𝑎;𝑚−𝑡−1→ 𝑋2 0.05;4 →9.49
Como 35.33<9.49 se rechaza la hipótesis nula con un grado de significacioncita de 95% lo que
cumple una distribución normal.
9. Conclusiones
● Debido a que existen diversos factores que involucran en el lanzamiento hacia la canasta
este hace que tienda a fallo en ciertas cantidades pero que tiene una distribución
binomial.
● Debido a que el número de la muestra es 50 de los 250 tiros se puede aplicar lo que se
conoce como el teorema de limite central para calcular diversas distribuciones.
● Las median tiene mucha variación esto se debe a los factores que afectan al experimento
como es el balón, tiempo de juego, experiencia entre otros.
● Se puede definir que el experimento es favorecedor para aprender a estimar
distribuciones binomiales y poner en practica todo lo aprendido en el semestre.
modas = []
for i in l:
apariciones = l.count(i)
if apariciones == repeticiones and i not in modas:
modas.append(i)
return modas
def rango(l):
maximo,minimo=max(l),min(l)
return (maximo-minimo)
def intervalos(l):
k=mt.log10(len(l))
t=1+(3.332*k)
a=rango(l)/round(t)
return round(t),a
def contar(lista1,lista2):
dicc={}
for i in range(len(lista1)):
l=[]
if i < (len(lista1)-1):
t=0
for k in lista2:
if lista1[i]<=k<lista1[i+1]:
t+=1
elif lista1[i+1]==max(lista2) and max(lista2)not in l:
l.append(max(lista2))
t+=lista2.count(max(lista2))
dicc[lista1[i]]=t
return dicc
def marcaDeclases(lista1):
dicc={}
for i in range(len(lista1)):
if i < (len(lista1)-1):
t=(lista1[i]+lista1[(i+1)])/2
dicc[str(lista1[i])]=round(t,3)
return dicc
def frecuenciaRelativa(lista1,lista2):
dicc={}
for i in lista1:
valores=lista1[i]/len(lista2)
dicc[i]=round(valores,3)
t=0
for di in dicc:
t+=dicc[di]
return dicc
def frecuentaAcumulada(dic):
dicc={}
t=0
for i in dic:
t+=dic[i]
def frecuentaAcumulada(dic):
dicc={}
t=0
for i in dic:
t+=dic[i]
dicc[i]=round(t,2)
return dicc
def variana(lista):
med=media(lista)
dic=0
for i in lista:
t=(i-med)**2
dic+=t
vari=dic/(len(lista)-1)
desvicion=vari**0.5
return vari,desvicion
def cuartil25(lista):
x = 0.25 * (len(lista)+1)
x = str(x)
x1, y = x.split(".")
if y == "0":
if isinstance(round(float(x)), int):
return round(float(x1))
else:
t = "0" + y
y1 = lista[int(x1) - 1] + float(t) * (lista[int(x1)] - lista[int(x1) - 1])
return round(y1,2)
def cuartil50(lista):
x = 0.5 * (len(lista)+1)
x = str(x)
x1, y = x.split(".")
if y == "0":
if isinstance(round(float(x)), int):
return (float(x1))
else:
t = "0" + y
y1 = lista[int(x1) - 1] + float(t) * (lista[int(x1)] - lista[int(x1) - 1])
return (round(y1,2))
def cuartil75(lista):
x = 0.75 * (len(lista)+1)
x = str(x)
x1, y = x.split(".")
if y == "0":
if isinstance(round(float(x)), int):
return (round(float(x1)))
else:
t = "0" + y
y1 = lista[int(x1) - 1] + float(t) * (lista[int(x1)] - lista[int(x1) - 1])
return (round(y1,2))
Códigos HTLM
<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8">
<title>Resultados busqueda</title>
<style>
table, th, td {
border: 1px solid black;
border-collapse: collapse;
}
th, td {
padding: 5px;
}
th {
text-align: left;
}
h1,h2 {
text-align: center;
}
</style>
</head>
<body>
<h1>Tabla De Estadistica</h1>
<h2>Resultados</h2>
<table style="width:100%">
<tr>
<th>intervalos</th>
<th>frecuencia</th>
<th>marca de clases</th>
<th>frecuencia relativa</th>
<th>frecuencia acumulada</th>
<th>frecuencia relativa acumulada</th>
</table>
</body>
</html>
TABLA PARA MEDIDAS
<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8">
<title>Medidas</title>
<style>
table, th, td {
border: 1px solid black;
border-collapse: collapse;
}
th, td {
padding: 5px;
}
th {
text-align: left;
}
h1,h2 {
text-align: center;
}
</style>
</head>
<body>
<h1>Medidas</h1>
<h2>Resultados</h2>
<table
. style="width:100%">
<tr>
<th>media</th>
<th>mediana</th>
<th>moda</th>
<th>varianza</th>
<th>desviacion estandar</th>
<th>Rango</th>
<th>Amplitud</th>
<th>cualtil 25%</th>
<th>cualtil 50%</th>
<th>cualtil 75%</th>
</table>
</body>
</html>
PROGRAMAS PRINCIPAL
import prueva as pr
from matplotlib import pyplot as plt
from matplotlib import pylab as py
formas=""""<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8">
<title>Resultados busqueda</title>
<style>
table, th, td {
border: 1px solid black;
border-collapse: collapse;
}
th, td {
padding: 5px;
}
th {
text-align: left;
}
h1,h2 {
text-align: center;
}
</style>
</head>
<body>
<h1>Tabla De Estadistica</h1>
<h2>Resultados</h2>
<table style="width:100%">
<tr>
<th>intervalos</th>
<th>frecuencia</th>
<th>marca de clases</th>
<th>frecuencia relativa</th>
<th>frecuencia acumulada</th>
<th>frecuencia relativa acumulada</th>
</tr>"""
ind = '''
</table>
</body>
</html>'''
formas1='''<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8">
<title>Medidas</title>
<style>
table, th, td {
border: 1px solid black;
border-collapse: collapse;
}
th, td {
padding: 5px;
}
th {
text-align: left;
}
h1,h2 {
text-align: center;
}
</style>
</head>
<body>
<h1>Medidas</h1>
<h2>Resultados</h2>
<table style="width:100%">
<tr>
<th>media</th>
<th>mediana</th>
<th>moda</th>
<th>varianza</th>
<th>desviacion estandar</th>
<th>Rango</th>
<th>Amplitud</th>
<th>cualtil 25%</th>
<th>cualtil 50%</th>
<th>cualtil 75%</th>'''
ind1 = '''
</table>
</body>
</html>'''
lista=[1,2,1,1,1,0,2,2,2,2,1,2,1,2,1,1,1,3,1,2,0,3,2,2,3,1,2,3,1,0,2,2,3,1,0,1,3,2,3,2,1,0,0,1,0,
2,3,0,1,4]
lista.sort()
print(lista)
media, moda1, mediana1, rango1, varianza1= pr.media(lista), pr.moda(lista), pr.mediada(lista),
pr.rango(lista), pr.variana(lista)
cuar25, cuar50, cuar75= pr.cuartil25(lista), pr.cuartil50(lista), pr.cuartil75(lista)
cuar25, cuar50, cuar75= pr.cuartil25(lista), pr.cuartil50(lista), pr.cuartil75(lista)
k4=pr.intervalos(lista)
t, amplitud1= k4[0], k4[1]
l=[lista[0]]
t1=lista[0]
soma1=''
sona1= '<tr>'
sona1+= '<td>'+ str(media) + '</td>'
sona1+= '<td>' + str(mediana1) + '</td>'
sona1+= '<td>' + str(moda1[0]) + '</td>'
sona1+= '<td>' + str(varianza1[0]) + '</td>'
sona1+= '<td>' + str(varianza1[1]) + '</td>'
sona1+= '<td>' + str(rango1) + '</td>'
sona1+= '<td>' + str(amplitud1) + '</td>'
sona1+= '<td>' + str(cuar25) + '</td>'
sona1+= '<td>' + str(mediana1) + '</td>'
sona1+= '<td>' + str(cuar75) + '</td>'
sona1+= '</tr>'
formas1+= sona1
import os
import webbrowser
CWD = os.getcwd()
f = open("medidas.html", mode="w")
f.write(formas1+ ind1)
webbrowser.open_new('file://' + CWD + '/' + 'medidas.html')
f.close()
for i in range(t):
t1+=amplitud1
l.append(round(t1,3))
varianza1=pr.contar(l, lista)
cua=pr.marcaDeclases(l)
frecuencia=pr.frecuenciaRelativa(varianza1, lista)
frAcum=pr.frecuentaAcumulada(varianza1)
fracumr=pr.frecuentaAcumulada(frecuencia)
soma=""
for media in range(len(l)-1):
k10=l[media]
sona = '<tr>'
sona += '<td>' + "["+str(l[media]) + "-" + str(l[media + 1]) + ")" + '</td>'
sona += '<td>' + str(varianza1[k10]) + '</td>'
sona += '<td>' + str(cua[str(k10)]) + '</td>'
sona += '<td>' + str(frecuencia[k10]) + '</td>'
sona += '<td>' + str(frAcum[k10]) + '</td>'
sona += '<td>' + str(fracumr[k10]) + '</td>'
sona += '</tr>'
formas += sona
import os
import webbrowser
CWD = os.getcwd()
f = open("estadistica.html", mode="w")
f.write(formas+ ind)
webbrowser.open_new('file://' + CWD + '/' + 'estadistica.html')
f.close()
histo=plt.hist(lista,bins=5)
plt.title("Gráfica histograma")
plt.show()
caja=plt.boxplot(lista,sym="ko")
plt.title("Gráfica diagrama de caja")
plt.show()
PROGRAMA PRINCIPAL PARA LA OJIVA
from matplotlib import pyplot as plt
lista=[0.16,0.5,0.82,0.98,1,1]
plt.title("Gráfica ojiva ")
plt.plot(lista, color='r', marker='o',linestyle='--',label = "Aciertos")
plt.show()
import pandas as pd
from matplotlib import pyplot as plt
import numpy as np
from scipy.interpolate import interp1d
sales=pd.read_csv("base de aciertos.txt",delim_whitespace=True)
t=sales["LanzamientosReales"]
print(t.describe())
x=sales.ix[:,0]
y=sales.ix[:,1]
plt.plot(x,y,"ro")
plt.ylabel("aciertos")
plt.xlabel("rondas")
plt.show()
coeficientes=np.polyfit(x,y,1)
polinomio=np.poly1d(coeficientes)
print(polinomio)
f=interp1d(x,y,1)
print(f(50))
ys=polinomio(x)
plt.plot(x,ys)
plt.show()