Sie sind auf Seite 1von 36

ESCUELA SUPERIOR POLITÉCNICA DEL LITORAL

PROYECTO DE ESTADISTICA

TÍTULO DEL PROYECTO:

ESTADISTICA DESCRIPTIVA

ESTUDIANTES:

 KAREN JULIANA RIERA GUARACA


 TAFT RAUL RAMOS LOPEZ
 BYRON CRISANTO ALVARADO MARTIN
 ERICK JOSUE GUADAMUD SOLEDISPA
 BRAYAN ANDRE ORDONEZ BUELE

GUAYAQUIL

ECUADOR
2017-2018
1. INDICE
1. INTRODUCCIÓN ........................................................................................................................... 3
2. Objetivo general: ......................................................................................................................... 4
3. Metodología ................................................................................................................................ 4
4. MARCO TEÓRICO. ........................................................................................................................ 5
 ESTADÍSTICA DESCRIPTIVA .................................................................................................. 5
 Medidas de tendencia central:............................................................................................ 6
 Medidas de tendencia no central: ...................................................................................... 7
 Medidas de Dispersión: ....................................................................................................... 8
 EXPERIMENTOS ALEATORIOS Y PROBABILIDAD .................................................................. 9
 HISTOGRAMA ...................................................................................................................... 9
 DISTRIBUCIÓN BINOMIAL.................................................................................................. 10
5. ANÁLISIS E INTERPRETACIÓN DE RESULTADO .......................................................................... 11
 ANÁLISIS DE LA TABLA DE FRECUENCIA ............................................................................ 13
 HISTOGRAMA .................................................................................................................... 13
................................................................................................................................................ 13
 OJIVA ................................................................................................................................. 14
 DIAGRAMA DE CAJA .......................................................................................................... 14
 TABLA CON REGLA DE STURGES........................................................................................ 15
 DIBUJO DEL HISTOGRAMA ................................................................................................ 16
 ANÁLISIS DE LA OJIVA........................................................................................................ 17
 DIAGRAMA DE CAJAS ........................................................................................................ 17
6. Análisis de probabilidad teórica y experimental ....................................................................... 18
 ANÁLISIS DE LA DISTRIBUCIÓN DE LOS DATO. .................................................................. 20
 Caso ideal .......................................................................................................................... 21
 Caso experimental............................................................................................................. 22
7. Contrastes de hipótesis ............................................................................................................. 22
 Hipótesis #1 ....................................................................................................................... 22
 Hipótesis #2 ....................................................................................................................... 23
 Hipótesis #3 ....................................................................................................................... 25
8. Conclusiones.............................................................................................................................. 26
9. IMÁGENES DE LOS LANZAMIENTOS .......................................................................................... 27
2. INTRODUCCIÓN

El presente proyecto estadístico tiene como objetivo evaluar los diferentes conceptos
adquiridos durante todo el curso de la materia de Estadísticas; con un grupo de cinco
estudiantes haciendo uso de una cancha de básquet en la Escuela Superior Politécnica
Superior realizando cuarenta rondas, cada una de cinco tiros y poder calcular el número de
aciertos al hacer canasta a una distancia de 6,25 metros, haciendo así una recolección de
datos, y convertir los mismos al lenguaje estadístico y hacer la respectiva interpretación de
los valores verificados en el análisis complementando el estudio bibliográfico en la teoría
expuesta.

Se hará la creación de líneas de códigos en Python, donde se programará el proyecto


estadístico con cada paso requerido en el mismo. El primer capítulo presenta un
seguimiento de los diferentes conceptos aprendidos al principio del curso como la tabla de
frecuencia, las medidas de tendencias central, las diferentes graficas tal como la ojiva; entre
otros.

Después conlleva a hacer el análisis de probabilidades de fracaso y de éxito tanto teóricas


como experimentales con los diferentes tiros que se realizaban en cada ronda mediante la
aplicación de las distribuciones muéstrales, en este caso la distribución binomial, y por
último se realizarán diferentes contrastes de hipótesis en dicho experimento y se comparará
los resultados estadísticos experimentales con los resultados estadísticos teóricos.
3. Objetivo general:
 Analizar los datos estadísticos obtenidos a partir de la experimentación y el uso de
los cálculos sobre estadística descriptiva previamente vistos.

Objetivos específicos:

 Realizar la tabla de frecuencias con cada uno de los elementos que la conforman.
 Dibujar el histograma, la ojiva y el diagrama de cajas.
 Calcular la media, varianza, desviación estándar, cuartiles.
 Realizar la interpretación de los gráficos realizados.

4. Metodología
Se va a realizar el lanzamiento de un balón de básquet hacia el aro de una cancha
reglamentaria desde una posición fija que cumpla con la condición de distancia al aro de
6.25 metros (3 puntos), mediante rondas de 5 tiros se van a registrar los aciertos que se
obtienen hasta completar los 250 lanzamientos y así obtener el porcentaje de acierto real.

Mediante los cálculos estudiados sobre estadística descriptiva se van a obtener los datos
para analizarlos.
5. MARCO TEÓRICO.

 ESTADÍSTICA DESCRIPTIVA
La estadística descriptiva se la puede definir como el conjunto de familia en las
Matemáticas que juntan, presenta y caracteriza diversos datos (ejemplo, edades de países,
altura de las personas, kilómetros de carreteras, entre otros). Con la finalidad de dar a
conocer la caracterización de diverso conjunto. (Zamora, 2003)
A los diferentes factores de los valores numéricos en un conjunto que pactan un temple
cuantitativo se denomina como una variable estadística.
Tipos de variables:

 Variables cualitativas o categóricas: Son valores de distintas variables que se


caracterizan por categorías o conjunto el cual se puede alterar eh excluir (mutable
excluyente). Los factores categóricos tienen o no una diversidad lógica (por
ejemplo: nación, color de ojos, sexo). (Zamora, 2003)

 Variables cuantitativas: son las que albergan patrones numéricos (edad, precio en
cifras, años entre otros. Tal que se diversifica de las variables cualitativas que son
las que expresan cualidades. (Zamora, 2003)

Las variables también se pueden clasificar en:

 Variables unidimensionales: sólo recogen información sobre una característica


(por ejemplo: edad de los alumnos de una clase).

 Variables bidimensionales: recogen información sobre dos características de la


población (por ejemplo: edad y altura de los alumnos de una clase).

 Variables pluridimensionales: recogen información sobre tres o más


características (por ejemplo: edad, altura y peso de los alumnos de una clase).
Por su parte, las variables cuantitativas se pueden clasificar en discretas y continuas:

 Discretas: sólo pueden tomar valores enteros (1, 2, 8, -4, etc.). Por ejemplo:
número de hermanos (puede ser 1, 2, 3...., etc., pero, por ejemplo, nunca podrá ser
3.45).

 Continuas: pueden tomar cualquier valor real dentro de un intervalo. Por ejemplo,
la velocidad de un vehículo puede ser 90.4 km/h, 94.57 km/h...etc.

Para estudiar comportamiento se distinguen los siguientes conceptos:

 Individuo: se denomina a cualquier sujeto que tenga indagación con respecto a


diversos patrones o fenómenos que se desea estudiar. Dando qué; si se estudia la
altura de un colegio, cada individuo (alumno) tendrá su medida; como si se verifica
el precio de una vivienda, se denotaría cada vivienda como un elemento (individuo).

 Población: es la distribución de todos los elementos o individuos de una


determinada población o conjunto de elemento a estudiar, (personas, objetos,
animales, ente otros). Que den manifiestos específicos sobre el fenómeno que se
desea estudiar. Por ejemplo, si se desea saber cuál será el precio de una casa en
alguna ciudad, la población de este suceso serán todas las viviendas de la ciudad.

 Muestra: subconjunto que seleccionado de una población. Por ejemplo, si se


estudia el precio de la vivienda de una ciudad, lo normal será no recoger
información sobre todas las viviendas de la ciudad.

 MEDIDAS DE TENDENCIA CENTRAL:


Las medidas de tendencia central son medidas que tratan de localizas la parte central del
conjunto de datos cualitativos.
 Media: la media de un conjunto se define como un valor característico que es
resultado de la suma de todos los datos obtenidos dividido para el número total de
datos:
∑𝑁
𝑖=1 𝑋𝑖
̅=
𝑀𝑒𝑑𝑖𝑎 (𝑋) = 𝒳
𝑁
Donde (𝑋1 , 𝑋2 , … . , 𝑋𝑛 ) son el conjunto de observaciones o datos.

 Medidas de tendencia no central:


Las medidas de tendencia no central permiten conocer valores del conjunto de datos que no
necesariamente sean los centrales, con la intención de dividir el conjunto en grupo de datos
con el mismo número de valores, entre estos tenemos:
 Cuartiles: Los cuartiles son valores que dividen el conjunto en cuatro grupos de
igual tamaño, el primer cuartil Q1 tiene el 25% de datos a su izquierda, el segundo
cuartil Q2, entre su izquierda y derecha el 50% de datos, y el tercer cuartil Q3 el
25% a su derecha, estos se definen de la siguiente manera:

 Percentiles: Los percentiles Pi son los que dividen al conjunto en 100 partes
iguales, es decir el mismo número de valores cada uno. El percentil P50 es la
mediana. Sea (𝑋1 , 𝑋2 , … . , 𝑋𝑛 ) una muestra de N elementos. El percentil Pi es:
 Medidas de Dispersión:
Las medidas de dispersión muestran como varía un conjunto de datos, mostrando donde
están mayor o menormente concentrados los datos, con respecto a las medidas de
centralización.
 Rango: El Rango (R) o recorrido, es la diferencia entre el valor máximo y el valor
mínimo de un conjunto de elementos:

 Rango Intercuartílico (IQR): Es una medida de dispersión estadística, y es la


diferencia entre el tercer cuartil y el primero:

 Varianza (𝑺𝟐 ): La varianza mide la dispersión de los datos de un conjunto de


muestra con respecto a la media, y se define de la siguiente manera:

 Desviación Estándar (S): es una medida de dispersión de la media y mide el


promedio de las desviaciones de los datos con respecto a la media y se define como:

El cuadrado de la desviación estándar es la varianza.


 EXPERIMENTOS ALEATORIOS Y PROBABILIDAD
Se llaman condiciones deterministas a los que desempeñan de una misma manera y con las
igualdades de forma principales. Dando de forma singular el mismo resultado. Planteando
un contraste, se tiene que un objeto de masa (m) que sale desde el reposo, y siendo atraído
por la gravedad desde un edificio, siempre llego al suelo con la misma velocidad con la que
parte tomando la formula v = √2gh. Cuanto no se puede definir el resultado final este se
considera aleatorios. Se puede considerar uno de los experimentos más usados para indicar
la aleatoriedad como es el dado lanado este dependerá de diversos factores. Dando sucesos
continuos eh estudios predeterminado se observa que cuando el número de suceso aumenta,
las frecuencias relativas con las que ocurre cierto suceso e, Fn (e),
𝑁𝑢𝑚𝑒𝑟𝑜 𝑑𝑒 𝑂𝑐𝑢𝑟𝑟𝑒𝑛𝑐𝑖𝑎𝑠 𝑑𝑒 𝑒
Fn (e) = 𝑛

𝑁𝑢𝑚𝑒𝑟𝑜 𝑑𝑒 𝑜𝑐𝑢𝑟𝑟𝑒𝑛𝑐𝑖𝑎
∑ → 𝑎 𝑙𝑎 𝑐𝑜𝑛𝑣𝑒𝑟𝑔𝑒𝑛𝑐𝑖𝑎 𝑜𝑠ℎ𝑒𝑎 𝑞𝑢𝑒 𝑡𝑒𝑛𝑔𝑎 𝑢𝑛𝑎 𝑐𝑜𝑡𝑎
𝑛
0

𝑑𝑜𝑛𝑑𝑒 𝑡𝑒𝑟𝑚𝑖𝑛𝑎𝑟𝑎 𝑙𝑎 𝑠𝑒𝑟𝑖𝑒 𝑒𝑛 𝑒𝑙 𝑐𝑎𝑠𝑜 𝑑𝑒 𝑒𝑠𝑡𝑎𝑑𝑖𝑠𝑡𝑖𝑐𝑎; 𝑒𝑠 𝑐𝑢𝑎𝑛𝑑𝑜 𝑠𝑒 𝑡𝑒𝑟𝑚𝑖𝑛𝑎 𝑒𝑙 𝑠𝑢𝑐𝑒𝑠𝑜 𝑎𝑙𝑒𝑎𝑡𝑜𝑟𝑖𝑜

Tiende a converger hacia cierta cantidad que se puede interpretar como la probabilidad de
ocurrir e:
P(E) = lim fn(e) 𝑠𝑖𝑒𝑚𝑝𝑟𝑒 𝑦 𝑐𝑢𝑎𝑛𝑑𝑜 𝑒𝑠𝑡𝑒 𝑡𝑒𝑛𝑔𝑎 𝑢𝑛𝑎 𝑐𝑜𝑡𝑎 𝑠𝑢𝑝𝑒𝑟𝑖𝑜.
n→∞

 HISTOGRAMA
El histograma es una manera de interpretar conjuntos de datos por una gráfica. Donde se denomina
una clase especial de diagrama de barras, en la cual las barras van unidas unas de otras, lo que no
proporciona espacio entre barras. A su vez están representadas cada barra es un espacio de un
conjunto de datos (subconjunto de datos).
Aclarando, que mediante la gráfica de un histograma podemos enseñar las distribuciones y
características de variables cuantitativas u numéricas. Donde los datos son a grupos en tamaños
propiciados, conocidos como clases mostrando las acumulaciones o tendencias.
 DISTRIBUCIÓN BINOMIAL
La estadística describe, la distribución binomial como un repartimiento de las diferentes
probabilidades discretas los que pactan el número de éxitos al realizar una secuencia de n
ensayos independientes entre sí, con un evento (p) que ocurra el triunfo del suceso.
Las variables discretas son las que tienen como característica fundamental tomar un número
finito de valores que siempre se encuentra en un intervalo de dos valores de diversas
características planteadas.
La función de probabilidad de la distribución binomial, también denominada función de la
distribución de Bernoulli, se expresa con la fórmula:
𝑁
𝑃(𝑋) = ( ) ∗ 𝑃 𝑋 ∗ 𝑄 𝑁−𝑋
𝑋
Dónde:
N= es el número de pruebas o ensayos.
X= es el número esperado de éxitos.
P= es la probabilidad porcentual de éxito.
Q= es la probabilidad porcentual de fracaso, que se obtiene siempre haciendo 1 – p.
6. ANÁLISIS E INTERPRETACIÓN DE RESULTADO
 Datos de lanzamientos
Para el procedimiento de los lanzamientos se izó en una cancha de baloncesto en el cual se
lanzó 250 tiros en rondas de 5; desde una distancia de 6,25 metros desde el punto del aro al
punto del lanzador lo que dio 50 datos recolectados que están distribuidos de la siguiente
manera. Los resultados se tomarán como 1 es acierto del aro y 0 es falla del aro
#1) total=1 #2) total=2 #3) total=1 #4) total=1 #5) total=1 #6) total=0 #7) total=2 #8) total=2
 0  0  0  1  0  0  0  1
 0  1  0  0  0  0  1  0
 0  0  1  0  0  0  1  0
 0  0  0  0  1  0  0  0
 1  1  0  0  0  0  0  1

#9) total=2 #10) #11) #12) #13) #14) #15) #16)


 0 Total=2 Total=1 Total=2 Total=1 Total=2 Total=1 Total=1
 1  1  0  0  0  1  0  0
 0  1  0  1  1  0  0  0
 0  0  0  0  0  0  0  1
 1  0  1  0  0  0  1  0
 0  0  1  0  1  0  0
#17) #18) #19) #20) #21) #22) #23) #24)
Total=1 Total=3 Total=1 Total=2 Total=0 Total=3 Total=2 Total=2
 1  1  0  1  0  1  0  0
 0  0  0  1  0  1  1  0
 0  1  0  0  0  0  1  0
 0  0  0  0  0  0  0  1
 0  1  1  0  0  1  0  1
#25) #26) #27) #28) #29) #30) #31) #32)
Total=3 Total=1 Total=2 Total=3 Total=1 Total=0 Total=2 Total=2
 1  0  0  0  0  0  1  0
 0  0  1  1  0  0  0  0
 0  0  0  0  0  0  0  0
 1  1  0  1  1  0  1  1
 1  0  1  1  0  0  0  1
#33) #34) #35) #36) #37) #38) #39) #40)
Total=3 Total= 1 Total=0 Total=1 Total=3 Total=2 Total=3 Total=2
 1  0  0  0  1  0  0  1
 0  0  0  0  1  0  1  0
 1  1  0  1  0  0  0  0
 0  0  0  0  0  1  1  1
 1  0  0  0  1  1  1  0
#41) #42) #43) #44) #45) #46) #47) #48)
Total=1 Total=0 Total=0 Total=1 Total=0 Total= 2 Total=3 Total=0
 0  0  0  0  0  0  1  0
 1  0  0  0  0  1  0  0
 0  0  0  0  0  0  1  0
 0  0  0  0  0  1  0  0
 0  0  0  1  0  0  1  0
#49) #50)
Total=1 Total=4
 0  1
 0  0
 1  1
 0  1
 0  1
 ANÁLISIS DE LA TABLA DE FRECUENCIA
TABLA CON ACIERTOS DEL 1 AL 5
aciertos Frecuencia absoluta Frecuencia Frecuencia Frecuencia relativa
absoluta relativa acumulada
acumulada
0 8 8 0.16 0.16

1 17 25 0.34 0.5

2 16 41 0.32 0.82

3 8 49 0.16 0.98

4 1 50 0.02 1
5 0 50 0 1

 HISTOGRAMA

El histograma
representar la frecuencia con sus respectivos aciertos por cada ronda de 5 y su respectiva
probabilidad esto quiere decir; que hubo 8 ocasiones donde no se hizo ningún acierto; que
tuvimos 17 ocasiones de 1 acierto; 16 ocasiones de 2 aciertos; 8 ocasiones de 3 aciertos; 1
ocasiones de 4 acierto y cero ocasiones de 5 aciertos lo que indica en la tabla de frecuencia.
 OJIVA

Si en el eje de las Y de la gráfica de la


ojiva se multiplicara por 100 esto
representarían los porcentajes de cada
valor en sus respectivos aciertos lo que
también indicaría sus respectivos
cuartiles en cada punto esto se puede
evidenciar por punto.
Lo que sucede en primer punto es que es
0.16 de 1; en el siguiente está en el 0.5
de 1; el que sigue en el 0.82 de 1; y los
últimos puntos van de 1 a 1

 DIAGRAMA DE CAJA

En el diagrama de caja para construirlos


tiene diferentes representaciones en la
parte posterior va el cuartil 25 % y en la
parte superior va el cuartil 75% eso es lo
que se conoce como rango intercuartil lo
que indica que diferencia hay entre los
aciertos del 25% al 75% la línea de color
amarillo es la mediana que es el 50% y los
bigotes indican si están los concentrados
entre el 25% o 75 % por eso es que se encuentra los límites de cuartiles en nuestro
experimentos casi todos los valores entraron en la caja con exención de un valor atipado o
aberrante que es el 4 representado por el punto este valor implementa la desconformidad o
no parecer relacionada con los datos de los grupos.

 TABLA CON REGLA DE STURGES


En la tabla de frecuencia tenemos que calcular:
I. 𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠: 𝑘 = 1 + 3.332log(𝑁) cálculos los intervalos con la regla de
STURGES → 𝑘 = 1 + 3.332 log(50) = 6.66 ≈ 7
II. 𝑅𝑎𝑛𝑔𝑜: 𝑣𝑎𝑙𝑜𝑟(𝑚𝑎𝑥𝑖𝑚𝑜) − 𝑣𝑎𝑙𝑜𝑟(𝑚𝑖𝑛𝑖𝑚𝑜) = 4 − 0 → 4
𝑟𝑎𝑛𝑔𝑜 4
III. Amplitud: = 7 → 0.571428
𝑘 Tabla 2 tenemos los rangos y la
IV. Tablas de frecuencias fórmulas de calcular: amplitud calculados con Python

Tabla 1: se puede observar cómo se calcula una tabla de frecuencia completa

Tabla 3 tenemos la tabla completa con los datos que se izó en el experimento esto se realizó por el programa Python
 DIBUJO DEL HISTOGRAMA

Diagrama 3) histograma realizado en Python

Representación del
histograma: en el histograma
planteado con nuestro experimento donde se encuentra una distribución con variables
cuantitativas lo que produce que se pueda contar, plasmándolo en un diagrama. Este
diagrama está caracterizado por la parte inferior o eje de las (x) que tienen sus intervalos,
los que indican hasta donde ingresan variables dependiendo de un rango a otro, en el que se
reflejan en la tabla de frecuencia, la parte de las (Y) se encuentra las frecuencias que son el
numero sucesos máximos que pueden tener un intervalo.
Se puede observar que el intervalo de [0 a 0.571) cuando en los lanzamientos no se obtuvo
ningún acierto de los 5 intentos, este llego a una frecuencia de 8 lo que representa la
acumulación de los lanzamientos no encestados. Así mismo se puede concluir que el
intervalo [0.571 a 1.143) están las veces que se acertaron” una vez” de los 5 lanzamientos
que esta llego a una frecuencia de 17; en los intervalos [1.143 a 1.714) se obtuvo un valor
de 0 esto se debe a que ningún lanzamiento tiene la probabilidad de que ingrese medio
balón por ende siempre tendrá un valor de 0 (todos los datos son enteros naturales);en los
intervalos[1.714 a 2.286) en este tenemos una acumulación de datos de 16 lo que se
manifiesta como un suceso con más aciertos que son dos “2”; [2.286 a 2.857) este caso es
igual al caso de los intervalos[1.143 a 1.714) no se puede definir ya que no ingresara
ningún valor de los aciertos;[2.857 a 3.429) en este intervalo tenemos una acumulación de
aciertos de 8 y en el intervalo [3.429 a 4] solo tenemos una frecuencia de aciertos de
1;Histograma de frecuencia de los aciertos por ronda aquí representa los aciertos con su
respectiva probabilidad
 ANÁLISIS DE LA OJIVA

Si en el eje de las Y de la gráfica de la


ojiva se multiplicara por 100 esto
representarían los porcentajes de cada
valor en sus respectivos aciertos lo que
también indicaría sus respectivos
cuartiles en cada punto esto se puede
evidenciar por punto.
La gran diferencia en esta ojiva que se
hizo con los datos según la regla de

Ilustración 4 realizado en python


sturges para sacar intervalos es que en
diversos factores o intervalos no
encontramos eventos (aciertos de los 5 tiros) es por eso que en ciertos puntos tenemos una
línea recta contante, pero si esos puntos los unimos obtendremos la misma relación que el
primer grafico lo que indica que el teorema es correcto.

Tabla 5 datos calculados con el programa Python

 DIAGRAMA DE CAJAS
grafica 6 realizado por con Python grafica 7 diagrama de caja de R
Análisis de caja: En el diagrama de caja para construirlos tiene diferentes representaciones
en la parte posterior va el cuartil 25 % y en la parte superior va el cuartil 75% eso es lo que
se conoce como rango intercuartil lo que indica que diferencia hay entre los aciertos del
25% al 75% la línea de color amarillo es la mediana que es el 50% y los bigotes indican si
están los concentrados entre el 25% o 75 % por eso es que se encuentra los límites de
cuartiles en nuestro experimentos casi todos los valores entraron en la caja con exención de
un valor atipado o aberrante que es el 4 representado por el punto este valor implementa la
desconformidad o no parecer relacionada con los datos de los grupos.

7. Análisis de probabilidad teórica y experimental


Para el proyecto se utilizó de manera intuitiva una probabilidad, que manejamos en el margen de
0,39 donde producimos la representación de los datos para luego sacar la probabilidad por medio
de casos favorables sobre casos totales
Rondas Lanzamientos Lanzamientos
Reales Totales
1 1 5
2 2 5
3 1 5
4 1 5
5 1 5
6 0 5
7 2 5
8 2 5
9 2 5
10 2 5
11 1 5
12 2 5
13 1 5
14 2 5
15 1 5
16 1 5
17 1 5
18 3 5
19 1 5
20 2 5
21 0 5
22 3 5
23 2 5
24 2 5
25 3 5
26 1 5
27 2 5
28 3 5
29 1 5
30 0 5
31 2 5
32 2 5
33 3 5
34 1 5
35 0 5
36 1 5
37 3 5
38 2 5
39 3 5
40 2 5
41 1 5
42 0 5
43 0 5
44 1 5
45 0 5
46 2 5
47 3 5
48 0 5
49 1 5
50 4 5
TOTAL 77 250

𝑐𝑎𝑠𝑜𝑠 𝑓𝑎𝑣𝑜𝑟𝑎𝑏𝑙𝑒𝑠
𝑃𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 𝑟𝑒𝑎𝑙 =
𝑐𝑎𝑠𝑜𝑠 𝑡𝑜𝑡𝑎𝑙𝑒𝑠
77
𝑃𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 𝑟𝑒𝑎𝑙 = → 0.308
250
Analizando se puede manifestar que la probabilidad que se teorizo fue diversamente mayor de la
que salió de forma experimental por lo que se manifiesta que debió existir contrastes que
afectaron la probabilidad teórica (balón, tiempo de juego, experiencia, etc).
 ANÁLISIS DE LA DISTRIBUCIÓN DE LOS DATO.
Se puede definir que la realización y análisis de la probabilidad de obtención de los datos se
verifica con un análisis de distribución multinomial; donde solo se verifican los resultados en el
cual se tiene aciertos ya que para los resultados de las rondas de 5 tiros las que no tienen aciertos
se contaran como 0. Esto indica que se tendrá la definición de análisis del caso binomial para así
concretar el con el caso multinomial.
𝑛
𝐵(𝑥; 𝑛, 𝑝) = ( ) 𝑝 𝑥 𝑞𝑛−𝑥
𝑥
Donde,
𝑛 = 𝑛𝑢𝑚𝑒𝑟𝑜 𝑑𝑒 𝑒𝑛𝑠𝑎𝑦𝑜𝑠
𝑥 = 𝑒𝑛𝑠𝑎𝑦𝑜
𝑝 = 𝑝𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 𝑑𝑒 𝑒𝑥𝑖𝑡𝑜
𝑞 = 𝑝𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 𝑑𝑒 𝑓𝑟𝑎𝑐𝑎𝑠𝑜
Es pertinente que el análisis del proyecto se abarque todos los casos de acierto por rondas de 5
para obtener su probabilidad dando como uso la distribución multinomial, ya que esta permite
una probabilidad que 𝐸1 ocurra 𝑥1 veces , 𝐸2 ocurra 𝑥2 veces y así sucesivamente donde,
𝑥1 + 𝑥2 + 𝑥3 + ⋯ + 𝑥𝑛 = 𝑛
Establecer el uso de la distribución conjunta
𝑓(𝑥1 , 𝑥2 , 𝑥3 , … , 𝑥𝑛 ; 𝑝1 , 𝑝2 , 𝑝3 , … , 𝑝𝑘 ; 𝑛)
Puesto que las repeticiones del experimento son independientes entonces
𝑛 𝑛!
(𝑥 𝑥 , … , 𝑥 ) =
1, 2 𝑛 𝑥1 ! 𝑥2 ! … 𝑥𝑛 !
Por lo que tenemos a la distribución en forma:
𝑛 𝑥 𝑥 𝑥
𝑓(𝑥1 , 𝑥2 , 𝑥3 , … , 𝑥𝑛 ; 𝑝1 , 𝑝2 , 𝑝3 , … , 𝑝𝑘 ; 𝑛) = (𝑥 𝑥 , … , 𝑥 ) 𝑝1 1 𝑝2 2 … 𝑝𝑛 𝑛
1, 2 𝑛

 Caso ideal
Donde,
𝑥1 = 𝑥2 = 𝑥3 = 𝑥4 = 𝑥5 = 𝑥6 = 8.333
𝑝1 = 𝑝2 = 𝑝3 = 𝑝4 = 𝑝5 = 𝑝6 = 0,16667
𝑛 = 50
50! (0,16676.667 )6
𝑓(𝑥1 , 𝑥2 , 𝑥3 , … , 𝑥𝑛 ; 𝑝1 , 𝑝2 , 𝑝3 , … , 𝑝𝑘 ; 𝑛) = ( )
8.333!
Media y varianza Teóricas
𝐸{𝑋𝑖 } = 8.333/5
𝐸{𝑋𝑖 } = 1.666
𝑣𝑎𝑟(𝑋𝑖 ) = 6.94

¡Debido a que la factorial es un numero flotante (con decimales) 8.333! este se procederá a
calcular la función gamma.

Γ(𝑧 + 1) = ∫ 𝑡 𝑧 𝑒 𝑡 𝑑𝑡
0

Γ(6.667 + 1) = ∫ 𝑡 8.333 𝑒 𝑡 𝑑𝑡
0

Γ(𝑧 + 1) = 82779.33
Ahora si procedemos a usar ese valor para calcular la probabilidad
50!
(0.166678.333 )6 = 0.000117528
8.333!6
 Caso experimental
Utilizando los parámetros experimentados es donde se comenzará a utilizar la probabilidad
multinomial; excluyendo las rondas de cero debido a que no existiría probabilidad de ronda de
cero.
𝑥1 = 8 , 𝑥2 = 17 , 𝑥3 = 16, 𝑥4 = 8, 𝑥5 = 1 𝑥6 = 0
𝑝1 = 0.16, 𝑝2 = 0.34, 𝑝3 = 0,32, 𝑝4 = 0.16, 𝑝5 = 0.02, 𝑝6 = 0
𝑛 = 50
50
𝑓(𝑥1 , 𝑥2 , 𝑥3 , … , 𝑥𝑛 ; 𝑝1 , 𝑝2 , 𝑝3 , … , 𝑝𝑘 ; 𝑛) = ( ) 0.168 0.3417 0.3216 0.168 0.021
8 17 16 8 1
𝑝 = 0.001215

8. Contrastes de hipótesis
 Hipótesis #1
Se compara que la media teórica es mayor que la media que se obtuvo en el experimento con un
nivel de significancia de 0.05
𝐻𝑖𝑝𝑜𝑡𝑒𝑠𝑖𝑠 𝑛𝑢𝑙𝑎 = 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎 𝑒𝑥𝑝𝑒𝑟𝑖𝑚𝑒𝑛𝑡𝑎𝑙 𝑒𝑠 𝑖𝑔𝑢𝑎𝑙 𝑞𝑢𝑒 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎 𝑡𝑒𝑜𝑟𝑖𝑐𝑎
𝐻𝑖𝑝𝑜𝑡𝑒𝑠𝑖𝑠 𝑎𝑙𝑡𝑒𝑟𝑛𝑎 = 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎 𝑒𝑥𝑝𝑒𝑟𝑖𝑚𝑒𝑛𝑡𝑎𝑙 𝑚𝑎𝑦𝑜𝑟 𝑞𝑢𝑒 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎 𝑡𝑒𝑜𝑟𝑖𝑐𝑎
𝐻𝑜 : 𝜇 = 1.666
𝐻𝑜 : 𝜇 > 1.666
𝑐𝑜𝑛 (1 − 𝛼)% 𝑞𝑢𝑒 𝑠𝑒 𝑎𝑐𝑒𝑝𝑡𝑒 𝑙𝑎 ℎ𝑖𝑝𝑜𝑡𝑒𝑠𝑖𝑠 𝑛𝑢𝑙𝑎 𝑒𝑛 𝑓𝑎𝑣𝑜𝑟 𝑑𝑒 𝑙𝑎 ℎ𝑖𝑝𝑜𝑡𝑒𝑠𝑖𝑠 𝑎𝑙𝑡𝑒𝑟𝑛𝑎 𝑠𝑖:
𝑑𝑎𝑡𝑜𝑠.
𝑍0.05 = 1.645
𝜎 = √50(0.001215)(0.998785) = 0.2453
1.54−1.666
𝑍𝑝 = 0.2453 = −3.61
√50
explicación: El punto de corte es 1,645. Cualquier puntaje z inferior a 1,645 será aceptado.
Dado que -3,61 es menor que 1,645, aceptamos la hipótesis nula

0.2463
𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑑𝑒 𝑐𝑜𝑛𝑓𝑖𝑎𝑛𝑧𝑎 = (1.66 ± ( ) (1.96)) = (1.472; 1.608)
√50
Comentarios:
 Se puede concluir que la media es menor a 1.666 con un nivel de significancia de 0.05
 IC: verificando que la incertidumbre que se encuentra dispersa a partir de la media de las
muestras .se obtuvo una seguridad del 90% de que la verdadera media se encuentra entre
(1.472; 1.608) y una seguridad de 95% que es menor que 1.66.

Se puede ver que hay evidencia estadística para no rechazar la hipótesis nula a criterios de la
alternante es decir que la media experimental es mayor q la teórica.

 Hipótesis #2
Se desea estimar la desviación estándar del experimento para la cual esta sea menor que a la
varianza teórica a un nivel de significancia de 0.05
𝐻𝑜 = 𝑙𝑎 𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖𝑜𝑛 𝑒𝑥𝑝𝑒𝑟𝑖𝑚𝑒𝑛𝑡𝑎𝑙 𝑒𝑠 𝑖𝑔𝑢𝑎𝑙 𝑞𝑢𝑒 𝑙𝑎 𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖𝑜𝑛 𝑡𝑒𝑜𝑟𝑖𝑐𝑎
𝐻𝑎 = 𝑙𝑎 𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖𝑜𝑛 𝑒𝑥𝑝𝑒𝑟𝑖𝑚𝑒𝑛𝑡𝑎𝑙 𝑒𝑠 𝑚𝑒𝑛𝑜𝑟 𝑞𝑢𝑒 𝑙𝑎 𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖𝑜𝑛 𝑡𝑒𝑜𝑟𝑖𝑐𝑎
(𝑛 − 1)𝑠 2 (5 − 1)(1.029)
𝑒𝑐𝑢𝑎𝑐𝑖ó𝑛 = = = 0.565
𝜎2 6.94
(𝒏 − 𝟏)𝒔𝟐 𝒙𝟐 ≤ 𝝈𝟐 ≤ (𝒏 − 𝟏)𝒔𝟐 𝒙𝟐
𝜶/𝟐 ;𝒏−𝟏 𝟏−𝜶/𝟐 ;𝒏−𝟏

Intervalo de confianza=(0.380;8.75)

Comentarios:
 Prueba: no se hay suficiente evidencia para decir que la desviación estándar es menor que
6.94 con un nivel de significancia de 95%
 IC:a pesar que la incertidumbre asociada en la estimación de lo que es la desviación con
los datos de las muestras que está en 90% de seguridad esto indica q la desviación
estándar verdadera se encuentra en el rango =(0.380;8.75) .

Esto queda de una manera indefinida ya que cae en la zona de incertidumbre 0.1<p <0,5 lo que
representa que es dudoso establecer las hipótesis planteadas anterior mente.
 Hipótesis #3
En la hipótesis 3 se plantea la prueba de bondad para verificar si es el caso que la distribución
binomial se ajusta a una distribución normar con grados de significancias de 0.0.5
𝐻𝑜 = 𝑒𝑙 𝑛𝑢𝑚𝑒𝑟𝑜 𝑑𝑒 𝑎𝑐𝑖𝑒𝑟𝑡𝑜𝑠 𝑡𝑖𝑒𝑛𝑑𝑒 𝑎 𝑢𝑛𝑎 𝑑𝑖𝑠𝑡𝑖𝑏𝑢𝑐𝑖𝑜𝑛 𝑛𝑜𝑟𝑚𝑎𝑙
𝐻𝑎 = 𝑒𝑙 𝑛𝑢𝑚𝑒𝑟𝑜 𝑑𝑒 𝑎𝑐𝑖𝑒𝑟𝑡𝑜𝑠 𝑛𝑜 𝑡𝑖𝑒𝑛𝑑𝑒 𝑎 𝑢𝑛𝑎 𝑑𝑖𝑠𝑡𝑖𝑟𝑏𝑢𝑐𝑖𝑜𝑛 𝑛𝑜𝑟𝑚𝑎𝑙
𝑐𝑜𝑛 (1 − 𝛼)% 𝑟𝑒𝑐ℎ𝑎𝑐𝑒 𝑙𝑎 ℎ𝑖𝑝𝑜𝑡𝑒𝑠𝑖𝑠 𝑛𝑢𝑙𝑎 𝑒𝑛 𝑓𝑎𝑣𝑜𝑟 𝑑𝑒 𝑙𝑎 ℎ𝑖𝑝𝑜𝑡𝑒𝑠𝑖𝑠 𝑎𝑙𝑡𝑒𝑟𝑛𝑎 𝑠𝑖:

aciertos frecuencia probabilidad Frecuencia Ei


0 8 0.264 13.2
1 17 0.1360 6.8
2 16 0.1504 7.52
3 8 0.1435 7.175
4 1 0.1185 5.925
5 0 0.085 4.25

𝑋−𝑈
Probabilidad = 𝑒𝑠𝑡𝑎𝑛𝑑𝑎𝑟𝑖𝑧𝑎𝑑𝑜 𝑎 𝑙𝑎 𝑛𝑜𝑟𝑚𝑎𝑙
𝜎

Probabilidades:
0−1.666
1. 𝑝(0 < 𝑥) = 2.63
= 0.264
1−1.666
2. 𝑝(0 < 𝑥 ≤ 1) = 2.63
= 0.13601
2−1.666
3. 𝑝(1 < 𝑥 ≤ 2) = = 0.1504
2.63
3−1.666
4. 𝑝(2 < 𝑥 ≤ 3) = 2.63
= 0.1435
4−1.666
5. 𝑝(3 < 𝑥 ≤ 4) = 2.63
= 0.1185
5−1.666
6. 𝑝(4 < 𝑥 ≤ 5) = 2.63
= 0.085

(𝑜𝑖−𝑒𝑖)2
 𝑥02 = ∑𝑘𝑘
𝑖=1 𝑒𝑖
=35.33

Estadístico de prueba:
2
Ecuación=𝑋𝑎;𝑚−𝑡−1→ 𝑋2 0.05;4 →9.49

Como 35.33<9.49 se rechaza la hipótesis nula con un grado de significacioncita de 95% lo que
cumple una distribución normal.
9. Conclusiones
● Debido a que existen diversos factores que involucran en el lanzamiento hacia la canasta
este hace que tienda a fallo en ciertas cantidades pero que tiene una distribución
binomial.
● Debido a que el número de la muestra es 50 de los 250 tiros se puede aplicar lo que se
conoce como el teorema de limite central para calcular diversas distribuciones.
● Las median tiene mucha variación esto se debe a los factores que afectan al experimento
como es el balón, tiempo de juego, experiencia entre otros.
● Se puede definir que el experimento es favorecedor para aprender a estimar
distribuciones binomiales y poner en practica todo lo aprendido en el semestre.

10. IMÁGENES DE LOS LANZAMIENTOS


Referencias:
 Distribución Binomial de Probabilidades, (s.f). Profesor en Línea. Extraído de
http://www.profesorenlinea.cl/matematica/Distribucion_binomial.html.
 Modelos de Probabilidad Discretos, (s.f). Universidad de Granada. Granada, Es.
Extraído de : http://www.ugr.es/~bioestad/_private/Tema_4_color.pdf
 Estadística Descriptiva, (s.f). Universo de Formulas. Extraído de:
http://www.universoformulas.com/estadistica/descriptiva/.
 Autor: Dr. José Miguel Becerra Espinoza, (s.f). Matemáticas en Línea. Universidad
Nacional Autónoma de México. Ciudad de México, Mx. Extraído de:
http://132.248.164.227/publicaciones/docs/apuntes_matematicas/34.%20Estadistica
%20Descriptiva.pdf.
Programas echo en Python con un escritor llamado pycharm
Funciones:
import math as mt
def media(lista):
suma=sum(lista)/len(lista)
return suma
def mediada(l):
l.sort()
if len(l) % 2 == 0:
n ,n1= len(l),round(len(l)/2)
mediana =(l[n1-1]+l[n1])/2
return mediana
else:
mediana = l[len(l)/2]
return mediana
def moda(l):
repeticiones = 0
for i in l:
apariciones = l.count(i)
if apariciones > repeticiones:
repeticiones = apariciones

modas = []
for i in l:
apariciones = l.count(i)
if apariciones == repeticiones and i not in modas:
modas.append(i)
return modas
def rango(l):
maximo,minimo=max(l),min(l)
return (maximo-minimo)
def intervalos(l):
k=mt.log10(len(l))
t=1+(3.332*k)
a=rango(l)/round(t)
return round(t),a
def contar(lista1,lista2):
dicc={}
for i in range(len(lista1)):
l=[]
if i < (len(lista1)-1):
t=0
for k in lista2:
if lista1[i]<=k<lista1[i+1]:
t+=1
elif lista1[i+1]==max(lista2) and max(lista2)not in l:
l.append(max(lista2))
t+=lista2.count(max(lista2))
dicc[lista1[i]]=t
return dicc
def marcaDeclases(lista1):
dicc={}
for i in range(len(lista1)):
if i < (len(lista1)-1):
t=(lista1[i]+lista1[(i+1)])/2
dicc[str(lista1[i])]=round(t,3)
return dicc
def frecuenciaRelativa(lista1,lista2):
dicc={}
for i in lista1:
valores=lista1[i]/len(lista2)
dicc[i]=round(valores,3)
t=0
for di in dicc:
t+=dicc[di]
return dicc
def frecuentaAcumulada(dic):
dicc={}
t=0
for i in dic:
t+=dic[i]
def frecuentaAcumulada(dic):
dicc={}
t=0
for i in dic:
t+=dic[i]
dicc[i]=round(t,2)
return dicc
def variana(lista):
med=media(lista)
dic=0
for i in lista:
t=(i-med)**2
dic+=t
vari=dic/(len(lista)-1)
desvicion=vari**0.5
return vari,desvicion
def cuartil25(lista):
x = 0.25 * (len(lista)+1)
x = str(x)
x1, y = x.split(".")
if y == "0":
if isinstance(round(float(x)), int):
return round(float(x1))
else:
t = "0" + y
y1 = lista[int(x1) - 1] + float(t) * (lista[int(x1)] - lista[int(x1) - 1])
return round(y1,2)
def cuartil50(lista):
x = 0.5 * (len(lista)+1)
x = str(x)
x1, y = x.split(".")
if y == "0":
if isinstance(round(float(x)), int):
return (float(x1))
else:
t = "0" + y
y1 = lista[int(x1) - 1] + float(t) * (lista[int(x1)] - lista[int(x1) - 1])
return (round(y1,2))
def cuartil75(lista):
x = 0.75 * (len(lista)+1)
x = str(x)
x1, y = x.split(".")
if y == "0":
if isinstance(round(float(x)), int):
return (round(float(x1)))
else:
t = "0" + y
y1 = lista[int(x1) - 1] + float(t) * (lista[int(x1)] - lista[int(x1) - 1])
return (round(y1,2))
Códigos HTLM

PLANTILLA PARA LA TABLA DE FRECUENCIA

<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8">
<title>Resultados busqueda</title>
<style>
table, th, td {
border: 1px solid black;
border-collapse: collapse;
}
th, td {
padding: 5px;
}
th {
text-align: left;
}
h1,h2 {
text-align: center;
}
</style>
</head>
<body>
<h1>Tabla De Estadistica</h1>
<h2>Resultados</h2>
<table style="width:100%">
<tr>
<th>intervalos</th>
<th>frecuencia</th>
<th>marca de clases</th>
<th>frecuencia relativa</th>
<th>frecuencia acumulada</th>
<th>frecuencia relativa acumulada</th>

</table>
</body>
</html>
TABLA PARA MEDIDAS

<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8">
<title>Medidas</title>
<style>
table, th, td {
border: 1px solid black;
border-collapse: collapse;
}
th, td {
padding: 5px;
}
th {
text-align: left;
}
h1,h2 {
text-align: center;
}
</style>
</head>
<body>
<h1>Medidas</h1>
<h2>Resultados</h2>
<table
. style="width:100%">
<tr>
<th>media</th>
<th>mediana</th>
<th>moda</th>
<th>varianza</th>
<th>desviacion estandar</th>
<th>Rango</th>
<th>Amplitud</th>
<th>cualtil 25%</th>
<th>cualtil 50%</th>
<th>cualtil 75%</th>
</table>
</body>
</html>

PROGRAMAS PRINCIPAL

import prueva as pr
from matplotlib import pyplot as plt
from matplotlib import pylab as py
formas=""""<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8">
<title>Resultados busqueda</title>
<style>
table, th, td {
border: 1px solid black;
border-collapse: collapse;
}
th, td {
padding: 5px;
}
th {
text-align: left;
}
h1,h2 {
text-align: center;
}
</style>
</head>
<body>
<h1>Tabla De Estadistica</h1>
<h2>Resultados</h2>
<table style="width:100%">
<tr>
<th>intervalos</th>
<th>frecuencia</th>
<th>marca de clases</th>
<th>frecuencia relativa</th>
<th>frecuencia acumulada</th>
<th>frecuencia relativa acumulada</th>
</tr>"""
ind = '''
</table>
</body>
</html>'''
formas1='''<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8">
<title>Medidas</title>
<style>
table, th, td {
border: 1px solid black;
border-collapse: collapse;
}
th, td {
padding: 5px;
}
th {
text-align: left;
}
h1,h2 {
text-align: center;
}
</style>
</head>
<body>
<h1>Medidas</h1>
<h2>Resultados</h2>
<table style="width:100%">
<tr>
<th>media</th>
<th>mediana</th>
<th>moda</th>
<th>varianza</th>
<th>desviacion estandar</th>
<th>Rango</th>
<th>Amplitud</th>
<th>cualtil 25%</th>
<th>cualtil 50%</th>
<th>cualtil 75%</th>'''
ind1 = '''
</table>
</body>
</html>'''
lista=[1,2,1,1,1,0,2,2,2,2,1,2,1,2,1,1,1,3,1,2,0,3,2,2,3,1,2,3,1,0,2,2,3,1,0,1,3,2,3,2,1,0,0,1,0,
2,3,0,1,4]
lista.sort()
print(lista)
media, moda1, mediana1, rango1, varianza1= pr.media(lista), pr.moda(lista), pr.mediada(lista),
pr.rango(lista), pr.variana(lista)
cuar25, cuar50, cuar75= pr.cuartil25(lista), pr.cuartil50(lista), pr.cuartil75(lista)
cuar25, cuar50, cuar75= pr.cuartil25(lista), pr.cuartil50(lista), pr.cuartil75(lista)
k4=pr.intervalos(lista)
t, amplitud1= k4[0], k4[1]
l=[lista[0]]
t1=lista[0]
soma1=''
sona1= '<tr>'
sona1+= '<td>'+ str(media) + '</td>'
sona1+= '<td>' + str(mediana1) + '</td>'
sona1+= '<td>' + str(moda1[0]) + '</td>'
sona1+= '<td>' + str(varianza1[0]) + '</td>'
sona1+= '<td>' + str(varianza1[1]) + '</td>'
sona1+= '<td>' + str(rango1) + '</td>'
sona1+= '<td>' + str(amplitud1) + '</td>'
sona1+= '<td>' + str(cuar25) + '</td>'
sona1+= '<td>' + str(mediana1) + '</td>'
sona1+= '<td>' + str(cuar75) + '</td>'
sona1+= '</tr>'
formas1+= sona1
import os
import webbrowser
CWD = os.getcwd()
f = open("medidas.html", mode="w")
f.write(formas1+ ind1)
webbrowser.open_new('file://' + CWD + '/' + 'medidas.html')
f.close()
for i in range(t):
t1+=amplitud1
l.append(round(t1,3))
varianza1=pr.contar(l, lista)
cua=pr.marcaDeclases(l)
frecuencia=pr.frecuenciaRelativa(varianza1, lista)
frAcum=pr.frecuentaAcumulada(varianza1)
fracumr=pr.frecuentaAcumulada(frecuencia)
soma=""
for media in range(len(l)-1):
k10=l[media]
sona = '<tr>'
sona += '<td>' + "["+str(l[media]) + "-" + str(l[media + 1]) + ")" + '</td>'
sona += '<td>' + str(varianza1[k10]) + '</td>'
sona += '<td>' + str(cua[str(k10)]) + '</td>'
sona += '<td>' + str(frecuencia[k10]) + '</td>'
sona += '<td>' + str(frAcum[k10]) + '</td>'
sona += '<td>' + str(fracumr[k10]) + '</td>'
sona += '</tr>'
formas += sona
import os
import webbrowser
CWD = os.getcwd()
f = open("estadistica.html", mode="w")
f.write(formas+ ind)
webbrowser.open_new('file://' + CWD + '/' + 'estadistica.html')
f.close()
histo=plt.hist(lista,bins=5)
plt.title("Gráfica histograma")
plt.show()
caja=plt.boxplot(lista,sym="ko")
plt.title("Gráfica diagrama de caja")
plt.show()
PROGRAMA PRINCIPAL PARA LA OJIVA
from matplotlib import pyplot as plt
lista=[0.16,0.5,0.82,0.98,1,1]
plt.title("Gráfica ojiva ")
plt.plot(lista, color='r', marker='o',linestyle='--',label = "Aciertos")
plt.show()

PROGRAMA PARA ALINEAR LA MUESTRA DE BONDAD

import pandas as pd
from matplotlib import pyplot as plt
import numpy as np
from scipy.interpolate import interp1d
sales=pd.read_csv("base de aciertos.txt",delim_whitespace=True)
t=sales["LanzamientosReales"]
print(t.describe())
x=sales.ix[:,0]
y=sales.ix[:,1]
plt.plot(x,y,"ro")
plt.ylabel("aciertos")
plt.xlabel("rondas")
plt.show()
coeficientes=np.polyfit(x,y,1)
polinomio=np.poly1d(coeficientes)
print(polinomio)
f=interp1d(x,y,1)
print(f(50))
ys=polinomio(x)
plt.plot(x,ys)
plt.show()

PROGRAMA PARA LA PRUEVA DE HIPOTESIS 3 DISTRIBUCION NORMAL


import matplotlib.pyplot as plt # importando matplotlib
import seaborn as sns # importando seaborn
import numpy as np
mu, sigma = 1.54, 1.014 # media y desvio estandar
lista=[1,2,1,1,1,0,2,2,2,2,1,2,1,2,1,1,1,3,1,2,0,3,2,2,3,1,2,3,1,0,2,2,3,1,0,1,3,2,3,2,1
,0,0,1,0,2,3,0,1,4]
# histograma de distribución normal.
cuenta, cajas, ignorar = plt.hist(lista, 5, normed=True)
normal = plt.plot(cajas, 1/(sigma * np.sqrt(2 * np.pi)) *
np.exp( - (cajas - mu)**2 / (2 * sigma**2) ),
linewidth=2, color='r',marker='o')
plt.show()

Das könnte Ihnen auch gefallen