Sie sind auf Seite 1von 15

ESCUELA SUPERIOR POLITECNICA

DEL LITORAL

Proyecto de Estadística

Integrantes:
Santiago Córdova
Lilibeth Ruiz
Jean Carlos Romero

Profesora:
Pamela Crow

Par: 14

2017-2018
ÍNDICE
INTRODUCCIÓN ............................................................................................................................. 2
OBJETIVOS ..................................................................................................................................... 3
Objetivo principal ..................................................................................................................... 3
Objetivo secundario ................................................................................................................. 3
MARCO TEÓRICO ........................................................................................................................... 3
METODOLOGÍA .............................................................................................................................. 5
ESTADÍSTICA DESCRIPTIVA............................................................................................................. 5
Tabla de frecuencias ................................................................................................................. 6
Medias de tendencia central .................................................................................................... 6
media..................................................................................................................................... 6
Mediana ................................................................................................................................ 6
Medias de dispersión ............................................................................................................... 6
Varianza ................................................................................................................................. 6
Desviación estándar .............................................................................................................. 7
Cuartiles .................................................................................................................................... 7
Rango Intercuartil.................................................................................................................. 7
Bigotes ................................................................................................................................... 7
DIAGRAMA DE CAJAS ............................................................................................................... 7
HISTOGRAMA ........................................................................................................................... 8
OJIVA ......................................................................................................................................... 8
CÁLCULOS DE PROBABILIDAD .......................................................................................................... 9
Probabilidad experimental....................................................................................................... 9
Probabilidad teórica ............................................................................................................... 10
ESTADÍSTICA INFERENCIAL .......................................................................................................... 11
Contraste de hipótesis............................................................................................................ 11
CONCLUSIONES ........................................................................................................................... 13
RECOMENDACIONES ................................................................................................................... 13
ANEXOS........................................................................................................................................ 14

1
INTRODUCCIÓN
En el siguiente proyecto se busca probar la distribución binomial y con este fin se harán
los contrastes de hipótesis necesarios, se hacen 200 lanzamientos al arco con un
portero, desde una distancia de 16.5m estos lanzamientos se deberán realizar en 40
rondas de 5 lanzamientos cada uno y con cada uno de estos datos se procederá a realizar
los cálculos posteriores.

Lo primero a realizar será una tabla de frecuencias de cada uno de los 6 posibles
resultados en cada ronda lo cual registra la cantidad de veces la cantidad de veces que
se acertó un tiro; luego se procederá con los cálculos correspondientes a estadística
descriptiva tales como histogramas, ojivas, medias, varianzas, desviación estándar,
cuartiles y diagrama de cajas.

Para el cálculo de la distribución binomial se deberá asumir un porcentaje de éxito el


cual nos permitirá obtener la probabilidad de cada resultado el cual debe ser comparado
con los resultados obtenidos en el experimento. La media y la varianza teórica se
calculará utilizando los resultados del experimento y se comparará con los datos de la
simulación para determinar la existencia de una diferencia estadística significativa.

2
OBJETIVOS
Objetivo principal
probar la distribución binomial y efectuar algunos contrastes de hipótesis realizando un
experimento.
Objetivo secundario
Aplicar los conocimientos adquiridos durante el curso de estadística general para
ingeniería.

MARCO TEÓRICO
estadística descriptiva
es la técnica matemática que obtiene, organiza, presenta y describe un conjunto de
datos con el propósito de facilitar su uso generalmente con el apoyo de tablas, medidas
numéricas o gráficas. Además, calcula parámetros estadísticos como las medidas de
centralización y de dispersión que describen el conjunto estudiado. [1]
Medidas de tendencia central
Al describir grupos de diferentes observaciones, con frecuencia es conveniente resumir
la información con un solo número. Este número que, para tal fin, suele situarse hacia
el centro de la distribución de datos se denomina medida o parámetro de tendencia
central o de centralización. Cuando se hace referencia únicamente a la posición de estos
parámetros dentro de la distribución, independientemente de que esté más o menos
centrada, se habla de estas medidas como medidas de posición.1 En este caso se
incluyen también los cuantiles entre estas medidas. [2]
Media
En matemáticas y estadística una media o promedio es una medida de tendencia
central que según la Real Academia Española (2001) «[…] resulta al efectuar una serie
determinada de operaciones con un conjunto de números y que, en determinadas
condiciones, puede representar por sí solo a todo el conjunto». Existen distintos tipos
de medias, tales como la media geométrica, la media ponderada y la media
armónica aunque en el lenguaje común, el término se refiere generalmente a la media
aritmética [3]
Mediana
En el ámbito de la estadística, la mediana (del latín mediānus 'del medio'1) representa
el valor de la variable de posición central en un conjunto de datos ordenados. [4]
Medidas de dispersión
Las medidas de dispersión muestran la variabilidad de una distribución, indicándolo por
medio de un número, si las diferentes puntuaciones de una variable están muy alejadas
de la media. Cuanto mayor sea ese valor, mayor será la variabilidad, cuanto menor sea,
más homogénea será a la media. Así se sabe si todos los casos son parecidos o varían
mucho entre ellos. [5]
Varianza
en teoría de probabilidad, la varianza o variancia (que suele representarse como ) de
una variable aleatoria es una medida de dispersión definida como la esperanza del

3
cuadrado de la desviación de dicha variable respecto a su media. O en pocas palabras,
es la media de los residuos al cuadrado. [6]
Distribución de frecuencia
En estadística, se le llama distribución de frecuencias a la agrupación de datos en
categorías mutuamente excluyentes que indican el número de observaciones en cada
categoría.1 Esto proporciona un valor añadido a la agrupación de datos. La distribución
de frecuencias presenta las observaciones clasificadas de modo que se pueda ver el
número existente en cada clase. [7]
Histograma
En estadística, un histograma es una representación gráfica de una variable en forma de
barras, donde la superficie de cada barra es proporcional a la frecuencia de los valores
representados. Sirven para obtener una "primera vista" general, o panorama, de la
distribución de la población, o de la muestra, respecto a una característica, cuantitativa
y continua (como la longitud o el peso). De esta manera ofrece una visión de grupo
permitiendo observar una preferencia, o tendencia, por parte de la muestra o población
por ubicarse hacia una determinada región de valores dentro del espectro de valores
posibles (sean infinitos o no) que pueda adquirir la característica. Así pues, podemos
evidenciar comportamientos, observar el grado de homogeneidad, acuerdo o concisión
entre los valores de todas las partes que componen la población o la muestra, o, en
contraposición, poder observar el grado de variabilidad, y por ende, la dispersión de
todos los valores que toman las partes, también es posible no evidenciar ninguna
tendencia y obtener que cada miembro de la población toma por su lado y adquiere un
valor de la característica aleatoriamente sin mostrar ninguna preferencia o tendencia,
entre otras cosas. [8]
OJIVA
En estadística la ojiva es un polígono frecuencial acumulado, es decir, que permite ver
cuántas observaciones se encuentran por encima o debajo de ciertos valores, en lugar
de solo exhibir los números asignados a cada intervalo. [9]

Distribución binomial
En estadística, la distribución binomial es una distribución de probabilidad discreta que
cuenta el número de éxitos en una secuencia de n ensayos de Bernoulli independientes
entre sí, con una probabilidad fija p de ocurrencia del éxito entre los ensayos. Un
experimento de Bernoulli se caracteriza por ser dicotómico, esto es, solo dos resultados
son posibles. A uno de estos se denomina «éxito» y tiene una probabilidad de
ocurrencia p y al otro, «fracaso», con una probabilidad q = 1 - p.2En la distribución
binomial el anterior experimento se repite n veces, de forma independiente, y se trata
de calcular la probabilidad de un determinado número de éxitos. Para n = 1, la binomial
se convierte, de hecho, en una distribución de Bernoulli. [10]
Contraste de hipótesis
Dentro de la inferencia estadística, un contraste de hipótesis (también
denominado test de hipótesis o prueba de significación) es un procedimiento para
juzgar si una propiedad que se supone en una población estadística es compatible con

4
lo observado en una muestra de dicha población. Fue iniciada por Ronald Fisher y
fundamentada posteriormente por Jerzy Neyman y Karl Pearson.
Mediante esta teoría, se aborda el problema estadístico considerando una hipótesis

determinada y una hipótesis alternativa , y se intenta dirimir cuál de las dos


es la hipótesis verdadera, tras aplicar el problema estadístico a un cierto número
de experimentos.
Está fuertemente asociada al concepto estadístico de potencia y a los conceptos
de errores de tipo I y II, que definen respectivamente, la posibilidad de tomar un suceso
falso como verdadero, o uno verdadero como falso.
Los tipos más importantes son los test centrados, de hipótesis y alternativa simple,
aleatorizados, etc. Dentro de los tests no paramétricos, el más extendido es
probablemente el test de la U de Mann-Whitney. [11]

METODOLOGÍA

ESTADÍSTICA DESCRIPTIVA
Datos: 40 rondas con 5 intentos de tiros al arco cada uno
RONDAS ACIERTOS RONDAS ACIERTOS
1 0 21 1
2 1 22 4
3 0 23 1
4 2 24 1
5 0 25 0
6 1 26 2
7 0 27 3
8 3 28 2
9 0 29 1
10 0 30 0
11 1 31 2
12 0 32 2
13 0 33 1
14 0 34 2
15 0 35 0
16 1 36 2
17 0 37 3
18 1 38 1
19 0 39 2
20 0 40 3

En ninguna de la ronda se logró acertar los 5 tiros al arco.


Se procede a ordenar los datos obtenidos en el experimento de forma ascendente:

5
0000000000000000111111111112222222233334

Tabla de frecuencias
n = 40
Se realiza la tabla de frecuencia colocando como marca de clase los posibles resultados
que se pueden obtener en cada ronda

TABLA DE FRECUENCIA
Resultados posibles Frecuencia absoluta Frecuencia relativa
0 16 0.400
1 11 0.275
2 8 0.200
3 4 0.100
4 1 0.025
5 0 0

Medias de tendencia central


media
para el cálculo de la media sumamos todos los aciertos y lo dividimos para el numero de
rondas

𝑁
𝑥𝑖 (0 ∗ 16) + (1 ∗ 11) + (2 ∗ 8) + (3 ∗ 4) + (4 ∗ 1)
∑ = = 1.075
𝑁 40
𝑖=1

Mediana
Es lo mismo que el segundo cuartil por lo que se procederá a calcular en la sección de
medias de dispersión
Q2=mediana=1

Medias de dispersión
Varianza
Para la varianza se utilizará la fórmula de la varianza muestral

6
Varianza (σ2) =
𝑁
(𝑥𝑖 − 𝑥̅ )2 16(0 − 1.075)2 + 11(1 − 1.075)2 + 8(2 − 1.075)2 + 4(3 − 1.075)2 + (4 − 1.075)2
∑ = = 1.251
𝑁−1 40 − 1
𝑖=1

Desviación estándar
𝜎 = √𝜎 2 = 1.118

Cuartiles
el cálculo de los cuartiles nos ayudara para realizar el diagrama de cajas
Cuartil 1= Q1=𝑋(0.25(𝑛+1)) = 𝑋(0.25∗41) = 𝑋10.25

Como el subíndice es 10.25, se aplica la siguiente fórmula y se usa la tabla de datos


recolectados:
𝑋(𝑖,𝑎) = 𝑋𝑖 + 0, 𝑎(𝑋(𝑖+1) − 𝑋𝑖 ) = 𝑋10.25 = 𝑋10 + 0,25(𝑋11 − 𝑋10 ) =

0 + 0,25(0 − 0) = 0

Cuartil 2= Q2=𝑋20.5
𝑋20.5 = 1 + 0.5(1 − 1) = 1

Cuartil 3 = Q3=𝑋30.75
𝑋30.75 = 2 + 0.75(2 − 2) = 2

Rango Intercuartil
R.I.=Q3 –Q1=2-0=0

Bigotes
Xmin= 𝑄1 − 1.5(𝑅𝐼) = 0 − 1.5𝑥2= -3

Xmax=𝑄3 + 1.5(𝑅𝐼) = 2 + 1.5𝑥2 = 5

DIAGRAMA DE CAJAS

7
Xmin=-3 Q1=0 Q2=1 Q3=2 Xmax=5

Interpretación:
Como el primer cuartil comienza en cero que es el mínimo real del experimento el Xmin
calculado no tiene un sentido real en el experimento y a su vez el Xmax es el número
máximo de aciertos posibles, además se nota que la agrupación de datos se da entre 0
y 2 aciertos por experimento
HISTOGRAMA

histograma
18
16
14
frecuencia absoluta

12
10
8
6
4
2
0
0 1 2 3 4 5
numero de acierto

Interpretación:
Muestra un sesgo positivo porque la distribución tiene una cola larga hacia la derecha,
eso quiere decir que la mayoría de los lanzamientos no fueron aciertos por lo que se
puede inferir que el goleador era muy mal pateador o el portero era muy bueno
OJIVA

ojiva
1.2
frecuencia relativa acumulada

0.8

0.6

0.4

0.2

0
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5
numero de aciertos

8
Interpretación:
se puede observar que como la ojiva no comienza con una frecuencia acumulada de 0.4
por lo cual en un 40% de los intentos no hubo ningún acierto y que en todos los ensayos
no hubo un solo intento en el cual se lograse acertar los 5 tiros al arco

CÁLCULOS DE PROBABILIDAD
Probabilidad experimental
El valor de la probabilidad “p” se calcula con la fórmula de la media considerando el n
como total de lanzamientos realizados en el experimento(n=200)
𝑁
𝑥𝑖 (0 ∗ 16) + (1 ∗ 11) + (2 ∗ 8) + (3 ∗ 4) + (4 ∗ 1)
𝑝=∑ = = 0.215
𝑁 200
𝑖=1

Se procede a calcular la probabilidad utilizando la fórmula de la distribución binomial en


el cual:
𝑛
𝑏(𝑥, 𝑛, 𝑝) = ( ) 𝑝 𝑥 (1 − 𝑝)𝑛−𝑥
𝑥
X= al número de aciertos en cada ronda
n= total de lanzamientos en cada ronda
 x=0 y n=5

b(0,5,0.215)= (50)0.2150 ∗ (1 − 0.215)5 = 0.298

 x=1 y n=5

b(1,5, 0.215)= (51)0.2151 ∗ (1 − 0.215)4 = 0.408

 x=2 y n=5

b(2,50.215)= (52)0.2152 ∗ (1 − 0.215)3 = 0.224

 x=3 y n=5

b(3,5, 0.215)= (53)0.2153 ∗ (1 − 0.215)2 = 0.061

 x=4 y n=5

b(4,5, 0.215)= (54)0.2154 ∗ (1 − 0.215)1 = 8.387𝑥10−3

 x=5 y n=5

b(5,5, 0.215)= (55)0.2155 ∗ (1 − 0.215)0 = 4.594𝑥10−4

9
Probabilidad teórica
el valor de probabilidad “p” que se utilizará en estos calculo será el que se nos pidió
suponer en el documento p = 0.45
𝑛
𝑏(𝑥, 𝑛, 𝑝) = ( ) 𝑝 𝑥 (1 − 𝑝)𝑛−𝑥
𝑥
 x=0 y n=5

b(0,5,0.45)= (50)04.50 ∗ 0. 5535 = 0.050

 x=1 y n=5

b(1,5,0.45)= (51)0.451 ∗ 0.554 =0.206

 x=2 y n=5

b(2,5,0.45)= (52)0.452 ∗ 0.553 = 0.337

 x=3 y n=5

b(3,5,0.45)= (53)0.453 ∗ 0.552 = 0.276

 x=4 y n=5

b(4,5,0.45)= (54)0.454 ∗ 0.551 = 0.113

 x=5 y n=5

b(5,5,0.45)= (55)0.455 ∗ 0.550 = 0.018

Interpretación de resultados:

Media
Teórica
𝜇=np=5*0.215=1.075

Experimental
𝑁
𝑥𝑖 (0 ∗ 16) + (1 ∗ 11) + (2 ∗ 8) + (3 ∗ 4) + (4 ∗ 1)
∑ = = 1.075
𝑁 40
𝑖=1

Interpretación de resultados:

Varianza
Teórica
σ2=npq =5*0.215*(1-0.215) =0.844

10
Experimental
𝑁
(𝑥𝑖 − 𝑥̅ )2 16(0 − 1.075)2 + 11(1 − 1.075)2 + 8(2 − 1.075)2 + 4(3 − 1.075)2 + (4 − 1.075)2
∑ = = 1.251
𝑁−1 40 − 1
𝑖=1

Interpretación de resultados:

ESTADÍSTICA INFERENCIAL
Se calculará la media y varianza de la distribución binomial para que con estos datos poder
hacer el contraste de hipótesis acerca de la diferencia de medias

Calculo de la varianza

Varianza experiemental= 𝜎12 =npq =5*45456*564153=57.316


Media experiemtal: 𝜇=np=5*=89
Varianza teorica= 𝜎22 =npq =5*0.45*0.55=1.238
Media teorica: 𝜇=np=5*0.45= 2.250
Contraste de hipótesis
𝜇1 : 𝑚𝑒𝑑𝑖𝑎 𝑡𝑒𝑜𝑟𝑖𝑐𝑎
𝜇2 : 𝑚𝑒𝑑𝑖𝑎 𝑒𝑥𝑝𝑒𝑟𝑖𝑚𝑒𝑛𝑡𝑎𝑙

Ho: 𝜇1 − 𝜇2 = 0
H1: 𝜇1 − 𝜇2 ≠ 0
Estadístico de prueba:
(𝑥̅1 − 𝑥̅2 ) − 𝑑
𝑧= 𝑧 < −𝑧𝛼 𝑦 𝑧 > 𝑧𝛼
2 2
𝜎2 𝜎22
√ 1 +
𝑛1 𝑛2

Donde d tiende a 0
(1,075 − 2.250) − 0
𝑧=
√0,844 + 1.238
5 5
Z=-1,784

11
Conclusión:

Como el estadístico de prueba no cayo en nuestra región de rechazo entoces se puede aceptar
Ho por lo que se puede concluir que no hay diferencia estadísticamente significativa

Prueba de bondad e ajuste


Se verificará que los resultados del experimento se ajustan a una variable normal por lo
que, se utilizará la prueba de bondad de ajuste en donde X es la variable aleatoria y:
Prueba de bondad

Ho: X tiene distribución normal


H1: X no tiene distribución normal

𝑁
𝑥𝑖 (0 ∗ 16) + (1 ∗ 11) + (2 ∗ 8) + (3 ∗ 4) + (4 ∗ 1)
∑ = = 1.075
𝑁 40
𝑖=1

Para calcular la probabilidad utilizaremos a fórmula de  =np donde p y q son las


probabilidades respectivas de éxito o fracaso en un lanzamiento. Para calcular el valor
de p se tomara que el valor de n es igual a 5.

=5p
 𝟏,𝟎𝟕𝟓
P= = =2,150
𝟓 𝟓

Numero de p Frecuencia frecuencia


aciertos esperada observada
0 0.298 11,920 16
1 0.408 16,32 11
2 0.224 8,896 8
3 0.061 2,440 4
4 8.387𝑥10−3 0,335 1

12
5 4.594𝑥10−4 0,002 0

Para los grados de libertad el valor de p será uno, ya que se tuvo que estimar la media
de la población para obtener de p y así calcular los valores esperados.
Grados de libertad=k-p-1=6-1-1= 4

2α;k-p-1 =9,49

𝑘
(16 − 11,92)2 (11 − 16,32)2 (8 − 8,896)2 (4 − 2,44)2 (1 − 0,335)2 (0 − 0,002)2
𝑋2 = ∑ 𝑋2 = + + + + +
𝑖=1
11,92 16,32 8,896 2,44 0,335 0,002

X2=5,540
Como 5,540 < 9,49 no se rechaza la hipótesis nula (H0) y se concluye que con grado de
significancia que el ajuste de datos es bueno para una distribución binomial.

CONCLUSIONES

RECOMENDACIONES

Referencias

[1] universoformulas, «http://www.universoformulas.com,» [En línea]. Available:


http://www.universoformulas.com/estadistica/descriptiva/.

[2] medwave, «www.medwave.cl,» [En línea]. Available:


https://www.medwave.cl/link.cgi/Medwave/Series/MBE04/4934.

[3] shmoop, «www.shmoop.com,» [En línea]. Available:


https://www.shmoop.com/estadistica-basica-probabilidades/media-mediana-modo-
rango.html.

[4] varsitytutors, «www.varsitytutors.com,» [En línea]. Available:


https://www.varsitytutors.com/hotmath/hotmath_help/spanish/topics/mean-median-
mode.

[5] ecured, «www.ecured.cu,» [En línea]. Available:


https://www.ecured.cu/Medidas_de_dispersi%C3%B3n.

13
[6] ub, «www.ub.edu,» [En línea]. Available:
http://www.ub.edu/stat/GrupsInnovacio/Statmedia/demo/Temas/Capitulo8/B0C8m1t10
.htm.

[7] ditutor, «www.ditutor.com,» [En línea]. Available:


https://www.ditutor.com/estadistica/distribuci%C3%B3n_frecuencias.html.

[8] wikipedia, «es.wikipedia.or,» [En línea]. Available:


https://es.wikipedia.org/wiki/Histograma.

[9] estadisticaitsp, «estadisticaitsp.blogspot.com,» [En línea]. Available:


http://estadisticaitsp.blogspot.com/2010/06/ojivas.html.

[10 profesorenlinea, «www.profesorenlinea.cl,» [En línea]. Available:


] http://www.profesorenlinea.cl/matematica/Distribucion_binomial.html.

[11 UAM, «/www.uam.es,» [En línea]. Available:


] https://www.uam.es/personal_pdi/ciencias/ortega/docencia/0910Estadistica/Contrastes
.pdf.

[12 wikipedia, «es.wikipedia.org,» [En línea]. Available:


] https://es.wikipedia.org/wiki/Ojiva_(estad%C3%ADstica). [Último acceso: 30 01 2018].

ANEXOS

14

Das könnte Ihnen auch gefallen