Sie sind auf Seite 1von 26

UNIVERSIDAD MARISTA

DE QUERTARO.

NOMBRE: Brenda Perusqua Sotelo.

GRADO: 5 cuatrimestre. GRUPO: A

MATERIA: Contenido y Didctica de Probabilidad y Estadstica I.

NOMBRE DEL DOCENTE: Jos Armando Vsquez Garfias.

TRABAJO: Manual de estadstica.

FECHA: 13 de Diciembre de 2010.


Brenda Perusqua Sotelo.

Licenciatura en Educacin Media Superior.

5 Cuatrimestre grupo A
NDICE.

Agrupacin de datos y grficas

Medidas de tendencias central..

Medidas de dispersin

Correlacin y recta de regresin..


*MANEJO DE DATOS.
ESTADSTICA: es una ciencia referente a la recoleccin, anlisis e
interpretacin de datos, ya sea para ayudar en la resolucin de la toma de
decisiones o para explicar condiciones regulares o irregulares de algn
fenmeno.

Lo podemos comprobar al escuchar en la vida diaria:

o La estadstica de muertos en Quertaro.


o La estadstica de los mejores equipos de futbol, etc.

Se divide en:
o Descriptiva: que se dedica a los mtodos de recoleccin, descripcin,
visualizacin y resumen de datos originados a partir de los fenmenos
en estudio. Los datos pueden ser resumidos numrica o grficamente.
o Inferencial: Se usa para modelar patrones en los datos y extraer
inferencias acerca de la poblacin bajo estudio. Estas inferencias
pueden tomar la forma de respuestas a preguntas si/no (prueba de
hiptesis), estimaciones de caractersticas numricas (estimacin),
pronsticos de futuras observaciones, descripciones de asociacin
(correlacin) o modelamiento de relaciones entre variables (anlisis de
regresin).

AGRUPACIN DE DATOS:

Muestra: es un subconjunto de casos o individuos de una poblacin


estadstica.
Variable: manera de expresar e identificar un grupo de elementos a estudiar,
como el nmero de muertos o de los mejores jugadores.
Frecuencia: cantidad de veces que se repite un determinado valor de la
variable.
A continuacin se presentarn algunos ejemplos para la solucin de
problemas estadsticos:

1.- Leer cuidadosamente el problema:

Durante el mes de julio, en una ciudad se han registrado las siguientes


temperaturas mximas:

32, 31,28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30,
29,29,30,30,31,30, 31, 34, 33, 29

2.- Vaciar en un cuadro bsico los datos tomados de forma original.

CUADRO DE TRABAJO.
32 31 28 29 33 32 31 30 31 31
27 28 29 30 32 31 31 30 30 29
29 30 30 31 30 31 34 33 33 29

3.- Ordenar los datos de forma creciente o decreciente en un cuadro, una


vez ordenados los datos se le llamar cuadro de trabajo.
CUADRO DE TRABAJO.
27 28 28 29 29 29 29 29 30 30
30 30 30 30 30 31 31 31 31 31
31 31 31 32 32 32 33 33 33 34

4.-Posteriormente se sacan los valores para armar la tabla:

4.1. rango: valor mayor valor menor.

Rango = xmx xmn

R= 34-27= 7
4.2. Nm. De grupos: es el nmero de grupos con el que se va a trabajar.
Tu escoges el nmero de grupos, pero, es recomendable que sean entre
5 y 15 grupos.

m=6
4.3. Intervalo: el rango entre el nm. De grupos.

7
6 = = = 1.16
6

4.4. Aproximacin : no sube tanto la cantidad del valor del intervalo. Esta
tambin cada persona, escoge el valor.

~ 1.19
4.5. Diferencia: aproximacin-intervalo por nm. De grupos.
Dif.= (Aproximacin L6) m

Dif.=(1.19 1.16) 6= (0.03) 6 = 0.18

4.6. La diferencia se divide en dos partes:

1= 0.14

2= 0.14

4.6.1. Inicio de tabla: primer valor la primer parte de la divisin de la


diferencia.

I.T = 27 0.14 = 26.86


4.6.2. Final de tabla: ultimo valor + la segunda parte de la divisin de
la diferencia.

F.T. = 34 + 0.14 = 34.14

4.7. Valores de los intervalos: valor del inicio de tabla + la aproximacin; la


cantidad de valores de intervalos depende del nmero de grupos, es decir, si
tengo 6 grupos, solo debo de obtener 6 valores de intervalos.

Valor + aproximacin

27 + 1.19 = 28.19
28.19 + 1.19 = 29.38
29.38 + 1.19 = 30.57
30.57 + 1.19 = 31.76
31.76 + 1.19 = 32.95
32.95 + 1.19 = 34.14

*TABLA:

La tabla contiene en una columna los intervalos y en la otra las frecuencias,


que son la cantidad de veces que se repiten determinados valores de entre
cada grupo de intervalos.

TABLA
INTERVALOS F
27 - 28.19 3
28.19 - 29.38 5
29.38 - 30.57 7
30.57 - 31.76 8
31.76 - 32.95 3
32.95 - 34.14 4

*TABLA DE DISTRIBUCION DE FRECUENCIAS: se utilizan cuando se


recolectan datos, con ellas se pueden representar los datos de manera
que es ms fcil analizarlos. Se pueden elaborar tablas de distribucin de
frecuencias para datos no agrupados y para datos agrupados. Estas
ltimas se utiliza cuando se tienen muchos datos.

Frecuencia acumulada: la suma total de todas las frecuencias


absolutas debe dar el total de la muestra estudiada.
Frecuencia relativa: porcentaje que representan los datos de
cada grupo en relacin con el total de datos.
Frecuencia relativa acumulada: es el porcentaje de datos que
tienen un valor igual o menor a un valor dado.
ndice: valor promedio de los datos de cada grupo.

TABLA
INTERVALOS F FA FR FRA X
27 - 28.19 3 2 0.1 0.066 41.095

28.19 - 29.38 5 7 0.166 0.233 42.88

29.38 - 30.57 7 14 0.233 0.466 44.665


30.57 - 31.76 8 22 0.266 0.733 46.45

31.76 - 32.95 3 25 0.1 0.833 48.235

32.95 - 34.14 4 29 0.133 0.966 50.02

Grficas: Una grfica es una representacin de datos, generalmente


numricos, mediante lneas, superficies o smbolos, para ver la relacin
que guardan entre s. Tambin puede ser un conjunto de puntos, que se
plasman en coordenadas cartesianas, y sirven para analizar el
comportamiento de un proceso, o un conjunto de elementos o signos que
permiten la interpretacin de un fenmeno.
Histograma: grfica de barras verticales formada por las longitudes de
intervalo en (x y las frecuencias en (y). se usan cuando se pretende resaltar la
representacin de porcentajes de datos que componen un total, la grfica de barras
sirve para comparar y tener una representacin grfica de la diferencia de
frecuencias o de intensidad de la caracterstica numrica de inters.

HISTOGRAMA
8
FRECUENCIAS

2 Series1

0
27 28.19 29.38 30.57 31.76 32.95
- 28.19 - 29.38 - 30.57 - 31.76 - 32.95 - 34.14
INTERVALOS.

Polgono de frecuencias: grafica poligonal abierta formada por los


ndices en (x y las frecuencias en (y). Las grficas lineales se
recomiendan para representar series en el tiempo, y es donde se
muestran valores mximos y mnimos; tambin se utilizan para varias
muestras en un diagrama.
POLIGONO DE FRECUENCIAS
9
8
7
FRECUENCIAS
6
5
4
3
2
1
0
41.095 42.88 44.665 46.45 48.235 50.02
NDICES

Ojiva porcentual: se obtiene con las longitudes de


intervalo (x) y las frecuencias relativas acumuladas en
(y).

OJIVA PORCENTUAL
1.2
FRECUANCIA RELATIVA ACUMULADA

1
0.8
0.6
0.4 Series1
0.2
0
27 - 28.19 - 29.38 - 30.57 - 31.76 - 32.95 -
28.19 29.38 30.57 31.76 32.95 34.14
INTERVALOS

Grafica de pastel: en cada segmento se representa el valor en grados


de fr por 360. grficas que nos permiten ver la distribucin interna de los datos
que representan un hecho, en forma de porcentajes sobre un total. Se suele separar
el sector correspondiente al mayor o menor valor, segn lo que se desee destacar.

GRFICA DE PASTEL

48 36
13% 10%
36 60
10% 17%

96 84
27% 23%

Medidas de tendencia central: el objetivo de estas medidas


es obtener una informacin til, centrando los datos obtenidos
de la evaluacin.

*Medidas de centralizacin: media, mediana y moda.

Ejemplo: Se desea conocer el precio mediano de los libros, el primer intervalo nos indica
que se han comprado 3 libros entre 1-500, pts, 13 entre 501 y 1000, y as sucesivamente ...
Frec. Frecuencia
Frecuencia acumulada Frecuencia relativa
intervalo (f) (fa) relativa (fr) acumulada (fra) NDICE (X)
1-500 3 3 0.02727273 0.02727273 251
501-1000 13 16 0.11818182 0.14545455 1001
1001-1500 25 41 0.22727273 0.37272727 1751
1501-2000 20 61 0.18181818 0.55454545 2501
2001-2500 18 79 0.16363636 0.71818182 3251
2501-3000 20 99 0.18181818 0.9 4001
3001-3500 11 110 0.1 1 4751

MEDIA ARITMTICA: aquel valor que es el promedio de todos los


valores dados.


=1
=

=1 : Sumatoria de la columna del producto de ndice y frecuencia de


grupo.

: Nmero de datos.

EJEMPLO:


2224130
= = 20219.36
110

Mediana: valor de los datos que se encuentra a la mitad una vez que se
han ordenado los datos o el promedio de los dos valores que se
encuentran a la mitad; valor que divide en dos partes iguales al total de
datos

1
=1
= + ( 2 )

: Lmite inferior del intervalo donde se ubica la mediana. (La posicin de la


+1
mediana se ubica mediante la frmula [ ])
2

: Nmero de datos.

1
=1 : Sumatoria de frecuencias anteriores a la frecuencia de la mediana.

: Frecuencia de la mediana

: Longitud del intervalo.

Ejemplo:

110
41
= 1501 + ( 2 ) 499.85
20

= 11151.105

Moda. valor de los datos que se repite ms veces. Puede haber ms de uno o
ninguno; medida de centralizacin menos usada pero muy significativa
cuando se quiere trabajar poco, se define como el valor que se repite con
mayor frecuencia si los datos no estn agrupados.

1
= + ( )
1 +2

: Lmite inferior del intervalo donde se ubica la moda. (La ubicacin


del grupo de la moda se logra encontrando el grupo con mayor
frecuencia)

1 : Diferencia entre la frecuencia de la moda y la frecuencia del


grupo anterior.

2 : Diferencia entre la frecuencia de la moda y la frecuencia del grupo


siguiente.

: Longitud del intervalo

12
= 1001 + ( ) 499.85
12 + 5

= 648.16

MEDIDAS DE DISPERSIN.

Breve Introduccin

Hasta el momento hemos estudiado los valores centrales de las medidas de tendencia central, pero tambin es
importante conocer si los valores en general estn cerca o alejados de estos valores centrales, es por lo que
surge la necesidad de estudiar medidas de dispersin.

Para obtener las medidas de dispersin, varianza; desviacin estndar y coeficiente de variacin, se
necesitar ampliar las columnas de la tabla de distribucin de frecuencia para obtener (x) 2, f(x)2

Ejemplo:
Se muestra la tabla de distribucin de frecuencias de la duracin en aos de la muestra de 42 acumuladores.

Frecuen Frecuenci
Frecue Frec. cia a relativa
ncia acumula relativa acumulad NDICE
intervalo (f) da (fa) (fr) a (fra) (X) f(x) (x)2 f(x)2
1.45 - 2.05 2 2 0.047 0.047 1.75 3.5 3.06 6.125
2.05 - 2.65 4 6 0.095 0.142 2.35 9.4 5.52 22.09
2.65 - 3.25 10 16 0.238 0.380 2.95 29.5 8.70 87.025
3.25 - 3.85 14 30 0.333 0.714 3.55 49.7 12.60 176.435
3.85 - 4.45 7 37 0.166 0.880 4.15 29.05 17.22 120.5575
4.45 - 5.05 5 42 0.119 1 4.75 23.75 22.56 112.8125

*VARIANZA

La varianza (tambin denominada variancia, aunque esta denominacin es menos


utilizada) es una medida estadstica que mide la dispersin de los valores respecto a un
valor central (media), es decir, la media de las diferencias cuadrticas de las puntuaciones
respecto a su media aritmtica. Suele ser representada con la letra griega o una V en
mayscula con exponente cuadrado.

2
2 =
( )2

S2x= 12.501 11.902=0.599

*COEFICIENTE DE VARIACIN: Mide la relacin entre la desviacin estndar y la media.


C.V.= S. . = =

0.773
. . = = 0.2240
3.45

C.V.= 22.4%

*DESVIACIN ESTANDAR:
= 2

= 0.599 = .773 .
REGRESIN Y CORRELACIN: En forma ms especifica el anlisis de
correlacin y regresin comprende el anlisis de los datos muestrales para saber que
es y como se relacionan entre si dos o mas variables en una poblacin.

Si sobre una poblacin de nios entre 0 y 6 aos, estudiamos las variables peso y
estatura, esperamos que en general ocurra que a mayor estatura tambin
encontremos mayor peso, aunque es posible que en algunos pocos casos no
ocurra as.

-IDEA DE CORRELACIN: Es frecuente que estudiemos sobre una misma


poblacin los valores de dos variables estadsticas distintas, con el fin de
ver si existe alguna relacin entre ellas, es decir, si los cambios en una
de ellas influyen en los valores de la otra. Si ocurre esto decimos que las
variables estn correlacionadas o bien que hay correlacin entre ellas.

-NUBE DE PUNTOS O DIAGRAMA DE DISPERSIN: La primera forma de


describir una distribucin bidimensional es representar los pares de
valores en el plano cartesiano. El grfico obtenido recibe el nombre de
nube de puntos o diagrama de dispersin.
Estas nubes de puntos se dan, segn sea la relacin que representa, que
puede ser: lineal, exponencial y sin relacin. Ejemplo:

-CORRELACIN LINEAL Y RECTA DE REGRESIN: Cuando


observamos una nube de puntos podemos apreciar si los puntos se
agrupan cerca de alguna curva. Aqu nos limitaremos a ver si los puntos
se distribuyen alrededor de una recta. Si as ocurre diremos que hay
correlacin lineal. La recta se denomina recta de regresin.

Cuando la recta es creciente la correlacin es positiva o directa: al


aumentar una variable, la otra tiene tambin tendencia a aumentar, como
en el ejemplo anterior. Cuando la recta es decreciente la correlacin es
negativa o inversa: al aumentar una variable, la otra tiene tendencia a
disminuir.
-EJEMPLO:

El gerente general de una planta de produccin de materiales de construccin considera


que la demanda de embarques de aglomerado puede estar relacionado con el nmero de
permisos de construccin emitidos en el municipio durante el trimestre anterior.

El gerente ha recolectado los datos que se muestran en la tabla.

Permisos de Embarques
construccin (X) (Y)
15 6
9 4
40 16
20 6
25 13
25 9
15 10
35 16

-DIAGRAMA DE SISPERSIN:
Embarques de conglomerado

18

16

14

12
Embarques Y

10

0
0 5 10 15 20 25 30 35 40 45

Permisos X

Embarques de conglomerado (Y)

Se realizan los clculos como se muestra en la siguiente tabla

n X Y XY X2 Y2
1 15 6 90 225 36
2 9 4 36 81 16
3 40 16 640 1600 256
4 20 6 120 400 36
5 25 13 325 625 169
6 25 9 225 625 81
7 15 10 150 225 100
8 35 16 560 1225 256
Totales 184 80 2146 5006 950

-COVARIANZA: mide el grado de dispersin de los datos en torno a las dos medias.

Se calcula las medias aritmticas de X y Y:

MEDIA DE PERMISOS(X):

184
= = = 23
8
MEDIA DE EMBARQUES(Y):

80
= = = 10
8

VARIACIN DE LAS CALIFICACIONES:

()2 5006
2 =
()2 = (23)2 = 625.8 529 = 96.8
8

= 96.8 = 9.83

VARIACIN DE LOS EMBARQUES:

()2 950
2 =
()2 = (10)2 = 118.75 100 = 18.75
8

= 18.75 = 4.33

VARIACIN CONJUNTA:

2146
2 = = (23)(10) = 268.25 230 = 38.25
8

-COEFICIENTE DE CORRELACION:
R = Coeficiente de correlacin, este mtodo mide el grado de
relacin existente entre dos variables, el valo rde R vara de -1 a
1, pero en la prctica se traba con un valor absoluto de R.
El valor del coeficiente de relacin se interpreta de modo que a
media que R se aproxima a 1, es ms grande la relacin entre los
datos, por lo tanto R (coeficiente de correlacin) mide la
aproximacin entre las variables.
2 38.25 38.25
= = = = . 89
( )() (9.83)(4.33) 42.56
Este coeficiente de variacin, no tiene unidades y su valor esta entre
-1 y 1, incluyendo el 0.
El coeficiente de 0.89, result pequeo, pero cercano al uno positivo,
lo que indica que entre las dos variables hay una buena correlacin
lineal positiva.

RECTA DE REGRESIN: sta recata permite pronosticar valores de Y a


partir de valores X .

Para que sea posible pronosticar, es necesario encontrar la recta de


regresin, que como toda recta tiene la forma general Y=mx+b

2 38.25
= ( ) +
= ( 23) + 10 = 0.3951 9.08 + 10
2 96.8

Yc=0.3951x+0.92

PRONSTICO:
Un vendedor que pide 9 permisos, sus embarques probables sern:

Y=0.3951(9)+0.92= 3.55+0.92= 4.47


Un vendedor que pide 40 permisos, sus embarques probables sern:
Y=0.3951(40)+0.92=15.80+0.92=16.72
Un vendedor que pide 25 permisos, sus embarques probables sern:
Y=0.3951(25)+0.92= 9.87+0.92=10.79

Un vendedor que pide 15 permisos, sus embarques probables sern:


Y=0.3951(15)+0.92=5.92+0.92=6.84

RECTA DE REGRESIN
18
16
14
EMBARQUES

12
10
8
6 Series1
4
2
0
15 9 40 20 25 25 15 35
PERMISOS DE CONSTRUCCIN

EJERCICIOS:

Agrupacin de datos y grficas:

Durante el mes de julio, en una ciudad se han registrado las

siguientes tem peraturas m xim as:

32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31,

30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29.
Medidas de tendencias central:

Sean los siguientes datos:

22, 21, 26, 24, 22, 25, 26, 23, 27, 29.

Determine la moda, mediana y media.

Medidas de dispersin:
En un diagnostico de educacin fsica se pidi a los alumnos de los cuartos medios que
hicieran abdominales durante 3 minutos. Se obtuvieron los siguientes resultados:

4 A: 45 38 43 29 34 60 54 27 32 33 23 34 34 28 56 62 56 57 45 47 48 54

33 45 44 41 34 36 34 54

4 B: 43 45 44 38 34 46 43 42 43 45 57 44 38 38 37 43 61 38 37 45 28 42

41 49 40 37 34 44 41 43

cul de los dos cursos tiene el rendimiento ms parejo? qu distribucin estadstico


permite comparar la distribucin de este tipo de datos?

Correlacin y recta de regresin:

El nmero de horas dedicadas al estudio de una asignatura y la calificacin obtenida


en el examen correspondiente, de ocho personas es:

Horas (X) 20 16 34 23 27 32 18 22
Calificacin (Y) 6.5 6 8.5 7 9 9.5 7.5 8

Se pide:

1 Recta de regresin de Y sobre X.

2 Calificacin estimada para una persona que hubiese estudiado 28 horas.


*BIBLIOGRAFA:

http://es.wikipedia.org/wiki/Gr%C3%A1fica

Introduccin

La importancia de las medidas de dispersin en la educacin secundaria es


valorada en pocas ocasiones como antecedente para cursos posteriores especficos
de estadstica y probabilidad. La prctica docente implica no slo el uso de tcnicas
de enseanza en general y de recursos materiales, sino que le subyace tambin la
necesidad de construir los conocimientos pertinentes sobre el tema de estudio,
cada vez que el docente interacta con el alumno. El complejo de conceptos
matemticos plantea dificultades de comprensin de unos a falta de dar sentido a
otros; tal es el caso de las frecuencias implicadas en la media aritmtica y sta, a
su vez, en algunas medidas de dispersin (desviacin media, desviacin estndar,
entre otras).

Das könnte Ihnen auch gefallen