Beruflich Dokumente
Kultur Dokumente
VALDIVIA
ESTADISTICA DESCRIPTIVA
Antecedentes:
El desarrollo de la recopilacin de datos y su uso en Estadstica, se remonta a
los primeros aos de la historia.
En el ao 3.050 A.C. se realiz en Egipto, un registro de las riquezas de la
poblacin, para hacer un nuevo reparto de ellas Sin embargo, el desarrollo pleno
de la Estadstica se inicia slo a fines del siglo XVII y principios del XVIII, cuando
matemticos como Bermoulli, Francis Maseres, Lagrange y Laplace desarrollaron
la Teora de la Probabilidad.
En estrecha relacin con la Fsica, la Qumica y la Biologa, la Estadstica
ha servido de base para el estudio de determinados fenmenos. Tambin la
Psicologa, la Pedagoga, la Sociologa y la Economa ,aplican estos mtodos a
los fenmenos sociales.
Esta disciplina es de estudio obligado en la educacin superior, debido a la
gran informacin relacionada con el hombre y la empresa. Su utilidad radica en la
necesidad del hombre ,en la toma de decisiones en el actuar cotidiano.
Estadstica Descriptiva
VALDIVIA
ESTADSTICA
SNTESIS TERICA
1.- Estadstica:
Es un conjunto de conceptos y mtodos empleados, para recolectar e
interpretar datos referentes, a un rea de investigacin particular y para extraer
conclusiones,.en situaciones en que la variabilidad est presente.
1.A- Estadstica Descriptiva o Deductiva:
Comprende una descripcin, esto es, resumir en forma adecuada un gran
conjunto de datos, As tenemos entonces, que esta parte corresponde a la
organizacin, recopilacin, tabulacin, representacin de los datos de inters; ya
sea mediante grficos o tablas, adems involucra la obtencin de la informacin
deseada. A estas medidas que resumen al gran conjunto de datos, recibe el
nombre de Estadsticas o Estadgrafos.
1.B.- Estadstica Inferencial o Inductiva:
Desarrolla las tcnicas para calcular valores llamados parmetros, que se
relacionan con una cierta poblacin, en base a datos, que entrega la estadstica
Descriptiva. Permite obtener informacin y sacar conclusiones relativas a una
poblacin, a partir de una muestra dada.
2.- Poblacin:
Poblacin Estadstica es el conjunto completo, de posibles mediciones o
registros de algn rasgo cualitativo, correspondiente a la coleccin completa de
unidades, para las que se harn inferencias. La poblacin representa el objetivo
de una investigacin y por ende, el objetivo de recolectar datos para obtener o
extraer conclusiones referentes a ella.
3.- Muestra:
La muestra de una poblacin, es el conjunto de mediciones que realmente
se obtienen en el curso de la recoleccin; por lo tanto, corresponde a un
subconjunto de la poblacin.
Estadstica Descriptiva
VALDIVIA
4.- Variable:
Es cualquier caracterstica que difiere de un miembro a otro, dentro de una
poblacin estadstica. Puede tomar un valor cualquiera, obtenido de un conjunto
que constituye el dominio de la variable. Se representa por x,y,etc.
Existen variables continuas y discretas:
-
Variable discreta: es aquella que puede tomar, slo valores enteros. Ej.;
nmero de componentes de un curso.
5.- Datos:
Es el conjunto de valores asociados o asignados a una variable.
Ejemplo:
Poblacin: padres de los alumnos.de un colegio determinado
Muestra: padres de los alumnos de octavo ao.
Variable: peso de los padres de los alumnos, de los octavos aos.
Datos: 60 kg.;80 kg.; 65 kg.;78 kg.; etc.
6. La palabra aleatoria viene del latn aleatorius,, propio del juego de dados y por
ende, relativo al juego de azar
7. La palabra azar proviene del rabe az-zahr, que significa casualidad.
8. Cuando se habla de intervalo es equivalente a clase.
Estadstica Descriptiva
VALDIVIA
DISTRIBUCIONES DE FRECUENCIAS
En la ordenacin de datos muy numerosos, es usual presentarlos
agrupados y ordenados en clases o categoras y determinar, el nmero de
individuos que pertenece a cada clase, llamado frecuencia de clase.
Una disposicin tabular o tabla de datos junto con las correspondientes
frecuencias de clase, se llama distribucin de frecuencias (o tabla de
frecuencias).
Para confeccionar estas tablas de frecuencias, debemos considerar los
siguientes casos:
Caso 1:
Si la variable que estamos midiendo es un tipo discreto (asumen valores de
un conjunto finito), entonces podemos realizar la distribucin en dos columnas. En
la primera se anotan los valores de la variable y en la segunda, el nmero de
veces que se repite cada una.
Caso 2:
Si la variable que estamos midiendo es de tipo continuo (pueden tomar
cualquier intervalo determinado por los nmeros reales), no tiene sentido el
tabularla para cada una de las observaciones, dado que es muy improbable que la
variable bajo estudio, tome el mismo valor durante el experimento. Dicho de otro
modo, cuando en una distribucin de frecuencias haya muchos valores distintos
de la variable, conviene agruparlos en intervalos o clases.
Estadstica Descriptiva
VALDIVIA
Ejemplo: CASO 1
Los siguientes datos corresponden a los pesos de un grupo de 33 personas:
45 36 72 54 45 72 48 62 38 43 48
64 43 36 54 72 64 60 70 38 64 60
70 48 72 62 72 48 54 64 70 43 60
Tabla se frecuencias:
Peso
36
38
43
45
48
54
60
62
64
70
72
N de personas
2
2
3
2
4
3
3
2
4
3
5
Ejemplo: Caso 2.
Despus de medir las alturas de 30 alumnos de un curso, resultaron los
siguientes valores de la variable:
154
152
163
158
178
155
155
163
150
161
157
166
166
165
161
167
182
160
162
156
175
159
155
164
163
160
167
170
175
168
164
176
150
162
165
172
162
162
158
160
R = 182-150= 32
Si elige intervalos de cuatro cm. de estaturas, entonces
32:4 = 8 intervalos
Tabla de frecuencias:
Intervalo
150.154
154.158
158.162
162.166
166.170
170.174
174.178
178.182
N de personas
3
6
8
11
5
2
3
2
Estadstica Descriptiva
VALDIVIA
f a ( xi )
n
Faa
n
INTERVALOS:
Para tablas en que la variable est representada por intervalos, es necesario
definir algunos otros conceptos, que nos sern de utilidad ms adelante.
a) INTERVALOS DE CLASES Y LIMITES DE CLASES:
El smbolo que define una clase, como el 150-154, en nuestro ejemplo,
se llama intervalo de clase . Los nmeros extremos 150 y 154 se llaman
limite inferior de clase (150) y lmite superior de clase (154).
Profesor: Erwin Belmar T.
Estadstico.
Estadstica Descriptiva
VALDIVIA
b) FRONTERAS DE CLASE:
Si se dan alturas con precisin de 1 cm., el intervalo de clase 150-154,
incluye tericamente todas las medidas desde 149,5 a 154,5. Estos nmeros
se llaman fronteras de clase o lmites reales de clase. En la prctica, las
fronteras de clase, se obtienen promediando el lmite superior de una clase,
con el inferior de la siguiente.
c) AMPLITUD O TAMAO DE UN INTERVALO DE CLASE:
Es la diferencia entre las fronteras de clases superior e inferior.
d) MARCA DE CLASE:
Es el punto medio del intervalo de clase y se obtiene promediando los
lmites inferior y superior de clase.
Ejemplo: La tabla de las alturas, luego de todas estas definiciones es:
Intervalo Marca de clase
o clase
[150-154]
152
[154-158]
156
[158-162[
160
[162-166[
164
[166-170[
168
[170-174[
172
[174-178[
176
[178-182[
180
f a ( xi )
3
6
8
11
5
2
3
2
Faa ( xi )
3
9
17
28
33
35
38
40
f r ( xi ) 100
7,5%
15 %
20 %
27,5%
12,5%
5%
7,5%
5%
Estadstica Descriptiva
VALDIVIA
12
10
8
6
4
2
0
148 152 156 160 164 168 172 176 180 184
Estadstica Descriptiva
VALDIVIA
40
36
32
28
24
20
16
12
8
4
0
148
152
156
160
164
168
172
176
180
Estadstica Descriptiva
VALDIVIA
ESTADSTICOS O ESTADGRAFOS
Los estadsticos o estadgrafos se definen como una regla para calcular
alguna medida, a partir de un grupo de observaciones. ste corresponde a un
nmero real fijo.
Existen diferentes tipos de estadgrafos, tales como:
I.- Estadgrafos de Centralidad, o Medidas de tendencia Central:
Media - Mediana - Moda
II.- Estadgrafos de Dispersin:
Cuartiles - Deciles - PercentilesIII.- Estadgrafos de Orden
Rango - Desviacin Media - Desviacin Estandar - Varianza - Coeficiente de
Variacin
IV.- Estadgrafos de Simetra
V.- Estadgrafos de Apuntamiento.
Antes de comenzar a mencionar algunos de stos, necesitamos recordar
algunas notaciones que se utilizaran:
Notacin de Indices:
Denotemos por x i cualesquiera de los N valores
x1 , x 2 , x 3 ,... x n que toma una variable x. La letra i en x i , puede valer 1,2,3,...N.
Se llama subndice.
Notacin de suma:
n
El smbolo
x
i 1
i=1 a
x
i 1
x1 x 2 ... x N
a)
ax
i 1
a xi
i 1
10
Estadstica Descriptiva
VALDIVIA
N
b)
a a a a a... na
donde a es constante.
i 1
Notacin:
X: variable de estudio
X i : i-simo valor de la variable
N: cantidad de datos de una poblacin finita.
N: muestra desde una poblacin finita, por lo tanto n N
I.- MEDIDAS DE TENDENCIA CENTRAL
xi
x1 x 2 ... x N
i 1
x
N
N
Si los datos provienen de una tabla de frecuencia, la media se calcula de la
siguiente forma. Sean x1 , x 2 ,... x k las marcas de clase de cada uno de los k
intervalos, cada uno con una frecuencia absoluta de n i , luego x es:
k
x
i 1
xi f a ( xi )
n
Intervalo
1
2
3
...
k
xi
ni
x1
x2
n1
n2
x3
n3
...
...
xk
nk
N
Ejemplos:
Profesor: Erwin Belmar T.
Estadstico.
11
Estadstica Descriptiva
VALDIVIA
8 3 5 12 10 38
7,6
5
5
xi f a ( xi ) 38
n
8
Intervalo
1
2
3
4
5
xi
ni
2
4
6
8
10
3
2
1
1
1
8
2)
8, 3, 5, 12 y 10 es:
i 1
xi f a ( xi )
6
8
6
8
10
38
w1 x1 w2 x 2 ... wk x k
xp
i 1k
w1 w2 ... wk
wi x i
w
i 1
1 70 1 90 3 85 415
83
11 3
3
4) MEDIANA:
Profesor: Erwin Belmar T.
Estadstico.
12
Estadstica Descriptiva
VALDIVIA
1
(9 11) 10
2
Para datos agrupados, la mediana obtenida por interpolacin viene dada por
n
Faa ( xi 1 )
Me( x) Li C 2
f a ( xi )
5) MODA:
La moda de un conjunto de nmeros, es el valor que ocurre con
mayor frecuencia; es decir, el valor ms frecuente. La moda puede no existir,
incluso no ser nica, en caso de existir.
En el caso de datos agrupados. donde se haya construdo una curva
de frecuencias para ajustar los datos, la moda ser el valor (o valores) de X
correspondiente al mximo (o mximos) de la curva.
La moda puede deducirse de una distribucin de frecuencias. o de un
histograma a partir de la frmula
f a ( xi 1 )
Mo Li C
f a ( xi 1 ) f a ( xi 1 )
6) MEDIA GEOMTRICA:
La media geomtrica de un grupo de n observaciones x1 , x 2 ,..., x n
se define como la raz ensima, del producto de las observaciones:
G n x1 x 2 ... x n
G n x1 1 x 2 2 .... x k
nk
ni ,
13
Estadstica Descriptiva
VALDIVIA
1
N
1
1
n i 1 x i
3
3
3,43
1 1 1 7
2 4 8 8
Faa ( xi 1 )
Qk Li C
f a ( xi )
DECILES:
Son aquellas medidas de orden que dividen a la muestra en 10
partes de igual tamao, sern denotadas por la letra Dk , k 1,9 . Su frmula
para datos tabulados es :
Profesor: Erwin Belmar T.
Estadstico.
14
Estadstica Descriptiva
VALDIVIA
nk
Faa ( xi 1 )
10
Dk Li C
f a ( xi )
PERCENTILES:
Son aquellas medidas de orden que dividen a la muestra ordenada
en 100 partes, dejando en cada una de ellas igual nmero de elementos, ser
denotada por Pk , k 1,99 . Su frmula para datos tabulados es:
nk
Faa ( xi 1 )
100
Pk Li C
f a ( xi )
MD
i 1
N
donde:
x es la media aritmtica de los nmeros
x i x = es el valor absoluto de la desviacin de x i respecto de x
DESVIACION ESTANDAR:
La desviacin estandar de un conjunto de N nmeros x i , x 2 ,..., x n que
provienen de una muestra se denota por S y se define:
15
Estadstica Descriptiva
VALDIVIA
N
(x
i 1
x) 2
n 1
x
i 1
2
i a
f ( xi )
x2
VARIANZA:
La varianza de un conjunto de datos se define como el cuadrado de
la desviacin estndar.
Var 2
COEFICIENTE DE VARIACION:
Sirve para comparar la dispersin de los datos respecto al promedio,
entre grupos de distintas medidas, es adimensional y se define como:
C .V . (
EJERCICIOS PROPUESTOS
16
Estadstica Descriptiva
VALDIVIA
n de empleados
250.0.259.990
260.0.269.990
270.0.279.990
280.0.289.990
290.0.299.990
300.0.309.990
310.0.319.990
total
8
10
16
14
10
5
2
65
17
Estadstica Descriptiva
VALDIVIA
7) En una industria donde trabajan 130 obreros, el salario medio alcanz a los
6500 pesos diarios. Qu sucede con este promedio si:
a) Se aumentan todos los salarios en 500 pesos.
b) Se aumentan los salarios en un 15%
c) Se aumentan los salarios en un 5%, ms 600 pesos.
Rp.: a) 7000
b) 7475
c) 7425
8) En un examen de estadstica, se obtuvo un promedio general de 4,951. El
curso del turno A tuvo una media de 5,2; los 17 alumnos del curso del turno C
obtuvieron un promedio de 4,6. Cuntos alumnos hay en el curso del primer
turno?
Rp.:24
9) Se dispone de la siguiente informacin sobre el nmero de personas activas en
25 familias.
0 2 2 4 4
13 2 51
2 2 010
4 4 1 22
15 3 3 5
a)
b)
c)
d)
e)
18
Estadstica Descriptiva
VALDIVIA
f r ( x3 ) 0,25
Fra ( x5 ) 0,93
f a ( x4 ) 304
f a ( x2 ) 2 f a ( x1 )
19
Estadstica Descriptiva
VALDIVIA
14,2 8,0 18,4 16,6 20,0 10,0 22,4 9,4 13,0 17,4
15,6 18,4 17,6 25,0 12,2 16,0 16,8 12,6 18,0 10,5
a) Construya una tabla de distribucin de frecuencias utilizando criterio
SAS (parte entera (1+3,3logn)
b) Calcule; media, mediana , moda.
c) Qu ingreso deja bajo si al 25% de los ingresos ms bajos?
d) Qu ingreso deja sobre s al 25% de los ingresos ms altos?
e) Si los ingresos se reajustan en un 25%, ms un bono de $5.000. Cul
es el nuevo ingreso promedio?
Rp.: b) 16,5 ; 16,5 ; 16,5
c) 13,38
(distribucin simtrica)
e) 25,63
16) Una casa comercial hace un estudio con respecto a los precios de cierto
artculo especfico, resultando un precio promedio de $1500 con una varianza
de $120. Posteriormente, se verific que el mal uso de un factor permiti un
error de $50 sobre el valor promedio. Determine los nuevos valores de los
estadgrafos mencionados, despus de la correccin.
Rp.: x 70 ; V ( x ) 120
17) Para estudiar el consumo de cierto producto por una poblacin, se dividi la
muestra en dos estratos A y B, cuyos datos se indican en las tablas siguientes:
Estrato A
X - X'
50-100
100-150
150-200
200-250
250-300
n
10
15
18
20
10
Estrato B
X -X'
100-150
150-200
200-250
250-300
Calcule
a) Media de cada estrato
b) Media general o estratificada
c) Varianza por estrato
d) Varianza general o estratificada
Rp.: a) de A es 178,42
de B es 215,91
b) 194,53 c) V(A)=3926,63
V(B)=2190,08
Profesor: Erwin Belmar T.
Estadstico.
N
5
15
20
15
d) 3524,89
20
Estadstica Descriptiva
VALDIVIA
[50
[
[
[
[
[
[
-110 [
[
[
yj
fa
fr
Faa
Fra
5
0,275
8
0,825
21
Estadstica Descriptiva
VALDIVIA
Rp.:
xi
hi
5
6
7
0,65
0,25
0,10
n 150
f a ( y3 ) 24
f r ( y7 ) 0,08
n int ervalos 7
f a ( y1 ) * y1 US $48.000
n1 8
y 3 n 3 1260
y1 10
n 2 n 5 62
H 6 0,96
Mo(y)=40
promedio=40
a)
b)
c)
d)
y 5 90
n 3 20
n2 n5 2
22
Estadstica Descriptiva
VALDIVIA
N1 8
b) n 4 4
N 3 12
c ) n 20
N m 22
d ) h1 0,20
n 40
N 4 16
n1 12
e ) H 1 h 2 h3 h4 1
n5 3
N5 1
f ) h1 H 2 H 3 2,8
g ) H 4 0,75
H 5 0,66
H 6 0,81
j ) H 4 0,30
n 10
n 3 31
k ) h1 0,04
h3 0,12
H 4 0,15
H 7 0,93
h) n6 : n3 2
i) H 6 N 6
l ) xi 0
25) Los sueldos que paga una empresa a sus empleados, en miles de US$
anuales, estn dados por;
x 'j 1 x 'j
ni
14.000-15.000
15.000-16.000
16.000-17.000
17.000-18.000
18.000-19.000
19.000-20.000
20.000-21.000
21.000-22.000
5
7
8
6
5
4
3
2
23
Estadstica Descriptiva
VALDIVIA
20,0
12,2
24,0
20,0
10,0
16,0
18,0
11,2
24
Estadstica Descriptiva
VALDIVIA
1838,96
100 21,48%
8560
25