Beruflich Dokumente
Kultur Dokumente
Idea principal
El objetivo de la estadstica descriptiva es resumir la informacin contenida en un conjunto de datos de la
manera ms concisa y completa posible. Esto puede hacerse mediante la construccin de tablas y
grficos y la determinacin de ciertos nmeros llamados estadsticos.
Cuando el nmero de observaciones es grande, en general mayor que 30, los datos se resumen en una
distribucin de frecuencias. La distribucin de frecuencia se logra agrupando los datos en clases o
categoras en las que se renen subconjunto de datos y registrando la frecuencia absoluta, el nmero
de datos que se encuentran en cada clase. Cuando la frecuencia se expresa como el cociente entre la
frecuencia absoluta de una clase y el nmero total de datos se denomina frecuencia relativa.
2.1) Un profesional de las Ciencias Naturales desea mostrar grficamente en un congreso los
resultados que apoyan la hiptesis que una industria de pinturas est contaminando el agua de
un arroyo al cual evacua sus efluentes con plomo. Para ello extrae 60 muestras de agua, 30
tomadas aguas arriba del establecimiento y las otras 30 aguas abajo. Los datos consisten en
valores de concentracin Pb (mgr/l) encontrado en el agua y se presentan a continuacin.
Aguas arriba del establecimiento:
8 10 6 9 4 7 5 12 8 7
8 7 12 5 6 9 7 10 6 8
6 4 5 9 8 11 8 6 12 9
Represente los datos de manera que se visualice claramente lo que el profesional desea poner de
manifiesto Le parece que los datos respaldan la hiptesis del profesional?
2.2) Los datos siguientes corresponden a la humedad relativa ambiente (%) de los das de enero
de 2010 de la ciudad de La plata:
55, 51, 60, 56, 64, 63, 63, 61, 57, 62, 50, 49, 70, 72, 54, 48, 53, 58, 66, 68, 45, 74, 65, 58, 61, 62,
59, 64, 57, 63, 52.
a) Construya una tabla de frecuencias, un histograma y una ojiva con los datos agrupados en
5 categoras de igual tamao.
Amplitud del intervalo: A = (valor ms alto valor ms bajo) / nmero de intervalos
b) Comparar el histograma obtenido con los histogramas resultantes de agrupar los datos en 3
y 10 intervalos de clase que se muestran a continuacin. Indicar en cul arreglo en
intervalos se originan grficos que representen mejor los datos. Justifique.
7
18
14
Nmero de observaciones
Nmero de observaciones
16
12
10
8
6
4
5
4
3
2
1
2
0
0
45,0000
54,6667
64,3333
74,0000
45,0
Humedad relativa
47,9
50,8
53,7
56,6
59,5
62,4
65,3
68,2
71,1
74,0
Humedad relativa
c) Entre que valores de humedad se encuentra el 50% central de los das del mes?
d) A partir de que valor se encuentra el 10% de los das ms hmedos?
e) Si descontamos el 15 % de los das menos hmedos y el 15% de los ms hmedos En
qu intervalo de valores se encuentran los das restantes?
19
MATEMTICA Y ESTADSTICA
2.3) Construya el grfico bivariado de dispersin con los datos de Gamma Ray y Porosidad total
obtenidos de un pozo de petrleo Existe alguna relacin entre las variables? Descrbala.
Gamma ray
96,22
94,32
94,79
94,84
94,11
95,42
96,71
98,16
103,40
105,89
Porosidad total
0,04
0,03
0,03
0,04
0,04
0,05
0,06
0,08
0,09
0,10
2.4) Los siguientes datos modales1 corresponden a componentes de arenas de 3 muestras de una
seccin subvertical del Patagoniano.
a) Identificar el/los tipos de variable.
b) Elaborar grficos que permitan comparar la composicin total de cada muestra.
c) Recalcular los valores de Qm, F y Lt, para graficar los datos en el diagrama triangular adjunto
(A = Qm, B = F, C = Lt). Clasificar las muestras utilizando el diagrama triangular de Folk et al.
(1970).
Techo
52
87
9
96
63
307
Qm
F
Qp
Lt
Matriz
Total de granos contados
Media
148
128
56
154
137
623
Base
99
153
40
204
157
653
En petrografa se llama Datos modales a los datos que se obtienen a partir de determinar cuantitativamente la composicin de los granos y el
recuento de estos en el microscopio. Se utiliza una la platina graduada que permite el movimiento de un corte delgado a un cierto intervalo de
distancia, formando una red de puntos en un sistema de coordenadas (x-y). En esta tcnica se registra por cada punto la composicin del grano
localizado en el centro de la retcula. Dependiendo de los objetivos del conteo de partculas es la metodologa empleada y su s restricciones, por
ejemplo se puede considerar solo un tamao de grano, solo contar las partculas o tambin la matriz y cementante, o bien granos de una sola
composicin.
20
MATEMTICA Y ESTADSTICA
Ejercicios complementarios
2.5) Se obtuvieron muestras de sedimentos de un ambiente actual donde los procesos de
transporte y depositacin dominante es el transporte por el agua (ambiente fluvial). Se desea
caracterizar el sedimento por medio del anlisis textural. Para ello se procesan los datos obtenidos
a partir del tamizado2.
a) Construya un histograma y un grfico de frecuencias acumuladas con los datos de un
anlisis granulomtrico que se presenta a continuacin.
b) Calcule el tamao granulomtrico en escala phi (-log2 dimetro del clasto en mm)
correspondiente a 5%,16%, 25%, 50%, 75%, 84% y 95%.
phi
-2,00
-1,75
-1,50
-1,25
-1,00
-0,75
-0,50
-0,25
0,00
0,25
0,50
0,75
1,00
1,25
1,50
1,75
2,00
2,25
2,50
2,75
3,00
3,25
3,50
3,75
4,00
4,25
2.6)
Peso neto
1,73
6,34
0,40
3,04
9,42
5,21
3,54
3,90
4,26
5,90
2,71
7,91
4,34
3,88
7,71
6,02
9,06
6,10
4,66
4,07
3,90
2,48
1,92
1,21
1,02
0,53
Peso acumulado
Peso acumulado %
Para realizar los anlisis granulomtricos de sedimentos actuales se elimina la materia orgnica, los carbonatos, el ox ido de hierro y las
sales solubles. Luego se arma una pila de tamices cuyas aberturas responden a la escala granulomtrica adoptada para el anli sis, en la
base se coloca un fondo y hacia arriba se colocan las mallas en orden creciente de abertura. Se vier te el sedimento seco en el tamiz
superior, se tapa y la pila de tamices se introduce en una maquina agitadora por 15 minutos. Finalizado el tamizado se vaca el contenido
de cada tamiz y el retenido en el fondo sobre un papel y se pesa al miligramo.
Folk y Ward (1957), propusieron utilizar los grficos de frecuencia acumulada que surgen de los anlisis granulomtricos de sedime ntos se
pueden usar para caracterizar los sedimentos de distintos ambientes actuales. Los grficos se realizan poniendo en el eje horizontal el
tamao de grano en escala phi (-log2 dimetro mm) y en el eje vertical peso acumulado %.
21
MATEMTICA Y ESTADSTICA
22
MATEMTICA Y ESTADSTICA
Lecturas recomendadas: Spiegel, 1991. Cap. 3: 60-90; Cap. 3: 91-115. Sokal & Rohlf, 1979. Biometra.
Cap. 4: 51-76. Merodio, 1986. Cap.1: 9-18. Chou, Cap. 3 : 43-68. Mendenhall, 1990. Cap.3: 29-63. Zar, H.J.
2009 Cap. 3 y 4.
Idea principal
La descripcin de los datos se completa calculando valores que caracterizan numricamente al conjunto
llamadas estadsticos. Existen medidas que describen la posicin de los valores centrales y de valores
especiales, de la dispersin de los datos y la forma de la distribucin. Las principales medidas de posicin que
dan una idea del centro de los datos son la media aritmtica, la mediana y moda. Las medidas que dan cuenta
de la posicin de valores especiales se llaman cuantiles. Las medidas de dispersin describen la
variabilidad de los datos respecto de alguna medida de posicin, en general alrededor de la media, las
principales son el rango, la varianza y la desviacin estndar y el coeficiente de variacin.
Existen otras medidas que describen la forma de la distribucin: la asimetra y la curtosis.
2.3
2.7
2.5
3.1
3.5
4.6
2.5
12.6
10.4
5.3
2.7
3.9
Calcule el coeficiente de variacin de los datos. Utilice la informacin de la tabla adjunta para
definir la distancia entre caneletas en un muestro de detalle.
23
MATEMTICA Y ESTADSTICA
Coef.Variabilidad
/Clasificacin
<20 %
Muy regulares
20-40 %.
Regulares
40-100 %
Irregulares
100-150 %
Muy Irregulares
>150 %
Extremadamente
Irregulares
Distancia
Canaletas
(m)
Seccionado
Testigo
(m)
Red de
sondeos
(m)
Valor K
Tipo de
yacimientos
15 - 50
5 - 15
200 x 200
0,05-0,1
Sedimentarios
4 - 15
2-5
100 x 100
0,1-0,2
Sed.+complejos
2,5 - 4
1-2
50 x 50
0,3-0,5
1,5 2,5
0,5 -2
25 x 25
0,6 0,8
1 1,5
1 0,5
No
determinado
0,8-1
Oro Platino
3.4)
El tratamiento de los datos cero (0): Existen 3 tipos de datos cero:
a) Los valores de la variable que corresponden al valor 0. Para los clculos de los estadsticos se incluyen
con la jerarqua de cualquier otro valor.
b) Valores 0 que indican dato ausente ya sea que no se ha medido esa variable en el espcimen o se ha
perdido la informacin. Para los clculos de los estadsticos en esas variables se realizan con los valores
disponibles, es decir se disminuye el tamao de la muestra
c) Los 0 por redondeo. Este tipo es muy comn en geologa y suelen estar relacionados con el lmite de
deteccin del aparato o metodologa utilizada para cuantificar los valores de la variable. Su aparicin es
frecuente en datos de geoqumica de roca, tanto de elementos mayoritario como traza. En las tablas de
datos son indicados de la forma <valor o -valor. Una estrategia habitual para el clculo de los
estadsticos, es reemplazar estos valores por la mitad del valor del lmite de deteccin, por ejemplo si el
lmite de deteccin es 0,01, se reemplazan por 0,005.
b) Los siguientes datos de saturacin de agua corresponden a una seccin de un pozo de petrleo, la
herramienta registra los datos ausentes con 9999.
0,26
0,36
0,47
9999
9999
0,59
0,57
0,56
0,54
9999
0,55
0,58
0,57
0,53
3.5)
El trabajar con datos producto de algn proceso de medicin o recuento y de la captura de los mismos se
pueden observar datos extraos. Se trata de valores que se sospecha que no pertenecen al conjunto de
datos y que se han registrado por un error de medicin, un error de transcripcin al momento de registrarse
los datos, o bien se producen por algn suceso sumamente extrao. En estadstica a estos valores se les
llama outliers. Existen diversos criterios para detectar outliers en un conjunto de datos. Uno de los
mtodos ms comunes es el que utiliza el concepto de cuartil (Q).
Para detectar valores outliers moderados, se calcula:
LmInf = Q1- 1,5(Q3-Q1)
LmSup = Q3 + 1,5(Q3-1)
24
MATEMTICA Y ESTADSTICA
Los datos que se presentan a continuacin corresponden valores del caudal medio mensual (m3/s)
del mes de diciembre del ro Neuqun, en la estacin Paso de los Indios (383154S, 692451O)
para el periodo 1903 2002. Los datos estn ordenados de menor a mayor. Calcular: la mediana, los
cuartiles 1 y 3, el rango intercuartilico (Q3-Q1) y los lmites superiores e inferiores para calcular
outliers moderados y extremos. Realice un grafico box-plot con los estadsticos calculados.
Identifique y clasifique los valores outlier de esta muestra, a qu supone usted se puede atribuir la
aparicin de estos valores?
55,25
209
296
391,8
503,4
634
772
78,68
210
311
408,5
503,6
635
786
87
224
315
413
506
637
831
90
233
316
414
526
647
841
95
236
339
422
535
648
922
99
237,5
341,8
431,9
535
654
947
108,1
244
344
433
551,1
658
1001
109
245
346
433
563
676,8
1009
114
250
347,7
433
563
707
1167
142
272
357
438
565
717
1183
166
272
358
458
567
718
168
281
365
461
599
744
179
282
370
462
603
760
182
286
373
480
610
765
196
291
380
499
627
768
Ejercicios suplementarios
3.6) Caracterice el sedimento fluvial del ejercicio 2.5 calculando:
a) La media, desvo estndar, asimetra y curtosis usando el mtodo analtico.
b) La media, desvo estndar, asimetra y curtosis usando el mtodo Folk y Ward (1957), a
partir de los datos que surgen del grafico de frecuencia acumulada con las siguientes
formulas obtenidos en el ejercicio 2.5:
X 50
X 16 84 50 ,
S 84 16 95 5
3
CS
16 84 250 (5 95 250 )
284 16
295 5
6,6
95 5
2,4475 25
25