Sie sind auf Seite 1von 8

UNIVERSIDAD NACIONAL DE SAN

MARTÍN
“AÑO DEL DIALOGO Y LA RECONCILIACIÓN
NACIONAL”

FACULTAD:
Ecología
ESCUELA PROFESIONAL:
Ingeniería Sanitaria
TRABAJO:

MANEJO, ALMACENAMIENTO Y ACCESO


A DATOS DE CALIDAD DE AGUA:
ESTADÍSTICAS BÁSICAS.

SEMESTRE:
2018-II
CICLO:
V
ASIGNATURA:
ANÁLISIS Y CALIDAD DE AGUA
DOCENTE:
Ing. Mirtha Felicita Valverde Vera
INTEGRANTE:

 Jaime Matius Guerra Reátegui


 Jhon Jarlin Coronel Bueno

 Diego Saúl Pérez Mori


I. INTRODUCCIÓN

El estudio de la calidad del agua por parte de ingenieros y científicos comúnmente


involucra la recolección de datos, su análisis, resumen y presentación en determinadas
formas. Para tal efecto, el desarrollo actual de los computadores, las hojas de cálculo y
los paquetes estadísticos (Excel, SAS, Minitab, Statgraphics, etc.) han facilitado esta
tarea. Sin embargo, para su aplicación se requiere un determinado conocimiento de la
estadística. Esta es, tal vez, una de las razones por las cuales el análisis e interpretación
de los resultados no reciben la atención apropiada en los estudios de calidad del agua. De
ahí el síndrome “muchos datos, poca información” que se está presentando en las
diferentes autoridades ambientales, agencias gubernamentales y empresas de servicios
públicos.
Generalmente, los datos de calidad del agua son utilizados para tomar decisiones, es decir,
evaluar alternativas de un determinado proyecto o simplemente para proveer información
sobre el estado del recurso.
II. GENERALIDADES

2.1Objetivos

2.1.1 Objetivo General

• Analizar, Manejar y Almacenar la recolección de datos de calidad de agua


a través del programa EXCEL

2.1.2 Objetivo Especifico

• Conocer cómo realizar una Distribución de frecuencia de forma adecuada.


• Conocer e Interpretar las medidas de tendencia central.
• Conocer e Interpretar las medidas de dispersión.

2.2 Manejo, Almacenamiento y Acceso a Datos de Calidad de Agua

El diseño de un sistema para almacenar datos de calidad del agua merece especial
cuidado, dado que es necesario que la información se guarde de tal manera que se
garantice la calidad y estado de la información, además, permita un acceso fácil, y se
puedan manipular y volver a guardar los datos. Aunque no existe una forma única de
almacenar y manipular la información, se pueden seguir ciertas reglas generales que
satisfacen las necesidades en la mayoría de los casos. (Sierra, 2011)

Con el auge de los computadores personales (PC), gran cantidad de empresas o


instituciones encargadas de manejar datos de calidad del agua poseen dos herramientas
básicas para almacenar, analizar y manipular datos: las hojas de cálculo (Excel, Lotus,
etc.) y las bases de datos (Access, Foxpro, Oracle, etc.). Las hojas de cálculo poseen
funciones estadísticas, graficadores y demás aplicaciones con las cuales se pueden
realizar prácticamente todas las actividades relacionadas con el almacenamiento,
actualización y análisis de datos. Las hojas de cálculo, además, disponen generalmente
de manejadores de datos (pequeñas bases de datos) que permiten hacer consultas sobre
los datos contenidos en una tabla. Las hojas de cálculo se usan de acuerdo con la
capacidad que tenga el software para almacenar datos; casi siempre esta es el limitante,
es decir, las hojas de cálculo se usan cuando no se tienen grandes cantidades de datos.
Se aconseja utilizar las bases de datos cuando el volumen de información es de tal
tamaño que no se puedan emplear las hojas de cálculo. Además de la capacidad, este tipo
de software permite hacer consultas más complejas sobre los datos que las hojas de
cálculo y su manejo requiere personal mejor entrenado.
En conclusión, debido a que los PC proveen mayor flexibilidad y velocidad para
realizar los análisis estadísticos, elaborar las tablas, dibujar los gráficos, preparar las
presentaciones, etc., se recomienda almacenar la información en forma electrónica en
lugar de hacerlo en forma manual. De hecho, es prácticamente imposible realizar
manualmente muchas de las anteriores operaciones.
Algunos de los beneficios de disponer de un sistema computarizado de manejo de
datos sobre un sistema manual son:
• Mayor capacidad de almacenar grandes volúmenes de datos.
• Mayor facilidad de controlar la calidad de la información.
• Gran posibilidad de relacionar los datos de calidad del agua con otro tipo de datos
tales como los niveles de agua, caudales, costos, etc.
• Mayor variedad de formas para presentar los datos. Los graficadores de que
disponen las herramientas de informática permite gran variedad formas de
elaborar las gráficas (curvas, columnas, pastel, etc.).
• Permiten o disponen de funciones y de otras herramientas que facilitan los análisis
estadísticos (correlación, tablas ANOVA, etc.).
Adicionalmente a todo lo anterior, el hecho de tener los datos almacenados en
formatos electrónicos (computarizados) permite el uso de los sistemas de información
geográficos (SIG) para la presentación, análisis e interpretación de los datos. Los SIG son
herramientas poderosas no solamente para presentar los datos sino para relacionarla con
datos de clima, usos del suelo, población, curvas de nivel, etc.

2.2 Estadísticas Básicas


La estadística dispone de dos técnicas para el análisis de datos: la estadística
descriptiva y la inferencia estadística. La estadística descriptiva se usa para resumir los
datos de tal manera que sean más simples de analizar o interpretar, por ejemplo, estimar
la media, la desviación estándar, etc. (Sierra, 2011)
La inferencia estadística se utiliza cuando es necesario responder preguntas sobre
la naturaleza dinámica de los datos. Los siguientes son ejemplos de este tipo de preguntas:
• ¿Cuál es la calidad del agua en forma general en un sitio dado?
• ¿Está la calidad del agua mejorando o empeorando?
• ¿Cómo están relacionadas unas variables de calidad del agua con algunas
• otras?
• ¿Cuáles son las fuentes de contaminación y cuál su magnitud?
• ¿Se puede predecir la calidad del agua con base en los datos del pasado?
Cuando estas y otras preguntas se hacen en forma de hipótesis, entonces se usa la
inferencia estadística (diferencias significativas, correlaciones, etc.) para responderlas.
Es importante anotar que las muestras de agua o de biota tomadas para hacer estudios de
calidad del agua son solamente fracción de todo el ambiente; las series de datos que se
analizan deben ser consideradas como “datos muestrales” de una “población” infinita que
no puede ser analizada. Por lo tanto, en calidad del agua, los datos son valores muéstrales
(estadísticos) que tienen por objeto estimar los parámetros de una población.
Como el objeto de este capítulo no es la descripción de un paquete estadístico ni
ilustrar la teoría de la probabilidad y la estadística sino mostrar la aplicación práctica de
ambos a estudios de calidad de agua, la metodología a seguir es realizar e ilustrar los
cálculos con la hoja de cálculo de Excel.

2.2.1 Medidas de Tendencia Central y Cuartiles.


Los estadísticos más utilizados para localizar el centro de una distribución
son la media, la mediana y la moda.
• La media está definida como la suma de los valores individuales de la serie
dividida en el número de datos. La media puede verse como el valor
promedio en el caso de una serie finita de datos o el centro de gravedad de
una distribución. Sin embargo, una de las interpretaciones más importantes
aplicables al caso del diagnóstico de aguas es cuando la media denota o se
tiene la noción del valor esperado de una variable aleatoria. (Sierra, 2011)
• La mediana es el valor localizado en la mitad de la serie cuando esta se
ordena desde el valor más bajo hasta el más alto. Cuando la serie tiene un
número par de datos, la mediana generalmente se toma como el promedio
de los dos valores centrales. Se conoce también como el percentil 50 o
segundo cuartil. (Sierra, 2011)
• La moda corresponde al valor que más veces se repite.
• Los cuartiles son los tres valores de la variable que dividen a un conjunto
de datos ordenados en cuatro partes iguales: Q1, Q2 y Q3 y determinan los
valores correspondientes al 25%, al 50% y al 75% de los datos. Nótese que
Q2 coincide con la mediana. (Sierra, 2011)
2.2.2 Medidas de Dispersión o Variabilidad.
Entre los estadísticos más utilizados para estimar la variabilidad de una
serie de datos están el rango, la desviación estándar y el coeficiente de variación.
El rango está definido como: Rango = Valor más alto - menor valor
Es importante reconocer que el rango está influenciado por los valores
extremos y que pueden fluctuar ampliamente cuando se tienen muestras pequeñas.
Por esta razón los estadísticos han propuesto la desviación estándar (s) como otra
manera de determinar el grado de variabilidad de la distribución de una serie de
datos.
El coeficiente de variación (cv) es la relación entre la desviación estándar
y la media y es una medida de la variabilidad relativa de los datos sin importar la
magnitud de los valores de la variable.

S
CV %  x100
x
2.3 Distribuciones de Frecuencia
La información de datos puede presentarse de una manera más descriptiva, usando
un histograma. El histograma es un gráfico de frecuencias; en la abscisas se grafican los
valores de las concentraciones y en las ordenadas se grafican las veces que una
concentración está en un determinado intervalo de frecuencia. No existe una metodología
definida para construir los histogramas, pero el criterio más importante es que el
histograma debe tratar de reflejar la distribución o “forma” que siguen los datos. (Sierra,
2011)

2.4 Prueba de Hipótesis


Una prueba de hipótesis es una regla que especifica si se puede aceptar o rechazar
una afirmación acerca de una población dependiendo de la evidencia proporcionada por
una muestra de datos.

Una prueba de hipótesis examina dos hipótesis opuestas sobre una población: la
hipótesis nula y la hipótesis alternativa. La hipótesis nula es el enunciado que se probará.
Por lo general, la hipótesis nula es un enunciado de que "no hay efecto" o "no hay
diferencia". La hipótesis alternativa es el enunciado que se desea poder concluir que es
verdadero de acuerdo con la evidencia proporcionada por los datos de la muestra.
Con base en los datos de muestra, la prueba determina si se puede rechazar la
hipótesis nula. Usted utiliza el valor p para tomar esa decisión. Si el valor p es menor que
el nivel de significancia (denotado como α o alfa), entonces puede rechazar la hipótesis
nula.

Un error común de percepción es que las pruebas estadísticas de hipótesis están


diseñadas para seleccionar la más probable de dos hipótesis. Sin embargo, al diseñar una
prueba de hipótesis, establecemos la hipótesis nula como lo que queremos desaprobar.
Puesto que establecemos el nivel de significancia para que sea pequeño antes del análisis
(por lo general, un valor de 0.05 funciona adecuadamente), cuando rechazamos la
hipótesis nula, tenemos prueba estadística de que la alternativa es verdadera. En cambio,
si no podemos rechazar la hipótesis nula, no tenemos prueba estadística de que la hipótesis
nula sea verdadera. Esto se debe a que no establecimos la probabilidad de aceptar
equivocadamente la hipótesis nula para que fuera pequeña.

Entre las preguntas que se pueden contestar con una prueba de hipótesis están las
siguientes:

 ¿Tienen las estudiantes de pregrado una estatura media diferente de 66


pulgadas?

 ¿Es la desviación estándar de su estatura igual a o menor que 5 pulgadas?

 ¿Es diferente la estatura de las estudiantes y los estudiantes de pregrado en


promedio?

 ¿Es la proporción de los estudiantes de pregrado significativamente más alta que


la proporción de las estudiantes de pregrado?

III. CONCLUSIONES Y RECOMENDACIONES


3.1 Conclusiones
Al concluir con la exposición los estudiantes tienen conocimiento sobre:
• Como realizar e interpretar las medidas de tendencia central y dispersión
en los datos de calidad de agua a través del programa Excel.
• Como realizar una tabla de distribución de frecuencias con su respectivo
Histograma
• Como realizar y analizar la prueba de hipótesis (t-Student) en el
programa Excel a través de dos medias poblacionales.

3.2 Recomendaciones
• Al docente del curso de Calidad de Agua, realizar más ejemplos
comparando los diferentes parámetros físicos-químicos para un mejor
entendimiento de parte de los estudiantes.
• Este tema de exposición tendría que haber estado a cargo del docente
responsable, debido a que son temas de especialidad y entra mucha
estadística para el análisis de los datos.

IV. REFERNCIAS BIBLIOGRAFICAS


• Minitab 18. (2017). ¿Qué es una prueba de hipótesis? Obtenido de Minitab 18:
https://support.minitab.com/es-mx/minitab/18/help-and-how-to/statistics/basic-
statistics/supporting-topics/basics/what-is-a-hypothesis-test/

• Sierra, C. (2011). CALIDAD DE AGUA - Evaluación y Diagnostico (Primera ed.).


Medellín: Universidad de Medellin, Ediciones de la U.

Das könnte Ihnen auch gefallen