Beruflich Dokumente
Kultur Dokumente
Las formas de presentar información puede encontrarse de diferentes formas, entre ellas
escritas que nos ayudara a describir cosas cuando los datos son pocos, tabulares que
ordena la información y grafica que son formas con diferentes colores que nos ayudara a
darle mayor comprensión a esta información
Entre estas graficas encontraremos, de barras, por sectores, ojiva, de líneas, por
frecuencias entre otros cada uno tiene su función diferente.
Entre ellas tenemos la gráfica box plot que consiste en una caja donde se demuestra la
mediana, y diferentes cuartiles de los datos de la muestra esto y mucho mas veremos a
continuación.
Formas Graficas y Tabulares de análisis de presentación de
Información
Presentación escrita:
Esta forma de presentación de informaciones se usa cuando una serie de datos incluye
pocos valores, por lo cual resulta más apropiada la palabra escrita como forma de
escribir el comportamiento de los datos; mediante la forma escrita, se resalta la
importancia de las informaciones principales.
Presentación tabular:
Cuando los datos estadísticos se presentan a través de un conjunto de filas y de
columnas que responden a un ordenamiento lógico; es de gran eso e importancia para el
uso e importancia para el usuario ya que constituye la forma más exacta de presentar las
informaciones. Una tabla consta de varias partes, las principales son las siguientes:
Título: Es la parte más importante del cuadro y sirve para describir todo el contenido de
este.
Encabezados: Son los diferentes subtítulos que se colocan en la parte superior de cada
columna.
Columna matriz: Es la columna principal del cuadro.
Presentación gráfica:
La presentación de datos estadísticos constituye en sus diferentes modalidades uno de
los aspectos de más uso en la estadística descriptiva. A partir podemos visualizar a
través de los diferentes medios escritos y televisivos de comunicación masiva la
presentación de los datos estadísticos sobre el comportamiento de las
principales variables económicas y sociales, nacionales e internacionales.
La utilidad de los gráficos es doble, ya que pueden servir no sólo como sustituto a las
tablas, sino que también constituyen por sí mismos una poderosa herramienta para
el análisis de los datos, siendo en ocasiones el medio más efectivo no sólo para describir
y resumir la información, sino también para analizarla.
En este trabajo solo nos vamos a centrar únicamente en los gráficos como vehículo de
presentación de datos, sin abordar su otra faceta como herramienta de análisis.
De acuerdo al tipo de variable que vamos a representar, las principales graficas son las
siguientes:
Histograma: Es un conjunto de barras o rectángulos unidos uno de otro, en razón de
que lo utilizamos para representar variables continuas.
Polígono de frecuencias: Esta grafica se usa para representar los puntos medios
de clase en una distribución de frecuencias
Gráfica lineal: Son usadas principalmente para representar datos clasificados por
cantidad o tiempo; o sea, se usan para representar series de tiempo o cronológicas.
Gráfica de barra 100% y gráfica circular: se usan especialmente para representar las
partes en que se divide una cantidad total.
Se usan cuando lo que se busca es resaltar la representación de los porcentajes de los datos que
componen un total. Las barras pueden ser:
Verticales
Horizontales
La manera de presentar los datos es diferente según el tipo de los mismos. De forma
rápida podemos hacer dos grandes grupos: datos cuantitativos y datos cualitativos. En
el grupo de datos cuantitativos tenemos aquellos cuyo resultado puede variar de forma
continua, como puede ser el peso, la edad, etc. y los que sólo pueden tomar valores
enteros como por ejemplo el número de hijos, el número de ingresados en la Unidad de
Quemados un día concreto, etc. A su vez en las variables cualitativas distinguiremos las
nominales, que constituyen una simple etiqueta -como puede ser el sexo, el grupo
sanguíneo, etc.- de las ordinales, en las que se da una relación de orden entre las
respuestas, como por ejemplo en el resultado de una patología/tratamiento (fallece,
empeora, sin cambios, mejora, curación) o el nivel educacional. Cada tipo variable tiene
requerimientos propios en cuanto a presentación y en cuanto a las pruebas que se
utilizan para contrastar los valores entre diferentes grupos.
La precisión de la estimación efectuada a partir de los datos del estudio se refleja en el
intervalo de confianza. El intervalo de confianza de un parámetro viene dado por
dos límites, inferior y superior, en el que, de acuerdo con nuestros datos, esperamos que
se encuentre el valor verdadero del parámetro de la población (desconocido), con un
nivel de seguridad determinado y que se suele fijar en el 95%.
El intervalo de confianza es mucho más informativo que indicar solo si un resultado ha
sido estadísticamente significativo, incluso aunque se dé el valor de la probabilidad
Representaciones gráficas pueden alcanzar en el proceso de análisis de datos.
Los diagramas de Caja-Bigotes (boxplots o box and whiskers) son una presentación visual que
describe varias características importantes, al mismo tiempo, tales como la dispersión y
simetría.
Para su realización se representan los tres cuartiles y los valores mínimo y máximo de los datos,
sobre un rectángulo, alineado horizontal o verticalmente.
+-----+-+
* o |-----------| | |---|
+-----+-+
+---+---+---+---+---+---+---+---+---+---+---+---+---+---+---+
0 1 2 4 5 7 9 10 12 15
Ordenar los datos y obtener el valor mínimo, el máximo, los cuartiles Q1, Q2 y Q3 y el rango
intercuartílico (RIC):
En el ejemplo, para trazar la caja:
Valor 7: es el Q1 (25% de los datos)
Valor 8.5: es el Q2 o mediana (el 50% de los datos)
Valor 9: es el Q3 (75% de los datos)
Rango intercuartílico (Q3–Q1)
Los bigotes», las líneas que se extienden desde la caja, se extienden hasta los valores máximo y
mínimo de la serie o hasta 1,5 veces el RIC.
Cuando los datos se extienden más allá de esto, significa que hay valores atípicos en la serie y
entonces hay que calcular los límites superior e inferior, Li y Ls.
Para ello, se consideran atípicos los valores inferiores a Q1–1.5·RIC o superiores a Q3+1.5·RIC.
En el ejemplo:
Inferior: 7–1.5·2 = 4
Superior: 9+1.5·2 = 12
Ahora se buscan los últimos valores que no son atípicos, que serán los extremos de los bigotes.
En el ejemplo: 4 y 10
Marcar como atípicos todos los datos que están fuera del intervalo (Li, Ls).
En el ejemplo: 0,5 y 2,5
Además, se pueden considerar valores extremadamente atípicos aquellos que exceden Q1–3·RIC
o Q3+3·RIC.
De modo que, en el ejemplo:
Inferior: 7–3·2 = 1
Superior: 9+3·2 = 15
Utilidad
Proporcionan una visión general de la simetría de la distribución de los datos; si la mediana no
está en el centro del rectángulo, la distribución no es simétrica.
Son útiles para ver la presencia de valores atípicos también llamados outliers.
Pertenece a las herramientas de la estadística descriptiva. Permite ver como es la dispersión
de los puntos con la mediana, los percentiles 25 y 75 y los valores máximos y mínimos.
Ponen en una sola dimensión los datos de un histograma, facilitando así el análisis de la
información al detectar que el 50% de la población está en los límites de la caja.
Construcción:
Una gráfica de este tipo consiste en una caja rectangular, donde los lados más largos muestran
el recorrido intercuartílico. Este rectángulo está dividido por un segmento vertical que indica
donde se posiciona la mediana y por lo tanto su relación con los cuartiles primero y tercero
(recordemos que el segundo cuartil coincide con la mediana).
Esta caja se ubica a escala sobre un segmento que tiene como extremos los valores mínimo y
máximo de la variable. Las líneas que sobresalen de la caja se llaman bigotes. Estos bigotes
tienen un límite de prolongación, de modo que cualquier dato o caso que no se encuentre dentro
de este rango es marcado e identificado individualmente
Ejemplo:
Utilizamos la ya usada distribución de frecuencias (en tallos y hojas), que representan la edad de
un colectivo de 20 personas.
36 25 37 24 39 20 36 45 31 31
39 24 29 23 41 40 33 24 34 40
Ordenar datos:
Para calcular los parámetros estadístico, lo primero es ordenar la distribución
20 23 24 24 24 25 29 31 31 33 34 36 36 37 39 39 40 40 41 4
Calculo de Cuartiles
Q1, el cuartil Primero es el valor mayor que el 25% de los valores de la distribución. Como N =
20 resulta que N/4 = 5; el primer cuartil es la media aritmética de dicho valor y el siguiente:
Q2=(39 + 39) / 2 = 39
Información de Diagrama
Podemos obtener abundante información de una distribución a partir de estas representaciones.
La parte izquierda de la caja es mayor que la de la derecha; ello quiere decir que las edades
comprendidas entre el 25% y el 50% de la población está más dispersa que entre el 50% y el
75%.
El bigote de la izquierda (Xmím, Q1) es más corto que el de la derecha; por ello el 25% de los
más jóvenes están más concentrados que el 25% de los mayores.
El rango intercuartílico = Q3 - Q1 = 14,5; es decir, el 50% de la población está comprendido en
14,5 años.
Conclusiones: