Sie sind auf Seite 1von 12

UNIVERSIDAD PANAMERICANA

Facultad de Ciencias Económicas


Licenciatura en Administración de Empresas
Estadística Básica

Formas Graficas y Tabulares de análisis de presentación de


Información y Box Plot
(Tarea de Investigación y Exposición)

Elsy Victoria Ramirez Yat (201803990)


Carmen Yolanda Teletor Ceballos (201704695)

Salamá Baja Verapaz, 22 de mayo 2019


Formas Graficas y Tabulares de análisis de presentación de
Información y Box Plot
(Tarea de Investigación y Exposición)

Elsy Victoria Ramirez Yat (201803990)


Carmen Yolanda Teletor Ceballos (201704695)

Lic. Maximino Morales Suruy (Docente)

Salamá Baja Verapaz, 22 de mayo 2019


Introducción:

Las formas de presentar información puede encontrarse de diferentes formas, entre ellas
escritas que nos ayudara a describir cosas cuando los datos son pocos, tabulares que
ordena la información y grafica que son formas con diferentes colores que nos ayudara a
darle mayor comprensión a esta información
Entre estas graficas encontraremos, de barras, por sectores, ojiva, de líneas, por
frecuencias entre otros cada uno tiene su función diferente.
Entre ellas tenemos la gráfica box plot que consiste en una caja donde se demuestra la
mediana, y diferentes cuartiles de los datos de la muestra esto y mucho mas veremos a
continuación.
Formas Graficas y Tabulares de análisis de presentación de
Información

Presentación escrita:
Esta forma de presentación de informaciones se usa cuando una serie de datos incluye
pocos valores, por lo cual resulta más apropiada la palabra escrita como forma de
escribir el comportamiento de los datos; mediante la forma escrita, se resalta la
importancia de las informaciones principales.

Presentación tabular:
Cuando los datos estadísticos se presentan a través de un conjunto de filas y de
columnas que responden a un ordenamiento lógico; es de gran eso e importancia para el
uso e importancia para el usuario ya que constituye la forma más exacta de presentar las
informaciones. Una tabla consta de varias partes, las principales son las siguientes:

Título: Es la parte más importante del cuadro y sirve para describir todo el contenido de
este.
Encabezados: Son los diferentes subtítulos que se colocan en la parte superior de cada
columna.
Columna matriz: Es la columna principal del cuadro.

Cuerpo: El cuerpo contiene todas las informaciones numéricas que aparecen en la


tabla.
Fuente: La fuente de los datos contenidos en la tabla indica la procedencia de estos.
Notas al pie: Son usadas para hacer algunas aclaraciones sobre aspectos que aparecen
en la tabla o cuadro y que no han sido explicados en otras partes.

Presentación gráfica:
La presentación de datos estadísticos constituye en sus diferentes modalidades uno de
los aspectos de más uso en la estadística descriptiva. A partir podemos visualizar a
través de los diferentes medios escritos y televisivos de comunicación masiva la
presentación de los datos estadísticos sobre el comportamiento de las
principales variables económicas y sociales, nacionales e internacionales.

Proporciona al lector o usuario mayor rapidez en la comprensión de los datos, una


gráfica es una expresión artística usada para representar un conjunto de datos.

En estadística denominamos gráficos a aquellas imágenes que, combinando la


utilización de sombreado, colores, puntos, líneas, símbolos, números, texto y
un sistema de referencia (coordenadas), permiten presentar información cuantitativa.

La utilidad de los gráficos es doble, ya que pueden servir no sólo como sustituto a las
tablas, sino que también constituyen por sí mismos una poderosa herramienta para
el análisis de los datos, siendo en ocasiones el medio más efectivo no sólo para describir
y resumir la información, sino también para analizarla.
En este trabajo solo nos vamos a centrar únicamente en los gráficos como vehículo de
presentación de datos, sin abordar su otra faceta como herramienta de análisis.
De acuerdo al tipo de variable que vamos a representar, las principales graficas son las
siguientes:
Histograma: Es un conjunto de barras o rectángulos unidos uno de otro, en razón de
que lo utilizamos para representar variables continuas.

Polígono de frecuencias: Esta grafica se usa para representar los puntos medios
de clase en una distribución de frecuencias

Gráfica lineal: Son usadas principalmente para representar datos clasificados por
cantidad o tiempo; o sea, se usan para representar series de tiempo o cronológicas.
Gráfica de barra 100% y gráfica circular: se usan especialmente para representar las
partes en que se divide una cantidad total.

La ojiva: Esta grafica consiste en la representación de las frecuencias acumuladas de


una distribución de frecuencias. Puede construirse de dos maneras diferentes; sobre la
base "menor que" o sobre la base "o más". Puede determinar el valor de la mediana de
la distribución.

Gráfica de barras: Es un conjunto de rectángulos o barras separadas una de la otra, en razón


de que se usa para representar variables discretas; las barras deben ser de igual base o
ancho y separadas a igual distancia. Pueden disponerse en forma vertical y horizontal.
Gráficos de barras horizontales
Representan valores discretos a base de trazos horizontales, aislados unos de otros. Se utilizan
cuando los textos correspondientes a cada categoría son muy extensos.
 para una serie
 para dos o más serie

Gráficos de barras proporcionales

Se usan cuando lo que se busca es resaltar la representación de los porcentajes de los datos que
componen un total. Las barras pueden ser:
Verticales
Horizontales

Gráficos de barras comparativas: Se utilizan para amparar dos o más series,


para comparar valores entre categorías. barras pueden ser: Verticales Horizontales

Una presentación adecuada y clara de los resultados de


un trabajo de investigación además de ser fundamental para contribuir a la difusión de
los mismos, puede incluso ser imprescindible para lograr que se acepte su publicación.
En la actualidad la exigencia de las revistas y de los revisores ha contribuido a que el
nivel de calidad en la presentación de datos sea bastante bueno, por lo que es
conveniente tener algunas ideas muy claras para evitar errores o situaciones que hoy ya
no son admisibles, lo que no solo nos preparará para la publicación de nuestros trabajos
sino también para una lectura crítica de los de otros. Precisamente un buen punto de
partida para obtener información, no sólo sobre cómo presentar nuestros resultados sino
también sobre cómo preparar todo el conjunto del artículo, lo constituyen las propias
guías suministradas por las revistas.

La manera de presentar los datos es diferente según el tipo de los mismos. De forma
rápida podemos hacer dos grandes grupos: datos cuantitativos y datos cualitativos. En
el grupo de datos cuantitativos tenemos aquellos cuyo resultado puede variar de forma
continua, como puede ser el peso, la edad, etc. y los que sólo pueden tomar valores
enteros como por ejemplo el número de hijos, el número de ingresados en la Unidad de
Quemados un día concreto, etc. A su vez en las variables cualitativas distinguiremos las
nominales, que constituyen una simple etiqueta -como puede ser el sexo, el grupo
sanguíneo, etc.- de las ordinales, en las que se da una relación de orden entre las
respuestas, como por ejemplo en el resultado de una patología/tratamiento (fallece,
empeora, sin cambios, mejora, curación) o el nivel educacional. Cada tipo variable tiene
requerimientos propios en cuanto a presentación y en cuanto a las pruebas que se
utilizan para contrastar los valores entre diferentes grupos.
La precisión de la estimación efectuada a partir de los datos del estudio se refleja en el
intervalo de confianza. El intervalo de confianza de un parámetro viene dado por
dos límites, inferior y superior, en el que, de acuerdo con nuestros datos, esperamos que
se encuentre el valor verdadero del parámetro de la población (desconocido), con un
nivel de seguridad determinado y que se suele fijar en el 95%.
El intervalo de confianza es mucho más informativo que indicar solo si un resultado ha
sido estadísticamente significativo, incluso aunque se dé el valor de la probabilidad
Representaciones gráficas pueden alcanzar en el proceso de análisis de datos.

Propósito de Los gráficos


En estadística denominamos gráficos a aquellas imágenes que, combinando la
utilización de sombreado, colores, puntos, líneas, símbolos, números, texto y
un sistema de referencia (coordenadas), permiten presentar información cuantitativa.
La utilidad de los gráficos es doble, ya que pueden servir no sólo como sustituto a las
tablas, sino que también constituyen por sí mismos una poderosa herramienta para el
análisis de los datos, siendo en ocasiones el medio más efectivo no sólo para describir y
resumir la información, sino también para analizarla.
El propósito de un gráfico no es entonces muy diferente del de cualquier otra
herramienta estadística: ayudar a la comprensión y comunicación de la evidencia
aportada por los datos respecto a una hipótesis en estudio. Un gráfico científico debe
servir por tanto para representar la realidad, no para generar nuevas realidades
inexistentes fuera de la propia imagen. La llegada de los ordenadores y de programas
para la generación de gráficos y presentaciones ha puesto en manos del usuario común
una herramienta poderosa, antes de que disponga de los conocimientos o la mentalidad
adecuada para usarla, y de esa forma nos vemos invadidos, cierto que con honrosas
excepciones, por una insensata proliferación de gráficos mercantilistas que parece que
tienen como único objetivo hacernos ver la capacidad del programa utilizado: llenos de
una variada gama de colores, todo tipo de fuentes de letras imaginables, casi tantos
como palabras, y por supuesto representación al menos en tres dimensiones. Todo lo
contrario de lo que un buen gráfico científico debe ser, en el que su calidad radica
precisamente en la simplicidad de la presentación para permitir visualizar
unos datos complejos.
Medidas de centralización
Se llama medidas de posición, tendencia central o centralización a unos valores
numéricos en torno a los cuales se agrupan, en mayor o menor medida, los valores de
una variable estadística. Estas medidas se conocen también como promedios.
Para que un valor pueda ser considerado promedio, debe cumplirse que esté situado
entre el menor y el mayor de la serie y que su cálculo y utilización resulten sencillos en
términos matemáticos.
Se distinguen dos clases principales de valores promedio:
Las medidas de posición centrales: medias (aritmética, geométrica, cuadrática,
ponderada), mediana y moda.
Las medidas de posición no centrales: entre las que destacan especialmente los
cuantíales.

Las medidas de centralización son parámetros representativos de distribuciones de


frecuencia como las que ilustra la imagen.
Media aritmética
Se define media aritmética de una serie de valores como el resultado producido al
sumar todos ellos y dividir la suma por el número total de valores. La media aritmética
se expresada como
Los cuantíeles son medidas de tendencia no centrales, que permiten determinar la
proporción de la población de una variable estadística cuyos valores estadísticos son
menores o iguales que un valor tomado como referencia. Este valor puede determinarse
dividiendo la población en diez partes (deciles), cien partes (percentiles), etcétera.
Variables estadísticas
En el mundo natural y en las sociedades humanas existen fenómenos cuyo
comportamiento no puede establecerse mediante leyes fijas, sino que obedecen a la
conjunción de múltiples factores cuya interacción es a menudo incontrolable. En tales
casos se recurre a análisis estadísticos, que recogen datos sobre un número elevado de
manifestaciones del fenómeno y los relacionan y describen por medio de tablas, gráficos
y valores numéricos representativos.
Diagrama de caja o diagrama box plot
También conocido como diagrama de caja y bigote, box plot, box-plot o boxplot. Es un método
estandarizado para representar gráficamente una serie de datos numéricos a través de sus
cuartiles. De esta manera, el diagrama de caja muestra a simple vista la mediana y los cuartiles
de los datos1, pudiendo también representar los valores atípicos de estos.

Los diagramas de Caja-Bigotes (boxplots o box and whiskers) son una presentación visual que
describe varias características importantes, al mismo tiempo, tales como la dispersión y
simetría.

Para su realización se representan los tres cuartiles y los valores mínimo y máximo de los datos,
sobre un rectángulo, alineado horizontal o verticalmente.

Cómo expresarlo gráficamente


Para la interpretación de este tipo de gráfico, primero obtenemos la media de cada intervalo, y
luego la mediana de la tabla de frecuencias en general. Con estos datos utilizamos la fórmula de
la media de cada intervalo elevado a la mediana. Los datos obtenidos en esta fórmula son la
interpretación.

+-----+-+
* o |-----------| | |---|
+-----+-+

+---+---+---+---+---+---+---+---+---+---+---+---+---+---+---+
0 1 2 4 5 7 9 10 12 15

Ordenar los datos y obtener el valor mínimo, el máximo, los cuartiles Q1, Q2 y Q3 y el rango
intercuartílico (RIC):
En el ejemplo, para trazar la caja:
Valor 7: es el Q1 (25% de los datos)
Valor 8.5: es el Q2 o mediana (el 50% de los datos)
Valor 9: es el Q3 (75% de los datos)
Rango intercuartílico (Q3–Q1)

Los bigotes», las líneas que se extienden desde la caja, se extienden hasta los valores máximo y
mínimo de la serie o hasta 1,5 veces el RIC.
Cuando los datos se extienden más allá de esto, significa que hay valores atípicos en la serie y
entonces hay que calcular los límites superior e inferior, Li y Ls.
Para ello, se consideran atípicos los valores inferiores a Q1–1.5·RIC o superiores a Q3+1.5·RIC.
En el ejemplo:
Inferior: 7–1.5·2 = 4
Superior: 9+1.5·2 = 12

Ahora se buscan los últimos valores que no son atípicos, que serán los extremos de los bigotes.
En el ejemplo: 4 y 10
Marcar como atípicos todos los datos que están fuera del intervalo (Li, Ls).
En el ejemplo: 0,5 y 2,5

Además, se pueden considerar valores extremadamente atípicos aquellos que exceden Q1–3·RIC
o Q3+3·RIC.
De modo que, en el ejemplo:

Inferior: 7–3·2 = 1

Superior: 9+3·2 = 15
Utilidad
Proporcionan una visión general de la simetría de la distribución de los datos; si la mediana no
está en el centro del rectángulo, la distribución no es simétrica.

 Son útiles para ver la presencia de valores atípicos también llamados outliers.
 Pertenece a las herramientas de la estadística descriptiva. Permite ver como es la dispersión
de los puntos con la mediana, los percentiles 25 y 75 y los valores máximos y mínimos.
 Ponen en una sola dimensión los datos de un histograma, facilitando así el análisis de la
información al detectar que el 50% de la población está en los límites de la caja.
Construcción:

Una gráfica de este tipo consiste en una caja rectangular, donde los lados más largos muestran
el recorrido intercuartílico. Este rectángulo está dividido por un segmento vertical que indica
donde se posiciona la mediana y por lo tanto su relación con los cuartiles primero y tercero
(recordemos que el segundo cuartil coincide con la mediana).

Esta caja se ubica a escala sobre un segmento que tiene como extremos los valores mínimo y
máximo de la variable. Las líneas que sobresalen de la caja se llaman bigotes. Estos bigotes
tienen un límite de prolongación, de modo que cualquier dato o caso que no se encuentre dentro
de este rango es marcado e identificado individualmente

Ejemplo:
Utilizamos la ya usada distribución de frecuencias (en tallos y hojas), que representan la edad de
un colectivo de 20 personas.

36 25 37 24 39 20 36 45 31 31

39 24 29 23 41 40 33 24 34 40

Ordenar datos:
Para calcular los parámetros estadístico, lo primero es ordenar la distribución

20 23 24 24 24 25 29 31 31 33 34 36 36 37 39 39 40 40 41 4
Calculo de Cuartiles
Q1, el cuartil Primero es el valor mayor que el 25% de los valores de la distribución. Como N =
20 resulta que N/4 = 5; el primer cuartil es la media aritmética de dicho valor y el siguiente:

Q1=(24 + 25) / 2 = 24,5

Q2, el Segundo Cuartil es, evidentemente, la mediana de la distribución, es el valor de la


variable que ocupa el lugar central en un conjunto de datos ordenados. Como N/2 =10 ; la
mediana es la media aritmética de dicho valor y el siguiente:

me= Q2 = (33 + 34)/ 2 =33,5

Q3 , el Tercer Cuartil, es el valor que sobrepasa al 75% de los valores de la distribución. En


nuestro caso, como 3N / 4 = 15, resulta

Q2=(39 + 39) / 2 = 39

Dibujar Grafica de Caja y Bigotes o box Plot

El bigote de la izquierda representa al colectivo de edades ( Xmín, Q1)


La primera parte de la caja a (Q1, Q2),
La segunda parte de la caja a (Q2, Q3)
El bigote de la derecha viene dado por (Q3, Xmáx).

Información de Diagrama
Podemos obtener abundante información de una distribución a partir de estas representaciones.
La parte izquierda de la caja es mayor que la de la derecha; ello quiere decir que las edades
comprendidas entre el 25% y el 50% de la población está más dispersa que entre el 50% y el
75%.
El bigote de la izquierda (Xmím, Q1) es más corto que el de la derecha; por ello el 25% de los
más jóvenes están más concentrados que el 25% de los mayores.
El rango intercuartílico = Q3 - Q1 = 14,5; es decir, el 50% de la población está comprendido en
14,5 años.
Conclusiones:

 La presentación de datos escritos se utilizan cuando los datos son pocos y la


mejor forma de presentarlos es por medio de una explicación escrita.
 La representación de datos de forma tabular se lleva a cabo cuando se presentan
datos por medio de diferentes columnas esto para facilitar su comprensión.
 La presentación grafica es una forma de presentar datos de mantera estadística
consiste en una serie de figuras con diferentes valores y colores que ayuda a la
comprensión de estos datos antes mencionados.
 La grafica box plot consiste en una gráfica en forma de caja donde se
demuestran la mediana el máximo y mínimo y el cuartil 1 y 3 de una serie de
datos para darle diferentes interpretaciones de estos valores.

Das könnte Ihnen auch gefallen