Sie sind auf Seite 1von 30

1

UNIVERSIDAD DE ORIENTE
NCLE ANZOTEGUI
UNIDAD DE CURSOS BSICOS
DEPARTAMENTO DE CIENCIAS
















Estadstica General Informe presentado por:
Cdigo de la asignatura: 0082023 Betmarys Tavares CI: 23.899.417
Seccin: 20 Nariana Prez. C.I: 20.919.605
Susana V. Ruiz. CI: 23.534.743



Barcelona, febrero de 2014
Introduccin a la Estadstica
y Estadstica descriptiva

2

INTRODUCCIN
La palabra estadstica se origina en las tcnicas de recoleccin, organizacin,
conservacin y tratamiento de los datos propios de un Estado, con lo que los antiguos
gobernantes controlaban sus sbditos y dominios econmicos. Estas tcnicas
evolucionaron junto con el desarrollo de las matemticas, utilizando sus herramientas
en el proceso del anlisis e interpretacin de la informacin.
El avance tecnolgico en la informtica ha contribuido enormemente al
desarrollo de la estadstica, sobre todo en la manipulacin de la informacin, pues en
el mercado existen paquetes estadsticos de excelente calidad, permitiendo el manejo
de grandes volmenes de informacin y de variables.
La estadstica entonces dej de ser una tcnica exclusiva de los estados, para
convertirse en una herramienta imprescindible de todas las ciencias, de donde
provienen las diferentes definiciones de los autores, ya que cada estudioso la define
de acuerdo con lo que utiliza de ella.
La estadstica no es una ciencia en s misma; sino un grupo de mtodos con
base cientfica empleados para la recoleccin, representacin, anlisis e interpretacin
de datos; con el fin de llegar a conclusiones o hacer predicciones concernientes al
fenmeno estudiado. De hecho, la estadstica es una rama de las matemticas.
El hombre acumula informacin que luego clasifica y analiza para poder
entender y controlar; luego la traduce a cifras, clculos y datos que ayudan a tomar
decisiones sobre cosas tan cotidianas como la compra de un vehculo, el lugar ms
seguro para vivir, la variacin del clima en una zona o cosas tan indispensables como
la compra y venta de un producto en una empresa o la matrcula de una institucin
educativa. Una forma de recolectar e interpretar los datos es a lo que se llama
estadstica.

3

La meta de la estadstica es tambin reducir y comprimir cantidades de datos.
Para ello se aplica la estadstica descriptiva, donde el inters se centra en describir el
conjunto de datos y no se plantea en extender las conclusiones a otros datos diferentes
a una poblacin, y la estadstica inferencial que estudia los resmenes de datos con
referencia a un modelo de tipo probabilstico.
En fin, la estadstica se presenta como una herramienta indispensable en la
toma de decisiones o al momento de escribir o entender trabajos cientficos. Hoy est
presente en casi todas las profesiones. Para un investigador mdico que indague sobre
los efectos de un nuevo medicamento, la estadstica es la evidencia del xito en sus
trabajos de investigacin.
4

NDICE

Introduccin ................................................................................................................ 2

Unidad I: Introduccin a la Estadstica .................................................................... 5
Definicin de estadstica e importancia. ....................................................................... 5
Alcances y limitaciones de la estadstica ...................................................................... 6
Divisin de la estadstica ............................................................................................... 6
Muestreo y tipos de muestreo ....................................................................................... 7
Niveles de medicin ...................................................................................................... 9

Unidad II: Estadstica Descriptiva .......................................................................... 11
Manejo de datos, toma, organizacin y presentacin de datos. .................................. 11
Distribucin de frecuencias. ........................................................................................ 16
Tipos de grficas estadsticas. ..................................................................................... 18
Medidas de posicin. ................................................................................................... 22
Medidas de asimetra................................................................................................... 26

Conclusin .................................................................................................................. 29

Bibliografa ................................................................................................................ 29




5

UNIDAD I
INTRODUCCIN A LA ESTADSTICA
1. Definicin de estadstica e importancia.
La estadstica es una rama de la matemtica que se refiere a la recoleccin,
anlisis e interpretacin de los datos obtenidos en un estudio. En forma general, la
estadstica es un conjunto de tcnicas que, partiendo de la observacin de fenmenos,
permiten al investigador obtener conclusiones tiles sobre ellos.

Es de gran importancia en la investigacin cientfica debido a que:
Permite una descripcin ms exacta.
Permite resumir los resultados de manera significativa y cmoda.
Permite deducir conclusiones generales.

En las ltimas dcadas la estadstica ha alcanzado un alto grado de desarrollo,
hasta el punto de incursionar en la totalidad de las ciencias; es una ciencia auxiliar
para todas las ramas del saber y parte esencial para toda profesin. La estadstica es
tan importante que casi no existe actividad humana en que no est involucrada la
estadstica.

En el sector salud se emplea el trmino bioestadstica para referirse a la
aplicacin de los mtodos estadsticos a los problemas de biologa y las ciencias de la
salud. Cuando se realiza una historia clnica, un examen fsico o de laboratorio, lo que
se est es recogiendo informacin estadstica (datos numricos) que ayudaran al
diagnstico o teraputica.

Para casi todos los tipos de estudio, se debe hacer un anlisis matemtico para
ver si los resultados tienen significado, siempre es posible que un resultado aparente
pueda deberse a la probabilidad. Los investigadores usan varios mtodos estadsticos
para analizar el resultado y llegar a alguna conclusin general.
6

Cada da se reconoce ms la importancia de contar con estadsticas vlidas y
confiables, particularmente para el desarrollo de estimaciones de poblacin y la
formulacin, monitoreo y evaluacin de polticas pblicas en el campo de la salud.

Las estadsticas vitales constituyen la base fundamental para el conocimiento
del crecimiento natural de la poblacin, de la evidencia sobre su estado de salud y
perfil epidemiolgico.

2. Alcances y limitaciones de la estadstica.
Entre sus alcances se encuentran:
Planificacin y evaluacin del comportamiento.
Medicin de preferencia y opiniones.
Comparacin de situaciones.
Medicin de caractersticas demogrficas.
Estudia las poblaciones completas acudiendo a muestras pequeas, ahorrando as
recursos y tiempo.

Entre sus limitaciones se encuentran:
Permite el manejo de datos y facilita su anlisis e interpretacin, pero si la calidad
de estos no es adecuada se puede cuestionar la validez de las conclusiones.
No explica fenmenos ni establece relaciones causales, sino tan solo asociaciones
estadsticas

3. Divisin de la estadstica.
Las tcnicas estadsticas son tan diversas que suelen ser agrupadas en dos
categoras generales: estadstica descriptiva y estadstica inferencial (esta ltima
tambin llamada inferencia estadstica). Ambas ramas comprenden la estadstica
aplicada. Hay tambin una disciplina llamada estadstica matemtica, la que se refiere
a las bases tericas de la materia.

7

3.1. Estadstica descriptiva: comprende las tcnicas que se emplean para resumir y
describir datos numricos; especficamente se ocupa de la recoleccin,
clasificacin, ordenacin, tabulacin y representacin grfica de los datos
estadsticos que se deriven de la medicin de las caractersticas del objeto de
estudio. En fin, la estadstica descriptiva solo se encarga de mostrar
organizadamente la informacin que se tiene.

Ejemplos bsicos de parmetros estadsticos son: la media y la desviacin
estndar. Algunos ejemplos grficos son: histograma, pirmide poblacional, grfico
circular, entre otros.

3.2. Estadstica inferencial: comprende las tcnicas con las que, con base
nicamente en una muestra sometida a observacin, se toman decisiones sobre
una poblacin o proceso estadstico. Estas inferencias pueden tomar la forma de
respuestas a preguntas si/no (prueba de hiptesis), estimaciones de unas
caractersticas numricas (estimacin), pronsticos de futuras observaciones,
descripciones de asociacin (correlacin) o modelamiento de relaciones entre
variables (anlisis de regresin).

Con la aplicacin de los procedimientos que comprende la estadstica
inferencial se espera que a partir de un nmero limitado de casos se llegue a una
conclusin general acerca de las caractersticas de la poblacin objeto de estudio.

4. Muestreo y tipos de muestreo.
El muestreo se puede definir como el proceso mediante el cual se selecciona
una muestra. Una muestra es un subconjunto de la poblacin con caractersticas
particulares de la misma. Para que el muestreo est bien realizado es necesario que
los elementos escogidos representen bien a toda la poblacin. Si la muestra no
cumple este cometido se dice que la muestra es sesgada o tendenciosa; en el caso
8

contrario, cuando la muestra ha sido bien seleccionada, se habla de muestra
representativa.

4.1. Muestreo no aleatorio o de juicio: en este mtodo se utiliza el conocimiento y
la opinin personal para identificar los elementos de la poblacin que van a
incluirse en la muestra. Una muestra seleccionada por muestreo de juicio se basa
en el conocimiento de la poblacin por parte de alguien. Este mtodo puede dar
buenos resultados, sin embargo, no es posible medir su validez.

4.2. Muestreo aleatorio o probabilstico: cuando el muestreo es aleatorio todos los
elementos de la poblacin tienen la misma posibilidad de figurar o no en la
muestra. Las muestras aleatorias no favorecen a ningn elemento de la poblacin,
lo cual evita parcialidades, sesgos, que conduciran a estimaciones imprecisas. Por
eso se puede evaluar objetivamente las estimaciones de las caractersticas de la
poblacin que resultan de la muestra; es decir, se puede medir la validez de la
estimacin.

Existen diversos mtodos del muestreo aleatorio:
Muestreo aleatorio simple: con este tipo de muestreo se seleccionan las muestras
mediante cualquier mtodo que permita a cada elemento de la poblacin entera tener
igual probabilidad de quedar incluido en la muestra. La tabla de nmeros aleatorios es
una herramienta sumamente til para la seleccin de este tipo de muestras.

Muestreo estratificado: con este tipo de muestreo se divide a la poblacin en grupos
homogneos relativos, llamados estratos, para luego tomar muestras aleatorias en
cada estrato garantizando que todos los elementos de la poblacin tienen la misma
posibilidad de quedar seleccionados. La poblacin puede estratificarse, por ejemplo,
por edad, sexo, estado de salud, entre otros.

9

Muestreo por conglomerados: en este tipo de muestreo se divide a la poblacin en
grupos o conglomerados y luego se selecciona una muestra aleatoria de ellos. Se
supone que esos conglomerados son representativos de la poblacin entera. Ejemplo
de conglomerados son: salones, grupos, urbanizaciones, entre otros.

5. Niveles de medicin
Los datos se pueden clasificar de acuerdo a cuatro niveles de medicin. Los
niveles de medicin indican que tipo de operacin se puede hacer con los datos para
resumirlos, presentarlos y determinar que pruebas estadsticas pueden llevarse a cabo
con ellos. Estos niveles tienen un orden ascendente.

5.1. Medicin nominal: en este tipo de medicin los objetos slo pueden ser
nombrados o contados. No hay un orden, consiste simplemente en clasificar
observaciones dentro de ciertas categoras, las cuales deben ser mutuamente
excluyentes y colectivamente exhaustivas. Mutuamente excluyentes significa que
un individuo, objeto o medicin pertenece nicamente a una categora, y
exhaustiva significa que ninguna medicin puede quedar sin categoras.

Una medicin es nominal cuando los datos se distribuyen en dos o ms
categoras que difieren entre s cualitativamente. El gnero, el color de cabello, la tez
y el color de los ojos son ejemplos de este tipo de medidas. En la medicin nominal
un mismo objeto de anlisis no puede estar en dos categoras, pero todos tienen que
estar en una.

5.2. Medicin ordinal: en este caso las observaciones adems de poder ser
clasificadas en categoras, tambin pueden ser ordenadas por rango, de manera
creciente o decreciente. Esto significa que una primera observacin puede ser
mayor que la segunda, y esta a su vez mayor que la tercera, y as sucesivamente.
Sin embargo esto no implica una secuencia de intervalos iguales.

10

A diferencia de una medida en escala nominal, en una escala ordinal se
asignan los datos a un conjunto de categoras en base a ciertos criterios, estas
categoras difieren entre s cuantitativamente. Las encuestas de opinin con
frecuencia utilizan una medida en escala ordinal como: totalmente de acuerdo, de
acuerdo, sin opinin, en desacuerdo y en total desacuerdo.

5.3. Medicin de intervalo: posee las caractersticas de la normal con la salvedad
que aqu la distancia entre los rangos son equivalentes, esto quiere decir que los
intervalos pueden ser sumados y restados. Otra caracterstica resaltante de la
medicin es que este tipo de variables no tiene cero absoluto, esto significa que el
atributo que se mide no tiene ausencia.

En una escala de intervalos las variables se miden de manera numrica, y al
igual que los datos ordinales, llevan inherente un rango u ordenamiento. Sin
embargo, a diferencia de los rangos ordinales, la diferencia entre los valores es
importante. Adicionalmente, en una escala de intervalos el valor de cero se selecciona
arbitrariamente, es decir, no tiene significado numrico solo es un punto de
referencia. La escala Fahrenheit para las temperaturas es un ejemplo de una escala de
intervalos.

5.4. Medicin de razn: es el nivel ms alto de medicin, ella posee todas las
caractersticas de las escalas anteriores, con la diferencia de que aqu el cero si es
absoluto, es decir, la presencia del cero indica la ausencia del atributo observado.

El valor cero no es arbitrario (no responde a las conveniencias de los
investigadores). Un ejemplo claro es la temperatura. La existencia de un cero en la
escala Celsius no supone la ausencia de temperatura, puesto que el cero grados
centgrados est situado por arbitrio de los creadores de la escala. Por el contrario, la
escala Kelvin s tiene un cero absoluto, precisamente all donde las molculas cesan
su actividad y no se produce roce entre los componentes moleculares.
11

UNIDAD II
ESTADSTICA DESCRIPTIVA
1. Manejo de datos, toma, organizacin y presentacin de datos.
Una de las etapas ms importantes de la investigacin es la recoleccin de la
informacin. El establecimiento de las fuentes, as como la cantidad y complejidad de
las preguntas, son decisiones que se han de tomar teniendo en cuenta la
disponibilidad de los recursos financieros, humanos y de tiempo, las limitaciones que
se tengan en la zona geogrfica, entre otros.

1.1. Fuente de datos: el lugar del cual se obtienen los datos para realizar anlisis
estadsticos se denomina fuente. Los datos requeridos para realizar una evaluacin
estadstica de los procesos administrativos se pueden encontrar por medio de
diversas fuentes las cuales pueden ser primarias o secundarias, oficiales o
privadas. Se llaman fuentes primarias a la persona o institucin que ha
recolectado los datos, y secundaria si la persona o institucin que ha publicado los
datos no fue la que efectu la investigacin.

Datos primarios: son aquellos que el investigador obtiene directamente de la
realidad, recolectndolos con sus propios instrumentos.

Datos secundarios: son registros escritos que proceden de un contacto con la
prctica, pero que ya han sido elegidos y procesados por otros investigadores.

Los datos primarios y secundarios son partes de una misma secuencia: todo
dato secundario ha sido primario en sus orgenes, y todo dato primario, a partir del
momento en que el investigador concluye su trabajo, se convierte en dato secundario
para los dems. Los datos oficiales son todos aquellos hallados en dependencias
gubernamentales, y por el contrario los datos emitidos por entes no gubernamentales
se denominan privados.
12

1.2. Tcnicas de recoleccin de datos: existen diversas tcnicas de recoleccin de
datos, entre las ms comunes o las ms empleadas se encuentran:

La observacin: consiste en el uso sistemtico de los sentidos para captar la
realidad a estudiar, y que luego ser organizada intelectualmente. El uso de los
sentidos es una fuente inagotable de datos de inestimable valor. Para realizar un
proceso de observacin con el propsito de recabar datos se deben seguir algunos
principios bsicos:

- Debe tener un propsito especfico.
- Debe ser planeada cuidadosa y sistemticamente.
- Debe llevarse, por escrito o de forma audiovisual, un control cuidadoso de la
misma.
- Debe especificarse su duracin y frecuencia.
- Debe seguir los principios bsicos de validez y confiabilidad.

La principal ventaja de esta tcnica es que los hechos son percibidos
directamente, sin ninguna clase de intermediacin, colocndonos ante una situacin
tal como sta se da naturalmente. Otra ventaja es que la conducta se describe en el
momento exacto en que est ocurriendo. Su principal desventaja reside en que la
presencia del observador puede generar una alteracin o modificacin en la conducta
de los objetos observados, destruyendo la espontaneidad y por tanto alterando la
confiabilidad de los datos.

La entrevista: el investigador, de acuerdo a la informacin que necesita
recolectar, elabora una serie de preguntas que ms tarde realiza a la persona que
se convertir en su fuente. La mayora de las veces se realizan en persona, es
decir, visitando al entrevistado y registrando la informacin ofrecida, ya sea con
un grabador o por escrito.
13

Como tcnica de recoleccin de datos la entrevista tiene muchas ventajas: es
aplicable a toda persona, siendo muy til con los analfabetos, los nios o con aquellos
que tienen limitacin fsica u orgnica que les dificulte proporcionar una respuesta
escrita. Se le puede explicar al entrevistado con qu propsito estamos recogiendo los
datos y esta ayuda a que ste dirija mejor sus respuestas. Tambin posee algunas
desventajas o limitaciones: requiere una mayor inversin de tiempo para recoger la
informacin, como las respuestas pueden ser totalmente abiertas se puede dificultar el
anlisis de los datos.

El cuestionario: es el mtodo que utiliza un instrumento impreso. Como en el
caso de la entrevista, hay preguntas, pero todas estn formuladas en un papel,
destinadas a obtener repuestas sobre el problema en estudio. El cuestionario
puede ser llenado por el encuestado o con ayuda de un empadronador y puede
aplicarse a grupos o individuos estando presente el responsable de recoger la
informacin o no; puede enviarse por diversos medios a los seleccionados en la
muestra.

Tambin puede contratarse a una persona que cumpla que aplique el
cuestionario, en estos casos se suele llamar cdula de entrevista. Un ejemplo de esta
aplicacin son los empadronadores de los censos de poblacin; la funcin que
cumplen es leer cada pregunta y marcar la respuesta dada por el encuestado. La
ventaja es que no quedarn preguntas en blanco y que puede ser aplicada a personas
alguna discapacidad. Cuando la aplicacin del cuestionario queda en manos de los
encuestados se pueden presentar problemas que a su vez se convierten en desventaja:
que el cuestionario no fuese devuelto; que los consultados evadan la respuesta a
alguna pregunta o no darle la importancia necesaria a las respuestas proporcionadas.
Debido a esa posible prdida de informacin se recomienda cuando se use est
tcnica se escoja una muestra ms grande de sujetos de estudio.


14

Existen tres tipos de cuestionarios:
- Cuestionarios abiertos: son en los que se pregunta al sujeto algo y se le deja en
libertad de responder como quiera. Este tipo de cuestionario es muy til y
proporciona mucha informacin, pero requiere ms tiempo por parte del
informante y es ms difcil de analizar por parte responsable de recoger los datos.

- Cuestionarios cerrados: estn estructurados de tal manera que al informante se
le ofrecen slo determinadas opciones de respuesta, y debe seleccionar una de
ellas. Este cuestionario es ms fcil de codificar y contestar. Como desventaja, es
que al ofrecerle categoras al informante se le estn "sugiriendo" las respuestas.

- Cuestionarios mixtos: poseen ambos tipos de preguntas abiertas y cerradas, por
ello el nombre de mixtos.

La mayora de los cuestionarios poseen la siguiente estructura:
a) Titulo.
b) Instrucciones.
c) Identificacin del encuestado (no hace referencia al nombre, en muchos
estudios las respuestas annimas suelen ser ms objetivas, pero si se aplica a
una poblacin diversa se puede identificar por edad, profesin, entre otros).
d) Preguntas.
e) Observaciones.

En general, en el proceso de recoleccin de datos los mtodos e instrumentos
y fuentes suelen combinarse, cada una con sus ventajas y desventajas, sus
caractersticas propias y la informacin que se requiera, sin embargo dan flexibilidad
para que el investigador determine su uso apropiado segn el estudio a realizar.

1.3. Crtica, clasificacin y ordenacin de datos: despus de haber reunido toda la
informacin pertinente, se necesita la depuracin de los datos recogidos. Para
hacer la crtica de una informacin, es fundamental el conocimiento de la
15

poblacin por parte de quien depura para poder detectar falsedades en las
respuestas, incomprensin a las preguntas, respuestas al margen, amn de todas
las posibles causas de nulidad de una pregunta o nulidad de todo un cuestionario.

Separado el material de "desecho" con la informacin depurada se procede a
establecer las clasificaciones respectivas y con la ayuda de hojas de trabajo, en las
que se establecen los cruces necesarios entre las preguntas, se ordenan las respuestas
y se preparan los modelos de tabulacin de las diferentes variables que intervienen en
la investigacin.

La tabulacin: una tabla es un resumen de informacin respecto a una o ms
variables, que ofrece claridad al lector sobre lo que se pretende describir. Para su
fcil interpretacin una tabla debe tener por lo menos: un ttulo adecuado el cual
debe ser claro y conciso. La tabla propiamente dicha con los correspondientes
subttulos internos y la cuantificacin de los diferentes tems de las variables, y
las notas de pie de cuadro que hagan claridad sobre situaciones especiales de la
tabla, u otorguen los crditos a la fuente de la informacin.

La presentacin: una informacin estadstica adquiere ms claridad cuando se
presenta en la forma adecuada. Los cuadros, tablas y grficos facilitan el anlisis,
pero se debe tener cuidado con las variables que se van a presentar y la forma de
hacerlo. No es aconsejable saturar un informe con tablas y grficos redundantes
que, antes que claridad, crean confusin.

Adems la eleccin de determinada tabla o grfico para mostrar los resultados,
debe hacerse no slo en funcin de las variables que relaciona, sino del lector a quien
va dirigido el informe.

El anlisis: la tcnica estadstica ofrece mtodos y procedimientos objetivos que
convierten las especulaciones de primera mano en aseveraciones cuya
16

confiabilidad puede ser evaluada y ofrecer una premisa medible en la toma de una
decisin. Es el anlisis donde se cristaliza la investigacin. Esta es la fase de la
determinacin de los parmetros y estadsticos muestrales para las estimaciones e
inferencias respecto a la poblacin, el ajuste de modelos y las pruebas de las
hiptesis planteadas, con el fin de establecer y redactar las conclusiones
definitivas.

2. Distribucin de frecuencias.
La estadstica descriptiva utiliza la distribucin de frecuencias para organizar
y presentar los datos. Lo deseable es lograr determinar de forma correcta las
distancias de los intervalos que se usarn para agrupar los datos.

La distribucin de frecuencias es un agrupamiento de datos en categoras
mutuamente excluyentes en el cual se registran la cantidad de veces que se ha
observado cada categora. Cuando se dispone de gran nmero de datos, es til
distribuirlos en clases o categoras para poder determinar el nmero de individuos
pertenecientes a cada clase, que es la frecuencia de clase. Una ordenacin tabular de
los datos en clases, reunidas las clases y con ms frecuencias correspondientes a cada
una, se conoce como una distribucin de frecuencias o tabla de frecuencias.

2.1. Tipos de frecuencias.
Frecuencia absoluta: es el nmero de veces que aparece un determinado valor en
un estudio estadstico. Se representa por f
i
. La suma de las frecuencias absolutas es
igual al nmero total de datos, que se representa por N. Para indicar resumidamente
estas sumas se utiliza la letra griega (sigma mayscula) que se lee suma o
sumatoria.

17

Frecuencia relativa: es el cociente entre la frecuencia absoluta de un
determinado valor y el nmero total de datos. Se puede expresar en tantos por
ciento y se representa por f
i
.

Frecuencia acumulada: es la suma de las frecuencias absolutas de todos los
valores inferiores o iguales al valor considerado. Se representa por f
a
.

Frecuencia relativa acumulada: es el cociente entre la frecuencia acumulada de
un determinado valor y el nmero total de datos. Se puede expresar en tantos por
ciento.

Punto medio:
- Valor central de la clase.
- Promedio entre el lmite inferior de entre dos clases sucesivas.
- Es el valor representativo de la clase.

2.2. Elementos de frecuencias.
Rango: es una medida de dispersin que se obtiene como la diferencia entre el
nmero mayor y el nmero menor de los datos.
R = Valor mximo Valor mnimo
Amplitud Total: es una medida que simplemente se obtiene sumndole 1 al
rango.

Clases: estn formadas por dos extremos, el menor se llama lmite inferior el
mayor se llama lmite superior. Hay distintos tipos de clases. El nmero de clase
se determina a travs de la frmula de Stuger, la cual es vlida cuando el N de
observaciones sea menor o igual a 500. Formula.
Nc = 1 + 3.33log (N)
Dnde: Nc es el nmero de clases y N la cantidad de muestras tomadas.
18

Valor del intervalo o amplitud: se obtiene por medio de la ecuacin de dicta.

Vi = AT / Nc

Dnde: Vi es el valor de intervalo, AT es la amplitud total y Nc el nmero de
clase.

3. Tipos de grficas estadsticas.
A pesar de la gran ayuda que prestan las tablas y cuadros con informacin
organizada, no todos los pblicos alcanzan a comprenderla o no disponen del tiempo
suficiente para analizarla. Es por ello que la mayora de los investigadores
acostumbran a reforzar la descripcin a travs de dibujos, generalmente con formas
geomtricas, que ayudan a visualizar el comportamiento de las variables tratadas.

Una grfica o diagrama es un dibujo complementario a una tabla o cuadro,
que permite observar las tendencias de un fenmeno en estudio y facilita el anlisis
estadstico de las variables all relacionadas.

Existen una gran cantidad de grficos para la representacin de datos
estadsticos, ya que de ellos depende el diseo artstico de quien los elabora, as como
de su imaginacin al combinar varios tipos de ellos, como forma de presentar una
informacin.

Grfico de lneas: usado bsicamente para mostrar el comportamiento de una
variable cuantitativa a travs del tiempo. El grfico de lneas consiste en
segmentos rectilneos unidos entre s, los cuales resaltan las variaciones de la
variable por unidad de tiempo.

Para su construccin ha de procederse de la siguiente manera: en el eje de las
ordenadas se marcan los puntos de acuerdo con la escala que se est utilizando. En el
caso de una escala aritmtica, distancias iguales en el eje, representan distancias
19

iguales en la variable. El eje de la variable X se divide en unidades de tiempo iguales,
teniendo presente el nmero de tems que ha de presentarse, as como la longitud del
eje. Es de anotar la conveniencia de mostrar la interrupcin y acercamiento del eje a
su origen cuando esto haya ocurrido.



Grfico de lneas compuesto: cuando se tienen varias variables a representar,
con el fin de establecer comparaciones entre ellas (siempre que su unidad de
medida sea la misma); se utiliza plasmarlos en un slo grfico, el cual es el
resultado de representar varias variables en un mismo plano.

Grfico de barras: como su nombre lo indica, est constituido por barras
rectangulares de igual ancho, conservando la misma distancia de separacin entre
s. Se utiliza bsicamente para mostrar y comparar frecuencias de variables
cualitativas o comportamientos en el tiempo, cuando el nmero de tems es
reducido. stos grficos suelen ser de barras verticales, aunque se pueden utilizar
de forma horizontal.






20

Histograma de frecuencias: para la construccin de un histograma de
frecuencias de fcil interpretacin y que no falsee la informacin, debe disponerse
de una distribucin de frecuencias por intervalos con amplitud igual para cada
clase o intervalo. En el eje de las abscisas procedemos a representar los intervalos
de la variable, y en el eje de las ordenadas las frecuencias de cada clase. El
histograma se construye dibujando barras contiguas que tienen como base la
amplitud de cada intervalo y como alturas las frecuencias respectivas.









Polgonos de Frecuencia: es perecido al histograma. Consiste en segmentos de
lnea que se conectan por los puntos formados por la interseccin del punto medio
de la clase y de la frecuencia de clase. La elaboracin de un polgono de
frecuencias se hace colocando los puntos medios de cada clase en el eje x y la
escala en el eje y, es decir, las frecuentas de clase. El punto medio representa los
valores de cada clase.

El histograma y el polgono de frecuencia permiten una visin de las
principales caractersticas de un conjunto de datos, a pesar de tener ambos el mismo
propsito, el histograma tiene la ventaja de representar cada frecuencia como un
rectngulo que adems incluye ambos valores del intervalo. Por su parte el polgono
de frecuencia tiene una ventaja sobre el histograma, permite comparar dos
distribuciones de frecuencia a la vez.

21

Grfico de sectores circulares: usualmente llamado grfico de pastel, debido a
su forma caracterstica de una circunferencia dividida en cascos, por medio de
radios que dan la sensacin de un pastel tajado en porciones. Se usa para
Representar variables cualitativas en porcentajes o cifras absolutas cuando el
nmero de tems no es superior a 5 y se quiere resaltar uno de ellos.

Para su construccin se procede de la siguiente forma: la circunferencia tiene
en su interior 360 grados, los cuales corresponden al total de la informacin, es decir
al 100%. Luego para determinar el nmero de grados correspondiente a cada
componente se multiplica el porcentaje respectivo por 360 y se divide por 100, los
cuales se miden con la ayuda de un transportador para formar los casquetes de los
diferentes tems.



Los pictogramas: a travs de una figura o de un smbolo permiten desarrollar
la representacin de algo. Ciertos alfabetos antiguos se crearon en torno a
pictogramas.

Cartograma: es un mapa o diagrama que muestra datos de cantidad asociados a
respectivas reas, mediante la modificacin de los tamaos de las unidades de
enumeracin. La informacin es aportada mediante la distorsin de las superficies
reales, utilizando cada superficie de enumeracin como un smbolo proporcional,
el cual aumenta o disminuye en funcin de los valores correspondientes.
22

4. Medidas de posicin.
Son indicadores usados para sealar que porcentaje de datos dentro de una
distribucin de frecuencias superan estas expresiones, cuyo valor representa el valor
del dato que se encuentra en el centro de la distribucin de frecuencia, por lo que
tambin se les llama "medidas de tendencia central.

4.1. Medidas de tendencia central para datos simples.
Media aritmtica: frecuentemente llamada promedio, consiste en la suma de los
valores del grupo de datos dividida entre la cantidad de valores. La media
aritmtica de una poblacin se representa con el smbolo (mu), y la media
aritmtica de una muestra se representa con el smbolo X (equis barra).

X: La sumatoria de todos los datos.
N: Poblacin.
n: Muestra

MEDIDAS DE
POSICIN
Central
Promedios
Matemticos
Media
Aritmtica
X
Media
Geomtrica
MG
Media
Ponderada
X w
Promedios No
Matemticos
Mediana
(Med)
Moda (Mo)
No Central
Cuartiles
(Qx)
Deciles
(Dx)
Percentiles
(Px)
23

Media ponderada: tambin llamada promedio ponderado, es una media
aritmtica en al que cada uno de los valores se le pondera de acuerdo a su
importancia con el grupo general. Las frmulas de media ponderada poblacional y
muestral son idnticas:

X w: Media ponderada.
X: Observacin individual.
W: Peso o ponderacin asignada a cada
observacin.

Media geomtrica: es til para encontrar el promedio de porcentajes,
proporciones, ndices o tasas de crecimiento. Tiene mucha aplicacin en el
comercio y en la economa debido a que nos interesa encontrar el porcentaje de
cambio en ventas, salarios o cualquier otro dato econmico. La media de un
conjunto n de nmeros positivos se define como la n-sima raz del producto de
los n valores. La formula de la media geomtrica se escribe as:


Mediana: tambin llamada media posicional, queda en la mitad un grupo de
elementos ordenados de forma ascendente o descendente. En este caso la mitad de
los nmeros estar por debajo de la mediana y la otra mitad por encima de ella. La
mediana se obtiene con la siguiente ecuacin:


Moda: es la medida de tendencia central ms fcil de recordar. Es el dato que
ms se repite dentro de nuestro conjunto de elementos.

24

4.2. Medidas de tendencia central para datos agrupados.
Media aritmtica para valores agrupados: para aproximar la media aritmtica
de datos organizados en una distribucin de frecuencias, se asume que las
observaciones de cada clase estn representadas por el punto medio de la clase.
La media de una distribucin de frecuencias se calcula as:

X = media aritmtica.
X= valor o punto medio de cada clase.
f= frecuencia de cada clase.
fX= frecuencia en cada clase por el punto medio de la clase.
fX = suma de estos productos.
n= nmero total de frecuencias.

La mediana para valores agrupados: es el valor por debajo del cual se
encuentran una mitad de los valores y por encima del cual se encuentra la otra
mitad. Como los datos estn organizados en una distribucin de frecuencias, se ha
perdido algo de informacin. Sin embargo, se puede estimar de la siguiente
manera:




L= Lmite inferior de la clase que contiene la mediana.
n= Nmero de frecuencias.
f= frecuencia en la clase mediana.
CF= nmero de las frecuencias acumuladas en las clases que preceden a la clase
que contiene la mediana.
i= amplitud de la clase en la que se encuentra la mediana.

25

Moda para datos agrupados: siendo la moda el valor con ms frecuencia, slo
se ubica dentro de la distribucin de frecuencias los intervalos con mayor
cantidad de frecuencia.

Media geomtrica para datos agrupados: se determina con la siguiente
ecuacin:

X= punto medio de los intervalos.
f = frecuencia.

4.3. Medidas de posicin no central.
Los cuartiles, deciles y percentiles se asemejan a la mediana por que dividen
la distribucin en partes iguales, la mediana lo hace en dos los que estn por encima y
por debajo de ella, mientras que los cuartiles dividen los valores en cuatro partes
iguales, los deciles en diez y los percentiles en cien.










Cuartiles: dividen al conjunto de datos ordenados en cuatro partes
porcentualmente iguales, Los cuartiles son denotados como Q
1
, Q
2
, Q
3
. El
segundo cuartil es precisamente la mediana. El primer cuartil, es el valor en el
cual o por debajo del cual queda un cuarto (25%) de todos los valores de la
26

sucesin (ordenada); el tercer cuartil, es el valor en el cual o por debajo del cual
quedan las tres cuartas partes (75%) de los datos.

Deciles: los deciles dividen la continuidad de los datos ordenados en diez partes
porcentualmente iguales. Los deciles se denotan D
1
, D
2
,..., D
9
, que se leen primer
decil, segundo decil, etc.

Centiles o percentiles: son una de las medidas ms utilizadas para propsitos de
ubicacin o clasificacin de las personas cuando atienden caractersticas tales
como peso, estatura, etc. Los percentiles dividen los datos ordenados en cien
partes porcentualmente iguales. Estos son los 99 valores que dividen en cien
partes iguales el conjunto de datos ordenados. Los percentiles (P
1
, P
2
,... P
99
),
ledos primer percentil,..., percentil 99.

5. Medidas de asimetra.
Son indicadores que permiten establecer el grado de simetra (o asimetra) que
presenta una distribucin probabilidad de una variable aleatoria sin tener que hacer su
representacin grfica.

Como eje de simetra se usa una recta paralela al eje de ordenadas que pasa
por la media de la distribucin. Si una distribucin es simtrica, existe el mismo
nmero de valores a la derecha que a la izquierda de la media, por tanto, el mismo
nmero de desviaciones con signo positivo que con signo negativo. Se dice que hay
asimetra positiva (o a la derecha) si la "cola" a la derecha de la media es ms larga
que la de la izquierda, es decir, si hay valores ms separados de la media a la derecha.
Se dice que hay asimetra negativa (o a la izquierda) si la "cola" a la izquierda de la
media es ms larga que la de la derecha, es decir, si hay valores ms separados de la
media a la izquierda.


27

5.1. Coeficiente de Bowley y su utilidad.
Se define como un mtodo para la definicin de asimetra en una serie de
datos. Es muy utilizado para poder analizar las distribuciones de datos.
Particularmente, para este coeficiente las medidas de uniformidad central o
tendencia central utilizadas corresponden a la mediana, mientras que al hablar de
uniformidad no central se buscan las medidas de posicin no centrales tipo cuartiles.
De este modo el coeficiente de asimetra de Bowley parte de la diferencia que existe
entre los datos centrales y los datos no centrales. Numricamente el coeficiente
corresponde a la siguiente relacin:
(AB= (Q
3
+Q
1
- 2Me)/Q
3
-Q
1
).
Cuando el coeficiente es mayor que cero (AB>0) se encuentra una asimetra
positiva en la distribucin de datos.
La asimetra resulta til en muchos campos. Muchos modelos simplistas
asumen una distribucin normal, esto es, simtrico en torno a la media. La
distribucin normal tiene una asimetra cero. Pero en realidad, los valores no son
nunca perfectamente simtricos y la asimetra de la distribucin proporciona una idea
sobre si las desviaciones de la media son positivas o negativas. Una asimetra positiva
implica que hay ms valores distintos a la derecha de la media.
5.2. Coeficiente de Pearson y su utilidad.
Se define como un ndice que puede utilizarse para medir el grado de relacin
de dos variables siempre y cuando ambas sean cuantitativas. La correlacin
de Pearson es independiente de la escala de medida de las variables.

La correlacin entre dos variables X e Y es perfecta positiva cuando
exactamente en la medida que aumenta una de ellas aumenta la otra. Esto sucede
cuando la relacin entre ambas variables es funcionalmente exacta. Difcilmente
ocurrir en psicologa, pero es frecuente en las ciencias fsicas donde los fenmenos
28

se ajustan a leyes conocidas, Por ejemplo, la relacin entre espacio y tiempo para un
mvil que se desplaza a velocidad constante.
Se dice que la relacin es perfecta negativa cuando exactamente en la medida
que aumenta una variable disminuye la otra. Igual que en el caso anterior esto sucede
para relaciones funcionales exactas, propio de las ciencias fsicas. Por ejemplo, la
relacin entre presin y volumen se ajusta a este caso.






Valor del
Coeficiente de Pearson
Grado de Correlacin
entre las Variables
r = 0 Ninguna correlacin
r = 1 Correlacin positiva perfecta
0 < r < 1 Correlacin positiva
r = -1 Correlacin negativa perfecta
-1 < r < 0 Correlacin negativa
29

CONCLUSIN
La estadstica es una rama de la matemtica que se encarga de la recopilacin
y la interpretacin de los datos obtenidos en un estudio con el fin de llegar a una
conclusin general sobre el tema. Esta recoleccin de datos es llevada a cabo
mediante una serie de procedimientos, los cuales intentan dar informacin con la
mayor certeza posible, bien sea para conocer una situacin o intentar solventarla,
como el diseo de experimentos y la toma de decisiones.
La estadstica aplicada puede ser dividida en: estadstica descriptiva, que se
encarga de los mtodos de recoleccin, descripcin, visualizacin y resumen de datos
originados a partir de los fenmenos en estudio; y estadstica inferencial, que se
dedica a la generacin de los modelos, inferencias y predicciones asociadas a los
fenmenos en cuestin).
En primer lugar, la estadstica acumula datos provenientes de la observacin
de los fenmenos, para luego procesarlos de forma razonable. Se vale de un grupo de
herramientas como los llamados niveles de medicin (nominal, ordinal, de intervalo y
de razn), los estudios observacionales y tambin las tcnicas de anlisis estadstico.
En este ltimo grupo habra que incluir algunas conocidas e importantes como la
frecuencia estadstica, el anlisis de varianza, la grfica estadstica, entre otros.
Las graficas estadsticas se adaptan segn el estudio a realizar; no siempre se
puede utilizar la misma para todos los casos. Resulta muy til la distribucin en
clases o categoras de los datos, a su vez, el nmero de individuos pertenecientes a
cada una, que es la frecuencia de clase.
La estadstica est presente en casi todas las actividades y profesiones; abarca
la recoleccin, presentacin y caracterizacin de informacin para ayudar tanto en el
anlisis e interpretacin de datos como en el proceso de la toma de decisiones.
30

BIBLIOGRAFA

Guarn, N. (2002). Estadstica Aplicada. Universidad Nacional de Colombia.
[Documento en lnea]. Extrado desde:
http://www.slideshare.net/natycanovas/estadistica-aplicada-norbertoguarinsalazar

Mrquez, L. (s.f.). Unidades Curriculares Especializadas: Estadstica I. Ministerio
de Educacin Superior. Venezuela. [Documento en lnea]. Extrado desde:
http://cesarguerra10.files.wordpress.com/2011/04/material-estadc3adstica-i.pdf

Prez, E. (2010). Introduccin a la Estadstica. Universidad de Oriente. Ncleo
Bolvar. [Documento en lnea]. Extrado desde:
http://udo-eapa.blogspot.com/p/descargas.html

Das könnte Ihnen auch gefallen