Beruflich Dokumente
Kultur Dokumente
1. Definir la unidad de observacin (elemento sobre el que vamos a registrar los datos). Las
unidades de observacin pueden tener existencia natural, como una persona o una cosa
elementos tangibles -, o pueden estar definidas artificialmente, como las distintas reas de
una empresa.
2. Determinar qu vamos a medir (lo que vamos a observar).
3. Definir si el relevamiento de datos se hace sobre la totalidad (poblacin) o sobre
una muestra. Si el anlisis se realiza en base a una muestra, el objetivo es obtener
conclusiones acerca de la poblacin. Por lo tanto, la muestra debe ser representativa de la
poblacin de la cual fue extraida.
ORDENAMIENTO DE DATOS.
Los datos son colecciones de cualquier cantidad de observaciones relacionadas. Una coleccin de
datos se conoce como conjunto de datos, y una sola observacin es un punto de dato.
Para que los datos sean tiles, necesitamos organizar nuestras observaciones, de modo que
podamos distinguir patrones y llegar a conclusiones lgicas.
Recoleccin de datos:
Los especialistas en estadstica seleccionan sus observaciones de manera que todos los grupos
relevantes estn representados en los datos.
Los datos pueden provenir de observaciones reales o de registros que se mantienen para otros
propsitos.
Los datos pueden ayudar a los responsables de tomar decisiones a hacer suposiciones bien
pensadas acerca de las causas y, por tanto, de los efectos probables de ciertas caractersticas en
situaciones dadas. Tambin el conocimiento de tendencias adquirido de la experiencia previa
puede permitir estar al tanto de posibles resultados y actuar en consecuencia.
Cuando los datos son ordenados de manera compacta y til, los responsables de tomar decisiones
pueden obtener informacin confiable sobre el ambiente y usarla para tomar decisiones
inteligentes. Los administradores deben tener mucho cuidado y asegurar que los datos utilizados
estn basados en suposiciones e interpretaciones correctas. Para ello, se utilizan las pruebas
para datos:
1. De dnde vienen los datos? La fuente es parcial? Es posible que haya un inters en
proporcionar datos que conduzcan a una cierta conclusin ms que a otras?
2. Los datos comprueban o contradicen otras evidencias que se poseen?
3. Hace falta alguna evidencia cuya ausencia podra ocasionar que se llegue a una
conclusin diferente?
4. Cuntas observaciones se tienen? Representan a todos los grupos que se desea
estudiar?
5. La conclusin es lgica? Se ha llegado a conclusiones que nuestros datos no
confirman?
Vale la pena usar los datos o debemos esperar y recabar ms informacin antes de actuar?
Diferencia entre muestras y poblaciones:
Muestra y poblacin son trminos relativos. Una poblacin es un todo y una muestra es una
fraccin o segmento de ese todo.
Una poblacin es un conjunto de todos los elementos que estamos estudiando, acerca de los
cuales intentamos sacar conclusiones. Debemos definir dicha poblacin de modo que quede claro
cundo un cierto elemento pertenece o no a la poblacin.
Una muestra es una coleccin de algunos elementos de la poblacin, pero no de todos. Cualquier
grupo que cumple con los requisitos de la poblacin, puede constituir una muestra, siempre y
cuando el grupo sea una fraccin de la poblacin completa.
Una muestra representativa contiene las caractersticas relevantes de la poblacin en las mismas
proporciones en que estn incluidas en tal poblacin.
Existen muchas formas de organizar los datos. Podemos slo colectarlos y mantenerlos en orden;
o si las observaciones estn hechas con nmeros, entonces podemos hacer una lista de los puntos
de dato de menor a mayor segn su valor numrico. Pero si los datos son trabajadores
especializados o los distintos tipos de automviles que ensamblan todos los fabricantes, debemos
organizarlos de manera distinta. Necesitaremos presentar los puntos de dato en orden alfabtico o
mediante algn principio de organizacin. Una forma comn de organizar los datos consiste en
dividirlos en categoras o clases parecidas y luego contar el nmero de observaciones que quedan
dentro de cada categora. Este mtodo produce una distribucin de frecuencias.
El objetivo de organizar los datos es permitirnos ver rpidamente algunas de las caractersticas de
los datos que hemos recogido: el alcance (los valores mayor y menor), patrones evidentes,
alrededor de qu valores tienden a agruparse los datos, qu valores aparecen con mayor
frecuencia, etc.
RECOMENDACIONES:
Si se trabaja con muestras, definir las condiciones que deben reunir antes de extraerlas.
La informacin obtenida, antes de ser organizada y analizada, se conoce como datos sin
procesar puesto que an no han sido tratados mediante ningn mtodo estadstico.
La cantidad de datos ms grande y los detalles ms minuciosos pueden no contener la informacin
ms til para la toma de decisiones administrativa. Una parte importante de la planeacin de
sistemas de informacin administrativa consiste en resumir y presentar los datos de modo que se
pueda obtener la informacin crtica de manera rpida y sencilla.
La ordenacin de datos es una de las formas ms sencillas de presentarlos, los forma en orden
ascendente o descendente.
Ventajas:
En ocasiones, un ordenamiento de datos no resulta til. Debido a que da una lista de todos los
valores, es una forma incmoda de mostrar grandes cantidades de datos.
La distribucin de frecuencias.
Una forma en que podemos comprimir los datos es la tabla de frecuencias o distribucin de
frecuencias. Las distribuciones de frecuencias sacrifican algunos detalles, pero ofrecen nuevas
perspectivas sobre los patrones de datos.
Una distribucin de frecuencias es una tabla en la que los datos se organizan en clases, es decir,
en grupos de valores que describen una caractersticas de los datos.
Una distribucin de frecuencias muestra el nmero de observaciones del conjunto de datos que
caen en cada una de las clases.
Tambin podemos expresar la frecuencia de cada valor como una fraccin o un porcentaje del
nmero total de observaciones. Para obtener este valor, dividimos la frecuencia de esa clase entre
el nmero total de observaciones del conjunto de datos. La respuesta se puede expresar como una
fraccin, un nmero decimal o un porcentaje.
La suma de todas las frecuencias relativas es igual a 1,00 o a 100%. Esto es as debido a que una
distribucin de frecuencias relativas aparea a cada clase con su fraccin o porcentaje apropiados
del total de datos. Por consiguiente, las clases que aparecen en cualquier distribucin de
frecuencias, ya sean relativas o simples, son completamente inclusivas. Todos los datos caen en
una u otra categora. Las clases son mutuamente exclusivas, es decir, ningn punto de dato cae en
ms de una categora.
La categora "otros" se conoce como clase de extremo abierto cuando permite que el extremo
inferior o el superior de una clasificacin cuantitativa no est limitado.
Los esquemas de clasificacin pueden ser tanto cuantitativos como cualitativos y tanto discretos
como continuos. Las clases discretas son entidades separadas que no pasan de una clase discreta
a otra sin que haya un rompimiento. Los datos discretos son aquellos que pueden tomar slo un
nmero limitado de valores.
Los datos continuos pasan de una clase a otra sin que haya un rompimiento. Implican mediciones
numricas. Los datos continuos pueden expresarse con nmeros fraccionarios o con enteros.
Las variables discretas son cosas que se pueden contar y las continuas son cosas que aparecen
en algn punto de una escala.
Pasos:
1. Decidir el tipo y nmero de clases para dividir los datos. De acuerdo con la medida
cuantitativa o un atributo cualitativo. Necesitamos decidir cuntas clases distintas usar y el
alcance que cada clase debe cubrir. el alcance total debe dividirse entre clases iguales,
esto es, el ancho del intervalo, tomado desde el principio de una clase hasta el principio de
la clase siguiente, necesita ser el mismo para todas las clases.
El nmero de clases depende del nmero de puntos de dato y del alcance de los datos
recolectados. Cuantos ms puntos de dato se tengan o cuanto ms grande sea el alcance,
ms clases se necesitarn para dividir los datos. Como regla general, los estadsticos rara
vez utilizan menos de 6 y ms de 15 clases.
Debido a que necesitamos hacer los intervalos de clase de igual tamao, el nmero de
clases determina el ancho de cada clase.
Ancho de los intervalos de clase = (valor unitario siguiente despus del valor ms grande
Debemos utilizar el siguiente valor ms alto de las mismas unidades, ya que estamos
midiendo el intervalo entre el primer valor de una clase y el primer valor de la siguiente.
2. Clasificar los puntos de dato en clases y contar el nmero de datos que hay en cada
clase.
Las grficas dan los datos en un diagrama de dos dimensiones. Sobre el eje horizontal podemos
mostrar los valores de la variable (la caracterstica que estamos midiendo). Sobre el eje vertical
sealamos las frecuencias de las clases mostradas en el eje horizontal.
Histogramas.
Un histograma consiste en una serie de rectngulos, cuyo ancho es proporcional al alcance de los
datos que se encuentran dentro de una clase, y cuya altura es proporcional al nmero de
elementos que caen dentro de cada clase. Si las clases que utilizamos en la distribucin de
frecuencias son del mismo ancho, entonces las barras verticales del histograma tambin tienen el
mismo ancho. La altura de la barra correspondiente a cada clase representa el nmero de
observaciones de la clase. Como consecuencia, el rea contenida en cada rectngulo (ancho por
altura) ocupa un porcentaje del rea total de todos los rectngulos igual al porcentaje de la
frecuencia de la clase correspondiente con respecto a todas las observaciones hechas.
Un histograma que utiliza las frecuencias relativas de los puntos de dato de cada una de las
clases, en lugar de usar el nmero real de puntos, se conoce comohistograma de frecuencias
relativas. Este tipo de histograma tiene la misma forma que un histograma de frecuencias
absolutas construido a partir del mismo conjunto de datos. Esto es as debido a que en ambos, el
tamao relativo de cada rectngulo es la frecuencia de esa clase comparada con el nmero total
de observaciones.
Polgonos de frecuencias.
Son otra forma de representar grficamente distribuciones tanto de frecuencias simples como
relativas. Para construir un polgono de frecuencias sealamos stas en el eje vertical y los valores
de la variable que estamos midiendo en el eje horizontal. A continuacin, graficamos cada
frecuencia de clase trazando un punto sobre su punto medio y conectamos los resultantes puntos
sucesivos con una lnea recta para formar un polgono.
Se aaden dos clases, una en cada extremo de la escala de valores observados. Estas dos
nuevas clases que contienen cero observaciones permiten que el polgono alcance el eje horizontal
en ambos extremos de la distribucin.
Un polgono de frecuencias es slo una lnea que conecta los puntos medios de todas las barras
de un histograma. Por consiguiente, podemos reproducir el histograma mediante el trazado de
lneas verticales desde los lmites de clase y luego conectando tales lneas con rectas horizontales
a la altura de los puntos medios del polgono.
Un polgono de frecuencias que utiliza frecuencias relativas de puntos de dato en cada una de las
clases, en lugar del nmero real de puntos, se conoce comopolgono de frecuencias relativas. Este
polgono tiene la misma forma que el polgono de frecuencias construido a partir del mismo
conjunto de datos, pero con una escala diferente en los valores del eje vertical.
Un polgono alisado mediante el aumento de clases y de puntos de dato se conoce como curva de
frecuencias.
Ojivas.
Una distribucin de frecuencias acumuladas nos permite ver cuntas observaciones estn por
encima de ciertos valores, en lugar de hacer un mero registro del nmero de elementos que hay
dentro de los intervalos.
Podemos construir una ojiva de una distribucin de frecuencias relativas de la misma manera en
que trazamos la ojiva de una distribucin de frecuencias absolutas. Slo habr un cambio: la
escala del eje vertical.
Las frecuencias acumuladas se grafican por medio de una ojiva en forma de escalera, debido a
que la frecuencia aumenta de a saltos.
RECOMENDACIONES:
Usar 5 clases como mnimo y 15 como mximo para agrupar los datos, en funcin del nmero de
datos disponibles.
Tener cuidado con la clasificacin automtica que hacen los paquetes estadsticos.
Al calcular frecuencias relativas como proporcin trabajar con cuatro dgitos despus de la
coma, para evitar errores de redondeo en la suma.
Unidad de observacin: persona o casa sobre la que se mide una o varias caractersticas
de inters.
Poblacin: conjunto formado por todas las unidades objeto de un estudio estadstico.
Coleccin de todos los elementos que se estn estudiando y sobre los cuales intentamos
llegar a conclusiones.
Arreglo de datos: organizacin de los datos sin procesar por observacin, tomados en
orden ascendente o descendente.
Clase de extremo abierto: clase que permite que el extremo superior o inferior de un
esquema de clasificacin cuantitativo no tenga lmite.
Datos continuos: datos que pueden pasar de una clase a la siguiente sin interrumpirse y
que pueden expresarse mediante nmeros enteros o fraccionarios. Datos numricos que
admiten infinitos valores entre dos valores cualesquiera; generalmente surgen de una
medicin.
Datos discretos: datos que no pasan de una clase a la siguiente sin que haya una
interrupcin; esto es, donde las clases representan categoras o cuentas distintas que
pueden representarse mediante nmeros enteros. Datos numricos que no admiten
valores intermedios entre dos valores sucesivos; generalmente surgen de un conteo.
Datos sin procesar: informacin antes de ser organizada o analizada por mtodos
estadsticos. Conjunto de datos que no han recibido ningn tratamiento estadstico.
Datos tratados: conjunto de datos que ha sido objeto de algn tipo de ordenamiento o
procesamiento.
Polgono de frecuencias: lnea que une los puntos medios de cada clase de un conjunto
de datos, trazada a la altura correspondiente a la frecuencia de datos. Representacin
grfica de la distribucin de frecuencias en forma suavizada de una variable continua.
BIBLIOGRAFA: RICHARD I. LEVIN - DAVID S. RUBIN, ESTADSTICA PARA ADMINISTRADORES, ED. PRENTICE HALL, SEXTA
ED., 1996
TABLAS Y
GRAFICAS
PARA
VARIABLES
CUANTITATIV
AS
INTRODUCCIN
Las variables cuantitativas son organizadas de una manera
ms precisa por su contenido numrico, los tipos de
continuas son:
Discretas
Contnuas
EJEMPLO
Suponga que decide llevar a cabo un estudio
comparativo del costo de una comida en un restaurante
de una gran ciudad con el de una comida similar en un
restaurante fuera de la ciudad. La siguiente tabla
muestra los datos de 50 restaurantes citadinos y 50
fuera de la ciudd. Los datos no estn ordenados, esta
organizacin hace difcil obtener conclusiones sobre el
precio de las comidas en las dos reas geogrficas.
Las variables se clasifican en dos grupos de acuerdo al nivel de medicin utilizado para su
observacin:
Variables cualitativas: son las variables medidas en escala nominal u ordinal, ya que la caracterstica
que miden de la unidad de anlisis es una cualidad.
Variables cuantitativas: son las variables medidas en escala intervalar, puesto que lo que miden es una
cantidad.
Encuesta
Es un mtodo de recoleccin mediante el cual la informacin se obtiene relevando slo un
subconjunto o muestra de elementos del universo en estudio, que permite obtener
informacin sobre el mismo.
Para que la informacin obtenida con la encuesta sea generalizable a la poblacin, la muestra
utilizada debe ser representativa de la poblacin de la que proviene. Para lograrlo, se utilizan
mtodos de seleccin de unidades especialmente diseados con este fin.
Su uso ha ido en rpido aumento, en la medida en que las instituciones productoras de
informacin disponen de personal capacitado para efectuar su organizacin, diseo y anlisis,
debido a su menor costo y a que en determinadas circunstancias la informacin resulta ms
exacta debido a que los errores ajenos al muestreo (errores en la recoleccin y en el
procesamiento) pueden ser reducidos a travs de una mejor capacitacin de los
empadronadores y la utilizacin de mtodos de captacin de informacin ms objetivos.
Agrupamiento de datos
Existen mtodos para resumir los datos medidos u observados.
Cuando se trata de variables cualitativas donde las categoras estn determinadas, lo nico
que hay que hacer es contabilizar el nmero de casos pertenecientes a cada categora y
normalizar en relacin al nmero total de casos, calculando una proporcin, un porcentaje o
una razn.
En cambio, cuando se trata de variables cuantitativas, el resumen de los datos consiste en
organizar tablas que sintetizan los datos originales y se denominan distribuciones de
frecuencia.
Frecuencia: es el nmero de veces que se presenta cada valor de la variable.
Tabla de frecuencias: es una tabla que presenta en forma ordenada los distintos valores
de una variable y sus correspondientes frecuencias.
Por ejemplo: consideremos la variable nmero de aulas por escuela, medida en las escuelas
de una localidad.
Frecuencia
Nmero de
aulas por (2)
escuela
(1)
8 7
9 7
10 12
11 11
12 15
13 10
14 5
67
La estadstica es una Ciencia que tiene como finalidad facilitar la solucin de problemas en
los cuales necesitamos conocer algunas caractersticas sobre el comportamiento de
algn suceso o evento. Caractersticas que nos permiten conocer o mejorar el conocimiento
de ese suceso. Adems nos permiten inferir el comportamiento de sucesos iguales o
similares sin que estos ocurran.
Inferencia Estadstica: Tcnica mediante la cual se sacan conclusiones o generalizaciones
acerca de parmetros de una poblacin basndose en el estadgrafo o estadgrafos de una
muestra de poblacin.
TIPOS DE POBLACIN:
Clasificacin
sueldo del
directores
comparacin
Sueldo del
con los
director Ventas
dividendos a los
Compaa ejecutivo($miles) Ramo ($millones) accionistas
Telecomuni-
Sprint 3344 caciones 14045 4
10
EJERCICIO 4
La revista Fortune publica datos sobre la clasificacin de las 500 corporaciones industriales
estadounidenses ms grandes, en trminos de ventas y utilidades. En la tabla 1.7 vemos
datos acerca de una muestra de las 500 compaas (Fortune, 28 de abril de 1997).
Cuntos elementos hay en este conjunto de datos?
Cul es la poblacin?
Calcule las ventas anuales de la muestra.
Con el resultado del inciso c, Cul es la estimacin de las ventas promedio para la poblacin?
TABLA 1.7 MUESTRA DE 10 EMPRESAS FORTUNE 500
Respuestas:
10
Las 500 corporaciones estadounidenses ms grandes.
$14227.59millones
14227.59millones
EJERCICIO 6
En Columbia House se distribuyen discos compactos, casetes y discos por correo a los
miembros de su club. La empresa realizo una encuesta musical pidiendo a los nuevos
miembros llenaran una nueva forma con 11 preguntas. Algunas de ellas fueron:
Cuntos lbumes (discos compactos, cintas o discos) compro usted en los ltimos 12 meses?
Es actualmente miembro de un club nacional de pedidos por correo? (S o No).
Qu edad tiene usted?
Incluyndose usted Cuntas personas (adultos y nios) viven en su casa?
Qu tipo de msica le interesa comprar? (Se presenta una lista de 15 categoras, incluyendo rock
pesado, rock suave, contempornea, heavy metal, rap y country).
Diga si en cada pregunta se piden datos cualitativos o cuantitativos.
Respuestas:
Las preguntas a, c y d son cuantitativas.
Las preguntas b y e son cualitativas.
EJERCICIO 8
En una encuesta de Wall Street Journal/NBC news se pregunto a 2013 adultos: Qu tan
satisfecho esta usted con la economa estadounidense en la actualidad? (The Wall Street
Journal, 12 de diciembre de 1997). Las categoras de las respuestas eran Insatisfecho,
Satisfecho y No estoy seguro.
De quienes respondieron, el 28% dijo no estar satisfecho con el estado de la economa de Estados
Unidos. Cuntas personas dieron esa respuesta?
Respuestas:
2013
Cualitativo
Porcentajes
563 o 564
EJRCICIO 10
Diga si cada una de las variables que siguen es cualitativa o cuantitativa.
Edad.
Sexo.
Lugar en la clase.
Marca de automvil.
Cantidad de personas que estn a favor de la pena de muerte.
Respuestas:
Cuantitativa; relacin
Cualitativa; nominal
Cualitativa; ordinal
Cualitativa; nominal
Cuantitativa; relacin
EJERCICIO 16
El rea de mercadotecnia de su empresa ha propuesto una nueva bebida diettica que, dicen,
captura una gran parte del mercado de adultos jvenes.
Qu datos quiere analizar antes de decidirse a invertir cantidades importantes para introducir el
nuevo producto en el mercado?