Beruflich Dokumente
Kultur Dokumente
ENEI
CURSO: ESTADSTICA DESCRIPTIVA
Algn da el conocimiento estadstico ser tan necesario para ser un buen y eficiente
ciudadano, como lo es saber leer
H.G. Wells
INTRODUCCIN
Casi todos los das utilizamos los conceptos estadsticos en las diversas facetas de nuestra vida. Por
ejemplo, al comenzar el da uno abre la llave de la ducha para probar la temperatura del agua y
decidir si aade ms agua caliente o ms agua fra y, si la temperatura es idnea empieza a baarse.
Como segundo ejemplo, supongamos que se est en una tienda de comestible decidieron qu pizza
congelada se va a comprar. Una de las empresas productoras de pizzas cuenta con un mostrador
donde se ofrecen pequeas pruebas de su producto. Despus de probarlo, uno decide si lo compra o
no. En ambos ejemplos, se toma una decisin y se elige el curso de accin basndose en una
muestra.
Las empresas enfrentan problemas similares. Una compaa debe asegurarse de que la cantidad
promedio de cereal en el paquete de 25,5 gramos cumpla con las especificaciones de la etiqueta.
Para hacerlo, selecciona muestras peridicas del rea de produccin y pesa el contenido.
Dentro del mbito empresarial se ha vuelto una regla emplear la estadstica y pensar tomndola en
cuenta. Mientras ms grandes sean las unidades empresariales, estas cuentan no solo con sus
propios departamentos de recopilacin de datos estadsticos, sino tambin se convierten en
consumidores de estadsticas recopiladas por otras personas. Asimismo, para la elaboracin de
documentos de prensa comercial y de gobierno se expresan en lenguaje estadstico, ya que solo de
esta forma se logra conducir de manera ordenada e inteligente estos asuntos.
Puede observarse entonces que la estadstica actualmente constituye una parte integral de la vida
cotidiana; se encuentra inmersa en mbitos tan variados como la poltica, la medicina, la educacin,
ESTADSTICA
La oficina de Censos calcula que la poblacin de EUA ser de 335 050 000 en el ao
2025.
La extensin promedio de los ciclos empresariales desde 1945 es de 61.
El auto tpico de EEUU recorre 11 099 millas por ao. El autobs tpico viaja 9 353 millas
por ao, y el camin tpico, 13 942 millas por ao. En Canad las cifras correspondientes
son 10 371 millas para automviles, 19 823 millas para autobuses, y 7 001 millas para
camiones.
Los anteriores son ejemplos de estadsticas. A una coleccin de informacin numrica se le conoce
como estadsticas (en plural).
Una primera razn para estudiar estadstica, es que en todos lados encontramos informacin
numrica. Si se revisan peridicos, revistas, publicaciones de inters general, revistas femeninas o
revistas de deporte, se ver bombardeado con informacin numrica. Presentamos algunos
ejemplos:
La empresa General Electric report que en 1999 sus ganancias fueron de $111 630 000
(dlares), mayores que los $100 469 000 que obtuvo en 1998.
Los egresados de post grado del programa de Maestra en Administracin de Empresas en
la Universidad de Notre Dame, contaron con un sueldo inicial promedio de $54 000 dlares
y 91% de ellos consiguieron trabajo a los tres meses de la graduacin.
En EUA se consume mayor cantidad de caf que en cualquier otro pas; en promedio, 1,75
tazas diarias por persona.
Cmo podemos determinar si las conclusiones presentadas son razonables? Acaso las muestras
fueron suficientemente grandes? Cmo se seleccionaron las unidades de la muestra? Para poder ser
una persona capacitada a fin de entender esta informacin, se necesita saber realizar el anlisis de la
informacin. La comprensin de los conceptos de estadstica ser de gran ayuda.
Una segunda razn por la cual tomar un curso de estadstica es que las tcnicas estadsticas se
utilizan para tomar decisiones que afectan nuestra vida diaria. He aqu algunos ejemplos:
Las compaas de seguros utilizan anlisis estadstico para establecer las tarifas de los
seguros de casas, automvil, vida y salud. Existen tablas que indican la probabilidad de que,
por ejemplo, una persona de 25 aos viva un ao ms, cinco aos ms, etctera.
Los investigadores mdicos estudian las tasas de curacin de enfermedades, basndose en
el uso de diferentes medicamentos y distintas formas de tratamiento. Por ejemplo, cul es
el efecto de tratar cierto tipo de dao a la rodilla con ciruga o con terapia fsica?
La agencia de Proteccin al Medio Ambiente (en EUA) est interesada en la calidad del
agua en el Lago Erie. Peridicamente toman muestras del lquido para establecer el nivel de
contaminacin y mantener el nivel de calidad.
La tercera razn para tomar un curso de estadstica es que el conocimiento de los mtodos
estadsticos ayuda a entender por qu se toman ciertas decisiones, y aporta una mejor comprensin
respecto a la forma en la que nos afectan las decisiones.
Sin importar el tipo de trabajo que se elija, el estudiante tendr que enfrentarse con la toma de
decisiones, para lo cual una comprensin del anlisis de datos ser de gran ayuda. Para poder tomar
una decisin basada en la informacin, se necesita:
Estadstica Descriptiva
Generalmente, el estudio de la estadstica se divide en dos categoras: estadstica descriptiva
y estadstica inferencial. La definicin de estadstica presentada anteriormente menciona la
organizacin, presentacin, anlisis de datos. Esta rea de la ciencia estadstica se
conoce comnmente como estadstica descriptiva.
Estadstica Inferencial
Estadstica Inferencial: Conjunto de mtodos utilizados para saber algo acerca de una
poblacin, basndose en la informacin obtenida de una muestra.
Una poblacin, tambin denominada universo, puede constar de individuos, por ejemplo
los estudiantes matriculados en la Universidad del Pacfico. Una poblacin tambin puede
incluir objetos, como las llantas XB 70 producidas durante una semana en la compaa
Cooper Tire and Rubber, en Findlay Ohio, o todas las truchas que se encuentran en un
estanque. Una poblacin tambin puede estar formada por un grupo de medidas, como
podran ser los pesos de todos los jugadores de la lnea defensiva del equipo de futbol
Para la poblacin,
Estadstico: se caracterstica
Medida utilizan tambin el muestra.
de la parmetro. Este es una caracterstica numrica de
la poblacin. Si se realiza un censo completo de la poblacin, se puede medir el parmetro.
Sin embargo, como ya se menciono, es muy difcil en la mayora de las investigaciones en
la prctica, acceder a toda la poblacin para un estudio.
El objetivo de calcular el estadstico de la muestra es estimar el valor del parmetro
correspondiente a la poblacin. Entre los parmetros tpicos se encuentran la media,
mediana, proporcin y desviacin estndar de la poblacin.
La compaa Market Facts con base en Chicago pidi a una muestra de 1960
consumidores que probaron un platillo de pescado congelado producido por la
Gran parte de los trabajos de estadstica se realizan con muestras. Las muestras son necesarias
debido a que con frecuencia las poblaciones son demasiado grandes para ser estudiadas en su
totalidad. Es muy costoso y demanda mucho tiempo examinar la poblacin total, por tanto debe
seleccionarse una parte de la poblacin, calcular el estadstico de la muestra y utilizarlo para estimar
el parmetro correspondiente de la poblacin.
La exactitud de toda estimacin es de enorme importancia. Esta exactitud depende de gran parte de
la forma como se seleccion la muestra y del cuidado que se tenga para garantizar que la muestra
proporcione una imagen lo ms parecido posible de la poblacin. Sin embargo, con mucha
frecuencia se comprueba que la muestra no es del todo representativa y generar un error de
muestreo. Este error, es la diferencia entre el estadstico de la muestra utilizado para estimar el
parmetro en la poblacin y el valor real pero desconocido del parmetro.
Error
Prof. de David
Willer muestreo: Diferencia
Chanduv Puicnentre el parmetro
Pgina 7 desconocido y el
estadstico obtenido en la muestra.
CONCEPTOS BSICOS DE ESTADSTICA
ENEI
CURSO: ESTADSTICA DESCRIPTIVA
TIPOS DE VARIABLES
Existen dos tipos bsicos de datos: los obtenidos a partir de una poblacin cualitativa y los que
resultan de una poblacin cuantitativa. Cuando la caracterstica o variable en estudio es no
numrica, se le denomina variable cualitativa o atributo. Cuando la variable estudiada se puede
expresar numricamente se denomina variable cuantitativa.
A su vez las variables cuantitativas pueden ser discretas o continuas. Las variables discretas pueden
asumir slo ciertos valores y generalmente existen brechas o huecos entre ellos. Por lo comn,
las variables discretas son resultado de un conteo.
Las observaciones de una variable continua pueden tomar cualquier valor dentro de un intervalo
determinado. Las variables continuas resultan generalmente de medir algo.
NIVELES DE MEDICIN
Los datos pueden clasificarse de acuerdo con los niveles de medicin. Generalmente, el nivel de
medicin de un dato determina los clculos que se pueden realizar para resumir y presentar la
informacin y las pruebas estadsticas que pueden desarrollarse.
Existen cuatro niveles de medicin: nominal, ordinal, de intervalo y de razn. El nivel ms bajo o
ms primitivo, es el nominal. El ms alto, o el que proporciona la mayor cantidad de informacin
acerca de la observacin, es el nivel de medicin de razn.
Esta escala establece los grupos de acuerdo con la presencia o ausencia de un atributo o
caracterstica, se utiliza para medir variables cualitativas cuyos valores no pueden ser
ordenados de acuerdo a la intensidad, es decir, de menor a mayor. La escala nominal slo
permite hacer muy pocas operaciones estadsticas, tales como contar frecuencias. La nica
relacin que puede establecerse entre observaciones medidas en esta escala es la de
igualdad (y por lo tanto la desigualdad). Dos observaciones son iguales si estn en la misma
clase.
Ejemplo:
Un ejemplo del nivel nominal de medicin es la clasificacin en seis colores de las lunas
M&M. Simplemente se clasifican las lunas segn el color. No hay un orden natural. Esto
quiere decir que primero se puede reportar la cantidad de lunas color caf, o las
anaranjadas o las de cualquier otro color.
La tabla 1 muestra un desglose del uso de telefona de larga distancia en Estados Unidos.
Este es el nivel nominal de medicin porque se cuenta el nmero de veces que se utiliz
cada compaa que proporciona servicio de larga distancia.
Tabla 1: Uso de la telefona de larga distancia segn el proveedor del servicio. EUA
Para poder procesar los datos generalmente se codifican las categoras en 1, 2, 3, etc.; en
este caso el 1 representa AT&T; el 2 MCI, y as sucesivamente. Esto facilita el conteo por
computadora. Sin embargo el haber asignado nmeros a las diferentes empresas no
permite manipular nmeros. Por ejemplo, 1+2no es igual a 3; esto es, AT&T + MCI no
es igual a Sprint.
El siguiente nivel de datos es el nivel ordinal. Se utiliza cuando se requiere colocar datos en
orden (1ero, 2do, 3ro, etc) en relacin a cierto atributo. Las observaciones no solo difieren
de categora a categora, si no que pueden clasificarse por rangos de acuerdo con algn
criterio. Las observaciones medidas en esta escala pueden ordenarse de menor a mayor y en
consecuencia no solo admite la relacin de igualdad sino adems la de "mayor que"
("menor que").
En resumen, los datos de nivel ordinal tienen las siguientes propiedades:
Ejemplo:
La tabla 2 presenta las calificaciones dadas por los estudiantes al profesor James
Brunner en un curso de Introduccin a las Finanzas. Cada estudiante responde a la
siguiente pregunta: En general, cmo califica al profesor de este curso? Esto muestra
el uso de la escala de medicin ordinal. Una categora es ms alta o mejor que la
siguiente. Ello quiere decir que Excelente es mejor que Bueno, Bueno es mejor
que Regular, etc. Sin embargo no es posible distinguir algo referente a la magnitud de
1. Las categoras para los datos son mutuamente excluyentes y colectivamente exhaustivas.
2. Las categoras en cuestin estn ordenadas de acuerdo con la cantidad de la
caracterstica que poseen.
3. Diferencias iguales en la caracterstica se presentan por diferencias iguales en la
medicin.
Ejemplo:
Supngase que las temperaturas ms altas en tres das consecutivos de invierno en la
ciudad de Boston son 28, 31 y 20 grados Fahrenheit (F). Estas temperaturas pueden
ordenarse fcilmente pero tambin se puede determinar la diferencia entre las mismas.
Esto es posible gracias a que un grado Fahrenheit representa una unidad constante
de medicin. Las diferencias iguales entre dos temperaturas son las mismas, sin importar
la posicin en que se encuentre en la escala. Esto quiere decir que la diferencia entre
10F y 15F es 5, y la diferencia entre 50 y 55 grados tambin es 5. Es importante
Es la escala ms fuerte, dado que usa un sistema numrico en el que el cero es un valor que
indica ausencia de la caracterstica que se est midiendo. Permite clasificar y ordenar. Los
intervalos son iguales. Se pueden realizar operaciones aritmticas como la multiplicacin y
divisin. La diferencia entre dos valores es importante y de magnitud definida. Permite el
clculo de la media geomtrica, el clculo del coeficiente de variacin y las pruebas que
requieren del conocimiento del punto cero de la escala.
Las propiedades del nivel de razn son:
1. Las categoras de los datos son mutuamente excluyentes y colectivamente exhaustivas.
2. Dichas categoras tienen un intervalo u orden de acuerdo con la cantidad de la categora
que poseen.
3. Diferencias iguales en la caracterstica estn representadas por diferencias iguales en
los nmeros que se han asignado a las categoras mencionadas.
4. El punto o valor cero indica ausencia de la caracterstica.
Ejemplos:
Ejemplos de la escala de razn son los salarios, las unidades de produccin, el peso, los
cambios en los precios de las acciones, la distancia entre un conjunto de oficinas, etc. El
dinero es un buen ejemplo. Si se tiene cero dlares entonces no se poseen fondos. Si una
persona gana $30 000 dlares al ao vendiendo seguros, y otra gana $60 000 al ao
vendiendo automviles, la segunda persona gana el doble de lo que percibe la primera.
La razn o cociente vale 2.
Desde luego hay variables que pueden medirse en ms de un nivel, segn el propsito de
medicin. Por ejemplo la variable antigedad en la empresa , es una variable medida en
escala de razn (de 0 a k das); pero tambin podra ser medida en escala ordinal, con
categoras: Mucha antiguedad / Regular antigedad / Poca antigedad.
Unidad de Observacin: Es la unidad que est sujeta a medicin, conocida tambin como unidad
elemental.
Estadstico o estadgrafo: Son tambin medidas de resumen que describen una caracterstica de la
muestra y para calcular su valor se requiere de los elementos de la muestra nicamente.