Sie sind auf Seite 1von 16

CENTRO DE ESTUDIOS VERACRUZ

Estadstica Descriptiva
Administracin de Empresas
Flix Flores Olivares

Estadstica Descriptiva

ESTADSTICA DESCRIPTIVA
La estadstica descriptiva es la rama de las Matemticas que recolecta, presenta y caracteriza un conjunto de datos (por ejemplo, edad de una poblacin, altura de los estudiantes de una escuela, temperatura en los meses de verano, etc.) con el fin de describir apropiadamente las diversas caractersticas de ese conjunto.

POBLACIN
Es el conjunto de personas u objetos que poseen ciertas caractersticas comunes, las cueles deben ser claramente definidas de tal manera que sea posible identificar con precisin si un elemento pertenece o no a la poblacin; para ello, la delimitacin en tiempo y espacio ayudara a precisar la poblacin. A cada integrante que conforma una poblacin se le denomina elemento. Los elementos no solo son tangibles o materiales; por ejemplo un conjunto de dialecto, Zapoteco es el elemento. La poblacin es finita cuando incluye un nmero limitado de elementos. Siempre que sea posible contar el nmero total de elementos se considera finita la poblacin. Ejemplo: Poblacin de una ciudad, nios en una escuela, poblacin de aves. La poblacin infinita incluye un gran nmero de elementos que no pueden contarse en su totalidad. Ejemplo: La cantidad de estrellas del Universo, cantidad de granos de arena del mar

MUESTRA
Es la parte o subconjunto de elementos de una poblacin.

PARMETRO Y ESTADSTICO
Todo valor numrico que describa a una poblacin recibe el nombre de parmetro; si se refiere a una muestra recibe el nombre de estadstico. Ejemplo: El coeficiente intelectual promedio de todos los estudiantes de quinto de bachillerato en Veracruz es un parmetro; pero si dicho promedio se obtiene de una muestra es estadstico.

VARIABLE
Es una caracterstica que puede tener distintos valores, a medida que se observa en los diferentes elementos de una poblacin. CEV Flix Flores Olivares Pgina 2

Estadstica Descriptiva
DATO
Es el valor de la variable asociado a un elemento de una poblacin o una muestra.

EXPERIMENTO
Es la actividad realizada, segn un plan definido, cuyos resultados producen un conjunto de datos. Es el mtodo, as como la manera de cavar informacin.

VARIABLES CUANTITATIVAS Y CUALITATIVAS


CUALITATIVAS En una variable cualitativa sus valores o categoras nos permiten clasificar los elementos de la poblacin y contabilizar el nmero de veces que se presentan por categora. Pueden ser nominales u ordinales. Es un ejemplo de valores hombre y mujer no tiene por s mismo un criterio para establecer un orden entre ellos, su escala es nominal. En un variable grado mximo (lista opcional), la escala de medicin se llama ordinal. CUANTITATIVAS Variables cuantitativas continuas. Cuando entre dos valores se puede tomar cualquiera de los infinitos comprendidos entre ellos. Ejemplo la estatura 1.70cm 1.75cm 1.80cm Variables cuantitativas discretas. Aquella cuya medicin solo puede expresarse en nmeros enteros, porque entre dos valores consecutivos no puede haber ninguno intermedio. En una variable cuantitativa podemos encontrar dos tipos de escalas de medicin: de intervalo y de razn.

ENCUESTAS
Las encuestas se pueden realizar sobre el total de la poblacin o sobre una parte representativa de la misma que llamaremos muestra. Una encuesta realizada al total de la poblacin es el Censo referido al 31 de marzo de los anos terminados en 1 en el que se recoge informacin sobre todos los censados en cada uno de los municipios disponiendo de una base de datos el Instituto Nacional de Estadstica para estudios posteriores de la poblacin, a que estos datos se van actualizando y poniendo al da para saber en cada momento la situacin del pas. Exceptuado estos estudios a toda la poblacin, las encuestas se suelen realizar sobre una muestra representativa. Diversos motivos inducen a tomar muestras de las poblaciones, entre las que cabe destacar: CEV Flix Flores Olivares Pgina 3

Estadstica Descriptiva
Cuando la poblacin es muy grande. Por motivo econmicos. Por falta de personal adecuado. Por motivo de calidad de los resultados. Por mayor rapidez en recoger los datos y presentar los resultados.

No obstante tambin se presentan unas limitaciones a la toma de muestras representativas, que se pueden resumir en: Cuando se necesita informacin de todos los elementos de la poblacin. Cuando no se domina la tcnica de muestreo. Cuando la poblacin es muy pequeina.

Cuando se toma informacin de todos y cada uno de los elementos de la poblacin de inters, se est realizando un censo. Tomar informacin de un muestra, se denomina muestreo.

ORDENAMIENTO DE DATOS
Muchas veces uno se pregunta, para qu sirven las encuestas que a veces se hacen en la calle?, Cmo saber si una estacin de radio se escucha ms que otra? , Cul candidato puede ganar? La respuesta se comienza con la recaudacin de datos. Los datos son informacin que se recoge, esto puede ser opinin de las personas sobre un tema, edad o sexo de encuestados, dnde viven, cuntas personas viven en una casa, qu tipo de sangre tiene un grupo de personas, etc. Hay datos que pueden ser de mucha utilidad a diferentes profesionales en la toma de decisiones, para resolver problemas o para mostrar resultados de investigaciones. Una vez que se haya

CEV Flix Flores Olivares

Pgina 4

Estadstica Descriptiva
recogido toda la informacin, se procede a crear una base de datos, donde se registran todos los datos obtenidos.

REPRESENTACIN GRAFICA
TABLA DE FRECUENCIA Toda la informacin recopilada se llama dato. La informacin puede ser la opinin de una persona encuestada, gustos, edad, sexo, el lugar donde viven, etc. Una vez acopiado la informacin, se crea una base de datos donde estos se registran, se manipula la informacin y agrupa, llegando a lo que en estadstica llamamos tabla de frecuencia. Frecuencia Absoluta y Frecuencia Relativa Frecuencia absoluta es la cantidad de datos que integran cada una de las clases, o que son las repeticiones que encontramos dentro de una misma clase. Frecuencia relativa es la cantidad de repeticiones obtenidas para cada clase, en relacin con el total de las observaciones. Las frecuencias relativas son un porcentaje, ya que relacionan una parte del conjunto con el total. EJ. Se realizo una encuesta a 10 jvenes de 15 aos para saber que animal tienen en su casa y estos fueron los resultados: Animal que tienen en su casa Perro Gato Pez Ninguno Total Frecuencia (f) 4 2 1 3 10 Frecuencia Relativa 4/10 = 0.4 2/10 = 0.2 1/10 = 0.1 3/10 = 0.3 1

Frecuencia Acumulada y Relativa Acumulada Este concepto es aplicable solamente para datos cuantitativos. La frecuencia acumulada es aquella que acumula frecuencias hasta un determinado valor de la variable. Sumando la frecuencia de todos los valores inferiores de un lmite fijado obtenemos la frecuencia relativa acumulada hasta ese valor. Frecuencia de Variables Agrupada en Intervalo Si los valores que toma la variable son muy diversos y cada uno de ellos se repite muy pocas veces, entonces conviene agruparlos por intervalos.

CEV Flix Flores Olivares

Pgina 5

Estadstica Descriptiva
Debemos entender por recorrido o rango la diferencia entre el dato mayor y el dato menor en los valores observados de la variable en estudio: por ejemplo el dato menor de una muestra es 63 y el mayor es 128 el recorrido es: Recorrido = 128-63=65 Amplitud del intervalo = Rango/Nmeros de Intervalos Deseados

EJERCICIO
Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas mximas: 32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29. Construir la tabla de frecuencias Temperatura 27 28 29 30 31 32 33 34 Frecuencia Absoluta Frecuencia Relativa Frecuencia Acumulada Frecuencia Relativa Acumulada

6 0.258

31

31

Los pesos de los 65 empleados de una fbrica vienen dados por la siguiente tabla: [50 - 60] 8 [60 - 70] 10 [70 - 80] 16 [80 - 90] 14 [90 - 100] 10 [100 - 110] 5 [110 - 120] 2

Peso

Rango [51 - 60] [61 - 70] [71 - 80] [81 - 90] [91 - 100] [101 - 110] [111 - 120]

Frecuencia Absoluta 8 10 16 14 10 5 2 65

Frecuencia Relativa

Frecuencia Acumulada

Frecuencia Relativa Acumulada

0.22

65

0.99

CEV Flix Flores Olivares

Pgina 6

Estadstica Descriptiva
Los datos a continuacin representan los tiempos, en minutos, que les tom a un grupo de personas contestar una prueba estandarizada.

Obtener el Recorrido tomando en cuenta el dato menor como 15 y el mayor 35 Obtener la amplitud del intervalo de 5 Elaborar una tabla de frecuencias que contenga, frecuencia absoluta, frecuencia relativa, frecuencia acumulada y frecuencia relativa acumulada.

Los 40 alumnos de una clase han obtenido las siguientes puntuaciones, sobre 50, en un examen 3, 15, 24, 28, 33, 35, 38, 42, 23, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13. Obtener el Recorrido Obtener la amplitud del intervalo de 10 Elaborar una tabla de frecuencias que contenga, frecuencia absoluta, frecuencia relativa, frecuencia acumulada y frecuencia relativa acumulada.

HISTOGRAMA Un histograma es una representacin grfica de una variable en forma de barras.

CEV Flix Flores Olivares

Pgina 7

Estadstica Descriptiva

MEDIDAS DE TENDENCIA CENTRAL


Cuando queremos sintetizar un grupo de datos de una poblacin o muestra necesitamos sealas al menos como se concentran los valores y como se dispersan, para ello requerimos las medidas de tendencia central. Las medidas de tendencia central son llamadas as porque tienden a localizarse en el centro de la informacin (de ah que tambin se les conoce como medidas de posicin). Las principales medidas de tendencia central son: Media Mediana Moda

CALCULO DE MEDIDAS DE TENDENCIA CENTRAL PARA DATOS NO AGRUPADOS


MEDIA Es la Medida de Tendencia Central ms utilizada. La media de un conjunto de valores es igual a la suma de dichos valores dividido entre el numero de ellos. El smbolo que utilizaremos para representarla ser (equis barra). =

Se toma el registro sobre el numero de cigarros que fuma un seor en una semana y se obtienen los siguientes datos: 4, 3, 5, 6, 4, 3, 5. El primer dato corresponde al lunes, el segundo al martes y as sucesivamente. = 4+3+5+6+4+3+5 30 = = = 4.2 7 7

Tomando en contexto la situacin, significa que el seos fuma en promedio 4.2 cigarros al da. Calculo de la Media para Datos Organizados Un grupo de 50 bailarinas se presento a un casting para una comedia musical, registrando las siguientes edades.

CEV Flix Flores Olivares

Pgina 8

Estadstica Descriptiva
Aplicando la formula de la media tenemos:
= 21 + 19 + +22 + 19 + 18 + 20 + + 17 1008 = = = 20.1 50 50

Si observamos con atencin los datos nos daremos cuenta que el primer valor 21 se repite 12 veces y el 19 se repite 16, lo cual simplificaremos los clculos gracias a la relacin entre la suma y la multiplicacin organizando los datos de la siguiente forma:
= 1 17 + 3 18 + 16 19 + 10 20 + 12 21 + 5 22 + 1 23 + 2 24 1008 = = 20.1 50 50

As, la frmula para calcular la media sufre algunas modificaciones: = Los nmeros tambin son sensibles Como se ha dicho, la Media o Promedio es una de las medidas ms utilizadas, pero tiene una desventaja: es muy sensible a los valores extremos. Veamos el siguiente ejemplo: Supongamos que 19 trabajadores de una empresa perciben un sueldo quincenal de $2,000.00, mientras que el gerente general tiene un sueldo de $22,000.00. Si obtenemos la media de los sueldos quincenales de estos 20 trabajadores incluyendo al gerente general se obtiene lo siguiente:
= 19 2,000 + 1(22,000) 38,000 + 22,000 60,000 = = = 3,000 20 20 20

Interpretando, diramos que el salario quincenal promedio de estos trabajadores es de $3,000.00, lo cual no es representativo de la mayora de los salarios, esta cantidad es engaoso. Cuando la variable incluye valores muy dispares o extremos, la media pierde representatividad, en estos casos es ms conveniente utilizar la mediana. MEDIANA Es el valor que divide al grupo de datos en dos partes iguales, 50% por debajo de l y el otro 50% por arriba del mismo. Para encontrar la mediana, para la cual utilizaremos el smbolo Me, se procede de la siguiente manera: 1. Se ordenan los datos de menor a mayor 2. Identificamos el valor que se ubique justo en medio de los datos. Aqu se pueden presentar dos casos a) Cuando el nmero de n es impar, la mediana queda precisamente en medio de ellos. CEV Flix Flores Olivares Pgina 9

Estadstica Descriptiva
b) Cuando es par, la median es el promedio de los dos valores centrales. Hallemos la mediana de los siguientes valores, los cuales representan las calificaciones de 5 estudiantes en una prueba.
3.9 3.9 7.7 5.1 5.1 8.1 7.8 7.8 8.1

7.7

Veamos el siguiente ejemplo donde n es par.

6 6

8 7 =

10

9 9

9 10

8+9 17 = = 8.5 2 2

Existe una frmula para conocer la posicin de la mediana, la cual es muy til especialmente cuando el nmero de datos n es muy grande. La formula es la siguiente: = = + 1 , 2

Se ha entregado a un grupo de 15 adultos una lista de 100 palabras y se le ha pedido a cada uno de ellos que recuerde el mayor nmero de palabras posibles, obteniendo los siguientes valores: 7 6 3 8 9 5 4 6 5 7 8 11 10 7 4

Ordenemos los datos mediante el auxilio de la siguiente tabla: Posicin o lugar 1 2 3 4 5 6 7 8 9 10 11 12 CEV Flix Flores Olivares Palabras recordadas 3 4 4 5 5 6 6 7 7 7 8 8 Pgina 10

Estadstica Descriptiva
13 14 15 9 10 11

Aplicando la frmula para conocer la posicin de la mediana y recordando que n = 15 se tiene que: = 15 + 1 =8 2

Lo cual significa que la mediana ocupa el octavo lugar, por lo tanto, Me = 7 palabras. Cuando se presentan los datos ya organizados en una tabla de frecuencia simple, la formula anterior adquiere mayor relevancia en cuanto a su utilidad. La siguiente figura se presenta las calificaciones de un examen de Taller de Lectura y Redaccin de un grupo de alumnos de bachillerato, indicando las siguientes frecuencias. Calificacin (X) 3 4 5 6 7 8 9 10 Total Nmero de Alumnos (f) 2 3 3 5 17 9 5 3 n = 47

Para proceder a ubicar la posicin de la mediana, necesitamos agregar la columna de frecuencias acumuladas, quedando la tabla anterior as: Calificacin (X) 3 4 5 6 7 8 9 10 Total Nmero de Alumnos (f) 2 3 3 5 17 9 5 3 n = 47 47 + 1 = 24 2 Pgina 11 fa 2 5 8 13 30 39 44 47

CEV Flix Flores Olivares

Estadstica Descriptiva
Lo anterior indica que la mediana se encuentra en el lugar 24. Para hallar el valor ubicamos en la tercera columna: la primera fila, fa=2, significa que las dos primeras calificaciones son iguales a 3, la segunda fila, fa=5, significa que del tercero al quinto datos las calificaciones son iguales a 4 y as sucesivamente hasta llegar a la posicin de la mediana, la cual es Me=7. MODA Es el dato o valor de la variable que ocurre con mayor frecuencia. El smbolo que utilizaremos es Mo.

CALCULO DE MEDIDAS DE TENDENCIA CENTRAL PARA DATOS AGRUPADOS


Recuerda que cuando hablamos de datos agrupados nos referimos a que estn distribuidos en intervalos de clase. MARCA DE CLASE Se llama marca de clase de un intervalo al valor que est justo en medio del mismo y se obtiene promediando los lmites del intervalo, es decir, sumndolos y dividiendo el resultado entre dos. = = Donde: LI = Limite inferior LS= Limite superior As, la marca de clase del intervalo 11-20 es: = LIMITES REALES Se llaman lmites reales a los que obtiene de restar y sumar medida unidad a los lmites inferiores y superiores del intervalo, respectivamente. Limite real inferior = LRI = 11 0.5 = 10.5 Limite real superior = LRS = 20 + 0.5 = 20.5 AMPLITUD O ANCHURA Al tamao del intervalo de le denomina amplitud o anchura del intervalo y se calcula obteniendo la diferencia entre los limites reales del intervalo. La amplitud del intervalo 11 20 es: a = 20.5 10.5 = 10 11 + 20 = 15.5 2 + 2

CEV Flix Flores Olivares

Pgina 12

Estadstica Descriptiva
MEDIA = MEDIANA

El procedimiento para calcular la mediana cuando los datos estn agrupados es el siguiente: 1. Se identifica el intervalo que contiene al valor de la mediana, para ello debemos conocer qu lugar ocupa: = 2

2. Se calcula la frecuencia acumulada fa correspondiente al intervalo inmediato inferior al que contiene a la mediana. 3. Se identifica la frecuencia absoluta f del intervalo que contiene a la mediana. 4. Se mide la amplitud o anchura a del intervalo que contiene a la mediana. 5. Se identifica el limite real inferior L del intervalo que contiene a la mediana. = + 2 ()

MODA Para obtener ese valor cuando tenemos los datos agrupados en intervalos, nos fijamos en el intervalo que tenga la frecuencia ms alta, la moda ser la marca de clase de ese intervalo.

MEDIDAS DE DISPERSIN O VARIABILIDAD


Las medidas de dispersin, tambin llamadas de variabilidad, indican ciertos aspectos del conjunto de datos que no nos los dicen las medidas de tendencia central; por lo tanto, una descripcin mas completa de la naturaleza de un conjunto de datos se obtiene cuando se utilizan tanto las medidas de tendencia central como las de variabilidad o dispersin. Una variacin o dispersin pequea indica un alto grado de homogeneidad en los datos, mientras que una variacin grande indica poca homogeneidad. Por ejemplo, si en una fbrica que se dedica a producir tornillos se encontraran una alta variacin de los dimetros de los mismos, esto causara un alto porcentaje de productos defectuosos. Por otro lado si se tratara de elegir entre varios aspirantes a ocupar el puesto de contador y el examen arrojara poca variacin en los puntajes, la decisin se tornara difcil al tener una poblacin relativamente homognea de aspirantes. Existen varias medidas de variabilidad, las que nosotros abordaremos son: CEV Flix Flores Olivares Pgina 13

Estadstica Descriptiva
Varianza Desviacin tpica

DESVIACIN TPICA Es la medida de variabilidad mas adecuada por sus propiedades algebraicas, se le conoce tambin como desviacin estndar. La desviacin tpica es una medida de la variacin de los valores con respecto a la media. Es una especie de desviacin promedio con respecto a la media. La desviacin tpica se calcula con la siguiente frmula: ( )2 ( )2

= VARIANZA

La varianza es una medida de variabilidad que se obtienen elevando al cuadrado la desviacin estndar. 2

MEDIDAS DE POSICIN
Son indicadores estadsticos que muestran la frecuencia acumulada hasta un valor k cualquiera. PERCENTILES Los percentiles representan los valores de la variable que estn por debajo de un porcentaje, el cual puede ser una valor de 1% a 100% (en otras palabras, el total de los datos es divido en 100 partes iguales). La notacin empleada ser: Donde k es equivalente al porcentaje de datos acumulados, y es el valor de la variable que representa dicho porcentaje. Por ejemplo, 5 es el valor de la variable que deja por debajo el 5% de los datos. 78 ser entonces el valor que agrupa el 78% de los datos.

CEV Flix Flores Olivares

Pgina 14

Estadstica Descriptiva

As, si en un grupo de personas el percentil 70 de las estaturas es de 1.73 metros; esto significa que lo a sumo el 70% de las personas es ms baja que 1,73 y que lo a sumo el 30% es ms alta que 1.73 El clculo percentil es diferente, segn los datos estn sin agrupar o agrupados. Calculo percentil para datos sin agrupar: Ejemplo 1. Al medir las estaturas de 9 personas, se encuentran los siguientes resultados: 1.83, 1.72, 1.76, 1.62, 1.56, 1.78, 1.60, 1.66 y 1.58. Encuentre el percentil 30. 1.56, 1.58, 1.60, 162, 166, 1.72, 1.76, 1.78, 1,83 Ejemplo 2. Al tomar a 20 alumnos un examen de Matemticas, las calificaciones fueron: 54, 21, 34, 78, 93, 45, 66, 38, 50, 87, 63, 88, 31, 62, 96. 80, 71, 59, 35 y 42. Hallar el percentil 60 de las calificaciones obtenidas. 21, 31, 34, 35, 38, 42, 45, 50, 54, 59, 62, 63, 66, 71, 78, 80, 87, 88, 93, 96 Calculo percentil para datos agrupados Ejemplo 1. Determinar el percentil 40 y el percentil 75, en la siguiente distribucin de frecuencias: Clase Frecuencia Limites Reales Frecuencia Acumulada 10-19 12 <19.5 12 20-29 26 <29.5 38 30-39 55 <39.5 93 40-49 61 <49.5 154 50-59 40 <59.5 194 60-69 28 <69.5 222 70-79 4 <79.5 226

Existen 226 datos y se quiere encontrar el Percentil 40; por tanto, hay que calcular el 40% de 226, que resulta ser 90.4 CEV Flix Flores Olivares Pgina 15

Estadstica Descriptiva
El intervalo donde cae 40 es el tercero, pues en l en donde se alcanza esta frecuencia acumulada de 38 y termina con una de 93. 100 = + () Aplicando la formula anterior obtenemos como resultado 39.03 que significa que el 40% de ellos es menor que el valor 39.03 y el 60% restante es mayor que 39.03. Al hallar el percentil de 75 nos da como resultado 53.38

CEV Flix Flores Olivares

Pgina 16

Das könnte Ihnen auch gefallen