Sie sind auf Seite 1von 12

DISTRIBUCION DE FRECUENCIAS- PROCESO DE TABULACION DE LA INFORMACION

1- PLANTEAMIENTO TERICO-CONCEPTUAL:
Luego que producto de la observacinestadstica se captaron los datos y atributos del fenmeno-objeto de estudio, se hace necesario proceder a tabular esta informacin con el objetivo de conocer estadsticamente el fenmeno. A este proceso de tabulacin de la informacin se la llama distribucin de frecuencias, y lo definiremos como un mtodo para organizar y resumir datos en una tabla estadstica. Para una mejor comprensin del tema es necesario adoptar las siguientes concepciones tericas: Es obvio que todo estudio estadstico ha de estar referido a un conjunto o coleccin de personas o cosas. Este conjunto de personas o casas es lo que denominaremos poblacin. Que se entiende como un conjunto de medidas cuando stas provienen de una caracterstica cuantitativa, o como el recuento de todas las unidades que presentan una caracterstica comn, siendo esta cualitativa. Tambin se puede definir a la poblacin como un conjunto de elementos o unidades. Las personas o cosas que forman parte de la poblacin se denominan elementos. En sentido estadstico un elemento puede ser algo con existencia real (tangible y observable), como un automvil o una casa, o algo ms abstracto como la temperatura, un voto, o un intervalo de tiempo. A su vez cada elemento de la poblacin tiene una serie de caracterstica que puede ser objeto del estudio estadstico. As por ejemplo, si consideramos como elemento a una persona, podemos distinguir en ella los siguientes caracteres: sexo, edad, nivel de estudios, profesin, peso, altura, color de cabellos, etc.Luego por tanto de cada elemento de la poblacin podremos estudiar uno o ms aspectos cualidades o caracteres. La poblacin puede ser segn su tamao de dos tipos: poblacin finita: cuando el nmero de elementos es finito, por ejemplo el nmero de estudiantes de la Universidad de Panam, o de una facultad o especialidad. Poblacin infinita: cuando el nmero de elementos es infinito, o tan grande que pudiese considerarse infinitos. Como por ejemplo si se realizase un estudio sobre los productos disponibles en el mercado, hay tantos y de tantas cualidades y precios que esta poblacin podra considerarse infinita. Cuando se toman todas las unidades o elementos de la poblacin, se habla de una investigacin exhaustiva o censo. Si slo se investiga una parte, se le considera como investigacin parcial o muestra.

La muestra para que sea representativa de la poblacin, requiere que las unidades o elementos sean seleccionadas al azar, en tal forma que cada una de ellas tenga la misma posibilidad de ser seleccionada. Para los smbolos utilizados en poblaciones se usan letras maysculas o griegas, en cambio para las muestras, se emplean letras minsculas.

Tipos de variables:
Los tipos de variables fundamentales, por lo menos para este tema, sern los siguientes: Variables Cuantitativas o Cardinales: susceptibles de medicin cuantitativa; o sea son las que se describen por medio de nmeros y las que a su vez comprenden: Variable Cuantitativa Discretas: son aquellas cuyo conjunto de valores es a lo sumo numerable. Sus valores pueden representarse siempre por X1, X2, , Xn.; y slo se pueden asociar a un nmero entero, es decir, aquellas que por su naturaleza no admiten un fraccionamiento de la unidad Ejemplos: Nmero de hijos en el hogar .Pginas de un libro Variable Cuantitativa Continua: son aquellas que pueden tomar todos los valores de un intervalo de nmeros reales, o sea que no se pueden expresar mediante un nmero entero, es decir, aquellas que por su naturaleza admiten que entre dos valores cualesquiera la variable puede tomar cualquier valor intermedio. Ejemplos: variable temperatura en grados Celsius (escala de intervalos). variable longitud en cm. (escala de razn). variable peso. variable tiempo Variables Cualitativas (Atributos) o Ordinales: susceptibles de ordenacin, pero no de medicin cuantitativa, reflejan generalmente los atributos del fenmeno. Los atributos son aquellos caracteres que para su definicin precisan de palabras, es decir, no le podemos asignar un nmero, y a su vez las podemos clasificar en:

Ordenables: aquellas que sugieren una ordenacin, por ejemplo la graduacin militar, el nivel de estudios, etc. No Ordenables: aquellas que slo admiten un ordenamiento alfabtico, pero no establece orden por su naturaleza,, por ejemplo el color del cabello, sexo, estado civil, etc. Nota: no obstante en muchos casos el tratamiento estadstico hace que a variables discretas las trabajemos como si fuesen continua y viceversa (por ejemplo la edad de las personas variable continua- se trabaja en aos cumplidos variable discreta-. En otros casos las variables cualitativas (atributos) se trabajan como variables cuantitativas, por ejemplo en los concursos de belleza se recurre

Escalas de medicin:
Corresponde a la Situacin 1, es decir, es una escala en que se establece un nmero determinado de clases o categoras de tal modo que cada elemento de la poblacin pertenece a una y slo una clase. Matemticamente se dice que se ha establecido una relacin de equivalencia entre los elementos de la poblacin. Si slo existen dos clases se denomina escala dicotmica. La nica operacin matemtica que se puede realizar con las clases de cualquier escala nominal es determinar las cantidades de elementos que les corresponden determinar sus frecuencias. Por ejemplo: Sexo: las clases son masculino o femenino. Especialidad: las diferentes especialidades (carreras) del CRUSAM. Nmero de cedula de identidadpersonal. Temperatura de una persona: sanguneo, flemtico, melanclico, colrico. Nmero de placa de automviles del pas. a. Escala Nominal: Corresponde a la Situacin 1, es decir, es una escala en que se establece un nmero determinado de clases o categoras de tal modo que cada elemento de la poblacin pertenece a una y slo una clase. Matemticamente se dice que se ha establecido una relacin de equivalencia entre los elementos de la poblacin. Si slo existen dos clases se denomina escala dicotmica. La nica operacin matemtica que se puede realizar con las clases de cualquier escala nominal es determinar las cantidades de elementos que les corresponden determinar sus frecuencias. Por ejemplo:

Sexo: las clases son masculino o femenino. Especialidad: las diferentes especialidades (carreras) del CRUSAM. Nmero de cedula de identidad personal. Temperatura de una persona: sanguneo, flemtico, melanclico, colrico. Nmero de placa de automviles del pas.

Medidas de tendencia Central Media Aritmtica


La medida de tendencia central ms obvia que se puede elegir, es el valor obtenido sumando las observaciones y dividiendo esta suma por el nmero de observaciones que hay en el grupo. La media resume en un valor las caractersticas de una variable teniendo en cuenta a todos los casos. Solamente puede utilizarse con variables cuantitativas. Ejemplo:
Notas de 5 alumnos en una prueba: Alumno Nota 1 6.0 entonces se suman las Notas: 2 5.4 6.0+5.4+3.1+7.0+6.1=27.6 3 3.1 Luego el total se divide por la cantidad de alumnos: 4 7.0 27.6/5=5.52 5 6.1 LA MEDIA ARITMTICA EN ESTE PROBLEMA SERIA 5.52

La Media Aritmtica La medida de tendencia central ms ampliamente usada es la media aritmtica, usualmente abreviada como media. (promedio) La media aritmtica de un conjunto de n valores es el resultado de la suma de todos ellos dividido entre n. Propiedades de la media aritmtica

1. Puede ser calculada en distribuciones con escala relativa e intervalar. 2. Todos los valores son incluidos en el cmputo de la media. 3. Una serie de datos solo tiene una media. 4. Es una medida muy til para comparar dos o ms poblaciones.

5. Es la nica medida de tendencia central donde la suma de las desviaciones de cada valor respecto a la media es igual a cero. Por lo tanto podemos considerar a la media como el punto de balance de una serie de datos.

Desventajas de la media aritmtica

1. Si alguno de los valores es extremadamente grande o extremadamente pequeo, la media no es el promedio apropiado para representar la serie de datos. 2. No se puede determinar si en una distribucin de frecuencias hay intervalos de clase abiertos.

Media muestral
Si se tiene una muestra estadstica de valores (X1,X2,...,Xn) para una variable aleatoria X con distribucin de probabilidad F (x,?) [donde ? es un conjunto de parmetros de la distribucin] se define la media muestral n-sima. Es necesario tener agrupados los datos en forma ascendente o descendente, es decir, que se tenga como primer dato el mximo o el mnimo antes de calcular la media muestral.

Distintas formas de escribir la frmula


Moda
Es el dato que ms se repite en la cuenta. Si existen dos datos que se repite un nmero igual de veces entonces el conjunto ser bimodal. Ejemplo: Nmero de personas en distintos carros en una carretera :
5-7-4-6-9-5-6-1-5-3-7

en este caso el nmero que ms se repite es 5 entonces la moda en este caso es 5.

Promedio Geomtrico
La media geomtrica de un conjunto de observaciones es la raz en nsima de su producto. El clculo de la media geomtrica exige que todas las observaciones sean positivas(+)

Percentiles
Los percentiles representan los valores de la variable que estn por debajo de un porcentaje, el cual puede ser un valor de 1% a 100% (en otras palabras, el total de los datos es divido en 100 partes iguales).

Observacin
A veces puede ser til otorgar pesos o valores a los datos dependiendo de su relevancia para determinado estudio. En esos casos se puede utilizar una media ponderada. Si x1,x2,...,xn son nuestros datos y w1,w2,...,wn son sus pesos respectivos la media ponderada se define de la siguiente forma:

Propiedades de la Media o Promedio


La media o Promedio tienen las siguientes propiedades Se puede Sumar, Restar y multiplicar de la siguiente forma Si tenemos : 1-2-3-4 entonces veremos lo siguiente : Suma : Si sumamos una constante a cada variable veremos lo siguiente.
Datos : 1 - 2 - 3 - 4 Media : Sumatoria de datos / Nmero de datos => 10 / 4 => 2.5

Si
Datos : 1 - 2 - 3 - 4 + Constante : 1 Datos : [(1+1) + (2+1) + (3+1) + (4+1)] /4 => 14/4 => 3.5

Entonces Vemos: que si aumentamos una constante a cada dato tambin deberemos de aumentarla al resultado. De la misma forma se muestra para la resta y multiplicacin.

Moda
En estadstica la moda es el valor que cuenta con una mayor frecuencia en una distribucin de datos.

Hablaremos de una distribucin bimodal de los datos, cuando encontremos dos modas, es decir, dos datos que tengan la misma frecuencia absoluta mxima. Cuando en una distribucin de datos se encuentran tres o ms modas, entonces es multimodal.

Si todas las variables tienen la misma frecuencia diremos que no hay moda.

Cuando tratamos con datos agrupados antes de definir la moda, se ha de definir el intervalo modal. El intervalo modal es el de mayor frecuencia absoluta. La moda, cuando los datos estn agrupados, es un punto que divide al intervalo modal en dos partes de la forma p y c-p, siendo c la amplitud del intervalo, que verifiquen que: Siendo ni la frecuencia absoluta del intervalo modal y ni 1 y ni + 1 las frecuencias absolutas de los intervalos anterior y posterior, respectivamente, al Las calificaciones en la asignatura de Matemticas de 39 alumnos de una clase viene dada por la siguiente tabla (debajo): Calificaciones 1 2 3 4 5 6 7 8 9

Nmero de alumnos 2 2 4 5 8 9 3 4 2 Calculemos la Mediana: Primero hallamos las frecuencias absolutas acumuladas Fi As, aplicando la formula asociada a la mediana para n impar, obtenemos X(39+1)/2 = X20 y basndonos en la frmula que hace referencia a las frecuencias absolutas --> Ni-1< n/2 < Ni = N19 < 19.5 < N20 Por tanto la mediana ser el valor de la variable que ocupe el vigsimo lugar. En nuestro ejemplo, 21 (frecuencia absoluta acumulada para Xi = 5) > 19.5 con lo que Me = 5 puntos (es aconsejable no olvidar las unidades; en este caso como estamos hablando de calificaciones, sern puntos) La mitad de la clase ha obtenido un 5 o menos, y la otra mitad un 5 o ms.

Ejemplo ( N par )
Las calificaciones en la asignatura de Matemticas de 38 alumnos de una clase viene dada por la siguiente tabla (debajo): Calificaciones 1 2 3 4 5 6 7 8 9

Nmero de alumnos 2 2 4 5 6 9 4 4 2 xi fi Fi 1 2 2 2 2 4 3 4 8

Calculemos la Mediana:

4 5 13

Primero hallamos las frecuencias absolutas acumuladas Fi (ver tabla margen 5 6 19 = 19 derecho). 6 9 28 Si volvemos a utilizar la frmula asociada a la mediana para n par, 7 4 32 obtenemos X(38/2) = X19 y basndonos en la frmula que hace referencia a 8 4 36 las frecuencias absolutas --> Ni-1< n/2 < Ni = N18 < 19 < N19 9 2 38 Con lo cual la mediana ser la media aritmtica de los valores de la variable que ocupen el decimonoveno y el vigsimo lugar. En nuestro ejemplo, el lugar decimonoveno lo ocupa el 5 y el vigsimo el 6, (desde el vigsimo hasta el vigsimo octavo) con lo que Me = (5+6)/2 = 5,5 puntos. La mitad de la clase ha obtenido un 5,5 o menos y la otra mitad un 5,5 o ms

MEDIDAS DE DISPERSION Las medidas de dispersin muestran la variabilidad de una distribucin, indicando por medio de un nmero si las diferentes puntuaciones de una variable estn muy alejadas de la media. Cuanto mayor sea ese valor, mayor ser la variabilidad, cuanto menor sea, ms homognea ser a la media. As se sabe si todos los casos son parecidos o varan mucho entre ellos. Para calcular la variabilidad que una distribucin tiene respecto de su media, se calcula la media de las desviaciones de las puntuaciones respecto a la media aritmtica. Pero la suma de las desviaciones es siempre cero, as que se adoptan dos clases de estrategias para salvar este problema. Una es tomando las desviaciones en valor absoluto (Desviacin media) y otra es tomando las desviaciones al cuadrado (Varianza). El rango estadstico es la diferencia entre el valor mnimo y el valor mximo en un grupo de nmeros. Para averiguar el rango de un grupo de nmeros:

Ordenamos los nmeros segn su tamao. Restamos el valor mnimo del valor mximo.

Ejemplo
Para una muestra (1, 45, 50, 55, 100), el dato menor es 1 y el dato mayor es 100. Sus valores se encuentran en un rango de:

Rango = 100 1 =99

Varianza
La varianza es una variable estadstica que mide la dispersin de los valores respecto a un valor central (media), es decir, la media de las diferencias cuadrticas de las puntuaciones respecto a su media aritmtica.

Propiedades

La varianza es siempre positiva o 0: Si a los datos de la distribucin les sumamos una cantidad constante la varianza no se modifica.

Y i = Xi + k

Si a los datos de la distribucin les multiplicamos una constante, la varianza queda multiplicada por el cuadrado de esa consta Propiedad distributiva: V(X + Y) = V(X) + V(Y)

Desviacin tpica
La varianza a veces no se interpreta claramente, ya que se mide en unidades cuadrticas. Para evitar ese problema se define otra medida de dispersin, que es la desviacin tpica, que se halla como la raz cuadrada positiva de la varianza. La desviacin tpica nos informa sobre la dispersin de los datos respecto al valor de la media; cuanto mayor sea su valor, ms dispersos estarn los datos.

El coeficiente de variacin es til para comparar dispersiones a escalas distintas pues es una medida invariante ante cambios de escala. Por otro lado presenta problemas ya que a diferencia de la desviacin tpica este coeficiente es variable ante cambios de origen. Por ello es importante que todos los valores sean positivos y su media de por tanto un valor positivo. Indican que tanto se desvan los datos de la media general, es una medida de dispersin relativa CV = S/X . 100, donde S= Desviacin estndar, X es la media , su resultado se expresa en porcentaje.

Ejemplo , la media del peso de 10 melones es 18700 grs., y su desviacin estndar es 168 grs., calcular el coeficiente de variacin CV= s/X. 100 = 168/18700 x 100 = 0.898% ~ 0.9%

Probabilidad
La probabilidad mide la frecuencia con la que se obtiene un resultado (o conjunto de resultados) al llevar a cabo un experimento aleatorio, del que se conocen todos los resultados posibles, bajo condiciones suficientemente estables. La teora de la probabilidad se usa extensamente en reas como la estadstica, la fsica, la matemtica, la ciencia y la filosofa para sacar conclusiones sobre la probabilidad de sucesos potenciales y la mecnica subyacente de sistemas complejos. La palabra probabilidad no tiene una definicin consistente. De hecho hay dos amplias categoras de interpretaciones de la probabilidad: los frecuentistas hablan de probabilidades slo cuando se trata de experimentos aleatorios bien definidos. La frecuencia relativa de ocurrencia del resultado de un experimento, cuando se repite el experimento, es una medida de la probabilidad de ese suceso aleatorio. Los bayesianos, no obstante, asignan las probabilidades a cualquier declaracin, incluso cuando no implica un proceso aleatorio, como una manera de representar su verosimilitud subjetiva.

Historia
El estudio cientfico de la probabilidad es un desarrollo moderno. Los juegos de azar muestran que ha habido un inters en cuantificar las ideas de la probabilidad durante milenios, pero las descripciones matemticas exactas de utilidad en estos problemas slo surgieron mucho despus. Segn Richard Jeffrey, "Antes de la mitad del siglo XVII, el trmino 'probable' (en latn probable) significaba aprobable, y se aplicaba en ese sentido, unvocamente, a la opinin y a la accin. Una accin u opinin probable era una que las personas sensatas emprenderan o mantendran, en las circunstancias."

Aparte de algunas consideraciones elementales hechas por Girolamo Cardano en el siglo XVI, la doctrina de las probabilidades data de la correspondencia de Pierre de Fermat y Blaise Pascal (1654). Christiaan Huygens (1657) le dio el tratamiento cientfico conocido ms temprano al concepto. Abraham de Moivre trataron el tema como una rama de las matemticas. Vase El

surgimiento de la probabilidad (The Emergence of Probability) de Ian Hacking para una historia de los inicios del desarrollo del propio concepto de probabilidad matemtica. Aplicaciones
Dos aplicaciones principales de la teora de la probabilidad en el da a da son en el anlisis de riesgo y en el comercio de los mercados de materias primas. Los gobiernos normalmente aplican mtodos probabilsticos en regulacin ambiental donde se les llama "anlisis de vas de dispersin", y a menudo miden el bienestar usando mtodos que son estocsticos por naturaleza, y escogen qu proyectos emprender basndose en anlisis estadsticos de su probable efecto en la poblacin como un conjunto. No es correcto decir que la estadstica est incluida en el propio modelado, ya que tpicamente los anlisis de riesgo son para una nica vez y por lo tanto requieren ms modelos de probabilidad fundamentales, por ej. "la probabilidad de otro 11-S". Una ley de nmeros pequeos tiende a aplicarse a todas aquellas elecciones y percepciones del efecto de estas elecciones, lo que hace de las medidas probabilsticas un tema poltico. Un buen ejemplo es el efecto de la probabilidad percibida de cualquier conflicto generalizado sobre los precios del petrleo en Oriente Medio - que producen un efecto domin en la economa en conjunto. Un clculo por un mercado de materias primas en que la guerra es ms probable en contra de menos probable probablemente enva los precios hacia arriba o hacia abajo e indica a otros comerciantes esa opinin. Por consiguiente, las probabilidades no se calculan independientemente y tampoco son necesariamente muy racionales. La teora de las finanzas conductuales surgi para describir el efecto de este pensamiento de grupo en el precio, en la poltica, y en la paz y en los conflictos. Se puede decir razonablemente que el descubrimiento de mtodos rigurosos para calcular y combinar los clculos de probabilidad ha tenido un profundo efecto en la sociedad moderna. Por consiguiente, puede ser de alguna importancia para la mayora de los ciudadanos entender cmo se calculan los pronsticos y las probabilidades, y cmo contribuyen a la reputacin y a las decisiones, especialmente en una democracia. Otra aplicacin significativa de la teora de la probabilidad en el da a da es en la fiabilidad. Muchos bienes de consumo, como los automviles y la electrnica de consumo, utilizan la teora de la fiabilidad en el diseo del producto para reducir la probabilidad de avera. La probabilidad de avera tambin est estrechamente relacionada con la garanta del producto. Se puede decir que no existe una cosa llamada probabilidad. Tambin se puede decir que la probabilidad es la medida de nuestro grado de incertidumbre, o esto es, el grado de nuestra ignorancia dada una situacin. Por consiguiente, puede haber una probabilidad de 1 entre 52 de que la primera carta en un baraja de cartas es la J de diamantes. Sin embargo, si uno

mira la primera carta y la reemplaza, entonces la probabilidad es o bien 100% o 0%, y la eleccin correcta puede ser hecha con precisin por el que ve la carta. La fsica moderna proporciona ejemplos importantes de situaciones deterministicas donde slo la descripcin probabilstica es factible debido a informacin incompleta y la complejidad de un sistema as como ejemplos de fenmenos realmente aleatorios.