Sie sind auf Seite 1von 166

PROBABILIDAD Y ESTADISTICA

PROBABILIDAD Y ESTADISTICA INTRODUCCION


Como dijera David Huntsberger: La palabra estadstica a menudo nos trae a la mente imgenes de nmeros apilados en grandes arreglos y tablas, de volmenes de cifras relativas a nacimientos, muertes, impuestos, poblaciones, ingresos, deudas, crditos y as sucesivamente. David tiene razn pues al instante de escuchar esta palabra estas son las imgenes que llegan a nuestra cabeza.

La Estadstica es mucho ms que slo nmeros apilados y grficas bonitas. Es una ciencia con tanta antigedad como la escritura, y es por s misma auxiliar de todas las dems ciencias. Los mercados, la medicina, la ingeniera, los gobiernos, etc. Se nombran entre los ms destacados clientes de sta.

La ausencia de sta conllevara a un caos generalizado, dejando a los administradores y ejecutivos sin informacin vital a la hora de tomar decisiones en tiempos de incertidumbre.

La Estadstica que conocemos hoy en da debe gran parte de su realizacin a los trabajos matemticos de aquellos hombres que desarrollaron la teora de las probabilidades, con la cual se adhiri a la Estadstica a las ciencias formales.

En este breve material se expone los conceptos, la historia, la divisin as como algunos errores bsicos cometidos al momento de analizar datos Estadsticos.

Definicin de La Estadstica

La Estadstica es la ciencia cuyo objetivo es reunir una informacin cuantitativa concerniente a individuos, grupos, series de hechos, etc. y deducir de ello gracias al anlisis de estos datos unos significados precisos o unas previsiones para el futuro.

166

PROBABILIDAD Y ESTADISTICA

La estadstica, en general, es la ciencia que trata de la recopilacin, organizacin presentacin, anlisis e interpretacin de datos numricos con e fin de realizar una toma de decisin ms efectiva.

Otros autores tienen definiciones de la Estadstica semejantes a las anteriores, y algunos otros no tan semejantes. Para Chacn esta se define como la ciencia que tiene por objeto el estudio cuantitativo de los colectivos; otros la definen como la expresin cuantitativa del conocimiento dispuesta en forma adecuada para el escrutinio y anlisis. La ms aceptada, sin embargo, es la de Minguez, que define la Estadstica como La ciencia que tiene por objeto aplicar las leyes de la cantidad a los hechos sociales para medir su intensidad, deducir las leyes que los rigen y hacer su prediccin prxima.

Los estudiantes confunden comnmente los dems trminos asociados con las Estadsticas, una confusin que es conveniente aclarar debido a que esta palabra tiene tres significados: la palabra estadstica, en primer trmino se usa para referirse a la informacin estadstica; tambin se utiliza para referirse al conjunto de tcnicas y mtodos que se utilizan para analizar la informacin estadstica; y el trmino estadstico, en singular y en masculino, se refiere a una medida derivada de una muestra.

Utilidad e Importancia

Los mtodos estadsticos tradicionalmente se utilizan para propsitos descriptivos, para organizar y resumir datos numricos. La estadstica descriptiva, por ejemplo trata de la tabulacin de datos, su presentacin en forma grfica o ilustrativa y el clculo de medidas descriptivas.

Ahora bien, las tcnicas estadsticas se aplican de manera amplia en mercadotecnia, contabilidad, control de calidad y en otras actividades; estudios de consumidores; anlisis de resultados en deportes; administradores de instituciones; en la educacin; organismos polticos; mdicos; y por otras personas que intervienen en la toma de decisiones.

CURSO DESARROLLADO

166

PROBABILIDAD Y ESTADISTICA
La sumatoria es un smbolo muy utilizado en matemticas que sirve para simplificar formulas estadsticas.Una sumatoria nos permite representar sumas muy grandes, de n sumandos o incluso sumas infinitas y se expresa con la letra griega sigma ( S ). Por lo general despus de una sumatoria aparece una variable con un suscrito representado por la letra i (SXi). Este suscrito indica qu valores de la variable se deben sumar, Para determinar cules valores es necesario sustituir la i por los valores que se indican arriba y debajo de la sumatoria Una sumatoria se define como:

La variable i es el ndice de suma al que se le asigna un valor inicial llamado lmite inferior, m. La variable i recorrer los valores enteros hasta alcanzar el lmite superior, n. Necesariamente ha de cumplirse:

Por ejemplo si queremos expresar la suma de los diez primeros nmeros naturales podemos hacerlo as con una sumatoria:

Las sumatorias son tiles para expresar sumas arbitrarias de nmeros, por ejemplo en frmulas: as, si queremos representar la frmula para hallar la media aritmtica de n nmeros:

Reglas de la sumatoria

Propiedad distributiva de la suma

166

PROBABILIDAD Y ESTADISTICA
La propiedad distributiva de la suma indica que cuando se multiplica cada uno de los trminos que componen una suma por la misma constante, es posible primero efectuar la suma de los trminos y luego multiplicar el resultado por la constante. Ejemplo: 9(2+7+4+6) = (9)2 + (9)7 +(9)4 + (9)6 = 18 + 63 + 36 + 54 = 171, lo mismo 9(2+7+4+6) = (9)19 = 171

Utilizando la sumatoria esta situacin se representa de la siguiente manera

Sumatoria de una constante:

Si se aplica la sumatoria a una constante es lo mismo que sumar la constante a s misma tantas veces como lo indique la sumatoria. Ejemplo: Si C = 5

Como la suma del mismo nmero repetidas veces se puede representar por medio de la operacin de multiplicacin es posible indicar que si C es una constante entonces

Sumatoria de dos o ms variables:

Si se aplica la sumatoria a una suma de dos o ms variables el resultado es igual a la suma de las sumatorias de estas variables. Ejemplo:

166

PROBABILIDAD Y ESTADISTICA

i XY 1 2 5 2 3 2 3 - 0 1 4 1 1

La sumatoria es igual a: (X1+Y1)+(X2+Y2)+(X3+Y3)+(X4+Y4) = X1+X2+X3+X4+Y1+Y2+Y3+Y4 (2+5)+[3+(-2)]+[(-1)+0]+(1+1) = 2+3+(-1)+1+5+(-2)+0+1 7+1-1+2 = 9

Entre las propiedades generales de las sumatorias reportadas en la literatura se encuentra las once que se relacionan a continuacin, cuya demostracin se realiza utilizando el procedimiento matemtico de Induccin Completa. propiedades:

Propiedad #1:

Propiedad #2:

Propiedad #3:

Propiedad #4:

166

PROBABILIDAD Y ESTADISTICA

Propiedad #5:

Propiedad #6:

Propiedad #7:

Propiedad #8:

Propiedad #9:

Propiedad #10:

Propiedad #11: Obtenidas en este trabajo

En la prctica existen mltiples problemas cuya solucin conduce al clculo de sumatorias que cumplen con requisitos especiales, como es el caso de la solucin de Sistemas de Ecuaciones Lineales resultante para la determinacin de las derivadas de funciones con intervalo de variacin uniforme de la variable dependiente; los problemas que exhiben simetra, etc., bajo cuyas condiciones es posible obtener expresiones tiles de trabajo, que simplifican las operaciones a realizar, entre las que pueden sealarse las que se deducen a continuacin.

Considerando simetra en el recorrido del ndice de la suma

Una condicin que trata de utilizarse siempre que sea posible, ya que simplifica los clculos en los modelos de fenmenos o procesos, es la simetra, la que en trminos de las sumatorias esta caracterstica se corresponde con la variacin del ndice de la suma en el intervalo como se indica a continuacin:

166

PROBABILIDAD Y ESTADISTICA
Bajo esta hiptesis de trabajo, es posible obtener el conjunto de propiedades que se demuestran a continuacin.

Propiedad #1:

Demostracin:

Propiedad #2:

Demostracin:

Propiedad #3:

Propiedad #4:

Propiedad #5:

166

PROBABILIDAD Y ESTADISTICA

Solucin de Sistemas de Ecuaciones Lineales con variable independiente de la forma x k x

Una aplicacin en la cual las sumatorias simtricas adoptan un trmino interesante es el caso de la obtencin de expresiones analticas por el clculo de las derivadas de funciones de variable discreta, en el cual es comn trabajar con trminos de la forma elevado a una cierta potencia. A continuacin se deducen cinco propiedades de gran utilidad prctica.

Propiedad #1: Clculo de

Propiedad #2: Clculo de

Propiedad #3: Clculo de

166

PROBABILIDAD Y ESTADISTICA

Propiedad #4: Clculo de

Propiedad #5: Clculo de

166

PROBABILIDAD Y ESTADISTICA

Propiedad #6: Clculo de

SUMATORIAS
La sumatoria es un smbolo muy utilizado en matemticas que sirve para simplificar formulas estadsticas.Una sumatoria nos permite representar sumas muy grandes, de n sumandos o incluso sumas infinitas y se expresa con la letra griega sigma ( S ). Por lo general despus de una sumatoria aparece una variable con un suscrito representado por la letra i (SXi). Este suscrito indica qu valores de la variable se deben sumar, Para determinar cules valores es necesario sustituir la i por los valores que se indican arriba y debajo de la sumatoria Una sumatoria se define como:

166

PROBABILIDAD Y ESTADISTICA
La variable i es el ndice de suma al que se le asigna un valor inicial llamado lmite inferior, m. La variable i recorrer los valores enteros hasta alcanzar el lmite superior, n. Necesariamente ha de cumplirse:

Por ejemplo si queremos expresar la suma de los diez primeros nmeros naturales podemos hacerlo as con una sumatoria:

Las sumatorias son tiles para expresar sumas arbitrarias de nmeros, por ejemplo en frmulas: as, si queremos representar la frmula para hallar la media aritmtica de n nmeros:

Reglas de la sumatoria

Propiedad distributiva de la suma

La propiedad distributiva de la suma indica que cuando se multiplica cada uno de los trminos que componen una suma por la misma constante, es posible primero efectuar la suma de los trminos y luego multiplicar el resultado por la constante. Ejemplo: 9(2+7+4+6) = (9)2 + (9)7 +(9)4 + (9)6 = 18 + 63 + 36 + 54 = 171, lo mismo 9(2+7+4+6) = (9)19 = 171

Utilizando la sumatoria esta situacin se representa de la siguiente manera

166

PROBABILIDAD Y ESTADISTICA

Sumatoria de una constante:

Si se aplica la sumatoria a una constante es lo mismo que sumar la constante a s misma tantas veces como lo indique la sumatoria. Ejemplo: Si C = 5

Como la suma del mismo nmero repetidas veces se puede representar por medio de la operacin de multiplicacin es posible indicar que si C es una constante entonces

Sumatoria de dos o ms variables:

Si se aplica la sumatoria a una suma de dos o ms variables el resultado es igual a la suma de las sumatorias de estas variables. Ejemplo:

X 2 3 1 4 1

i 1 2 3

Y 5 -2 0 1

La sumatoria es igual a: (X1+Y1)+(X2+Y2)+(X3+Y3)+(X4+Y4) = X1+X2+X3+X4+Y1+Y2+Y3+Y4

166

PROBABILIDAD Y ESTADISTICA
(2+5)+[3+(-2)]+[(-1)+0]+(1+1) = 2+3+(-1)+1+5+(-2)+0+1 7+1-1+2 = 9

Entre las propiedades generales de las sumatorias reportadas en la literatura se encuentra las once que se relacionan a continuacin, cuya demostracin se realiza utilizando el procedimiento matemtico de Induccin Completa.

propiedades:

Propiedad #1:

Propiedad #2:

Propiedad #3:

Propiedad #4:

Propiedad #5:

Propiedad #6:

Propiedad #7:

Propiedad #8:

Propiedad #9:

166

PROBABILIDAD Y ESTADISTICA

Propiedad #10:

Propiedad #11:

Obtenidas en este trabajo

En la prctica existen mltiples problemas cuya solucin conduce al clculo de sumatorias que cumplen con requisitos especiales, como es el caso de la solucin de Sistemas de Ecuaciones Lineales resultante para la determinacin de las derivadas de funciones con intervalo de variacin uniforme de la variable dependiente; los problemas que exhiben simetra, etc., bajo cuyas condiciones es posible obtener expresiones tiles de trabajo, que simplifican las operaciones a realizar, entre las que pueden sealarse las que se deducen a continuacin.

Considerando simetra en el recorrido del ndice de la suma

Una condicin que trata de utilizarse siempre que sea posible, ya que simplifica los clculos en los modelos de fenmenos o procesos, es la simetra, la que en trminos de las sumatorias esta caracterstica se corresponde con la variacin del ndice de la suma en el intervalo como se indica a continuacin:

Bajo esta hiptesis de trabajo, es posible obtener el conjunto de propiedades que se demuestran a continuacin.

Propiedad #1: Demostracin:

166

PROBABILIDAD Y ESTADISTICA

Propiedad #2: Demostracin:

Propiedad #3:

Propiedad #4:

Propiedad #5:

Solucin de Sistemas de Ecuaciones Lineales con variable independiente de la forma x k x

166

PROBABILIDAD Y ESTADISTICA
Una aplicacin en la cual las sumatorias simtricas adoptan un trmino interesante es el caso de la obtencin de expresiones analticas por el clculo de las derivadas de funciones de variable discreta, en el cual es comn trabajar con trminos de la forma elevado a una cierta potencia. A continuacin se deducen cinco propiedades de gran utilidad prctica.

Propiedad #1: Clculo de

Propiedad #2: Clculo de

Propiedad #3: Clculo de

Propiedad #4: Clculo de

166

PROBABILIDAD Y ESTADISTICA

Propiedad #5: Clculo de

Propiedad #6: Clculo de

166

PROBABILIDAD Y ESTADISTICA

ESTADISTICA DESCRIPTIVA
Estadstica:

La estadstica es comnmente considerada como una coleccin de hechos numricos expresados en trminos de una relacin sumisa, y que han sido recopilado a partir de otros datos numricos. La estadstica es una ciencia con base matemtica referente a la recoleccin, anlisis e interpretacin de datos, que busca explicar condiciones regulares en fenmenos de tipo aleatorio. Es transversal a una amplia variedad de disciplinas, desde la fsica hasta las ciencias sociales, desde las ciencias de la salud hasta el control de calidad, y es usada para la toma de decisiones en reas de negocios e instituciones gubernamentales. La estadstica se divide en dos ramas:

Estadstica Descriptiva:

Tienen por objeto fundamental describir y analizar las caractersticas de un conjunto de datos, obtenindose de esa manera conclusiones sobre las caractersticas de dicho conjunto y sobre las relaciones existentes con otras poblaciones, a fin de compararlas. No obstante puede no solo referirse a la observacin de todos los elementos de una poblacin (observacin exhaustiva) sino tambin a la descripcin de los elementos de una muestra (observacin parcial). En relacin a la estadstica descriptiva, Ernesto Rivas Gonzles dice; "Para el estudio de estas muestras, la estadstica descriptiva nos provee de todos sus medidas; medidas que cuando quieran ser aplicadas al universo total, no tendrn la misma exactitud que tienen para la muestra, es decir al estimarse para el universo vendr dada con cierto margen de error; esto significa que el valor de la medida calculada para la muestra, en el oscilar dentro de cierto lmite de confianza, que casi siempre es de un 95 a 99% de los casos.

166

PROBABILIDAD Y ESTADISTICA

Estadstica Inductiva:

Est fundamentada en los resultados obtenidos del anlisis de una muestra de poblacin, con el fin de inducir o inferir el comportamiento o caracterstica de la poblacin, de donde procede, por lo que recibe tambin el nombre de Inferencia estadstica. Segn Berenson y Levine; Estadstica Inferencial son procedimientos estadsticos que sirven para deducir o inferir algo acerca de un conjunto de datos numricos (poblacin), seleccionando un grupo menor de ellos (muestra). El objetivo de la inferencia en investigacin cientfica y tecnolgica radica en conocer clases numerosas de objetos, personas o eventos a partir de otras relativamente pequeas compuestas por los mismos elementos. En relacin a la estadstica descriptiva y la inferencial, Levin & Rubin (1996) citan los siguientes ejemplos para ayudar a entender la diferencia entre las dos.

Supngase que un profesor calcula la calificacin promedio de un grupo de historia. Como la estadstica describe el desempeo del grupo pero no hace ninguna generalizacin acerca de los diferentes grupos, podemos decir que el profesor est utilizando estadstica descriptiva. Graficas, tablas y diagramas que muestran los datos de manera que sea ms fcil su entendimiento son ejemplos de estadstica descriptiva.

Supngase ahora que el profesor de historia decide utilizar el promedio de calificaciones obtenidos por uno de sus grupos para estimar la calificacin promedio de las diez unidades del mismo curso de historia. El proceso de estimacin de tal promedio sera un problema concerniente a la estadstica inferencial. Los estadsticos se refieren a esta rama como inferencia estadstica, esta implica generalizaciones y afirmaciones con respecto a la probabilidad de su validez.

LA ESTADISTICA EN EL PROCESO DE INVESTIGACIN


Poblacin:

166

PROBABILIDAD Y ESTADISTICA

El concepto de poblacin en estadstica va ms all de lo que comnmente se conoce como tal. Una poblacin se precisa como un conjunto finito o infinito de personas u objetos que presentan caractersticas comunes. "Una poblacin es un conjunto de todos los elementos que estamos estudiando, acerca de los cuales intentamos sacar conclusiones". Levin & Rubin (1996). "Una poblacin es un conjunto de elementos que presentan una caracterstica comn". Cadenas (1974). Ejemplo: Los miembros del Colegio de Ingenieros del Estado Cojedes. El tamao que tiene una poblacin es un factor de suma importancia en el proceso de investigacin estadstica, y este tamao vienen dado por el nmero de elementos que constituyen la poblacin, segn el nmero de elementos la poblacin puede ser finita o infinita. Cuando el nmero de elementos que integra la poblacin es muy grande, se puede considerar a esta como una poblacin infinita, por ejemplo; el conjunto de todos los nmeros positivos. Una poblacin finita es aquella que est formada por un limitado nmero de elementos, por ejemplo; el nmero de estudiante del Ncleo San Carlos de la Universidad Nacional Experimental Simn Rodrguez. Cuando la poblacin es muy grande, es obvio que la observacin de todos los elementos se dificulte en cuanto al trabajo, tiempo y costos necesario para hacerlo. Para solucionar este inconveniente se utiliza una muestra estadstica. Es a menudo imposible o poco prctico observar la totalidad de los individuos, sobre todos si estos son muchos. En lugar de examinar el grupo entero llamado poblacin o universo, se examina una pequea parte del grupo llamada muestra.

Muestra:

"Se llama muestra a una parte de la poblacin a estudiar que sirve para representarla". Murria R. Spiegel (1991). "Una muestra es una coleccin de algunos elementos de la poblacin, pero no de todos". Levin & Rubin (1996). "Una muestra debe ser definida en base de la poblacin determinada, y las conclusiones que se obtengan de dicha muestra solo podrn referirse a la poblacin en referencia", Cadenas (1974). Ejemplo; El estudio realizado a 50 miembros del Colegio de Ingenieros del Estado Cojedes. El estudio de muestras es ms sencillo que el estudio de la poblacin completa; cuesta menos y lleva menos tiempo. Por ltimo se aprobado que el examen de una poblacin entera todava

166

PROBABILIDAD Y ESTADISTICA
permite la aceptacin de elementos defectuosos, por tanto, en algunos casos, el muestreo puede elevar el nivel de calidad. Una muestra representativa contiene las caractersticas relevantes de la poblacin en las mismas proporciones que estn incluidas en tal poblacin. Los expertos en estadstica recogen datos de una muestra. Utilizan esta informacin para hacer referencias sobre la poblacin que est representada por la muestra. En consecuencia muestra y poblacin son conceptos relativos. Una poblacin es un todo y una muestra es una fraccin o segmento de ese todo.

Muestreo:

Esto no es ms que el procedimiento empleado para obtener una o ms muestras de una poblacin; el muestreo es una tcnica que sirve para obtener una o ms muestras de poblacin. Este se realiza una vez que se ha establecido un marco muestral representativo de la poblacin, se procede a la seleccin de los elementos de la muestra aunque hay muchos diseos de la muestra. Al tomar varias muestras de una poblacin, las estadsticas que calculamos para cada muestra no necesariamente seran iguales, y lo ms probable es que variaran de una muestra a otra. Ejemplo;

Consideremos como una poblacin a los estudiantes de educacin del Ncleo San Carlos de la UNESR, determinando por lo menos dos caracteres ser estudiados en dicha poblacin; Religin de los estudiantes Sexo.

Tipos de muestreo

Existen dos mtodos para seleccionar muestras de poblaciones; el muestreo no aleatorio o de juicio y el muestreo aleatorio o de probabilidad. En este ltimo todos los elementos de la poblacin tienen la oportunidad de ser escogidos en la muestra. Una muestra seleccionada por muestreo de juicio se basa en la experiencia de alguien con la poblacin. Algunas veces una muestra de juicio se usa como gua o muestra tentativa para decidir como tomar una muestra aleatoria ms adelante. Las muestras de juicio evitan el anlisis estadstico necesarios para hacer muestras de probabilidad.

Variables y Atributos:

166

PROBABILIDAD Y ESTADISTICA

Las variables, tambin suelen ser llamados caracteres cuantitativos, son aquellos que pueden ser expresados mediante nmeros. Son caracteres susceptibles de medicin. Como por ejemplo, la estatura, el peso, el salario, la edad, etc. Segn, Murray R. Spiegel, (1992) "una variable es un smbolo, tal como X, Y, Hx, que puede tomar un valor cualquiera de un conjunto determinado de ellos, llamado dominio de la variable. Si la variable puede tomar solamente un valor, se llama constante." Todos los elementos de la poblacin poseen los mismos tipos de caracteres, pero como estos en general no suelen representarse con la misma intensidad, es obvio que las variables toman distintos valores. Por lo tanto estos distintos nmeros o medidas que toman los caracteres son los "valores de la variable". Todos ellos juntos constituyen una variable. Los atributos tambin llamados caracteres cualitativos, son aquellos que no son susceptibles de medicin, es decir que no se pueden expresar mediante un nmero. IUTIN (1997). "Reciben el nombre de variables cualitativas o atributos, aquellas caractersticas que pueden presentarse en individuos que constituyen un conjunto. La forma de expresar los atributos es mediante palabras, por ejemplo; profesin, estado civil, sexo, nacionalidad, etc. Puede notar que los atributos no se presentan en la misma forma en todos los elementos. Estas distintas formas en que se presentan los atributos reciben el nombre de "modalidades". Ejemplo; El estado civil de cada uno de los estudiantes del curso de estadsticas I, no se presenta en la misma modalidad en todos.

Formas de Observar la Poblacin:

1.

2. Atendiendo a la fuente se clasifican en directa o indirecta. o o Observacin directa: es aquella donde se tienen un contacto directo con los elementos o caracteres en los cuales se presenta el fenmeno que se pretende investigar, y los resultados obtenidos se consideran datos estadsticos originales. Para Ernesto Rivas Gonzlez (1997) "Investigacin directa, es aquella en que el investigador observa directamente los casos o individuos en los cuales se produce el fenmeno, entrando en contacto con ellos; sus resultados se consideran datos estadsticos originales, por esto se llama tambin a esta investigacin primaria".

Ejemplo; el seguimiento de la poblacin agrcola por ao, llevado en una determinada granja.

166

PROBABILIDAD Y ESTADISTICA
o o Observacin Indirecta: es aquella donde la persona que investiga hace uso de datos estadsticos ya conocidos en una investigacin anterior, o de datos observados por un tercero (persona o entidad). Con el fin de deducir otros hechos o fenmenos.

Ejemplo; si un investigador pretende estudiar la produccin por aos de una granja avcola, en sus ltimos cinco aos de produccin, tendra que hacer un seguimiento, a tal fin recurrira a las observaciones que posee la oficina administrativa de la granja durante estos cinco aos, o dirigirse a la oficina de estadstica, llevada en el ministerio de produccin y comercio (M.P.C) de la localidad donde est registrada dicha granja. Es de notar que el investigador se vale de observaciones realizadas por terceros. 1. Atendiendo a la periodicidad, puede ser continua, peridica o circunstancial. o o Una observacin continua; como su nombre lo indica es aquella que se lleva acabo de un modo permanente.

Ejemplo: la contabilidad comercial, llevada en cuanto a compras, ventas y otras operaciones que se van registrando a medida que van producindose. o

Una observacin peridica; es aqulla que se lleva a cabo a travs de perodos de tiempo constantes. Estos perodos de tiempos pueden ser semanas, trimestres, semestres, aos, etc. Lo que debemos destacar es que los perodos de tiempo tomados como unidad deben tomarse constantes en los posible.

Ejemplo; el registro llevado por la Oficinas de Control de Estudios de la UNESR, en cuanto a la inscripcin de los estudiantes por semestre. o

La observacin circunstancial, es aquella que se efecta en forma ocasional o espordica, esta observacin hecha ms por una necesidad momentnea, que de carcter regular o permanente.

Ejemplo; la obtencin de nmeros de aulas utilizadas y no utilizadas en los colegios pertenecientes al municipio San Carlos del Estado Cojedes. 1. Atendiendo a la cobertura; pueden ser exhaustiva, parcial o mixta o o Observacin Exhaustiva. Cuando la observacin es efectuada sobre la totalidad de los elementos de la poblacin se habla de una observacin exhaustiva.

166

PROBABILIDAD Y ESTADISTICA
o Observacin Parcial. Dados que las poblaciones en general son grandes, la observacin de todos sus elementos se ve imposibilitada. La solucin para superar este inconveniente es observar una parte de esta poblacin. Observacin Mixta. En este tipo de observacin se combinan adecuadamente la observacin exhaustiva con la observacin parcial. Por lo general, este tipo de observaciones se lleva a cabo de tal manera que los caracteres que se consideran bsicos se observan exhaustivamente y los otros mediante una muestra; o bien cuando la poblacin es muy grande, parte de ella se observa parcialmente.

Censo:

Se entiende por censo aquella numeracin que se efecta a todos y cada uno de los caracteres componentes de una poblacin. Para Levin & Rubin (1996) "Algunas veces es posible y prctico examinar a cada persona o elemento de la poblacin que deseamos describir. A esto lo llamamos una numeracin completa o censo. Utilizamos el muestre cuando no es posible contar o medir todos los elementos de la poblacin. Si es posible listar (o enumerar) y observar cada elemento de la poblacin, los censos se utilizan rara vez porque a menudo su compilacin es bastante difcil, consume mucho tiempo por lo que resulta demasiado costoso.

Encuesta:

Se entiende por encuesta las observaciones realizadas por muestreo, es decir son observaciones parciales. El diseo de encuestas es exclusivo de las ciencias sociales y parte de la premisa de que si queremos conocer algo sobre el comportamiento de las personas, lo mejor, ms directo y simple es preguntrselo directamente a ellas. (Cadenas, 1974). Segn Antonio Napolitano "La encuesta, es un mtodo mediante el cual se quiere averiguar. Se efecta a travs de cuestionarios verbales o escritos que son aplicados a un gran nmero de personas".

Estadstica Descriptiva:

Tienen por objeto fundamental describir y analizar las caractersticas de un conjunto de datos, obtenindose de esa manera conclusiones sobre las caractersticas de dicho conjunto y sobre las relaciones existentes con otras poblaciones, a fin de compararlas. No obstante puede no solo referirse a la observacin de todos los elementos de una poblacin (observacin

166

PROBABILIDAD Y ESTADISTICA
exhaustiva) sino tambin a la descripcin de los elementos de una muestra (observacin parcial). En relacin a la estadstica descriptiva, Ernesto Rivas Gonzles dice; "Para el estudio de estas muestras, la estadstica descriptiva nos provee de todos sus medidas; medidas que cuando quieran ser aplicadas al universo total, no tendrn la misma exactitud que tienen para la muestra, es decir al estimarse para el universo vendr dada con cierto margen de error; esto significa que el valor de la medida calculada para la muestra, en el oscilar dentro de cierto lmite de confianza, que casi siempre es de un 95 a 99% de los casos.

Estadstica Inductiva:

Est fundamentada en los resultados obtenidos del anlisis de una muestra de poblacin, con el fin de inducir o inferir el comportamiento o caracterstica de la poblacin, de donde procede, por lo que recibe tambin el nombre de Inferencia estadstica. Segn Berenson y Levine; Estadstica Inferencial son procedimientos estadsticos que sirven para deducir o inferir algo acerca de un conjunto de datos numricos (poblacin), seleccionando un grupo menor de ellos (muestra). El objetivo de la inferencia en investigacin cientfica y tecnolgica radica en conocer clases numerosas de objetos, personas o eventos a partir de otras relativamente pequeas compuestas por los mismos elementos. En relacin a la estadstica descriptiva y la inferencial, Levin & Rubin (1996) citan los siguientes ejemplos para ayudar a entender la diferencia entre las dos. Supngase que un profesor calcula la calificacin promedio de un grupo de historia. Como la estadstica describe el desempeo del grupo pero no hace ninguna generalizacin acerca de los diferentes grupos, podemos decir que el profesor est utilizando estadstica descriptiva. Graficas, tablas y diagramas que muestran los datos de manera que sea ms fcil su entendimiento son ejemplos de estadstica descriptiva. Supngase ahora que el profesor de historia decide utilizar el promedio de calificaciones obtenidos por uno de sus grupos para estimar la calificacin promedio de las diez unidades del mismo curso de historia. El proceso de estimacin de tal promedio sera un problema concerniente a la estadstica inferencial. Los estadsticos se refieren a esta rama como inferencia estadstica, esta implica generalizaciones y afirmaciones con respecto a la probabilidad de su validez. UNIDAD II Medicin de Caracteres

Medicin

166

PROBABILIDAD Y ESTADISTICA
Existen diversas definiciones del termino "medicin", pero estas dependen de los diferentes puntos de vista que se puedan tener al abordar el problema de la cuantificacin y el proceso mismo de la construccin de una escala o instrumento de medicin. En general, se entiende por medicin la asignacin de nmeros a elementos u objetos para representar o cuantificar una propiedad. El problema bsico est dado por la asignacin un numeral que represente la magnitud de la caracterstica que queremos medir y que dicho nmeros pueden analizarse por manipulaciones de acuerdo a ciertas reglas. Por medio de la medicin, los atributos de nuestras percepciones se transforman en entidades conocidas y manejables llamadas "nmeros". Es evidente que el mundo resultara catico si no pudiramos medir nada. En este caso cabra preguntarse de que le servira la fsico saber que el hierro tiene una alta temperatura de fusin.

Niveles o Escalas de mediciones Escala Nominal:

La escala de medida nominal, puede considerarse la escala de nivel ms bajo, y consiste en la asignacin, puramente arbitraria de nmeros o smbolos a cada una de las diferentes categoras en las cuales podemos dividir el carcter que observamos, sin que puedan establecerse relaciones entre dichas categoras, a no ser el de que cada elemento pueda pertenecer a una y solo una de estas categoras. Se trata de agrupar objetos en clases, de modo que todos los que pertenezcan a la misma sean equivalentes respecto del atributo o propiedad en estudio, despus de lo cual se asignan nombres a tales clases, y el hecho de que a veces, en lugar de denominaciones, se le atribuyan nmeros, puede ser una de las razones por las cuales se le conoce como "medidas nominales". Por ejemplo, podemos estar interesados en clasificar los estudiantes de la UNESR Ncleo San Carlos de acuerdos a la carrera que cursan. Carrera Educacin Administracin Nmero asignada a la categora 1 2

Se ha de tener presente que los nmeros asignados a cada categora sirven nica y exclusivamente par identificar la categora y no poseen propiedades cuantitativas.

Escala Ordinal: En caso de que puedan detectarse diversos grados de un atributo o propiedad de un objeto, la medida ordinal es la indicada, puesto que entonces puede recurrirse a la propiedad de "orden" de los nmeros asignndolo a los objetos en estudio de modo que, si la cifra asignada al objeto A es mayor que la de B, puede inferirse que A posee un mayor grado de atributo que B. La asignacin de nmeros a las distintas categoras no puede ser completamente arbitraria, debe hacerse atendiendo al orden existente entre stas.

166

PROBABILIDAD Y ESTADISTICA
Los caracteres que posee una escala de medida ordinal permiten, por el hecho mismo de poder ordenar todas sus categoras, el clculo de las medidas estadsticas de posicin, como por ejemplo la mediana. Ejemplo:

Al asignar un nmero a los pacientes de una consulta mdica, segn el orden de llegada, estamos llevando una escala ordinal, es decir que al primero en llegar ordinal, es decir que al primeo en llegar le asignamos el n 1, al siguiente el n 2 y as sucesivamente, de esta forma, cada nmero representar una categora en general, con un solo elemento y se puede establecer relaciones entre ellas, ya que los nmeros asignados guardan la misma relacin que el orden de llegada a la consulta.

Escalas de intervalos iguales: la escala de intervalos iguales, est caracterizada por una unidad de medida comn y constante que asigna un nmero igual al nmero de unidades equivalentes a la de la magnitud que posea el elemento observado. Es importante destacar que el punto cero en las escalas de intervalos iguales es arbitrario, y no refleja en ningn momento ausencia de la magnitud que estamos midiendo. Esta escala, adems de poseer las caractersticas de la escala ordinal, encontramos que la asignacin de los nmeros a los elemento es tan precisa que podemos determinar la magnitud de los intervalos (distancia) entre todos los elementos de la escala. Sin lugar a dudas, podemos decir que la escala de intervalos es la primera escala verdaderamente cuantitativa y a los caracteres que posean esta escala de medida pueden calculrsele todas las medidas estadsticas a excepcin del coeficiente de variacin. Ejemplo:

El lapso transcurrido entre 1998-1999 es igual al que transcurri entre 2000-2001.

Escala de coeficientes o Razones:

El nivel de medida ms elevado es el de cocientes o razones, y se diferencia de las escalas de intervalos iguales nicamente por poseer un punto cero propio como origen; es decir que el valor cero de esta escala significa ausencia de la magnitud que estamos midiendo. Si se observa una carencia total de propiedad, se dispone de una unidad de medida para el efecto. A iguales diferencias entre los nmeros asignados corresponden iguales diferencias en el grado de atributo presente en el objeto de estudio. Adems, siendo que cero ya no es arbitrario, sino un valor absoluto, podemos decir que A. Tiene dos, tres o cuatro veces la magnitud de la propiedad presente en B. Ejemplo:

166

PROBABILIDAD Y ESTADISTICA

En una encuesta realizada en un barrio de esta localidad se observ que hay familias que no tienen hijos, otras tienen 6 hijos que es exactamente el doble de hijos que aquellas que tienen 3 hijos.

Las variables y su medicin:

Una variable es un smbolo, tal como X, Y, H, x B, que pueden tomar un conjunto prefijado de valores, llamado dominio de esa variable. Para Murray R. Spiegel (1991) "una variable que puede tomar cualquier valor entre dos valores dados se dice que es una variable continua en caso contrario diremos que la variable es discreta". Las variables, tambin llamadas caracteres cuantitativos, son aquellas cuyas variaciones son susceptibles de ser medidas cuantitativamente, es decir, que pueden expresar numricamente la magnitud de dichas variaciones. Por intuicin y por experiencia sabemos que pueden distinguirse dos tipos de variables; las continuas y las discretas

Las variables continuas se caracterizan por el hecho de que para todo para de valores siempre se puede encontrar en valor intermedio, (el peso, la estatura, el tiempo empleado para realizar un trabajo, etc.) Una variable es continua, cuando puede tomar infinitos valores intermedios dentro de dos valores consecutivos. Por ejemplo, la estatura, el peso, la temperatura. Para ver el grfico seleccione la opcin "Descargar" del men superior

Ejemplo:

En el preescolar Blanca de Prez, ubicado en la urbanizacin Monseor Padilla de esta ciudad se procedi a recoger las medidas de talla y peso de los nios que a este asisten. Nio Peso Talla Jos 18,300 1,15 Julio 20,500 1,20 Pedro 19,000 1,10 Luis 18,750 1,18

166

PROBABILIDAD Y ESTADISTICA
.Las variables discretas sern aquellas que pueden tomar solo un nmero limitado de valores separados y no continuos; son aquellas que solo toman un determinado nmeros de valores, porque entre dos valores consecutivos no pueden tomar ningn otro; por ejemplo el nmero de estudiantes de una clase es una variable discreta ya que solo tomar los valores 1, 2, 3, 4... ntese que no encontramos valor como 1,5 estudiantes UNIDAD III Estadsticas Primarias Datos Estadsticos:

Los datos estadsticos no son otra cosa que el producto de las observaciones efectuadas en las personas y objetos en los cuales se produce el fenmeno que queremos estudiar. Dicho en otras palabras, son los antecedentes (en cifras) necesarios para llegar al conocimiento de un hecho o para reducir las consecuencias de este. Los datos estadsticos se pueden encontrar de forma no ordenada, por lo que es muy difcil en general, obtener conclusiones de los datos presentados de esta manera. Para poder obtener una precisa y rpida informacin con propsitos de descripcin o anlisis, estos deben organizarse de una manera sistemtica; es decir, se requiere que los datos sean clasificados. Esta clasificacin u organizacin puede muy bien hacerse antes de la recopilacin de los datos. Ejemplo: Si se quiere conocer las caractersticas de los estudiantes del Ncleo San Carlos de la UNESR, que solicitan prstamo a la biblioteca de dicha Universidad, la recoleccin de la informacin debe clasificar a cada estudiante sobre la base de: Carrera que estudia, edad, semestre de estudios, etc. Vemos pues que la clasificacin marca la pauta de la clase de datos que debe ser obtenido.

Clasificacin de los datos

Los datos estadsticos pueden ser clasificados en cualitativos, cuantitativos, cronolgicos y geogrficos.

Datos Cualitativos: cuando los datos son cuantitativos, la diferencia entre ellos es de clase y no de cantidad. Ejemplo: Si deseamos clasificar los estudiantes que cursan la materia de estadstica I por su estado civil, observamos que pueden existir solteros, casados, divorciados, viudos.

166

PROBABILIDAD Y ESTADISTICA
Datos cuantitativos: cuando los valores de los datos representan diferentes magnitudes, decimos que son datos cuantitativos. Ejemplo: Se clasifican los estudiantes del Ncleo San Carlos de la UNESR de acuerdo a sus notas, observamos que los valores (nota) representan diferentes magnitudes.

Datos cronolgicos: cuando los valores de los datos varan en diferentes instantes o perodos de tiempo, los datos son reconocidos como cronolgicos. Ejemplo: Al registrar los promedios de notas de los Alumnos del Ncleo San Carlos de la UNESR en los diferentes semestres. Datos geogrficos: cuando los datos estn referidos a una localidad geogrfica se dicen que son datos geogrficos. Ejemplo El nmero de estudiantes de educacin superior en las distintas regiones del pas. Fuentes de datos Estadsticos:

Los datos estadsticos necesarios para la comprensin de los hechos pueden obtenerse a travs de fuentes primarias y fuentes secundarias.

Fuentes de datos primarias: es la persona o institucin que ha recolectado directamente los datos.

Fuentes secundarias: son las publicaciones y trabajos hechos por personas o entidades que no han recolectado directamente la informacin. Las fuentes primarias ms confiables, son las efectuadas por oficinas gubernamentales encargadas de tal fin. En la prctica, es aconsejable utilizar fuentes de datos primarias y en ltima instancia cuando estas no existan, usar estadsticas de fuentes secundarias. Con este ltimo tipo no debemos pasar por alto que la calidad de las conclusiones estadsticas dependen en grado sumo de la exactitud de los datos que se recaben. De anda servira usar tcnicas estadsticas precisas y refinadas para llegar a conclusiones valederas, si estas tcnicas no son aplicadas a datos adecuados o confiables. Cuando un investigador quiere obtener datos estadsticos relativo a un estudio que desea efectuar, puede elegir entre una fuente primaria o en su defecto, una secundaria. O recopilar los datos por s mismo. La posibilidad mencionada en ltimo termino podr deberse bien a la

166

PROBABILIDAD Y ESTADISTICA
inexistencia de los datos o bien a que esto no se encuentran discriminados en la forma requerida. Ejemplo: Si un investigador quiere conocer el nmero de alumnos repitientes en educacin media, clasificados por ciclos, para los ltimos diez aos, el investigador puede usar una fuente primaria, tal como la memoria y cuenta el Ministerio de Educacin cada ao. Mtodo para la recoleccin de datos:

En estadstica se emplean una variedad de mtodos distintos para obtener informacin de los que se desea investigar. Discutiremos aqu los mtodos ms importantes, incluyendo las ventajas y limitaciones de estos. La entrevista personal: los datos estadsticos necesarios para una investigacin, se renen frecuentemente mediante un proceso que consiste en enviar un entrevistador o agente, directamente a la persona investigada. El investigador efectuar a esta persona una serie de preguntas previamente escritas en un cuestionario o boleta, donde anotar las respuestas correspondientes. Este procedimiento que se conoce con el nombre de entrevista personal, permite obtener una informacin ms veraz y completa que la que proporcionan otros mtodos, debido a que al tener contacto directo con la persona entrevistada, el entrevistador podr aclarar cualquier duda que se presente sobre el cuestionario o investigacin. Otra ventaja es la posibilidad que tienen los entrevistadores de adaptar el lenguaje de las preguntas al nivel intelectual de las personas entrevistadas. Una de las desventajas de este mtodo se debe a que si el entrevistador no obra de buena f o no tiene un entrenamiento adecuado, puede alterar las respuestas por las personas entrevistadas. Otra desventaja es su alto costo, ya que resulta bastante oneroso el entrenamiento de los agentes o entrenadores y los supervisores de estos, sobre todo si se trata de una investigacin extensa. Cuestionarios por correo: consiste en enviar por correo el cuestionario acompaado por el instructivo necesario, dando en este no solo las instrucciones pertinentes para cada una de las preguntas, sino tambin una breve explicacin del objeto de la encuesta con el fin de evitar interpretaciones errneas. Una de las ventajas es que tienen un costo muy inferior al anterior procedimiento, puesto que no hay que incluir gastos de entrenamiento de personal, el nico gasto sera el de franqueo postal. Dentro de las desventajas de este procedimiento podemos sealar que solo un porcentaje bastante bajo de estos es devuelto, en algunos casos no estamos seguros de que los formularios hayan sido recibidos por sus destinatarios y que hayan sido respondido por ellos mismos. Lo que trae como consecuencia que la informacin se obtenga con una serie de errores difciles de precisar por el investigador. Entrevista por telfono: como lo indica su nombre, este mtodo consiste en telefonear a la persona a entrevistar y hacerle una serie de preguntas. Este mtodo es bastante simple y econmico, ya que el entrenamiento y supervisin de las personas encargadas de efectuar las preguntas es siempre fcil.

166

PROBABILIDAD Y ESTADISTICA
Entre las limitaciones que presenta este mtodo podemos sealar el nmero de preguntas que pueden formularse es relativamente limitado; adems las investigaciones efectuadas por este mtodo tienen un carcter selectivo, debido a que muchas de las personas que potencialmente podran ser investigadas no posee servicio telefnico, por lo que quedan sin la posibilidad de ser entrevistados. Instrumentos para la recoleccin de datos: Cuestionarios:

Cualquiera que sea el mtodo por el que se decida el investigador para recabar informacin, es necesario elaborar un estudio de preguntas. Los cuestionarios en general, constan de las siguientes partes:

a.

b. La identificacin del cuestionario : nombre del patrocinante de la encuesta, (oficial o privada), nombre de la encuesta, nmero del cuestionario, nombre del encuestador, lugar y fecha de la entrevista. c. Datos de identificacin y de carcter social del encuestado: apellidos, nombres, cdula de identidad, nacionalidad, sexo, edad o fecha de nacimiento, estado civil, grado de instruccin, ocupacin actual, ingresos, etc.

d. Datos propios de la investigacin, son los datos que interesa conocer para construir el propsito de la investigacin. Como es natural, estas partes, as como las preguntas, varan de acuerdo a la finalidad de la encuesta. En algunos tipos de investigacin, la parte referente a los datos personales es eliminada por no tener ningn tipo de inters para el estudio.

Consideraciones que debemos tomar en cuenta:

El cuestionario debe ser conciso; tratar en los posible de que con el menor nmero de preguntas, se obtenga la mejor informacin. Claridad de la redaccin; evitar preguntas ambiguas o que sugieran respuestas incorrectas, por lo que deben estar formuladas las preguntas de la forma ms sencilla. Discrecin: un cuestionario hecho a conciencia, no debe tener preguntas indiscretas o curiosas, sobre datos personales que puedan ofender al entrevistado. Facilidad de contestacin: se deben evitar, en lo posible, las preguntas de respuestas libres o abiertas y tambin la formulacin de preguntas que requieran clculos numricos por parte del entrevistado. Orden de las preguntas: estas deben tener una secuencia y un orden lgico, agruparlas procurando que se relacionen unas con otras.

Series o distribuciones estadsticas:

166

PROBABILIDAD Y ESTADISTICA

Anteriormente hemos sealado que la estadstica, no se encarga del estudio de un hecho aislado, sino que tienen por objeto de los colectivos. Pues bien cuando se realiza una investigacin se obtiene una masa de datos que deben ser organizados para disponerlos en un orden, arreglo o secuencia lgica, con el fin de facilitar el anlisis de los mismos esta coleccin de datos numricos obtenidos de la observacin, que se clasifican y ordenan segn un determinado criterio, se denominan "series estadsticas", tambin conocidas como "distribucin estadstica". Clasificacin de las series estadsticas:

1.

2. Series temporales o cronolgicas ; estas se definen como una masa o conjunto de datos producto de la observacin de un fenmeno individual o colectivo, cuantificable en sucesivos instantes o periodos de tiempo. Ejemplo: Produccin nacional de madera en Rola en m Rollizos (periodo 1993 1998) Aos 1993 1994 1995 1996 1997 1998 Produccin (m rollizos) 1.161.061,454 981.668,626 1.087.926,142 1.440.306,250 1.618.075,000 1.027.177,876

Fuente: MARN D.G.S Recurso Forestal. 1999 CVG PROFORCA Es importante resaltar que cuando se trata de series temporales o cronolgicas, se debe especificar el instante o el periodo de tiempo a los que se refieren los caracteres en estudio. Cuando nos referimos a instantes de tiempo, por el hecho de que la observacin se hace en un momento especfico de tiempo. Ejemplo: Plantaciones forestales ejecutadas a nivel nacional, al 31 de diciembre de cada ao entre 1997 2001. 3. Series atemporales; cuando las observaciones de un fenmeno se hacen referidas al mismo instante o intervalo de tiempo, nos encontramos ente una serie atemporal. Aqu el tiempo no va incluido a cada observacin, puesto que es el mismo tiempo para todas ellas. Este tipo de observacin proporciona una "visin instantnea" de los fenmenos o caracteres de los componentes del colectivo en estudio. Ejemplo:

166

PROBABILIDAD Y ESTADISTICA
Las notas de las participantes en la materia de estadstica I en el periodo acadmico que termin en septiembre del 2001. 2.1) series de frecuencia; cuando realizamos un estudio de cada uno de los elementos que componen la poblacin o muestra bajo anlisis, observamos que en general, hay un nmero de veces en que aparece repetido un mismo valor de una variable, o bien repeticiones de la misma modalidad de un atributo. Este nmero de repeticiones de un resultado, recibe el nombre de frecuencia absoluta o simplemente frecuencia. El procedimiento mediante el cual se realiza el conteo, para as determinar el nmero de veces que cada dato se repite, recibe el nombre de tabulacin. Ejemplo: Consideremos las edades de 20 nios, pertenecientes al Preescolar Blanca de Prez, ubicado en la urbanizacin Monseor Padilla

5 6 3 4

6 3 4 3

5 4 6 6

4 5 5 4

3 4 3 6

Tabulando los datos tenemos Nios distribuidos por edades:

Edad (variable) 3 4 5 6 Total =

N de nios (Frecuencia) 5 6 4 5 20

Al agrupar los resultados de las observaciones en trmino de las veces que stos se repiten, da lugar a las llamadas "series de frecuencias" o distribuciones de frecuencias; las cuales se dividen a su vez en series de frecuencia cualitativas y cuantitativas, segn que los caracteres de estudio se refieran a atributos o variables respectivamente. 2.2.1) Series de frecuencia acumulativa: son comnmente llamadas series de frecuencia de atributos o caracteres cualitativos y las formas de representar un atributo recibe el nombre de modalidades. Cuando se observan y se obtienen los elementos que deseamos estudiar con respecto a un carcter de tipo cualitativo y se procede a agruparlos segn las distintas modalidades que toma el atributo, "frecuencia cualitativa". Ejemplo:

166

PROBABILIDAD Y ESTADISTICA

Agrupamos los resultados obtenidos al observar los 35 estudiantes de la materia estadstica I, respecto a su estado civil. Estudiantes de la materia Estadsticas I, clasificados por su estado civil. Estado civil Solteros Casados Viudos Divorciados N de Estudiantes (frecuencia) 18 12 1 4

2.1.2) Series de frecuencias cualitativas : es el resultado del agrupamiento de los valores que se repiten (frecuencia) al ser observada una variable. Ejemplo:

Tomamos nuevamente los 35 estudiantes de la materia estadstica I, respecto a su edad.

Edad (en aos) 19 20 25 28 32 42 Total =

N de estudiantes (frecuencia) 12 2 8 6 4 3 35

2.2) series especiales o geogrficas: es aquella que est formada por los valores que toman una variable en funcin del espacio geogrfico.

166

PROBABILIDAD Y ESTADISTICA

ORGANIZACION Y PRESENTACION DE DATOS


Presentaciones en tablas:

Primero definir que es una tabla para luego trabajar las diferentes clases de tablas pedidas:

Una tabla es un cuadro que consiste en la disposicin conjunta, ordenada y normalmente totalizada, de las sumas o frecuencias totales obtenidos en la tabulacin de los datos, referentes a las categoras o dimensiones de una variable o de varias variables relacionadas entre s. Las tablas sistematizan los resultados cuantitativos y ofrecen una visin numrica, sinttica y global del fenmeno observado y de las relaciones entre sus diversas caractersticas o variables. En ella, culmina y se concreta definitivamente la fase clasificatoria de la investigacin cuantitativa. Teniendo la definicin de lo que es una tabla, podemos trabajar entonces cada uno de los tipos de tablas pedidos: Tabla de entrada de datos: Es una tabla en la cual solo aparecen los datos que se obtuvieron de la investigacin cientfica o del experimento. Es la tabla ms sencilla y se utiliza cuando no se necesita mayor informacin acerca de los datos, estas tablas se construyen por medio de la tabulacin de los datos, este procedimiento es relativamente sencillo, para realizarlo nos ocupamos de un conjunto de datos estadsticos obtenidos al registrar los resultados de una serie de n repeticiones de algn experimento u observacin aleatoria, suponiendo que las repeticiones son mutuamente independientes y se realizan en condiciones uniformes, es importante decir que el resultado de cada observacin puede expresarse de forma numrica, para este tipo de tablas de entrada de datos se puede trabajar con una mas variables, de manera que nuestro material estadstico consiste en n valores observados de la variable Xj.

Los valores observados se suelen registrar, en primer lugar en una lista, si l numero de observaciones no excede de 20 30, estos datos se registran en orden creciente de magnitud. Con los datos de esta tabla pueden hacerse diversas representaciones grficas y calcularse determinadas caractersticas numricas como la media, la mediana,etc. EJ: Agrupar en una tabla de datos

10, 1, 6, 9, 2, 5, 7, 4, 3, 8

X 1 2 3 4 5 6 7 8 9 1

166

PROBABILIDAD Y ESTADISTICA
0

Tablas de frecuencias: Una tabla de frecuencia esta formada por las categoras o valores de una variable y sus frecuencias correspondientes. Esta tabla es lo mismo que una distribucin de frecuencias. Esta tabla se crea por medio de la tabulacin y agrupacin, la cual es un mtodo sencillo como lo habamos empezado a ver en la tabla de datos, Se realiza el mismo procedimiento de tabulacin anteriormente descrito si el numero de valores observados para la variable, se trabaja con una sola variable, descontando los repetidos son pequeos, si existen repetidos la frecuencia f es el numero de repeticiones de un valor de X dado, Sin embargo, cuando el conjunto de datos es mayor, resulta laborioso trabajar directamente con los valores individuales observados y entonces se lleva a cabo, por lo general, algn tipo de agrupacin como paso preliminar, antes de iniciar cualquier otro tratamiento de los datos. Las reglas para proceder a la agrupacin son diferentes segn sea la variable, discreta o continua, para una variable discreta suele resultar conveniente hacer una tabla en cuya primera columna figuren todos los valores de la variable X representados en el material, y en la segunda, la frecuencia f con que ha aparecido cada valor de X en las observaciones.

Para una variable continua, el procedimiento de agrupacin es algo ms complicado. Se toma un intervalo adecuado sobre el eje de la variable que contenga los n valores observados, y divdase el intervalo en cierto numero de intervalos de clase. Todas las observaciones que pertenecen al mismo intervalo de clase se agrupan y cuentan, y l numero que resulte representa la frecuencia de clase correspondiente a dicho intervalo, luego se forma una tabla, en cuya primera columna figuran los limites de cada intervalo de clase, y en la segunda aparecen las correspondientes frecuencias. Estas clases de tablas son las mas usadas y brindan mayor informacin de los datos que las tablas de entradas de datos, efectivamente, una tabla de este tipo dar en forma abreviada, una informacin completa acerca de la distribucin de los valores observados. Con estas se pueden utilizar mas a fondo los mtodos grficos al igual que los mtodos aritmticos. Ej: Agrupar en una tabla 1, 1, 2, 2, 2, 2, 3, 3, 3, 4, 5

X 1 2 3 4 5

F 2 4 3 1 1

11
Agrupar en una tabla las siguientes estaturas: 160, 168, 175, 183, 170, 164, 170, 184, 171, 168, 187, 161, 183, 175, 185, 186, 187, 164, 165, 175, 162, 188, 169, 163, 166, 172, 173, 167, 174, 176, 178, 179, 177

166

PROBABILIDAD Y ESTADISTICA
160-165 265-270 170-175 175-180 180-185 185-190 6 6 6 7 3 5

33

Tablas de doble entrada: Tambin llamadas tablas de contingencias, son aquellas tablas de datos referentes a dos variables, formada, en las cabeceras de las filas, por las categoras o valores de una variable y en las de las columnas por los de la otra, y en las casillas de la tabla, por las frecuencias o numero de elementos que renen a la vez las dos categoras o valores de las dos variables que se cruzan en cada casilla. Para la tabulacin de un material agrupado de observaciones simultaneas de dos variables aleatorias necesitaremos una tabla descrita como anteriormente lo describimos, las reglas para agrupar son las mismas que en el caso de una sola variable.

Este tipo de tablas brindan informacin estadstica de dos eventos relacionados entre s, es til en casos en los cuales los experimentos son dependientes de otro experimento, mas adelante aparecen mas aplicaciones del anlisis estadstico bivariable.

Ej: T1/T 2 S NO S 12 10 NO 2 4

Mtodos grficos:

Los resultados de los estudios deben presentarse en forma clara y correcta a fin de que puedan utilizarse adecuadamente. Este trabajo da algunas definiciones y explica procedimientos para la presentacin grfica de la informacin (grficos ms comunes) de acuerdo a lineamientos reconocidos internacionalmente, ya que con frecuencia se cometen errores y los grficos estn mal confeccionados. Permite al lector mejorar la presentacin del contenido cientfico. Se ponen ejemplos de grficos elaborados de forma sencilla en las aplicaciones de Microsoft Office, como usualmente lo hacen las personas no expertas. Palabras clave: grfico, barras, frecuencias, variable

166

PROBABILIDAD Y ESTADISTICA
En muchas ocasiones la informacin proporcionada en una tabla es tan singular o importante que se decide presentar esos resultados de forma grfica. Cuando se decide utilizar el grfico, este sustituye a la tabla, no la complementa. Por ello no se deben tener tantos grficos como tablas. Como se presenta slo uno de los dos, se acostumbra reflejar la informacin numrica en el grfico para que no sea necesaria la tabla correspondiente. Incluso, un nmero innecesariamente grande de grficos le puede restar lucidez al trabajo en lugar de proporcionarle calidad o rigor cientfico. Se debe lograr un balance entre estas dos formas de presentacin de resultados . El objetivo bsico de un grfico es transmitir la informacin de forma tal que pueda ser captada rpidamente, de un golpe de vista. Luego, un grfico debe ser ante todo sencillo y claro, a pesar de su aspecto artstico, ya que se elabora para ser incluido en un trabajo cientfico. Existen mltiples tipos de grficos, pero aqu trataremos solamente de los usados ms frecuentemente, que son: grfico de barras simples, grfico de sectores o circular (pastel), grfico de barras mltiples, grfico de barras compuestas, histograma, polgono de frecuencias, grfico de frecuencias acumuladas y grfico aritmtico simple. Tambin haremos una breve referencia a otros tipos de grfico utilizados en ciertos temas del campo de la Medicina, como son los grficos semilogartmicos, los probabilsticos y los logsticos .

OBJETIVO Explicar los elementos bsicos necesarios a tener en cuenta para realizar una correcta representacin grfica de los datos.

DESARROLLO Veamos primeramente algunos principios comunes en la construccin de grficos: En su gran mayora los grficos se inscriben en un sistema de ejes coordenados, siendo el circular o de sectores una excepcin. En uno de los ejes se representan las frecuencias observadas o los valores calculados a partir de los datos, mientras que en el otro se representa el criterio principal de clasificacin (que aparece en el taln de la tabla correspondiente). La escala relativa al eje donde se representan frecuencias debe comenzar en cero. De ser necesario, se puede interrumpir 'adecuadamente' la escala. Decimos adecuadamente porque la forma de realizar esa ruptura depende del tipo de grfico. La longitud de un eje debe ser, aproximadamente, entre una vez y una vez y media la del otro. Esta proporcionalidad es importante, pues garantiza la comparabilidad entre grficos. Cada eje debe ser rotulado, es decir, indicar que representa, y en caso de que corresponda, la

166

PROBABILIDAD Y ESTADISTICA
unidad de medida usada. Un grfico no debe sobrecargarse de lneas o cifras, el solo da la idea general del fenmeno, pues los detalles estn representados en la tabla correspondiente

Componentes

de

un

grfico.

Un grfico, al igual que una tabla, est compuesto de las partes siguientes: a.Identificacin del grfico. b.Ttulo del grfico. c.- Cuerpo del grfico o grfico propiamente dicho (incluye la clave o leyenda de ser necesaria esta). d.- Pie del grfico. Las caractersticas de estos componentes, salvo el grfico propiamente dicho, son las mismas de dichos componentes en la tabla o cuadro estadstico, as que no insistiremos en ellas y pasaremos directamente a discutir la construccin de los diferentes tipos de grficos. Debemos hacer una aclaracin antes de continuar. En la actualidad es muy infrecuente encontrar un grfico hecho a mano. Generalmente se emplean sistemas graficadores de microcomputadoras. Esto no invalida la necesidad de conocer las reglas y convenciones establecidas con respecto a la confeccin de los mismos. Dada la enorme libertad que brindan algunos de esos sistemas, en ms de una oportunidad hemos visto grficos confeccionados por estos medios que presentan errores, entre otras cosas, por seleccionar un tipo de grfico no adecuado para la informacin que se desea representar

3.- Diferentes tipos de grficos.

a) Grfico de barras simples. Se usa fundamentalmente para representar distribuciones de frecuencias de una variable cualitativa o cuantitativa discreta y, ocasionalmente, en la representacin de series cronolgicas o histricas. Uno de los ejes sirve para inscribir las frecuencias, ya sean absolutas o relativas (%), y el otro para la escala de clasificacin utilizada. Un ejemplo de este tipo de grfico es el que se presenta a continuacin:

Cada clase se representa con una barra o rectngulo cuya altura (si el eje de frecuencias es el vertical) resulta proporcional a la frecuencia que representa. Todas las barras deben tener el mismo grosor y el espacio entre barras debe ser el mismo, teniendo un ancho de 0,5 a 1 vez el de las barras.

166

PROBABILIDAD Y ESTADISTICA
El orden de las barras en el grfico debe ser el mismo que en la tabla que le sirve de fuente. Por ello, si no existe un criterio 'a priori' de orden entre las clases establecidas, pueden ordenarse las mismas (y, como es lgico, las barras en el grfico) en orden ascendente o descendente de las frecuencias, para facilitar la interpretacin de esos resultados.

b) Grfico circular, de sectores o pastel. El grfico siguiente es un ejemplo tpico de grfico circular (confeccionado con los mismos valores del grfico anterior):

Se usa, fundamentalmente, para representar distribuciones de frecuencias relativas (%) de una variable cualitativa o cuantitativa discreta. En este grfico se hace corresponder la medida del ngulo de cada sector con la frecuencia correspondiente a la clase en cuestin. Si los 360 del crculo representan el 100 % de los datos clasificados, a cada 1% le correspondern 3,6. Luego, para obtener el tamao del ngulo para un sector dado bastara con multiplicar el por ciento correspondiente por 3,6 (por simple regla de tres). Mediante un sector circular se representan las medidas angulares correspondientes a las diferentes categoras, respetando el orden establecido en la tabla, partiendo de un punto dado de la circunferencia. Ese punto dado generalmente es el punto ms alto de la circunferencia (12 en el reloj). Si lo que se representa en cada sector no puede colocarse dentro del mismo, se elabora una leyenda o se coloca fuera, adyacente al mismo. Se acostumbra a diferenciar los sectores con tramas o colores diferentes, lo que hace que resulte un grfico ms vistoso que el de barras simples.

c)

Grfico

de

barras

mltiples.

Se usa para representar las frecuencias observadas en clasificaciones dobles, es decir, cuando son dos los criterios de clasificacin, para variables cualitativas o cuantitativas discretas. Su forma de construccin es similar a la del grfico de barras simples, slo que en este caso se

166

PROBABILIDAD Y ESTADISTICA
representan dos variables. El hecho de ser doble, triple, cudruple, etc., parte del nmero de clases que tenga la variable, que no es el criterio principal de clasificacin. Las barras que integran una barra mltiple se colocan juntas o ligeramente solapadas. Veamos un ejemplo de este tipo de grfico:

Este es un grfico de barras triples. En la leyenda aparece el criterio de clasificacin que complementa al que aparece en el eje de categoras. Note la separacin entre los tros de barras.

d) Grfico de barras compuestas. Su objetivo es la representacin de las frecuencias relativas (%) observadas en clasificaciones dobles, es decir, cuando son dos los criterios de clasificacin, para variables cualitativas o cuantitativas discretas. Su forma de construccin es la siguiente: cada barra representa el 100 % de los individuos en cada clase del criterio principal de clasificacin y se divide, proporcionalmente, en los por cientos correspondientes a las clases del otro criterio de clasificacin. Como es lgico, las diferentes partes en que se dividen las barras compuestas se diferencian con tramas o colores diferentes.

166

PROBABILIDAD Y ESTADISTICA

e) Histograma. Este grfico se usa para representar una distribucin de frecuencias de una variable cuantitativa continua. Habitualmente se representa la frecuencia observada en el eje Y, y en el eje X la variable. La escala del eje correspondiente a la variable se rotula con los lmites inferiores de notacin de las clases consideradas y se agrega al final el que le correspondera a una clase subsiguiente inexistente. En este caso, las frecuencias deben resultar proporcionales no a la altura de las barras, sino al rea de las mismas, lo que significa que la obtencin de las alturas de las barras resulta un poco ms compleja que en los grficos anteriores. Adems, las barras van contiguas y no separadas, por la naturaleza continua de la variable de clasificacin. Para lograr la proporcionalidad entre la frecuencia y el rea de la barra que esta representa el procedimiento es el siguiente: sabemos que el rea de un rectngulo es el producto de la base por la altura y que la base de una barra en el grfico es, precisamente, la amplitud del intervalo de clase, luego la formulacin de esa 'proporcionalidad' sera: frecuencia observada = amplitud del intervalo* altura de la barra Conocemos la frecuencia observada y la amplitud de cada uno de los intervalos, por tanto, para calcular las alturas de las barras slo se tendra que despejar en la frmula correspondiente, lo que quedara: altura de la barra = frecuencia observada / amplitud del intervalo Debido a la forma de obtencin de esas alturas, el eje de las frecuencias debe rotularse como nmero de individuos por unidad de medida de la variable en cuestin, por ejemplo: 'defunciones por ao de edad'; 'nmero de individuos por kg de peso; etc. El procedimiento que hemos explicado es el general, pero sucede, en el caso particular de que las amplitudes de todos los intervalos de clase sean iguales, que no es estrictamente necesario realizar estos clculos: sera dividir todas las frecuencias por una constante y eso no alterara el grfico, pues se mantendra la misma relacin de proporcionalidad entre las frecuencias. Vemoslo a travs de un ejemplo, cuando las amplitudes de los intervalos son iguales:

En este caso se us la frecuencia absoluta como altura de la barra. Todas las barras tienen el mismo ancho y van unidas, una a continuacin de la otra, porque estn representando una variable continua (edad).

166

PROBABILIDAD Y ESTADISTICA
Es sencillo darse cuenta de que es imposible presentar otra distribucin en ese grfico, pues unas barras podran ocultar a otras. Es decir, este tipo de grfico slo es til para presentar una distribucin.

f) Polgono de frecuencias. Se utiliza, al igual que el histograma, para representar distribuciones de frecuencias de variables cuantitativas continuas, pero como no se utilizan barras en su confeccin sino segmentos de recta, de ah el nombre de polgono. Habitualmente se usa cuando se quiere mostrar en el mismo grfico ms de una distribucin o una clasificacin cruzada de una variable cuantitativa continua con una cualitativa o cuantitativa discreta, ya que por la forma de construccin del histograma slo se puede representar una distribucin. Para su confeccin, una vez construidas y rotuladas las escalas, de manera similar a como se realiza para un histograma, los valores de alturas obtenidos se plotean sobre el punto medio o marca de clase de los intervalos correspondientes y luego se procede a unir esos puntos con segmentos de recta. Veamos un ejemplo de polgono de frecuencias:

g) Grfico de frecuencias acumuladas u ojiva. Su objetivo, al igual que el histograma y el polgono de frecuencias es representar distribuciones de frecuencias de variables cuantitativas continuas, pero slo para frecuencias acumuladas. No se utilizan barras en su confeccin, sino segmentos de recta, por ello no slo es til para representar una distribucin de frecuencias sino tambin cuando se quiere mostrar ms de una distribucin o una clasificacin cruzada de una variable cuantitativa continua con una cualitativa o cuantitativa discreta. Este es un ejemplo de una ojiva:

166

PROBABILIDAD Y ESTADISTICA

La diferencia con el polgono de frecuencia es que la frecuencia acumulada no se plotea sobre el punto medio de la clase, sino al final de la misma, ya que representa el nmero de individuos acumulados hasta esa clase. Como el valor de la frecuencia acumulada es mayor a medida que avanzamos en la distribucin, la poligonal que se obtiene siempre va a ser creciente y esa forma particular de la misma es la que ha hecho que se le d tambin el nombre de ojiva.

h) Grfico aritmtico simple. Este es uno de los ms sencillos de confeccionar. Su uso estadstico fundamental es en la representacin de series cronolgicas, y en casos particulares, como el del Crecimiento y Desarrollo Humanos, para representar los valores promedio o posicionales (medias, medianas y percentiles, que se estudiarn ms adelante) de muchas dimensiones: peso para la edad, peso para la talla y talla para la edad, entre otras. Uno de los ejes (habitualmente el horizontal) se usa para la unidad de tiempo estudiada: aos, das, etc.. En el otro eje se representa la frecuencia o el indicador calculado a partir de esos datos. En este tipo de grfico es particularmente importante la relacin de proporcionalidad entre los ejes para evitar malas interpretaciones del fenmeno que se presenta. El grfico que sigue es un ejemplo de grfico de este tipo:

166

PROBABILIDAD Y ESTADISTICA
En el mismo grfico se puede presentar ms de una serie de datos si la escala usada se adecua para todas, cuando los valores de las mismas no son extremadamente diferentes. 4.- Errores ms comunes en la confeccin de grficos. En la confeccin de un grfico se pueden cometer dos tipos de errores: errores de forma y errores de contenido. Aqu mencionaremos los que se han observado con ms frecuencia en las publicaciones cientficas. De forma: No uso de la identificacin. No aparicin de ttulo o ttulos extremadamente extensos. Ttulos que no responden a las preguntas bsicas. Grficos muy cargados y/o sumamente complejos de interpretar. Desproporcin notable entre las longitudes de los ejes. Omisin de los rtulos de los ejes y/o las unidades de medida. De contenido: Uso de grficos inadecuados dada la naturaleza de lo que se representa. Omisin de la leyenda donde se han usado claves o smbolos. No respetar alguna de las reglas establecidas para la construccin del grfico en particular. Por ejemplo, barras unidas cuando se trabaja con variable cualitativa o discreta.

5.-

Otros

tipos

de

representacin

grfica.

Existen muchos otros tipos de grficos con propsitos ms especficos que los discutidos anteriormente. Daremos una visin muy general de los mismos sin adentrarnos en las particularidades relativas a la construccin. Estos son grficos en los que, en lugar de tener escalas aritmticas en los dos ejes de coordenadas (como es el caso del grfico aritmtico simple), uno de los ejes tiene una escala especial. Esos grficos reciben los nombres de la escala especial, no aritmtica. Por ejemplo: grfico semilogartmico grfico probabilstico - grfico logstico (una escala logstica) (una (una escala escala logartmica) probabilstica)

Veamos la forma ms frecuente de uso de uno de ellos. Semilogartmico: En ocasiones, al representar series cronolgicas para comparar, resulta que los valores de las diferentes series pueden diferir grandemente y eso hace prcticamente imposible el uso del Grafico aritmtico simple, pues deben aparecer en la escala del eje Y valores que pueden estar 'muy distantes' entre s. La solucin es usar una escala logartmica en dicho eje y as pueden colocarse todos los datos sin alterar seriamente sus

166

PROBABILIDAD Y ESTADISTICA
comportamientos, de modo tal que las comparaciones sean vlidas. Vemoslo con un ejemplo:

El eje correspondiente a las tasas es un eje logartmico, para poder representar nmeros de magnitudes tan diferentes al unsono. Tambin hay formas de presentacin grfica que no son grficos propiamente dichos. Al menos, no de los tipos que hemos visto. Esas presentaciones pueden ser: Mapas con localizaciones especficas dando informacin sobre el tema de que se trate. Por ejemplo, dando colores o intensidades diferentes a las distintas zonas geogrficas en funcin del grado de afectacin por el fenmeno en estudio. Fotos. Esquemas. Organigramas, etc.

Nota complementaria: Sobre los grficos basados en barras (barras simples, mltiples, etc) existe la prohibicin de cortar el eje de las frecuencias (nmero de casos, por cientos, etc). Para el resto se autoriza el corte de cualesquiera de los ejes, siempre y cuando este no interrumpa el trazado. Esto nos ayuda a reducir el grfico slo al rea del sistema de ejes coordenados entre cuyos valores se mueven los datos a graficar.

CONCLUSIONES 1-Los grficos se reciben con agrado por parte de los editores y lectores, pero la apariencia es lo menos importante, el objetivo de la presentacin grfica es mejorar la presentacin del contenido cientfico.

2-Si el contenido de los resultados se puede hacer de forma textual, no se recomienda la presentacin grfica, ya que eleva los costos de publicacin.

3- El objetivo bsico de un grfico es transmitir la informacin de forma tal que pueda ser captada rpidamente, de un golpe de vista, un grfico debe ser ante todo sencillo y claro, a pesar de su aspecto artstico, ya que se elabora para ser incluido en un trabajo cientfico

166

PROBABILIDAD Y ESTADISTICA

DISTRIBUCION DE DATOS ESTADISTICOS


Tablas de frecuencias.

El manejo de la informacin requiere de la ordenacin de datos de tal forma que permita la obtencin de una forma ms fcil la obtencin de conclusiones acerca de la muestra. Una primera ordenacin se realiza mediante el manejo de tablas, en las que se ordenan los datos de acuerdo a ciertas caractersticas de los datos.

El manejo de datos discretos permite la manipulacin de tablas, sobre todo cuando el nmero de datos no es muy reducido. A continuacin describiremos la manipulacin de datos mediante el manejo de datos discretos y continuos. Las variables a ser manejadas en el estudio, en el caso de valores discretos, se puede representar mediante una tabla en la que se representa los variables mediante variables con nombre como (xi) y el nmero de veces en que un dato se representara mediante frecuencias, frecuencias absolutas, frecuencias relativas. La representacin de esta tabla mediante frecuencias se le conoce como tabla estadstica cuya funcin es la determinar la frecuencia de cada clase las cuales aparecen a un lado de cada clase.

La representacin generalmente se da como sigue:

Variable (Xi) X1 X2 X3 . .

Frecuencias simples y relativas Frecuencia f(xi) Frecuencia relativa (el nmero veces ni que se repite Xi ) f(X1 )= n1 f(X2 )= n2 f(X3 )= n3 . . f(xi)/N= ni/N f(X1 )/N= n1/N f(X2 )/N= n2/N f(X3 )/N= n3/N . .

166

PROBABILIDAD Y ESTADISTICA

. . Xn-1 Xn

. . f(Xn-1 ) = nn-1 f(Xn)= nn

. . f(Xn-1 )/N= nn-1/N f(Xn)/N= nn/N

Un ejemplo de clasificacin de datos.

Se presenta una tabla que muestra las calificaciones obtenidas en un examen de matemticas, y a su lado se presenta el nmero de alumnos que obtuvieron esas calificaciones.

Frecuencias simples y relativas Frecuencia f(xi) =f i frecuencia absoluta Frecuencia relativa h(xi)

Variable (Ci) C i= calificaciones obtenidas

(El nmero veces que se (El nmero veces que se repite Xi ) repite Xi ) h(xi) = f(xi)/n

10 9 8 7 6 5 4 3 2 1

1 3 2 3 4 2 1 2 1 1

1/20 3/20 2/20 3/20 4/20 2/20 1/20 2/20 1/20 1/20

En el caso de las variables continuas se debe de dividir los intervalos en los que debe de distribuirse la informacin, en este caso existen varios criterio sobre los que debemos de plantear la distribucin. Uno de ellos, de los ms comunes, consiste en determinar la cantidad de parmetros.

166

PROBABILIDAD Y ESTADISTICA

Dentro de las frecuencias que aparecen en las tablas, las ms comunes, son frecuencia absoluta, la frecuencia absoluta acumulada y la frecuencia relativa.

La frecuencia absoluta f(xi) se determina como el nmero de veces que se repite un dato xi.

La frecuencia absoluta acumulada Fi: Para un determinado valor se considera como la frecuencia de cada dato xi mas la suma de los valores anteriores a dicha suma.

donde son el numero de datos acumulados de las clases anteriores

La frecuencia relativa hi : es el cociente hi =fi/N , en algunas ocasiones se representa como ni/N, donde N es el nmero total de datos, corresponde a la suma de todas la frecuencias individuales de cada clase, y ni o fi los datos en cada clase. Las frecuencias relativas representan el porciento de veces en que ocurre un dato. Como veremos en teora de probabilidades, el concepto de frecuencia relativa nos conduce a un concepto de probabilidad.

La frecuencia relativa acumulada Hi : es la suma de los valores acumulados de la frecuencia relativa la suma de las frecuencias relativas que se han acumulado, incluyendo la clase sobre la que se esta calculando la frecuencia relativa.

TABLAS DE FRECUENCIAS Y REPRESENTACIONES GRAFICAS

Se proporcionar un conjunto de herramientas o tcnicas estadsticas para el tratamiento de la informacin, tanto cualitativa como cuantitativa, que facilitan el manejo y anlisis de los datos.

En la etapa de organizacin de los datos, nos referimos a la clasificacin y tabulacin de los mismos. Por lo tanto, luego que los tenemos, se dividir la informacin en clases previamente definidas, en funcin de una o ms caractersticas. Un elemento cualquiera del conjunto de datos pertenecer a una clase determinada, si cumple con las caractersticas de esa clase. De lo contrario, pertenecer a otra clase. Las clases deben ser excluyentes y exhaustivas, es decir que cada elemento del conjunto debe pertenecer a una sola clase y a

166

PROBABILIDAD Y ESTADISTICA
su vez, todo elemento debe pertenecer a alguna clase. O sea que todo elemento debe quedar dentro de una clase pero no puede estar en dos clases a la vez.

Cuando la divisin en clases se realiza en funcin de alguna caracterstica cualitativa, nos encontramos frente a datos cualitativos o atributos. Un atributo es una cualidad que nos permite diferenciar los individuos u objetos del conjunto segn posean o no dicha cualidad. Ejemplo: sexo, estado civil, profesin, color, etc.

El nmero de clases en que puede agruparse la informacin depende del atributo elegido. Si clasificamos a las personas en funcin del sexo, este atributo admite dos clases: masculino, femenino. Nos encontramos frente a un caso de particin dicotmica. Si la clasificacin se realiza en funcin del estado civil, podemos establecer mas clases: soltero, casado, divorciado, viudo, etc. En esta situacin hablamos de particin mltiple. Todo atributo que admite una particin mltiple puede ser llevado a otra dicotmica, agrupando alguna de las clases en una sola. Si agrupamos todos los no casados, pasamos a dos clases: casados y no casados. Esta agrupacin puede ser til en algunas situaciones, pero se pierde informacin.

La nomenclatura que utilizaremos para un dato cualitativo es A; B, etc. y para los elementos de su particin ser:

a.- Particin dicotmica: a: pertenecer a una clase. a: pertenecer a la otra clase

b.- Particin mltiple: a1, a2, a3, ..................ai, donde el subndice i representa la cantidad de clases.

Cuando la divisin en clases se realiza en funcin de alguna caracterstica cuantitativa, nos encontramos frente a datos cuantitativos o variables. Ejemplo: estatura, ingresos, cantidad de miembros de una familia, cantidad de libros en prstamo, etc y los valores que pueden tomar depender de la variable. Lo expresado anteriormente nos conduce a diferenciar dos tipos de variables:

Discretas : son aquellas variables que solo pueden tomar un conjunto

166

PROBABILIDAD Y ESTADISTICA
finito de valores, generalmente valores enteros. La cantidad de libros en prstamo es un caso tpico de variable discreta, pudiendo tomar los valores 0,1, 2, 3........n.

Continuas : son aquellas variables que pueden tomar a priori un conjunto

infinito de valores. Generalmente son las magnitudes vinculadas a longitudes, superficies, volumen, edad, duracin o peso. Pero por razones de medicin se discretizan y ese valor observable representa un valor dentro de un intervalo terico.

Para este tipo de datos la nomenclatura que utilizaremos ser similar que para atributos, con la nica diferencia que se usar la letra X .

2.1.- Distribuciones de frecuencias.

La distribucin de frecuencias es la representacin estructurada, en forma de tabla, de toda la informacin que se ha recogido sobre la variable que se estudia.

Toda variable o atributo tiene asociada una distribucin de frecuencias, que implica una correspondencia biunvoca entre dos conjuntos. Por un lado, tenemos el conjunto formado por los valores que toma la variable o el atributo y por el otro el de las frecuencias relacionadas con ellos La asociacin existe en ambos sentidos, pues a cada valor de la variable o atributo, denominado clase, le corresponde una frecuencia y a su vez cada frecuencia se identifica con una clase de la variable

2.1.1.- Frecuencia absoluta y relativa.

frecuencia absoluta : es la cantidad de datos que integran cada una de

las clases, o sea que son las repeticiones que encontramos dentro de una misma clase.

166

PROBABILIDAD Y ESTADISTICA
La notacin en atributos es: n (a i), siendo i el subndice asignado para referenciar las diferentes clases. La notacin en variables es: n (x i).

Las propiedades de las frecuencias absolutas son:

a. - 0 = n( a i ) = n

0 = n( x i ) = n

siendo n el tamao de la muestra.

b. -

S n (a i) = n

S n(x i) = n

La correspondencia entre los valores de la variable y su frecuencia absoluta determina lo que denominamos distribucin de frecuencias absolutas

frecuencia relativa : es la cantidad de repeticiones obtenidas para

cada clase, en relacin al total de las observaciones. Resulta de dividir la cantidad de elementos de cada clase (frecuencia absoluta) por el tamao de la muestra. La notacin es h (a i) o h(x i), segn el tipo de variable.

De acuerdo a la definicin :

h (a i ) = n ( a i ) / n

Las propiedades de las frecuencias relativas son:

a. - 0 = h( a i ) = 1

0 = h( x i ) = 1

166

PROBABILIDAD Y ESTADISTICA

b. - S h (a i) = 1

S h(x i) = 1

Las frecuencias relativas son un porcentaje, ya que relacionan una parte del conjunto con el total

La correspondencia entre los valores de la variable y su frecuencia relativa determina lo que denominamos distribucin de frecuencias relativas

Trataremos por separado ejemplos para datos cualitativos y cuantitativos.

En el caso de los atributos, estos ya vimos que pueden clasificarse en dicotmicos o mltiples.

En el caso de variables tendremos 3 situaciones distintas, dependiendo del tipo de variable, el tamao de la muestra y el nmero de observaciones

EJEMPLO N 1.-

ATRIBUTOS (particin mltiple)

El atributo analizado es A: lugar de procedencia del alumnado de la EUBCA.

Supongamos que el alumnado es de 1600 alumnos y la distribucin por departamentos es: (luego de haber corregido y tabulado los datos)

Ai : Procedencia a 1 : Montevideo a 2 : Rivera a 3 : Colonia a : 4 Tacuaremb

n (a i ): frec. absoluta 1000 100 80 45

h (a i): frec. relativa 0.625 0.063 0.05 0.028

166

PROBABILIDAD Y ESTADISTICA
a 5 : Paysand a 6 : Salto a 7 : Canelones TOTAL 50 40 285 1600 0.031 0.025 0.178 1

Esto da lugar a una particin mltiple.

EJEMPLO N 2.-

ATRIBUTOS (particin dicotmica)

Si agrupamos como estudiantes de Montevideo y del Interior tendramos una clasificacin dicotmica.

Procedenci a Montevideo Interior Total

Frec. Absoluta. 1000 600 1600

Frec. relativa 0.625 0.375 1

La informacin tambin puede ser presentada en grficos, lo cual expondremos con posterioridad.

Con cuadro y grfico estamos presentando la informacin y con las frecuencias relativas estamos analizando la misma.

EJEMPLO N 3.-

VARIABLES (cantidad de observaciones pequea)

La variable analizada es X: puntaje de una prueba de Estadstica.

166

PROBABILIDAD Y ESTADISTICA
Supongamos que el total de alumnos que dieron la prueba es 7 y el puntaje de la prueba es de 0 a 5.

Los resultados obtenidos fueron: 0, 2, 2, 1, 4, 5, 3.

Se colocan todas las observaciones en forma separada, aunque algunas tengan el mismo valor, por lo tanto el nmero de clases es igual al de las observaciones, siendo la frecuencia de cada clase igual a 1.

Esto dara lugar al siguiente cuadro:

Puntaje Frec. absolutas Frec. relativas 0 1 1/7 1 1 1/7 2 1 1/7 2 1 1/7 3 1 1/7 4 1 1/7 5 1 1/7 7 1

El cuadro correspondiente no es nada significativo, ya que salvo el 2, todas las frecuencias son de uno.

EJEMPLO N 4.-

VARIABLES (muestras relativamente grandes con pocos valores de la variable)

La variable es la misma que la analizada en el ejercicio anterior, con la diferencia que la muestra es de mayor tamao y por lo tanto cada valor se repite muchas veces, dando lugar a frecuencias mayores que 1. Generalmente estas situaciones se dan con mayor frecuencia en variables discretas.

166

PROBABILIDAD Y ESTADISTICA
Los resultados obtenidos fueron: 2, 5, 1, 2, 0, 2, 1, 5, 1, 4, 3, 0, 5, 4, 4, 3, 3, 2, 4, 5.Si presentamos esta informacin estructurada obtendramos la siguiente tabla de frecuencias:

Puntaje 0 1 2 3 4 5 Total

Frec. absoluta 2 3 4 3 4 4 20

Frec. relativa 0.10 0.15 0.20 0.15 0.20 0.20 1

Existe una tercer situacin que la veremos en el punto 2.2.-

2.1.2.- Frecuencias acumuladas.

Este concepto es aplicable solamente para variables, ya que para atributos no tiene sentido. La frecuencia acumulada es aquella que acumula frecuencias relativas hasta un determinado valor de la variable. Sumando las frecuencias de todos los valores inferiores a un lmite fijado, obtenemos la frecuencia relativa acumulada hasta ese valor.

La correspondencia entre los valores de la variable y su frecuencia acumulada se denomina Funcin de distribucin acumulada y se expresa como F* (x i ). Esta funcin cumple con las siguientes propiedades:

F* (x i ) = 1 cuando la distribucin alcanza su mximo. Al llegar al ltimo valor, la funcin no crece ms por no existir frecuencias para acumular.

F* (x i ) = 0 cuando la distribucin alcanza su mnimo. Por debajo del primer valor, la funcin sigue valiendo cero porque tampoco existen frecuencias.

166

PROBABILIDAD Y ESTADISTICA

F* (x i ) es no decreciente, pues al crecer el valor de la variable, la funcin puede ir creciendo o mantenerse constante, ya que las frecuencias que se acumulan nunca son negativas y lo mnimo que pueden valer es cero.

F* (x i ) es continua, y de acuerdo al tipo de distribucin , puede ser continua por la derecha o por ambos dados .

2.2.- Frecuencia de una variable agrupada en intervalos.

Si los valores que toma la variable son muy diversos y cada uno de ellos se repite muy pocas veces, entonces conviene agruparlos por intervalos, ya que de otra manera obtendramos una tabla de frecuencias muy extensa que aportara muy poco valor a efectos de sntesis. Este agrupamiento deliberado en intervalos hace perder informacin, pero a su vez permite manejar datos que por su volumen no podran ser analizados ni interpretados.

El nmero de tramos en los que se agrupa la informacin es una decisin que debe tomar el analista. La regla es que mientras ms tramos se utiliza menos informacin se pierde, pero puede que menos representativa e informativa sea la tabla. Por lo tanto, lo primero que debemos observar es el recorrido total de la variable y dividirlo en tantos intervalos como sea conveniente, tratando de no superar los 15 y que no sean menos de 4 o 5. El siguiente ejemplo muestra el agrupamiento.

EJEMPLO N 5.-

VARIABLES (muestras relativamente grandes con muchos valores de la variable)

Supongamos que nos encontramos con una prueba cuyo puntaje vara de 0 a 50 y tomamos una muestra de 45 alumnos. Los resultados individuales son:

166

PROBABILIDAD Y ESTADISTICA
1 41 38 22 43 29 19 16 1 35 29 2 29 46 20 31 2 20 25 22 25 31 3 19 15 42 38 30 16 18 28 18 3 27 23 28 6 12 32 36 7 28 10 50 28 Uno de los agrupamientos posibles sera en 5 intervalos, de amplitud 10 cada uno.

Intervalos ( 0 10 ] ( 10 20 ] ( 20 30 ] ( 30 40 ] ( 40 50 ]

n(x) 9 10 13 8 5 45

h(x) 0.20 0.22 0.29 0.18 0.11 1

2.3.- Representaciones Grficas.

Estos cuadros de distribuciones generalmente van acompaados con grficas, especificas para cada caso, y que permiten una ms rpida comprensin de los datos.

2.3.1.- Diagrama de barras y de sectores.

El grfico de barras, como su nombre lo indica, son barras del ancho que se desee, y de altura la frecuencia absoluta o relativa.

166

PROBABILIDAD Y ESTADISTICA

En cuanto al grfico de sectores, tambin denominado circular o de pastel, su forma es circular y cada frecuencia esta representada por un sector del crculo. Este grfico permite apreciar que parte representa cada clase dentro del total, pero a veces se hace difcil apreciar la diferencia entre una frecuencia y otra.

Ambos grficos son utilizados fundamentalmente para representar atributos.

2.3.2.- Diagrama de bastones y escalonado.

166

PROBABILIDAD Y ESTADISTICA

El grfico de bastones es un grfico en barra, pero con una variante en la amplitud de la barra, ya que en estos casos sera una lnea (bastn), con una altura que sera la frecuencia absoluta o relativa. Se aplica fundamentalmente para las distribuciones de variables y en particular para las que se muestran en el ejemplo 4.-

(El bastn debera ser una lnea)

En cuanto al grfico escalonado, es el que se utiliza para representar la funcin de distribucin de una variable en la situacin del ejemplo 4.

166

PROBABILIDAD Y ESTADISTICA

2.3.3.- Histograma de frecuencias.

En el caso de la variable que debe ser agrupada en intervalos, los valores que caen dentro de cada intervalo se consideran distribuidos uniformemente dentro del mismo., y las frecuencias ya no son alturas, sino reas, por lo que la representacin grfica son rectngulos, que tienen por base la amplitud del intervalo y por altura lo que denominaremos funcin de densidad y que se define de la siguiente manera:

f*(x i )= frecuencia relativa / amplitud del intervalo

La representacin grfica de esta funcin de densidad recibe el nombre de histograma. Los intervalos elegidos no tienen porque tener siempre la misma amplitud, en algunas situaciones se toman intervalos mayores donde no se necesita tanta precisin o en los extremos de la distribucin

166

PROBABILIDAD Y ESTADISTICA
En cuanto a la grfica de la funcin de distribucin acumulada, en esta situacin no es escalonada, sino que es lineal, ya que los valores no se encuentran agrupados en torno a un punto, sino que lo hacen en un intervalo.

A continuacin se presenta la grfica mencionada anteriormente, en base a los datos del ejemplo N 5.

2.3.4.- Grficos lineales.

En el punto anterior mencionamos que la grfica de la funcin de distribucin de una variable agrupada en intervalos, es lineal. Tambin los datos temporales suelen representarse con un grfico lineal, los que sern tratados en su oportunidad.

MEDIDAS DE POSICION

166

PROBABILIDAD Y ESTADISTICA
Son estadgrafos de posicin que son interpretados como valores que permiten resumir a un conjunto de datos dispersos, podra asumirse que estas medidas equivalen a un centro de gravedad que adoptan un valor representativo para todo un conjunto de datos predeterminados. Estas medidas son:

1. Promedio Aritmtico (Media o simplemente promedio)

2. Mediana

3. Moda

4. Promedio Geomtrico

5. Promedio Ponderado

6. Promedio Total

7. Media Armnica

Otras medidas de posicin son: Cuartiles, Deciles y Percentiles

La Media Aritmtica (?):

La medida de tendencia central ms ampliamente usada es la media aritmtica, usualmente abreviada como la media y denotada por ? (lase como "X barra"). La media aritmtica para datos no agrupados

166

PROBABILIDAD Y ESTADISTICA

Si se dispone de un conjunto de n nmeros, tales como X 1, X2, X3,,Xn, la media aritmtica de este conjunto de datos se define como "la suma de los valores de los n i nmeros , divididos entre n", lo que usando los smbolos explicados anteriormente , puede escribirse como:

Ejemplo:

Se tienen las edades de cinco estudiantes universitarios de Ier ao, a saber: 18,23, 27,34 y 25., para calcular la media aritmtica (promedio de las edades, se tiene que:

La media aritmtica para datos agrupados

Si los datos se presentan en una tabla de distribucin de frecuencias, no es posible conocer los valores individuales de cada una de las observaciones, pero si las categoras en las cuales se hallan. Para poder calcular la media, se supondr que dentro de cada categora, las observaciones se distribuyen uniformemente dentro alrededor del punto medio de la clase, por lo tanto puede considerarse que todas las observaciones dentro de la clase ocurren en el punto medio, por lo expuesto la media aritmtica para datos agrupados puede definirse de la siguiente manera: Si en una tabla de distribucin de frecuencia, con r clases, los puntos medio son: X 1, X2, X3, ,Xn; y las respectivas frecuencias son f 1, f2, f3, , fn, la media aritmtica se calcula de la siguiente manera:

donde: N = nmero total de observaciones, por tanto Sf i puede simplificarse y escribirse como N ( N= Sfi ) Ejemplo:

Si se toman los datos del ejemplo resuelto al construir la tabla de distribucin de frecuencia de las cuentas por cobrar de Cabreras y Asociados que fueron los siguientes:

166

PROBABILIDAD Y ESTADISTICA
Clases 1 2 3 4 5 6 Puntos Medios (Xi) 14,628 29,043 43.458 57,873 72.288 86.703 Frecuencias (fi) 10 4 5 3 3 5

Al calcular la cuenta promedio por cobrar (media aritmtica) de estos datos se tiene lo siguiente:

Media aritmtica ponderada.

Por otro lado, si al promediar los datos estos tienen diferentes pesos, entonces estamos ante un caso de media aritmtica ponderada, que puede definirse de la siguiente manera Definicin:

Sea dado un conjunto de observaciones, tales como X 1, X2; X3; ; Xn; y un conjunto de valores p1, p2; p3; ; pn; asociado con cada observacin Xi respectivamente, que reciben el nombre de factores de ponderacin, entonces la media ponderada se calcula como:

Ejemplo:

166

PROBABILIDAD Y ESTADISTICA
En el curso de estadstica del Prof. Cabrera la nota semestral se calcula como una media ponderada. Por cuanto que el promedio de laboratorios representa el 30% de la nota semestral. El promedio de ejercicios parciales representa el 30% y el examen semestral el restante 40%. Si obtiene en este curso los siguientes promedios al final del semestre: laboratorios 90 pts. Parciales 75% pts. Y en el examen semestral 70 pts.; el promedio semestral se calcula de la siguiente forma.:

La nota semestral de 77.5 corresponde a "C".

Propiedades de la media aritmtica Puede ser calculada en distribuciones con escala relativa y de intervalos Todos los valores son incluidos en el cmputo de la media. Una serie de datos solo tiene una media. Es una medida muy til para comparar dos o ms poblaciones Es la nica medida de tendencia central donde la suma de las desviaciones de cada valor respecto a la media es igual a cero. Por lo tanto podemos considerar a la media como el punto de balance de una serie de datos. Desventajas de la media aritmtica Si alguno de los valores es extremadamente grande o extremadamente pequeo, la media no es el promedio apropiado para representar la serie de datos. No se puede determinar si en una distribucin de frecuencias hay intervalos de clase abiertos.

1.3.- La Mediana (X0.5): Cuando una serie de datos contiene uno o dos valores muy grandes o muy pequeos, la media aritmtica no es representativa. El valor central en tales problemas puede ser mejor descrito usando una medida de tendencia central llamada mediana., y denotada por X0.5 La mediana es una medida de posicin y se define como la posicin central en el arreglo ordenado de la siguiente manera:

166

PROBABILIDAD Y ESTADISTICA
Dado un conjunto de nmeros agrupados en orden creciente de magnitud, la mediana es el nmero colocado en el centro del arreglo, de tal forma que una mitad de las observaciones est por encima y la otra por debajo de dicho valor. Si el nmero de observaciones es par, la mediana es la media de los dos valores que se hallan en el medio del arreglo, de donde se concluye en la siguiente definicin:

Mediana. Es el punto medio de los valores de una serie de datos despus de haber sido ordenados de acuerdo a su magnitud. Hay tantos valores antes que la mediana como posteriores en el arreglo de datos La Mediana para datos no agrupados.

Sea X1, X2; X3; ; Xn; una sucesin de datos, la mediana denotada por X 0.5 se calcula de la siguiente manera: X0.5 = X (n+1)/2 si n es par Xn/2 + X(n/2)+1 X0.5= ---------------------- si n es impar 2 Nota: El resultado obtenido en la formula corresponde al nmero de la observacin en el arreglo, por tanto debe reemplazarse por el valor de dicha variable en el arreglo. Ejemplo: (n es impar) Se tienen las edades de cinco estudiantes universitarios de I ao, a saber: 18,23,25.27 y 35. Obsrvese que los datos deben estar ordenados en un arreglo ascendente o descendente. Por cuanto que el nmero de datos es cinco (n=5) y es impar, entonces X0.5 = Xn+1/2 = X(5+1)/2 = X6/2 = X3 = 25 aos Nota: obsrvese que se obtuvo el nmero de la variable mediana (X 3) que en el arreglo de edades ordenado en forma ascendente corresponde a 25 aos (X3=25) Continuacin del ejemplo(n es par) Si el nmero de estudiantes hubiere sido par, suponga que se adiciona un estudiante con 31 aos, entonces el arreglo ascendente consecuente sera 18, 23, 25, 27, 31 y 35, entonces la mediana se calcula asi:

La mediana para datos agrupados

166

PROBABILIDAD Y ESTADISTICA
Si se tiene una distribucin de frecuencias, la mediana es igualmente ese valor que tiene 50% de las observaciones por debajo y 50 % por encima. Geomtricamente, la mediana es el valor de X sobre el eje de las abscisas correspondiente a la ordenada que divide un histograma en dos partes de igual rea. Para hallar el valor de la mediana, en el caso de datos agrupados debe encontrarse primero la clase mediana, la que se define como la clase ms baja para la cual la frecuencia acumulada excede N/2 (siendo N=Sfi ). Encontrada esta clase, la siguiente formula servir para hallar el valor de la mediana

N/2 fa X0.5 = Li + ------------- ( C ) fi donde: L = lmite inferior de la clase mediana. N = frecuencia total o Sfi. fa = frecuencia absoluta acumulada hasta la clase premediana fi = frecuencia absoluta de la clase mediana C = amplitud de la clase mediana. Ejemplo: Clases P.M. Xi 7.420 21.835 21.835 36.250 36.250 50.665 50.665 65.080 65.080 79.495 79.495 93.910 Total 14.628 29.043 10 4 0.33 0.13 0.17 10 14 19 30 20 16 0.33 0.46 1.00 0.67 fi fr fa? fa? fra? fra?

43.458 5

0.63 0.54

57.873 72.288 86.703 XXX

3 3 5 30

0.10 0.10 0.17 1.00

22 25 30

11 8 5

0.73 0.83 1.00

0.37 0.27 0.17

XXX XXX XXX XXX

Si se desea calcular la mediana, es necesario primero encontrar la clase mediana, que ser aquella que en teora contenga el dato N/2 = 30/2 = 15, que corresponde con la tercera clase por cuanto que la frecuencia acumulada (fa) hasta esa clase es 19, luego entonces:

166

PROBABILIDAD Y ESTADISTICA

Respuesta: La mediana de cuentas por cobrar es B/.39.133

Propiedades de la mediana Hay solo una mediana en una serie de datos. No es afectada por los valores extremos ( altos o bajos ) Puede ser calculada en distribuciones de frecuencia con intervalos abiertos, si no se encuentra en el intervalo abierto. Puede ser calculada en distribuciones con escala relativa, de intervalos, y ordinal.

La Moda (Mo.): A veces es importante conocer cul es el valor que ms prevalece en el conjunto de datos. El valor que ocurre con ms frecuencia se le conoce como moda. La moda es la medida de tendencia central especialmente til para describir mediciones de tipo ordinal, de intervalos y nominal. En un conjunto de nmeros la moda se define como el valor nmero que ocurre con ms frecuencia Ejemplo: En el siguiente conjunto de nmeros 1, 5, 5, 9, 12, 12, 12, 14. La moda es igual a 12, por cuanto que es el nmero que ms se repite (tres veces) La Moda para datos agrupados (Mo.):

La Moda puede deducirse de una distribucin de frecuencia o de un histograma a partir de la frmula.

166

PROBABILIDAD Y ESTADISTICA
Mo. = Li + [ ( ?1 / ?1+?2 ) ] C Donde; Li = lmite inferior de la clase modal (clase de mayor frecuencia absoluta (fa) ?1 = diferencia de las frecuencias absolutas de la clase modal y premodal. ?2 = diferencia de las frecuencias absolutas de la clase modal y postmodal C = amplitud de la clase modal. Ejemplo:

Para encontrar la moda es necesario, en primer lugar, identificar la clase modal; que ser aquella que posea la mayor frecuencia absoluta. En el ejemplo de cuentas por cobrar de Cabrera`s y Asociados la clase modal ser la primera, por cuanto que tiene la mayor frecuencia absoluta. A partir de esto se puede reemplazar en la formula anterior los datos, a saber :

Li =7.42 C=14.415 f1 = 10 (frecuencia absoluta de la clase modal) f0 = 0 (frecuencia absoluta de la clase premodal) f2 = 4 (frecuencia absoluta de la clase postmodal) ?1 = 100 = 10 ?2 = 10-4 = 6 Mo. = 7.42 + [ (10/10+6) 14.415 ] = 7.42 + [ (10/16) 14.415] = = 7.42 + [ 0.625 (14.415) ] = 7.42 + 9.01 = 16.53

Propiedades de la moda La moda se puede determinar en todos los tipos de mediciones (nominal, ordinal, de intervalos, y relativa). La moda tiene la ventaja de no ser afectada por valores extremos. Al igual que la mediana, puede ser calculada en distribuciones con intervalos abiertos.

166

PROBABILIDAD Y ESTADISTICA
Desventajas de la moda En muchas series de datos no hay moda porque ningn valor aparece ms de una vez. En algunas series de datos hay ms de una moda, en este caso uno podra preguntarse cual es el valor representativo de la serie de datos?

Relacin emprica entre la media, la mediana y la moda En distribuciones totalmente simtricas, la media, la mediana y la moda coinciden, localizndose en un mismo valor. En cambio, en distribuciones moderadamente asimtricas, la siguiente relacin se mantiene aproximadamente: Media Moda = 3(Media Mediana

Posiciones relativas de la media, la mediana y la moda para curvas de frecuencias asimtricas a derecha e izquierda respectivamente, para curvas simtricas los tres valores coinciden

1.5.- La Media Armnica (?a): La Media Armnica, la representaremos como ?a, es la inversa de la media aritmtica de las inversas de los valores de la variable, responde a la siguiente definicin: Si se tiene un conjunto de observaciones tales como: X 1, X2, . Xn; la media armnica, denotada por ?a, se define como el reciproco de la suma de los valores inversos de la variable estadstica divididos entre el nmero total de datos y se calcula con la siguiente frmula

166

PROBABILIDAD Y ESTADISTICA
Se utiliza para promediar velocidades, tiempos, rendimiento, etc. (cuando influyen los valores pequeos). Su problema: cuando algn valor de la variable es prximo a cero no se puede calcular Ejemplo:

Un.automvil que hace viajes de ida y vuelta entre las ciudades A y B, realiza el viaje entre A y B a razn de 80 Km por hora y el viaje entre B y A a 120 Km por hora, La velocidad promedio del viaje de ida y vuelta ser de

?a = (1/80 + 1/120)/2 = [(120+80)9600]/2 = 19200/200 = 96 km/h Propiedades de la media armnica La media armnica se basa en todas las observaciones por lo que est afectada por todos los valores de la variable. Da a los valores extremadamente grandes un peso menor que el que les da la media geomtrica, mientras que a los valores pequeos les da un peso mayor que el que les da tanto la media aritmtica como la media geomtrica. La media armnica esta indeterminada si alguno de los valores es cero, pues hallar el recproco de cero implica dividir entre cero, lo cual no es vlido. La media armnica est rgidamente definida y siempre es definitiva, excepto cuando uno de los valores es cero. La media armnica es el promedio que se ha de usar, cuando lo que se va a promediar son proporciones donde los numeradores de las razones son los mismos para todas las proporciones. La media armnica se presta a manipulaciones algebraicas posteriores

La Media Geomtrica(?g):

Se define como la raz de ndice de la frecuencia total cuyo radicando es el producto de las potencias de cada valor de la variable elevado a sus respectivas frecuencias absolutas, se denota por ?g; suele utilizarse cuando los valores de la variable siguen una progresin geomtrica. Tambin para promediar porcentajes, tasas, n ndices, etc. siempre que nos vengan dados en porcentajes y se calcula mediante la siguiente frmula ?g = nv(X1 * X2 * * Xn Frmula que algunas veces es conveniente expresarla en forma logartmica. El logaritmo de la media geomtrica es la media aritmtica de los logaritmos de los valores de la variable. El problema se presenta cuando algn valor es 0

166

PROBABILIDAD Y ESTADISTICA
negativo y exponente de la raz par ya que no exista raz par de un nmero negativo, entonces la frmula anterior se presenta de la siguiente manera: log Xg = 1/N (log X1 + log X2 + + log Xn)

Ejemplo;

Encontrar la media de los siguientes nmeros 2, 4, 8. obsrvese que entre ellos existe una razn o proporcin constante, cada uno de ellos es el doble del anterior, por tanto la media a utilizar es la media geomtrica, de la siguiente manera

?g = 3v (2) (4) (8) = 3v 64 = 4 Respuesta: la media geomtrica de los datos es 4

Propiedades de la media geomtrica (?g) La media geomtrica esta basada en todas las observaciones, por lo que est afectada por todos los valores de la variable. Sin embargo, da menos pesos a los valores extremadamente grandes que el que les da la media aritmtica. La media geomtrica es igual a cero si algunos de los valores es cero, y se puede volver imaginaria si ocurren valores negativos. Con la excepcin de estos dos casos, su valor siempre es definitivo y est rgidamente definido. La media geomtrica es la que se debe utilizar cuando lo que se va a promediar son tasas de cambios o proporciones, y se intenta dar igual peso a tasas de cambios iguales.

Medidas de posicin para datos agrupados y no agrupados: cuartiles, deciles y percentiles INTRODUCCIN Las Medidas de Posicin, tambin conocidas como Otras Medidas de Dispersin, son otras medidas o mtodos que resultan ser ms prcticos para precisar ciertas situaciones en las que se busca describir la variacin o dispersin en un conjunto de datos CUANTILES

Los cuantiles son medidas de posicin que se determinan mediante un mtodo que determina la ubicacin de los valores que dividen un conjunto de observaciones en partes iguales.

166

PROBABILIDAD Y ESTADISTICA
Los cuantiles son los valores de la distribucin que la dividen en partes iguales, es decir, en intervalos que comprenden el mismo nmero de valores. Cuando la distribucin contiene un nmero alto de intervalos o de marcas y se requiere obtener un promedio de una parte de ella, se puede dividir la distribucin en cuatro, en diez o en cien partes. Los ms usados son los cuartiles, cuando dividen la distribucin en cuatro partes; los deciles, cuando dividen la distribucin en diez partes y los centiles o percentiles, cuando dividen la distribucin en cien partes. Los cuartiles, como los deciles y los percentiles, son en cierta forma una extensin de la mediana. Para algunos valores u , se dan nombres particulares a los cuantiles, Q (u):

u 0.5 0.25, 0.75 0.1, ... , 0.99 0.01, ..., 0.99

Q(u) Mediana Cuartiles Deciles Centiles

CUARTILES

Los cuartiles son los tres valores que dividen al conjunto de datos ordenados en cuatro partes porcentualmente iguales. Hay tres cuartiles denotados usualmente Q1, Q2, Q3. El segundo cuartil es precisamente la mediana. El primer cuartil, es el valor en el cual o por debajo del cual queda un cuarto (25%) de todos los valores de la sucesin (ordenada); el tercer cuartil, es el valor en el cual o por debajo del cual quedan las tres cuartas partes (75%) de los datos. Datos Agrupados

Como los cuartiles adquieren su mayor importancia cuando contamos un nmero grande de datos y tenemos en cuenta que en estos casos generalmente los datos son resumidos en una tabla de frecuencia. La frmula para el clculo de los cuartiles cuando se trata de datos agrupados es la siguiente:

166

PROBABILIDAD Y ESTADISTICA
k= 1,2,3 Donde: Lk = Lmite real inferior de la clase del cuartil k n = Nmero de datos Fk = Frecuencia acumulada de la clase que antecede a la clase del cuartil k. fk = Frecuencia de la clase del cuartil k c = Longitud del intervalo de la clase del cuartil k Si se desea calcular cada cuartil individualmente, mediante otra frmula se tiene lo siguiente: El primer cuartil Q1, es el menor valor que es mayor que una cuarta parte de los datos; es decir, aquel valor de la variable que supera 25% de las observaciones y es superado por el 75% de las observaciones.

Frmula de Q1, para series de Datos agrupados:

Donde: L1 = limite inferior de la clase que lo contiene P = valor que representa la posicin de la medida f1 = la frecuencia de la clase que contiene la medida solicitada. Fa-1 = frecuencia acumulada anterior a la que contiene la medida solicitada. Ic = intervalo de clase El segundo cuartil Q2, (coincide, es idntico o similar a la mediana, Q2 = Md), es el menor valor que es mayor que la mitad de los datos, es decir el 50% de las observaciones son mayores que la mediana y el 50% son menores.

Frmula de Q2, para series de Datos agrupados:

Donde: L1 = limite inferior de la clase que lo contiene P = valor que representa la posicin de la medida

166

PROBABILIDAD Y ESTADISTICA
f1 = la frecuencia de la clase que contiene la medida solicitada. Fa-1 = frecuencia acumulada anterior a la que contiene la medida solicitada. Ic = intervalo de clase El tercer cuartil Q3, es el menor valor que es mayor que tres cuartas partes de los datos, es decir aquel valor de la variable que supera al 75% y es superado por el 25% de las observaciones.

Frmula de Q3, para series de Datos agrupados:

Donde: L1 = limite inferior de la clase que lo contiene P = valor que representa la posicin de la medida f1 = la frecuencia de la clase que contiene la medida solicitada. Fa-1 = frecuencia acumulada anterior a la que contiene la medida solicitada. Ic = intervalo de clase.Otra manera de verlo es partir de que todas las medidas no son sino casos particulares del percentil, ya que el primer cuartil es el 25% percentil y el tercer cuartil 75% percentil. Para Datos No Agrupados Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante las siguientes frmulas: - El primer cuartil: Cuando n es par:

Cuando n es impar:

Para el tercer cuartil

Cuando n es par:

166

PROBABILIDAD Y ESTADISTICA
Cuando n es impar:

DECILES

Los deciles son ciertos nmeros que dividen la sucesin de datos ordenados en diez partes porcentualmente iguales. Son los nueve valores que dividen al conjunto de datos ordenados en diez partes iguales, son tambin un caso particular de los percentiles. Los deciles se denotan D1, D2,..., D9, que se leen primer decil, segundo decil, etc. Los deciles, al igual que los cuartiles, son ampliamente utilizados para fijar el aprovechamiento acadmico. Datos Agrupados Para datos agrupados los deciles se calculan mediante la frmula.

k= 1,2,3,... 9 Donde: Lk = Lmite real inferior de la clase del decil k n = Nmero de datos Fk = Frecuencia acumulada de la clase que antecede a la clase del decil k. fk = Frecuencia de la clase del decil k c = Longitud del intervalo de la clase del decil k Otra frmula para calcular los deciles: El cuarto decil, es aquel valor de la variable que supera al 40%, de las observaciones y es superado por el 60% de las observaciones.

El quinto decil corresponde a la mediana.

166

PROBABILIDAD Y ESTADISTICA

El noveno decil supera al 90% y es superado por el 10% restante.

Donde (para todos): L1 = limite inferior de la clase que lo contiene P = valor que representa la posicin de la medida f1 = la frecuencia de la clase que contiene la medida solicitada. Fa-1 = frecuencia acumulada anterior a la que contiene la medida solicitada. Ic = intervalo de clase.

Frmulas Datos No Agrupados Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante las siguientes frmulas:

Cuando n es par:

Cuando n es impar: Siendo A el nmero del decil.

CENTILES O PERCENTILES

Los percentiles son, tal vez, las medidas ms utilizadas para propsitos de ubicacin o clasificacin de las personas cuando atienden caractersticas tales como peso, estatura, etc. Los percentiles son ciertos nmeros que dividen la sucesin de datos ordenados en cien partes porcentualmente iguales. Estos son los 99 valores que dividen en cien partes iguales el conjunto de datos ordenados. Los percentiles (P1, P2,... P99), ledos primer percentil,..., percentil 99.

166

PROBABILIDAD Y ESTADISTICA
Datos Agrupados Cuando los datos estn agrupados en una tabla de frecuencias, se calculan mediante la frmula:

k= 1,2,3,... 99 Donde: Lk = Lmite real inferior de la clase del decil k n = Nmero de datos Fk = Frecuencia acumulada de la clase que antecede a la clase del decil k. fk = Frecuencia de la clase del decil k c = Longitud del intervalo de la clase del decil k Otra forma para calcular los percentiles es: Primer percentil, que supera al uno por ciento de los valores y es superado por el noventa y nueve por ciento restante.

El 60 percentil, es aquel valor de la variable que supera al 60% de las observaciones y es superado por el 40% de las observaciones.

El percentil 99 supera 99% de los datos y es superado a su vez por el 1% restante.

Frmulas Datos No Agrupados

166

PROBABILIDAD Y ESTADISTICA
Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante las siguientes frmulas: Para los percentiles, cuando n es par:

Cuando n es impar:
Siendo A, el nmero del percentil. Es fcil ver que el primer cuartil coincide con el percentil 25; el segundo cuartil con el percentil 50 y el tercer cuartil con el percentil 75.

3. EJEMPLO

Determinacin del primer cuartil, el sptimo decil y el 30 percentil, de la siguiente tabla:

Salarios (I. De Clases)

No. De Empleados (f1) 85 90 120 70 62 36

fa

200-299 300-299 400-499 500-599 600-699 700-800

85 175 295 365 427 463

Como son datos agrupados, se utiliza la frmula

Siendo,

166

PROBABILIDAD Y ESTADISTICA

La posicin del primer cuartil.


La posicin del 7 decil.

La posicin del percentil 30. Entonces,

El primer cuartil:
115.5 85 = 30.75 Li = 300, Ic = 100 , fi = 90

El 7 decil:

Posicin: 324.1 295 = 29.1Li = 500, fi = 70

El percentil 30 Posicin:

138.9 85 = 53.9 fi = 90

166

PROBABILIDAD Y ESTADISTICA
Estos resultados nos indican que el 25% de los empleados ganan salarios por debajo de $ 334; que bajo 541.57 gana el 57%de los empleados y sobre $359.88, gana el 70% de los empleados.

MEDIDAS DE DISPERSION
Son estadgrafos de dispersin que permiten evaluar el grado de homogeneidad, dispersin o variabilidad de un conjunto de datos. Estas medidas son:

1. Amplitud o Rango

2. Varianza

3. Desviacin Estndar

4. Coeficiente de Variabilidad

Rango La forma ms sencilla de medir la variabilidad es el rango. Es la diferencia entre los ms altos y ms bajos valores en un conjunto de datos. En la forma de una ecuacin: Rango = valor ms alto - valor ms bajo El rango tiene la ventaja de ser fcil de calcular y entender. Ejemplo: Las calificaciones de cinco estudiantes de estadstica son: 8, 8, 10, 6, y 8. Cul es el rango de las calificaciones? Rango = valor ms alto - valor ms bajo = 10 - 6 = 4

166

PROBABILIDAD Y ESTADISTICA
Rango para datos agrupados Para estimar el rango de una distribucin de frecuencia se resta el lmite inferior del intervalo de clase ms chico del lmite superior del intervalo de clase ms grande Ejemplo: Una muestra de las edades del pblico de un concierto se encuentra distribuida de la siguiente manera: Edades Nmero de personas

15 - 19 20 - 24 25 - 29 30 - 34 35 - 39 40 - 44 45 - 49

2 1 4 15 10 5 3

Rango = mayor limite superior - menor lmite inferior = 49 - 15 = 34

Desviacin media

La desviacin media mide la cantidad promedio que varan los datos respecto a su media. La definicin es: Desviacin media es la media aritmtica de los valores absolutos de las desviaciones de los datos respecto a su media. La frmula de la desviacin media ( Dm ) es:

166

PROBABILIDAD Y ESTADISTICA
| X n Ejemplo: Las calificaciones de cinco estudiantes de estadstica son: 8, 8, 10, 6, y 8. Cul es la desviacin media de las calificaciones? X X|X | |

Dm =

8 8 10 6 8

0 0 +2 -2 0

0 0 2 2 0 S=4

| X Dm = n

| =

4 = 0.8 5

Desviacin media para datos agrupados En el caso de que los datos se encuentren agrupados en una distribucin de frecuencia la frmula es :

f | X Dm = n

Ventajas y Desventajas de la desviacin media La desviacin media tiene dos ventajas. Utiliza para su cmputo todos los elementos de la serie de datos y es facil de entender. Sin embargo, es dificil trabajar con valores absolutos y por ello la desviacin media no es usada frecuentemente.

La varianza y la desviacin estndar

166

PROBABILIDAD Y ESTADISTICA
Concepto de varianza y desviacin estndar La varianza y la desviacin estndar sirven para cuantificar la variabilidad de una muestra midiendo su dispersin alrededor de la media. La definicin es la siguiente: Varianza. Es la media aritmtica de las desviaciones cuadradas de los datos respecto a la media. Desviacin estndar. Es la raz cuadrada de la varianza. Varianza y Desviacin Estndar para datos no agrupados Las frmulas de la varianza de una poblacin y de una muestra son ligeramente diferentes. Las frmulas son: (x)2 Sx 2

(x) Sx 2

=
2

N N

S=

n n-1

varianza de una poblacin

varianza de una muestra

Las desviaciones estndar de la poblacin y muestra se calculan simplemente sacando la raz cuadrada a la respectiva varianza. desviacin estndar de una poblacin

desviacin estndar de una muestra

S = S2

Ejemplo El contenido de cinco botellas de perfume seleccionadas de forma aleatoria de la lnea de produccin son (en ml): 85.4, 85.3, 84.9, 85.4, y 84.0. Cul es la varianza y la desviacin estndar de las observaciones muestreadas?

X 85.4 85.3 84.9 85.4 84.0

X2 7293.16 7276.09 7208.01 7293.16 7056.00

166

PROBABILIDAD Y ESTADISTICA

Sx= 425.0 Sx2=

36126.42

(x)2 Sx2 S=
2

(425)2 36126.42 = = 0.355

n n-1

5 5-1

S=

2 S

0.35 = 5 0.5958

Varianza y Desviacin Estndar para datos agrupados Si los datos estn agrupados en una distribucin de frecuencia, la varianza y la desviacin estndar de la muestra se pueden aproximar sustituyendo Sfx por Sx y Sfx por Sx. Las frmulas quedaran de la siguiente manera: (fx)2 Sfx2 Sfx2 N N varianza de una poblacin S2= n n-1 varianza de una muestra (fx)2

2=

desviacin estndar de una poblacin

desviacin estndar de una muestra

S = S2

Ejemplo: Calcular la varianza y la desviacin estndar de la siguiente distribucin de frecuencia del nmero de meses de duracin de una muestra de 40 bateras para coche.

166

PROBABILIDAD Y ESTADISTICA
duracin de las bateras (meses) Nmero de bateras

15 - 19 20 - 24 25 - 29 30 - 34 35 - 39 40 - 44 45 - 49

2 1 4 15 10 5 3

Primeramente, calculamos la marca de clase, para despus calcular los productos fX y fx2 para proceder finalmente a calcular las sumatorias SfX y Sfx 2 y aplicar las frmulas. LI LS X F FX FX2

15 19 17 20 24 22 25 29 27 30 34 32 35 39 37 40 44 42 45 49 47

2 1 4 15 10 5 3

34 22 108 480 370 210 141

588 484 2916 15360 13690 8820 6627

n =40 SfX = 1365 Sfx2 = 48475

S2

Sfx2

(fx)

= 48475

(1365)

166

PROBABILIDAD Y ESTADISTICA
2 2

= n n-1

40 40 - 1 48.573

Teorema de Chebyshev

Una pequea desviacin estndar para un grupo de datos, indica que esos valores estan localizados cerca de la media.Inversamente una gran desviacin estndar revela que las observaciones estn muy dispersas en relacin a la media. El matemtico Chebyshev (1821-1894) desarroll un teorema que nos permite determinar la proporcin mnima de valores que hay dentro de un numero especfico de desviaciones estndar y la media En terminos generales, el teorema de Chebyshev establece: Para un grupo de observaciones (muestra o poblacin), la proporcin mnima de valores que caen dentro de un intervalo formado por la media k desviaciones estndar es por lo menos 1 - 1/k , donde k es una constante ms grande que 1. P( - k < X < + k ) = 1 - 1/k Basados en el Teorema de Chebyshev, por lo menos tres de cada 4 valores, podran caer en el intervalo comprendido entre la media ms dos desviaciones estndar y la media menos dos desviaciones estndar. P( - k < X < + k ) = 1 - 1/k P( - 2 < X < + 2 ) = 1 - 1/2 P( - 2 < X < + 2 ) = 1 - 1/4 P( - 2 < X < + 2 ) = .75

Coeficiente de variacin

166

PROBABILIDAD Y ESTADISTICA

El coeficiente de variacin se define como la razn de la desviacin estndar entre la media aritmtica

C.V. =

( 100 )

Ventajas El coeficiente de variacin es til cuando pretende comparar la variabilidad de dos o ms conjuntos de datos expresados en diferentes unidades de medicin, pues el resultado ser sealado en porcentajes. Desventajas Cuando el valor de la media es cercano a cero, el coeficiente de variacin es muy sensible a pequeos cambios en la media, limitando su utilidad A diferencia de la desviacin estndar este no puede ser utilizado para elaborar intervalos de confianza para la media.

Rango intercuartilar

El rango intercuartilar (IQR) es la distancia entre el primer cuartil y el tercer cuartil. Comprende el conglomerado de valores mas cercanos a la media. El IQR es importante cuando dos series de datos similares son comparadas. El IQR no es afectado por valores extremos. En un diagrama de cajas, el IQR es igual a la longitud de la caja. El rango intercuartilar puede ser calculado por el siguiente procedimiento: 1.- Se ordena la serie de datos 2.- El primer cuartil ( Q1 ) es el valor con posicin () (n +1) 3.- El tercer cuartil ( Q3 ) es el valor con posicin () (n +1) 4. Calcular el IQR con la siguiente frmula: IQR = Q3 - Q1

166

PROBABILIDAD Y ESTADISTICA

Ejemplo Las calificaciones de una muestra de cinco estudiantes son: 8, 8, 10, 6 y 8. Calcule el rango intercuartilar. Primero se ordena la serie de datos 6 8 8 8 10

Q3 es el valor con posicin ()( n + 1 ) = ()( 5 + 1) = ()( 6 ) = 4.5 Q1 es el valor con posicin ()( n + 1 ) = ()( 5 + 1) = ()( 6 ) = 1.5 Encontrar Q3 y Q1 por interpolacin. Dato: Posicin : 6 Q1 8 8 8 Q3 10

1.5

4.5

Q1 = 6 + ( 8 - 6 ) ( 1.5 - 1 ) / ( 2 - 1 ) = 7 Q3 = 8 + ( 10 - 8 ) ( 4.5 - 4 ) / ( 5 - 4 ) = 9 IQR = Q3 - Q1 = 9 - 7 = 2 Rango intercuartilar para datos agrupados El tercer cuartil y el primer cuartil de una muestra de datos agrupados en una distribucin de frecuencia pueden ser estimados mediante el siguiente procedimiento: 1. Calcular el valor de () n para Q1, y () n para Q3 2. Localizar el intervalo de clase en el cual Q3 y Q1 se encuentren. 3. Aplicar la frmula a los valores del intervalo de clase encontrado ( n - FA ) TIC Q1 = LSR + F

Q3 = LSR + ( n - FA ) TIC

166

PROBABILIDAD Y ESTADISTICA

F Donde: LSR es el lmite superior real de la clase que contiene el primer o el tercer cuartil n es el total de datos o frecuencias. FA es la frecuencia acumulada de la clase que contiene el primer o el tercer cuartil. F es la frecuencia de la clase que contiene el primer o el tercer cuartil. TIC es el tamao del intervalo de clase que contiene el primer o el tercer cuartil. 4. Calcular el rango intercuartilar con la frmula: IQR = Q3 - Q1

Ejemplo Una muestra de las edades de la audiencia de un concierto se distribuye como sigue: Edades Nmero de personas

15 - 19 20 - 24 25 - 29 30 - 34 35 - 39 40 - 44 45 - 49

2 1 4 15 10 5 3

1. Calcular el valor de n / 4 para Q1, y () n para Q3

166

PROBABILIDAD Y ESTADISTICA
() n = () 40 = 10 () n = () 40 = 30 2. Localizar la clase en la cual Q3 y Q1 se encuentren.

LI LS LSR 15 19 19.5 20 24 24.5 25 29 29.5

F 2 1 4

FA 2 3 7

30 34 34.5 15 22 Q1 35 39 39.5 10 32 Q3 40 44 44.5 45 49 49.5 5 3 37 40

3. Aplicar la frmula con los valores de la clase encontrada ( n - FA ) TIC Q1 = LSR + F = 34.5 + 15 ( 10 - 22 ) 5 = 30.5

( n - FA ) TIC Q3 = LSR + F = 39.5 +

( 30 - 32 ) 5 = 38.5 10

4.- Calcular el rango intercuartilar con la frmula: IQR = Q3 - Q1 = 38.5 - 30.5 = 8

166

PROBABILIDAD Y ESTADISTICA

MEDIDAS DE FORMA
Evala la forma que adopta la distribucin de frecuencias respecto al grado de distorsi (inclinacin) que registra respecto a valor promedio tomado como centro de gravedad, el grado de apuntamiento (elevamiento) de la distribucin de frecuencias. A mayor elevamiento de la distribucin de frecuencia significar mayor concentracin de los datos en torno al promedio,por tanto, una menor dispersin de los datos. Estas medidas son:

1. Asimetra o Sesgo

2. Curtosis

1. Asimetra o Sesgo

Esta medida nos permite identificar si los datos se distribuyen de forma uniforme alrededor del punto central (Media aritmtica). La asimetra presenta tres estados diferentes [Fig.5-1], cada uno de los cuales define de forma concisa como estn distribuidos los datos respecto al eje de asimetra. Se dice que la asimetra es positiva cuando la mayora de los datos se encuentran por encima del valor de la media aritmtica, la curva es Simtrica cuando se distribuyen aproximadamente la misma cantidad de valores en ambos lados de la media y se conoce como asimetra negativa cuando la mayor cantidad de datos se aglomeran en los valores menores que la media.

Figura 1-1

166

PROBABILIDAD Y ESTADISTICA

El Coeficiente de asimetra, se representa mediante la ecuacin matemtica,

Ecuacin 5-9

Donde (g1) representa el coeficiente de asimetra de Fisher, (Xi) cada uno de los valores, ( ) la media de la muestra y (ni) la frecuencia de cada valor. Los resultados de esta ecuacin se interpretan:

(g1 = 0): Se acepta que la distribucin es Simtrica, es decir, existe aproximadamente la misma cantidad de valores a los dos lados de la media. Este valor es difcil de conseguir por lo que se tiende a tomar los valores que son cercanos ya sean positivos o negativos ( 0.5). (g1 > 0): La curva es asimtricamente positiva por lo que los valores se tienden a reunir ms en la parte izquierda que en la derecha de la media. (g1 < 0): La curva es asimtricamente negativa por lo que los valores se tienden a reunir ms en la parte derecha de la media.

Desde luego entre mayor sea el nmero (Positivo o Negativo), mayor ser la distancia que separa la aglomeracin de los valores con respecto a la media.

Figura 1-2

166

PROBABILIDAD Y ESTADISTICA

166

PROBABILIDAD Y ESTADISTICA

Observamos que cuando la distribucin, es simtrica, los valores de la media, la mediana, y la moda coinciden; aunque no tienen porque ser el origen de coordenadas.

Cuando la distribucin tiene sesgo a la derecha, el valor ms grande es la media y el ms chico, es la moda.

Ocurre a la inversa, cuando la distribucin tiene asimetra negativa, la media es el valor ms pequeo, y la moda es el ms grande.

2. Curtosis

Esta medida determina el grado de concentracin que presentan los valores en la regin central de la distribucin. Por medio del Coeficiente de Curtosis, podemos identificar si existe una gran concentracin de valores (Leptocrtica), una concentracin normal (Mesocrtica) una baja concentracin (Platicrtica).

Figura 5-2 Para calcular el coeficiente de Curtosis se utiliza la ecuacin:

166

PROBABILIDAD Y ESTADISTICA

Ecuacion 5-10

Donde (g2) representa el coeficiente de Curtosis, (Xi) cada uno de los valores, ( ) la media de la muestra y (ni) la frecuencia de cada valor. Los resultados de esta frmula se interpretan:

(g2 = 0) la distribucin es Mesocrtica : Al igual que en la asimetra es bastante difcil encontrar un coeficiente de Curtosis de cero (0), por lo que se suelen aceptar los valores cercanos ( 0.5 aprox.). (g2 > 0) la distribucin es Leptocrtica (g2 < 0) la distribucin es Platicrtica

Cuando la distribucin de los datos cuenta con un coeficiente de asimetra (g1 = 0.5) y un coeficiente de Curtosis de (g2 = 0.5), se le denomina Curva Normal. Este criterio es de suma importancia ya que para la mayora de los procedimientos de la estadstica de inferencia se requiere que los datos se distribuyan normalmente.

La principal ventaja de la distribucin normal radica en el supuesto que el 95% de los valores se encuentra dentro de una distancia de dos desviaciones estndar de la media aritmtica (Fig.5-3); es decir, si tomamos la media y le sumamos dos veces la desviacin y despus le restamos a la media dos desviaciones, el 95% de los casos se encontrara dentro del rango que compongan estos valores.

Figura 5-3

166

PROBABILIDAD Y ESTADISTICA
Desde luego, los conceptos vistos hasta aqu, son slo una pequea introduccin a las principales medidas de Estadstica Descriptiva; es de gran importancia que los lectores profundicen en estos temas ya que la principal dificultad del paquete SPSS radica en el desconocimiento de los conceptos estadsticos.

Las definiciones plasmadas en este captulo han sido extradas de los libros Estadstica para administradores escrito por Alan Wester de la editorial McGraw-Hill y el libro Estadstica y Muestreo escrito por Ciro Martnez editorial Ecoe editores (Octava edicin). No necesariamente tienes que guiarte por estos libros ya que en las libreras encontraras una gran variedad de textos que pueden ser de bastante utilidad.

PROBABILIDADES
La teora de la probabilidad es la teora matemtica que modela los fenmenos aleatorios. Estos deben contraponerse a los fenmenos determinsticos, en los cuales el resultado de un experimento, realizado bajo condiciones determinadas, produce un resultado nico o previsible: por ejemplo, el agua calentada a 100 grados Celsius, a nivel del mar, se transforma en vapor. Un fenmeno aleatorio es aquel que, a pesar de realizarse el experimento bajo las mismas condiciones determinadas, tiene como resultados posibles un conjunto de alternativas, como el lanzamiento de un dado o de una moneda. Los procesos reales que se modelizan como procesos aleatorios pueden no serlo realmente; cmo tirar una moneda o un dado no son procesos aleacin en sentido estricto, ya que no se reproducen exactamente las mismas condiciones iniciales que lo determinan, sino slo unas pocas. En los procesos reales que se modelizan mediante distribuciones de probabilidad corresponden a modelos complejos donde no se conocen a priori todos los parmetros que intervienen; sta es una de las razones por las cuales la estadstica, que busca determinar estos parmetros, no se reduce inmediatamente a la teora de la probabilidad en s.

En 1933, el matemtico sovitico Andri Kolmogrov propuso un sistema de axiomas para la teora de la probabilidad, basado en la teora de conjuntos y en la teora de la medida, desarrollada pocos aos antes por Lebesgue, Borel y Frechet entre otros.

Esta aproximacin axiomtica que generaliza el marco clsico de la probabilidad, la cual obedece a la regla de clculo de casos favorables sobre casos posibles, permiti la rigorizacin de muchos argumentos ya utilizados, as como el estudio de problemas fuera de los marcos clsicos. Actualmente, la teora de la probabilidad encuentra aplicacin en las ms variadas ramas del conocimiento, como puede ser la fsica (donde corresponde mencionar el desarrollo

166

PROBABILIDAD Y ESTADISTICA
de las difusiones y el movimiento Browniano), o las finanzas (donde destaca el modelo de Black y Scholes para la valuacin de acciones).

Interpretaciones de la probabilidad

Adems de las muchas aplicaciones formales de la teora de la probabilidad, el concepto de probabilidad aparece en nuestra vida y en nuestras conversaciones cotidianas. A menudo omos y usamos expresiones tales como: "Probablemente llover maana por la tarde", "es muy probable que el avin llegue tarde", o "hay muchas posibilidades de que pueda reunirse con nosotros para cenar esta noche". Cada una de estas expresiones est basada en el concepto de la probabilidad, o la verosimilitud, de la ocurrencia de algn suceso especfico.

A pesar de que el concepto de probabilidad es una parte tan comn y natural de nuestra experiencia, no existe una nica interpretacin cientfica del trmino probabilidad aceptada por todos los estadsticos, filsofos y dems autoridades cientficas. A travs de los aos, cada interpretacin de la probabilidad propuesta por unos expertos ha sido criticada por otros. De hecho, el verdadero significado de la probabilidad es todava fundamentos de la estadstica. Describiremos aqu tres interpretaciones diferentes de la probabilidad. Cada una de estas interpretaciones puede ser til en la aplicacin de la teora de la probabilidad a problemas prcticos.

La interpretacin frecuencialista de la probabilidad

En muchos problemas, la probabilidad de obtener algn resultado especfico de un proceso puede ser interpretada en el sentido de la frecuencia relativa con la que se obtendra ese resultado si el proceso se repitiera un nmero grande e veces en condiciones similares. Por ejemplo, la probabilidad de obtener una cara cuando se lanza una moneda es considerada debido a que la frecuencia relativa de caras debera de ser aproximadamente cuando la moneda es lanzada un nmero grande de veces en condiciones similares. En otras palabras, se supone que la proporcin de lanzamientos en los que se obtiene una cara sera aproximadamente .

Est claro que las condiciones mencionadas en este ejemplo son muy vagas para servir como base de una definicin cientfica de probabilidad. En primer lugar, se menciona un "nmero grande" de lanzamientos de la moneda, pero no hay una indicacin clara del nmero especfico que podra considerarse suficientemente grande. En segundo lugar, se afirma que la moneda debera de ser lanzada cada vez en "condiciones similares", pero estas condiciones no se describen con precisin. Las condiciones en las cuales se lanza la moneda no pueden ser completamente idnticas para cada lanzamiento porque entonces los resultados seran todos iguales y se obtendran slo caras o slo cruces. De hecho, una persona experimentada puede lanzar una moneda repetidamente y cogerla de tal manera que obtenga una cara en casi

166

PROBABILIDAD Y ESTADISTICA
todos los lanzamientos. Consecuentemente, los lanzamientos no deben ser completamente controlados sino que deben tener algunas caractersticas "aleatorias".

Se afirma , adems, que la frecuencia relativa de caras sera aproximadamente , pero no se especifica un lmite para la variacin posible respecto al valor . Si una moneda fuera lanzada 1 000 000 de veces, no esperaramos obtener exactamente no esperaramos obtener exactamente 500 000 caras. En realidad, nos sorprendera mucho si obtuviramos exactamente 500 000 caras. Por otro lado, tampoco esperaramos que el nmero de caras distara mucho de 500 000. Sera deseable hacer una afirmacin precisa de las verosimilitudes de los diferentes nmeros posibles de caras, pero estas verosimilitudes dependeran necesariamente del mismo concepto de probabilidad que estamos tratando de definir.

Otro inconveniente de la interpretacin frecuencialista de la probabilidad es que slo puede utilizarse para un problema en el que pueda haber, al menos en principio, un nmero grande de repeticiones similares de cierto proceso. Muchos problemas importantes no son de este tipo. Por ejemplo, la interpretacin frecuencialista de la probabilidad no puede ser aplicada directamente a la probabilidad de que un determinado conocido contraiga matrimonio en los prximos dos aos o a la probabilidad de que un proyecto concreto de investigacin mdica conduzca al desarrollo de un nuevo tratamiento para cierta enfermedad dentro de un periodo de tiempo determinado.

La interpretacin clsica de la probabilidad

La interpretacin clsica de la probabilidad est basada en el concepto de resultados igualmente verosmiles. Por ejemplo, cuando se lanza una moneda existen dos resultados posibles: cara o cruz. Si se puede suponer que la ocurrencia de estos resultados es igualmente verosmil, entonces deben tener la misma probabilidad. Puesto que la suma de las probabilidades debe ser 1, tanto la probabilidad de una cara como la probabilidad de una cruz debe ser . Generalizando, si el resultado de algn proceso debe ser uno de n resultados son igualmente verosmiles, entonces la probabilidad de cada resultado es 1/n. Dos dificultades bsicas aparecen cuando se intenta desarrollar una definicin formal de probabilidad desde la interpretacin clsica. En primer lugar, el concepto de resultados de probabilidad igualmente verosmiles se basa en esencia en el concepto de probabilidad que estamos tratando de definir.

Afirmar que dos resultados posibles son igualmente verosmiles es lo mismo que afirmar que los resultados tiene la misma probabilidad . En segundo lugar, no se proporciona un mtodo sistemtico para asignar probabilidades a resultados que no sean igualmente verosmiles. Cuando se lanza una moneda o se arroja un dado equilibrado se escoge una carta de una baraja bien mezclada, los diferentes resultados posibles pueden en general ser considerados igualmente verosmiles debido a la naturaleza del proceso. Sin embargo, cuando el problema es predecir si una persona se casar o si un proyecto de investigacin tendr xito, los resultados posibles no suelen considerarse igualmente verosmiles, y es necesario un mtodo diferente para asignar probabilidades a estos resultados.

166

PROBABILIDAD Y ESTADISTICA

La interpretacin subjetiva de la probabilidad

De acuerdo con la interpretacin subjetiva, o personal, de la probabilidad, la probabilidad que una persona asigna a uno de los posibles resultados de un proceso representa su propio juicio sobre la verosimilitud de que se obtenga el resultado. Este juicio estar basado en las opiniones e informacin de la persona acerca del proceso. Otra persona, que puede tener diferentes opiniones o informacin distinta, puede asignar una probabilidad diferente al mismo resultado. Por esta razn, resulta ms apropiado hablar de la probabilidad subjetiva que asigna cierta persona a un resultado, que de la verdadera probabilidad de ese resultado.

Como ilustracin de esta interpretacin, supongamos que una moneda ha de ser lanzada una vez. Una persona sin informacin especial acerca de la moneda o de la manera en que se lanza podra considerar cara o cruz como resultados igualmente verosmiles. Esa persona asignara entonces una probabilidad subjetiva de a la posibilidad de obtener una cara. La persona que realmente lanza la moneda, sin embargo, podra pensar que una cara es mucho ms verosmil que una cruz. Con objeto de que esta persona sea capaz de asignar probabilidades subjetivas a los resultados, debe expresar su grado de creencia en trminos numricos. Supongamos, por ejemplo, que considera que la verosimilitud de obtener una cara es la misma que la de obtener una carta roja cuando se escoge una carta de una baraja bien mezclada que contiene cuatro cartas rojas y una negra. Puesto que la persona asignara una probabilidad de 4/5 a la posibilidad de obtener una carta roja, debera asignar esa misma probabilidad a la posibilidad de obtener una cara cuando se lanza la moneda.

Esta interpretacin subjetiva de la probabilidad puede ser formalizada. En general, si los juicios de una persona acerca de las verosimilitudes relativas a diversas combinaciones de resultados satisfacen ciertas condiciones de consistencia, entonces puede demostrarse que sus probabilidades subjetivas para los diferentes sucesos posibles pueden ser determinadas en forma nica. La interpretacin subjetiva tiene, sin embargo, dos dificultades. En primer lugar, el requisito de que los juicios de una persona sobre las verosimilitudes relativas a un nmero infinito de sucesos sean completamente consistentes y libres de contradicciones no parece humanamente posible. En segundo lugar, la interpretacin subjetiva no proporciona bases "objetivas" para que dos o ms cientficos que trabajan juntos obtengan una evaluacin conjunta de su estado de conocimientos en un rea cientfica de inters comn.

Por otro lado, aceptar la interpretacin subjetiva de la probabilidad tiene el efecto positivo de subrayar algunos de los aspectos subjetivos de la ciencia. La evaluacin por un determinado cientfico de la probabilidad de algn resultado incierto debe ser, en ltima instancia, su propia evaluacin, basada en todas las evidencias de que dispone. Esta evaluacin puede estar parcialmente basada en la interpretacin frecuencialista de la probabilidad, ya que el cientfico puede tener en cuenta la frecuencia relativa de la ocurrencia de este resultado o de resultados similares en el pasado. Tambin puede basarse en parte la interpretacin clsica de probabilidad, puesto que el cientfico puede tener en cuenta el nmero total de resultados posibles que considera igualmente verosmiles. Sin embargo, la asignacin final de probabilidades numricas es responsabilidad del propio cientfico. La naturaleza subjetiva de la ciencia se manifiesta tambin en el problema especfico que un cientfico particular elige como objeto de estudio de entre la clase de problemas que podra haber elegido en el

166

PROBABILIDAD Y ESTADISTICA
experimento que decide desarrollar al llevar a cabo ese estudio y en las conclusiones que deduce de sus datos experimentales.

La teora matemtica de la probabilidad y la estadstica puede desempear un papel importante en estas elecciones, decisiones y conclusiones. Ms an, esta teora de la probabilidad y la estadstica se puede desarrollar sin considerar la controversia en torno a las diferentes interpretaciones del trmino probabilidad. Esta teora es correcta y puede ser aplicada tilmente, con independencia de la interpretacin de probabilidad que se utiliza en un problema particular.

Definicin clsica de probabilidad La probabilidad es la caracterstica de un evento, que existen razones para creer que ste se realizar. La probabilidad p de que suceda un evento S de un total de n casos posibles igualmente probables es igual a la razn entre el nmero de ocurrencias h de dicho evento (casos favorables) y el nmero total de casos posibles n.

La probabilidad es un nmero (valor) que varia entre 0 y 1. Cuando el evento es imposible se dice que su probabilidad es 0, si el evento es cierto y siempre tiene que ocurrir su probabilidad es 1. La probabilidad de no ocurrencia de un evento est dada por q, donde:

Sabemos que p es la probabilidad de que ocurra un evento y q es la probabilidad de que no ocurra, entonces p + q = 1 Simblicamente el espacio de resultados, que normalmente se denota por O, es el espacio que consiste en todos los resultados que son posibles. Los resultados, que se denota por ? 1,?2, etctera, son elementos del espacio O. Definicin segn la frecuencia relativa y definicin axiomtica Segn Spiegel (1) la definicin clsica de la probabilidad se define con base a s misma (igualmente factible es sinnimo de igualmente probable) se define la probabilidad estimada o emprica basada en la frecuencia relativa de aparicin de un suceso S cuando O es muy grande. La probabilidad de un suceso es una medida que se escribe como ,

y mide con qu frecuencia ocurre algn suceso si se hace algn experimento indefinidamente.

166

PROBABILIDAD Y ESTADISTICA
La definicin anterior es complicada de representar matemticamente ya que O debiera ser infinito. Otra manera de definir la probabilidad es de forma axiomtica esto estableciendo las relaciones o propiedades que existen entre los conceptos y operaciones que la componen. Vase tambin: Axiomas de probabilidad Probabilidad discreta Este tipo de probabilidad, es aquel que puede tomar slo ciertos valores diferentes que son el resultado de la cuenta de alguna caracterstica de inters. Estos Valores pueden ser de varios tipos ya sean Finitos o Infinitos, Numerables o innumerables

EJEMPLO 1: sea X el nmero de caras obtenidas al lanzar 3 veces una moneda. Aqu los valores de X son x = 0, 1, 2, 3 Como se muestra en el ejemplo 1 estos valores son Numerables, y Finitos, ya que se nos da un nmero de especifico de casos y solo nos pueden dar un nmero especifico de resultados. Probabilidad continua Una variable aleatoria es una funcin que da un valor numrico a cada suceso en O. Funcin de densidad Artculo principal: Funcin de densidad La funcin de densidad, o densidad de probabilidad de una variable aleatoria, es una funcin a partir de la cual se obtiene la probabilidad de cada valor que toma la variable. Su integral en el caso de variables aleatorias continuas es la distribucin de probabilidad. En el caso de variables aleatorias discretas la distribucin de probabilidad se obtiene a travs del sumatorio de la funcin de densidad. Probabilidad condicional Artculo principal: Probabilidad condicionada Se llama probabilidad condicional o probabilidad condicionada a la probabilidad de que un suceso se cumpla habindose cumplido ya otro. Se nota "probabilidad de A sabiendo que B se ha cumplido" de la siguiente manera:

Dicha probabilidad se calcular de la siguiente forma:

166

PROBABILIDAD Y ESTADISTICA

PROBABILIDAD: RELACION ENTRE SUCESOS


Entre los sucesos compuestos se pueden establecer distintas relaciones: a) Un suceso puede estar contenido en otro: las posibles soluciones del primer suceso tambin lo son del segundo, pero este segundo suceso tiene adems otras soluciones suyas propias. Ejemplo: lanzamos un dado y analizamos dos sucesos: a) que salga el nmero 6, y b) que salga un nmero par. Vemos que el suceso a) est contenido en el suceso b). Siempre que se da el suceso a) se da el suceso b), pero no al contrario. Por ejemplo, si el resultado fuera el 2, se cumplira el suceso b), pero no el el a). b) Dos sucesos pueden ser iguales: esto ocurre cuando siempre que se cumple uno de ellos se cumple obligatoriamente el otro y viceversa. Ejemplo: lanzamos un dado al aire y analizamos dos sucesos: a) que salga nmero par, y b) que salga mltiplo de 2. Vemos que las soluciones coinciden en ambos casos. c) Unin de dos o ms sucesos: la unin ser otro suceso formado por todos los elementos de los sucesos que se unen. Ejemplo: lanzamos un dado al aire y analizamos dos sucesos: a) que salga nmero par y b) que el resultado sea mayor que 3. El suceso unin estara formado por los siguientes resultados: el 2, el 4, el 5 y el 6 d) Interseccin de sucesos: es aquel suceso compuesto por los elementos comunes de dos o ms sucesos que se intersectan. Ejemplo: lanzamos un dado al aire, y analizamos dos sucesos: a) que salga nmero par, y b) que sea mayor que 4. La interseccin de estos dos sucesos tiene un slo elemento, el nmero 6 (es el nico resultado comn a ambos sucesos: es mayor que 4 y es nmero par). e) Sucesos incompatibles: son aquellos que no se pueden dar al mismo tiempo ya que no tienen elementos comunes (su intereseccin es el conjunto vacio). Ejemplo: lanzamos un dado al aire y analizamos dos sucesos: a) que salga un nmero menor que 3, y b) que salga el nmero 6. Es evidente que ambos no se pueden dar al mismo tiempo.

166

PROBABILIDAD Y ESTADISTICA
f) Sucesos complementarios: son aquellos que si no se da uno, obligatoriamente se tiene que dar el otro. Ejemplo: lanzamos un dado al aire y analizamos dos sucesos: a) que salga un nmero par, y b) que salga un nmero impar. Vemos que si no se da el primero se tiene que dar el segundo (y viceversa).

CALCULO DE PROBABILIDADES
Probabilidad Como hemos comentado anteriormente, la probabilidad mide la mayor o menor posibilidad de que se d un determinado resultado (suceso) cuando se realiza un experimento aleatorio. La probabilidad toma valores entre 0 y 1 (o expresados en tanto por ciento, entre 0% y 100%): El valor cero corresponde al suceso imposible : lanzamos un dado al aire y la probabilidad de que salga el nmero 7 es cero (al menos, si es un dado certificado por la OMD, "Organizacin Mundial de Dados"). El valor uno corresponde al suceso seguro: lanzamos un dado al aire y la probabilidad de que salga cualquier nmero del 1 al 6 es igual a uno (100%). El resto de sucesos tendr probabilidades entre cero y uno : que ser tanto mayor cuanto ms probable sea que dicho suceso tenga lugar. Cmo se mide la probabilidad? Uno de los mtodos ms utilizados es aplicando la Regla de Laplace: define la probabilidad de un suceso como el cociente entre casos favorables y casos posibles. P(A) = Casos favorables / casos posibles Veamos algunos ejemplos: a) Probabilidad de que al lanzar un dado salga el nmero 2 : el caso favorable es tan slo uno (que salga el dos), mientras que los casos posibles son seis (puede salir cualquier nmero del uno al seis). Por lo tanto: P(A) = 1 / 6 = 0,166 (o lo que es lo mismo, 16,6%) b) Probabilidad de que al lanzar un dado salga un nmero par : en este caso los casos favorables son tres (que salga el dos, el cuatro o el seis), mientras que los casos posibles siguen siendo seis. Por lo tanto:

166

PROBABILIDAD Y ESTADISTICA
P(A) = 3 / 6 = 0,50 (o lo que es lo mismo, 50%) c) Probabilidad de que al lanzar un dado salga un nmero menor que 5 : en este caso tenemos cuatro casos favorables (que salga el uno, el dos, el tres o el cuatro), frente a los seis casos posibles. Por lo tanto: P(A) = 4 / 6 = 0,666 (o lo que es lo mismo, 66,6%) d) Probabilidad de que nos toque el "Gordo" de Navidad : tan slo un caso favorable, el nmero que jugamos (qu triste...), frente a 100.000 casos posibles. Por lo tanto: P(A) = 1 / 100.000 = 0,00001 (o lo que es lo mismo, 0,001%) Merece la pena ...... Por cierto, tiene la misma probabilidad el nmero 45.264, que el nmero 00001, pero cul de los dos compraras? Para poder aplicar la Regla de Laplace el experimento aleatorio tiene que cumplir dos requisitos: a) El nmero de resultados posibles (sucesos) tiene que ser finito. Si hubiera infinitos resultados, al aplicar la regla "casos favorables / casos posibles" el cociente siempre sera cero. b) Todos los sucesos tienen que tener la misma probabilidad. Si al lanzar un dado, algunas caras tuvieran mayor probabilidad de salir que otras, no podramos aplicar esta regla. A la regla de Laplace tambin se le denomina "probabilidad a priori", ya que para aplicarla hay que conocer antes de realizar el experimento cuales son los posibles resultados y saber que todos tienen las mismas probabilidades. Y si el experimento aleatorio no cumple los dos requisitos indicados, qu hacemos?, ponemos una denuncia? No, no va a ser necesario denunciar a nadie, ya que en este caso podemos acudir a otro modelo de clculo de probabilidades que se basa en la experiencia (modelo frecuentista): Cuando se realiza un experimento aleatorio un nmero muy elevado de veces, las probabilidades de los diversos posibles sucesos empiezan a converger hacia valores determinados, que son sus respectivas probabilidades. Ejemplo: si lanzo una vez una moneda al aire y sale "cara", quiere decir que el suceso "cara" ha aparecido el 100% de las veces y el suceso "cruz" el 0%. Si lanzo diez veces la moneda al aire, es posible que el suceso "cara" salga 7 veces y el suceso "cruz" las 3 restantes. En este caso, la probabilidad del suceso "cara" ya no sera del 100%, sino que se habra reducido al 70%. Si repito este experimento un nmero elevado de veces, lo normal es que las probabilidades de los sucesos "cara" y "cruz" se vayan aproximando al 50% cada una. Este 50% ser la probabilidad de estos sucesos segn el modelo frecuentista. En este modelo ya no ser necesario que el nmero de soluciones sea finito, ni que todos los sucesos tengan la misma probabilidad.

166

PROBABILIDAD Y ESTADISTICA
Ejemplo: si la moneda que utilizamos en el ejemplo anterior fuera defectuosa (o estuviera trucada), es posible que al repetir dicho experimento un nmero elevado de veces, la "cara" saliera con una frecuencia, por ejemplo, del 65% y la "cruz" del 35%. Estos valores seran las probabilidades de estos dos sucesos segn el modelo frecuentista. A esta definicin de la probabilidad se le denomina probabilidad a posteriori, ya que tan slo repitiendo un experimento un nmero elevado de veces podremos saber cual es la probabilidad de cada suceso.

PROBABILIDAD DE SUCESOS
Probabilidad de sucesos Al definir los sucesos hablamos de las diferentes relaciones que pueden guardar dos sucesos entre s, as como de las posibles relaciones que se pueden establecer entre los mismos. Vamos a ver ahora cmo se refleja esto en el clculo de probabilidades.

a) Un suceso puede estar contenido en otro: entonces, la probabilidad del primer suceso ser menor que la del suceso que lo contiene. Ejemplo: lanzamos un dado y analizamos dos sucesos: a) que salga el nmero 6, y b) que salga un nmero par. Dijimos que el suceso a) est contenido en el suceso b). P(A) = 1/6 = 0,166 P(B) = 3 / 6 = 0,50 Por lo tanto, podemos ver que la probabilidad del suceso contenido, suceso a), es menor que la probabilidad del suceso que lo contiene, suceso b).

b) Dos sucesos pueden ser iguales : en este caso, las probabilidades de ambos sucesos son las mismas. Ejemplo: lanzamos un dado al aire y analizamos dos sucesos: a) que salga nmero par, y b) que salga mltiplo de 2. Las soluciones coinciden en ambos casos. P(A) = 3 / 6 = 0,50 P(B) = 3 / 6 = 0,50

166

PROBABILIDAD Y ESTADISTICA

c) Interseccin de sucesos: es aquel suceso compuesto por los elementos comunes de los dos o ms sucesos que se intersectan. La probabilidad ser igual a la probabilidad de los elemntos comunes. Ejemplo: lanzamos un dado al aire y analizamos dos sucesos: a) que salga nmero par, y b) que sea mayor que 3. La interseccin de estos dos sucesos tiene dos elementos: el 4 y el 6. Su probabilidad ser por tanto: P(A B) = 2 / 6 = 0,33

d) Unin de dos o ms sucesos : la probabilidad de la unin de dos sucesos es igual a la suma de las probabilidades individuales de los dos sucesos que se unen, menos la probabilidad del suceso interseccin Ejemplo: lanzamos un dado al aire y analizamos dos sucesos: a) que salga nmero par, y b) que el resultado sea mayor que 3. El suceso unin estara formado por los siguientes resultados: el 2, el 4, el 5 y el 6. P(A) = 3 / 6 = 0,50 P(B) = 3 / 6 = 0,50 P (A B) = 2 / 6 = 0,33 Por lo tanto, P (A u B) = (0,50 + 0,50) - 0,33 = 0,666

e) Sucesos incompatibles: la probabilidad de la unin de dos sucesos incompatibles ser igual a la suma de las probabilidades de cada uno de los sucesos (ya que su interseccin es el conjunto vacio y por lo tanto no hay que restarle nada). Ejemplo: lanzamos un dado al aire y analizamos dos sucesos: a) que salga un nmero menor que 3, y b) que salga el nmero 6. La probabilidad del suceso unin de estos dos sucesos ser igual a: P(A) = 2 / 6 = 0,333 P(B) = 1 / 6 = 0,166 Por lo tanto, P(A u B) = 0,33 + 0,166 = 0,50

166

PROBABILIDAD Y ESTADISTICA
f) Sucesos complementarios: la probabilidad de un suceso complementario a un suceso (A) es igual a 1 - P(A) Ejemplo: lanzamos un dado al aire. el suceso (A) es que salga un nmero par, luego su complementario, suceso (B), es que salga un nmero impar. La probabilidad del suceso (A) es igual a : P(A) = 3 / 6 = 0,50 Luego, la probabilidad del suceso (B) es igual a: P(B) = 1 - P(A) = 1 - 0,50 = 0,50 Se puede comprobar aplicando la regla de "casos favorables / casos posibles": P(B) = 3 / 6 = 0,50 g) Unin de sucesos complementarios: la probabilidad de la unin de dos sucesos complementarios es igual a 1. Ejemplo: seguimos con el ejemplo anterior: a) que salga un nmero par, y b) que salga un nmero impar. La probabilidad del suceso unin de estos dos sucesos ser igual a: P(A) = 3 / 6 = 0,50 P(B) = 3 / 6 = 0,50 Por lo tanto, P(A U B) = 0,50 + 0,50 = 1

COMBINACIONES, VARIACIONES Y PERMUTACIONES (I)


Para aplicar la Regla de Laplace, el clculo de los sucesos favorables y de los sucesos posibles a veces no plantea ningn problema, ya que son un nmero reducido y se pueden calcular con facilidad: Por ejemplo: Probabilidad de que al lanzar un dado salga el nmero 2. Tan slo hay un caso favorable, mientras que los casos posibles son seis. Probabilidad de acertar al primer intento el horscopo de una persona. Hay un caso favorable y 12 casos posibles. Sin embargo, a veces calcular el nmero de casos favorables y casos posibles es complejo y hay que aplicar reglas matemticas:

166

PROBABILIDAD Y ESTADISTICA
Por ejemplo: 5 matrimonios se sientan aleatoriamente a cenar y queremos calcular la probabilidad de que al menos los miembros de un matrimonio se sienten junto. En este caso, determinar el nmero de casos favorables y de casos posibles es complejo. Las reglas matemticas que nos pueden ayudar son el clculo de combinaciones, el clculo de variaciones y el clculo de permutaciones. a) Combinaciones: Determina el nmero de subgrupos de 1, 2, 3, etc. elementos que se pueden formar con los "n" elementos de una nuestra. Cada subgrupo se diferencia del resto en los elementos que lo componen, sin que influya el orden. Por ejemplo, calcular las posibles combinaciones de 2 elementos que se pueden formar con los nmeros 1, 2 y 3. Se pueden establecer 3 parejas diferentes: (1,2), (1,3) y (2,3). En el clculo de combinaciones las parejas (1,2) y (2,1) se consideran idnticas, por lo que slo se cuentan una vez. b) Variaciones: Calcula el nmero de subgrupos de 1, 2, 3, etc.elementos que se pueden establecer con los "n" elementos de una muestra. Cada subgrupo se diferencia del resto en los elementos que lo componen o en el orden de dichos elementos (es lo que le diferencia de las combinaciones). Por ejemplo, calcular las posibles variaciones de 2 elementos que se pueden establecer con los nmero 1, 2 y 3. Ahora tendramos 6 posibles parejas: (1,2), (1,3), (2,1), (2,3), (3,1) y (3,3). En este caso los subgrupos (1,2) y (2,1) se consideran distintos. c) Permutaciones: Clcula las posibles agrupaciones que se pueden establecer con todos los elementos de un grupo, por lo tanto, lo que diferencia a cada subgrupo del resto es el orden de los elementos. Por ejemplo, calcular las posibles formas en que se pueden ordenar los nmero 1, 2 y 3. Hay 6 posibles agrupaciones: (1, 2, 3), (1, 3, 2), (2, 1, 3), (2, 3, 1), (3, 1, 2) y (3, 2, 1)

COMBINACIONES, VARIACIONES Y PERMUTACIONES (II)


Cmo se calculan? a) Combinaciones: Para calcular el nmero de combinaciones se aplica la siguiente frmula:

166

PROBABILIDAD Y ESTADISTICA

El termino " n ! " se denomina "factorial de n" y es la multiplicacin de todos los nmeros que van desde "n" hasta 1. Por ejemplo: 4 ! = 4 * 3 * 2 * 1 = 24 La expresin "Cm,n" representa las combinaciones de "m" elementos, formando subgrupos de "n" elementos. Ejemplo: C10,4 son las combinaciones de 10 elementos agrupndolos en subgrupos de 4 elementos:

Es decir, podramos formar 210 subgrupos diferentes de 4 elementos, a partir de los 10 elementos. b) Variaciones: Para calcular el nmero de variaciones se aplica la siguiente frmula:

La expresin "Vm,n" representa las variaciones de "m" elementos, formando subgrupos de "n" elementos. En este caso, como vimos en la leccin anterior, un subgrupo se diferenciar del resto, bien por los elementos que lo forman, o bien por el orden de dichos elementos. Ejemplo: V10,4 son las variaciones de 10 elementos agrupndolos en subgrupos de 4 elementos:

Es decir, podramos formar 5.040 subgrupos diferentes de 4 elementos, a partir de los 10 elementos. c) Permutaciones: Para calcular el nmero de permutaciones se aplica la siguiente frmula:

166

PROBABILIDAD Y ESTADISTICA
La expresin "Pm" representa las permutaciones de "m" elementos, tomando todos los elementos. Los subgrupos se diferenciaran nicamente por el orden de los elementos. Ejemplo: P10 son las permutaciones de 10 elementos:

Es decir, tendramos 3.628.800 formas diferentes de agrupar 10 elementos.

COMBINACIONES, VARIACIONES Y PERMUTACIONES (III)


Vamos a analizar ahora que ocurrira con el clculo de las combinaciones, de las variaciones o de las permutaciones en el supuesto de que al formar los subgrupos los elementos pudieran repetirse. Por ejemplo: tenemos bolas de 6 colores diferentes y queremos formar subgrupos en los que pudiera darse el caso de que 2, 3, 4 o todas las bolas del subgrupo tuvieran el mismo color. En este caso no podramos utilizar las frmulas que vimos en la leccin anterior. a) Combinaciones con repeticin: Para calcular el nmero de combinaciones con repeticin se aplica la siguiente frmula:

Ejemplo: C'10,4 son las combinaciones de 10 elementos con repeticin, agrupndolos en subgrupos de 4, en los que 2, 3 o los 4 elementos podran estar repetidos:

Es decir, podramos formar 715 subgrupos diferentes de 4 elementos. b) Variaciones con repeticin: Para calcular el nmero de variaciones con repeticin se aplica la siguiente frmula:

166

PROBABILIDAD Y ESTADISTICA

Ejemplo: V'10,4 son las variaciones de 10 elementos con repeticin, agrupndolos en subgrupos de 4 elementos:

Es decir, podramos formar 10.000 subgrupos diferentes de 4 elementos. c) Permutaciones con repeticin: Para calcular el nmero de permutaciones con repeticin se aplica la siguiente frmula:

Son permutaciones de "m" elementos, en los que uno de ellos se repite " x1 " veces, otro " x2 " veces y as ... hasta uno que se repite " xk " veces. Ejemplo: Calcular las permutaciones de 10 elementos, en los que uno de ellos se repite en 2 ocasiones y otro se repite en 3 ocasiones:

Es decir, tendramos 302,400 formas diferentes de agrupar estos 10 elementos.

EJERCICIOS
1.- Ejercicio

Calcular la probabilidad de acertar los 14 signos de la quiniela: Solucin: Se aplica la Regla de Laplace (casos favorables / casos posibles). El caso favorable es tan slo uno (acertar los 14 signos). Los casos posibles se calculan como variaciones con repeticin de 3 elementos (1, X y 2), tomados de 14 en 14 (los signos que hay que rellenar). Son variaciones y no combinaciones ya que el orden influye: no es lo mismo (1,1,X) que (1, X, 1). Y son con repeticin, ya que cualquiera de los signos (1, X y 2) se puede repetir hasta 14 veces.

166

PROBABILIDAD Y ESTADISTICA
Por lo tanto, los casos posibles son:

Y la probabilidad de acertar los 14 resultados es:

No demasiado elevada....pero el que la sigue la consigue.

2.- Ejercicio Y la probabilidad de acertar 12 signos de la quiniela: Solucin: Aplicamos nuevamente la Regla de Laplace. En este caso los casos favorables se calculan como combinaciones de 14 elementos tomados de 2 en 2, de esta manera obtenemos todas las posibles alternativas de fallar 2 resultados de 14 (lo que equivale a acertar 12 resultados). Utilizamos combinaciones y no variaciones ya que el orden no importa (da lo mismo fallar el 3 y el 6, que el 6 y el 3)

Los casos posibles siguen siendo los mismos:

Por lo que la probabilidad de acertar 12 resultados es:

Por lo tanto, tenemos ms probabilidades de acertar 12 resultados que 14 (ser por eso por lo que pagan menos?).

3.- Ejercicio Calcular la probabilidad de, en una carrera de 12 caballos, acertar los 3 que quedan primeros (sin importar cual de ellos queda primero, cual segundo y cual tercero). Solucin: Se aplica la Regla de Laplace. El caso favorable es tan slo uno: los 3 caballos que entran en primer lugar. Los casos posibles se calculan como combinaciones de 12 elementos tomados de 3 en 3 (es decir, determinamos todos las posibles alternativas de 3 caballos que

166

PROBABILIDAD Y ESTADISTICA
pueden entrar en las 3 primeras posiciones). Como el orden de estos 3 primeros caballos no importa, utilizamos combinaciones en lugar de variaciones. Por lo tanto, los casos posibles son:

Por lo que la probabilidad de acertar los 3 caballos ganadores es:

Algo mayor que en las quinielas.... Eso s, se paga menos.

4.- Ejercicio Y si hubiera que acertar, no slo los 3 caballos que ganan, sino el orden de su entrada en meta. Solucin: El caso favorable sigue siendo uno: los 3 caballos que entran en primer lugar, colocados en su orden correspondiente. Los casos posibles se calculan ahora como variaciones (ya que el orden influye) de 12 elementos tomados de 3 en 3 (calculamos todas las posibles maneras en que los 12 caballos podran ocupar las 3 primeras posiciones.

Por lo que la probabilidad de acertar los 3 caballos ganadores es:

Menor que en el ejemplo 3. Ya no vale acertar que 3 caballos entran en primer lugar, sino que tenemos que acertar el orden de su entrada.

PROBABILIDAD COMPUESTA
La probabilidad compuesta (o regla de multiplicacin de probabilidades) se deriva de la probabilidad condicionada:

166

PROBABILIDAD Y ESTADISTICA
La probabilidad de que se den simultneamente dos sucesos (suceso interseccin de A y B) es igual a la probabilidad a priori del suceso A multiplicada por la probabilidad del suceso B condicionada al cumplimiento del suceso A. La frmula para calcular esta probabilidad compuesta es:

Ejemplo 1 : Estudiamos el suceso A (porcentaje de varones mayores de 40 aos casados) y el suceso B (varones mayores de 40 aos con ms de 2 hijos) y obtenemos la siguiente informacin: Un 35% de los varones mayores de 40 aos estn casados. De los varones mayores de 40 aos y casados, un 30% tienen ms de 2 hijos (suceso B condicionado al suceso A). Calcular la probabilidad de que un varn mayor de 40 aos est casado y tenga ms de 2 hijos (suceso interseccin de A y B). Por lo tanto: P (A) = 0,35 P (B/A) = 0,30 P (A B) = 0,35 * 0,30 = 0,105 Es decir, un 10,5% de los varones mayores de 40 aos estn casados y tienen ms de 2 hijos.

2 ejemplo: Estudiamos el suceso A (alumnos que hablan ingls) y el suceso B (alumnos que hablan alemn) y obtenemos la siguiente informacin: Un 50% de los alumnos hablan ingls. De los alumnos que hablan ingls, un 20% hablan tambin alemn (suceso B condicionado al suceso A). Calcular la probabilidad de que un alumno hable ingls y alemn (suceso interseccin de A y B). Por lo tanto: P (A) = 0,50 P (B/A) = 0,20 P (A B) = 0,50 * 0,20 = 0,10 Es decir, un 10% de los alumnos hablan ingls y alemn.

166

PROBABILIDAD Y ESTADISTICA

TEOREMA DE LA PROBABILIDAD TOTAL


El Teorema de la probabilidad total nos permite calcular la probabilidad de un suceso a partir de probabilidades condicionadas: Ejemplo: supongamos que si llueve la probabilidad de que ocurra un accidentes es x% y si hace buen tiempo dicha probabilidad es y%. Este teorema nos permite deducir cul es la probabilidad de que ocurra un accidente si conocemos la probabilidad de que llueva y la probabilidad de que haga buen tiempo. La frmula para calcular esta probabilidad es:

Es decir, la probabilidad de que ocurra el suceso B (en nuestro ejemplo, que ocurra un accidente) es igual a la suma de multiplicar cada una de las probabilidades condicionadas de este suceso con los diferentes sucesos A (probabilidad de un accidente cuando llueve y cuando hace buen tiempo) por la probabilidad de cada suceso A. Para que este teorema se pueda aplicar hace falta cumplir un requisito: Los sucesos A tienen que formar un sistema completo , es decir, que contemplen todas las posibilidades (la suma de sus probabilidades debe ser el 100%). Ejemplo: al tirar una moneda, el suceso "salir cara" y el suceso "salir cruz" forman un sistema completo, no hay ms alternativas: la suma de sus probabilidades es el 100% Ejemplo: al tirar un dado, que salga el 1, el 2, el 3, o el 4 no forman un sistema completo, ya que no contempla todas las opciones (podra salir el 5 o el 6). En este caso no se podra aplicar el teorema de la probabilidad total.

Ejercicio 1: En un saquito hay papeletas de tres colores, con las siguientes probabilidades de ser elegidas: a) Amarilla: probabilidad del 50%. b) Verde: probabilidad del 30% c) Roja: probabilidad del 20%. Segn el color de la papeleta elegida, podrs participar en diferentes sorteos. As, si la papeleta elegida es: a) Amarilla: participas en un sorteo con una probabilidad de ganar del 40%.

166

PROBABILIDAD Y ESTADISTICA
b) Verde: participas en otro sorteo con una probabilidad de ganar del 60% c) Roja: participas en un tercer sorteo con una probabilidad de ganar del 80%. Con esta informacin, qu probabilidad tienes de ganar el sorteo en el que participes?: 1.- Las tres papeletas forman un sistema completo: sus probabilidades suman 100% 2.- Aplicamos la frmula:

Luego, P (B) = (0,50 * 0,40) + (0,30 * 0,60) + (0,20 * 0,80) = 0,54 Por tanto, la probabilidad de que ganes el sorteo es del 54%.

Ejercicio 2: Van a cambiar a tu jefe y se barajan diversos candidatos: a) Carlos, con una probabilidad del 60% b) Juan, con una probabilidad del 30% c) Luis, con una probabilidad del 10% En funcin de quien sea tu prximo jefe, la probabilidad de que te suban el sueldo es la siguiente: a) Si sale Carlos: la probabilidad de que te suban el sueldo es del 5%. b) Si sale Juan: la probabilidad de que te suban el sueldo es del 20%. c) Si sale Luis: la probabilidad de que te suban el sueldo es del 60%. En definitiva, cual es la probabilidad de que te suban el sueldo?: 1.- Los tres candidatos forman un sistema completo 2.- Aplicamos la frmula: P (B) = (0,60 * 0,05) + (0,30 * 0,20) + (0,10 * 0,60) = 0,15 Por tanto, la probabilidad de que te suban el sueldo es del 15%. Lo llevas claro amigo...

TEOREMA DE BAYES
166

PROBABILIDAD Y ESTADISTICA

El Teorema de Bayes viene a seguir el proceso inverso al que hemos visto en el Teorema de la probabilidad total: Teorema de la probabilidad total: a partir de las probabilidades del suceso A (probabilidad de que llueva o de que haga buen tiempo) deducimos la probabilidad del suceso B (que ocurra un accidente). Teorema de Bayes: a partir de que ha ocurrido el suceso B (ha ocurrido un accidente) deducimos las probabilidades del suceso A (estaba lloviendo o haca buen tiempo?). La frmula del Teorema de Bayes es:

Tratar de explicar estar frmula con palabras es un galimatas, as que vamos a intentar explicarla con un ejemplo. De todos modos, antes de entrar en el ejercicio, recordar que este teorema tambin exige que el suceso A forme un sistema completo.

Ejercicio 1: El parte meteorolgico ha anunciado tres posibilidades para el fin de semana: a) Que llueva: probabilidad del 50%. b) Que nieve: probabilidad del 30% c) Que haya niebla: probabilidad del 20%. Segn estos posibles estados meteorolgicos, la posibilidad de que ocurra un accidente es la siguiente: a) Si llueve: probabilidad de accidente del 10%. b) Si nieva: probabilidad de accidente del 20% c) Si hay niebla: probabilidad de accidente del 5%. Resulta que efectivamente ocurre un accidente y como no estabamos en la ciudad no sabemos que tiempo hizo (nev, llovo o hubo niebla). El teorema de Bayes nos permite calcular estas probabilidades: Las probabilidades que manejamos antes de conocer que ha ocurrido un accidente se denominan "probabilidades a priori" (lluvia con el 60%, nieve con el 30% y niebla con el 10%). Una vez que incorporamos la informacin de que ha ocurrido un accidente, las probabilidades del suceso A cambian: son probabilidades condicionadas P (A/B), que se denominan "probabilidades a posteriori". Vamos a aplicar la frmula:

166

PROBABILIDAD Y ESTADISTICA

a) Probabilidad de que estuviera lloviendo:

La probabilidad de que efectivamente estuviera lloviendo el da del accidente (probabilidad a posteriori) es del 71,4%.

b) Probabilidad de que estuviera nevando:

La probabilidad de que estuviera nevando es del 21,4%.

c) Probabilidad de que hubiera niebla:

La probabilidad de que hubiera niebla es del 7,1%

INDEPENDENCIA DE SUCESOS
Dos sucesos son independientes entre s, si la ocurrencia de uno de ellos no afecta para nada a la ocurrencia del otro: Ejemplo: el suceso estatura de los alumnos de una clase y el color del pelo son independientes: el que un alumno sea ms o menos alto no va a influir en el color de su cabello, ni viceversa.

166

PROBABILIDAD Y ESTADISTICA
Para que dos sucesos sean independientes tienen que verificar al menos una de las siguientes condiciones: P (B/A) = P (B) es decir, que la probabilidad de que se de el suceso B, condicionada a que previamente se haya dado el suceso A, es exactamente igual a la probabilidad de B. Ejemplo: la probabilidad de que al tirar una moneda salga cara (suceso B), condicionada a que haga buen tiempo (suceso A), es igual a la propia probabilidad del suceso B. P (A/B) = P (A) es decir, que la probabilidad de que se de el suceso A, condicionada a que previamente se haya dado el suceso B, es exactamente igual a la probabilidad de A. Ejemplo: la probabilidad de que haga buen tiempo (suceso A), condicionada a que al tirar una moneda salga cara (suceso B), es igual a la propia probabilidad del suceso A. P (A B) = P (A) * P (B) es decir, que la probabilidad de que se de el suceso conjunto A y B es exactamente igual a la probabilidad del suceso A multiplicada por la probabilidsad del suceso B. Ejemplo: la probabilidad de que haga buen tiempo (suceso A) y salga cara al tirar una moneda (suceso B), es igual a la probabilidad del suceso A multiplicada por la probabilidad del suceso B Si el suceso A es independiente del suceso B , entonces el suceso B tambin es independiente del suceso A. Ejemplo 1: analicemos dos sucesos: Suceso A: la probabilidad de que haga buen tiempo es del 0,4 Suceso B: la probabilidad de tener un accidente es del 0,1 Suceso interseccin: la probabilidad de que haga buen tiempo y tener un accidente es del 0,08 Veamos si se cumple alguna de las condiciones sealadas: P (B/A) = P (A B) / P (A) = 0,08 / 0,4 = 0,2 (que no es igual a P (B)) P (A/B) = P (A B) / P (B) = 0,08 / 0,6 = 0,133 (que no es igual a P (A)) P (A B) = 0,08 (que no es igual a P (A) multiplicado por P (B)) Por lo tanto, no se cumple ninguna de las tres condiciones sealadas por lo que estos dos sucesos no son independientes, sino que existe algn grado de dependencia entre ellos. Ejemplo 2: analicemos dos sucesos: Suceso A: la probabilidad de que haga buen tiempo es del 0,4 Suceso B: la probabilidad de salir cara al lanzar una moneda es del 0,5 Suceso interseccin: la probabilidad de que haga buen tiempo y que salga cara es 0,2

166

PROBABILIDAD Y ESTADISTICA
Veamos si se cumple alguna de las condiciones sealadas: P (B/A) = P (A B) / P (A) = 0,2 / 0,4 = 0,5 (igual que P (B)) P (A/B) = P (A B) / P (B) = 0,2 / 0,6 = 0,4 (igual que P (A)) P (A B) = 0,2 (igual a P (A) multiplicado por P (B)) Por lo tanto, estos dos sucesos s son independientes.

DISTRIBUCIONES DE PROBABILIDAD
Distribuciones discretas y continuas Las distribuciones discretas son aquellas en las que la variable puede pude tomar un nmero determinado de valores: Ejemplo: si se lanza una moneda al aire puede salir cara o cruz; si se tira un dado puede salir un nmero de 1 al 6; en una ruleta el nmero puede tomar un valor del 1 al 32. Las distribuciones continuas son aquellas que presentan un nmero infinito de posibles soluciones: Ejemplo: El peso medio de los alumnos de una clase puede tomar infinitos valores dentro de cierto intervalo (42,37 kg, 42,3764 kg, 42, 376541kg, etc); la esperanza media de vida de una poblacin (72,5 aos, 7,513 aos, 72, 51234 aos). Vamos a comenzar por estudiar las principales distribuciones discretas. Distribuciones discretas: Bernouilli Es aquel modelo que sigue un experimento que se realiza una sola vez y que puede tener dos soluciones: acierto o fracaso: Cuando es acierto la variable toma el valor 1 Cuando es fracaso la variable toma el valor 0 Ejemplo: Probabilidad de salir cara al lanzar una moneda al aire (sale cara o no sale); probabilidad de ser admitido en una universidad (o te admiten o no te admiten); probabilidad de acertar una quiniela (o aciertas o no aciertas) Al haber nicamente dos soluciones se trata de sucesos complementarios: A la probabilidad de xito se le denomina "p"

166

PROBABILIDAD Y ESTADISTICA
A la probabilidad de fracaso se le denomina "q" Verificndose que: p+q=1 Veamos los ejemplos anteriores : Ejemplo 1: Probabilidad de salir cara al lanzar una moneda al aire: Probabilidad de que salga cara: p = 0,5 Probabilidad de que no salga cara: q = 0,5 p + q = 0,5 + 0,5 = 1 Ejemplo 2: Probabilidad de ser admitido en la universidad: Probabilidad de ser admitido: p = 0,25 Probabilidad de no ser admitido: q = 0,75 p + q = 0,25 + 0,75 = 1 Ejemplo 3: Probabilidad de acertar una quiniela: Probabilidad de acertar: p = 0,00001 Probabilidad de no acertar: q = 0,99999 p + q = 0,00001 + 0,99999 = 1

DISTRI. DISCRETAS: BERNOUILLI


Distribuciones discretas y continuas Las distribuciones discretas son aquellas en las que la variable puede pude tomar un nmero determinado de valores: Ejemplo: si se lanza una moneda al aire puede salir cara o cruz; si se tira un dado puede salir un nmero de 1 al 6; en una ruleta el nmero puede tomar un valor del 1 al 32. Las distribuciones continuas son aquellas que presentan un nmero infinito de posibles soluciones: Ejemplo: El peso medio de los alumnos de una clase puede tomar infinitos valores dentro de cierto intervalo (42,37 kg, 42,3764 kg, 42, 376541kg, etc); la esperanza media de vida de una poblacin (72,5 aos, 7,513 aos, 72, 51234 aos).

166

PROBABILIDAD Y ESTADISTICA
Vamos a comenzar por estudiar las principales distribuciones discretas. Distribuciones discretas: Bernouilli Es aquel modelo que sigue un experimento que se realiza una sola vez y que puede tener dos soluciones: acierto o fracaso: Cuando es acierto la variable toma el valor 1 Cuando es fracaso la variable toma el valor 0 Ejemplo: Probabilidad de salir cara al lanzar una moneda al aire (sale cara o no sale); probabilidad de ser admitido en una universidad (o te admiten o no te admiten); probabilidad de acertar una quiniela (o aciertas o no aciertas) Al haber nicamente dos soluciones se trata de sucesos complementarios: A la probabilidad de xito se le denomina "p" A la probabilidad de fracaso se le denomina "q" Verificndose que: p+q=1 Veamos los ejemplos anteriores : Ejemplo 1: Probabilidad de salir cara al lanzar una moneda al aire: Probabilidad de que salga cara: p = 0,5 Probabilidad de que no salga cara: q = 0,5 p + q = 0,5 + 0,5 = 1 Ejemplo 2: Probabilidad de ser admitido en la universidad: Probabilidad de ser admitido: p = 0,25 Probabilidad de no ser admitido: q = 0,75 p + q = 0,25 + 0,75 = 1 Ejemplo 3: Probabilidad de acertar una quiniela: Probabilidad de acertar: p = 0,00001 Probabilidad de no acertar: q = 0,99999 p + q = 0,00001 + 0,99999 = 1

166

PROBABILIDAD Y ESTADISTICA

DISTRI. DISCRETAS: BINOMIAL


Las distribucin binomial parte de la distribucin de Bernouilli: La distribucin de Bernouiili se aplica cuando se realiza una sola vez un experimento que tiene nicamente dos posibles resultados (xito o fracaso), por lo que la variable slo puede tomar dos valores: el 1 y el 0 La distribucin binomial se aplica cuando se realizan un nmero"n" de veces el experimento de Bernouiili, siendo cada ensayo independiente del anterior. La variable puede tomar valores entre: 0: si todos los experimentos han sido fracaso n: si todos los experimentos han sido xitos Ejemplo: se tira una moneda 10 veces: cuantas caras salen? Si no ha salido ninguna la variable toma el valor 0; si han salido dos caras la variable toma el valor 2; si todas han sido cara la variable toma el valor 10 La distribucin de probabilidad de este tipo de distribucin sigue el siguiente modelo:

Alguien entiende esta frmula? Vamos a tratar de explicarla con un ejemplo: Ejemplo 1: Cul es la probabilidad de obtener 6 caras al lanzar una moneda 10 veces? " k " es el nmero de aciertos. En este ejemplo " k " igual a 6 (en cada acierto decamos que la variable toma el valor 1: como son 6 aciertos, entonces k = 6) " n" es el nmero de ensayos. En nuestro ejemplo son 10 " p " es la probabilidad de xito, es decir, que salga "cara" al lanzar la moneda. Por lo tanto p = 0,5 La frmula quedara:

Luego, P (x = 6) = 0,205

166

PROBABILIDAD Y ESTADISTICA
Es decir, se tiene una probabilidad del 20,5% de obtener 6 caras al lanzar 10 veces una moneda. Ejemplo 2: Cul es la probabilidad de obtener cuatro veces el nmero 3 al lanzar un dado ocho veces? " k " (nmero de aciertos) toma el valor 4 " n" toma el valor 8 " p " (probabilidad de que salga un 3 al tirar el dado) es 1 / 6 (= 0,1666) La frmula queda:

Luego, P (x = 4) = 0,026 Es decir, se tiene una probabilidad del 2,6% de obtener cuatro veces el nmeros 3 al tirar un dado 8 veces.

DISTRI. DISCRETAS: POISSON


Las distribucin de Poisson parte de la distribucin binomial: Cuando en una distribucin binomial se realiza el experimento un nmero "n" muy elevado de veces y la probabilidad de xito "p" en cada ensayo es reducida, entonces se aplica el modelo de distribucin de Poisson: Se tiene que cumplir que: " p " < 0,10 " p * n " < 10 La distribucin de Poisson sigue el siguiente modelo:

Vamos a explicarla:

166

PROBABILIDAD Y ESTADISTICA
El nmero "e" es 2,71828 " " = n * p (es decir, el nmero de veces " n " que se realiza el experimento multiplicado por la probabilidad " p " de xito en cada ensayo) " k " es el nmero de xito cuya probabilidad se est calculando Veamos un ejemplo: La probabilidad de tener un accidente de trfico es de 0,02 cada vez que se viaja, si se realizan 300 viajes, cual es la probabilidad de tener 3 accidentes? Como la probabilidad " p " es menor que 0,1, y el producto " n * p " es menor que 10, entonces aplicamos el modelo de distribucin de Poisson.

Luego, P (x = 3) = 0,0892 Por lo tanto, la probabilidad de tener 3 accidentes de trfico en 300 viajes es del 8,9% Otro ejemplo: La probabilidad de que un nio nazca pelirrojo es de 0,012. Cul es la probabilidad de que entre 800 recien nacidos haya 5 pelirrojos?

Luego, P (x = 5) = 4,602 Por lo tanto, la probabilidad de que haya 5 pelirrojos entre 800 recien nacidos es del 4,6%.

DISTRI. DISCRETAS: HIPERGEOMETRICA


Las distribucin hipergeomtrica es el modelo que se aplica en experimentos del siguiente tipo:

166

PROBABILIDAD Y ESTADISTICA
En una urna hay bolas de dos colores (blancas y negras), cul es la probabilidad de que al sacar 2 bolas las dos sean blancas? Son experimentos donde, al igual que en la distribucin binomial, en cada ensayo hay tan slo dos posibles resultados: o sale blanca o no sale. Pero se diferencia de la distribucin binomial en que los distintos ensayos son dependientes entre s: Si en una urna con 5 bolas blancas y 3 negras en un primer ensayo saco una bola blanca, en el segundo ensayo hay una bola blanca menos por lo que las probabilidades son diferentes (hay dependencia entre los distintos ensayos). La distribucin hipergeomtrica sigue el siguiente modelo:

Donde:

Vamos a tratar de explicarlo: N: es el nmero total de bolas en la urna N1: es el nmero total de bolas blancas N2: es el nmero total de bolas negras k: es el nmero de bolas blancas cuya probabilidad se est calculando n: es el nmero de ensayos que se realiza Veamos un ejemplo: en una urna hay 7 bolas blancas y 5 negras. Se sacan 4 bolas Cul es la probabilidad de que 3 sean blancas? Entonces: N = 12; N1 = 7; N2 = 5; k = 3; n = 4 Si aplicamos el modelo:

166

PROBABILIDAD Y ESTADISTICA

Por lo tanto, P (x = 3) = 0,3535. Es decir, la probabilidad de sacar 3 bolas blancas es del 35,3%. Pero este modelo no slo se utiliza con experimentos con bolas, sino que tambin se aplica con experimentos similares:

Ejemplo: en una fiesta hay 20 personas: 14 casadas y 6 solteras. Se eligen 3 personas al azar Cul es la probabilidad de que las 3 sean solteras?

Por lo tanto, P (x = 3) = 0,0175. Es decir, la probabilidad de que las 3 personas sean solteras es tan slo del 1,75%

DISTRI. DISCRETAS: MULTINOMIAL


La distribucin multinomial es similar a la distribucin binomial, con la diferencia de que en lugar de dos posibles resultados en cada ensayo, puede haber mltiples resultados: Ejemplo de distribucin binomial: a unas elecciones se presentaron 2 partidos polticos: el POPO obtuvo un 70% de los votos y el JEJE el 30% restante. Cul es la probabilidad de que al elegir 5 ciudadanos al azar, 4 de ellos hallan votado al JEJE?

166

PROBABILIDAD Y ESTADISTICA
Ejemplo de distribucin multinomial: a esas elecciones se presentaron 4 partidos polticos: el POPO obtuvo un 40% de los votos, el JEJE el 30%, el MUMU el 20% y el LALA el 10% restante. Cul es la probabilidad de que al elegir 5 ciudadanos al azar, 3 hayan votado al POPO, 1 al MUMU y 1 al LALA? La distribucin multinomial sigue el siguiente modelo:

Donde: X1 = x1: indica que el suceso X1 aparezca x1 veces (en el ejemplo, que el partido POPO lo hayan votado 3 personas) n: indica el nmero de veces que se ha repetido el suceso (en el ejemplo, 5 veces) n!: es factorial de n (en el ejemplo: 5 * 4 * 3 * 2 * 1) p1: es la probabilidad del suceso X1 (en el ejemplo, el 40%) Veamos el ejemplo:

Luego: P = 0,0256 Es decir, que la probabilidad de que las 5 personas elegidas hayan votado de esta manera es tan slo del 2,56%

Nota: 0! es igual a 1, y cualquier nmero elevado a 0 es tambin igual a 1

Veamos otro ejemplo: En una fiesta, el 20% de los asistentes son espaoles, el 30% franceses, el 40% italiano y el 10% portugueses. En un pequeo grupo se han reunido 4 invitados: cual es la probabilidad de que 2 sean espaoles y 2 italianos? Aplicamos el modelo:

Luego

166

PROBABILIDAD Y ESTADISTICA
P = 0,0384 Por lo tanto, la probabilidad de que el grupo est formado por personas de estos pases es tan slo del 3,84%.

DISTRI. DISCRETAS: MULTIHIPERGEOMETRICA

La distribucin multihipergeomtrica es similar a la distribucin hipergeomtrica, con la diferencia de que en la urna, en lugar de haber nicamente bolas de dos colores, hay bolas de diferentes colores. Ejemplo: en una urna hay 7 bolas blancas, 3 verdes y 4 amarillas: cul es la probabilidad de que al extraer 3 bolas sea cada una de un color distinto? La distribucin multihipergeomtrica sigue el siguiente modelo:

Donde: X1 = x1: indica que el suceso X1 aparezca x1 veces (en el ejemplo, que una de las bolas sea blanca) N1: indica el nmero de bolas blancas que hay en la urna (en el ejemplo, 7 bolas) N: es el nmero total de bolas en la urna (en el ejemplo, 14 bolas) n: es el nmero total de bolas que se extraen (en el ejemplo, 3 bolas) Veamos el ejemplo:

166

PROBABILIDAD Y ESTADISTICA
Luego: P = 0,2307 Es decir, que la probabilidad de sacar una bola de cada color es del 23,07%. Veamos otro ejemplo:

En una caja de lpices hay 10 de color amarillo, 3 de color azul y 4 de color rojo. Se extraen 7 lpices, cual es la probabilidad de que 5 sean amarillos y 2 rojos? Aplicamos el modelo:

Luego P = 0,0777 Por lo tanto, la probabilidad de que los 5 lpices sean de los colores indicados es del 7,77%.

DISTRI. CONTINUAS: UNIFORME


La distribucin uniforme es aquella que puede tomar cualquier valor dentro de un intervalo, todos ellos con la misma probabilidad. Es una distribucin continua porque puede tomar cualquier valor y no nicamente un nmero determinado (como ocurre en las distribuciones discretas). Ejemplo: el precio medio del litro de gasolina durante el prximo ao se estima que puede oscilar entre 140 y 160 ptas. Podra ser, por tanto, de 143 ptas., o de 143,4 ptas., o de 143,45 ptas., o de 143,455 ptas, etc. Hay infinitas posibilidades, todas ellas con la misma probabilidad.

166

PROBABILIDAD Y ESTADISTICA
Su funcin de densidad, aquella que nos permite conocer la probabilidad que tiene cada punto del intervalo, viene definida por:

Donde: b: es el extremo superior (en el ejemplo, 160 ptas.) a: es el extremo inferior (en el ejemplo, 140 ptas.) Por lo tanto, la funcin de distribucin del ejemplo sera:

Es decir, que el valor final est entre 140 ptas. y 141 ptas. tiene un 5% de probabilidad, que est entre 141 y 142, otro 5%, etc. El valor medio de esta distribucin se calcula:

En el ejemplo:

Por lo tanto, el precio medio esperado de la gasolina para el prximo ao es de 150 ptas. Veamos otro ejemplo: El volumen de precipitaciones estimado para el prximo ao en la ciudad de Sevilla va a oscilar entre 400 y 500 litros por metro cuadrado. Calcular la funcin de distribucin y la precipitacin media esperada:

Es decir, que el volumen de precipitaciones est entre 400 y 401 litros tiene un 1% de probabilidades; que est entre 401 y 402 litros, otro 1%, etc. El valor medio esperado es:

Es decir, la precipitacin media estimada en Sevilla para el prximo ao es de 450 litros.

166

PROBABILIDAD Y ESTADISTICA

DISTRI. CONTINUAS: NORMAL (I)


Es el modelo de distribucin ms utilizado en la prctica, ya que multitud de fenmenos se comportan segn una distribucin normal. Esta distribucin de caracteriza porque los valores se distribuyen formando una campana de Gauss, en torno a un valor central que coincide con el valor medio de la distribucin:

Un 50% de los valores estn a la dercha de este valor central y otro 50% a la izquierda Esta distribucin viene definida por dos parmetros: X: N (, 2)

: es el valor medio de la distribucin y es precisamente donde se sita el centro de la curva (de la campana de Gauss). 2 : es la varianza. Indica si los valores estn ms o menos alejados del valor central: si la varianza es baja los valores estn prximos a la media; si es alta, entonces los valores estn muy dispersos.
Cuando la media de la distribucin es 0 y la varianza es 1se denomina "normal tipificada", y su ventaja reside en que hay tablas donde se recoge la probabilidad acumulada para cada punto de la curva de esta distribucin. Adems, toda distribucin normal se puede transformar en una normal tipificada: Ejemplo: una variable aleatoria sigue el modelo de una distribucin normal con media 10 y varianza 4. Transformarla en una normal tipificada. X: N (10, 4) Para transformarla en una normal tipificada se crea una nueva variable (Y) que ser igual a la anterior (X) menos su media y dividida por su desviacin tpica (que es la raz cuadrada de la varianza)

166

PROBABILIDAD Y ESTADISTICA

En el ejemplo, la nueva variable sera:

Esta nueva variable se distribuye como una normal tipificada, permitindonos, por tanto, conocer la probabilidad acumulada en cada valor. Y: N (0, 1)

DISTRI. CONTINUAS: NORMAL (II)


La distribucin normal tipificada tiene la ventaja, como ya hemos indicado, de que las probabilidades para cada valor de la curva se encuentran recogidas en una tabla.

X 0, 0 0,1 0, 2 0, 3 0, 4 0,5 0, 6 0,7 0, 8 0, 9 1,0 1,1 1,2 1,3 1,4 1,5 1,6 1,7

0,00

0,01

0,02

0,03

0,04

0,05

0,06

0,07

0,08

0,09

0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5723 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7090 0,7224 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7813 0,7852 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389 0,8416 0,8643 0,8849 0,9032 0,9192 0,9332 0,9452 0,9554 0,8438 0,8665 0,8869 0,9049 0,9207 0,9345 0,9463 0,9564 0,8461 0,8686 0,8888 0,9066 0,9222 0,9357 0,9474 0,9573 0,8485 0,8708 0,8907 0,9082 0,9236 0,9370 0,9484 0,9582 0,8508 0,8729 0,8925 0,9099 0,9251 0,9382 0,9495 0,9591 0,8531 0,8749 0,8944 0,9115 0,9265 0,9394 0,9505 0,9599 0,8554 0,8770 0,8962 0,9131 0,9279 0,9406 0,9515 0,9608 0,8577 0,8790 0,8980 0,9147 0,9292 0,9418 0,9525 0,9616 0,8599 0,8810 0,8997 0,9162 0,9306 0,9429 0,9535 0,9625 0,8621 0,8830 0,9015 0,9177 0,9319 0,9441 0,9545 0,9633

166

PROBABILIDAD Y ESTADISTICA
1,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,9706 1,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,9767 2, 0,9788 0,9798 0,9803 0,97725 0,97778 0,97831 0,97932 0,98077 0,98124 0,98169 0 2 2 0 0,9830 0,9838 0,9842 0,9850 2,1 0,98214 0,98257 0,98341 0,98461 0,98537 0,98574 0 2 2 0 0,9864 0,9880 0,9884 0,9887 0,9889 2,2 0,98610 0,98679 0,98713 0,98745 0,98778 5 9 0 0 9 0,9892 0,9895 0,9898 0,9901 0,9903 0,9908 2,3 0,99061 0,99111 0,99134 0,99158 8 6 3 0 6 6 0,9920 0,9924 0,9926 0,9928 0,9934 2,4 0,99180 0,99224 0,99305 0,99324 0,99361 2 5 6 6 3 0,9939 0,9943 0,9944 0,9950 0,9952 2,5 0,99379 0,99413 0,99461 0,99477 0,99492 6 0 6 6 0 0,9958 0,9959 0,9960 0,9963 0,9964 2,6 0,99534 0,99547 0,99560 0,99573 0,99621 5 8 9 2 3 0,9966 0,9968 0,9969 0,9970 0,9972 2,7 0,99653 0,99674 0,99711 0,99720 0,99736 4 3 3 2 8 0,9980 2,8 0,99744 0,99752 0,99760 0,99767 0,99774 0,99781 0,99788 0,99795 0,99801 7 0,9983 0,9984 0,9985 2,9 0,99813 0,99819 0,99825 0,99831 0,99841 0,99851 0,99861 6 6 6

Cmo se lee esta tabla? La columna de la izquierda indica el valor cuya probabilidad acumulada queremos conocer. La primera fila nos indica el segundo decimal del valor que estamos consultando. Ejemplo: queremos conocer la probabilidad acumulada en el valor 2,75.Entonces buscamos en la columna de la izquierda el valor 2,7 y en la primera fila el valor 0,05. La casilla en la que se interseccionan es su probabilidad acumulada (0,99702, es decir 99.7%). Atencin: la tabla nos da la probabilidad acumulada, es decir, la que va desde el inicio de la curva por la izquierda hasta dicho valor. No nos da la probabilidad concreta en ese punto. En una distribucin continua en el que la variable puede tomar infinitos valores, la probabilidad en un punto concreto es prcticamente despreciable. Ejemplo: Imaginemos que una variable continua puede tomar valores entre 0 y 5. La probabilidad de que tome exactamente el valor 2 es despreciable, ya que podra tomar infinitos valores: por ejemplo: 1,99, 1,994, 1,9967, 1,9998, 1999791, etc. Veamos otros ejemplos: Probabilidad acumulada en el valor 0,67: la respuesta es 0,7486 Probabilidad acumulada en el valor 1,35: la respuesta es 0,9115 Probabilidad acumulada en el valor 2,19: la respuesta es 0,98574 Veamos ahora, como podemos utilizar esta tabla con una distribucin normal:

166

PROBABILIDAD Y ESTADISTICA
Ejemplo: el salario medio de los empleados de una empresa se distribuye segn una distribucin normal, con media 5 millones de ptas. y desviacin tpica 1 milln de ptas. Calcular el porcentaje de empleados con un sueldo inferior a 7 millones de ptas. Lo primero que haremos es transformar esa distribucin en una normal tipificada, para ello se crea una nueva variable (Y) que ser igual a la anterior (X) menos su media y dividida por la desviacin tpica

En el ejemplo, la nueva variable sera:

Esta nueva variable se distribuye como una normal tipificada. La variable Y que corresponde a una variable X de valor 7 es:

Ya podemos consultar en la tabla la probabilidad acumulada para el valor 2 (equivalente a la probabilidad de sueldos inferiores a 7 millones de ptas.). Esta probabilidad es 0,97725 Por lo tanto, el porcentaje de empleados con salarios inferiores a 7 millones de ptas. es del 97,725%.

DISTRI. CONTINUAS: NORMAL (III) EJER.


Ejercicio 1: La renta media de los habitantes de un pas es de 4 millones de ptas/ao, con una varianza de 1,5. Se supone que se distribuye segn una distribucin normal. Calcular: a) Porcentaje de la poblacin con una renta inferior a 3 millones de ptas. b) Renta a partir de la cual se sita el 10% de la poblacin con mayores ingresos. c) Ingresos mnimo y mximo que engloba al 60% de la poblacin con renta media. a) Porcentaje de la poblacin con una renta inferior a 3 millones de ptas.

166

PROBABILIDAD Y ESTADISTICA
Lo primero que tenemos que hacer es calcular la normal tipificada:

(*) Recordemos que el denominador es la desviacin tpica ( raz cuadrada de la varianza) El valor de Y equivalente a 3 millones de ptas es -0,816. P (X < 3) = P (Y < -0,816) Ahora tenemos que ver cul es la probabilidad acumulada hasta ese valor. Tenemos un problema: la tabla de probabilidades (ver leccin 35) slo abarca valores positivos, no obstante, este problema tiene fcil solucin, ya que la distribucin normal es simtrica respecto al valor medio. Por lo tanto: P (Y < -0,816) = P (Y > 0,816) Por otra parte, la probabilidad que hay a partir de un valor es igual a 1 (100%) menos la probabilidad acumulada hasta dicho valor: P (Y > 0,816) = 1 - P (Y < 0,816) = 1 - 0,7925 (aprox.) = 0,2075 Luego, el 20,75% de la poblacin tiene una renta inferior a 3 millones ptas. b) Nivel de ingresos a partir del cual se sita el 10% de la poblacin con renta ms elevada. Vemos en la tabla el valor de la variable tipificada cuya probabilidad acumulada es el 0,9 (90%), lo que quiere decir que por encima se sita el 10% superior. Ese valor corresponde a Y = 1,282 (aprox.). Ahora calculamos la variable normal X equivalente a ese valor de la normal tipificada:

Despejando X, su valor es 5,57. Por lo tanto, aquellas personas con ingresos superiores a 5,57 millones de ptas. constituyen el 10% de la poblacin con renta ms elevada. c) Nivel de ingresos mnimo y mximo que engloba al 60% de la poblacin con renta media Vemos en la tabla el valor de la variable normalizada Y cuya probabilidad acumulada es el 0,8 (80%). Como sabemos que hasta la media la probabilidad acumulada es del 50%, quiere decir que entre la media y este valor de Y hay un 30% de probabilidad. Por otra parte, al ser la distribucin normal simtrica, entre -Y y la media hay otro 30% de probabilidad. En definitiva, el segmento (-Y, Y) engloba al 60% de poblacin con renta media. El valor de Y que acumula el 80% de la probabilidad es 0,842 (aprox.), por lo que el segmento viene definido por (-0,842, +0,842). Ahora calculamos los valores de la variable X correspondientes a estos valores de Y.

166

PROBABILIDAD Y ESTADISTICA
Los valores de X son 2,97 y 5,03. Por lo tanto, las personas con ingresos superiores a 2,97 millones de ptas. e inferiores a 5,03 millones de ptas. constituyen el 60% de la poblacin con un nivel medio de renta.

Ejercicio 2: La vida media de los habitantes de un pas es de 68 aos, con una varianza de 25. Se hace un estudio en una pequea ciudad de 10.000 habitantes: a) Cuntas personas superarn previsiblemente los 75 aos? b) Cuntos vivirn menos de 60 aos? a) Personas que vivirn (previsiblemente) ms de 75 aos Calculamos el valor de la normal tipificada equivalente a 75 aos

Por lo tanto P (X > 75) = (Y > 1,4) = 1 - P (Y < 1,4) = 1 - 0,9192 = 0,0808 Luego, el 8,08% de la poblacin (808 habitantes) vivirn ms de 75 aos. b) Personas que vivirn (previsiblemente) menos de 60 aos Calculamos el valor de la normal tipificada equivalente a 60 aos

Por lo tanto P (X < 60) = (Y < -1,6) = P (Y > 1,6) = 1 - P (Y < 1,6) = 0,0548 Luego, el 5,48% de la poblacin (548 habitantes) no llegarn probablemente a esta edad.

DISTRI. CONTINUAS: NORMAL (IV) EJER.


Ejercicio 1: El consumo medio anual de cerveza de los habitantes de una pas es de 59 litros, con una varianza de 36. Se supone que se distribuye segn una distribucin normal.

166

PROBABILIDAD Y ESTADISTICA
a) Si usted presume de buen bebedor, cuntos litros de cerveza tendra que beber al ao para pertenecer al 5% de la poblacin que ms bebe?. b) Si usted bebe 45 litros de cerveza al ao y su mujer le califica de borracho qu podra argumentar en su defensa? a) 5% de la poblacin que ms bebe. Vemos en la tabla el valor de la variable tipificada cuya probabilidad acumulada es el 0,95 (95%), por lo que por arriba estara el 5% restante. Ese valor corresponde a Y = 1,645 (aprox.). Ahora calculamos la variable normal X equivalente a ese valor de la normal tipificada:

Despejando X, su valor es 67,87. Por lo tanto, tendra usted que beber ms de 67,87 litros al ao para pertenecer a ese "selecto" club de grandes bebedores de cerveza. b) Usted bebe 45 litros de cerceza al ao. Es usted un borracho? Vamos a ver en que nivel de la poblacin se situara usted en funcin de los litros de cerveza consumidos. Calculamos el valor de la normal tipificada correspondiente a 45 litros:

Por lo tanto P (X < 45) = (Y < -2,2) = P (Y > 2,2) = 1 - P (Y < 2,2) = 0,0139 Luego, tan slo un 1,39% de la poblacin bebe menos que usted. Parece un argumento de suficiente peso para que dejen de catalogarle de "enamorado de la bebida"

Ejercicio 2: A un examen de oposicin se han presentado 2.000 aspirantes. La nota media ha sido un 5,5, con una varianza de 1,5. a) Tan slo hay 100 plazas. Usted ha obtenido un 7,7. Sera oportuno ir organizando una fiesta para celebrar su xito? b) Va a haber una 2 oportunidad para el 20% de notas ms altas que no se hayan clasificados. A partir de que nota se podr participar en esta "repesca"? a) Ha obtenido usted un 7,7 Vamos a ver con ese 7,7 en que nivel porcentual se ha situado usted, para ello vamos a comenzar por calcular el valor de la normal tipificada equivalente.

166

PROBABILIDAD Y ESTADISTICA

A este valor de Y le corresponde una probabilidad acumulada (ver tablas) de 0,98214 (98,214%), lo que quiere decir que por encima de usted tan slo se encuentra un 1,786%. Si se han presentado 2.000 aspirante, ese 1,786% equivale a unos 36 aspirantes. Por lo que si hay 100 plazas disponibles, tiene usted suficientes probabilidades como para ir organizando la "mejor de las fiestas". b) "Repesca" para el 20% de los candidatos Vemos en la tabla el valor de la normal tipificada que acumula el 80% de la probabilidad, ya que por arriba slo quedara el 20% restante. Este valor de Y corresponde a 0,842 (aprox.). Ahora calculamos el valor de la normal X equivalente:

Despejamos la X y su valor es 6,38. Por lo tanto, esta es la nota a partir de la cual se podr acudir a la "repesca".

TEOREMA CENTRAL DEL LIMITE EJER. (I)


Ejercicio 1. La renta media de los habitantes de un pas se distribuye uniformemente entre 4,0 millones ptas. y 10,0 millones ptas. Calcular la probabilidad de que al seleccionar al azar a 100 personas la suma de sus rentas supere los 725 millones ptas. Cada renta personal es una variable independiente que se ditribuye segn una funcin uniforme. Por ello, a la suma de las rentas de 100 personas se le puede aplicar el Teorema Central del Lmite. La media y varianza de cada variable individual es:

= (4 + 10 ) / 2 = 7 2 = (10 - 4)^2 / 12 = 3
Por tanto, la suma de las 100 variables se distribuye segn una normal cuya media y varianza son:

166

PROBABILIDAD Y ESTADISTICA
Media: n * = 100 * 7 = 700 Varianza: n * 2 = 100 * 3 = 300 Para calcular la probabilidad de que la suma de las rentas sea superior a 725 millones ptas, comenzamos por calcular el valor equivalente de la variable normal tipificada:

Luego: P (X > 725) = P (Y > 1,44) = 1 - P (Y < 1,44) = 1 - 0,9251 = 0,0749 Es decir, la probabilidad de que la suma de las rentas de 100 personas seleccionadas al azar supere los 725 millones de pesetas es tan slo del 7,49%

Ejercicio 2. En una asignatura del colegio la probabilidad de que te saquen a la pizarra en cada clase es del 10%. A lo largo del ao tienes 100 clases de esa asignatura. Cul es la probabilidad de tener que salir a la pizarra ms de 15 veces? Se vuelve a aplicar el Teorema Central del Lmite. Salir a la pizarra es una variable independiente que sigue el modelo de distribucin de Bernouilli: "Salir a la pizarra", le damos el valor 1 y tiene una probabilidad del 0,10 "No salir a la pizarra", le damos el valor 0 y tiene una probabilidad del 0,9 La media y la varianza de cada variable independientes es:

= 0,10 2 = 0,10 * 0,90 = 0,09


Por tanto, la suma de las 100 variables se distribuye segn una normal cuya media y varianza son: Media: n * = 100 * 0,10 = 10 Varianza: n * 2 = 100 * 0,09 = 9 Para calcular la probabilidad de salir a la pizarra ms de 15 veces, calculamos el valor equivalente de la variable normal tipificada:

166

PROBABILIDAD Y ESTADISTICA
Luego: P (X > 15) = P (Y > 1,67) = 1 - P (Y < 1,67) = 1 - 0,9525 = 0,0475 Es decir, la probabilidad de tener que salir ms de 15 veces a la pizarra a lo largo del curso es tan slo del 4,75% ( nimo !!!, no es tan grave)

TEOREMA CENTRAL DEL LIMITE EJER. (II)


Ejercicio 1. Un da visitamos el Casino y decidimos jugar en la ruleta. Nuestra apuesta va a ser siempre al negro y cada apuesta de 500 ptas. Llevamos 10.000 ptas. y queremos calcular que probabilidad tenemos de que tras jugar 80 veces consigamos doblar nuestro dinero. Cada jugada es una variable independiente que sigue el modelo de distribucin de Bernouilli. "Salir negro", le damos el valor 1 y tiene una probabilidad del 0,485 "No salir negro", le damos el valor 0 y tiene una probabilidad del 0,515 (*) La probabilidad de "no salir negro" es mayor ya que puede salir rojo o el cero La media y varianza de cada variable individual es:

= 0,485 2 = 0,485 * 0,515 = 0,25


A la suma de las 80 apuestas se le aplica el Teorema Central del Lmite, por lo que se distribuye segn una normal cuya media y varianza son: Media: n * = 80 * 0,485 = 38,8 Varianza: n * 2 = 80 * 0,25 = 20 Para doblar nuestro dinero el negro tiene que salir al menos 20 veces ms que el rojo (20 * 500 = 10.000), por lo que tendr que salir como mnimo 50 veces (implica que el rojo o el cero salgan como mximo 30 veces).

166

PROBABILIDAD Y ESTADISTICA
Comenzamos por calcular el valor equivalente de la variable normal tipificada:

Luego: P (X > 50) = P (Y > 2,50) = 1 - P (Y < 2,50) = 1 - 0,9938 = 0,0062 Es decir, la probabilidad de doblar el dinero es tan slo del 0,62% (as, que ms vale que nos pongamos a trabajar).

Ejercicio 2. El precio de una accin en bolsa se mueve aleatoriamente entre 10 ptas. y 20 ptas., con la misma probabilidad en todo el tramo. Hemos dado la orden a nuestro broker de que nos compre paquetes de 1.000 acciones cada da durante las prximas 40 sesiones. Una vez ejecutada la orden, tenemos un total de 40.000 acciones. A final de ao vendemos todas las acciones al precio de 13 ptas./accin, recibiendo 520.000 ptas. Calcular la probabilidad de que ganemos dinero en esta operacin. El precio de cada paquete comprado es una variable aleatoria independiente que se distribuye uniformemente entre 10.000 ptas y 20.000 ptas. Su media y varianza son:

= (10.000 + 20.000 ) / 2 = 15.000 2 = (20.000 - 10.000)^2 / 12 = 833,3


El precio total de los 40 paquetes comprados se distribuye segn una distribucin normal cuya media y varianza son: Media: n * = 40 * 15.000 = 600.000 Varianza: n * 2 = 40 * 833,3 = 33.333,3 Para estimar la probabilidad de que ganemos dinero, calculamos el valor equivalente de la variable normal tipificada:

Luego: P (X > 520.000) = P (Y > 2,40) = 1 - P (Y < 2,40) = 1 - 0,9918 = 0,0082 Por tanto, la probabilidad de que ganemos dinero con la "dichosa" operacin es tan slo del 0,82% ( lo llevamos claro, Gervasio !!!)

166

PROBABILIDAD Y ESTADISTICA

VARIABLES ALEATORIAS

Variable Aleatoria Unidimensional La relacin entre los sucesos del espacio muestral y el valor numrico que se les asigna se establece a travs de variable aleatoria.

Definicin Una variable aleatoria es una funcin que asigna un valor numrico a cada suceso elemental del espacio muestral. Es decir, una variable aleatoria es una variable cuyo valor numrico est determinado por el resultado del experimento aleatorio. La variable aleatoria la notaremos con letras en mayscula X, Y, ... y con las letras en minscula x, y, ... sus valores. La v.a. puede tomar un nmero numerable o no numerable de valores, dando lugar a dos tipos de v.a.: discretas y continuas.

Definicin Se dice que una variable aleatoria X es discreta si puede tomar un nmero finito o infinito, pero numerable, de posibles valores.

Definicin Se dice que una variable aleatoria X es continua si puede tomar un nmero infinito (no numerable) de valores, o bien, si puede tomar un nmero infinito de valores correspondientes a los puntos de uno o ms intervalos de la recta real

DISTRIBUCIN DE PROBABILIDAD DE VARIABLES ALEATORIAS DISCRETAS Sea X una v.a. discreta que toma un nmero finito de valores, r en total, x1, x2, ..., xi, ..., xr. La probabilidad de que la v.a. X tome un valor particular xi se representar por:

166

PROBABILIDAD Y ESTADISTICA
Definicin La distribucin de probabilidad o funcin de probabilidad de una variable aleatoria X, P(x), es una funcin que asigna las probabilidades con que la v.a. toma los posibles valores, de forma que las probabilidades verifiquen: Si X es una v.a. discreta, para determinar la , siendo , tan slo hay que sumar las probabilidades correspondientes a valores de X comprendidos entre a y b, es decir:

Definicin Sea una v.a. X de tipo discreto que toma un n finito o infinito numerable de valores x1, x2, ..., xr y cuya distribucin de probabilidad es P(x). Se define la funcin de distribucin acumulativa de la v.a. X, F(x), como la probabilidad de que la v.a. X tome valores menores o iguales que x, es decir: Representando la suma de las probabilidades puntuales hasta el valor x inclusive de la v.a. X. La funcin de distribucin de una v.a. discreta es una funcin que verifica: Se puede decir por tanto que una v.a. X discreta, est caracterizada por su funcin de probabilidad o distribucin de probabilidad P(x) y tambin por su funcin de distribucin F(x).

DISTRIBUCIN DE PROBABILIDAD DE VARIABLES ALEATORIAS CONTINUAS La v.a. de tipo continuo se tratar de forma diferente a como se ha visto en el caso de v.a. discreta, ya que en el caso continuo no es posible asignar una probabilidad a cada uno de los infinitos posibles valores de la v.a. y que estas probabilidades sumen uno (como en el caso discreto), teniendo por tanto que utilizar una aproximacin diferente para llegar a obtener la distribucin de probabilidad de una v.a. continua.

Definicin Sea X una v.a. continua. Si existe una funcin f(x) tal que verifica: Diremos que f(x) es la funcin de densidad de la v.a. continua X. En el caso continuo la suma de las densidad o el rea bajo la curva f(x) debe ser igual a la unidad, y como consecuencia la probabilidad de que la v.a. continua X tome valores en el intervalo [a,b] ser igual al rea bajo la curva f(x) acotada entre a y b, es decir: Si la v.a. X es discreta, existen las probabilidades puntuales P(X=xi). En el caso continuo, si xi es un punto interior al intervalo de definicin de la v.a. continua X, entonces

Definicin Sea X una v.a. de tipo continuo que toma un nmero infinito de valores sobre la recta real y con funcin de densidad f(x). Se define la funcin de distribucin acumulativa de la v.a. X, F(x), como la probabilidad de que la v.a. continua X tome valores menores o iguales a x, es decir: y representa el rea limitada por la curva f(x), a la izquierda de la recta X=x. Consideramos una masa unidad distribuida sobre el intervalo ( ), y la funcin de distribucin F(x) para cada valor x de la v.a. nos da la cantidad de masa que hay en el intervalo , es decir, la masa que hay en el punto x y a la izquierda de x, aunque nos dar igual considerar el intervalo ( ), de forma que: La funcin de distribucin de una v.a. continua es una funcin que verifica: Como la representa grficamente el rea encerrada bajo la curva f(x) y los valores a y b del eje de abscisas, entonces a la probabilidad se le puede dar la misma interpretacin.

166

PROBABILIDAD Y ESTADISTICA
VARIABLE ALEATORIA BIDIMENSIONAL En determinadas ocasiones hay que trabajar en espacios de ms de una dimensin, estableciendo aplicaciones que transforman los sucesos elementales del experimento aleatorio en puntos del espacio n-dimensional (Rn), estas aplicaciones se hacen utilizando v.a. bidimensionales o n-dimensionales.

En muchas ocasiones nos puede interesar estudiar conjuntamente dos caractersticas del fenmeno aleatorio, es decir, estudiar el comportamiento conjunto de dos v.a. para intentar explicar la posible relacin entre ellas. Para poder estudiar conjuntamente las dos v.a., es necesario conocer la distribucin de probabilidad conjunta.

DISTRIBUCIN DE PROBABILIDAD BIDIMENSIONAL Sea la X una v.a. discreta que toma un nmero finito de valores x1, x2, ..., xr y sea Y una v.a. de tipo discreto, que toma valores y1, y2, ..., ys. La probabilidad de que la v.a. X tome el valor xi, y la v.a. Y toma el valor yj, la designaremos por: Definicin La distribucin de probabilidad bidimensional o distribucin de probabilidad conjunta de una v.a. discreta bidimensional es una funcin P(xi,yj) que asigna las probabilidades a los diferentes valores conjuntos de la v.a. bidimensional (X,Y), de tal manera que se verifiquen las dos condiciones siguientes:

Definicin Sea una v.a. bidimensional (X,Y) de tipo discreto cuya distribucin de probabilidad es pij = P(xi,yj), i=1, 2, ..., r y j = 1, 2, ..., s. Se define la funcin de distribucin conjunta, F(x,y) como: y representa la suma de las probabilidades puntuales P(xi,yj) hasta el valor (x , y) inclusive de la v.a. bidimensional (X,Y). Consideremos ahora una v.a. bidimensional (X,Y) de tipo continuo:

Definicin Sea (X,Y) una v.a. bidimensional de tipo continuo, si existe una funcin f(x,y) tal que verifica: diremos que f(x,y) es la funcin de densidad de la v.a. bidimensional continua (X,Y). Esta funcin de densidad conjunta, se puede interpretar como un histograma de frecuencias relativas conjuntas para X e Y, pues la funcin de densidad f(x,y) representa una superficie de densidad de probabilidad en el espacio tridimensional , y el volumen por debajo de esta superficie y por encima del rectngulo e , es igual a la probabilidad de que las v.a. tienen valores dentro del rectngulo indicado, es decir:

Definicin Sea una v.a. bidimensional (X,Y) de tipo continuo que toma valores sobre el espacio bidimensional R2 y cuya funcin de densidad es f(x,y). Se define la funcin de distribucin de la v.a. bidimensional, F(x,y) como: La funcin de distribucin bidimensional satisface una serie de propiedades:

166

PROBABILIDAD Y ESTADISTICA
DISTRIBUCINES MARGINALES Ahora nos va a interesar conocer la distribucin de alguna o de ambas v.a. por separado, a partir de la informacin que nos proporcionaba la distribucin conjunta de (X,Y), lo cual nos lleva al concepto de distribucin marginal. En el caso de la v.a. bidimensional (X,Y), teniendo en cuenta que todos los sucesos bivariantes, correspondientes a los diferentes valores que puede tomar la v.a. bidimensional, es decir: (X=xi, Y=yj) i, j = 1, 2, 3, .... eran sucesos mutuamente excluyentes, entonces podremos decir que el suceso univariante X=xi es la unin de todos los sucesos bivariantes (X=xi, Y=yj) para todos los valores posibles de yj.

Definicin Sea una v.a. bidimensional (X,Y) de tipo discreto cuya distribucin de probabilidad es pij=P(xi, yj). Entonces las distribuciones de probabilidad marginales, de X e Y, respectivamente vienen dadas por La distribucin de probabilidad marginal de X es la probabilidad de que X=xi con independencia del valor que tome Y, con lo que se puede escribir: De forma anloga la distribucin de probabilidad marginal de Y ser:

Definicin Sea una v.a. bidimensional (X,Y) de tipo discreto cuya distribucin de probabilidad es pij = P(xi,yj). Entonces las funciones de distribucin marginales de X e Y, se definen: Si consideramos una v.a. bidimensional de tipo continuo (X,Y) se obtiene:

Definicin. Sea una v.a. bidimensional (X,Y) de tipo continuo, cuya funcin de densidad conjunta es f(x,y). Entonces las funciones de densidad marginales de X e Y, se definen:

Definicin. Sea una v.a. bidimensional (X,Y) de tipo continuo, cuya funcin de densidad conjunta es f(x,y). Entonces se definen las funciones de distribucin marginales de X e Y como:

DISTRIBUCINES CONDICIONADAS Queremos conocer cmo se distribuye una de las variables cuando se imponen condiciones a la otra variable. En el tema anterior definiamos . Ahora consideramos la v.a. bidimensional (X,Y), con su correspondiente distribucin de probabilidad. Se define la probabilidad condicionada de la v.a. discreta X dado Y=yj En este caso yj es fijo y xi vara sobre todos los posibles valores de la v.a. X, obteniendo as la distribucin de probabilidad de la v.a. discreta X bajo la condicin Y=yj. Anlogamente la distribucin de probabilidad condicionada de la v.a. discreta Y dado X=xi sera: En este caso xi es fijo e yj vara sobre todos los posibles valores de la variable aleatoria Y.

INDEPENDENCIA DE VARIABLES ALEATORIAS

166

PROBABILIDAD Y ESTADISTICA
Definicin Consideremos una v.a. bidimensional (X,Y) cuya funcin de distribucin conjunta es F(x,y) y sus funciones de distribucin marginales F1(x) y F2(y) respectivamente.

Se dir que las v.a. X e Y son independientes si y slo si se verifica que la funcin de distribucin conjunta F(x,y) es igual al producto de sus distribuciones marginales, es decir:

Si X e Y son v.a. discretas, con distribucin de probabilidad conjunta pij=P(xi,yj), y con distribuciones de probabilidad marginales Pi.=P(xi) y P.j=P(yj) respectivamente, entonces diremos que las v.a. son independientes si y slo si se verifica:

Si X e Y son v.a. continuas, con funcin de densidad conjunta f(x,y) y funciones de densidad marginales f1(x) y f2(y) respectivamente, se dir que las v.a. son independientes si y slo si se verifica:

ESTIMACIN Y PRUEBA DE HIPOTESIS

1.- INTRODUCCION

Dentro del estudio de la inferencia estadstica, se describe como se puede tomar una muestra aleatoria y a partir de esta muestra estimar el valor de un parmetro poblacional en la cual se puede emplear el mtodo de muestreo y el teorema del valor central lo que permite explicar como a partir de una muestra se puede inferir algo acerca de una poblacin, lo cual nos lleva a definir y elaborar una distribucin de muestreo de medias muestrales que nos permite explicar el teorema del limite central y utilizar este teorema para encontrar las probabilidades de obtener las distintas medias maestrales de una poblacin. Pero es necesario tener conocimiento de ciertos datos de la poblacin como la media, la desviacin estndar o la forma de la poblacin, pero a veces no se dispone de esta informacin. En este caso es necesario hacer una estimacin puntual que es un valor que se usa para estimar un valor poblacional. Pero una estimacin puntual es un solo valor y se requiere un intervalo de valores a esto se denomina intervalote confianza y se espera que dentro de este intervalo se encuentre el parmetro poblacional buscado. Tambin se utiliza una estimacin mediante un intervalo, el cual es un rango de valores en el que se espera se encuentre el parmetro poblacional

166

PROBABILIDAD Y ESTADISTICA
En nuestro caso se desarrolla un procedimiento para probar la validez de una aseveracin acerca de un parmetro poblacional este mtodo es denominado Prueba de hiptesis para una muestra.

2.- HIPOTESIS Y PRUEBA DE HIPOTESIS

Tenemos que empezar por definir que es una hiptesis y que es prueba de hiptesis. Hiptesis es una aseveracin de una poblacin elaborado con el propsito de poner aprueba, para verificar si la afirmacin es razonable se usan datos. En el anlisis estadstico se hace una aseveracin, es decir, se plantea una hiptesis, despus se hacen las pruebas para verificar la aseveracin o para determinar que no es verdadera. Por tanto, la prueba de hiptesis es un procedimiento basado en la evidencia muestral y la teora de probabilidad; se emplea para determinar si la hiptesis es una afirmacin razonable. Prueba de una hiptesis: se realiza mediante un procedimiento sistemtico de cinco paso:

Siguiendo este procedimiento sistemtico, al llegar al paso cinco se puede o no rechazar la hiptesis, pero debemos de tener cuidado con esta determinacin ya que en la consideracin de estadstica no proporciona evidencia de que algo sea verdadero. Esta prueba aporta una clase de prueba ms all de una duda razonable. Analizaremos cada paso en detalle Objetivo de la prueba de hiptesis.

El propsito de la prueba de hiptesis no es cuestionar el valor calculado del estadstico (muestral), sino hacer un juicio con respecto a la diferencia entre estadstico de muestra y un valor planteado del parmetro.

3.- Procedimiento sistemtico para una prueba de hiptesis de una muestra

166

PROBABILIDAD Y ESTADISTICA

.Paso 1: Plantear la hiptesis nula Ho y la hiptesis alternativa H1. Cualquier investigacin estadstica implica la existencia de hiptesis o afirmaciones acerca de las poblaciones que se estudian. La hiptesis nula (Ho) se refiere siempre a un valor especificado del parmetro de poblacin, no a una estadstica de muestra. La letra H significa hiptesis y el subndice cero no hay diferencia. Por lo general hay un "no" en la hiptesis nula que indica que "no hay cambio" Podemos rechazar o aceptar Ho. La hiptesis nula es una afirmacin que no se rechaza a menos que los datos maestrales proporcionen evidencia convincente de que es falsa. El planteamiento de la hiptesis nula siempre contiene un signo de igualdad con respecto al valor especificado del parmetro. La hiptesis alternativa (H1) es cualquier hiptesis que difiera de la hiptesis nula. Es una afirmacin que se acepta si los datos maestrales proporcionan evidencia suficiente de que la hiptesis nula es falsa. Se le conoce tambin como la hiptesis de investigacin. El planteamiento de la hiptesis alternativa nunca contiene un signo de igualdad con respecto al valor especificado del parmetro. Paso 2: Seleccionar el nivel de significancia.

Nivel de significacia: Probabilidad de rechazar la hiptesis nula cuando es verdadera. Se le denota mediante la letra griega a, tambi?n es denominada como nivel de riesgo, este termino es mas adecuado ya que se corre el riesgo de rechazar la hiptesis nula, cuando en realidad es verdadera. Este nivel esta bajo el control de la persona que realiza la prueba. Si suponemos que la hiptesis planteada es verdadera, entonces, el nivel de significacin indicar la probabilidad de no aceptarla, es decir, estn fuera de rea de aceptacin. El nivel de confianza (1-a), indica la probabilidad de aceptar la hiptesis planteada, cuando es verdadera en la poblacin.

La distribucin de muestreo de la estadstica de prueba se divide en dos regiones, una regin de rechazo (conocida como regin crtica) y una regin de no rechazo (aceptacin). Si la estadstica de prueba cae dentro de la regin de aceptacin, no se puede rechazar la hiptesis nula. La regin de rechazo puede considerarse como el conjunto de valores de la estadstica de prueba que no tienen posibilidad de presentarse si la hiptesis nula es verdadera. Por otro

166

PROBABILIDAD Y ESTADISTICA
lado, estos valores no son tan improbables de presentarse si la hiptesis nula es falsa. El valor crtico separa la regin de no rechazo de la de rechazo. Tipos de errores

Cualquiera sea la decisin tomada a partir de una prueba de hiptesis, ya sea de aceptacin de la Ho o de la Ha, puede incurrirse en error: Un error tipo I se presenta si la hiptesis nula Ho es rechazada cuando es verdadera y deba ser aceptada. La probabilidad de cometer un error tipo I se denomina con la letra alfa a Un error tipo II, se denota con la letra griega se presenta si la hiptesis nula es aceptada cuando de hecho es falsa y deba ser rechazada. En cualquiera de los dos casos se comete un error al tomar una decisin equivocada. En la siguiente tabla se muestran las decisiones que pueden tomar el investigador y las consecuencias posibles.

Para que cualquier ensayo de hiptesis sea bueno, debe disearse de forma que minimice los errores de decisin. En la prctica un tipo de error puede tener ms importancia que el otro, y as se tiene a conseguir poner una limitacin al error de mayor importancia. La nica forma de reducir ambos tipos de errores es incrementar el tamao de la muestra, lo cual puede ser o no ser posible. La probabilidad de cometer un error de tipo II denotada con la letra griega beta , depende de la diferencia entre los valores supuesto y real del parmetro de la poblacin. Como es ms fcil encontrar diferencias grandes, si la diferencia entre la estadstica de muestra y el correspondiente parmetro de poblacin es grande, la probabilidad de cometer un error de tipo II, probablemente sea pequea. El estudio y las conclusiones que obtengamos para una poblacin cualquiera, se habrn apoyado exclusivamente en el anlisis de una parte de sta. De la probabilidad con la que estemos dispuestos a asumir estos errores, depender, por ejemplo, el tamao de la muestra

166

PROBABILIDAD Y ESTADISTICA
requerida. Las contrastaciones se apoyan en que los datos de partida siguen una distribucin normal Existe una relacin inversa entre la magnitud de los errores a y : conforme a aumenta, disminuye. Esto obliga a establecer con cuidado el valor de a para las pruebas estadsticas. Lo ideal sera establecer a y .En la prctica se establece el nivel a y para disminuir el Error se incrementa el nmero de observaciones en la muestra, pues as se acortan los limites de confianza respecto a la hiptesis planteada .La meta de las pruebas estadsticas es rechazar la hiptesis planteada. En otras palabras, es deseable aumentar cuando sta es verdadera, o sea, incrementar lo que se llama poder de la prueba (1- ) La aceptacin de la hiptesis planteada debe interpretarse como que la informacin aleatoria de la muestra disponible no permite detectar la falsedad de esta hiptesis. Paso 3: Clculo del valor estadstico de prueba

Valor determinado a partir de la informacin muestral, que se utiliza para determinar si se rechaza la hiptesis nula., existen muchos estadsticos de prueba para nuestro caso utilizaremos los estadsticos z y t. La eleccin de uno de estos depende de la cantidad de muestras que se toman, si las muestras son de la prueba son iguales a 30 o mas se utiliza el estadstico z, en caso contrario se utiliza el estadstico t. Tipos de prueba

a) Prueba bilateral o de dos extremos: la hiptesis planteada se formula con la igualdad Ejemplo H0 : = 200 H1 : ? 200

b) Pruebas unilateral o de un extremo: la hiptesis planteada se formula con = o = H0 : = 200 H0 : = 200 H1 : < 200 H1 : > 200

166

PROBABILIDAD Y ESTADISTICA

En las pruebas de hiptesis para la media (), cuando se conoce la desviacin estndar (s) poblacional, o cuando el valor de la muestra es grande (30 o ms), el valor estadstico de prueba es z y se determina a partir de:

El valor estadstico z, para muestra grande y desviacin estndar poblacional desconocida se determina por la ecuacin:

En la prueba para una media poblacional con muestra pequea y desviacin estndar poblacional desconocida se utiliza el valor estadstico t.

Paso 4: Formular la regla de decisin

SE establece las condiciones especficas en la que se rechaza la hiptesis nula y las condiciones en que no se rechaza la hiptesis nula. La regin de rechazo define la ubicacin de todos los valores que son tan grandes o tan pequeos, que la probabilidad de que se presenten bajo la suposicin de que la hiptesis nula es verdadera, es muy remota

166

PROBABILIDAD Y ESTADISTICA

Distribucin muestral del valor estadstico z, con prueba de una cola a la derecha Valor critico: Es el punto de divisin entre la regin en la que se rechaza la hiptesis nula y la regin en la que no se rechaza la hiptesis nula. Paso 5: Tomar una decisin.

En este ltimo paso de la prueba de hiptesis, se calcula el estadstico de prueba, se compara con el valor crtico y se toma la decisin de rechazar o no la hiptesis nula. Tenga presente que en una prueba de hiptesis solo se puede tomar una de dos decisiones: aceptar o rechazar la hiptesis nula. Debe subrayarse que siempre existe la posibilidad de rechazar la hiptesis nula cuando no debera haberse rechazado (error tipo I). Tambin existe la posibilidad de que la hiptesis nula se acepte cuando debera haberse rechazado (error de tipo II). 4.- Ejemplo en la cual se indica el procedimiento para la prueba de hiptesis Ejemplo

El jefe de la Biblioteca Especializada de la Facultad de Ingeniera Elctrica y Electrnica de la UNAC manifiesta que el nmero promedio de lectores por da es de 350. Para confirmar o no este supuesto se controla la cantidad de lectores que utilizaron la biblioteca durante 30 das. Se considera el nivel de significancia de 0.05 Datos: Da 1 2 3 4 5 6 7 8 9 Usuarios 356 427 387 510 288 290 320 350 403 Da Usuarios Da 11 305 21 12 413 22 13 391 23 14 380 24 15 382 25 16 389 26 17 405 27 18 293 28 19 276 29 Usuario 429 376 328 411 397 365 405 369 429

166

PROBABILIDAD Y ESTADISTICA
10 329 20 417 30 364

Solucin: Se trata de un problema con una media poblacional: muestra grande y desviacin estndar poblacional desconocida. Paso 01: Seleccionamos la hiptesis nula y la hiptesis alternativa Ho: -350 Ha: ? 350

Paso 02: Nivel de confianza o significancia 95% a-0.05 Paso 03: Calculamos o determinamos el valor estadstico de prueba De los datos determinamos: que el estadstico de prueba es t, debido a que el numero de muestras es igual a 30, conocemos la media de la poblacin, pero la desviacin estndar de la poblacin es desconocida, en este caso determinamos la desviacin estndar de la muestra y la utilizamos en la formula reemplazando a la desviacin estndar de la poblacin.

Calculamos la desviacin estndar muestral y la media de la muestra empleando Excel, lo cual se muestra en el cuadro que sigue. Columna1 Media Error tpico Mediana Moda Desviacin estndar Varianza de la muestra Curtosis Coeficiente de asimetra Rango Mnimo Mximo Suma Cuenta Nivel de confianza (95.0%)

372.8 9.56951578 381 405 52.4143965 2747.26897 0.36687081 0.04706877 234 276 510 11184 30 19.571868

166

PROBABILIDAD Y ESTADISTICA

Paso 04: Formulacin de la regla de decisin. La regla de decisin la formulamos teniendo en cuenta que esta es una prueba de dos colas, la mitad de 0.05, es decir 0.025, esta en cada cola. el rea en la que no se rechaza Ho esta entre las dos colas, es por consiguiente 0.95. El valor critico para 0.05 da un valor de Zc = 1.96. Por consiguiente la regla de decisin: es rechazar la hiptesis nula y aceptar la hiptesis alternativa, si el valor Z calculado no queda en la regin comprendida entre -1.96 y +1.96. En caso contrario no se rechaza la hiptesis nula si Z queda entre -1.96 y +1.96.

Paso 05: Toma de decisin. En este ultimo paso comparamos el estadstico de prueba calculado mediante el Software Minitab que es igual a Z = 2.38 y lo comparamos con el valor critico de Zc = 1.96. Como el estadstico de prueba calculado cae a la derecha del valor critico de Z, se rechaza Ho. Por tanto no se confirma el supuesto del Jefe de la Biblioteca.

RECURSOS
VIDEOS MULTIMEDIA. Ejercicios de Estadstica Media Mediana y Moda de Datos Agrupados Descripcin de datos Agrupados y no Agrupados Imgenes de Estadstica Grficos Estadsticos Estadstica Aplicada 01 Estadstica Aplicada 02 Estadstica Aplicada 03 Estadstica Aplicada 08 Estadstica Aplicada 09 Estadstica Aplicada 10 Tablas de frecuencia

166

PROBABILIDAD Y ESTADISTICA
Creacin de Variables en SPSS Transfromacion de Variables en SPSS Tablas de Frecuencia en SPSS

MANUALES
Manuales en PDF:
Sumatorias Bsicas sumatorias Estadstica

Conceptos Basicos de la Estadstica Guia Teorica de Estadstica 1 Estadistica Basica Curso de Estadstica Basica Estadstica Descriptiva Estadstica Descriptiva de los datos Estadistica Descriptiva y variables 1 Aplicaciones de la Estadstica Descriptiva Graficos Estadsticos
Apuntes de estadstica Libro de estadstica Medidas de tendencia Central Medidas de tendencia Central Medidas de posicion Medidas de posicin y dispersin

166

PROBABILIDAD Y ESTADISTICA
Estadigrafos Organizacion y presentacion de datos A Organizacion y presentacion de datos B Organizacion y presentacion de datos C Variables aleatorias Teoria de la Probabilidad Breve introduccin a la teoria de la probabilidad Teoria de la Probabilidad Probabilidad Manual de calculos estadstios con spss

Manual de spss 12.0 Manual de spss Estimacion por intervalos y pruevas de hipotesis Pruevas de hiptesis Intervalos de confianza

Manuales en Word:
sumatorias Sumatorias Propiedades Ejercicios Indices sumarios Estadstica 1 Estadstica Estadstica Bsica datos agrupados e Histogramas Tabla de Distribucion de Frecuencias

166

PROBABILIDAD Y ESTADISTICA
Tablas de Frecuencias y representaciones graficas Medidas de posisin central Medidas de posisin central Medidas de dispersin

Manuales en Power Point:


Programa del Curso de Estadstica 1 Estadistica Descriptiva Organizacin y presentacion de datos Estadsticos

Estadigrafos de Dispersion Medidas de Tendencia Central SPSS Tutorial Pruevas de Hiptesis Variables aleatorias y sus distribuciones

BIBLIOGRAFIA

166

PROBABILIDAD Y ESTADISTICA

Autor:

George

C.

Canavos

Este libro se plane como una introduccin a la teora de la probabilidad y a la inferencia estadistica, para toda persona interesada en las disciplinas aplicadas; economa y finanzas, . ingenieria y ciencias fsicas y de la vida. No es necesario ningun conocimiento previo de probabilidad y estadstica, aunque se espera que el lector se encuentre familiarizado con los fundamentos de clculo diferencial e integral. EL Libro hace incapi en las aplicaciones. El rigor matemtico se emplea unicamente con el fin de exponer las bases de la probabilidad y la estadstica

Autor: Gert Maibaum

El presente tomo 11 de la Coleccin de textos de estudio Mathematik fir Lehrer ofrece una introduccin a la teora de y la estadstica matemtica, disciplinas que poseen una gran significacin para las ms diversas esferas aplicacin e investigacin cientifica, razn por la cual han entrado a formar parte de la formacin matemtica en la media superior. Este libros, en correspondencia con el objetivo general de la serie, est destinado, principalmente, a servir de texto en la formacin de profesores de matemtica, pero adems ddebe ser apropiado para los estudiantes de especialidades que durante su estudio establezcan contacto con el Clculo de probabilidades y la Estadstica, o ramas que empleen sus mtodos y procedimientos.

166

PROBABILIDAD Y ESTADISTICA

Autor: David Muoz

Como dijera Huntsberger: La palabra estadstica a menudo nos trae a la mente imgenes de nmeros apilados en grandes arreglos y tablas, de volmenes de cifras relativas a nacimientos, muertes, impuestos, poblaciones, ingresos, deudas, crditos y as sucesivamente. Huntsberger tiene razn pues al instante de escuchar esta palabra estas son las imgenes que llegan a nuestra cabeza.

Autores: A. J. Arriaza Gmez F. Fernndez Palacn M. A. Lpez Snchez M. Muoz Mrquez S. Prez Plaza A. Snchez Navas

Este libro surge como material de apoyo a un curso de estadsstica bsica con R. La gnesis est en la creacin del proyecto R UCA en mayo del 2007 y su primera versin ve la luz en enero de ese mismo ao. Los autores en orden alfabtico inverso son Antonio Sanchez Navas, Sonia Prez Plaza, Manuel Muoz Mrquez, Mara Auxiliadora Lpez Snchez, Fernando Fernndez Palacn y Antonio Jess Arriaza Gmez.

166

PROBABILIDAD Y ESTADISTICA

Autores: David Muoz Ana Maria Snchez Snchez

Como dijera Huntsberger: La palabra estadstica a menudo nos trae a la mente imgenes de nmeros apilados en grandes arreglos y tablas, de volmenes de cifras relativas a nacimientos, muertes, impuestos, poblaciones, ingresos, deudas, crditos y as sucesivamente. Huntsberger tiene razn pues al instante de escuchar esta palabra estas son las imgenes que llegan a nuestra cabeza.

SYLLABUS DE ESTADISTICA 1. AOS 2006,2007,2008 Y 2009

INFOGRAFIA
http://www.aulafacil.com/CursoEstadistica/CursoEstadistica.htm http://www.mailxmail.com/b-estadistica http://www.monografias.com/trabajos43/medidas-tendencia-central/medidas-tendencia-central.shtml http://www.monografias.com/trabajos15/estadistica/estadistica.shtml http://www.monografias.com/trabajos13/sumato/sumato.shtml http://thales.cica.es/rd/Recursos/rd97/UnidadesDidacticas/53-1-u-indice.html http://www.ucm.es/info/genetica/Estadistica/estadistica_basica.htm http://colposfesz.galeon.com/est501/suma/sumahtml/suma.htm http://www.monografias.com/trabajos30/estadistica-basica/estadistica-basica.shtml

166

PROBABILIDAD Y ESTADISTICA
http://www.monografias.com/trabajos60/estadistica-descriptiva/estadistica-descriptiva.shtml http://www.fisterra.com/mbe/investiga/10descriptiva/10descriptiva.asp http://thales.cica.es/rd/Recursos/rd98/Matematicas/01/matematicas-01.html

http://www.monografias.com/trabajos27/datos-agrupados/datos-agrupados.shtml
http://www.monografias.com/trabajos12/tutor/tutor.shtml http://www.cyta.com.ar/biblioteca/bddoc/bdlibros/guia_estadistica/index.htm http://www.angelfire.com/sc/matasc/EyD/bioesta/medidas.htm http://www.tuveras.com/estadistica/estadistica02.htm http://nutriserver.com/Cursos/Bioestadistica/bioestadistica.html http://dieumsnh.qfb.umich.mx/estadistica/ http://www.scribd.com/doc/5810376/Introduccion-a-la-estadistica http://colposfesz.galeon.com/est501/distfrec/meddisp/meddisp.htm http://www.ucm.es/info/genetica/Estadistica/estadistica_basica%201.htm http://www2.uca.es/serv/ai/formacion/spss/Inicio.pdf http://www.catedras.fsoc.uba.ar/sautu/pdfs/SPSS-manual.pdf http://carmesimatematic.webcindario.com/introduccionestadistica.htm

http://www.terra.es/personal2/jpb00000/tprobabilidad1.htm
http://www.lawebdefisica.com/apuntsmat/probabilidad/

http://estadistica.ematematicas.net/probabilidad/index.php?tipo=axiomatica http://www.bioestadistica.uma.es/libro/node66.htm http://www.cecam.sld.cu/pages/rcim/revista_4/articulos_html/rene.htm


http://www.e-biometria.com/glosario/glosario.htm

166

PROBABILIDAD Y ESTADISTICA

166

Das könnte Ihnen auch gefallen