Beruflich Dokumente
Kultur Dokumente
Notas
Indice
1. DEFINICIÓN DE VARIABLE ALEATORIA 1
2. DEFINICIÓN DE VARIABLES ALEATORIAS INDEPENDIENTES 1
3. VARIABLES ALEATORIAS DISCRETAS 2
4. VARIABLES ALEATORIAS CONTINUAS 4
5. VARIABLES ALEATORIAS MULTIDIMENSIONALES 9
6. TRANSFORMACIÓN DE VARIABLES 11
7. BIBLIOGRAFÍA 12
Pr ( A ∩ B ) = Pr ( A ) × Pr ( B )
Esta definición puede extenderse a k variables aleatorias Y1 , Y2 , , Yk , donde la independencia entre ellas
está asegurada si
f ( y1 , y2 , , yk ) = f1 ( y1 ) f 2 ( y2 ) f k ( yk )
cualesquiera que sean y1 , y2 , , yk .
donde f designa la función de densidad conjunta de (Y1 , Y2 , , Yk ) ;
1
fi designa la función de densidad de Yi .
Se pueden distinguir distintos tipos de variables aleatorias según dos criterios de clasificación:
(a) Variables cuantitativas que son las que resultan de experimentos cuyos resultados son directamente
numéricos;
(b) Variables cualitativas que son las que proceden de experimentos cuyos resultados expresan una
cualidad no numérica que necesita ser cuantificada.
Otra clasificación más operativa de las variables aleatorias sería:
(a) Variable discreta: aquella que se define sobre un espacio muestral numerable, finito o infinito.
Espacio numerable es aquel cuyos elementos se pueden ordenar, asignándoles a cada uno un
número de la serie de los números naturales (del 1 al n ó del 1 al I ). Todas las variables con un
número finito de valores y todas las que tomen valores en números enteros o racionales
(fraccionarios), son variables discretas;
(b) Variable continua: es aquella que se define sobre un espacio asimilable al conjunto de los números
reales, es decir, un espacio no numerable (o un espacio infinito de tipo C o infinito dos).
En general, la regla de oro es que todas las variables que proceden de experimentos en los que se cuenta
son discretas y todas las variables que proceden de experimentos en los que se mide son continuas.
Se dice que hemos definido una variable aleatoria para un experimento aleatorio cuando hemos asociado
un valor numérico a cada resultado del experimento.
Sea E el espacio muestral asociado a un experimento. Se llama variable aleatoria a toda aplicación del
espacio muestral E en el conjunto de los números reales (es decir, asocia a cada elemento de E un
número real).
Se utilizan letras mayúsculas X , Y , para designar variables aleatorias, y las respectivas minúsculas,
x, y, para designar valores concretos de las mismas.
Si un experimento con espacio muestral E , tiene asociada la variable aleatoria X , es natural que se
planteen preguntas como: ¿cuál es la probabilidad de que X tome un determinado valor? Esto nos lleva a
establecer, por convenio, la siguiente notación:
2
pieza tiene una probabilidad p de ser defectuosa; el tamaño de un conjunto si éste es aleatorio y no
demasiado grande; el número de artículos demandados en un almacén; el número de encuestados que
están a favor de determinada cuestión y un cuantioso etcétera.
Notación y parámetros
Notación y parámetros
Notación y parámetros
Notación y parámetros
3
3.5. Distribución de Poisson
Usos
Una variable aleatoria de Poisson es en realidad una variable aleatoria binomial llevada al límite, es decir
cuando n →∞ . (aunque basta con que sea suficientemente grande) y p → 0 (aunque basta con que
seasuficientemente pequeño).
En general cualquier “suceso raro" puede ser perfectamente modelizado por una variable aleatoria de
Poisson. Ejemplos típicos son el número de remaches defectuosos en un avión (porque un avión puede
llegar a tener varios millones de ellos y al ser un mecanismo tan simple es realmente difícil que sea
defectuoso); el número de erratas en un libro (que contiene un gran número de palabras que difícilmente
están mal escritas); el número de llegadas a un servicio ( o de llamadas a un callcenter) si la distribución
entre los tiempos es exponencial; el número de accidentes laborales en un mes en una gran empresa; el
número de personas que entran en un supermercado en un minuto; el número de personas residentes en
una gran ciudad que en un día sufren un infarto; etc.
Notación y parámetros
Notación y parámetros
n n
Varianza σ =
2
∑x
i =1
2
i pi − µ =2
∑(x
i =1
2
i − µ 2 ) pi
n
Desviación típica σ =+ ∑x
i =1
2
i pi − µ 2
4
4.1. Distribución beta
Usos
Debido a su gran flexibilidad se utiliza en situaciones en las que la ausencia de datos concretos no impide,
sin embargo, tener una idea del comportamiento "global" de la variable aleatoria. Si suponemos conocidos,
o razonablemente supuestos, valores tales como el máximo, mínimo, media o moda y el tipo de simetría (o
asimetría), entonces es posible encontrar una distribución Beta que se adapte a dichas suposiciones.
También se utiliza para simular la proporción (o el número total) de productos defectuosos en un lote de
fabricación, la duración de un proceso (en PERT/CPM), o la mediana de una muestra aleatoria.
Notación y parámetros
Propiedades
Si α = β la distribución es simétrica y centrada;
Si α = β = 1 se convierte en una distribución uniforme;
Si X ∼ Be (α , β ) ↔ 1 − X ∼ Be ( β , α ) ;
( )
Be 1 , 1 es la distribución arcoseno.
2 2
Notación y parámetros
Propiedades
Es una distribución de valores positivos siempre menores que B , cuya moda es A .
5
4.3. Distribución de Cauchy
Usos
El cociente de dos cantidades normales estándar independientes sigue una distribución de Cauchy, este
hecho es suficiente para que esta distribución deba ser tenida en cuenta a la hora de realizar simulaciones.
π π
De otra manera, si θ se distribuye U ∼ − , , entonces X = tg (θ ) se distribuye según una
2 2
distribución de Cauchy ( a = 0, b =1) . Así, la distancia a la que un segmento de longitud infinita y con un
origen arbitrario corta a una recta (la distancia se considera desde el punto de corte de la recta que
determina la distancia del origen a la recta) se distribuye con arreglo a esta distribución cuando el ángulo
π π
que forma el segmento con la recta es arbitrario (esto es, igualmente posible entre − , .
2 2
La distribución de Cauchy se caracteriza por tener las colas (es simétrica) mucho más largas que otras
distribuciones simétricas (la normal o incluso la logística) esto hace que tenga aplicación durante la fase de
validación de un modelo cuando se quiere someter a éste a un gran número de valores extremos.
Notación y parámetros
No es una distribución demasiado conocida. Aunque pueda encontrarse con otra notación, la habitual es
X ∼ C ( a, b ) ,
donde a es el parámetro de posición ( −∞ < a < ∞ ) ; y
Notación y parámetros
6
fenómenos de espera, el hecho de que sea siempre positiva la liga a magnitudes como el tiempo para
realizar una tarea o el tiempo hasta el fallo de un dispositivo, entre otras posibles aplicaciones.
Estas aplicaciones se derivan del hecho de que puede considerarse como la probabilidad de que ocurran α
sucesos en un periodo ( 1β ) de tiempo (por ejemplo que fallen los k subsistemas de un dispositivo que
harán que éste finalmente deje de funcionar; que se lleven a cabo las k subtareas que componen una tarea
principal con lo que ésta puede considerarse terminada, etc.)
Notación y parámetros
donde α (α > 0 ) ;
es un parámetro de forma,
Notación y parámetros
Notación y parámetros
7
4.8. Distribución lognormal
Usos
De la misma manera que la suma de un número (suficiente) de variables aleatorias positivas se distribuye
de forma normal, el producto de un número (suficiente) de variables aleatorias positivas se distribuye de
forma log–normal. Así, numerosas magnitudes en las que en vez de la adición está presente el producto, se
modelizan a través de esta distribución; por ejemplo la evolución de los precios Pt de un determinado
producto puede modelizarse de la forma siguiente:
σ2
µ − t +ε σ t
2
Pt = P0 e
Notación y parámetros
La notación habitual es X ∼ LN ( µ ,σ ) ,
2
Notación y parámetros
La notación habitual es X ∼ N ( µ ,σ ) ,
2
8
el tamaño de las ciudades; el número de empleados de las empresas; las fluctuaciones de los precios en los
mercados de valores, entre otras. En algunos textos la encontramos exclusivamente asociada a la
distribución de los ingresos de los individuos: "la probabilidad de que la renta de un individuo supere una
cierta cantidad A es una variable aleatoria de Pareto (α = A ) ".
En general, es una distribución a tener en cuenta para modelizar una magnitud (positiva) cuando en ésta se
cumpla que un pequeño porcentaje de valores aparece un gran número de veces y es posible un elevado
número de valores extremos aunque muy poco probables.
Notación y parámetros
Notación y parámetros
La notación habitual es X ∼ U ( a, b ) ,
donde a es el parámetro de posición; y
b−a determina la escala de la distribución ( b > a ) .
5.1 Definición
Sea E el espacio muestral asociado a un experimento aleatorio. Sea Ω un espacio de sucesos asociado a
E . Llamaremos variable aleatoria multidimensional o variable aleatoria n-dimensional a una función
X = ( X 1, , Xn ) X :E → n
Cada variable componente de una variable aleatoria n-dimensional es una variable aleatoria unidimensional
que recibe el nombre de variable marginal: si ( X ,Y ) es una variable aleatoria bidimensional, llamaremos
variables marginales a cada una de las variables componentes, X e Y , y a sus distribuciones respectivas,
distribuciones marginales.
Diremos que una variable aleatoria ( X , Y ) es de tipo discreto o, simplemente, discreta si el conjunto de
posibles pares de valores de la variable es finito o infinito numerable. Los pares de valores que tienen
probabilidad positiva se llaman puntos de masa
9
Variables continuas
Las variables aleatorias bidimensionales de tipo continuo son una extensión de las variables aleatorias
(unidimensionales) continuas que hemos estudiado en el tema anterior: son aquellas que toman valores en
el recinto del plano.
Diremos que una variable aleatoria bidimensional ( X ,Y ) es de tipo continuo o, simplemente, continua si
existe una función f :
2
→ no negativa tal que la función de distribución de ( X , Y ) , F ( x, y ) , verifica
que
∫ ( ∫ f ( u, v ) dv ) du
x y
F ( x, y ) = ∀ ( x, y ) ∈ 2
−∞ −∞
Distribuciones marginales
Si ( X ,Y ) es una variable aleatoria bidimensional, llamaremos variables marginales a cada una de las
variables componentes, X e Y , y a sus distribuciones respectivas, distribuciones marginales.
Intuitivamente, dos sucesos son independientes cuando el conocimiento de la ocurrencia de uno de ellos no
modifica la probabilidad del otro. Este concepto se puede extender a variables aleatorias
En este contexto, si ( X ,Y ) es una variable aleatoria bidimensional, y sabemos que Y ha tomado el valor
y , diremos que X e Y son variable aleatorias independientes cuando este conocimiento no modifica la
distribución de probabilidad de X . Esta idea se puede generalizar al caso de variables aleatorias n–
dimensionales
Sea ( X ,Y ) una variable aleatoria bidimensional: Entonces, X e Y son independientes si y solo si:
f ( x, y ) = f X ( x ) f Y ( y ) ∀ ( x, y ) ∈ 2
Esta caracterización se extiende al caso de n variables y ya que va a ser de gran importancia en temas
posteriores, se describe a continuación.
Teorema:
• Si ( X 1, , X n ) es discreta,
Pr ( X 1 = x1 , , X n = xn ) = Pr ( X 1 = x1 ) Pr ( X n = xn )
• Si ( X 1, , X n ) es continua con función de densidad f ,
f ( x1 , x2 , , xn ) = f ( x1 ) f ( x2 ) f ( xn )
10
6. Transformación de variables
Cuando una variable no satisface las asunciones de normalidad, homogeneidad de varianzas o linealidad,
puede ser útil corregir la deficiencia usando una transformación de la misma.
Una transformación es una función de un valor que define un nuevo valor. Su forma general es: y = f(x),
donde f es la función de transformación.
Se distinguen dos categorías de transformación: transformación lineal y transformación no lineal
La transformación lineal cambia la escala de la distribución pero no la forma de la distribución. Podemos de
esta manera eliminar valores negativos.
La transformación no lineal cambia la distribución para ajustarla a la distribución normal y estabiliza la
varianza.
Hay distintos tipos de transformación de las variables y entre ellos podemos citar los siguientes:
• Estandarización Z o z–scores. Convierte todos los valores de la población (o muestra) en medidas de
desviación estándar por encima o por debajo de la media. Estos valores transformados se llaman
scores estándar o z–scores. Un score estándar es la distancia de un valor a la media de la distribución.
La distribución resultante de este proceso tiene una media de cero (0) y una desviación estándar de uno
(1). La estandarización Z no normaliza una distribución; el tipo (o forma) de la distribución permanece
el mismo.
El beneficio de este proceso es hacer variables con diferentes o diferentes unidades de medida o
diferentes escalas de medida comparables.
Cuando una transformación Z se hace en una población normal, la distribución resultante se llama
distribución normal estándar o distribución Z .
Esta transformación es común en la regresión lineal. En la regresión lineal la pendiente ( b ) representa
el coeficiente de correlación no estandarizado, mientras que el coeficiente beta ( β ) representa el
coeficiente de correlación estandarizado, por eso la b compara la misma variable en diferentes
ecuaciones, mientras que la β compara diferentes variables dentro de la misma ecuación.
• Transformación lineal. Traslada los datos a un nuevo origen por expansión (o contracción) de la escala
de medida. La distribución no cambia. Tiene la forma general y = b x + a , donde a es la translación o
constante aditiva y b es la constante multiplicativa.
La constante de translación solamente agrega un valor constante a cada medida. Tiene el efecto de
cambiar el origen del eje x . La constante multiplicativa expande (o contrae) la escala, tiene un efecto
de escala.
• Transformación logarítmica o logaritmo ampliada: Se usa para normalizar una distribución que tenga un
sesgo positivo extremo. También es apropiada para alguna población cuando la varianza es
proporcional a la media.
3
• Transformación x : se usa para reducir sesgo negativo extremo.
2
• Transformación x : se usa para corregir sesgo negativo.
• Transformación raíz cuadrada o raíz cuadrada ampliada: reduce el sesgo positivo de tipo medio.
2
• Transformación seno hiperbólico inverso −x
[: corrige la kurtosis positiva residual.
e −e
x
11
7. Bibliografía
http://www.unavarra.es/estadistica/LE/Estadistica/
http://www.campusvirtual.uma.es/est_fisio/apuntes/
www.eumed.net/cursecon/libreria/2004/jsf/6.pdf
www.uclm.es/profesorado/jmezo/estadistica/t2.pdf
http://www.eumed.net/cursecon/libreria/drm/drm-estad.pdf
http://www.eui.upm.es/~acorral/material/index.html
http://www.utexas.edu/courses/schwab/sw388r7/SolvingProblems/ComputingTransformations.ppt
http://www.colfa.utsa.edu/Sociology/masters/manip.html
www.unavarra.es/estadistica/I.T.I./I.T.I.Mecanica/Metodos estadisticos de la Ingenieria/Curso 2004-
05/Apuntes estadistica/VA_continuas_1.pdf
www.unavarra.es/estadistica/I.T.I./I.T.I.Mecanica/Metodos estadisticos de la Ingenieria/Curso 2004-
05/Apuntes estadistica/VA_continuas_2.pdf
www.unavarra.es/estadistica/I.T.I./I.T.I.Mecanica/Metodos estadisticos de la Ingenieria/Curso 2004-
05/Apuntes estadistica/VA_discretas.pdf
www.chups.fr/polys/biostats/poly/stats.pdf
www.anu.edu.au/nceph/surfstat/surfstat-home/contents.html
www.uvp5.univ-paris5.fr/staticmed/E-STAT/PlantStatPCEM1.htm
www.eumed.net/libros/2006a/rmss/index.htm
ftp.medprev.uma.es/libro/html.htm
idea.uab.es/fklijn/bio/indexold.htm
halweb.uc3m.es/omar/taller/TALLER.html
Libros
Martínez González MA, De Irala Estévez J, Faulín Fajardo FJ. Bioestadística amigable. Madrid: Díaz de
Santos, 2001
Spiegel, MR. Estadística, 2ª Edición. México: McGraw-Hill, 2000.
Horra Navarro, J. Estadística aplicada, 3ª Edición. Madrid: Díaz de Santos, 2003
A.Martín Andres, J.de D. Luana del Castillo. Bioestadística para las Ciencias de la Salud, 5ª Edición. Madrid:
Norma, 2004
12