Beruflich Dokumente
Kultur Dokumente
Media poblacional
Es la suma de los valores de los elementos dividida por la cantidad de stos. Es
conocida tambin como promedio, o media aritmtica.
La media muestral y la media poblacional se calculan en la misma manera, pero la
notacin abreviada que se emplea es diferente.
Media ponderada
La media ponderada constituye un caso especial de la media aritmtica y se presenta
cuando hay varias observaciones con el mismo valor.
Mediana
Es el valor del elemento intermedio cuando todos los elementos se ordenan.
Frmula de la mediana:
Mediana = X[n/2 +1/2]
12
Medidas de dispersin
Muestran la variabilidad de una distribucin, indicando por medio de un nmero, si las
diferentes puntuaciones de una variable estn muy alejadas de la media. Cuanto mayor
sea ese valor, mayor ser la variabilidad, cuanto menor sea, ms homognea ser a
la media. As se sabe si todos los casos son parecidos o varan mucho entre ellos.
El rango o recorrido estadstico es la diferencia entre el valor mximo y el valor mnimo
en un grupo de nmeros aleatorios. Se le suele simbolizar con R.
Para calcular la variabilidad que una distribucin tiene respecto de su media, se calcula
la media de las desviaciones de las puntuaciones respecto a la media aritmtica. Pero
la suma de las desviaciones es siempre cero, as que se adoptan dos clases de
estrategias para salvar este problema. Una es tomando las desviaciones en valor
absoluto (desviacin media) y otra es tomando las desviaciones al cuadrado (varianza).
Desviacin media
Media aritmtica de los valores absolutos de las desviaciones con respecto a la media
aritmtica.
Varianza muestral
TEORIA DE LA PROBABILIDAD
La probabilidad constituye un importante parmetro en la determinacin de las diversas
casualidades obtenidas tras una serie de eventos esperados dentro de un rango
estadstico.
Probabilidad clsica
La probabilidad clsica parte del supuesto de que los resultados de un experimento son
igualmente posibles. De acuerdo con el punto de vista clsico, la probabilidad de un
Probabilidad emprica
La probabilidad emprica o frecuencia relativa es el segundo tipo de probabilidad.
sta se basa en el nmero de veces que ocurre el evento como proporcin del nmero
de intentos conocidos.
Probabilidad subjetiva
Si se cuenta con poca o ninguna experiencia o informacin con la cual sustentar la
probabilidad, es posible aproximarla en forma subjetiva. En esencia, esto significa que
un individuo evala las opiniones e informacin disponibles y enseguida calcula o
asigna la probabilidad. Esta probabilidad se denomina adecuadamente probabilidad
subjetiva.
i)
ii)
ii)
A) PROBABILIDAD TOTAL
B) TEOREMA DE BAYES
Mtodos de muestreo
Una muestra es una porcin o parte de la poblacin de inters. En muchos casos, el
muestreo resulta ms accesible que el estudio de toda la poblacin. En esta seccin se
explican las razones principales para muestrear y, enseguida, diversos mtodos para
elegir una muestra.
Error de muestreo
Diferencia entre el estadstico de una muestra y el parmetro de la poblacin
correspondiente.
Estimador puntual.
La estimacin de parmetros tiene por finalidad asignar valores a los parmetros
poblacionales a partir de los estadsticos obtenidos en las muestras. Dicho de otra
manera, la finalidad de la estimacin de parmetros es caracterizar las poblaciones a
partir de la informacin de las muestras (por ejemplo, inferir el valor de la Media de la
poblacin a partir de los datos de la muestra).
Nivel de confianza
El nivel de confianza indica qu tan probable es que el parmetro de poblacin, como
por ejemplo la media, est dentro del intervalo de confianza.
El nivel de confianza representa el porcentaje de intervalos que incluiran el parmetro
de poblacin si usted tomara muestras de la misma poblacin una y otra vez. Por lo
tanto, si usted recogi cien muestras y cre cien intervalos de confianza de 95%, cabra
esperar que aproximadamente 95 de los intervalos incluyeran el parmetro de
poblacin.
Una prueba de hiptesis es una prueba estadstica que se utiliza para determinar si
existe suficiente evidencia en una muestra de datos para inferir que cierta condicin es
vlida para toda la poblacin.
Niveles de Significacin.
Al contrastar una cierta hiptesis, la mxima probabilidad con la que estamos
dispuesto a correr el riesgo de cometern error de tipo I, se llama nivel de significacin.
Anlisis de la varianza
Un anlisis de varianza (ANOVA) prueba la hiptesis de que las medias de dos o ms
poblaciones son iguales. Los ANOVA evalan la importancia de uno o ms factores al
comparar las medias de la variable de respuesta en los diferentes niveles de los
factores. La hiptesis nula establece que todas las medias de la poblacin (medias de
los niveles de los factores) son iguales mientras que la hiptesis alternativa establece
que al menos una es diferente.
La distribucin F
Caractersticas de la distribucin F
1. Existe una familia de distribuciones F. Un miembro particular de la familia se
determina mediante dos parmetros: los grados de libertad en el numerador y
los grados de libertad en el denominador.
2. La distribucin F es continua. Esto significa que se supone un nmero infinito
de valores entre cero y el infinito positivo.
3. La distribucin F no puede ser negativa. El valor menor que F puede tomar es
0.
Grados de libertad
De un conjunto de observaciones, los grados de libertad estn dados por el nmero de
valores que pueden ser asignados de forma arbitraria, antes de que el resto de las
variables tomen un valor automticamente, producto de establecerse las que son
libres, esto, con el fin de compensar e igualar un resultado el cual se ha conocido
previamente. Se encuentran mediante la frmula n-r donde nmero de sujetos en la
muestra que pueden tomar un valor y es el nmero de sujetos cuyo valor depender
del que tomen los miembros de la muestra que son libres. Tambin pueden ser
representados por , donde nmero de grupos, esto, cuando se realizan operaciones
con grupos y no con sujetos individuales.
Otro uso de la distribucin F es el anlisis de la tcnica de la varianza (ANOVA), en la
cual se comparan tres o ms medias poblacionales para determinar si pueden ser
iguales.
Para emplear ANOVA, se supone lo siguiente:
1. Las poblaciones siguen la distribucin normal.
2. Las poblaciones tienen desviaciones estndar iguales ().
3. Las poblaciones son independientes.
Cuando se cumplen estas condiciones, F se emplea como la distribucin del estadstico
de prueba.
La estrategia es estimar la varianza de la poblacin (desviacin estndar al cuadrado)
de dos formas y despus determinar la razn de dichos estimados. Si esta razn es
aproximadamente 1, entonces por lgica los dos estimados son iguales, y se concluye
que las medias poblacionales no son iguales. La distribucin F sirve como un rbitro al
indicar en que instancia la razn de las varianzas muestrales es mucho mayor que 1
para haber ocurrido por casualidad.
En esta ecuacin, y representa los valores de la coordenada a lo largo del eje vertical
en el grfico (ordenada); en tanto que x indica la magnitud de la coordenada sobre el
eje horizontal (absisa). El valor de a (que puede ser negativo, positivo o igual a cero)
es llamado el intercepto; en tanto que el valor de b (el cual puede ser negativo o
positivo) se denomina la pendiente o coeficiente de regresin.
Anlisis de correlacin
La idea bsica del anlisis de correlacin es reportar la asociacin entre dos variables.
El primer paso habitual es trazar los datos en un diagrama de dispersin.
Este es expresado por un nico valor llamado coeficiente de correlacin (r), el cual
puede tener valores que oscilan entre -1 y +1. Cuando r es negativo, ello significa que
una variable (ya sea x o y) tiende a decrecer cuando la otra aumenta (se trata
entonces de una correlacin negativa, correspondiente a un valor negativo de b en
el anlisis de regresin). Cuando r es positivo, en cambio, esto significa que una
variable se incrementa al hacerse mayor la otra (lo cual corresponde a un valor positivo
de b en el anlisis de regresin).
Coeficiente de correlacin
Describe la fuerza de la relacin entre dos conjuntos de variables en escala de
intervalo o de razn.
Se designa con la letra r, y con frecuencia se le conoce como r de Pearson y
coeficiente de correlacin producto-momento. Puede adoptar cualquier valor de 1.00
a +1.00, inclusive. Un coeficiente de correlacin de 1.00 o bien de +1.00 indica una
correlacin perfecta.
El coeficiente de determinacin
Correlacin y causa
Si hay una relacin fuerte (sea 0.91) entre dos variables, es factible suponer que un
aumento o una disminucin en una variable causa un cambio en la otra variable.
Se puede concluir cuando se tienen dos variables con fuerte correlacin es que hay
una relacin o asociacin entre ambas variables, no que un cambio en una ocasiona un
cambio en la otra.