Beruflich Dokumente
Kultur Dokumente
TAREA 3
GLOSARIO
ESTADISTICA
DOCENTE: MTRO. MARCO A. JIMENO ZAVALA
ALUMNOS
CHAVEZ GRANADOS LUIS ANTONIO
FLORES ROSALES LUIS ALBERTO
REYES REYES OBED
TERCER SEMESTRE GRUPO B
GLOSARIO DE TÉRMINOS ESTADÍSTICOS
A
ANOVA. - Análisis de la varianza. Es una técnica estadística que sirve para decidir /
determinar si las diferencias que existen entre las medias de tres o más grupos (niveles
de clasificación) son estadísticamente significativas. Las técnicas de ANOVA se basan
en la partición de la varianza para establecer si la varianza explicada por los grupos
formados es suficientemente mayor que la varianza residual o no explicada.
ÁREA BAJO LA CURVA (entre dos puntos). - Si la curva viene dada por una función
de densidad teórica, representa la probabilidad de que la variable aleatoria tome un valor
dentro del intervalo determinado por esos dos puntos.
CUARTILES. - Existen tres cuartiles: Q1, Q2 y Q3. Estos números dividen a los valores
muestrales, una vez ordenados, en cuatro partes homogéneas en cuanto a número de
observaciones. Así Q1 determina el valor que hace que haya un 25% de valores muestrales por
debajo de éste, y un 75% por encima de éste. Q2 es la mediana.
DATOS PAREADOS. - Datos de poblaciones dependientes, donde los datos de las variables
van emparejados por individuos, en contraposición con los datos independientes.
DECILES. - Corresponden a los percentiles 10%, 20%, 30%, 40%, 50%, 60%, 70% 80%, 90% y
100%
ERROR ALFA. - Es el error que se comete cuando se rechaza una hipótesis nula cuando está
verdadera. Error de tipo I.
ERROR ALFA GLOBAL. - Es el error alfaque se comete por hacer múltiples comparaciones.
ERROR BETA. - Es el error que se comete cuando no se rechaza una hipótesis nula siendo esta
falsa. Error de tipo II.
ESTADÍSTICOS. - Son funciones de la muestra. Su valor variará según la muestra, pero nos
permite hacer estimaciones de parámetro poblacionales o construir estadísticos experimentales
para tomar decisiones.
ESTIMADOR. - Función de la muestra que sirve para dar valores candidatos a los
valores desconocidos poblacionales.
FACTOR DE CLASIFICACIÓN. - Es una variable que se usa para clasificar los datos
experimentales en grupos. Los factores de clasificación son variables nominales. Cada factor de
clasificación se compone de niveles. Así la variable “fumador” codificada como “nunca”,
“exfumador”, “fumador actual” es un factor de clasificación con tres niveles.
FUNCIÓN. - Función matemática. Expresión que liga dos o más variables de forma
determinística.
GRADOS DE LIBERTAD. - El número de datos que se pueden variar para que a un total fijo
podamos reconstruir dicho total; así la media tiene n-1 grado de libertad, pues si conocemos el
valor de ésta, podemos variar n-1 datos ya que restante vendrá fijado. En una tabla 4 x 3, si nos
dan las frecuencias marginales podremos variar las frecuencias de (4-1) x (3-1) = 3 x 2 = 6
celdas, quedando forzosamente determinadas las frecuencias de las celdas restantes. Así, los
grados de libertad serían en este caso de 6.
HIPÓTESIS. - Cualquier teoría que formule posibles líneas de trabajo experimental. Ver
hipótesis nula y alternativa.
sí.
JUEGO DE SUMA CERO. - En la teoría de juegos, juego en el que lo que unos ganan es a
costa de lo que otros exactamente pierden.
MÁXIMO. - Es un valor muestral de forma que por encima de este no hay valores muestrales.
MEDIANA. - Corresponde al percentil 50%. Es decir, la mediana hace que haya un 50%
de valores muestrales inferiores a ella y un 50% de valores muestrales superiores a ella.
MÍNIMO. - Es un valor muestral de forma que por debajo de este no hay valores
MODELO. - Intento matemático / estadístico para explicar una variable respuesta por medio de
una o más variables explicativas o factores.
ODDS. - Nombre inglés para designar la medida del efecto relacionada, en una tabla de
frecuencias 2 por 2, con la razón de los productos cruzados.
ORDEN DE UNA MATRIZ. - Es el número que designa, en una matriz cuadrada, el número de
filas o columnas.
ORTOGONAL. - Se dice de las variables y en general de las funciones que son independientes.
P (p-valor). - El nivel de significación observado en la prueba. Cuanto más pequeño sea, mayor
será la evidencia para rechazar la hipótesis nula.
PREVALENCIA. - Cociente entre el número de individuos que poseen una característica (p.
Ej. Enfermedad) entre el total de la población.
PROPORCIÓN. - Número de individuos que verifican una condición entre el total muestral.
Se puede expresar en tanto por ciento.
PRUEBA DE F.- Prueba estadística que sirve para comparar varianzas. El estadístico F
experimental es el estadístico de contraste en el ANOVA y otras pruebas de comparación de
varianzas.
PRUEBA DE LOS SIGNOS. - Prueba estadística que sirve para comparar dos variables en
términos de diferencias positivas o negativas, y no en términos de magnitud.
PRUEBA DE MCNEMAR. - Prueba estadística que sirve para comparar proporciones en datos
pareados.
PUNTO DE INFLEXIÓN. - Representan los puntos de una función matemática donde la curva
pasa de ser cóncava a convexa o recíprocamente.
RANGO. - Diferencia entre el valor máximo y mínimo de una muestra o población. Solo es
válido en variables continuas. Es una mala traducción de inglés “range”. Amplitud.
RECTA DE REGRESIÓN. - Es el modelo que sirve para explicar una variable respuesta
continua en términos de un único factor o variable explicativa.
REGRESIÓN. - Técnica estadística que relaciona una variable dependiente (y) con la
información suministrada por otra variable independiente (x); ambas variables deben ser
continuas. Si asumimos relación lineal, utilizaremos la regresión lineal simple. Entre las
restricciones de la RLS se incluyen: Los residuos deben ser normales; las observaciones
independientes; la dispersión de los residuos debe mantenerse a lo largo de la recta de regresión.
SESGO. - La diferencia entre el valor del parámetro y su valor esperado. También se utiliza
en contraposición de aleatorio, así una muestra sesgada es no aleatoria.
SIMETRÍA. - Es una medida que refleja si los valores muestrales se extienden o no de
igual forma a ambos lados de la media.
SUMATORIA. - Estadístico descriptivo que suma los valores numéricos de los datos
muestrales de distribuciones continuas.
TABLA DEL ANOVA. - Es una forma de presentar la variabilidad observada en una variable
respuesta en términos aditivos según las distintas fuentes de variación: modelo residual.
TEOREMA DEL LÍMITE CENTRAL. - Resultado básico en la estadística que afirma que
la distribución de las medias muestrales será normal para un n suficientemente grande con
independencia de la distribución de datos de partida.
VARIABLE. - Objeto matemático que puede tomar diferentes valores. Generalmente asociado
a propiedades o características de las unidades de la muestra. Lo contrario de variable es
constante.
VARIABLE CONTINUA. - Aquella que puede tomar una infinidad de valores, de forma que,
dados dos valores cualesquiera, también pueda tomar cualquier valor entre dichos valores.
VARIABLE DISCRETA. - Variable que toma un número finito o infinito de valores, de forma
que no cubre todos los posibles valores numéricos entre dos dados, en contraposición de las
continuas.