Beruflich Dokumente
Kultur Dokumente
σ 𝑥 − 𝑥ҧ 𝑦 − 𝑦ത
𝑟=
σ 𝑥 − 𝑥ҧ 2 σ 𝑦 − 𝑦ത 2
σ(𝑥 − 𝑥)(𝑦
ҧ − 𝑦)
ത −2223 −2223 −2223
𝑟= = = =
2
σ(𝑥 − 𝑥)ҧ ∙ σ(𝑦 − 𝑦)
ത 2 6390 ∙ 993.6 79.9374 ∙ 31.5214 79.9374 ∙ 31.5214
−2223
= = − 𝟎. 𝟖𝟖𝟐𝟐
2519.7387
DIAGRAMAS DE
DISPERSIÓN
Es un gráfico que muestra la
relación entre dos variables
cuantitativas, sobre un mismo
grupo de individuos.
En un plano cartesiano, se
representan la combinación o
relación de los valores de las
variables x (abscisas) e y
(ordenadas), para que cualquier
punto ubicado en el plano, sea la
combinación de ambos valores,
formando una coordenada (x, y)
Tenemos un conjunto de datos, donde relacionaremos dos variables,
eficiencia terminal y el gasto público en educación por alumno en
miles de pesos.
Los datos están ordenados por años, tenemos dos niveles educativos
a considerar: bachillerato y profesional técnico (Datos a nivel
Nacional, Fuente INEGI)
Dibujaremos un diagrama que relacione la eficiencia terminal con el
gasto público en educación, seleccionaremos para este primer
diagrama de dispersión, el nivel bachillerato y lo relacionaremos con
el gasto publico a nivel bachillerato.
Cada punto representa un año en especifico, por cada año hay un
nivel de gasto y por cada nivel de gasto, hay un nivel de eficiencia
terminal.
65
2010
64 2014
2013
2009
2012
Eficiencia Terminal
63
2011
2008
62
61 2007
60 2006
2005
59
0 5 10 15 20 25 30 35
Gasto Público en Nivel Bachillerato (Miles de pesos)
Se debe identificar el comportamiento dentro de la nube de puntos,
para poder determinar si alguno de ellos, sale del comportamiento
general, por lo que será importante determinar la forma de la
relación, así como la dirección que tiene (sentido) y la fuerza que hay
en la relación entre las variables.
En este gráfico, se pueden identificar tres grupos principales:
65
2010
64 2014
2013
2009
2012
63
2011
Eficiencia Terminal
2008
62
61 2007
2006
60
2005
59
0 5 10 15 20 25 30 35
Gasto Público en Nivel Bachillerato (Miles de pesos)
También observamos dos brincos, donde se
De manera general, observamos que el gasto ha aumentado al paso de los años y
la eficiencia terminal.
En el año 2010 el gasto publico fue de 27 y la eficiencia terminal de 64.2
En el 2011 el gasto público se elevo a 29.1 y la eficiencia terminal disminuyo de
64.2 a 62.8, lo que se representa con el brinco en la gráfica.
En términos generales, la relación es de incremento, lo cual lleva a definir el
diagrama como una relación positiva.
Podemos determinar, entonces, que existe una relación lineal entre las variables
65
64
63
Eficiencia Terminal
62
61
60
59
0 5 10 15 20 25 30 35
Gasto Público en Nivel Bachillerato (Miles de pesos)
Por el contrario, si graficamos el nivel de profesional técnico, obtenemos una grafica
60
50 2009
2005 2008 2011
2010
2013
eficiencia Terminal
30
20
10
0
0 5 10 15 20 25
Gasto Público Profesional Técnico (Miles de pesos)
En el diagrama podemos observar que no hay una relación clara, es decir, no se
puede determinar una relación entre ambas variables.
El coeficiente de determinación, se define como la proporción de la
varianza total de la variable explicada por la regresión. El coeficiente de
determinación, también llamado R cuadrado, refleja la bondad del ajuste
de un modelo a la variable que pretender explicar.
Es importante saber que el resultado del coeficiente de determinación
oscila entre 0 y 1. Cuanto más cerca de 1 se sitúe su valor, mayor será el
ajuste del modelo a la variable que estamos intentando explicar. De forma
inversa, cuanto más cerca de cero, menos ajustado estará el modelo y, por
tanto, menos fiable será.
2 𝜎𝑅2 2
𝑅 = 1− 2 𝑅
𝜎
𝑅2 = 1 −
𝜎2
𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑟𝑒𝑠𝑖𝑑𝑢𝑎𝑙
𝐶𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑑𝑒𝑡𝑒𝑟𝑚𝑖𝑛𝑎𝑐𝑖𝑜𝑛 = 1 −
𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎
Estadística inferencial: se ocupa de predecir, sacar conclusiones para una
población tomando como base una muestra.
Población: conjunto de individuos sobre los que realizamos el estudio
Muestra: subconjunto de la población , esta debe representar bien a la
población para que los datos a inferir sean correctos.
POBLACION MUESTRA
𝜇 = 𝑚𝑒𝑑𝑖𝑎 𝑡í𝑝𝑖𝑐𝑎 𝜇ҧ = 𝑥ҧ = 𝑚𝑒𝑑𝑖𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙
p= 𝑝𝑟𝑜𝑝𝑜𝑟𝑐𝑖ó𝑛 𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙 𝑝Ƹ = 𝑝𝑟𝑜𝑝𝑜𝑟𝑐𝑖ó𝑛 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙
𝜎 = 𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑡í𝑝𝑖𝑐𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙 (𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝜎 2 ) 𝑠 = 𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑡í𝑝𝑖𝑐𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙 (𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝜎 2 )
Parámetros muestrales
Parámetros poblacionales
(Estadísticos poblacionales)
Estimación estadística:
Estimación puntuales:
𝜎 3.2
𝑥~𝑁
ҧ 𝜇, = 𝑁 167,
𝑛 10
𝑥~𝑁
ҧ 167, 1.012
𝑥~𝑁
ҧ 167, 1.012 𝑧~𝑁
ҧ 0, 1 𝑆𝑖𝑔𝑢𝑒 𝑙𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝑛𝑜𝑟𝑚𝑎𝑙,