Sie sind auf Seite 1von 28

Universidad Nacional del Comahue

Facultad de Ingeniería

PROBABILIDAD Y ESTADÍSTICA

Dr. Sergio Bramardi

Programa

• UNIDAD 1: Estadística Descriptiva.

• UNIDAD 2: Cálculo de Probabilidades.

• UNIDAD 3: Variables aleatorias y Distribuciones de Probabilidad

• UNIDAD 4: Estimación de Parámetros

• UNIDAD 5: Pruebas de Hipótesis

• UNIDAD 6: Análisis de Regresión y Correlación

1
EQUIPO DE CÁTEDRA

Profesor: Sergio Bramardi


Asistente: Ana Haique
Ayudantes: Mabel Basanta – Javier Molina
Alumnos: Ignacio Hendl

HORARIOS DE CLASES
Lunes AULA 107 (Rectorado)
14:30-17:00 (Gralmente. Teoría)

Jueves AULA 107 (Rectorado)


17:00-20:00 (Gralmente. Práctica)

SISTEMA DE PROMOCIÓN

La acreditación podrá realizarse a través de los siguientes regímenes

Cursado: dos exámenes parciales teóricos-prácticos, con sus respectivos


recuperatorios. Aprobación con 60 puntos que corresponde a responder
satisfactoriamente el 60 % de los temas solicitados en la evaluación.

Promoción: la suma de puntos en los parciales deberá acumular como mínimo


160 puntos con no menos de 80 puntos en cada uno. Para esta instancia, y a
los efectos de lograr alcanzar la suma de puntaje exigido, se admitirá la
posibilidad de mejorar la nota obtenida en el examen parcial de menor
calificación. Además de este requisito para acceder a la promoción se deberá
rendir al finalizar el cursado un examen integrador de aplicación de las técnicas
desarrolladas (nota mínima 80), donde se deberá demostrar tanto manejo
práctico como teórico-conceptual y presentar la resolución de un ejercicio con
software estadístico.

2
Nota Final promocionados:

80 – 83 puntos  7 (SIETE)
84 – 89 Puntos  8 (OCHO)
90 – 95 puntos  9 (NUEVE)
96 – 100 puntos  10 (DIEZ)

FECHAS TENTATIVAS PARCIALES

Lunes 29 de Abril, 12 hs PRIMER PARCIAL

Lunes 10 de Junio, 12 hs SEGUNDO PARCIAL

24 de Junio y 1 de Julio RECUPERATORIOS

23 de Julio COLOQUIO

CLASES DE CONSULTA

Sergio Bramardi Miércoles 13 hs Aula 4 FAEA

3
CONTENIDOS

UNIDAD 1: Estadística Descriptiva. Población, muestra. Variables,


Datos. Distribuciones de frecuencia y su representación gráfica.
Medidas de posición: Media , Mediana, Modo, Cuartiles. Propiedades
de la Media aritmética. Medidas de dispersión: Rango, Rango
intercuartílico. Desvío medio, Desvío Estándar. Variancia,
propiedades de la variancia, propiedades del desvío standart.
Estadísticos de simetría y de kurtosis. Diagramas de cajas (Box-
plots). Modelos empíricos de frecuencias en dos dimensiones.
Diagramas de dispersión y tablas de frecuencias. Covarianza y
correlación lineal entre dos variables. Utilización de variables
clasificatorias para comparación de subpoblaciones.

Ciencias Básicas (Materias comunes) Probabilidad y Estadística (Módulo I)

4
¿ Qué es la estadística ?

Es la disciplina que se ocupa de la recopilación, presentación, análisis


e interpretación de datos para la toma de decisiones y resolución de
problemas.

La importancia que la Estadística ha alcanzado en nuestros días, tanto


en el trabajo profesional como en la investigación, es innegable.

La tendencia positivista de las ciencias modernas, ha hecho que la


legitimación y comprobación de resultados o garantías de su validez
dependan cada vez más de la utilización de herramientas o métodos
estadísticos.

Estos métodos estadísticos se utilizan en los campos más diversos de


las actividades humanas, donde no escapan las disciplinas biológicas,
economía, ingeniería, medicina, entre otras.

Métodos estadísticos

serie de procedimientos para:

OBTENER – TRATAR – ANALIZAR

Información o datos estadísticos

5
DATOS VARIABILIDAD

describir y comprender esa variabilidad

Est. DESCRIPTIVA Est. INFERENCIAL

Población X1

X2
.
.
.
Auxilio de la Teoría de
Xi
Probabilidades
. X1
. .
. .
. Muestra
XN
Xn

Tipos de Datos

Cuantitativos o Numéricos Cualitativos o Categóricos


(describen cantidades) (representan cualidades o atributos)

Discretos conteo Nominales


Continuos medición Ordinales

Unidad experimental:

individuo u objeto sobre el que se realiza la observación del dato

Si existe variabilidad en los datos Variable Aleatoria

6
Etapas de la estadística descriptiva:

 Recopilación de datos

 Organización de la información

 Resumen de esa información

Tablas de distribución de frecuencias:


Organiza la información en una disposición tabular, donde se determinan
clases o categorías de la V.A. bajo estudio y se contabiliza el número de
individuos o unidades experimentales que pertenecen cada clase:
Frecuencia Absoluta (fi)

1) Variables discretas:

X: “Número de alertas diarias en un gasoducto a lo largo de un mes”

1021325324061211223002340245122

X: “Número de alertas diarias en un gasoducto a lo largo de un año”

3302132532406121122300234024512102132521224
0132406121122300234024512240213253240612234
0245122002132572406223002340245122102132532
4061212122401122300234024512270213221224015
3240612112230102340245122102132532402122401
6120311223002390245122102132532406121223002
3402451223021325324061218223002340245122021
3253240612230245122121224132530112230023402
451210213200213257240

7
1) Variables discretas:

X: “Número de alertas diarias en un gasoducto a lo largo de un mes”

RX: {0, 1, 2, 3, 4, 5,6} n = 30 m<n

fi
i xi fi hi Fi Hi hi 
n
1 0 5 0.16 5 0.16

2 1 6 0.20 11 0.36 k

3 2 9 0.30 20 0.66 Fk  
i
fi

4 3 4 0.13 24 0.80

5 4 3 0.10 27 0.90
Fi
6 5 2 0.06 29 0.96 Hi 
n
7 6 1 0.03 30 1.00

Gráficos asociados:

- diagrama de barras o bastones Suma altura barras = 1

10

30%
9

20%
6
No of obs

17%
5

13%
4

10%
3

7%
2

3%
1

0
0 1 2 3 4 5 6
X (Nro. de alertas diarias en gasoducto)

8
Gráficos asociados:

- diagrama de barras o bastones

10

30%
9

20%
6
No of obs

17%
5

13%
4

10%
3

7%
2

3%
1

0
0 1 2 3 4 5 6
X (Nro. alertas darias en gasoducto)

Tablas o Cuadros: resumen información procedente del


trabajo que se expone o de la bibliografía. Deben tener
leyendas explicativas o títulos que aclaren su contenido al
lector, sin obligarlo a leer el texto. Si los valores que se incluyen
no son propios, debe indicarse claramente la fuente de donde
se han tomado.

Figuras: incluyen gráficos, mapas, fotografías, esquemas y


dibujos. Deben tener una leyenda o título, que si bien breve,
debe ser suficientemente explicativo de su contenido.

9
Gráficos asociados:

- diagrama de escalera

35

30
[ )(
[ )
25
[ )
20 [ )
No of obs

15

10 [ )

5 [ )

0 )0 1 2 3 4 5 6
X

Gráficos asociados:

- diagrama de escalera

35

100%
30 97%
90%

25 80%

67%
20
No of obs

15

37%
10

17%
5

0
0 1 2 3 4 5 6
X

10
2) Variables continuas:
X: “consumo eléctrico anual por habitante en 46 ciudades”
(en kilos equivalente de petróleo)

RX: [37,4 ; 51,2] n = 46 Rango=13,8 kep

i xi fi hi Fi Hi

1 (37-39] 1 0.021 1 0.021 Rango


h 
m
2 (39-41] 5 0.108 6 0.130
3 (41-43] 8 0.174 14 0.304
m = de 5 a 10
4 (43-45] 13 0.286 27 0.586
5 (45-47] 9 0.195 36 0.782
Orientativo
6 (47-49] 7 0.152 43 0.934
m alrededor de n
7 (49-51] 2 0.043 45 0.978
8 (51-53] 1 0.021 46 1.000

Gráficos asociados:

- histograma área histograma = 1

14
28%

12

10
20%

17%
8
No of obs

15%

6
11%

4%
2
2% 2%

0% 0%
0
37 39 41 43 45 47 49 51 53
X (consumo eléctrico anual por ha en kep)

11
Gráficos asociados:

- polígono de frecuencias

14
28%

12

10
20%

17%
8
No of obs

15%

6
11%

4%
2
2% 2%

0% 0%
0
37 39 41 43 45 47 49 51 53
X (consumo eléctrico anual por ha en kep)

Gráficos asociados:

- polígono de frecuencias

14
28%

12

10
20%

17%
8
No of obs

15%

6
11%

4%
2
2% 2%

0% 0%
0
37 39 41 43 45 47 49 51 53
X (consumo eléctrico anual por ha en kep)

12
Gráficos asociados:

- diagrama de ojiva
50
100% 100% 100%
98%
45
93%

40
78%
35

30
59%
No of obs

25

20

15 30%

10
13%
5
2%
0%
0
37 39 41 43 45 47 49 51 53 55
X

3) Variables cualitativas:

X: “rama de estudio de los egresados de Universidades Estatales. Año 2014”

RX: {Aplicadas, Básicas, Salud, Humanas, Sociales}

Rama Egresados
Ciencias Aplicadas 18.943
Ciencias Aplicadas
Ciencias Básicas 2.705 (23,23%)
Ciencias Sociales
Ciencias de la Salud 14.252 (41,90%)
Ciencias Básicas
Ciencias Humanas 11.478 (3,32%)
Ciencias de la Salud
Ciencias Sociales 34.165
(17,48%)
TOTAL 81.543
Ciencias Humanas
(14,08%)

- diagrama de torta

13
- diagrama de Pareto

40.000

35.000 41,90%

30.000

25.000
Egresados (fi)

20.000 23,23%

15.000 17,48%

14,08%
10.000

5.000
3,32%

0
1. Cs. Sociales 3. Cs. de la Salud 5. Cs . Bás icas
2 . Cs . Apl icad as 4. Cs . Hum anas

Rama de estudio

Reducción de la información

Medidas numéricas que representan al conjunto de datos

Describen la distribución de frecuencia

posición
dispersión
Estadístico: una función de los datos
simetría
kurtosis

Parámetro población
Estimador muestra

14
Estadísticos de Posición

1. Media aritmética

1 n
1 N
x  M(X) 
n
 xi  
N
 i=1
xi
i=1

 xi . f i m
x  i=1
n
 
i=1
x i . hi

Propiedades de la media

 x
i=1
i
-x  = 0 M ( a + b x) = a + b M(x)

Media Ponderada
n1  x1  n2  x2
x
n1  n2

No es un buen estadístico de posición


para distribuciones asimétricas (ej. Sueldos)

15
2. Mediana: es el valor para el cual, cuando todas las observaciones
se ordenan de manera creciente, la mitad de estas es menor que ese
valor y la otra mitad mayor

n 1
Posición de la Me = (principalmente para series simples)
2

Corresponde al percentil 50 Me = H50%

(principalmente para datos agrupados en tablas de frecuencia)

3. Moda: es el valor de la observación que ocurre con mayor frecuencia

Variables discretas:

X: “Número de alertas diarias en un gasoducto a lo largo de un mes”

i xi fi hi Fi Hi
64 
1 0 5 0.16 5 0.16 x   2,133
30
2 1 6 0.20 11 0.36

3 2 9 0.30 20 0.66
Me= 2
4 3 4 0.13 24 0.80

5 4 3 0.10 27 0.90

6 5 2 0.06 29 0.96 Mo= 2


7 6 1 0.03 30 1.00

16
Variables continuas:

X: “consumo eléctrico anual por habitante en 46 ciudades”


(en kilos equivalente de petróleo)

i xi fi hi Fi Hi

1 (37-39] 1 0.021 1 0.021 2048


.
x  44,52
2 (39-41] 5 0.108 6 0.130 46
3 (41-43] 8 0.174 14 0.304
4 (43-45] 13 0.286 27 0.586
Me = 44,39
5 (45-47] 9 0.195 36 0.782
6 (47-49] 7 0.152 43 0.934
7 (49-51] 2 0.043 45 0.978 Intervalo Modal = (43-45]
8 (51-53] 1 0.021 46 1.000

Pequeña diferencia con Media datos sin agrupar

• intervalo modal
Variable continua:
• valor representativo del intervalo

12

10
 a
  b 
8 a  b
No of obs (fi)

 a
4

  ab
2

0
5 10 15 20
X

17
x
Mo
Me

Mo Me x x Me Mo

1
 n
 n
4. Media geométrica xg  Mg(X)    xi 
 i=1 

5. Cuartiles y Percentiles:

Primer cuartil o cuartil inferior corresponde H25%


Segundo cuartil = Me
Tercer cuartil o cuartil superior corresponde H75%

El percentil pk% es un valor tal que al menos el k % de las observaciones


están en el valor o por debajo de él, y al menos el (100-k)% están en el
valor o encima de él.

18
Cuartiles

100%

80%
H=0,75
Percent of obs

60%

H=0,50

40%

H=0,25
20%

0%
36 38 40 42 44 46 48 50 52 54
X

C1 Me C3

Otros Gráficos :

- diagrama de cajas o Box-plot

52

50

48

46

44

42

40
Median = 44,15
25%-75%
= (42,5, 46,7)
38 Non-Outlier Range
= (37,4, 51,2)
Outliers
36 Extremes
X

19
Estadísticos de Dispersión

1. Rango: r = máx(xi) – mín(xi)

2. Rango intercuartílico: RI = C3 – C1

3. Desvío Medio:
n

x i x
DM  i 1
n

4. Variancia:

 (x i  )2
2 x  i 1 poblacional
N

2
 n 
n   xi 
 xi   i 1 
n
2
x  x
2
i
n muestral
S2 x  i 1
 i 1
n 1 n 1

Grados de libertad

Cantidad de información independiente

20
Dado que la suma de las n desviaciones (xi  x ) siempre da cero, la
especificación de cualesquiera n - 1 de estas cantidades determina de
manera automática la restante. Por lo tanto, sólo n - 1 de las n
desviaciones (xi  x ) están determinadas de manera arbitraria o
independientes.
2
 m 
m m   xi  fi 
( x i  x )2  fi  xi 2  fi   i 1 
n
S2 x  i 1
 i 1
n 1 n 1

Propiedades de la variancia:

V ( a + b x) = b2 V(x)

5. Desvío estándar:

  2 s  s2

6. Coeficiente de variación:

 s
CV  CV 
 x

21
Otros Estadísticos Descriptivos

1. Simetría (Skewness):
N

-Mo  (x i  )3
Sim  Sim  i 1
 N  3

Sim > 0 cola a la derecha


Sim < 0 cola a la izquierda

Simetría muestral:
n

x-Mo n  (x i  x )3
Sim  Sim   i 1
s (n  1).(n  2) s3

2. Curtosis: describe lo apuntada o plana que es una distribución respecto


a una distribución normal

 (x i   )4
Kurt  i 1
3
N  4

n.(n  1 )  (x i  x )4
Kurt   i 1
3
(n  1).(n  2).(n  3) s4

Kurt > 0 apuntada


Kurt < 0 aplanada (dist. Uniforme Kurt=-1,2)

22
Análisis descriptivo de una variable
aleatoria clasificada según categorías

TRAT 1 TRAT 2
28 35
26
24 30
22

20 25

18
16 20
No of obs

No of obs
14
12 15
10
8 10

6
4 5
2
0 0
14 15 16 17 18 19 20 21 22 23 24 25 19 20 21 22 23 24 25 26 27 28 29
X X

Descriptive Statistics
Valid N Mean Minimum Maximum Std.Dev. Skewness Kurtosis
Variable
TRAT1 100 19,61 15,71 23,34 1,55 0,04 -0,17
TRAR2 100 23,67 19,83 27,42 1,38 0,21 0,34

Box Plot
28

26

24

22
X

20

18

16
Median
25%-75%
Non-Outlier Range
14 Outliers
1 2 Extremes
TRAT

23
Box Plot
28

26

24

22
X

20

18

16
Median
25%-75%
Non-Outlier Range
14 Outliers
1 2 3 4 Extremes
TRAT

Tablas de frecuencia bivariadas


Y

y1 y2 ... yj ... yk X

x1 f11 f12 ... f1j ... f1k f1.


x2 f21 f22 ... f2j ... f2k f2.
. . . ... . ... . .
. . . ... . ... . .
. . . ... . ... . .
X
xi fi1 fi2 ... fij ... fik fi.
. . . ... . ... . .
. . . ... . ... . .
. . . ... . ... . .
xm fm1 fm2 ... fmj ... fmk fm.

Y f.1 f.2 ... f.j ... f.k f.. = n

Tabla de contingencia: ambas variables categóricas

24
Indiv Altura Peso
1 1,66 67,93
2 1,64 69,45
3 1,6 67,24
4 1,55 64,16
5 1,66 66,69
Var n Media Min Max
6 1,70 71,61
7 1,75 74,14 Altura 100 1,67 1,47 1,86
8 1,69 71,54 Peso 100 70,27 62,09 79,12
9 1,64 70,54
10 1,64 68,95
11 1,68 71,24
12 1,65 67,30
13 1,68 72,22
. . .
100 1,63 67,78

(60-65] (65-70] (70-75] (75-80] (80-85] (85-90]

(1,45-1,50]

(1,50-1,55]

(1,55-1,60]

(1,60-1,65]

(1,65-1,70]

(1,70-1,75]

(1,75-1,80]

(1,80-1,85]

(1,85-1,90]

25
80

78

76

74

72
Peso

70

68

66

64

62

60
1,40 1,45 1,50 1,55 1,60 1,65 1,70 1,75 1,80 1,85 1,90
Altura

26
Ambas variables cuantitativas: diagrama de dispersión
35 40

30 35

30
25

25
20

20
Y

Y
15
15

10
10

5
5

0 0
0 1 2 3 4 5 6 7 8 9 10 11 12 0 1 2 3 4 5 6 7 8 9 10 11 12
X X

35

30

25

20

Datos: par ordenado (xi ; yi )


Y

15

10

0
0 1 2 3 4 5 6 7 8 9 10 11 12
X

COVARIANZA:
n n

n n x y i i

 (x i  x ).(y i  y )  x .y i i  i 1
n
i 1

S xy  i 1
 i 1
n 1 n 1

II I

III IV

x
x

27
Matriz de varianzas-covarianzas:

Para datos cuantitativos importante relación entre variables

matriz de varianzas-covarianzas (pxp)

S X2 S XY S XZ 
 
S=  S 2
Y SYZ 
 SZ2 
 pxp

CORRELACIÓN:
Sxy
rxy 
S X2 .SY2

1 r XY r XZ 
 1 rYZ 
r=  
 1 
pxp

28

Das könnte Ihnen auch gefallen