Beruflich Dokumente
Kultur Dokumente
ORIGEN
estadstica,
es
la
ciencia
dedicada
la
coleccin,
anlisis,
Estadstica descriptiva:
Desarrolla modelos tericos que se ajusten a una determinada realidad con cierto grado de confianza.
Estadstica inferencial:
ESTUDIOS ESTADISTICOS
Un estudio estadstico es una de las aplicaciones mas importantes para
cualquier profesional llmese, ingeniero, profesor, medico, contador,
una
carpeta de datos.
La observacin nos permite conocer la poblacin, sus caractersticas, su
forma de vida, sus problemas y priorizar sus necesidades. De la
Observacin se puede partir a
virtuales
dedicadas
al
enriquecimiento
de
esta
herramienta.
INSTALACION DE R
1. Entrar en la pgina web: http://www.r-project.org/ , La pgina tiene el siguiente
aspecto (Ver figura 1)
2. Pulsar el conector CRAN bajo la referencia Download. Aparecen un conjunto de
direcciones web en el mundo (mirrors, espejos) donde est disponibles copias del
software para ser descargadas.
INICIANDO R
Ejecute el programa R, una vez instalado. Lo haremos pulsando un icono que es
una letra R grande que al instalar nos habr generado en nuestro escritorio.
Tambin eligiendo el programa por la va >>Inicio>Programas>R> R 2.13.2
Suma
Resta
/
^
Multiplicacin
Divisin
Potencia
%/%
entera
Comparativos
Lgicos
== igualdad
!= Diferente de
& Y lgico
! No lgico
<
Menor que
O lgico
sd(x)
var(x)
range(x)
sort(x)
summary
Ejemplos
1.
Problema
B 4 B5
B6
Solucin en R
B6=-3
> B4=8
> B5=10
> B6=-3
> (B4+B5)/B6
[1] -6
2.
Problema
5
Solucin en R
( B 3 B 2) 5
LOG ( B 2 B 4)
Donde B2 =
10
B3= 2; B4 =
6
> B2=10
> B3=2
> B4=6
> (((B3+B2)^5)/(log(B2+B4)))^1/5
[1] 17949.43
frmula:
N
1 N 2
2. desarrollar el polinomio
A1=5,
A2=-2
A 1+ A 2
3
A3
A 4+ A 5
A3=5,
A4=8,
A5=7
OBJETIVOS DE LA UNIDAD:
TERMINOLOGIA
POBLACIN:
definicin semntica.
Por ejemplo:
a. La cantidad de ensayos que hace un estudiante en un experimento de
laboratorio repetido indefinidamente.
b. Nmero de hijos de todas las familias que conforman la gran
comunidad educativa en un colegio.
MUESTRA:
Se define como la mejor representacin de la poblacin. La muestra es
un subconjunto de la poblacin a la cual se le efecta la medicin con el
fin de estudiar las propiedades del conjunto del cual es obtenida.
El
tamao
de
la
poblacin,
la
disponibilidad
de
recursos,
la
Sexo
Origen
Color de piel
Ejemplo:
a la variable independiente y
Escritura en R
Llevar nmeros
Separar los valores y letras
por medio de puntos
Empezar con puntos.
> Estatura=150
> Estatura
[1] 150
> Ingresos2005=150000
> Ingresos2005
[1] 150000
> Estatura.nio.1=140
> Estatura.nio.1
[1] 140
> .Edad=15
> .Edad
[1] 15
"Estatura"
"Estatura.nio.1"
Tambin existe el comando history( ), que permite ver las variables y las
operaciones que se han realizado con ellas en ventana flotante (ver
grfico 11)
Pidiendo Ayuda:
R posee en idioma ingles una amplia ayuda en lnea que permite guiarse
en el camino de las diferentes operaciones que se estn realizando, para
ello se digita sobre la consola el comando?, seguido de la expresin que
se requiere ayuda. Por ejemplo pidamos ayuda del comando solve
?solve
starting httpd help server ... done
Comandos en R
Resultado Grafico
curve(x^2-5*x+16,
-5, 10)
Resultado Grafico
curve(tan, -2*pi,
2*pi)
y
a.
x2
x2 1
x2
2
x
y ln
b.
y 2 x 4 5 x3 3
c.
FRECUENCIAS:
Para comprender el concepto de frecuencia partimos de
una
Logro No
La tabla muestra en
resultados
de
estudiantes
de
los D
de estudiantes que I
A
determinada
S
respecto
podemos E
4
3
5
5
3
una
valoracin.
Al
decir:
CLASES DE FRECUENCIAS
FRECUENCIA ABSOLUTAS: (f)
Resultan del conteo directo, de los datos que se repiten en una
distribucin. La suma de todas las frecuencias absolutas es el tamao de
la muestra.
fi = n
f = f1 + f2 + f3 + ... + fn = n; n es el tamao de la muestra.
s
D
I
A
S
E
4
3
5
5
3
20
FRECUENCIAS ACUMULADAS:(F)
Se obtiene de la acumulacin sucesiva de las frecuencias absolutas. El
ltimo dato acumulado es el tamao de la muestra.
Su clculo se obtiene as:
F1 = 4
F2 = f1+f2 = 4 + 3 =7
F3 = f1 + f2 +f3 =4 + 3 + 5 = 12
F4 = f1 + f2 + f3 + f4 = 4 + 3 + 5 + 5 = 17
F5 = f1 + f2 + f3 + f4 + f5 = 4 + 3 + 5 + 5 + 3 = 20
En una tabla de frecuencias se observara as:
Logro
4
3
5
5
3
20
4
7
12
17
20
s
D
I
A
S
E
distribucin. Se
obtiene dividiendo la
hi
f
n
Logro
s
D
I
A
S
E
4
3
5
5
3
4 0.2
7 0.1
12 5
17 0.2
20 5
0.2
5
0.1
5
20
Logro
s
D
I
A
S
E
4
3
5
5
3
20
4
7
12
17
20
0.2
0.1
5
0.2
5
0.2
5
0.1
5
1
0.2
0.3
5
0.6
0.8
5
1
EJEMPLO DE APLICACIN:
La siguiente distribucin de datos representa los salarios de 40
trabajadores de un colegio privado de la ciudad de Villavicencio en
donde se requiere que el docente trabaje bajo la figura de docente
catedrtico. Para el caso se asigna un valor por la hora trabajada de
acuerdo a un grado de escalafn emitido el ministerio de educacin
nacional.
Los valores de los salarios corresponden en miles de pesos.
30
25
20
40
28
35
40
25
45
20
40
30
15
30
25
20
50
50
50
30
50
15
30
45
40
15
20
28
35
40
30
15
20
45
50
15
10
20
28
30
1
5
6
3
3
7
2
5
3
5
40
1
6
12
15
18
25
27
32
35
40
0,025
0,125
0,15
0,075
0,075
0,175
0,05
0,125
0,075
0,125
1
0,025
0,15
0,3
0,375
0,45
0,625
0,675
0,8
0,875
1
190
150
148
152
158
100
174
187
188
160
178
153
151
128
137
174
199
103
168
188
127
150
130
175
137
152
174
188
103
148
153
174
188
127
150
158
175
190
128
150
160
178
199
130
151
168
187
200
en
orden
de
tamao
no
diferentes profesores, al
estamos
perdiendo
ninguna
n
Algunos utilizan la formula m =
La aproximacin de m se puede hacer por defecto o por exceso
m = 1 + 3,3*log(25) 5.6
Aqu m se puede trabajar con 6 y seria una aproximacin por exceso, o a
5 y seria una aproximacin por defecto.
AMPLITUD DEL INTERVALO:
Determina la distancia que existe entre un dato y otro, se simboliza por
C, depende del criterio establecido para presentar la informacin, puede
variar la amplitud en cada intervalo, pero se recomienda tener a C
constante a lo largo de toda la distribucin de frecuencias, se calcula
mediante las formula.
C=
X max X min
m
Rango
m
100
C
6
= 17
F
2
h
0.08
H
0.08
115.5
132.5
149.5
166.5
3
2
7
5
5
7
14
19
0.12
0.08
0.28
0.2
0.2
0.28
0.56
0.76
183.5_ 200 6
25
0.24
Total
_
_
_
_
132
149
166
183
25
C2=2
C3=0
C6=3
C7=1
C8= 4
C11=0
C12=3
C13=1
C4=5
C5=2
C9=3
C10=1
C14=0
C15=5
de F
3
7
9
12
13
0.2
0.26
0.13
0.2
0.06
0.2
0.46
0.59
0.79
0.58
15
6
6
0.13 1
1
defectuosos cajas
0
1
2
3
4
5
f
3
4
2
3
1
2
15
En data deben estar ubicados los archivos vlidos y que pueden ser
llevados a R. Una vez cambiado el directorio para el reconocimiento de la ruta, el
archivo que se quiere exportar de Excel se le debe guardar como texto delimitado
por tabulaciones en la carpeta destino. Los comandos para exportar son:
Comandos en R
Resultado de la tabla
datos=read.delim("Tasas.txt")
attach(datos)
datos
lleva
una
Con esto ya se tiene la tabla en donde se pueden hacer todas las correcciones
pertinentes.
Comandos en R
Resultado de la tabla
datos=read.table("Nombres.txt")
attach(datos)
datos
EJERCICIOS DE APLICACION
Ejercicio 1
En las aulas del colegio ha brotado un virus. La alcalda en compaa con
el hospital de la regin han levantado un estudio para evitar que el virus
se expanda en toda la comunidad. La droga que ataca el virus requiere
de una dosis que esta sujeta a un peso. Con el objetivo de obtener un
peso promedio y brindar la dosis adecuada a todos los estudiantes se ha
tomado una muestra de 20 estudiantes y se obtuvieron los siguientes
resultados.
30,3 32,1 50,2 52,3 34,2 36,4 54,2 56,3 38,1 40,2
58,2 60,4 42,3 43,3 62,5 64,1 45,2 46,3 65,2 67,3
Determine para el problema una tabla de frecuencia para datos
agrupados y realice interpretacin de algunos resultados, de la misma
manera llvelos a un archivo txt y crguelos en el programa R.
Ejercicio 2
Los siguientes datos representan 50 (en miles de pesos) salarios de los
empleados de la secretaria de educacin. Para tal distribucin de datos
realizar la tabla de intervalos de clase.
50
300
178
320
350
280
145
220
145
220
200
400
392
235
289
400
230
400
220
256
100
400
270
187
400
175
400
189
100
187
120
180
125
248
400
300
178
256
400
200
150
230
280
300
220
276
235
400
386
400
De
programa R
Ejercicio 3
Complete el siguiente cuadro
Intervalos
Intervalos con f
de Clases
20 _ 24
limites reales
3
2
5
3
4
1
2
3
2
_56
Total
101
120
115
130
150
112
145
138
121
126
115
140
137
143
118
147
149
150
115
100
127
135
149
146
137
122
118
135
129
Elabore
una
distribucin
de
frecuencias,
para
datos
agrupados,