Beruflich Dokumente
Kultur Dokumente
Pág.
INTRODUCCIÓN 3
AGRADECIMIENTO 4
SESIÓN 5
I C CREACIÓN DE BASE DATOS CON IBM SPSS STATISTICS 23 6
II FRECUENCIA MEDIANTE GRÁFICOS 11
III MEDIDAS DE DISPERSIÓN Y MEDIDAS DE TENDENCIA CENTRAL 15
IV R PROJECT - ESTADÍSTICA DESCRIPTIVA 18
V IMPORTAR UNA BASE DE DATOS DE EXCEL A R-PROJECT 23
VI VALIDACIÓN POR JUICIO DE EXPERTOS 38
VII MUESTREO CON PROCESS 53
VIII VALIDACION DEL INSTRUMENTO Y PRUEBA PILOTO 57
IX PRUEBAS PARAMÉTRICAS Y PRUEBAS NO PARAMÉTRICAS 59
X PRUEBA DE CHI-CUADRADO 62
I. INTRODUCCIÓN
R es un entorno y lenguaje de programación con un enfoque al análisis
estadístico.
R es una implementación de software libre del lenguaje S pero con soporte
de alcance estático. Se trata de uno de los lenguajes más utilizados en
investigación por la comunidad estadística, siendo además muy popular en
el campo de la minería de datos, la investigación biomédica,
la bioinformática y las matemáticas financieras. A esto contribuye la
posibilidad de cargar diferentes bibliotecas o paquetes con funcionalidades
de cálculo y gráficas.
Actualmente, están apareciendo diversos programas estadísticos para las
diferentes disciplina como por ejemplo en las ciencias de la salud, que están
teniendo una gran aceptación por diversos investigadores como son el
EPIDAT, Infostat, BioStat etec.
II. AGRADECIMIENTO
Queremos agradecer a nuestro señor padre celestial que está en los cielos
por darnos la fuerza de seguir adelante e impulsarnos a ver este presente
proyecto.
También queremos expresar nuestros sinceros agradecimientos a nuestros
estudiantes de nuestras facultades que día a día nos inspira a superarnos
más, por sus inquietudes y preguntas que nos hacen estar a la vanguardia
del conocimiento.
A veces, en los retos que nos proponemos interfieren muchos factores que
los dilatan en el tiempo y sin su apoyo incondicional y sus consejos este
trabajo no habría podido hacerse realidad.
Agradecido también a nuestros colegas docentes por sus sugerencias en
hacer mucho más interesante el presente manual que espera ser una guía
práctica de consulta para todos los deseosos en aprender este campo muy
interesante como es la estadística.
Muchas gracias
LOS AUTORES
Sesión 1
Para ilustrar cómo bajar este archivo ejecutable, en seguida se explica cómo guardar el
archivo R-2.10.0-win32.exe que permitirá la instalación de R versión 2.10.0
para Windows.
¿Cómo se instala R?
Una vez que el archivo se encuentra en el disco duro, uno puede comenzar el
protocolo de instalación siguiendo los siguientes pasos:
Sesión 2
Cuando hablamos de datos que siguen una distribución normal observamos que la
mediana, la media y la moda es lo mismo por lo tanto los datos lo reportamos como
promedio y utilizamos la desviación estándar en donde la curva de normalidad nos
dice que una desviación estándar engloba el 61 %, 2 desviaciones estándar el 95 y tres
desviaciones estándar el 99.7%.
Que sucede si los datos provienen de una distribución no normal
Med X
Podemos encontrarnos con datos con una cola a la derecha en este caso si sacamos el
promedio, este valor va a estar más cercano a la cola y la mediana estará más cercana
a la mayor cantidad de datos por lo que se reporta la mediana que será más
representativa en los datos. Igual análisis para una curva con la cola hacia la izquierda.
Utilizamos el rango como media de dispersión o cuando estamos con datos que
presenta mucho outlier por ello lo representamos con rango intercuartil.
Se designa outlier a una observación que estadísticamente cae fuera del intervalo
esperado (que puede ser por ejemplo la media más/menos tres sigma).
Por ejemplo, para medir la estatura promedio de los habitantes de cierta ciudad, se
escoge una muestra y se los mide. Uno de los individuos mide cuatro metros y medio.
En esta caso estamos con una distribución bimodal donde el promedio y la mediana es
lo mismo, pero tenemos dos valores que son lo que más se repite en nuestra
distribución donde teneos que tener cuidado de cómo se va a reportar se tiene que ver
como es la distribución más representada en los datos.
Practicando con R
Que es R
Es un lenguaje y entorno de programación estadística
Es uno de los software libre más utilizados a nivel mundial en diferentes
campos: biología, economía, matemáticas, etc.
La herramienta permite cargar diferentes paquetes según sean las necesidades
específicas del usuario.
1. Inicio del software r haciendo clic en el icono para el acceso directo del
programa r
La primera pantalla que nos aparece es R console (que es donde nos arroja los
resultados de nuestras instrucciones).
Permite trabajar de una manera sencilla
Presenta 4 partes:
1. Menú
2. Ventana de Instrucciones
3. Ventana de resultados
Vamos abrir un scrip (que es donde podemos digitar nuestras líneas de programación y
así podamos guardarlas si aso lo deseamos).
Sesión 3
Otra manera es guardar el archivo con el formato CSV(delimitado por comas) pero
antes, cargar la librería con el comando
library(foreign)
Una vez cargada se va a almacenar los datos, si esta en spss usaremos el comando
datos=read.spss(file.choose(),T)
Sesión 4
Prueba binomial en R
https://www.youtube.com/watch?v=PUaE1f-0NrA
Digitar los datos en un archivo en Excel y en una sola columna que continuación se
detalla:
estatura
151.370892 156.240015 155.414818 160.29699 163.93734 156.431986
163.563441 159.173251 171.6819 161.181865 154.995516 156.752802
165.107356 173.694666 166.821809 163.952225 164.395087 167.034815
164.152822 159.822582 162.373373 163.362649 145.384956 160.276786
167.576276 156.85644 160.554277 157.453023 161.89726 153.285448
166.23784 148.508825 149.377598 160.348442 156.962456
153.929089 159.523021 158.294967 151.019335 168.690901
160.608898 160.254543 151.862981 155.090201 159.087127
160.938082 153.402261 156.852403 152.553959 157.303613
162.316514 155.676744 155.802175 160.395579 158.760666
163.492136 156.001161 164.663064 159.413486 165.677831
167.722271 157.813465 162.162988 170.847937 164.201183
164.102699 161.607493 159.288192 165.741748 156.14645
155.245666 163.416633 152.224221 167.897949 151.344812
158.588274 150.470968 156.505652 166.370572 150.890663
156.608752 156.329983 157.990906 165.770563 154.903669
164.368478 169.729895 156.844664 161.049728 153.408718
155.553813 162.604684 152.798131 160.443619 158.17778
158.878304 160.440419 149.547376 158.072617 166.926098
Aparece una ventana donde te indica que busques el archivo llamado directorio creado
y guardado como punto y coma, en este caso se a guardado en un usb de trabajo y
damos aceptar
dir()
agrupados<-read.csv("Agrupados.csv")
Observamos que
aparecen los 100
datos que
representa la
estatura de
personas
1
Manual para el Aprendizaje del Software estadístico R
CATEDRÁTICO: Dr. CESAR TORRES SIME
CATEDRÁTICO: Dr. WILMER HUAMANÍ PALOMINO
Universidad Nacional del Callao
Facultad de Ingeniería Industrial y de Sistemas
Facultad de Ingeniería Pesquera y de Alimentos
Ahora el nombre de la función es tdfA y como argumentos es agrupados que es el
nombre de nuestro data frame pero recordemos que necesitamos las estaturas en
forma de vector por lo cual utilizaremos el símbolo dólar ($) para elaborar la
distribución de frecuencias.
tdfA(agrupados$estatura)
Digitar los datos en un archivo en Excel y en una sola columna que continuación se
detalla:
calf
8 9 8
0 7 8
7 7 8
8 7 7
9 9 3
7 7 9
0 9 7
5 8
7 9
getwd()
getwd()
dir()
read.csv("NoAgrupados.csv")
datos<-read.csv("NoAgrupados.csv")
<- asignado este símbolo de asignación en r indica que los datos que estoy leyendo
en forma de data Frame serán asignados al objeto datos.
Ahora cada vez que escribimos datos en r obtendremos la data frame que hemos
leído
En este ejemplo nos interesa tener los datos en r en forma de vector y no en data
frame, es decir para extraer estos datos escribimos datos$calf
datos$calf
tabla1
}
1
Manual para el Aprendizaje del Software estadístico R
CATEDRÁTICO: Dr. CESAR TORRES SIME
CATEDRÁTICO: Dr. WILMER HUAMANÍ PALOMINO
Universidad Nacional del Callao
Facultad de Ingeniería Industrial y de Sistemas
Facultad de Ingeniería Pesquera y de Alimentos
tdfNA(datos$calf)
Sesión 5
Digitar
normal<-rnorm(250)
hist(normal)
hist(datos1$velocidades,main="Velocidades en km/h",xlab="Velocidades en
Km/h",ylab="Frecuencia",col=rainbow(9),cex.main=2)
Para bordes
hist(datos1$velocidades,main="Velocidades en km/h",xlab="Velocidades en
Km/h",ylab="Frecuencia",col=rainbow(9),cex.main=2,border=F)
border=T
aparece los
bordes
Ejercicios
Se tiene una base de datos de notas de un salón de clase de un curso determinado
hallar el gráfico de barras
Paso 1
Guardar el archivo en csv en "c" y copiar la dirección
Notas<-read.csv("C:/tarea/NotasAlumnos.csv")
barplot(Notas$Notas)
Esta opción es para tomar solo las notas
Paso 2
Colocando títulos a la gráfica
barplot(Notas$Notas,main="Notas de alumnos de Mecánica Aplicada")
Agregando colores
barplot(Notas$Notas,main="Notas de alumnos de Mecánica
Aplicada",ylab="notas",ylim=c(0,20),col=rainbow(15))
Sesión 5
Tablas de frecuencias
Sesión 6
ALFA DE CROMBACH
Objetivo
Conocer y calcular el análisis de fiabilidad de una escala mediante el coeficiente Alpha
de Cronbach con R Commander
INSTALAR R COMMANDER
Es un paquete de liberaría es decir un conjunto de códigos editado por un
desarrollador de r que ha puesto a disposición de otros usuarios para que pueda
utilizar sus comandos.
Nos da un mensaje de error porque r necesita instalar otros paquetes necesarios para
abrir r comander , damos que si , recordar para instalar paquetes se necesita una
conexión a internet
Damos OK
Elegimos Rcmdr:
Una vez tengamos cargado el archivo, el mensaje de R Commander nos avisa sobre el
número de filas y columnas que tiene el documento:
Sesión 6
Bibliografía
http://francodatascience.com/2015/08/25/funcion-para-datos-no-
agrupados/
http://francodatascience.com/2015/08/27/funcin-para-datos-agrupados-4/