Sie sind auf Seite 1von 13

2.6. Analisis de componentes principales Vamos a ver como resuelve R el analisis de componentes principales.

Para ellovamos a emplear la base de datos USArrests , que recoge datos sobre detencionesefectuadas en diferentes estados de EE.UU.: USArrestsplot(USArrests) # matriz de diagramas de dispersionpc1<-princomp(USArrests) # guardamos los resultados del ACP enpc1plot(pc1) #valores propios. Es adecuado el ACP?biplot(pc1) #representacion simulta ne a de v a r ia b le s e i nd iv i du o s pc1<princomp(USArrests,scale=TRUE) #trabajamos con la matrizcor.biplot(pc1)summary(pc1)p c 1 $s c o r e s # p un t ua c io ne s de l o s i nd iv id uo s s o b r e lo s e je s 2.7. Ejemplo de tipologa de Comunidades Autono-ma s c o n e l p a q u e t e a d e 4 ( C ui d a d o : An t e s de utilizar el package ade4 es preciso insta-larlo) Leemos los datos y creamos el data.frame DatosComunidades . DatosComunidades<-read.table("Prueba.txt", header=TRUE) Efectuamos un analisis de componentes principales normado y ponderado (con lapoblacion de las comunidades autonomas) empleando el comando dudi.pca() : library(ade4)acp2<-dudi.pca(subset(DatosComunidades,select=c(UE15,POBLACION)),row.w=DatosComuni Veamos el resumen de resultados: CAP I T U L O 2 . A N ALISIS DE DATOS 20 acp2 El crculo de correlacion: s.corcircle(acp2$co) Las coordenadas de las Comunidades Autonomas en el nuevo sistema de refer-encia: s.label(acp2$li) Ahora vamos a aplicar un algoritmo de clasicacion jerarquica ascendente con elcomando hclust() . Previamente debemos calcular la matriz de distancias entrelas Comunidades Autonomas para lo que nos valdremos del comando dist()

: dist1<-dist(subset(DatosComunidades,select=c(UE15,POBLACION)))dist1clust1<-hclust(dist1)plot(clust1) 2.8. Analisis de componentes principales con Fac-toMineR Cargamos el package: library(FactoMineR) Efectuamos un ACP y guardamos los resultados en el objeto acp2 : acp2<-PCA(subset(DatosComunidades,select=c(UE15,POBLACION)),row.w=DatosComunidades Vemos los resultados referidos a los valores propios (incluidos porcentajes deinercia acumulados y sin acumular correspondientes a cada componente princi-pal): acp2$eig Los resultados para los individuos (coordenadas, contribuciones y cosenos cuadra-dos): CAP I T U L O 2 . A N ALISIS DE DATOS 21 acp2$ind Los resultados para las variables (coordenadas, correlaciones con los compo-nentes principales, contribuciones y cosenos cuadrados): acp2$var C a p u t o l 3 V a r i o s 3.1. Packages Las instalaciones de R consisten en un modulo basico y un conjunto de packagesrecomendados -alrededor de 25-. Sin embargo existen cientos de packages querecogen las contribuciones de la comunidad que desarrolla R as como de otrosinvestigadores. Para ver cuales son los packages que se encuentran instaladose n R d e b e u t i l i z a r s e e l c o ma n d o library() . Este mismo comando sirve paracargar un package previamente instalado, en la forma library(package) . Elcomando search() proporciona un listado de los packages activos.L a f o r m a m a s s e n c i l l a d e i n s t a l a r u n n u e v o p a c k a g e e s me d i a n t e l a

o p c i onP a q u e t e s / I n s t a l a r p a q u e t e s a p a r t i r d e a r c hi v o s z i p l o c a l e s q u e s e e n c u e n - tra disponible en el menu principal de R Gui. Obviamente es necesario haberobtenido previamente el package en formato zip. 3.2. Ayuda en R La sintaxis de R es relativamente complicada. Po r ese motivo es del maximointeres disponer de una buena ayuda on-line. Esa ayuda se puede invocar devarias maneras: h e lp . s ta r t ( ) #a r r a n c a e l n a ve g a d o r y l a a y u da o n l i ne help(comando) #proporciona ayuda sobre un comando en particularhelp.search(\caracter") #busca ayuda sobre el tema \caracter"library(help=package) #proporciona ayuda sobre los comandos deun package concretoexample(comando) #proporciona ejemplos sobre un comando concreto 22

CAP ITULO 3. VARIOS 23 3.3. Establecer el directorio de trab ajo Para conocer cual es el directorio de trabajo por defecto debemos utilizar la fun-cion getwd() . A continuacion podemos establecer el nuevo directorio de trabajomediante la funcion setwd() , del siguiente modo: setwd("c:/docs/mydir") 3.4.Area de trabajo en R (Workspace) El area de trabajo es el lugar donde R guarda todos los objetos que estan activosen un momento dado. Se puede obtener una copia del area de trabajo medianteel comando save.image() .S i , p o r e je mp l o , d e s e a mo s o b t e n e r u n a c o p i a d e t o d o s l o s o b je t o s d e l area detrabajo en el archivo .RData -archivo de area de trabajo por defecto- deberemosescribir: save.image()

Si deseamos guardar solo algunos de los objetos y, ademas, deseamos hacerlo enun archivo con un nombre distinto deberemos emplear el comando: save(ListaDeObjetos,file="myfile.RData") Cuando deseemos recuperar los objetos copiados en un archivo de area de tra-bajo debemos emplear la funcion: load("myfile.RData") 3 . 5 . H i s t orico de comandos Si deseamos guardar una copia de los comandos que hemos utilizado o cargarlaen la memoria debemos emplear respectivamente los comandos savehistory(file= ".Rhistory") y loadhistory(file = ".Rhistory") .

CAP ITULO 3. VARIOS 24 3.6. Ejecucion de comandos desde un archivo detexto Ademas de trabajar interactivamente con R tambien es posible escribir un con- junto de comandos -correspondientes, por ejemplo, a un analisis determinado- yejecutar todos ellos de una sola vez -esta forma de funcionamiento se llama pro-ceso por lotes (batch processing)-. Podemos acceder a ella mediante el comando source() . Por ejemplo, el siguiente comando ejecuta los comandos recogidos enel chero de texto MiFichero.txt situado en el directorio de trabajo : source("MiFichero.txt") 3 . 7 . T r a b a j o c o n g r acos Adema s d e v e r l o s g r a c o s e n l a c o n s o l a g r aca puede interesar obtener una copia de ellos para incluirlos en un documento de texto o en un informe. Paraello se puede utilizar el siguiente conjunto de comandos: jpeg("c:/MisGraficos/myplot.jpg")plot(x)dev.off() E l p r i me r c o ma n d o i n d i c a a R q u e d e b e g u a r d a r u n a c o p i a d e l g r a c o e n un archivo llamado myplot.jpg situado en el directorio C:/MisGracos. Adem as,e l f o r ma t o d e l g r aco ser a jpg -cabe tambien crear gracos con formato pdf, Windows Metale, png, etcetera-. El segundo comando recoge la

generacion delgraco. El tercero devuelve el destino de los gracos a la consola graca.

B b i o l g f a r Berk, R.A. (2008); Statistical Learning form a Regression Perspective; Springer.Bliese, P. (2006); Multilevel Modeling in R;Burns, P. (2003); A Guide for the Unwilling S UserC h a mb e r s , J . M . ( 2 0 0 8 ) ; S o f t w a r e f o r Da t a An a l ys i s . P r o g r a m mi n g wi t h R ; SpringerCohen, Y; Cohen, J.Y. (2008); Statistics and Data with R: An Applied ApproachThrough Examples; WileyCook D., Swayne D.F. (2007); Interactive and Dynamic Graphics for Data Anal-ysis; Springer.Crawley, M.J. (2007); The R Book; Wiley.Dalgaard, P. (2002); Introductory Statistics with R; SpringerEveritt B.S. (2005); And R and S-Plus Companion to Multivariate Analysis;Springer.Faraway J.J. (2002); Practical Regression and Anova using RFarnsworth, G.V. (2006); Econometrics in RGalwey N.W. (2006); Introduction to Mixed Modelling. Beyond Regression andAnalysis of Variance; Wiley.Gelman, A., Hill, J. (2007); Data Analysis Using Regression and Multilevel/HierarchicalModels; Cambridge University PressKuhnert, P., Venables, B. (2005); An Introduction to R: Software for StatisticalModelling & Computing; CSIRO.Maindonald, J.H. (2008); Using R for Data Analysis and Graphics. Introuduc -tion, Code and Commentary; Australian National UniversityM a i n d o n a l d J . , B r a u n J . ( 2 0 0 3 ) ; D a t a An a l ys i s a n d Gr a p h i c s Us i n g R a n Examplebased Approach; Cambridge University Press.M a r q u e s d e S a, J.P. (2007); Applied Statistics Using SPSS, STATISTICA, MATLAB and R; 2nd edition; Springer.25 CAP ITULO 3. VARIOS 26Muenchen, B. (2007); R for SAS and SPSS UsersMurrel P. (2006); R Graphics; Chapman & Hall / CRCOwen, W.J. (2007); The R Guide; University of RichmondParadis E. (2005); R for Beginners.Quene, H. (2006); Statistics with R and S-Plus; Utrecht UniversityRobinson, A. (2008); icebrakeR; University of MelbourneS e e f e l d , K . , Li n d e r , E. ( 2 0 0 7 ) ; S t a t i s t i c s u s i n g R w i t h B i o l o g i c a l E x a mp l e s ; University of New HampshireTorgo, L. (2003); Data Mining with R: learning by case studies. Ve n a b l e s W. . N . , S mi t h , D .M . ( 2 0 0 8 ) ; An I n t r o d u c t i o n t o R . N o t e s o n R : A Programming Environment for Data Analysis and Graphics.Venables W.N., Ripley B.D. (2000); S Programming; Springer.Venables W.N.,

Ripley B.D. (2002); Modern Applied Statistics with S 4th edi tionVerzani, J. (2002); simpleR. Using R for Introductory StatisticsWang, K.K. (2002); R for Windows Users; Department of Statistics; New Zealand Actividad (16) Filters Agregar a la coleccinReviewAdd noteLikeInsertar Showing TodosLos ms recientesReviewsAll NotesLikes
6b2421895b19f1 read

Rating 0/5

Post notePost reviewPost replyPost note and like 1 hundred reads|ms de 4 aos ago 1 thousand reads|ms de 3 aos ago

Salome Pacheco liked this|ms de 2 aos ago

Daniela Pea liked this|ms de 3 aos ago

omisil liked this|ms de 3 aos ago

davidesparta liked this|ms de 3 aos ago

txemarix liked this|ms de 3 aos ago

omisil liked this|ms de 3 aos ago

MSPE23 liked this|ms de 3 aos ago

Jos Vzquez liked this|ms de 3 aos ago Cargar ms Recomendado PURCHASE ONLY SAMPLE NOT AVAILABLE Tutorial FactoClass Matilde Ins Csari PURCHASE ONLY SAMPLE NOT AVAILABLE EstadisticaDescriptivaMultivariada-I-11 emercadovell PURCHASE ONLY SAMPLE NOT AVAILABLE Correspondencias3 Rosana Ferrero PURCHASE ONLY SAMPLE NOT AVAILABLE CorralesPardoRamos08 pumbalibelula PURCHASE ONLY SAMPLE NOT AVAILABLE manualuni-r justorfc PURCHASE ONLY SAMPLE NOT AVAILABLE

ACP2 Rosana Ferrero PURCHASE ONLY SAMPLE NOT AVAILABLE R-intro, en espaol messhie PURCHASE ONLY SAMPLE NOT AVAILABLE PardoOrtiz04 Andres Valencia PURCHASE ONLY SAMPLE NOT AVAILABLE Herramientas_Estadistica_Exploratoria-1 Santiesteban Xuxuhuatl PURCHASE ONLY SAMPLE NOT AVAILABLE Libro R Leonel_Ganga Ms de este usuario PURCHASE ONLY SAMPLE NOT AVAILABLE El anlisis de correlacin en la regresin mltiple jjgibaja PURCHASE ONLY SAMPLE NOT AVAILABLE

Las hiptesis de Gauss-Markov jjgibaja PURCHASE ONLY SAMPLE NOT AVAILABLE Modelo general de regresin lineal multivariante jjgibaja PURCHASE ONLY SAMPLE NOT AVAILABLE Transparencias metodologia noviembre 2007Juanjo jjgibaja

http://es.scribd.com/doc/7806235/SesionR

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% %%%%%% paquete ttulo Descargas 1 Plyr Herramientas para la divisin , la aplicacin y la combinacin de datos de 84.049 2 digest Crear hash criptogrfica digiere de objetos R 83192 3 ggplot2 Una implementacin de la Gramtica de la grfica 82768 4 espacio de color Espacio de color Manipulation 81901 5 stringr Que sea ms fcil trabajar con strings 77658

6 RColorBrewer ColorBrewer paletas de 66.783 7 reshape2 flexiblemente remodelar datos : un reinicio del paquete remodelar 64911 8 zoo S3 Infraestructura para regular e irregular de series temporales ( Z de observaciones ordenadas ) 60.844 9 proto Prototipo de programacin basado en objetos 59043 10 escalas de funciones para grficos en escala 58369 11 coche Companion de Regresin Aplicada 57453 12 dichromat Combinaciones de colores para dicrmatas 56624 13 Organizar grobs GTABLE en 54.431 mesas 14 munsell sistema de color Munsell 53183 15 Eje etiquetado Etiquetado 51 877 16 Hmisc Harrell Varios 47.836 17 rJava R de bajo nivel a la interfaz Java 47731 18 mvtnorm multivariante Distribuciones normal y 46.884 t 19 bitops bit a bit Operaciones 45.689 20 del sistema del dispositivo de visualizacin 3D rgl (OpenGL ) 41001 21 Leer extranjeras datos almacenados por Minitab , S , SAS , SPSS , Stata , Systat , dBase , .. 37849 22 Herramientas de XML para el anlisis y la generacin de XML dentro de R y S -Plus 37153 23 celosa Grficos Lattice 36597 24 e1071 Varios Funciones del Departamento de Estadstica ( e1071 ) , TU Wien 35180 25 GTools diversas herramientas de programacin R 35028 26 clases sp y mtodos para los datos espaciales 34786 27 gdata varias herramientas de programacin R para la manipulacin de datos 34262 28 RCPP Seamless R y C + + Integracin 33.929 29 Funciones de apoyo de las masas y conjuntos de datos de Venables y la masa de Ripley 33667 30 Matriz de clases y mtodos de 30.740 matriz dispersa y densa 31 lmtest prueba modelos de regresin lineal 30319 32 Anlisis de la supervivencia Supervivencia 30186 33 caTools Herramientas : Estadsticas de ventana mvil , GIF, Base64 , AUC ROC , etc 29945 34 multcomp inferencia simultnea en general los modelos

paramtricos 29871 35 RCurl general de red (HTTP / FTP / ...) interfaz de cliente de R 28.866 36 knitr Un paquete de propsito general para la generacin de informes dinmicos en R 28104 37 mesas de exportacin XTABLE a LaTeX o HTML 28091 38 xts Tiempo extensible de la serie 28058 39 rpart particionamiento recursivo 27812 40 herramientas de anlisis y evaluacin se evaluar que proporcionan ms detalles que el default 27617 41 RODBC ODBC Access Database 26.131 42 Funciones quadprog para resolver problemas de programacin cuadrtica 25433 43 URBANA anlisis de series de tiempo y las finanzas computacionales 25144 44 DBI R Database Interface 24793 45 NLME lineal y no lineal de efectos mixtos Models 24360 46 lme4 modelos lineales de efectos mixtos con clases S4 24.199 47 reconfigurar flexiblemente remodelar datos 24118 48 sndwich de covarianza Estimadores Robustos Matrix 24016 49 pasos de seleccin subconjunto de regresin 23666 50 gplots varias herramientas de programacin R para la representacin de datos 23251 51 abind Combinar arrays multidimensionales 22758 52 randomForest Breiman y los bosques al azar de Cutler para la clasificacin y regresin 22401 53 Rcmdr R Comandante 22131 54 anlisis salida coda y diagnstico de MCMC 21900 55 mapas dibujar mapas geogrficos 21550 56 igraph anlisis de redes y la visualizacin 21423 57 formatR Formato Cdigo R Automticamente 21049 58 MapTools Herramientas para la lectura y la manipulacin de objetos espaciales 20957 59 RSQLite interfaz SQLite para R 19671 60 Procedimientos psicolgicos para Psicolgica, psicomtrica y Personalidad Investigacin 19545 61 KernSmooth Funciones para suavizado kernel para Varita &

Jones ( 1995 ) 19.166 62 enlaces rgdal para el Geospatial Data Abstraction Library 19,064 63 RcppArmadillo integracin RCPP de Armadillo templated biblioteca de lgebra lineal 18899 64 Muestra los efectos de efecto para las lineales, lineales generalizados , Logit multinomial - , Modelos Logit Proporcional- Cuotas y De efectos mixtos Modelos 18843 65 sem Modelos de Ecuaciones Estructurales 18711 66 vcd visualizacin de datos categricos 18589 67 XLConnect Excel Conector para R 18230 68 rebajas rendering Markdown para R 18211 69 TimeSeries Rmetrics - Financial Objects series temporales 17.932 70 TimeDate Rmetrics - cronolgica y Calendario Objetos 17.838 71 RJSONIO serializar objetos R para JSON , JavaScript Object Notation 17801 72 Anlisis de conglomerados clster Extended Rousseeuw et al 17136 73 scatterplot3d 3D Scatter Plot 17110 74 nnet Feed- forward Redes Neuronales y Modelos multinomiales Log- lineales 17.074 75 fBasics Rmetrics - Mercados y estadsticas bsicas 16278 76 funciones de prediccin del pronstico de series de tiempo y modelos lineales 15.638 77 quantreg regresin cuantil 15509 78 foreach bucle Foreach construccin de R 15.405 79 chron objetos cronolgicas que pueden manejar fechas y horas 15226 80 plotrix Varias funciones grficas 15142 81 Coleccin matrixcalc de funciones para el clculo de la matriz 15107 82 aplpack otro paquete Terreno: stem.leaf , bagplot , caras, spin3R y algunas funciones de los deslizadores 14654 83 Pruebas strucchange , Seguimiento y Citas Cambios Estructurales 14503 84 iteradores construccin Iterator para R 14449 85 mgcv Mixed GAM Vehculos Computacin con GCV / AIC / REML suavidad

estimacin de 14.186 86 kernlab mquina basada en el Kernel de aprendizaje Lab 14135 87 SparseM lgebra lineal dispersa 13921 88 Clasificacin de rboles y rboles de regresin 13871 89 robustbase estadsticas slidas bsicas 13778 90 vegan Comunidad Ecologa paquete 13686 91 devtools herramientas para hacer ms fcil el desarrollo de cdigo R 13488 92 latticeExtra Utilidades grfica adicional en base a Lattice 13253 93 modeltools Herramientas y Clases de Modelos Estadsticos 13233 94 xlsx leer, escribir archivos de Excel 97/2000/XP/2003 13.097 formato Excel 2007 y 95 Slam matrices ligeras dispersas y Matrices 13060 96 TTR Normas sobre Operaciones Tcnicas 12.894 97 quantmod cuantitativa Framework Modelado Financiero 12892 98 relimp contribucin relativa de los efectos en un modelo de regresin 12692 99 Akima interpolacin de los datos espaciados irregularmente 12.680 100 memoise funciones Memoise 12600

Das könnte Ihnen auch gefallen