Sie sind auf Seite 1von 3

UNIVERSIDAD SIMN BOLVAR

DIVISIN

Fsica y Matemticas

DEPARTAMENTO

Cmputo Cientfico y Estadstica

CDIGO

CO5316

REQUISITOS

CO3322, CO3321 o equivalente

HORAS/SEMANA

T.4

ASIGNATURA

P.0

L.0

Anlisis de Datos

UNIDADES CRDITO:

VIGENCIA

Septiembre 2012

AUTORES

I. Garca, Z. Martnez y M. Rodrguez

PROFESOR

L. Bravo, I. Llatas, I. Garca, Z. Martnez y M. Rodrguez

Objetivo general:
Desarrollar competencias en el rea de anlisis estadstico de datos multivariados mediante el
software R (ambiente estadstico y lenguaje de programacin, GNU) que permita a los
estudiantes la bsqueda de soluciones a problemas aplicados. El contenido del curso integra
los mtodos descriptivos multivariantes de minera de datos, y de reconocimiento de patrones,
con los procedimientos de inferencia estadstica para vectores de variables.

Objetivos Especficos:
1. Manipular bases de datos usando distintos programas para adecuarse a los
requerimientos de R.
2. Programar funciones en R para realizar anlisis estadsticos.
3. Aplicar tcnicas de anlisis descriptivo para generar estadsticas que caracterizan las
relaciones entre varias variables de inters.
4. Aplicar las tcnicas estadsticas multivariadas ms relevantes como herramientas para
disminuir la dimensionalidad en problemas con alto nmero de variables de inters.
5. Plantear modelos lineales generalizados que permitan explicar un alto porcentaje de la
variabilidad de la(s) variable(s) objetivo.
6. Identificar correctamente el contexto de aplicacin de cada una de las tcnicas
multivariadas estudiadas con datos reales.

UNIVERSIDAD SIMN BOLVAR

Contenidos
1. Introduccin al curso y al ambiente de trabajo de R (1 semana).
2. Repaso de nociones de lgebra lineal y distribuciones multivariadas (1 semana).
3. Anlisis exploratorio de datos multivariados (1 semana).
4. Repaso de modelos lineales. Modelos de Anlisis de varianza con uno y dos criterios
de clasificacin. Comparacin mltiple de medias (1 semana)
5. Anlisis de modelos lineales generalizados (1 semana)
6. Anlisis de componentes principales (1 semana)
7. Escalamiento multidimensional y anlisis de correspondencias (1 semana).
8. Anlisis de conglomerados (cluster) (2 semanas).
9. Anlisis discriminante (1 semana)

ESTRATEGIAS METODOLGICAS DE ENSEANZAAPRENDIZAJE


El curso consiste de 4 horas semanales de clases en aula, donde el profesor expone el
contenido de la materia, buscando un balance entre los contenidos tericos y los
ejemplos de aplicacin. Se incentiva la participacin de los alumnos a travs de
preguntas. Se sugieren ejercicios y miniproyectos a ser realizados fuera del aula, para
reforzar los conceptos discutidos en clase y promover el trabajo en equipo. Se fomenta
la investigacin de aplicaciones de las tcnicas estudiadas a datos reales. Se realizarn
presentaciones de los proyectos realizados.

ESTRATEGIAS DE EVALUACIN

Al menos dos pruebas escritas: la primera en semana 6 (30% de la nota final) y


la segunda en semana doce (30% de la nota final).
Al menos dos proyectos elaborados en equipos de hasta tres estudiantes, cada
uno de 15%.
Al menos dos presentaciones por parte del estudiante (relacionada con el
proyecto realizado) , cada una 5%.

UNIVERSIDAD SIMN BOLVAR

FUENTES DE INFORMACIN:

Venables W, Ripley B. 2010. Modern Applied Statistics with S (Statistics and


Computing). Springer. ISBN-10: 1441930086.

Pea, D. 2010. Anlisis de datos Multivariantes. McGraw . Hill Interamericana


de Espana.

Hair J, Black W, Babin B y Anderson R. 2009. Multivariate Data Analysis,


7ma. Edicin.

Johnson R, Wichern D. 2007. Applied Multivariate Statistical Analysis, 6ta.


Edicin.

Jobson J.D. 1992. Applied Multivariate Data Analysis. Vol I y II. Springer.

Se utilizar el paquete estadstico R que es un programa de licencia pblica y


puede descargarse desde la pgina web http://www.r-project.org/ donde tambin puede
encontrarse documentacin en ingls y espaol sobre el software.

Das könnte Ihnen auch gefallen