Beruflich Dokumente
Kultur Dokumente
RESUMEN
En las investigaciones medicas en la actualidad, se usan mucho las estadísticas, para
generar cálculos, gráficos y reportes. Es así como la investigación estadística en todos
los campos de la ciencia (ciencias de la salud, economía, ciencias sociales, , ciencias de
la educación, etc) se ha visto facilitada con el uso de las herramientas
computacionales para su presentación y procesamiento, con ello generar resultados
sobre la exploración de los datos.
EL SPSS:
Statistical Package for the Social Sciences (SPSS), fue desarrollado por Hull y Nie
hace 30 años, en la actualidad con mas difusión mundial. Es un software modular
(base, mapas, tablas, modelos de regresión, modelos avanzados, pruebas exactas,
tendencias, categorías, análisis de conjuntos, valores perdidos, etc.). Chaid y spss
base ofrecen técnicas : para el acceso, manipulación, análisis y presentación de
datos: Análisis Exploratorio, tablas de contingencia, correlación y regresión lineal
múltiple, análisis factorial, discriminante y de conglomerados(clusters), calculo de
proximidad, etc.
VERSIONES SPSS:
MODULOS CLASIFICACION
- PARA CLUTERS O CONGLOMERADOS O AGRUPACIONES: Minería de
Datos
MODULO CORRELACION
o PARA BIVARIADA, PARCIAL Y DISTANCIAS
MODULO REGRESION
o PARA BIVARIADA, PARCIAL Y DISTANCIAS
PRACTICA No.03 DE LABORATORIO
Ejercicio 1:
Los Directivos del Hospital Docente de la UNMSM pide que se haga un análisis
sanguíneo para 80 pacientes, dado que los valores de pH sanguíneo son las siguientes:
7.33 7.32 7.34 7.40 7.28 7.29 7.35 7.33 7.34 7.28
7.31 7.35 7.32 7.33 7.33 7.36 7.32 7.31 7.35 7.36
7.26 7.39 7.29 7.32 7.34 7.30 7.34 7.32 7.39 7.30
7.33 7.33 7.35 7.34 7.33 7.36 7.33 7.35 7.31 7.33
7.37 7.38 7.38 7.33 7.35 7.30 7.31 7.33 7.35 7.33
7.27 7.33 7.32 7.31 7.34 7.32 7.34 7.32 7.31 7.36
7.30 7.37 7.33 7.32 7.31 7.33 7.32 7.30 7.29 7.38
7.33 7.35 7.32 7.33 7.32 7.34 7.32 7.34 7.32 7.33
a) Definir la variable pH, Tipo (Numérico), Anchura(8), Decimal (2), Perdidos
(ninguno), columna(6), Alineación(derecha), Medida(Escala)
a) Seleccionar una o mas variables del archivo TIERRA para Clasificar la Población
Mundial (poblac), el indice de alfabetizacion (alfabet) y la mortalidad infantil
(mortinf) por religiones (relig).
Ejercicio 4:
Se tiene la siguiente tabla bidimensional de frecuencias con los datos sobre presiones
diastolitas de la sangre tomadas en reposo. Los valores de las variables T denotan el
tiempo en minutos transcurridos desde el comienzo del descanso y los valores de la
variable P presentan las presiones diastolitas.
T 0 5 10 15 20
P
66 1 1 0 1 2
68 3 2 1 0 1
70 0 1 9 1 2
72 1 2 1 2 1
74 3 1 2 1 2
Ejercicio 1:
Análisis de Cluster (conglomerados) el SPSS incorpora un procedimiento que
implementa el análisis de cluster no jerárquicos mediante el método de k-medias. Este
procedimiento intenta identificar grupos de casos relativamente homogéneos
basándose en las características seleccionadas y utilizando un algoritmo que puede
gestionar un gran numero de casos. El usuario debe especificar el numero de
conglomerados (centros iniciales de los conglomerados si conoce de antemano).
Trabajar con el Archivo TIERRA Para la solución completa se obtendrá los centros
iniciales de los conglomerados y la tabla ANOVA. Para cada caso se obtendrá
información del conglomerado y la distancia desde el centro del conglomerado. Ejm.
Podemos preguntar ¿ Cuales son los grupos identificables de países con población,
densidad de población y población urbana similares?. Son el Análisis de
Conglomerados k-medias, podrían agruparse los países en k grupos homogéneos
basados en las características consideradas.
Ejercicio 2:
Utilizar el archivo DIABETES_DBF.XLS, que contiene indicadores sociodemográficos,
indicadores clínicos, indicadores económicos, indicadores de respuestas adaptativas,
y otros de los pacientes de un Centro de Salud Publica. Determinar lo siguiente:
a) Convertir el archivo de DIABETES_DBF.XLS a DIABETES_DBF.SAV las 49
variables deberán ser definidos según la vista de variables de SPSS según su
tipo y característica de datos/variable.
b) Llenar los datos con (N=230) pacientes con Diabetes Mellitus, guardar la
información.
Ejercicio 3:
Se considera una muestra de 60 pacientes con cáncer de próstata en los que mide la
edad (edad), el nivel de acido (acido) que mide la extensión del tumor, el grado de
agresividad del tumor (grado), la etapa en la que se encuentra (etapa), los resultados
de una radiografía (radiogra) y cuando se ha detectado al intervenir quirúrgicamente
que el cáncer se ha extendido a los nodos linfáticos. A partir de estos datos se trata
de ajustar un modelo que permita predecir cuado el cáncer se extiende a los nodos
linfáticos (nodo) sin necesidad de intervención quirúrgica. Determinar lo siguiente:
Ejercicio 5:
Para el Análisis de Datos pueden tomar 2 o más categorías debajo descritos- estos
son algunas aplicaciones que se puedan realizar en los Hospitales, Postas de Salud,
Clínicas, EsSalud y Consultorio de Salud.
1. Descubrir distintos comportamientos de una misma patología.
2. Realizar pronósticos ajustados a cada paciente.
3. Predecir las patologías que pueden aparecer como complicación de una
enfermedad determinada.
4. Encontrar la predisposición a padecer determinadas enfermedades.
5. Descubrir asociaciones entre patologías.
6. Determinar el mejor tratamiento individual para cada paciente.
7. Sistema de apoyo al diagnóstico.
8. Descubrir nuevas características de una patología.
9. Comparación entre parámetros clínicos.
Así, por ejemplo, en el caso de descubrir comportamientos de una misma patología, los
sistemas de minería de datos pueden encontrar subgrupos, dentro de una determinada
patología, que tienen características comunes dentro del mismo subgrupo y diferentes
entre los diversos subgrupos. Estas clasificaciones pueden encontrarlas el sistema de
manera automática, es decir, a partir de las relaciones que el sistema encuentra por sí
mismo y que no tienen porqué atenerse a las clasificaciones clásicas realizadas con
interés académico, clínico o fisiopatológico.