Sie sind auf Seite 1von 19

Benemrita Universidad Autnoma de Puebla

Facultad de Ciencias de la Computacin

Minera de datos aplicada a los ndices de seguridad en


Mxico con Weka.
Alumnos:

Jean Alexander Ramrez Murillo.


David Snchez Rodrguez.
Katia Cecilia Flores Toledo.
Gabriela Guzmn Hernndez.

Materia:
Minera de Datos.
Profesora:
Dra. Mara Josefa Somodevilla Garca.

Primavera 2015

ndice

1
1.1 Introduccin .............................................................................................................................................. 3
1.2 Preparacin de los datos .......................................................................................................................... 4
1.2.1 Muestra de datos ............................................................................................................................... 4
1.2.2 Objetivos de anlisis ........................................................................................................................ 4
1.3 Pre procesado de los datos ...................................................................................................................... 5
1.3.2 Trabajo con filtros ............................................................................................................................. 7
1.4 Visualizacin ........................................................................................................................................... 13
1.4.1 Representacin 2D de los datos .................................................................................................... 13
1.4.2 Filtrado grafico de los datos ...................................................................................................... 15
1.5 Asociacin ................................................................................................................................................ 16
1.6 Clster....................................................................................................................................................... 17
1.7 Conclusiones ........................................................................................................................................... 19

Minera de datos aplicada a los ndices de seguridad en


Mxico con Weka
1.1 Introduccin
En este material mostraremos el uso de weka, que como ya sabemos es una
herramienta de minera de datos la cual es utilizada para experimentacin de
anlisis de datos que permite aplicar, analizar y evaluar las tcnicas ms relevantes
de anlisis de datos, principalmente las provenientes del aprendizaje automtico,
sobre cualquier conjunto de datos.
Aplicaremos esta herramienta para el tratamiento de datos sobre el tema de los
ndices de Seguridad en Mxico.
Hemos elegido este tema ya que en la actualidad todos nos enfrentamos con
problemas de seguridad de cualquier tipo, actualmente conocemos a por lo menos
alguna persona que ha sufrido algn robo, asalto, agresin etc. es por ello que
decidimos trabajar con estos datos para poder predecir conductas o descubrir
patrones y as poder aportar conocimiento a dicha rama y de ser posible poder tomar
medidas para disminuir estos ndices.
Los datos que trabajaremos fueron tomados de fuentes confiables como la pgina
del INEGI, que nos provee de material recolectado a lo largo de varias dcadas los
cuales pone a nuestra disposicin para poder descargarlos y trabajar con ellos.
Este escrito lo ponemos en forma de un manual prctico adaptado a los datos que
estamos trabajando, poniendo algunos ejemplos de los resultados arrojados por la
herramienta.

1.2 Preparacin de los datos


Para nuestro proyecto utilizamos una base de datos en MySQL, posteriormente
se aplicaran mtodos de filtrado y agrupamiento de weka. Para los datos de los
siguientes temas.

Delitos.
Economa.
Educacin.
Poblacin.
Recursos naturales.
Salud publica.
Sistema penitenciario.
Vivienda.

1.2.1 Muestra de datos


El fichero de datos objeto de anlisis en este trabajo contiene muestras
correspondientes a los indicadores mencionados anteriormente de una dcada, de
2002 al 2012.
Los datos que describen cada indicador contienen la siguiente informacin:
id_indicador, descripcin, ao, estado, municipio y valor.
Los datos fueron obtenidos de la pgina oficial de INEGI.

1.2.2 Objetivos de anlisis


En nuestro caso, uno de los objetivos perseguidos es poder responder mediante la
minera de estos datos las preguntas que nos hemos planteado como objetivo de
anlisis; algunas de ellas son las siguientes:

Qu estados de la republica son ms seguros para vivir?

Cules son las caractersticas de los estados con mayor ndice delictivo?

Cmo influye los factores educativos y de economa para cometer delitos por parte de las
mujeres?

1.3 Pre procesado de los datos


1.3.1 Consultas para el pre procesamiento en Weka

Qu estados de la republica son ms seguros para vivir?

ndices necesarios:
Para determinar que estados son ms seguros para habitar tomaremos en cuenta los delitos
ms graves y de mayor ocurrencia de la BD Minera, los cuales son:

Delitos por homicidio 1006000051


Delitos Sexuales 1006000050
Robo 1006000053
Cifra negra delitos 6200005821

Densidad poblacional 3105001001

Consulta

Cules son las caractersticas de los estados con mayor ndice delictivo?

Para resolver esta incgnita, se ocupan las siguientes caractersticas por estado.

Consulta a la base de datos:

select b.descripcion, b.2002,b.2003,b.2004,b.2005,b.2006,b.2007, b.2008,b.2009, b.2010,


b.2011, b.2012, estados.nombres from (select * from (select * from casos where descripcion like
'porcentaje%analfabetas total' or descripcion like '%internos%' or descripcion like '%ingresos
netos%') as a join tiempo where a.id_indi= tiempo.caso) as b join estados where estados.id_estado
= b.edo;

Cmo influye los factores educativos y de economa para cometer delitos por parte de las
mujeres?

ndices necesarios:
Para determinar que estados son ms seguros para habitar tomaremos en cuenta los delitos ms
graves y de mayor ocurrencia de la BD Minera, los cuales son:

Poblacin econmicamente activa


Poblacin analfabeta
Delitos por robo

Consulta sql:
Select * from estados right join tiempo on tiempo.edo=estados.id_estado where
caso=1007000019 OR caso=3103002003 OR caso=3108001003;

1.3.2 Trabajo con filtros

Qu estados de la republica son ms seguros para vivir?

Dichas variables tienen una cierta relacin logia sin embargo para determinar con mejor precisin
su impacto en nuestros datos utilizaremos el tema 1.6 del manual Asociacin para buscar reglas que
relacionen dichos campos.

Esto nos devuelve una larga lista de aos, sin embargo para tomar con mejor claridad la densidad
poblacional tomaremos los aos 2005,2010 y 2012 para los reportes delictivos ms nuevos
disponibles.

Los datos resultantes son de tipo numrico as que aplicaremos el filtro discretize con 4 bins y
equalFrequency.

Cules son las caractersticas de los estados con mayor ndice delictivo?

Al discretizar los valores de la suma de los atributos, de analfabetismo e ingresos netos.


Se obtienen 3 bins.

Cmo influye los factores educativos y de economa para cometer delitos por parte de las
mujeres?

Tomando en cuenta los censos globales que son los que reflejan mejores datos tenemos:

AddExpression
Queremos evaluar los aos 2010 y 2005 para tener como comprar dichos datos y poder sacar
algun patron o informacion relevante. Para ello restamos los valores del ao 2010 los del 2005

Tomando en cuenta el indicador de educacin, que es el nmero de mujeres analfabetas tenemos:

1.4 Visualizacin

1.4.1 Representacin 2D de los datos


Los eventos son excluyentes entre si obviamente, aqu podemos apreciar los casos de delito
que buscamos.

1.4.2 Filtrado grafico de los datos


En esta parte podemos observar los delitos en el periodo 2005.

Delitos en el 2010

Delitos en el 2012 los datos ms recientes adquiridos.

1.5 Asociacin
Aplicamos algoritmo A priori para descubrir las reglas de asociacin ms importantes.

1.6 Clster
Al aplicar Kmeans, con 5 clster observamos que el resultado es Oaxaca, Yucatn y Tlaxcala.

1.7 Conclusiones

Qu estados de la republica son ms seguros para vivir?

Observando la distribucin de los datos, segn los reportes del 2012, en conclusin los
estados ms tranquilos o seguros en general serian baja California sur, Campeche, Durango,
Nayarit, Quertaro, Quintana Roo.
Y los ms peligrosos o con mayor violencia son Oaxaca, Veracruz, Michoacn y Zacatecas.
Algo ms que se puede observar es que en el periodo 2005 a 2010 hubo un incremento en los
crmenes ms fuertes que son el homicidio y el abuso sexual, tendr que ver con un periodo
presidencial y los planes de gobierno de esos aos?

Cules son las caractersticas de los estados con mayor ndice delictivo?

Oaxaca es el estado con ms alto ndice delictivo y una tasa baja de ingresos netos al
municipio.
Los estados con mayor ndice son: Oaxaca, Yucatn y Tlaxcala.

Cmo influye los factores educativos y de economa para cometer delitos por parte de las
mujeres?
Los factores educativos influyen medianamente en la comisin de robos.

Das könnte Ihnen auch gefallen