Sie sind auf Seite 1von 120

DESARROLLO DE UN MODELO COMPUTACIONAL, PARA LA IDENTIFICACION DE PATRONES CANDLESTICKS UTILIZANDO TECNICAS DE MINER IA DE DATOS

MARIO LINARES VASQUEZ

Tesis presentada como requisito parcial para obtener el t tulo de MAGISTER EN INGENIER IA INGENIER DE SISTEMAS Y COMPUTACION IA

Director: DIEGO FERNANDO HERNANDEZ LOSADA, PH. D. Profesor Asociado Codirector: FABIO AUGUSTO GONZALEZ OSORIO, PH. D. Profesor Asociado

UNIVERSIDAD NACIONAL DE COLOMBIA FACULTAD DE INGENIER IA D. C. BOGOTA 2009

Aprobada por la Facultad de Ingenier en cumplima iento de los requisitos exigidos para otorgar el t tulo de: Magister en Ingenier Ingenier de a a Sistemas y Computacin o

Diego Fernando Hernndez Losada, Ph. D. a


Director de la Tesis

Fabio Augusto Gonzlez Osorio, Ph. D. a


Codirector

Germn Hernndez Prez a a e


Jurado

Germn Guerrero Chaparro a


Jurado

Universidad Nacional de Colombia Bogot D. C., Abril de 2009 a

DEDICATORIA

A mis maestros Diego Hernndez y Fabio Gonzlez por su conanza y continua gu A todos a a a. aquellos profesores de la Universidad Nacional que contribuyeron mi proceso de formacin, como o Sandra Liliana Rojas y Jairo Hernn Aponte. A los liminarios por su paciencia. A ti Sara, por ser a esa luz que me dio inspiracin y apoyo durante la parte ms importante de este proceso. o a

iii

Contenido

Contenido Lista de Tablas Lista de Figuras 1 Introduccin o 1.1 Objetivos y Aportes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2 Organizacin del documento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . o

iv vi vii 1 3 3

I
2

Marco Terico o
Fundamentos Teor de la Inversin a o 2.1 Teor del Consumidor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . a

5
9 9 13 14

3 Anlisis Tcnico a e 3.1 Candlesticks . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

II Modelo Propuesto para Soporte al Proceso de Seleccin de Portafolio o


4 Modelo Propuesto 4.1 Modelo Identicacin Formas Bsicas . . . . . . . . . . . . . . . . . . . . . . . . . . . o a 4.2 Modelo para Generacin de Expectativas . . . . . . . . . . . . . . . . . . . . . . . . . o 4.3 Seleccin de Activos para Diseo de Portafolio . . . . . . . . . . . . . . . . . . . . . . o n

19
23 23 28 33

III Experimentacin y Anlisis de Resultados o a


5 Experimentacin o 5.1 Conjunto de Datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.2 Diseo Experimental . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . n 5.3 Anlisis de Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . a 6 Conclusiones y Trabajo Futuro

35
39 39 39 45 49

Apndices e
Apndice A: Art e culo Estado del Arte iv

53
55

Apndice B: Glosario de Trminos Financieros e e Apndice C: Resumen de Probabilidad y Estad e stica Experimento aleatorio . . . . . . . . . . . . . . . . . . . . Variable aleatoria . . . . . . . . . . . . . . . . . . . . . . . Media . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Valor Esperado . . . . . . . . . . . . . . . . . . . . . . . . Varianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . Desviacin Estndar . . . . . . . . . . . . . . . . . . . . . o a Covarianza . . . . . . . . . . . . . . . . . . . . . . . . . . Correlacin . . . . . . . . . . . . . . . . . . . . . . . . . . o

69 77 77 77 78 78 78 78 79 79

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

Apndice D: Desarrollo de la Herramienta Computacional e Visin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . o Plan de Iteraciones . . . . . . . . . . . . . . . . . . . . . . . . . Modelo de uso . . . . . . . . . . . . . . . . . . . . . . . . . . . Manual de usuario PDM-Data Manager . . . . . . . . . . . . . Manual de usuario PDM- Candles . . . . . . . . . . . . . . . . Manual de usuario PDM- Prextree . . . . . . . . . . . . . . . Manual de usuario PDM-Patterns . . . . . . . . . . . . . . . . Bibliograf a

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

81 . 81 . 83 . 84 . 89 . 95 . 95 . 100 107

Lista de Tablas
4.1 4.2 4.3 4.4 5.1 5.2 5.3 5.4 5.5 5.6 Candlesticks . . . . . . . . . . . . . . . Candlesticks y tamaos . . . . . . . . n Ejemplos esquemas de representacin . o Estados de la naturaleza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 27 29 30 40 42 43 45 46 48

Conjunto de datos . . . . . . . . . . . . . . . . . . . . . . . . Experimentos catlogo de patrones y expectativas . . . . . . a Experimentos Expectativas y Seleccin de Activos . . . . . . o Resultados Fase 1 - Experimentos Grupo 1 . . . . . . . . . . Resumen Fase 2- Experimentos Grupo 1 y Grupo 2 . . . . . . Resultados Experimentos Expectativas y Seleccin de Activos o

vi

Lista de Figuras
2.1 3.1 3.2 3.3 3.4 3.5 3.6 3.7 4.1 4.2 4.3 4.4 4.5 5.1 5.2 5.3 5.4 5.5 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 Conjunto disponible y restriccin presupuestal . . . . . . . . . . . . . . . . . . . . . . . . o Google Precio de cierre - Grca de l a nea Google - Grca de barras . . . . . . . . . a Google - Candlestick . . . . . . . . . . . . Barras vs Candlestick . . . . . . . . . . . Basic Candlesticks . . . . . . . . . . . . . Patrones de ruptura . . . . . . . . . . . . Patrones de continuacin . . . . . . . . . o Sistema clasicador difuso Conjuntos difusos . . . . . Posicin relativa . . . . . o Secuencia y estado . . . . Arbol de prejos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 15 15 16 16 17 18 18 24 25 28 30 31

Patrones tamao 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . n Patrones tamao 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . n Espacio TPR vs FPR (tomada de http://en.wikipedia.org/wiki/Receiver operating Espacio ROC seleccin de activos . . . . . . . . . . . . . . . . . . . . . . . . . . . o Tasa de Error clasicacin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . o

. . . . . 41 . . . . . 42 characteristic) 44 . . . . . 47 . . . . . 47 77 80 80 82 83 84 85 86 87 88 90 91 92 93 94 94 96 96

Variable Aleatoria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Covarianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Correlacin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . o Modelo de datos - PDM Data Manager . . . . . Formas bsicas . . . . . . . . . . . . . . . . . . . a Arquitectura general . . . . . . . . . . . . . . . . Diagrama casos de uso PDM-Data Manager . . . Casos de uso PDM-Candles . . . . . . . . . . . . Casos de uso PDM-Prextree . . . . . . . . . . . Casos de uso PDM-Patterns . . . . . . . . . . . . Ventana principal -PDM Data Manager . . . . . Manage Markets . . . . . . . . . . . . . . . . . . Manage Companies . . . . . . . . . . . . . . . . . Manage Stocks . . . . . . . . . . . . . . . . . . . Manage Quotes . . . . . . . . . . . . . . . . . . . Ventanas para creacin . . . . . . . . . . . . . . o Ventana para carga de precios mediante archivo . Grca Candlesticks 1 . . . . . . . . . . . . . . . a vii . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35

Grca Candlesticks 2 . . . . . . . . . . . . . . . . a PDM Candles - Ventana Principal . . . . . . . . . PDM Candles - Resultados . . . . . . . . . . . . . PDM Candles - Archivo CSV generado . . . . . . . PDM Prextree - Ventana Principal . . . . . . . . PDM Prextree - Ventana construccin catlogo . o a PDM Prextree - Panel rbol de prejos . . . . . . a PDM Prextree - Panel rbol de patrones . . . . . a PDM Prextree - Reglas . . . . . . . . . . . . . . . PDM Patterns - Ventana Principal . . . . . . . . . PDM Patterns - Panel parmetros de codicacin a o PDM Patterns - Panel parmetros de anlisis . . . a a PDM Patterns - Panel seleccin de acciones . . . . o PDM Patterns - Reporte . . . . . . . . . . . . . . . PDM Patterns - Visor rboles de patrones . . . . . a PDM Patterns - Visor secuencia de candlesticks . . PDM Patterns - Simulador portafolios . . . . . . .

. . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . .

97 97 98 98 99 100 101 101 102 102 103 103 103 104 104 105 105

viii

Cap tulo 1

Introduccin o
El problema de seleccin de portafolio es reconocido en la comunidad acadmica y empresarial como o e uno de los grandes desaf de las nanzas, la estad os stica y las ciencias de la computacin, debido a o sus caracter sticas especiales, como son la complejidad e incertidumbre impl cita en los procesos, y la fundamentacin de tipo econmico que lo orienta (generacin de riqueza). De forma general consiste o o o en la seleccin de un conjunto de activos de un universo disponible, de acuerdo con un conjunto de o variables objetivo del tomador de decisiones, que denen el modelo de inversin. Tal como se plantea o en [54], el proceso de seleccin se compone de dos etapas: o Generacin de expectativas: con base en los valores histricos de las series nancieras, la o o informacin del mercado, y el conocimiento del tomador de decisiones, se construyen expectatio vas acerca del comportamiento futuro de los activos y la dinmica del mercado que dene ese a comportamiento. Dise o del portafolio: con base en las expectativas obtenidas y el perl del tomador de n decisiones (tolerancia del riesgo, horizonte de planeacin, posicin, etc) se selecciona el conjunto o o de activos y t tulos (acciones, bonos, monedas, etc) en los cuales se debe invertir, as como la proporcin de inversin de riqueza en cada uno de estos; esta seleccin est dirigida por la o o o a necesidad de optimizar las variables objetivo del proceso, que se asocian con el perl del tomador de decisiones. Por ejemplo, dos criterios clsicos de seleccin son maximizar el retorno esperado a o y minimizar el riesgo del portafolio. Trabajos como los de Markowitz y Sharpe en [54] y [69] respectivamente, han denido los fundamentos nancieros y matemticos del diseo de portafolio a n en un bloque terico conocido como la Teor Moderna de Portafolio. o a De forma general, las expectativas que dirigen el proceso de diseo del portafolio, son reglas, n patrones o relaciones, que denen el comportamiento esperado de los activos con base en el mercado y todos los activos disponibles1 . Este comportamiento es representado a travs de series de tiempo que e presentan el histrico de algn valor caracter o u stico del activo. Estos valores caracter sticos describen el activo desde el punto de vista de su comportamiento en un mercado nanciero a travs del tiempo. e Los enfoques para generar estas expectativas, se pueden agrupar en tres grupos: prediccin de series o de tiempo (Forecasting), generacin de reglas de asociacin, identicacin de patrones y tendencias, o o o tal como se plantea en [53]. En la actualidad, todo el desarrollo resumido por estos 3 enfoques, junto con el crecimiento de los modelos nancieros asociados con el proceso, estn convergiendo hacia la cona struccin de modelos h o bridos que combinan estos enfoques de generacin de expectativas, con nuevas o metodolog como la computacin exible y la Miner de Datos. Cabe mencionar aqu trabajos como as o a los de Wilson [78] y Das et al [21]. En el caso de [78], se presenta un sistema h brido para la prediccin o de precios de acciones que se basa en diferentes modelos tcnicos, estad e sticos y adaptativos. El ncleo u
1 Al conjunto de activos o t tulos disponibles en el mercado para efectos de diseo de un portafolio, se le denomina n universo de seleccin o

del sistema es una red auto-organizativa que evala mediante cada una de las entradas de la red, cual u de los modelos utilizados se desempea mejor para cada una de las acciones del universo de seleccin. n o Luego, la capa de salida de la red con base en la recomendacin de los modelos seleccionados, cono struye el portafolio teniendo en cuenta el valor del riesgo denido por el tomador de decisiones. En [21], se generan reglas a partir del anlisis de series nancieras. Estas reglas expresan expectativas a a nivel de comportamiento temporal en una misma serie (autocorrelacin) y correlacin entre diferentes o o series. El proceso de construccin de las reglas se basa en el uso de tcnicas de agrupacin (K-means o e o espec camente) como herramienta para identicar patrones en las series, utilizando como medida de similitud L2 (distancia euclidiana). Esta tcnica requiere como parmetros el valor de la ventana e a temporal para discretizacin de las series y el nmero de patrones a encontrar (utilizando K-means) o u sobre los conjuntos discretizados. Las reglas de asociacin encontradas, expresan la relacin entre la o o presencia de patrones frecuentes en series de precios de cierre, que son identicados con la tcnica de e agrupacin. o En materia de modelos clsicos para abordar el problema de seleccin de portafolio, las aproximaa o ciones desde la teor nanciera y las ciencias de la computacin asumen que las series de tiempo se de a o comportan bajo distribuciones normales, descritas por una medida de tendencia y una de variacin. o Pero el reciente crecimiento de reas de investigacin como la Miner de Datos, y la orientacin de a o a o sus tcnicas como la extraccin de conocimiento y el manejo de grandes volmenes de informacin e o u o (tanto cuantitativa como cualitativa), presentan al problema del portafolio nuevas opciones de implementacin y de solucin, sin los supuestos de normalidad. Trabajos como los presentados en [78] y o o [21], plantean nuevos horizontes en materia de sistemas h bridos para la solucin del problema. Por o ejemplo, la identicacin de patrones en series nancieras con tcnicas de agrupacin, requiere el uso o e o de esquemas automticos que no necesiten la denicin de parmetros del conjunto posible (por ejema o a plo el nmero de clusters), de tal forma que los resultados sean ms verstiles e identiquen de forma u a a menos restringida el conocimiento impl cito en los datos de las series. Por otro lado, caracter sticas de los patrones como escalamiento en tiempo y amplitud, translacin vertical y ruido, revelan la necesio dad del uso de medidas de similitud robustas y aplicables al proceso. Por ejemplo, Dynamic Time Warping es una medida de similiaridad presentada en [46] y [47] , cuya motivacin es tratar con series o que tienen caracter sticas especiales como las mencionadas anteriormente. El proceso de anlisis de tendencias e identicacin de patrones en series nancieras es de vital a o importancia para campos de estudio como el Diseo Activo de Portafolios, el Anlisis de Series y n a Modelos cualitativos. Con el crecimiento constante del nmero transacciones registradas en la bolsa y u la adicin de nuevas compa a los mercados de intercambio, la identicacin de patrones en series o nas o es cada vez ms compleja dada la cantidad de informacin disponible. Este proceso de reconocimiento a o est limitado por supuestos patrones ya denidos por el anlisis tcnico [60], y dada la dinmica del a a e a mercado es necesario tambin analizar nuevos patrones emergentes que an no han sido identicados e u (partiendo del supuesto que estos patrones existen). Aqu el factor motivante y generador de investi gacin, es que los modelos de clsicos de diseo de portafolio no estn elaboradoras para operar con o a n a informacin cualitativa y reglas de prediccin, sino con distribuciones de probabilidad de los retornos o o esperados de las acciones. En esta medida se requiere de una herramienta computacional que soporte al proceso de diseo de portafolio abordando el problema de la generacin de expectativas como un n o proceso de reconocimiento de patrones, que aproveche las bondades propuestas por el anlisis tcnico. a e Esta herramienta debe cubrir las necesidades de manipulacin de grandes volmenes de informacin o u o y descubrimiento automtico de conocimiento en las series nancieras (a manera de reglas). a Bajo esta ptica, el propsito de esta tsis para obtar al t o o e tulo de Maestr en Ingenier - Ingenier a a a de Sistemas y Computacin, es el desarrollo de una herramienta de software basada en miner de o a datos, para soporte al proceso de Seleccin de Portafolio. Esta herramienta plantea una implementacin o o computacional de una tcnica para reconocimiento de patrones en series nancieras, conocida como e candlesticks. Estos candlesticks se denen a travs de reglas lingu e sticas para el reconocimieno visual de patrones y proporcionan expectativas del comportamiento futuro de las acciones. En el caso particular de esta tesis se utiliza razonamiento difuso para la identicacin de los candlesticks. Estos candlesticks o reconocidos sobre el conjunto de datos, se organizan como patrones mediante un rbol de prejos a 2

sobre el cual se generan expectativas(reglas) que son usadas entonces para sugerir al tomador de inversiones la composicin de su portafolio para el d de anlisis seleccionado. La denicin del o a a o modelo computacional representa un aporte valioso al campo nanciero y al campo computacional, en la medida que un modelo computacional permitir realizar de forma automtica un proceso manual a a que en el contexto nanciero requiere esfuerzo y tiene un nivel de complejidad asociado, como lo es el reconocimiento de patrones en grandes volumenes de datos.

1.1

Objetivos y Aportes

Con base en el objetivo general de implementar una herramienta de software basada en miner de a datos, para soporte al proceso de Seleccin de portafolio, se presentan a continuacin los objetivos o o espec cos denidos y se describen los aportes de la tesis para cada uno: Objetivo 1: Elaborar un estado del arte desde el punto de vista de los modelos computaciones aplicados al proceso de seleccin de portafolio. Como resultado de este objetivo se public en la o o Revista Ingenier e Investigacin [53] (Ver Apndice A) un art a o e culo estado del arte de modelos computaciones utilizados en el proceso de Seleccin de Art o culo. El aporte de este art culo radica en la taxonomia de tcnicas presentada y en la descripcin del proceso de seleccin como un e o o problema de seleccin multiobjetivo, el cual es presentado comnmente en un enfoque netamente o u nanciero. Este estado del arte permiti identicar como la tcnica de candlesticks no habia sido o e utilizado antes para la generacin de expectativas. o Objetivo 2: Disear un modelo de generacin de expectativas basado en razonamiento difuso y n o a rboles de prejos. El modelo de generacin de expectativas propuesto incluye un sistema clasio cador difuso, que permite usar computacionalmente las reglas linguisticas usadas en el proceso humano de reconocimiento de candlesticks. Este modelo aborda el problema desde una perspectiva de reconocimiento de patrones y no como un problema de prediccin clsico (aproximacin de o a o funciones). Adicionalmente el uso del rbol de prejos permite organizar las secuencias de cana dlesticks encontradas en los datos reales, de tal forma que se construye un catlogo de patrones a que permite evaluar la frecuencia y capacidad de dar informacin de cada patrn. o o Objetivo 3: Desarrollar un modelo de diseo de portafolio, basado en el modelo de generacin de n o expectativas. Uno de los elementos claves del proceso de diseo de portafolio radica en la seleccin n o de los activos que formarn parte del portafolio con base en las expectativas generadas. El a aporte del modelo de diseo propuesto, radica en que permite seleccionar del universo disponible n aquellos activos, que para un d de anlisis denido proporcionan una perspectiva de mercado a a creciente con base en el anlisis de los candlesticks proporcionados por el anlisis tcnico. a a e Objetivo 4: Implementar un prototipo de software basado en los modelos de generacin de o expectativas y diseo de portafolio construidos en el proyecto. Este prototipo permite validar los n modelos propuestos y proporciona a los tomadores de deciciones una herramienta para soporte al proceso, que va desde la gestin de datos hasta la seleccin de activos para diseo de portafolios. o o n Objetivo 5: Evaluar el desempeo del prototipo de software desarrollado, con series de tiempo n de acciones reales. Con el uso de series de acciones reales se puede validar como el prototipo contribuye al proceso de seleccin, generando portafolios de inversin y visualizando los resultados o o de estos.

1.2

Organizacin del documento o

Este documento presenta el desarrollo del proceso de investigacin y desarrollo en cuatro partes que o son: marco terico, modelo propuesto, proceso de desarrollo de la herramienta computacional, y anlisis o a 3

de resultados obtenidos y conclusiones. En la primera parte se presenta la teor nanciera asociada a con el proceso de Seleccin de Portafolio, con los siguientes cap o tulos: Cap tulo 2: presenta fundamentos de la teor de la inversin como la teor del consumidor a o a en la cual se basan los modelos de portafolio.. Cap tulo 3: presenta el anlisis tcnico y la tcnica de candlesticks como herramienta para a e e identicacin de patrones en series de acciones. El modelo propuesto usa los candlesticks del o anlisis tcnico para abordar el proceso de seleccin de activos en el diseo de portafolios. a e o n La segunda parte est dedicada al modelo propuesto. Incluye el Cap a tulo 4 en el cual se dene el modelo para identicacin de formas bsicas de candlesticks con un sistema clasicador difuso y el o a modelo para generacin de expectativas usando rboles de prejos. o a En la tercera se presentan los resultados del proceso con los siguientes cap tlos: Cap tulo 5: describe el proceso de experimentacin usando datos reales del mercado burstil. o a Este cap tulo incluye la descripcin del conjunto de datos, el diseo experimental y el anlisis o n a de los resultados obtenidos. Cap tulo 6: plantea los conclusiones del proceso y el trabajo futuro. Adicionalmente, el documento tiene una seccin de Apndices para contextualizar al lector no o e familiarizado con la terminolog y conceptos nancieros, y mostrar el proceso de desarrollo de los a prototipos que soportaron la experimentacin: o Apndice A: estado de arte sobre tcnicas computaciones utilizadas en la generacin de exe e o pectativas. Apndice B: glosario de trminos nancieros. e e Apndice C: repaso de la estad e stica usada en el proceso de Seleccin de Portafolio o Apndice D: proceso de desarrollo de los prototipos construidos como producto de la tesis. e

Mario Linares Vsquez a Departamento de Ingenier de Sistemas a Universidad Nacional de Colombia

Parte I

Marco Terico o

En la losof la mente est aferrada a las cosas, a a mas en la poes se halla libre de tales cadenas a y puede divagar y ngir lo que le plazca. Francis Bacon. Teor del Cielo a

Cap tulo 2

Fundamentos Teor de la Inversin a o


2.1 Teor del Consumidor a

Cada uno de los agentes que forman parte de un sistema econmico se encuentran intimamente ligados o con los procesos de produccin y ms espec o a camente con el consumo de los productos generados por estos procesos al interior del sistema. Bienes y servicios, dinero, etc, son la materializacin de estos o productos y las personas u organizaciones son la representacin de los agentes que quieren de una otra o forma poseer esos productos de acuerdo con criterios como la necesidad, el lujo, o de forma general la adquisicin de bienestar. o Este proceso de adquisicin de productos con base en la maximizacin de la satisfaccin o la o o o utilidad, est fundamentado en la toma de decisiones racionales (con o sin incertidumbre), y se conoce a como el Problema del Consumidor. El problema del consumidor se modela como un problema de optimizacin que se dene a travs o e de 4 elementos, que son los siguientes: el conjunto de oportunidades disponible, las restricciones presupuestales, las preferencias individuales de consumo y el comportamiento de consumo representados en las elecciones hechas con el n de maximizar la satisfaccin. o Para ilustrar el problema del consumidor, a continuacin se presentarn cada uno de los elementos, o a antes de enunciar el modelo formal.

2.1.1

Conjunto de Oportunidades

El proceso de adquisicin de bienes est dirigido en primera instancia por el universo de seleccin o a o disponible en el mercado. Las oportunidades de elegir una canasta o conjunto de bienes son directamente observables por cualquier consumidor, y cualquier variacin en las oportunidades deber inuir o a directamente sobre la eleccin. Es decir, los cambios en la eleccin son debidos en gran parte a la o o variacin en el universo de seleccin. En esta medida se dene el conjunto de oportunidades, como el o o conjunto n de productos disponibles en el mercado.

2.1.2

Restricciones Presupuestales

De forma general cuando el consumidor se dispone a comprar algn bien, no solo encuentra el bien u buscado sino otros (conjunto disponible) que le hacen reexionar sobre la canasta a comprar. Esta situacin evidencia como las condiciones para la toma de decisiones han cambiado y por ende el o conjunto de oportunidades. Aqu es donde en la toma de la decisin respecto a la compra interviene un segundo elemento, y o es la cantidad de dinero que posee el consumidor al momento de la compra. Esta condicin se dene o como la restriccin presupuestal. Si el consumidor posee un valor de riqueza que se denomina y, y cada o uno de los n productos del conjunto disponible tienen un precio pi i, i = 1, .., n, se dene entonces la siguiente la relacin o 9

pi xi y
i=1

(2.1)

donde xi representa el porcentaje de la riqueza y que el consumidor utilizar en la compra del a producto i, o la cantidad del bien i a comprar. La relacin (2.1) expresa la restriccin presupuestal en o o el problema de consumidor bajo el hecho que el costo de los bienes a consumir o adquirir est limitado a por la cantidad de riqueza que dispone el tomador de decisiones para efecto del consumo.

Figura 2.1: Conjunto disponible y restriccin presupuestal o

La Figura 2.1 ilustra el efecto de la restriccin presupuestal sobre un conjunto disponible de 2 o productos (A y B). As una canasta se puede expresar como una combinacin de cantidades de o producto A y B. Pero la restriccin presupuestal reduce las opciones a un conjunto vlido a travs del o a e cual el consumidor debe seleccionar las ms atractivas bajo un criterio de satisfaccin o utilidad. Por a o ejemplo los puntos o, p y q son combinaciones vlidas pero el consumidor en particular dene cual es a ms atractiva. a El modelo bsico de consumo involucra solo una restriccin que est denida por la riqueza a o a disponible, pero otros elementos pueden ser involucrados como el tiempo disponible, el mximo nivel a de ocio soportado, extendiendo as el problema bsico a un problema multiobjetivo. a

2.1.3

Preferencias individuales

Un elemento fundamental desde el punto de vista de la teor del consumidor es la comprensin y a o modelado de cmo los individuos realizan sus decisiones y cmo seleccionan alternativas de un conjunto o o disponible de las mismas. Desde el punto de vista miroeconmico, cada individuo ordena o prioriza las o alternativas de seleccin de acuerdo con su preferencia relativa. Segn esto, cuando el individuo realiza o u una eleccin, selecciona la alternativa que mejor satisfaga sus necesidades en un momento dado. o Este proceso de seleccin sobre m alternativas, que se traduce en un orden de preferencias expresado o por el consumidor, dene una relacin de orden entre las alternativas disponibles. Por ejemplo, cuando o algunas alternativas tienen el mismo nivel en la lista de preferencias, el consumidor tendr indiferencia a entre las mismas. Existen dos propiedades asociadas con la relacin de orden: o 10

(i) Una relacin de orden permite comparar 2 alternativas diciendo cual es dominante o preferida, o o denir cuando ambas tienen el mismo nivel de preferencia. (ii) La relacin de orden es transitiva, es decir si una alternativa A es mayor que una alternativa B, o y esta ultima mayor que una C, entonces A es mayor q C. Las relaciones de preferencias se usan para caracterizar los deseos de los consumidores, por varias combinaciones de bienes. Los bienes son indexados de 1 hasta n. Una canasta de bienes se dene entonces como la coleccin de varias cantidades de esos n bienes, y la cantidad de cada bien en una o canasta es un nmero real positivo. As cada consumidor tiene sus relaciones de preferencia propias. u El instrumento formal para identicar las relaciones de preferencia se conoce como Funcin de o utilidad y se dene bajo la siguiente condicin: Si la relacin de orden es completa, transitiva, reexo o iva y continua, entonces las preferencias se pueden representar a travs de una funcin de utilidad e o continua. La funcin de utilidad U , es una funcin real, denida de la siguente forma: o o U: n (x1 , x2 , .., xn ) f (x1 , x2 , .., xn ) donde el conjunto de x representa el conjunto cantidades de compra de los bienes o canasta de bienes (con la condicin que el orden de las preferencias sobre estas se preserva por la magnitud de U (x)) o y f mide la satisfaccin o bienestar producido por la canasta. As una funcin de utilidad tiene la o , o propiedad de que dados dos elementos x(1) y x(2) en X se cumple que U (x(1) ) U (x(2) ) s y solo s x(1) es ms atractiva que x(2) . a

2.1.4

El problema del consumidor

Cualquier consumidor se ha visto en la situacin de que sus deseos de elegir n bienes se ven frustrados o cuando decide ir de compras a un centro comercial. Esta situacin de frustacin conrma claramente o o como las preferencias individuales son afectadas por restricciones como la cantidad de dinero que se tiene para comprar los bienes. Esta situacin representa el Problema del Consumidor. o Una canasta se dene como la representacin de un vector n-dimensional x(k) de nmeros no o u negativos, donde comnmente se asume que los bienes son divisibles Un consumidor selecciona una u canasta que contiene un conjunto de bienes descritos por el vector x(k) = (x1 , x2 , .., xn ) donde xi i = 1, .., n representa la cantidad del bien i-simo en la canasta k. Las preferencias del consumidor, e sobre varias posibles canastas, se representa por la relacin de preferencias denida por la funcin de o o utilidad U (x). Asociado a cada bien i existe un precio, medido en alguna unidad monetaria pi > 0, de tal forma n que el costo de elegir xi ser pi xi . En esta medida el costo total de elegir la canasta x(k) ser i=1 pi xi . a a Asumiendo, que el consumidor tiene un presupuesto o nivel de riqueza de y unidades monetarias, el problema del consumidor en su versin bsica se dene como un problema de optimizacin de la o a o siguiente forma: max U (x)
n

sujeto a
i=1

pi xi y

(2.2)

y en su forma general de l restricciones y k funciones de utilidad, es decir el problema del consumidor en su versin multiobjetivo se expresa o max U (x) = [U1 (x), U2 (x), ..., Uk (x)]T sujeto a gi (x) yi i, i = 1..l 11

(2.3)

2.1.5

Portafolios de Inversin o

El proceso de diseo de portafolio es una instancia particular del problema del consumidor en el n mercado bursatil. Consiste en seleccionar bajo algn criterio particular, el conjunto de activos del u universo de seleccin en los cuales se va a invertir. Adicionalmente incluye la seleccin de los porcentajes o o de inversin en cada uno de los activos. Este proceso se describe como un problema de optimizacin o o multiobjetivo en el cual, el tomador de decisiones selecciona en un conjunto de soluciones dominantes, la opcin que vaya mejor con su perl. o Este proceso de seleccin de los activos incluye una fase de generacin de expectativas (preferencias o o individuales) respecto al comportamiento futuro de los activos, con la cual se dene la estrategia de inversin a seguir. Estas expectativas, de forma general se construyen desde dos puntos de vista o o esquemas de anlisis de la informacin disponible, que se conocen como Anlisis Fundamental y a o a Anlisis Tcnico. En el primero, el objetivo es establecer el precio de los activos con base en toda la a e informacin disponible en el mercado, como lo son histricos, noticias, indicadores macroeconmicos, o o o etc. En el segundo, el objetivo es encontrar tendencias de comportamiento con base en los precios histricos de los t o tulos. En la siguiente seccin se presentar mas en detalle el Anlisis Tcnico. o a a e

12

Cap tulo 3

Anlisis Tcnico a e
El comportamiento del mercado burstil se presenta como informacin disponible en diferentes formas. a o Generalmente se habla de indicadores, ndices, precios, estados nancieros, etc, pero la forma esencial de informacin disponible, son las series de tiempo que registran los valores caracter o sticos de los t tulos o activos del universo disponible. En el caso particular del mercado burstil el universo disponible a se compone de acciones. Estos valores caracter sticos representan el comportamiento diario de las especies1 como resultado de la dinmica temporal del mercado: a Precio de Apertura (YA (t)): es el valor que tiene la especie en el momento de apertura de una sesin del mercado de intercambio al cual est asociado el activo. o a Precio de Cierre (YC (t)): es el valor que tiene la especie al momento de cierre de una sesin del o mercado de intercambio al cual est asociado el activo. El precio de cierre es el valor que se toma a como referencia cuando se analiza un t tulo para efectos de diseo de portafolio. n Promedio (YP (t)): es el valor promedio de todos los precios obtenidos por una especie durante una sesin del mercado. o Mximo (Ymax (t)) y M a nimo (Ymin (t)): son los valores mximo y m a nimo que obtuvo una especie durante una sesin del mercado. o Volumen (V (t)): se mide como el producto de la cantidad por el precio de transaccin de cada o unidad. Cantidad (Q(t)): es la cantidad de acciones(unidades) de una especie particular transadas durante una sesin de mercado. o Una serie de tiempo se dene como una secuencia S de valores si indexados y ordenados por el tiempo. En el caso de las series de acciones cada si es un valor representativo de su comportamiento en el mercado, que suele llamarse precio. Estos precios son valores reales que marcan el comportamiento de una accin en un d estos precios se denen por la dinmica del mercado y son precio de cierre, o a; a precio de apertura, precio m nimo y precio mximo. Adicionalmente a los precios se utiliza tambin a e el volumen que se dene como el nmero de acciones transadas en el mercado durante el d De una u a. especie de accin (por ejemplo la accin de GOOGLE en NYSE) en particular se pueden tener m o o nimo 5 series de tiempo que describen el comportamiento de la accin 2 . De estas, la serie del precio de cierre o es la ms utilizada bajo el supuesto que este valor revela todo el ejercicio diario de los agentes del a
1 El trmino especie se utiliza para referirse a la accin que una empresa en particular registra en el mercado de bolsa e o para efectos de negociacin y transaccin. El termino accin se utilizara para referirse a las unidades de una especie en o o o particular que son negociadas. 2 Se menciona aqu que m nimo 5 series, porque en el anlisis tambin se utilizan los indicadores tcnicos o los a e e retornos, que son funciones de transformacin de los precios que a su vez son tambin series de tiempo. o e

13

mercado. Las series de tiempo nancieras son especialmente reconocidas por la motivacin econmica o o que sugieren (adquisicin de riqueza) y por un conjunto de caracter o sticas propias. De acuerdo con la informacin que se utiliza en el proceso de anlisis de las series nancieras, el tomador de decisiones o a puede abordar el problema desde la ptica del Anlisis Fundamental, el Anlisis Tcnico o una mezcla o a a e de ambas. El Anlisis Fundamental utiliza toda la informacin disponible y existente como por ejemplo, a o indicadores macroeconmicos, estados nancieros de las compa noticias y fundamentales. En esta o nas, medida el objetivo es con base en toda esa informacin calcular el valor que debe tener una accin. o o El Anlisis Tcnico solo utiliza como informacin disponible los precios histricos de las acciones. El a e o o ejercicio de este tipo de anlisis consiste en pronosticar el precio de las acciones con base en grcas a a e indicadores tcnicos. Tres supuestos estructuran el esquema terico a partir del cual se construye el e o anlisis tcnico: a e El precio revela toda la informacin del mercado. o Los precios se mueven en tendencias. La historia del mercado se repite. Como el precio reeja toda la informacin que lo puede afectar (noticias, fundamentales, indio cadores macroeconomicos, demanda, oferta, etc), para efectos de predecir el comportamiento del mercado solo se requiere entonces el estudio de los precios histricos de las acciones. Como estos precios o se mueven en tendencias, el uso de grcas proporciona un mecanismo a travs del cual el tomador a e de decisiones identica tendencias de los precios para ejecutar las estrategias de compra/venta en el sentido de esas tendencias. Adicionalmente, la psicolog del mercado se revela en el comportamiento a histrico que puede ser representado a travs de patrones grcos. El acervo de conocimiento del o e a anlisis tcnico presenta un conjunto de patrones que han sido identicados y categorizados en el a e pasado. Estos patrones son propios del tipo de grca que utiliza el tomador de decisiones. En el a anlisis tcnico se utilizan cuatro tipos de grcas que son: grca de l a e a a neas, grca de barras, grca a a de puntos y guras, y candlesticks.

3.1

Candlesticks

Las grcas y los indicadores tcnicos son las herramientas fundamentales que los seguidores del a e Anlisis Tcnico usan con el objetivo de predecir el comportamiento futuro del mercado. Las grcas a e a proporcionan una representacin visual de los precios caracter o sticos de las acciones (apertura, cierre, mximo, m a nimo), mientras que los indicadores tcnicos son medidas del comportamiento del mercado. e Las grcas de l a nea presentan solo un precio caracter stico, que generalmente es el precio de cierre. Si el analista desea visualizar otro valor, debe entonces pintar otra serie de tiempo en el grca. Estas a son utilizadas tambien para visualizar el comportamiento de indicadores tcnicos a lo largo del tiempo e (Figura 3.1). Las grcas de barras presentan en un sola gura los precios de cierre, mximo y m a a nimo; si el precio de apertura es disponible suele pintarse tambin. Se llama de barras, porque una l e nea vertical es utilizada para representar el rango de precios entre el mximo y el m a nimo. Los precios de cierre y apertura se pintan como una pequea marca horizontal sobre la barra vertical, que van hacia hacia n la derecha y la izquierda respectivamente (Figuras 3.2 y 3.4). Los Candlesticks (Figura 3.3 ) son la versin Japonesa de las grcas de barras. La diferencia entre o a ambos tipos de grcas, radica en que los candlesticks visualmente proporcionan ms informacin, en a a o la medida que es ms clara la diferencia y la direccin del cambio entre los precios de cierre y apertura. a o El cuerpo de los candlesticks es un rectangulo que representa el rango denido por los precios de cierre y apertura. En el caso que el precio de apertura es mayor, el cuerpo es de color negro, en caso contrario el cuerpo es blanco (Figura 3.4). Adicionalmente los precios mximo y m a nimo son representados como barras verticales que salen del cuerpo. 14

Figura 3.1: Google Precio de cierre - Grca de l a nea

Figura 3.2: Google - Grca de barras a

Si el precio revela todo y el mercado se mueve en ciclos el ocio de los analistas tcnicos es ree conocer las relaciones existentes entre los precios, el tiempo y los datos historicos. En esta medida los candlesticks son la herramienta preferida a la hora de reconocer patrones porque permiten identicar el comportamiento de los mercados y la psicolog de los tomadores de decisiones mediante conguraa ciones espec cas de los precios de las acciones. Estas conguraciones son denominadas formas bsicas a y se reconocen como guras con cuerpo y colas particulares(Figura 3.5): Marubozu (1). Long days (2). 15

Figura 3.3: Google - Candlestick

Figura 3.4: Barras vs Candlestick

Long lower shadow (3). Shaven Head (4). Hanging Man (5). Hammer (6). Spinning Top (7). Inverted Hammer (8). Shooting Star (9). Shaven Bottom (10). Long upper shadow (11). Dojis (12): neutral, long legged, Dragony doji, Gravestone doji. 16

Figura 3.5: Basic Candlesticks

Una coleccin secuencial de formas bsicas se dene como un patrn candlestick que representa el o a o comportamiento de los agentes del mercado y la mentalidad de los tomadores de decisiones. Un patrn o se describe por la secuencia de formas bsicas asociadas, la posicin relativa de estas en la secuencia, a o y el estado de la naturaleza asociado. Estos estados de la naturaleza describen el comportamiento asociado al patrn, es decir su naturaleza de ruptura o continuacin de la tendencia posterior a la o o secuencia. Estos patrones son reconocidos de forma visual con base en reglas que generalmente se expresan en lenguaje natural, y forman parte del acervo de conocimiento del anlisis tcnico y sus a e seguidores. Las reglas se usan tanto en el proceso de identicacin de las formas individuales como o patrones espec cos. En el caso de identicacin de formas bsicas, se denen utilizando relaciones o a de magnitud de las partes de la forma: cuerpo, cola(sombra) superior y cola (sombra) inferior. Un ejemplo de estas reglas es : si la cola superior es muy pequea o pequea, el cuerpo es pequeo, y n n n la cola inferior es larga, la gura bsica es entonces un hammer (ver Figura 3.5). En el caso de los a patrones las reglas se denen utilizando posiciones relativas entre una secuencia de forma bsica que a tiene un estado de la naturaleza asociado. En el marco de trabajo del anlisis tcnico, estos patrones han sido observados a lo largo del a e tiempo y algunos han sido catalogados debido a su ocurrencia frecuente y la implicacin de estos en el o comportamiento futuro del mercado. Las guras 3.7 y 3.6 presentan ejemplos de patrones de ruptura y patrones de continuacin respectivamente. o Los patrones de ruptura de tendencia, que aparecen en la Figura 3.7 son: Eveninng star (1), Morning star (2), Rising three methods (3), Inverted hammer (4), Engulng (5), Abandoned baby(6), Unique three river (7), Three stars in the south (8), Breakaway (9), Concealling baby swallow (10). Los patrones de continuacin , que aparecen en la Figura 3.6 son: o Upside tasuki gap (1), Downside tasuki gap (2), Side by side white lines + (3), Side by side white lines - (4), Three line strike + (5), Three line strike - (6). Para una referencia completa del catlogo de patrones ver [60]. a

17

Figura 3.6: Patrones de ruptura

Figura 3.7: Patrones de continuacin o

18

Parte II

Modelo Propuesto para Soporte al Proceso de Seleccin de Portafolio o

19

The rst step in forecasting the business or economic future consists, thus of gathering observations from the past. Freund John E and Frank J Williams, Modern business Satistics

21

Cap tulo 4

Modelo Propuesto
En materia de esfuerzos computacionales para generacin de expectativas para diseo de portafolios de o n inversin, varios enfoques y tcnicas han sido utilizadas. La mayoria de los esfuerzos de investigacin se o e o han orientado a modelos para prediccin (forecasting), aproximacin de funciones y regresin clsica o o o a sobre series de tiempo con el precio de cierre o indicadores tcnicos. En [53] (Ver Apndice A) se e e presenta un estado del arte de tcnicas computacionales aplicadas a generacin de expectativas. e o Desafortunadamente, los trabajos orientados a generacin de expectativas solo se han enfocado o en la informacin presente en el precio de cierre y algunos indicadores, a pesar de que en el mundo o real del anlisis tcnico el ejercicio diario se basa en el anlisis de grcas de candlesticks y en la a e a a identicacin de patrones que llevan a la denicin de estrategias de inversin. o o o Los patrones candlesticks se han denido bajo un catlogo elaborado con base en la observacin a o histrica de los mercados. Esta observacin incluye el anlisis de grandes volumenes de informacin que o o a o son las series de tiempo histricas de las acciones o t o tulos en un mercado. Mltiples preguntas aparecen u en torno a la validez estad stica de estos patrones y la completitud y correctitud del catlogo actual. a En general, aqu nace el inters para la identicacin de patrones candlesticks de forma autmatica, e o o usando tcnicas propias de la miner de datos, desde un punto de vista exploratorio y de conrmacin e a o de los supuestos del anlisis tcnico. a e Dadas las caracter sticas propias del proceso de reconocimiento de patrones candlesticks, el modelo propuesto en esta tesis tiene tres fases que son las siguentes: Identicacin de formas bsicas y codicacin de series de tiempo en una serie o a o simblica. El objetivo de esta fase es obtener una representacin simblica de las series de o o o tiempo de los precios de los t tulos. La representacin simblica es una serie que representa los o o candlesticks que se obtienen a partir de los precios reales. Esta representacin depende de los o parmetros seleccionados por el usuario para efectos de la codicacin a o Generacin de expectativas para Dise o de portafolio. Con las series simblicas de los o n o t tulos seleccionados, se construye un catlogo histrico de patrones, con base en las parmetros a o a de construccin de patrones, seleccionados por el usuario. Para construir el catlogo se recorren o a todas las series simblicas, se extraen las secuencias y se identica el estado de la naturaleza o asociado con cada secuencia. Dise o de portafolio. Para un d de anlisis seleccionado, se identican las secuencias reales n a a de ese d y se buscan en el catlogo las secuencias cuyo estado con mayor probabilidad de a a ocurrencia este asociado a un estado de mercado creciente (bull).

4.1

Modelo Identicacin Formas Bsicas o a

La identicacin de formas bsicas se aborda como un proceso t o a pico de clasicacin, que en la vida o real es un proceso de reconocimiento visual de patrones, realizado por el tomador de decisiones, con 23

Figura 4.1: Sistema clasicador difuso

base en reglas que generalmente se expresan en lenguaje natural. Estas reglas se denen utilizando relaciones de magnitud de las partes que tiene la forma bsica: cuerpo, cola(sombra) superior y cola a (sombra) inferior. Un ejemplo de estas reglas es : si la cola superior es muy pequea o pequea, el n n cuerpo es pequeo, y la cola inferior es larga, la gura bsica es entonces un hammer (ver Figura 3.5). n a Es decir el universo del discurso que dene los patrones bsicos es cualitativo, y para efectos de su a implementacin computacional se requiere entonces de una tcnica capaz de manejar informacion de o e este tipo, es decir que permita la implementacin de un modelo denido con informacin cualitativa. o o Con base en esto se dene para el modelo propuesto, la tarea de identicacin de formas bsicas o a como un proceso de clasicacin difuso, de tal forma que el mecanismo de razonamiento natural o denido a travs de reglas, se implemente computacionalmente a travs de razonamiento difuso. La e e arquitectura del sistema clasicador difuso se presenta en la Figura 4.1. A continuacin se describen o cada uno de sus componentes.

4.1.1

Fuzzicador

Las entradas al fuzzicador son las series de tiempo de los valores caracter sticos, de tal forma que una entrada individual es formada por los 4 valores de los precios. Las reglas difusas son evaluadas sobre las magnitudes que representan una forma bsica: tamao del cuerpo, tamao de la sombra superior a n n y tamao de la sombra inferior. Estas medidas se denen de la siguiente forma: n body = |open close|/|high low| (4.1)

upShadow

|high open|/|high low|, open > close |high close|/|high low|, e.o.c

(4.2)

lowShadow

|close low|/|high low|, open > close |open low|/|high low|, e.o.c

(4.3)

Una forma bsica se representa entonces como la tripla C = (body, upShadow, lowShadow) con a base en las deniciones dadas en las ecuaciones (4.1),(4.2) y (4.3). Cada tripla Ci ser evaluada a con base en los conjuntos difusos propios del problema, que sern aplicados a las magnitudes de a la forma bsica. En el caso particular de este modelo se denen cinco conjuntos difusos que son a 24

Figura 4.2: Conjuntos difusos

veryshort, short, medium, long, verylong. Las funciones de pertenencia de los conjuntos difusos son las siguientes (ver Figura 4.2): veryshort (x) = 1 20x, x 0,05 0, x > 0,05 (4.4)

short (x)

x 0,1 10x, 1, 0,1 < x 0,3 = 2,5 5x, 0,3 < x 0,4 0, x > 0,4 0, 10x 3, = 1, 7 10x, 0, 5x 2,5, = 1, 1 10x, x 0,3, x > 0,7 0,3 < x 0,4 0,4 < x 0,6 0,6 < x 0,7 x 0,5 0,5 < x 0,7 0,7 < x 0,9 x > 0,9

(4.5)

medium (x)

(4.6)

long (x)

(4.7)

verylong (x)

0, x 0,9 10x 9, x > 0,9

(4.8)

4.1.2

Inferencia y reglas

El universo de reglas disponibles est denido por la cantidad de formas bsicas que sirven como a a clases para el sistema. En esta medida se tiene una regla por cada forma bsica (ver Figura 3.5). Estas a reglas son de la forma IF x is Ai and y is B i THEN z = ci con A y B conjuntos difusos y c un valor real (singleton difuso) para todo i = 1, 2, ..., r. Este tipo de reglas son usadas en un mtodo de razone amiento difuso conocido como mtodo de consequente simplicado en la medida que el consequente e se dene como una asignacin a una clase y no a un conjunto difuso. Para efectos de evaluacin de o o los antecedentes de las reglas se utiliza el operador min entre las variables :

25

wj = Aj (x) B j (y) = min(Aj (x), B j (y))) As cada wj representa el valor o pertenencia de una tupla Ci para la la regla j. La regla con el mayor valor wj es la regla ganadora, es decir, la que dene la clase que ser asignada a la tupla. El a conjunto de reglas se presenta a continuacin: o 7. IF (body is short and upShadow is medium and lowShadow is medium) or ( body is short and upShadow is short and lowShadow is medium) or (body is short and upShadow is medium and lowShadow is short) THEN c = 7 (SPINNING-TOP)

1. IF body is verylong and upShadow is veryshort and lowShadow is veryshort THEN c = 1 (MARUBOZU)

2. IF body is long and upShadow is short and lowShadow is short THEN c = 2 (LONG)

3. IF body is medium and upShadow is short and lowShadow is medium THEN c = 3 (LONGLOWER-SHADOW)

8. IF body is short and upShadow is long and lowShadow is short THEN c = 8 (INVERTEDHAMMER)

4. IF (body is long and upShadow is veryshort and lowShadow is short) or (body is medium and upShadow is veryshort and lowShadow is medium) THEN c = 4 (SHAVEN-HEAD)

9. IF body is short and upShadow is long and lowShadow is veryshort THEN c = 9 (SHOOTING-STAR)

5. IF body is short and upShadow is veryshort and lowShadow is long THEN c = 5 (HANGINGMAN)

10. IF (body is long and upShadow is short and lowShadow is veryshort) or (body is medium and upShadow is medium and lowShadow is veryshort) THEN c = 10 (SHAVEN-BOTTOM)

6. IF body is short and upShadow is short and lowShadow is long THEN c = 6 (HAMMER)

11. IF body is medium and upShadow is medium and lowShadow is short THEN c = 11 (LONG-UPPER-SHADOW)

12. IF body is veryshort THEN c = 12 (DOJI) Para efectos de asignacin de la clase a una tripla (body,upperShadow, lowerShadow), se evalua o la tripla con todas las reglas del motor de inferencia y se asigna la clase de la regla con mayor valor wj . En este caso particular, la defuzzicacion simplemente consiste en convertir el nmero de la clase u (denido por el valor c de la regla ganadora) a su cadena identicadora respectiva, es decir si la clase de la regla ganadora es 1 el sistema retornar que las variables corresponden a una forma bsica a a denominada MARUBOZU (Ver Tabla 4.1 y Figura 3.5). 26

Tabla 4.1: Candlesticks FORMA MARUBOZU LONG LONG LOWER SHADOW SHAVEN HEAD HANGING MAN HAMMER SPINNING TOP INVERTED HAMMER SHOOTING STAR SHAVEN BOTTOM LONG UPPER SHADOW DOJI Valor 1 2 3 4 5 6 7 8 9 10 11 12 Cadena corta M L LLS SH HM H ST IH SS SB LUS D

4.1.3

Otros esquemas de representacin o

Adicional al esquema principal de representacin que son los candlesticks, se plantean otras formas de o representacin que se basan tambin en la forma natural de reconocimiento de patrones que realizan o e los analistas tcnicos. Esos esquemas adicionales son los siguientes: e Cuerpo: una forma bsica se representa por el tamao del cuerpo que puede ser Long o Short. a n Cuerpo y sombras: una forma bsica se representa por la tripla (upperShadowSize, bodySize, a lowerShadowSize). As una forma de tipo Hammer que tiene una sombra superior corta, un cuerpo corto y una sombra inferior larga, se representa por la cadena SSL. Para efectos de denicin de los tamaos propios de cada forma bsica en el modelo se utiliza la o n a tabla 4.2. Tabla 4.2: Candlesticks y tamaos n FORMA MARUBOZU DOJI HAMMER HANGING MAN INVERTED HAMMER LONG LONG LOWER SHADOW LONG UPPER SHADOW SHAVEN BOTTOM SHAVEN HEAD SHOOTING STAR SPINNING TOP SOMBRA SUPERIOR short long short short long short short long short short long long CUERPO long short short short short long short short long long short short SOMBRA INFERIOR short long long long short short long short short short short long

4.1.4

Extensiones de los esquemas de representacin o

Cada forma bsica reconocida, puede tener infomacin adicional que contribuye al proceso de rea o conocimiento de los patrones. Con el objetivo de evaluar experimentalmente como la informacin o 27

disponible inuye el proceso, se denen las siguientes extensiones que pueden ser usadas de forma adicional al esquema de representacin seleccionado: o Color: de acuerdo con la diferencia entre el valor de cierre y el de apertura se asigna el color a la forma; si (open close) 0 entonces el cuerpo es negro(B), en caso contrario el cuerpo es blanco(W). Posicin relativa: bajo el supuesto que, la ubicacin relativa de una forma bsica respecto a o o a su predecesora inuye en el proceso de conrmacin de un patrn se dene la posicin relativa o o o de acuerdo con regiones denidas por las partes de una forma bsica. Estos puntos son mximo, a a cierre, promedio, apertura y m nimo para el caso de formas negras, y mximo, apertura, promea dio, cierre y m nimo para el caso de formas blancas. Con estos 5 puntos se establecen 6 regiones (A,B,C,D,E,F) y la posicin relativa es el rango de regiones que ocupa una forma respecto a su o predecesora (Ver Figura 4.3 ).

Figura 4.3: Posicin relativa o

Los esquemas de representacin planteados, sern utilizados para efectos de trasformar las series o a de tiempo de los precios en una serie simblica de patrones. En la Tabla 4.3 se presentan ejemplos o de como un patrn es codicado con los diferentes esquemas de representacin. El patrn en la gura o o o de la tabla 4.3, tiene un Long negro, un Hammer blanco y un Marubozu negro. El Hammer esta en posicin relativa A con respecto al Long, y el Marubozu en posicin EF con respecto al Hammer. o o

4.2

Modelo para Generacin de Expectativas o

Una expectativa se expresa como una regla, donde el antecedente es un patrn o secuencia de formas o bsicas, y el consecuente un estado de la naturaleza. Estos estados de la naturaleza son una expresin de a o 28

Tabla 4.3: Ejemplos esquemas de representacin o


Patrn o Esquema Cuerpo Bsico a L, S, L Bsico + color a L-B, S-W, L-B Bsico + pos a L, S-A, L-EF Bsico + color + pos a L-B, S-W-A, L-B-EF

Cuerpo+sombras

SLS, SSL,SLS

SLS-B, SSL-W, SLS-B

SLS, SSL-A, SLS-EF

SLS-B, SSL-W-A, SLS-B-EF

Candlesticks

L, H, M

L-B, H-W, M-B

L, H-A, M-EF

L-B, H-W-A, M-B-EF

cambio o continuacin de la tendencia de la accin que expresa el patrn 1 , y se denen a continuacin: o o o o Continuation bear: indica que al nalizar el patrn, la tendencia es de ca del mercado, si o da la tendencia antes de la ocurrencia del patrn era tambien ca o da. Continuation bull: indica que al nalizar el patrn, la tendencia es de subida del mercado, si o la tendencia antes de la ocurrencia del patrn era tambien subida. o Reversal bear: indica un punto de ruptura de la tendencia del mercado al nalizar el patrn, o cuya conrmacin se da porque la tendencia pasada era de ca o da. Reversal bull: indica un punto de ruptura de la tendencia del mercado al nalizar el patrn, o cuya conrmacin se da porque la tendencia pasada era de subida. o Para generar entonces las expectativas es necesario construir un catlogo de patrones a partir de a las series simblicas, de tal forma que para un conjunto de activos seleccionados en un dia anlisis o a espec co, el tomador de decisiones pueda identicar los posibles estados de la naturaleza asociados a cada activo, mediante la bsqueda en el catlogo. Es decir, para los activos seleccionados, se identican u a las secuencias de formas bsicas que terminan en el d de anlisis y tienen un tamao denido por a a a n el usuario. Asumiendo que estas secuencias denen el estado del mercado y por lo tanto pueden ser patrones que ya se presentaron en el pasado, se buscan en el catlogo con el n de identicar los a estados de la naturaleza asociados con cada secuencia y las probabilidades de ocurrencia de estos estados. Estas secuencias y sus estados de la naturaleza representan las expectativas que el tomador de decisiones usar para reducir el universo disponible de activos que conformarn el portafolio. Por a a ejemplo, para el activo Exxon el d 20 de agosto de 2007 se presenta una secuencia de tamao dos a n con la forma [ L-W , ST-W-AD ] y una tendencia pasada de crecimiento. Al buscar la secuencia en el catlogo, se encuentra ese patrn con los estados continuation bull y reversal bull, con probabilidades a o de ocurrencia 60 % y 40 % respectivamente. El proceso de catalogacin de patrones involucra tres elementos que son: la ventana de seleccin o o o tamao del patrn, las formas bsicas, y la conrmacin a travs de las tendencias pasada y futura del n o a o e patrn. Si bien la literatura (ver [60]) reporta un conjunto de patrones identicados por observacin, o o en este modelo se pretende aprovechar el volumen de informacin disponible y explorar el conjunto o de patrones que se puedan encontrar en un mercado particular. La estrategia para la construccin o del catlogo de patrones consiste en recorrer el conjunto de datos, para extraer las secuencias de a candlesticks en las series mediante ventanas secuenciales. Si la serie tiene 1000 datos y el tamao n seleccionado para los patrones es 2, de la serie se extraern 999 secuencias de tamao 2. De forma a n general, el nmero de secuencias de tamao w a extraer de un serie de n datos es igual a n (w 1). u n Junto con cada secuencia se debe identicar el estado de la naturaleza asociado con ella, el cual se describe por las tendencias pasada y futura de la secuencia (Ver Figura 4.4). El grupo de los datos seleccionados para estimar la tendencia pasada son los t dias anteriores al dia de inicio de una secuencia; para el caso de la tendencia futura son los t dias posteriores al dia de nalizacin de la o secuencia.
1 Estos estados de la naturaleza se aplican para una accin individual y son el insumo para el proceso de dise o de o n portafolio.

29

Figura 4.4: Secuencia y estado

Tabla 4.4: Estados de la naturaleza Estado Pasado Futuro Figura

Continuation bull

Bull

Bull

Continuation bear Reversal bull Reversal Bear

Bear Bull Bear

Bear Bear Bull

Las tendencias se estiman mediante una regresin lineal de la forma yi = + x (donde repo resenta la tendencia) que se aplica sobre los datos representativos de cada tendencia. Estos datos representativos son el precio promedio de cada d En el caso que > 0 se dene la tendencia como a. bull, si < 0 se dene la tendencia como bear, y en caso contrario se dene como side o indecisin . o En esta medida, con la tendencia pasada y futura de cada secuencia se dene el estado asociado, de acuerdo con la Tabla 4.4. Cuando ya se tiene el conjunto de patrones con sus respectivos estados de la naturaleza, se construye el catlogo como un diccionario de todas las secuencias encontradas en el a conjunto de datos. El catlogo de patrones se elabora como un rbol de prejos. Un rbol de prejos es una estructura a a a de datos que se utiliza como arreglo asociativo, donde las llaves o ndices se representan como cadenas. Un camino particular de la ra hasta un nodo padre de hojas del rbol, es la llave, y las hojas de ese z a camino representan los valores que se asocian a esa llave. En este tipo de rbol, el nodo ra es vac a z o, y cada nodo representa un caracter o una subcadena de la llave. Para el caso particular del catlogo a de patrones propuesto, cada nodo del rbol representa una forma bsica codicada, y las hojas son a a los estados de la naturaleza con el nmero de veces que ocurre cada estado, para un camino de nodos u que va desde la raiz hasta cada padre de ojas. En la Figura 4.5 se presenta un rbol de prejos para a patrones de tamao 2 y representacin bsica de candlesticks. En esta gura se resalta un camino que n o a representa el patrn [L, HM], el cual tiene 10 ocurrencias para el estado cont. bull y 50 ocurrencias o para el estado cont. bear. El orden de complejidad de los procesos de actualizacin, bsqueda e insercin en el rbol tienen o u o a como cota superior O(n) donde n es el nmero de llaves y como cota inferior (w) donde w es el u 30

Figura 4.5: Arbol de prejos

tamao del patrn. Segn esto, el uso de una tabla hash tendr mejor desempeo y realizar la misma n o u a n a funcin. Pero el uso del rbol de prejos como diccionario de patrones radica en que la estructura de o a a rbol proporciona las siguientes caracter sticas: En cada nodo se puede almacenar informacin adicional como el nmero de hojas que descienden o u de cada nodo o valores particulares de la medidas de inters para el camino que llega al nodo. e Facilita el clculo de medidas de inters cmo el soporte, la conanza y la entrop Si las a e o a. expectativas se van a generar a travs del catlogo, en algunos casos va ser necesario podar o e a poblar el rbol con reglas (caminos sobre el rbol) con cierto inters denido por esas medidas a a e particulares. Reduce el almacenamiento, en la medida que todos los descendientes de un nodo tienen como prejo comn el camino del cual son hijos. u Como cada nodo tiene un conteo de sus hijos, se puede saber cuantos patrones incluyen la secuencia o prejo denido por un camino que va desde la ra hasta el nodo. z

4.2.1

Algoritmo generacin de expectativas o

Los pasos para la generacin de expectativas son los siguientes: o 1. Seleccionar el conjunto de activos a analizar (S) 2. Seleccionar el esquema de codicacin a utilizar (R), el tamao del patrn (w) y el tamao de o n o n la tendencia (t). 3. Seleccionar el d de anlisis (d), es decir el d para el cual se van a generar las expectativas. a a a 31

4. Codicar las series del conjunto de activos seleccionado, usando el esquema de codicacin y o los tamaos de ventana y tendencias escogidos. La codicacin se hace con los precios que van n o hasta el dia de anlisis inclusive. a 5. Construir el catlogo de patrones, extrayendo de las series codicadas las secuencias de tamao a n w y las tendencias asociadas. Con base en las tendencias se determina el estado de la naturaleza de cada secuencia. Una secuencia y su estado son un patrn. o 6. De las series codicadas se extraen los patrones o secuencias que nalizan en el d de anlisis. a a 7. Buscar en el catlogo de patrones las secuencias extraidas en el paso anterior y consultar en a en el rbol los nodos hojas asociadas con las secuencias, es decir los estados de la naturaleza a asociados. Las secuencias extraidas y los estados asociados(con su respectiva probabilidad de ocurrencia) son las expectativas generadas. A continuacin se plantea con base en funciones, el proceso para generacin de expectativas descrito o o anteriormente: Dado un conjunto S secuenciado por el tiempo donde cada Si es una tupla de la forma Q = {open, close, high, low}, w es el tamao del patrn, t la longitud de la tendencia (pasado y futuro) y n o R el esquema de representacin seleccionado, el algoritmo general para construccin del catlogo de o o a patrones es el siguiente: funcion construirCatalogo(S, w, t, R) 1. 2. 3. 4. S = extraerV entanas(S, w) P = codif icar(S , R, t) T = construirArbolP ref ijo(P ) retornar T

n-funcion Teniendo la secuencia S de tuplas Q, el primer paso es construir una coleccin de subsecuencias o de S con tamao w (funcin extraerV entanas). Estas subsecuencias luego son codicadas de acuerdo n o con el tipo de representacin elegida; este paso incluye identicar las tendencias pasada y futura del o patrn para denir el estado de la naturaleza asociado con la secuencia (funcin codif icar). o o Las expectativas se generan para un dia de anlisis, basndose en el catlogo de patrones, construido a a a a partir del universo de datos seleccionado por el tomador de decisiones. Ese dia de anlisis dene el a n de un patrn y el objetivo es entonces identicar ese patrn y buscar los estados de la naturaleza o o asociados a este, usando el catlogo. Si d es el d de anlisis, la siguiente funcin describe de forma a a a o general el proceso: funcion generarExpectativas(S, w, t, R, d) 1. 2. 3. 4. T = construirCatalogo(S, w, t, R) q = codif icarP atron(S, d, w, R, t) E = encontrarHojas(T, q) retornar E

n-funcion La funcin codif icarP atron construye un patrn q a partir del conjunto disponible S, el dia de o o anlisis seleccionado, el tamao de ventana w, el tipo de representacin R y la longitud de la tendencia a n o t. La funcin encontrarHojas retorna el conjunto de hojas (estados de la naturaleza) del rbol T , o a que corresponden al patrn q y su tendencia. o 32

4.2.2

Extraccin reglas interesantes o

Cada regla o expectativa representa un patrn o secuencia de formas bsicas y su asociacin a uno o o a o varios estados de la naturaleza. Una regla es vlida y proporciona informacin si y solo si est asociada a o a en gran parte a un solo estado, es decir una regla que el 50 % de las veces que ocurre representa un continuation-bear y que el otro 50 % representa un reversal-bear no tiene sentido porque no proporciona informacin al tomador de decisiones. En esta medida es necesario denir una medida que permita o seleccionar reglas interesantes desde el punto de vista de calidad de informacin. o La entrop desde el punto de vista de la teor de la informacin se dene como una medida de a a o la incertidumbre asociada con una variable aleatoria. A mayor incertidumbre menor la informacin o contenida, y a menor incertidumbre mayor la informacin proporcionada por la variable. Si pi es la o probabilidad de ocurrencia de un evento i, y la sumatoria de todos los pi para los eventos posibles es igual a 1, la entrop se dene mediante la siguiente ecuacin: a o
n n

H(p1 , p2 , .., pn ) =
i=1

pi log(1/pi ) =
i=1

pi log(pi )

(4.9)

Para el caso particular de las reglas generadas en el catlogo de patrones, el objetivo es entonces a marcar como interesantes solo aquellas que proporcionen la mayor informacion es decir aquellas con la menor entrop idealmente aquellas con entrop cero o muy cercana a cero. Si los eventos son cada a, a uno de los estados de la naturaleza a los cuales est asociada una regla o expectativa, a continuacin a o se dene la entrop para una regla: a

p1 p2 p3 p4 p5 H

:= probabilidad de ocurrencia del estado continuation bear := probabilidad de ocurrencia del estado continuation bull := probabilidad de ocurrencia del estado reversal bear := probabilidad de ocurrencia del estado reversal bull := probabilidad de ocurrencia del estado indecisin o = p1 log5 (1/p1 ) + p2 log5 (1/p2 ) + p3 log5 (1/p3 ) + p4 log5 (1/p4 ) + p5 log5 (1/p5 )

(4.10)

En este caso se utiliza logaritmo en base 5 para que el m nimo sea cero y el mximo sea 1. a

4.3

Seleccin de Activos para Dise o de Portafolio o n

El modelo de diseo propuesto se basa en la generacin de expectativas presentadas en la seccin n o o anterior. Asumiendo el supuesto en el cual no son permitidas las posiciones cortas (es decir porcentajes de inversin menores que cero), el objetivo es tomar del universo de seleccin, aquellos activos que o o esten asociados con una tendencia futura de crecimiento, es decir, aquellos activos que para el d a de portafolio seleccionado tengan asociados los estados de continuation bull o reversal bear con una probabilidad superior a un umbral dado. Por ejemplo si para un activo la tendencia pasada es bear, solo seria seleccionado si cambia su tendencia a bull, o si la tendencia pasada es bull se selecciona solo si su tendencia se va a mantener. Este esquema de seleccin corresponde a un perl de tomador de o decisiones amante o indiferente al riesgo en el cual los altos retornos son el objetivo sin tomar muy en cuenta el riesgo, y el horizonte de inversin es corto, es decir d a d porque los candlesticks o a a, proporcionan una visin del comportamiento a corto plazo de los activos. o Los pasos para ejecutar el modelo de diseo de portafolio propuesto son los siguientes: n 1. Seleccionar el conjunto de activos a analizar (S) 2. Seleccionar el esquema de codicacin a utilizar (R), el tamao del patrn (w) y el tamao de o n o n la tendencia (t). 33

3. Seleccionar el d de anlisis (d), es decir el d para el cual se van a generar las expectativas. a a a 4. Codicar las series del conjunto de activos seleccionado, usando el esquema de codicacin y o los tamaos de ventana y tendencias escogidos. La codicacin se hace con los precios que van n o hasta el dia de anlisis inclusive. a 5. Construir el catlogo de patrones, extrayendo de las series codicadas las secuencias de tamao a n w y las tendencias asociadas. Con base en las tendencias se determina el estado de la naturaleza asociado. 6. De las series codicadas se extraen los patrones o secuencias que nalizan en el d de anlisis. a a 7. Buscar en el catlogo de patrones las secuencias extraidas en el paso anterior y consultar en a en el rbol los nodos hojas asociadas con las secuencias, es decir los estados de la naturaleza a asociados. Las secuencias extraidas y los estados asociados(con su respectiva probabilidad de ocurrencia) son las expectativas generadas. 8. Del conjunto de expectativas generadas, seleccionar aquellas que proporcionen una perspectiva de crecimiento del activo. Para esto se debe identicar la tendencia pasada real de cada una de las secuencias extraidas en el paso 6. Si la tendencia pasada es bull se debe seleccionar la secuencia solo si la expectativa asociada dice que el estado de mayor ocurrencia es Continuation bull. Si la tendencia pasada es bear se debe seleccionar la secuencia si la expectativa asociada dice que el estado de mayor ocurrencia es Reversal bear. El activo se selecciona si la probabilidad de ocurrencia de estado que representa la expectativa creciente, es superior a un umbral denido por el usuario, el cual debe ser mayor a 0.5. 9. Como para cada activo hay una expectativa, las expectativas seleccionadas en el paso anterior denen los activos que sern utilizados en la construccin del portafolio. Con estos activos ya a o le corresponde al tomador de decisiones seleccionar los porcentajes de inversin que mejor se o acomodan a su peril de riesgo.

34

Parte III

Experimentacin y Anlisis de Resultados o a

35

The illusion of randomness gradually disappears as the skill in chart reading improves. J Murphy

37

Cap tulo 5

Experimentacin o
Adicionalmente al proceso de desarrollo, se realiz un proceso de experimentacin orientado a validar o o el modelo propuesto, en sus fases de identicacin de formas bsicas y generacin de expectativas. A o a o continuacin se describe el conjunto de datos utilizado, se presenta el diseo experimental propuesto o n y se analizan los resultados obtenidos.

5.1

Conjunto de Datos

El conjunto de datos se construye con los datos histricos de series de acciones reales, que transan en o la bolsa de acciones de Nueva York (NYSE). El periodo de tiempo seleccionado va desde el 2 de enero de 1962 hasta el 20 de septiembre de 2007 y en total se seleccionaron 30 series de forma aleatoria. Cada serie est formada por cuatro atributos que son la fecha, el precio de apertura, el precio mximo, el a a precio de cierre y el precio m nimo. La Tabla 5.1 presenta las series seleccionadas que en total suman 4 series (una serie por precio) con 214781 instancias cada una.

5.2

Dise o Experimental n

El diseo experimental se estructura en torno a cuatro fases de experimentacin, que son las siguientes: n o clasicacin, validacin de candlesticks, catlogo de patrones y seleccin de activos. o o a o

5.2.1

Fase 1 - Clasicacin o

El objetivo de esta fase es validar el sistema clasicador difuso propuesto en, el proceso de reconocimiento de formas bsicas (candlesticks). Para este caso particular se realizarn dos grupo de a a experimentos utilizando el prototipo PDM-Candles: Grupo 1: en este grupo se utilizar el clasicador difuso para un conjunto reducido de reglas y a para el conjunto completo de reglas, con el n de identicar sobre todo el conjunto de datos, el porcentaje de instancias no clasicadas, es decir etiquetadas con la clase undened. El conjunto reducido tiene las reglas para clasicar MARUBOZU, LONG, DOJI y SPINNING TOP. Grupo 2: utilizar el sistema clasicador difuso para reconocer formas bsicas en un subconjunto a del conjunto de datos y luego validar la clasicacin contra las clases reales (etiquetadsa mano ualmente). Para esta caso se selecciona entonces una muestra de 5000 registros de la serie AAPL (Apple), que van desde el 2 de enero de 1962 hasta el 3 de diciembre de 1981. 39

Tabla 5.1: Conjunto de datos Compa na 3 M. Apple Inc. Abbott Laboratories AMR Corporation Alltel Corp. British Airways ADR Continental Airlines, Inc. Cott Corp. Cadbury Schweppews plc Diageo plc Ford Motor Co. General Motors Corporation Honda Motor Co. Ltd. Honeywell International Inc. Hewlett-Packard Co. International Business Machines Corp. Johnson and Johnson Coca-Cola Co. Southwest Airlines Co. Merck & Co. Inc. Microsoft Corporation Pepsico, Inc. Pzar Inc. Schering-Plough Corp. AT&T Inc. Toyota Motor Corp. Tyco International Ltd. United Technologies Corp. Exxon Mobil Corp. Verizon Communications Inc. S mbolo MMM AAPL ABT AMR AT BAIRY.PK CAL COT CSG DEO F GM HMC HON HPQ IBM JNJ KO LUV MRK MSFT PEP PFE SGP T TM TYC UTX XOM VZ Inicio(a-m-d) 1970-01-02 1962-01-02 1983-04-06 1980-01-02 1984-07-19 1987-08-18 1993-07-19 1992-06-16 1984-10-25 1997-12-17 1977-01-03 1993-04-13 1987-08-11 1970-01-02 1962-01-02 1984-09-07 1970-01-02 1962-01-02 1980-01-02 1970-01-02 1986-03-13 1977-01-03 1982-01-04 1983-04-06 1984-07-19 1962-01-02 1987-12-30 1970-01-02 1970-01-02 1983-11-21 Fin(a-m-d) 2007-09-20 2007-09-20 2007-09-20 2007-09-20 2007-09-20 2007-08-14 2007-09-20 2007-09-20 2007-09-20 2007-09-20 2007-09-20 2007-09-20 2007-09-20 2007-09-20 2007-09-20 2007-09-20 2007-09-20 2007-09-20 2007-09-20 2007-09-20 2007-09-20 2007-09-20 2007-09-20 2007-09-20 2007-09-20 2007-09-20 2007-09-20 2007-09-20 2007-09-20 2007-09-20 Instancias 9522 11509 6172 6990 5846 5035 3571 3841 5772 2448 7753 3633 5067 9522 11509 5812 9522 11509 6996 9522 5430 7752 6490 6172 5846 11509 4975 9522 9522 6012

5.2.2

Fase 2 - Validacin de candlesticks o

Para esta fase el objetivo es validar patrones reportados en la literatura mediante el catlogo de paa trones generado por el prototipo PDM-Patterns, identicando el patrn y los estados de la naturaleza o a los cuales se asocia. A continuacin se describen los grupos de experimentos a ejecutar. o Grupo 1: Validar con el catlogo de patrones generados por el prototipo PDM-Patterns, el a siguiente conjunto de patrones candlesticks para tamao de ventana de tendencia 5, 10 y 15 n (Ver Figura 5.1): Harami Reversal Bear (1) Harami Cross Reversal Bear (2) Doji Star Reversal Bear (3) Kicking Reversal Bear (4) Homing Pigeon Reversal Bear (5) Harami Reversal Bull (6) 40

Figura 5.1: Patrones tamao 2 n

Harami Cross Reversal Bull (7) Doji Star Reversal Bull (8) Kicking Reversal Bull (9) Grupo 2: consiste en validar con el catlogo de patrones generados por el prototipo PDMa Patterns, el siguiente conjunto de patrones candlesticks para tamao de ventana de tendencia n 5, 10 y 15 (Ver Figura 5.2): Abandoned Baby Star Reversal Bear (1) Morning Doji Star Reversal Bear (2) Morning Star Reversal Bear (3) Three Stars in the South Reversal Bear (4) Three White Soldiers Reversal Bear (5) Abandoned Baby Reversal Bull (6) Evening Doji Star Reversal Bull (7) Evening Star Rev Reversal (8) Three Black Crows Reversal Bull (9) Three Inside Down Reversal Bull (10)

5.2.3

Fase 3 - Catlogo de patrones y Expectativas a

El proceso de generacin de expectativas tiene sentido en la medida que el proceso sea capaz de generar o reglas que proporcionen informacin al cliente. En esta fase se utiliza el prototipo PDM-Prextree o para encontrar reglas con baja entrop utilizando la totalidad del conjunto de datos para construir a el catlogo de patrones. Los experimentos a ejecutar se describen en la Tabla 5.2. a 41

Figura 5.2: Patrones tamao 3 n

Tabla 5.2: Experimentos catlogo de patrones y expectativas a No 1 2 3 4 5 6 7 8 9 10 11 12 Pattern type Candle Candle Candle Candle Candle Candle Candle Candle Candle Candle Candle Candle Itemset Candle Candle Candle Candle+position Candle+position Candle+position Candle+color Candle+color Candle+color Candle+color+position Candle+color+position Candle+color+position Pattern size 3 3 3 3 3 3 3 3 3 3 3 3 Tendence 5 10 15 5 10 15 5 10 15 5 10 15 Entropy 0.7 0.7 0.7 0.7 0.7 0.7 0.7 0.7 0.7 0.7 0.7 0.7

5.2.4

Fase 4 - Expectativas y Seleccin de activos o

El objetivo de esta fase es validar el desempeo del proceso de seleccin de activos, visto como un n o proceso de clasicacin binaria, donde la clase positiva son los activos cuyo precio de cierre aument de o o un dia a otro, y la case negativa son aquellos activos cuyo precio disminuy. o Para efectos de evaluacin del desempeo del proceso de clasicacin, los activos seleccionados por o n o las expectativas que se obtienen con el modelo propuesto, pertenecen a la clase positiva, y los que no a la clase negativa. La combinacin de parmetros para cada experimento se dene en la Tabla 5.3. El conjunto de o a datos utilizado para la experimentacin incluye los 30 activos del conjunto de datos, en el rango de o 42

Tabla 5.3: Experimentos Expectativas y Seleccin de Activos o


No 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 Pattern type Candle Candle Candle Candle Candle Candle Candle Candle Candle Candle Candle Candle Candle Candle Candle Candle Candle Candle Candle Candle Candle Candle Candle Candle Candle Candle Candle Candle Candle Candle Candle Candle Candle Candle Candle Candle Candle Candle Candle Candle Candle Candle Candle Candle Candle Candle Candle Candle Candle Candle Candle Candle shape shape shape shape shape shape shape shape shape shape shape shape shape shape shape shape shape shape shape shape shape shape shape shape shape shape shape shape shape shape shape shape shape shape shape shape shape shape shape shape shape shape shape shape shape shape shape shape shape shape shape shape Itemset Candle Candle Candle Candle Candle Candle Candle Candle Candle Candle Candle Candle Candle Candle Candle Candle Candle+color Candle+color Candle+color Candle+color Candle+color Candle+color Candle+color Candle+color Candle+color Candle+color Candle+color Candle+color Candle+pos Candle+pos Candle+pos Candle+pos Candle+pos Candle+pos Candle+pos Candle+pos Candle+pos Candle+pos Candle+pos Candle+pos Candle+pos+color Candle+pos+color Candle+pos+color Candle+pos+color Candle+pos+color Candle+pos+color Candle+pos+color Candle+pos+color Candle+pos+color Candle+pos+color Candle+pos+color Candle+pos+color Pattern Size 4 4 4 4 4 4 4 4 3 3 3 3 2 2 2 2 4 4 4 4 3 3 3 3 2 2 2 2 4 4 4 4 3 3 3 3 2 2 2 2 4 4 4 4 3 3 3 3 2 2 2 2 Tendence Size 5 5 10 10 10 10 5 5 10 10 5 5 10 10 5 5 10 10 5 5 10 10 5 5 10 10 5 5 10 10 5 5 10 10 5 5 10 10 5 5 10 10 5 5 10 10 5 5 10 10 5 5 Range Si Si Si Si No No No No No No No No No No No No No No No No No No No No No No No No No No No No No No No No No No No No No No No No No No No No No No No No Threshold 0.6 0.55 0.6 0.55 0.55 0.6 0.55 0.6 0.55 0.6 0.55 0.6 0.55 0.6 0.55 0.6 0.55 0.6 0.55 0.6 0.55 0.6 0.55 0.6 0.55 0.6 0.55 0.6 0.55 0.6 0.55 0.6 0.55 0.6 0.55 0.6 0.55 0.6 0.55 0.6 0.55 0.6 0.55 0.6 0.55 0.6 0.55 0.6 0.55 0.6 0.55 0.6

43

Figura 5.3: Espacio TPR vs FPR (tomada de http://en.wikipedia.org/wiki/Receiver operating characteristic)

fechas que va del primero de febrero de 2006 hasta el primero de abril de 2006. En la medida que el proceso de clasicacin depende de varios parmetros de seleccin, se evaluarn o a o a diferentes combinaciones, para establecer cual combinacin tiene mejor desempeo en la clasicacin. o n o Los siguientes indicadores sern utilizados para la evaluacin: tasa de verdaderos positivos, tasa de a o falsos positivos y tasa de error de clasicacin. Estos valores se obtienen de la matriz de confusin que o o se compone de los siguientes valores: Verdaderos positivos (TP): nmero de instancias correctamente clasicadas en la clase positiva. u Verdareros negativos (TN): nmero de instancias correctamente clasicadas en la clase negativa. u Falsos positivos (FP): nmero de instancias incorrectamente clasicadas en la clase positiva. u Falsos negativos (FN): nmero de instancias incorrectamente clasicadas en la clase negativa. u Con base en los valores de la matriz de confusin se denen las siguientes medidas de desempeo o n del proceso de clasicacin: o TPR (tasa de verdaderos positivos): representa el porcentaje de instancias clasicadas en la clase positiva, del total de instancias del conjunto que pertenecen a la clase positiva FPR (tasa de falsos positivos): representa el porcentaje de instancias clasicadas incorrectamente en la clase negativa, del total de instancias del conjunto que pertenecen a la clase negativa. ER (tasa de error): porcentaje de instancias mal clasicadas. Las formulas de estas medidas se presentan a continuacin: o T P R = T P/(T P + F N ) F P R = F P/(F P + T N ) ER = (F N + F P )/(T P + T N + F P + F N ) 44 (5.1) (5.2) (5.3)

Estas medidas permitirn establecer, que para el conjunto de pruebas utilizado, un algoritmo de a clasicacin o una combinacin de parmetros del algoritmo es mejor que otra, si se obtiene la mayor o o a tasa de verdaderos positivos con una tasa baja de falsos positivos. La Figura 5.3 presenta el espacio ROC en el cual se grcan los valores TPR vs FPR para un clasicador. Los clasicadores de mejor a desempeo son los ms cercanos al punto superior izquierdo de la grca, que estn por encima de la n a a e diagonal que divide el espacio. Esta diagonal representa el caso donde el clasicador tiene el mismo desempeo que tirar una moneda no sesgada, donde la TPR es igual a la FPR. n

5.3

Anlisis de Resultados a

El proceso de clasicacin presentado, evidencia como el sistema clasicador difuso tiene un buen o desempeo cuando se usa el conjunto completo de reglas, reportando solo un 1.58 % de instancias n no clasicadas para el Grupo 1 de experimentos. En la Tabla 5.4 se presentan los resultados de este grupo de experimentos. En los tabla se presentan el nmero de instancias clasicadas en cada tipo de u forma bsica, utilizando el sistema clasicador difuso presentado en la Seccin 4.1, para los conjuntos a o de reglas reducido y completo denidos con el diseo experimental. n Tabla 5.4: Resultados Fase 1 - Experimentos Grupo 1 Clase MARUBOZU LONG LONG LOWER SHADOW SHAVEN HEAD HANGING MAN HAMMER SPINNING TOP INVERTED HAMMER SHOOTING STAR SHAVEN BOTTOM LONG UPPER SHADOW DOJI UNDEFINED Instancias grupo reducido 14097 (6.56 %) 38912 (18.12 %) 49726 (23.15 %) 17840 (8.31 %) 94206 (43.86 %) Instancias grupo completo 13308 (6.20 %) 31252 (14.55 %) 13365 (6.22 %) 32866 (15.30 %) 7203 (3.35 %) 5736 (2.67 %) 36811 (17.14 %) 5275 (2.46 %) 6447 (3.00 %) 30788 (14.33 %) 11081 (5.16 %) 17257 (8.03 %) 3392 (1.58 %)

Para el Grupo 2 de experimentos, en el caso de la clasicacin de la serie AAPL (Apple) el 8 % de o las instancias fueron mal clasicadas, donde la mayoria de las formas mal clasicadas fueron de tipo Long Upper Shadow y Spinning top, lo cual sugiere que es necesario ajustar o revisar los conjuntos difusos y las reglas de clasicacin. Pero independiente de eso, un 92 % de clasicacin correcta sugiere o o que el clasicador difuso, funciona bien en el proceso de reconocimiento de formas bsicas que es la a base del proceso de generacin de expectativas basadas en candlesticks. o La segunda fase de experimentos se ejecut con el objetivo de vericar cuales patrones reportados o en la literatura, son encontrados con el catlogo de patrones propuesto (Ver Seccin 4.2). Los resultados a o de esta fase son resumidos en la tabla 5.5. En esta tabla se presenta el patrn, estado de la naturaleza o de mayor ocurrencia asociado al patrn, y la entrop del mismo. El nivel de entrop es una medida o a a de la cantidad de informacin que aporta el patrn. Por ejemplo, si el patrn tiene una entrop o o o a alta quiere decir que la probabilidad de ocurrencia es muy parecida o igual para cada estado de la naturaleza asociado; con lo cual el patrn no aporta informacin al proceso (Ver seccin 4.9). o o o De los patrones seleccionados de la literatura solo tres concuerdan con el estado de la naturaleza reportado para los tres grupos de tendencias utilizadas. Estos patrones son three white soldiers>rev bear ( Ver Figura 5.2-5 ), abandoned baby>rev bull ( Ver Figura 5.2-6 ) y doji star >rev bull ( Ver Figura 5.1-8 ). Pero mantienen un valor de entrop alta a pesar de su coincidencia con la literatura. a 45

En resumen todas las reglas presentan valores altos de entropia pero sugieren una leve orientacin de o las reglas hacia un estado de mayor ocurrencia, es decir que la probabilidad de este estado es superior a los otros de no forma contundente. Tabla 5.5: Resumen Fase 2- Experimentos Grupo 1 y Grupo 2 Patrn o Harami Reversal Bear Harami Cross Reversal Bear Doji Star Reversal Bear Kicking Reversal Bear Homing Pigeon Reversal Bear Harami Reversal Bull Harami Cross Reversal Bull Doji Star Reversal Bull Kicking Reversal Bull Abandoned Baby Rev Bear Morning Doji Reversal Bear Morning Star Reversal Bear 3 Stars in the South Rev Bear 3 White Soldiers Rev Bear Abandoned Baby Rev Bull Evening Doji Star Rev Bull Evening Star Rev Bull 3 Black Crows Rev Bull 3 Inside Down Rev Bull Tendencia 5 Rev. bull(e=0.77) Rev. bull(e=0.77) Cont. bull(e=0.77) Rev. bull(e=0.70) Rev. bull(e=0.77) Cont. bull(e=0.78) Cont. bull(e=0.8) Rev. bull(e=0.77) Cont. bull(e=0.75) Rev. bear(e=0.76) Cont. bull(e=0.77) Rev. bear(e=0.77) Rev. bull(e=0.75) Rev. bull(e=0.77) Rev. bear(e=0.77) Cont. bull(e=0.77) Cont. bull(e=0.76) Tendencia 10 Cont. bull(e=0.77) Cont. bull(e=0.76) Cont. bear(e=0.77) Cont. bull(e=0.75) Cont. bull(e=0.77) Cont. bull(e=0.77) Cont. bull(e=0.77) Rev. bull(e=0.77) Cont. bull(e=0.72) Cont. bull(e=0.77) Cont. bull(e=0.77) Rev. bear(e=0.77) Cont. bear/Rev. bull(e=0.77) Reversal bear(e=0.76) Reversal bull(e=0.77) Cont. bull/Rev. bull(e=0.77) Cont. bull(0.76) Tendencia 15 Cont. bull(e=0.81) Cont. bull(e=0.76) Cont. bear(e=0.68) Cont. bull(e=0.75) Cont. bull(e=0.77) Cont. bull(e-0.77) Cont. bull(e=0.77) Rev. bull(e=0.77) Cont. bull(e=0.72) Cont. bull(e=0.76) Cont. bull(e=0.77) Cont. bull(e=0.77) Rev. bull(e=0.72) Rev. bear(e=0.77) Cont. bull(e=0.77) Rev. bull(e=0.76) Cont. bull(e=0.76)

La fase de investigacin asociada con generacin del catlogo de patrones, buscaba encontrar o o a patrones de alta ocurrencia con bajo nivel de entropia, de tal forma que la entropia baja conrmara que la probabilidad de asignacin a un estado de la naturaleza fuera alta, dada su alta ocurrencia y o baja asignacin a otras. Pero en este caso los resultados obtenidos, muestran como las reglas con baja o entropia son de baja ocurrencia, y las de mayor ocurrencia tienen una entropia alta.Se obtienen reglas con entrop cero, estas reglas son de soporte bajo y en su gran mayor son reglas individuales, es a a decir patrones que solo han ocurrido una vez en todo el conjunto de datos. La posicin relativa y el o color de las formas bsicas contribuyen en el proceso de conrmacin de las tendencias del patrn. a o o Si estos dos elementos no fueran importantes la sola notacin candle bastar para encontrar reglas o a de alta ocurrencia, pero no es as la notacin candle es la que genera menor nmero de reglas con , o u entropia cero. Pero en ultimas no hay reglas de alto soporte que tengan a su vez alta entrop lo cual a, quiere decir que el simple uso de los candlesticks no es suciente para establecer una tendencia futura del mercado en la medida que un patrn se asocia con mltiples estados de la naturaleza. o u Los resultados de la Fase de seleccin de activos conrman lo anterior. Para efectos de ver los o resultados de esta fase, se presentan las medidas de desempeo de la clasicacin en la Tabla 5.6, el n o espacio ROC de los experimentos en la Figura 5.4, y la tasa de error de clasicacin obtenida con o cada combinacin de parmetros en la Figura 5.5. o a Los experimentos revelan como el crecimiento del umbral aumenta la tasa de falsos positivos. La Figura 5.4 presenta como las diferentes combinaciones no son lo suciente buenas como para catalogar bien el clasicador y superar un clasicador binomial aleatorio no sesgado, es decir no superan el hecho de tirar una moneda legal y decidir si el activo sube si cae cara. Esto se debe a que son muy pocas las instancias de patrones que tienen una amplia diferencia de porcentaje entre las clases. Lo cual revela que los candlesticks por si solos no pueden ser usados como seal de venta o compra. Es necesario n conrmar la seal mediante el uso de otros indicadores o el anlisis de fundamentales. n a 46

Figura 5.4: Espacio ROC seleccin de activos o

Figura 5.5: Tasa de Error clasicacin o

47

Tabla 5.6: Resultados Experimentos Expectativas y Seleccin de Activos o


Exp 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 TP 45 116 53 168 259 166 229 157 208 49 184 61 107 2 39 1 167 161 141 140 269 176 220 148 162 23 114 27 14 14 17 17 178 170 183 173 216 88 170 58 14 14 17 17 117 116 102 101 255 158 219 121 TN 552 489 528 425 340 416 364 423 378 532 447 543 500 587 562 590 438 440 458 463 348 428 346 437 432 552 507 577 583 583 579 579 403 411 412 426 412 514 454 545 583 583 579 579 492 492 496 498 360 461 394 487 FP 39 102 63 166 251 715 227 168 213 59 144 48 91 4 29 1 153 151 133 128 243 163 245 154 159 39 84 14 8 8 12 12 188 180 179 165 179 77 147 46 8 8 12 12 99 99 95 93 231 130 197 104 FN 594 523 586 471 380 473 410 482 431 590 455 578 532 637 600 638 472 478 498 499 370 464 419 491 477 616 525 612 625 625 622 622 461 469 456 466 423 551 469 581 625 625 622 622 522 523 537 585 384 481 420 518 TPR 0.07 0.18 0.08 0.26 0.41 0.26 0.36 0.25 0.33 0.08 0.29 0.10 0.17 0.00 0.06 0.00 0.26 0.25 0.22 0.22 0.42 0.28 0.34 0.23 0.25 0.04 0.18 0.04 0.02 0.02 0.03 0.03 0.28 0.27 0.29 0.27 0.34 0.14 0.27 0.09 0.02 0.02 0.03 0.03 0.18 0.18 0.16 0.15 0.40 0.25 0.56 0.19 FPR 0.07 0.17 0.11 0.28 0.42 0.63 0.38 0.28 0.36 0.10 0.24 0.08 0.15 0.01 0.05 0.00 0.26 0.26 0.23 0.22 0.41 0.28 0.41 0.26 0.27 0.07 0.14 0.02 0.01 0.01 0.02 0.02 0.32 0.30 0.30 0.28 0.30 0.13 0.24 0.08 0.01 0.01 0.02 0.02 0.17 0.17 0.16 0.16 0.39 0.22 0.59 0.18 ER 0.51 0.51 0.53 0.52 0.51 0.67 0.52 0.53 0.52 0.53 0.49 0.51 0.51 0.52 0.51 0.52 0.51 0.51 0.51 0.51 0.50 0.51 0.54 0.52 0.52 0.53 0.50 0.51 0.51 0.51 0.52 0.52 0.53 0.53 0.52 0.51 0.49 0.51 0.50 0.51 0.51 0.51 0.52 0.52 0.50 0.51 0.51 0.53 0.50 0.50 0.51 0.51

48

Cap tulo 6

Conclusiones y Trabajo Futuro


El proceso de construccin de esta tesis deja como resultados materiales un estado del arte, este o documento como tal y cuatro prototipos de software. Pero ms alla de esos resultados materiales a estn los aportes para el campo nanciero y naturalmente para las ciencias de la computacin. El a o estado del arte publicado en la Revista Ingenier e Investigacin (Ver Apndice A), presenta una a o e clasicacin de las tcnicas computacionales usadas en la generacin de expectativas para seleccin o e o o de portafolio y a su vez presenta el problema de seleccin de portafolio de manera formal y como o un problema de optimizacin multiobjetivo. La importancia de este estado del arte radica en que esa o propuesta de clasicacin de las tcnicas, sin un referente similar en la literatura, permiti o e o Presentar el problema de seleccin de portafolio como un problema de optimizacin multiobjeo o tivo, haciendo enfasis en la denicin conceptual y formal de sus fundamentos. o Identicar los modelos computacionales utilizados hasta el momento. Reconocer como la orientacin preponderante de esos modelos es la prediccin de series de tiempo o o bajo la hiptesis dbil del mercado eciente, es decir, bajo la hiptesis que el precio reeja la o e o informacin histrica disponible. o o Identicar como la necesidad de grandes volmenes de informacin hace que los esfuerzos de u o investigacin ms recientes incluyan tcnicas de miner de datos. o a e a Identicar como la tcnica de candlesticks ha sido abordada muy poco en el campo computae cional. Con el modelo propuesto se establece un proceso de seleccin de activos basado en la identicacin o o de patrones candlesticks, lo cual representa para el campo nanciero un aporte en la medida que el modelo computacional permite validar la eciencia de los candlesticks. Aqui gana vital importancia el modelo difuso de reconocimiento como la base que permite generar todo ese proceso, y representa un aporte desde el punto de vista computacional, en la medida que esta tcnica ha sido utiliza muy e poco con esa orientacin nanciera. o El modelo adicionalmente se reeja en la implementacin de una herramienta de software como puesta por cuatro prototipos funcionales, diseados para brindar soporte al proceso de seleccin de n o portafolio. Los cuatro prototipos, utilizando el fundamento conceptual de la teor de portafolio y los a candlesticks del anlisis tcnico, cubren los siguientes niveles de funcionalidad asociadas al proceso: a e Administracin de datos del mercado (compa acciones, precios). o nas, Identicacin y codicacin de series de acciones (con sus cuatro precios caracter o o sticos) en series de formas bsicas de candlesticks, utilizando un sistema clasicador difuso construido a partir a de reglas de lenguaje natural. 49

Construccin de catlogos de patrones usando rboles de prejos. o a a Generacin de expectativas individuales de comportamiento de acciones para un d de anlisis o a a espec co, donde esas expectativas se expresan como probabilidades de ocurrencia de los estados asociados al patrn. o Seleccin de activos para siseo de portafolios para inversionistas con perl de amantes al riesgo o n con base en la generacin de expectativas a partir del reconocimiento de candlesticks en series o de precios de acciones.

El uso de los candlesticks es un modelo reciente que forma parte de un conjunto de tcnicas ms e a elaboradas y maduras que se conocen como anlisis tcnico. Dada su poca edad y caracter emp a e rico, pocos esfuerzos se han orientado a comprobar la validez estad stica de los patrones. Esta tesis no pretendi ser un estudio de este estilo, pero si demostr como el uso de tcnicas computacionales o o e permitieron simular o ejecutar de forma articial, el proceso natural de reconocimiento que d a a d realizan los traders en busca de esos supuestospatrones de candlesticks. El diseo experimental a n propuesto y los resultados de la ejecucin de este, son un intento para abordar de forma inicial esa o comprobacin. Por ejemplo los resultados de la Fase 2 de experimentos muestran como tres de los o patrones seleccionados se encuentran en el catlogo generado, pero sin dar lugar a una conanza total a sobre el estado asociado a la secuencia, dado el nivel de entrop asociado. Estos tres patrones son a catalogados en la literatura como de alta conanza, pero los resultados de los experimentos sugieren incertidumbre. Los resultados de la Fase 3 son una clara representacin de la dinmica real del mercado y un o a motor generador de ideas para trabajo futuro que permita mejorar la concepcin y explotacin de los o o candlesticks en el marco computacional. En la Fase 3 se obtiene una explosin de reglas individuales o con entropia alta y reglas de alto soporte con entropia baja, lo cual lleva a la conclusin que el o mecanismo de decisin no puede estar basado solo en los candlesticks, sino que es necesario encontrar o mecanismos de conrmacin de los estados de la naturaleza, como otras herramientas del analisis o tcnico o modelos basados en fundamentales. e En la Fase 4 de experimentacin, los resultados presentan como la eciencia de la seleccin de o o activos basada en candlesticks es baja, porque requiere de otras medidas o indicadores que conrmen la seal dada por los estados de la naturaleza de los candlesticks. El proceso de seleccin de activos n o es pobre y presenta igual o peor desempeo que un clasicador binomial aleatorio. Se puede concluir n que el modelo de toma de decisiones basado en candlesticks no proporciona informacin de ayuda o en el diseo de estrategias de inversin. Pero hay que aclarar que esto se puede dar por dos causas. n o La primera de ellas es que efectivamente los candlesticks no funcionan; la segunda es que el modelo de representacin utilizado no es el ms adecuado, pero probar esto es dif o a cil, es ms fcil probar el a a enfoque candlestick con otros modelos para comprobar su validez. Para terminar, y para establecer un camino de investigacin alrededor de esta tesis como un o esfuerzo novedoso en el campo de la computacin nanciera, se sugieren los siguientes elementos como o trabajo futuro: En el caso del modelo clasicador difuso, se podr utilizar la generacion de reglas y conjuntos a difusos mediante modelos de coevolucin como el presentado en [34]. o Dada la explosin de reglas generadas, es necesario agruparlas para denir grupos genricos o e de patrones, lo cual contribuir a una redenicin de los patrones candlesticks en el marco a o nanciero. Para esto se propone el uso de tcnicas de clustering y la denicin de medidas de e o similaridad para los patrones y las formas bsicas. a Validar el proceso de seleccin de activos con la construccin de portafolios a partir de estos, y o o evaluar su desempeo en el marco del retorno y riesgo de los portafolios. n 50

Incluir en el modelo de generacin de expectativas instrumentos nancieros de conrmacin de o o tendencia, como los indicadores tcnicos. e Adicionar al modelo de diseo de portafolio propuesto, una nueva medida del riesgo que tenga n en cuenta el valor de la entrop y la distribucin de probabilidad asociadas con los estados de la a o naturaleza de una expectativa. Con esta nueva medida de riesgo, el enfoque clsico de seleccin a o de activos para portafolios que plantea escoger aquellos con alto retorno y bajo riesgo, podr a ser remplazado por un nuevo enfoque donde el objetivo es ahora seleccionar aquellos activos que para el d de anlisis revelen un patrn con el estado de la naturaleza ms adecuado (nueva a a o a visin del retorno clsico) y cuya probabilidad ocurrencia sea alta manteniendo una entropia o a baja (nueva visin del riesgo clsico) . o a

51

Apndices e

53

Apndice A: Art e culo Estado del Arte


Art culo publicado en la Revista Ingenier e Investigacin de la Facultad de Ingenier de la Univera o a sidad Nacional.

LINARES Mario, HERNANDEZ Diego, GONZALEZ Fabio. Exploiting stock data: a survey of state of the art computational techniques aimed at producing beliefs regarding investment portfolios. Revista Ingenier e Investigacin. Volumen 28 No 1, Abril de 2008(105-116). ISSN: 0120-5609 a o

55

REVISTA INGENIERA E INVESTIGACIN VOL. 28 No. 1, ABRIL DE 2008 (105-116)

Exploiting stock data: a survey of state of the art computational techniques aimed at producing beliefs regarding investment portfolios
El valor de las series de tiempo de acciones: un estado del arte de tcnicas computacionales para la generacin de expectativas en portafolios de inversin
Mario Linares Vsquez1, Diego Fernando Hernndez Losada2 y Fabio Gonzlez Osorio3 ABSTRACT Selecting an investment portfolio has inspired several models aimed at optimising the set of securities which an investtor may select according to a number of specific decision criteria such as risk, expected return and planning horizon. The classical approach has been developed for supporting the two stages of portfolio selection and is supported by disciplines such as econometrics, technical analysis and corporative finance. However, with the emerging field of computational finance, new and interesting techniques have arisen in line with the need for the automatic processing of vast volumes of information. This paper surveys such new techniques which belong to the body of knowledge concerning computing and systems engineering, focusing on techniques particularly aimed at producing beliefs regarding investment portfolios.

Keywords: portfolio, optimisation, stock, securities, return, risk, profile, belief, rules set.
RESUMEN El proceso de seleccin de portafolio ha dado origen a diferentes modelos, orientados a optimizar el conjunto de titulos valor disponibles para un inversionista, con base en diferentes criterios de decisin tales como el riesgo, el retorno esperado, horizonte de planeacin, entre otros. El enfoque clsico de estos modelos cubre las dos fases del proceso de seleccin de portafolio, y est definido por disciplinas tales como la econometra, el anlisis tcnico y las finanzas corporativas. Pero el nacimiento de la computacin financiera define el uso de nuevas tcnicas bajo la necesidad del procesamiento automtico de grandes volmenes de informacin. Este artculo es un estado del arte de esas nuevas tcnicas, desde el punto de vista de la ingeniera de sistemas y sus modelos computacionales, aplicados particularmente a la generacin de expectativas de inversin en portafolios..

Palabras clave: portafolio, optimizacin, acciones, ttulos valor, retorno, riesgo, expectativas, conjunto de reglas.
Recibido: octubre 01 de 2007 Aceptado: febrero 21 de 2008

Introduction
The financial market has become one of the main components of capitalist economies; it is an elementary mechanism for raising capital, transferring risks and international trade. Investment is an activity which is tightly bound to financial markets. It basically consists of buying and selling (stocks, commodities and currency) aimed at making profit. It is a game where all internal and external variables involved in the process must be correctly interpreted for producing beliefs; such

beliefs are decision-making variables in the decision-making process. Portfolio selection represents a specialisation of investment in the stock market domain, framed within the conceptual framework of finance; it consists of selecting a set of securities available on the market, according to an investors profile and requirements. Decision-making is defined by an investtors ability to understand stocks historical behaviour and the influence of external factors such as micro and macro-economic environments. Intuition, knowledge and good luck are

1 Ingeniero de Sistemas, Universidad Nacional de Colombia. Candidato M.Sc., Ingeniera de Sistemas y Computacin, Universidad Nacional de Colombia. Auxiliar docente, Departamento de Ingeniera de Sistemas e Industrial. mlinaresv@unal.edu.co 2 Ingeniero Industrial. Magster, en Administracin de Empresas. Magster en Economa. M.Sc., of Science in Finance. Ph.D., en Ciencias Econmicas. Profesor, Departamento de Ingeniera de Sistemas e Industrial y Decano, Facultad de Ingeniera, Universidad Nacional de Colombia. dfhernandezl@unal.edu.co 3 Ingeniero de sistemas. Magster, en Ciencias Matemticas, Universidad Nacional de Colombia. M.Sc. in Computer Science, The University of Memphis, USA. Ph.D, in Computer Science, The University of Memphis, USA. Profesor asociado, Departamento de Ingeniera de Sistemas e Industrial y Decano, Facultad de Ingeniera, Universidad Nacional de Colombia. fagonzalezo@unal.edu.co

105

EXPLOITING STOCK DATA: A SURVEY OF STATE OF THE ART COMPUTATIONAL TECHNIQUES AIMED AT PRODUCING BELIEFS REGARDING INVESTMENT PORTFOLIOS

examples of components which are generally recognised as being factors in successful portfolio selection. The classical framework for portfolio selection is defined by the risk/return element of Markowitzs theory (Markowitz, 1952). This theory states that portfolio selection consists of two stages: creating beliefs and portfolio design; the former concerns how investors define their beliefs about markets future performance whilst the latter deals with how investors select investments according to their own beliefs. Several mathematical and probabilistic models have been developed from a financial viewpoint for the design stage; however, they have assumed that beliefs are represented as probabilistic distributions of stock series data. Econometrics provides models for time series analysis (re creating beliefs), including forecasting, regression and function approximators regarding stock series data; technical analysis (Murphy, 1999) provides charts and technical indicators suggesting beliefs about market trends to the investors. However, beliefs are not only density functions of stock data, nor values concerning market trends; beliefs in the real world are rules and patterns repre-senting the investors knowledge and ability to understand market dynamics. Classical financial models thus do not support this type of representation but several computer-based techniques can handle such representations (using rules, patterns, etc.) and are widely used in the academic community. This survey is thus aimed at presenting several computational models found in the literature for solving the problem of creating portfolio beliefs. Initially of this survey presents a conceptual framework for selecting a portfolio as part of a multi-objective optimisation approach, presents classical models for portfolio design (being the second stage of the process), presents models for creating beliefs concerning portfolio performance, focusing on statistical and computational techniques. Finally draws conclusions and proposes further work on computational techniques for creating beliefs.

An investor acting within a classical and rational economics environment will thereby wish to invest in stocks producing the highest return; however, the decision concerning which stocks to choose (i.e. those forming the portfolio) is orientated by beliefs such as the price of stock x is going down because the dollar price is high.. or, I will not invest in stock y because its price has gone down since last week[...]. Such rules describe how knowledge about stock performance arises according to factors such as the market, the stocks history, political decisions, the economic environment and speculation. An investors profile is then defined by the following: -Position: geographical position, job, sociological and economical conditions; -Preferences: risk attitude, time conditions, expected return; and -Predictions: trading rules, beliefs, stock trends and so on.

Figure 1: Portfolio selection

The portfolio selection problem


Portfolio selection is described as being the selection of a securities set from an available universe; such selection is driven by a decision-makers objectives and according to an investors knowledge and beliefs about market behaviour. The aim behind this selection is to invest a limited amount of money for a period of time on securities bringing an investor the best expected values concerning the variables involved in decision-making. The aim then (from the viewpoint of economics) is to maximise investor wealth. The following information categories are involved: -Quantitative: indices, technical indicators, security prices (time series); and -Qualitative: fundamental beliefs, news, speculation.

Two stages are involved in portfolio selection (Markowitz, 1952); the first consists of creating beliefs about securities performance in horizon planning (the time during which an investor is going to take portfolio decisions). An investor must observe market behaviour and use experience and knowledge of domain application in creating such beliefs. Output from this stage results in a set of rules subjectively describing securities performance (predicted behaviour). The set of rules or beliefs generally represent probability distributions for securities, association rules, temporal patterns, trading rules and so on. The second stage consists of using beliefs about securities for designing a portfolio. This selection is defined by an investors objective variables. The set of securities and the vector of money invested in each selected security represent the output from this stage. This output is called a portfolio and is applied to an investment period; a sequence of portfolios must be built (one for each period) when an investor is working with multiple periods. This sequence is called a portfolio selection algorithm (El-Yaniv, 1998) and specifies how an investor must reinvest wealth from period to period (Figure 1). Several approaches have been found in the literature for providing a solution for the portfolio selection problem. However, these approaches do not cover the whole process; they have been developed for a specific stage of the process

106

REVISTA INGENIERA E INVESTIGACIN VOL. 28 No. 1, ABRIL DE 2008 (105-116)

LINARES, HERNNDEZ, GONZLEZ

(Figure 2). The models are organised in document according to the stages and notation defined below. Portfolio selection may be generally defined as being multiobjective optimisation. The investors profile directs the process and is defined by multiple objective variables and constraints such as the expected stock yield, the decision-makers risk profile, horizon planning and the amount of money available for the investment. Portfolio selection is formally defined in a multi-objective approach as follows: With Sm a set of available securities on the market, and a horizon planning H with L time periods, then the portfolio selection problem consists of finding a portfolio P of N securities for each period of H, with P = S P , x * where S P S is the

-Specific risk (unsystematic risk), influencing individual assets or a specific set. Such influence on portfolio selection can be reduced through diversification. This principle is based on the fact that specific risk influences tend to become cancelled out in large and well-diversified portfolios. Both types of risk compound a securitys total risk, so a security risk consists of adding systematic risk to specific risk. The implicit relationship between risk and return defines the conceptual framework for a decision-makers interaction with the market. This trade-off between return and risk is repressented by the decision-makers profile or risk tolerance (adverse to risk, risk-lover) and is expressed on the market by the fact that higher-risk investments have higher expected return. Expected return may involve a loss proportional to risk with higher-risk values (Figure 3). The investment game is thus played with risk/return trade-off investor management.

* * portfolio securities set, and x = x , x2 ,...., xn is the vector of wealth proportions invested in each security of S P . The * * 1

portfolio must satisfy the investor profile, so x * will satisfy:

( ) h (x ) = 0; i = 1,2,..., q
* i

g i x * 0; i = 1,2,..., m

(1) (2)

and optimise
f ( x ) = [ f 1 ( x ), f 2 ( x ),..., f k ( x )]
T

(3)
Figure 2. Portfolio selection approaches

The investor profile is represented by equations (1), (2) and (3). So (1) and (2) define the feasible region and represent the constraints imposed on the process; the k components of (3) represent the main criteria for portfolio selection. For example, a classical investor would prefer f1 = max(return) while an investor adopting a return-risk approach would prefer f1 = max(return) and f1 = min(risk ) .

Return and risk concepts


Return (yield) and risk represent the main concepts in portfolio selection, these being the main objective variables driving the whole process. Return is the profit or yield obtained as a result of investment; it is a security or portfolios gain or loss during a particular period, consisting of income plus capital gains relative to investment. Return is usually quoted as a percentage. Risk is commonly defined as being the chance or possibility that a real investment return will be different from what was expected; it is also referred to as being the uncertainty involved in an investment in a security or portfolio. In economics, risk measures the expected loss for an investment in monetary units. Risk is defined by the factors influencing any securities performance. Risk is generally classified as follows: -Systematic risk (pervasive risk), affecting a large number of securities. For example, the effect of political news on stock prices is a kind of systematic risk. Systematic risk is a product of the financial markets dynamics. It is thus impossible to protect an investor against this or try to predict it; and

Figure 3: Risk/Return trade-off

Measuring return
Portfolio selection includes evaluating stock series performance; these series are considered to be random variables. A decision-maker has thus to rely on a toolbox of measurements and indicators describing stock behaviour. Stock series are described in terms of portfolio selection by measuring central tendency and return dispersion. Risk is thus represented by returns variance and return on the expected value of the returns series. These measurements are used on the assumption than stock returns follow normal distribution. The return is obtained from the stock series prices4 as a random variable transformation so return also becomes a ran-

A stock series has four prices: close, open, high and low.

REVISTA INGENIERA E INVESTIGACIN VOL. 28 No. 1, ABRIL DE 2008 (105-116)

107

EXPLOITING STOCK DATA: A SURVEY OF STATE OF THE ART COMPUTATIONAL TECHNIQUES AIMED AT PRODUCING BELIEFS REGARDING INVESTMENT PORTFOLIOS

dom variable. This transformation is defined as a real function:

Risk measurement
Multiple measurements allow an investor to estimate an investments financial risk (Giorgi, 2002; Galvan, 2004; Nawrocki). These kinds of measurements are functions g of the securities return (range n and domain ):

RY (t , k ) = f (Y (t ); k )

(4)

with Y (t ) a time series of security prices and k is the regression time window. Simple return and log return are two instances of (4) which are widely used in finance.

Risk (RY ) = g (RY (t ))

(9)

Simple return
This is also called an arithmetic return and is defined with k=1 as follows:

Equation (9) represents the set of functions which can be considered as a risk measurement. Artzner et al., (1999), reduced the functions set g to , with risk measurement axiomatisation and coherent risk measurement definition:

RY (t ) =

Y (t ) Y (t 1) Y (t ) = 1 Y (t 1) Y (t 1)
Y (t ) Y (t k ) Y (t ) = 1 Y (t k ) Y (t k )

(5)

Risk (RY ) = (RY (t ))

(10)

A simple return with k window size is called k-step:

with a coherent risk measurement is defined as follows: A function : X is a coherent risk measurement if it fulfils the following axioms: (i) Subadditivity (axiom S): ( X + Y ) ( X ) + (Y ) ; (ii) Positive homogeneity (axiom PH): if (X ) = ( X ) ;

RY (t , k ) =

(6)

This return has some features:

(iii) RY (t ) > 0 defines a loss. (iv )

(ii ) RY (t ) > 0 defines a gain.

(i )

RY (t ) = 1 when Y (t ) = 2 * Y (t k ).

0 , then

Y (t ) Y (t k ) Y (t k ) Y (t ) Y (t k ) Y (t )

(iii) Monotony (Axiom M): if X Y , then ( X ) (Y ) ; and (iv) Translation invariance ( X + m) = ( X ) m (axiom T): if
m then

Log return
A simple return is an asymmetric function regarding positive and negative changes of the same magnitude. For example, if Y(t) = 13 and Y(t1) = 8, then simple return RY (t) = 0.625, but if Y(t) = 8 and Y(t 1) = 13, RY (t) = 0.3846. Log (logarithmic) return fixes simple return asymmetry and is defined as follows:

-Axiom S is related to the diversification theorem. If portfolio risk is not less than the sum of individual risks, then an investtor would prefer to invest in securities individually and not on a portfolio. -Axiom PH. The risk of units of X is equal to times the risk of X; it is a consequence of axiom S. -Axiom M. If return X is less than return Y, then risk ok X will be higher. -Axiom T. Risk decreases if the portfolio has a risk-free security.

Y (t ) R logY (t ) = ln Y (t 1) = ln(Y (t )) ln(Y (t 1))


and with k-step:

(7)

Y (t ) R logY (t , k ) = ln = ln (Y (t )) ln (Y (t k )) Y (t k )
This return has some features:

(8)

Coherent risk evaluates the risk associated with future states while classical risk measurement assesses risk with return historical data. Convex risk measurement is an extension of coherent ones. Convex measurement is a weak form of coherent measurement. Convex measurement includes situations in which risk position5 does not increase lineally with position size: A function : X is called convex measurement if it fulfils the conditions of convexity6, mononotony and translation invariance.

(i ) RY (t ) > 0 defines a gain. (iii) If

(ii ) RY (t ) > 0 defines a loss. .

Y (t ) = 2 then R logY (t ) = ln (2 ) = 69.3% Y (t k )

Y (t ) Y (t k ) (iv) ln Y (t k ) = ln Y (t )

5 6

A position represents an investment decision : buy, sell, hold. Convexity: (X + (1 )Y ) ( X ) + (1 ) (Y ),

[0,1]

108

REVISTA INGENIERA E INVESTIGACIN VOL. 28 No. 1, ABRIL DE 2008 (105-116)

LINARES, HERNNDEZ, GONZLEZ

Variance and semi-variance are classic risk measurements and belong to a group called deviation measurement: A function : X is called deviation measurement if it fulfils the following conditions (in addition to subadditivity and positive homogeneity): (i) Shift invariance: ( X + m) = ( X ) m ; (ii) Non-negativity: if ( X ) 0 X , with X being a random variable representing return. A set of risk measurements widely used in portfolio selection are presented below.

(i.e. distribution of returns is not symmetric concerning central tendency). VaR thus measures the dispersion of loss associated with a fixed occurrence probability ( level). Higher risk means higher loss with a fixed probability. For a level [0,1] , VaR is defined as follows:

VaR ( X ) = inf {x P[X x] > }

(14)

VaR is not a coherent risk measurement because it does not fulfil the subadditivity axiom.

Variance
Risk is associated with the volatility of securities prices and securities returns in a classic conception. Assuming that returns data has symmetrical and normal distribution, then expected return represents central tendency and variance is average variation with mean:
2 VAR (R ) = R = E [R E [R ]] 2

(11)

Semi-variance
This is based on the observation that decision-makers do not worry about the risk of securities having prices below a threshold. Semi-variance is an answer for handling securities having asymmetric distributions and is defined as follows (Deng et al., 2000):

Figure 4: Min-Max model efficient set

SemiVAR(R ) = E Min{Ri ,0}

i 1,2,.., n (12)

ES: expected shortfall


Expected shortfall is a solution for VaR weakness (i.e. expected shortfall fulfils the subadditivity axiom). Expected shortfall with an level is average loss in the worst 100 %:

with Ri being the time series data and the threshold. A particular instance of semi-variance occurs when the threshold is the expected value:

SemiVAR(R ) = E Min{Ri E[R],0}

(13)

ES = 1 VaRu ( X )du
0

(15)

Semi-variance defines risk as being the volatility below the threshold and is a particular case of a set of measurements called K-th order lower partial moments (LPMk)7.

Portfolio design
The following notation will be used in this section: - xi : proportion invested in security i - Ri : return for i-th security; random variable with i = E[Ri ] - R = [R1 , R2 ,...., RN ]T - = [1 , 2 ,...., N ]T - COV (R ) : variance-covariance matrix of random vector R - W(t): the investors wealth for period t The purpose of this stage is to build optimal portfolio P. This is based on Markowitzs Modern Portfolio Theory (MPT) (Markowitz, 1952 and 1999) which has inspired a lot of work on the nature of portfolio selection. Two approaches in the literature cover portfolio design: MPT and investment strate-

VaR: value at risk


VaR involves the concept of providing a simple number encapsulating all available risk portfolio information (Rom-bouts and Rengifo, 2004). This number must be understood by people lacking financial skills and the operations involved in calculating it must be fast. VaR is based on two aspects of the financial market: -Managers measure risk as loss in monetary units; and -Portfolio deviations less than expected return do not have the same probability as deviations exceeding expected return

LPM k ( X ; c ) = E [max (c X ,0 )]k = E [min ( X c ,0 )]k , ( k 2 )

REVISTA INGENIERA E INVESTIGACIN VOL. 28 No. 1, ABRIL DE 2008 (105-116)

109

EXPLOITING STOCK DATA: A SURVEY OF STATE OF THE ART COMPUTATIONAL TECHNIQUES AIMED AT PRODUCING BELIEFS REGARDING INVESTMENT PORTFOLIOS

gies (Van der Hart et al., 2001; Amir et al., 2002); this survey focuses on the former. The purpose of the MPT approach is to build a portfolio according to return and risk decision criteria. Models arising from such dual decision criterion have been developed according to the measurement used for evaluating risk (i.e. risk interpretation is the main element of MPT models). Decision criteria in earlier models (before MPT) only consisted of maximising return but, with the introduction of the concept of portfolio diversification, risk became an important element in new models of portfolio selection.

-Min risk: The decision criterion was variance minimisation with a minimum value for return:

min( f 2 (x )) = min x COV (R ) x E RT x


T

f (x )

[ ]
N i

[ f1 (x )]T

(26) (27) (28) (29)

x
i =1

= > 0 (30)

i , xi

Index models
Portfolio diversification reduces securities specific risk but systematic risk is a market feature so it cannot be minimised with portfolios. Systematic risk affects securities return and establishes a relationship between market and security performance. This relationship is security and is defined as follows:

Mean and variance models


This kind of model assumes normal securities probability distribution and represents beliefs about securities future performance. Mean distribution is considered as return while variance is the measurement used for risk. Mean-variance models have assumed that an investor is averse to risk. The available wealth for an investor is 1, so

xw
i =1 i

= W . The

X =

Cov ( RX , Rm ) Var (Rm )

(31)

model presents the following variations according to the constraints and objective functions which are used in the process: -Min-Max: This is the general case for the mean-variance model. Return maximisation and risk minimisation are the decision criteria applied in this mathematical model. The problem thus becomes multi-objective optimisation. The solution set is thus a Pareto front or efficient set (Figure 4 is an example of Pareto front for a Min-Max model). An investor must look at non-dominated solutions when selecting a portfolio and pick one of them according to his particular requirements. The model may be formally presented as follows:

with RX being the return for security X and Rm the market return. Sharpe proposed the CAPM model in 1963 (Sharpe, 1964), assuming that most stock prices increase when the market goes up and decrease when it goes down. A market factor is then introduced to describe such type of security movements. This market factor represents security . Differences between individual securities returns are assumed to be the result of additional independent random disturbances specific to each security. A securitys return has two parts, the first depending on the market and the second being a random variable independent of other securities. The CAPM expression is defined as follows:

f (x ) max( f1 (x )) min ( f 2 (x ))

(16) N = max E R x = max i xi (17) i =1 = min x T COV (R ) x (18)

x
i =1

( [ ]) (
T

[ f1 (x ), f 2 (x )]T

Ri = r f + i (Rm r f )

(32)

with r f being the risk free rate on the market. Sharpes single index model states that a securitys return is a linear function of market return where the market is typically represented by one of the broad equity indices. Other factors different to market movement are observed to have an influence on security prices, such as the effects of industry and interest rates. Multi-index models have thus been proposed as a measurement involving several betas for systematic risk. The general form for multi-index models (with error ei ) is:

= > 0 (20)

(19)

i , xi

-Max-return: The decision criterion was return maximisation with maximum value for risk:

f (x ) max ( f1 ( x ))

(x

COV (R ) x

x
i =1

1 2

(21) N = max E R T x = max i xi (22) i =1

( [ ])

[ f1 (x )]T

Ri = i + j ,i R j + ei
j =1

(33)

(23) (24)

Mean-semi variance models (E-S)


Semi-variance measures risk in this model; it is proposed following the observation that investors may only be concerned with the risk of securities return being lower than the mean.

i , xi

> 0 (25)

110

REVISTA INGENIERA E INVESTIGACIN VOL. 28 No. 1, ABRIL DE 2008 (105-116)

LINARES, HERNNDEZ, GONZLEZ

It is not widely used in spite of its being intuitively closer to reality than the mean-variance model.

Mean absolute deviation model (MAD)


Mean-absolute deviation measures risk in this model (Kommo, 1991):

The beliefs are represented as rules. These rules are considerations about securities performance; the rules are also the knowledge hidden in the historical data. Three approaches for creating beliefs are presented below. Each has its own set of rules. Several computing and systems engineering techniques applied to belief-making are presented in this section. These techniques are classified into three groups: -Time series forecasting; -Association rules; and -Interesting patterns and trends.

N N w( x ) = E Ri xi E R j x j i =1 j =i

(34)

Mean-variance-skewness model (MVS)


Skewness is the third momentum of a probability distribution measuring distribution asymmetry. This model is a natural extension of the mean-variance model which adds skewness as another criterion for portfolio selection (Deng et al., 2000) A third decision criterion is thus introduced: maximise expected skewness value. The MVS optimisation model has two forms: -Max-Min-Max : if curity

is the third momentum for the i-th se-

f (x )

max( f1 ( x )) = max E R T x = max i xi (36) i =1 min( f 2 ( x )) = min x T COV (R ) x (37) N max( f 3 (x )) = max i xi (38) i =1
N

( [ ]) (

[ f1 (x ), f 2 (x ), f 3 (x )]T

(35)

x
i =1

= > 0 (40)

(39)

i , xi

-Max-skewness: if and are the target values for risk and return, respectively:

f (x ) max( f1 (x )) E RT x
T

[ ]
N i

(41) N = max i xi (42) i =1 = (43)

[ f1 (x )]T

x COV ( R) x =

(44) (45)
Figure 5: Time series forecasting models

x
i =1

i , xi

> 0 (46)

Creating beliefs making


Belief-making consists of producing a set of rules defining securities future performance. Many concepts, models and theories concerning which factors are involved in the securities temporal behaviour can be found in the literature (Chen et al., 1986; Burmesteir et al., 2003; Ekern, 1971). These factors or economic forces influencing all stock returns are known as systematic or pervasive risk and are the components making belief-making so interesting.

The first is the most widely used while the rest are attracting new followers within the computational finance community.

Time series forecasting


Securities forecasting is recognised in the community as being a very difficult task insofar as financial time series have special features (Hellstrom and Holmstrom, 1998; Rydberg, 2000). Two ways of modelling the problem from the point of view of data involved in prediction are commonly found in the literature: technical and fundamental analysis. Forecasting is only based on securities historical data in the for-

REVISTA INGENIERA E INVESTIGACIN VOL. 28 No. 1, ABRIL DE 2008 (105-116)

111

EXPLOITING STOCK DATA: A SURVEY OF STATE OF THE ART COMPUTATIONAL TECHNIQUES AIMED AT PRODUCING BELIEFS REGARDING INVESTMENT PORTFOLIOS

mer while fundamental analysis also includes data related to the market situation and other parameters. Technical analysis is based on the assumption that a particular stocks historical performance is a strong indication of future performance. Formally, if si (t ) is the predicted value for the i-th security for time t, si (t ) is defined for technical and fundamental analysis in (47) and (48), respectively, as follows:

-Support vector machines; and -Bayesian networks.

Neural networks
An artificial neural network is used as a universal approximator able to approximate any continuous function without a priori assumptions about the data. The aim of a neural network is to build an internal model (topology and connection values) for forecasting the desired values. The inputs are the si (t ) available values and these are used for training and testing network sets. May strategies have been used for forecasting securities prices according to neural input and output: -Input: individual prices, price combination, prices and technical indicator combinations; and -Output: price forecasting, reversal point forecasting, index forecasting, candlestick forecasting8. The literature presents models ranging from neural networks to time series forecasting (Kodogiannis y Lolis, 2002; Dunis y Jalilov, 2001; Lendasse et al., 2000; Lendasse et al., 1998; Chan et al.), such as recurrent neural networks, feed-forward networks with FIR filters and multilayer perceptrons; Hutchinsons work (Hutchinson, 1999) using radial basis functions networks is a good example of this. Table 1 summarises the neural network approaches used in the literature for financial series forecasting.

si (t ) = f (si (t 1), si (t 2 ),.., si (t n ), I )

si (t ) = f (si (t 1), si (t 2 ),.., si (t n ))

(47) (48)

In (48), I is a vector having the factors representing risk and other fundamental parameters which influence securities behaviour. The list below is an example of these factors: -Inflation; -Interest rates; -Trade balance; -Stock indices: Dow Jones, DAX, Swedish General Index; and -Commodity prices: coffee, oil, currency. Forecasting is formally defined as follows: If

si (t ) is a time series for the i-th security, w is the windows

autoregressive size, H is portfolio horizon planning and g(t) is a function of the factors involved in the process. Securities prediction thus consists of finding the values for si (t ) in the following way:

Evolutionary computation
Evolutionary computation (EC) integrates evolutionary concepts with programming for solving hard optimisation problems. EC is implemented for stock forecasting via two approaches: -Genetic algorithms (Koza, 1989).
Table 1. Artificial neural networks and financial forecasting Neural network approach Reference Multilayer perceptron Kodogiannis and Lolis, 2002 Radial basis functions Kodogiannis and Lolis, 2002 Autoregressive recurrent neural Kodogiannis and Lolis, 2002 network Elman network Kodogiannis and Lolis, 2002 Neuro-fuzzy inference system Kodogiannis and Lolis, 2002 Multilayer perceptron Dunis and Jalilov, 2001 Multilayer perceptron Jao et al., 1999 Radial basis functions Lendasse et al., 2000 Kohonnen network Lendasse et al., 1998 Backpropagation-conjugate Chan et al. gradient Radial basis functions Hutchinson, 1993 Dual coupled network Hernandez et al., 2007

t H , si (t ) = f (si (t 1), si (t 2),.., si (t w), g (t ))


In the case of technical analysis g(t)= 0.

(49)

Prediction is formulated and solved according to two perspectives. The former assumes that the prediction model is linear; the second perspective is more general and defines the model as being non-linear. Figure 5 gives graphical examples of how data is represented by linear and non-linear models. The linear approach generally uses statistical techniques while the contemporary nonlinear approach is based on machine learning and evolutionary computation models. Predicting financial time series has therefore been solved in many ways, as follows: -Linear autoregressive models (AR, ARMA, ARIMA Models), also called scoring models:

si (t ) = am si (t j ) + bm g (t j ) + e(t )
j =1

-Classical nonlinear models (Clements, 2003); -Nonlinear models implemented with artificial neural networks; -Evolutionary computation;
8

Candlestick forecasting is the most recent approach. An example of this is given in (Hernandez et al., 2007) where multiple candlestick representations were used.

112

REVISTA INGENIERA E INVESTIGACIN VOL. 28 No. 1, ABRIL DE 2008 (105-116)

LINARES, HERNNDEZ, GONZLEZ

y = f ( x ) = w ( x ) + b

(50)

where (x ) is the high dimensional space and w and b are estimated by minimising

RSVMs (C ) = C

1 n 1 2 L (d i , yi ) + 2 w n 1=1 d y otherwise

(51) (52)

d y L (d , y ) = 0

Bayesian networks (Heckerman, 1997)


A Bayesian network is a graphical model representing probabilistic relationships amongst variables of interest. Bayesian networks combine traditional quantitative analysis (historical data) with decision-maker judgment concerning qualitative information displayyed in a directed acyclic graph. The models output is a portfolio return distribution according to a Bayesian inference model (Shenoy and Shenoy, 2000). The network nodes represent the quantitative information while the edges represent the qualitative information. The nodes are thus the variables (stocks, indices) and the edges define variable dependencies (conditional probabilities between variables). Each variable has a set of mutually exclusive values called its state space (e.g. dollar price varies and its states are high or low). The model graphically represents the relationship between the factors affecting portfolio return, according to the network designer (Figures 6 and 7 are examples of Bayesian network portfolio models). The model depends on any combination of empirical data, investor expectations, judgment or forecast.

Figure 6. Bayesian Network (Shenoy and Shenoy, 2000)

-Genetic programming (Koza, 1992) Genetic algorithms and genetic programming are used for finding non-linear models; in the genetic programming case, this process is called symbolic regression. For example, Kaboudan (Kaboudan, 2000) used symbolic regression with genetic programming for predicting stock prices.

Support vector machines (SVMs)


Applying SVMs to time series forecasting has become a subject of intense study from the perspective of non-linear regression stimation problems (Muller et al., Tay and Cao, 2001, Cao and Tay, 2001). SVMs estimate the regression function using linear functions which are defined in a high dimensional space. Given a set of G = {xi , d i }n ( xi is the input vector, d i is the desired value and n is the space dimension) data points, the approximation function is:

Association rules
An association rule defines a unidirectional relationship between two sets of attributes. It is an expression of the form if x then y which is supported by data, where x and y are predicates about problem attributes. So a predicate x is a logic expression with connectors and (i.e. A1 2 A1 = 3 A2 = 3 A2 = 1998 ). An example of an association rule in the financial field is something like if dollar increase = 0.1 and euro increase = 0.5, then x stock increase = 0.2. Association rules are also expressed as grammars and deterministic finite state automata when the rule has an associated output. Association rules state the interaction between securities, indexes series and market tendencies in portfolio selection. The aim of data mining process is to automatically extract informative rules from the series. In most cases this means that the rules should have some level of precision, be repressentative of the data, easy to interpret and interesting for a human expert (i.e. novel, surprising or useful). Association rules describe knowledge regarding an application domain. In the case of portfolio selection, the rules describes the knowledge implicit in the market behaviour or the beliefs which decision-makers (such as investors, experts and tra-

Figure 7: A Bayesian network portfolio model (Shenoy and Shenoy, 2000)

REVISTA INGENIERA E INVESTIGACIN VOL. 28 No. 1, ABRIL DE 2008 (105-116)

113

EXPLOITING STOCK DATA: A SURVEY OF STATE OF THE ART COMPUTATIONAL TECHNIQUES AIMED AT PRODUCING BELIEFS REGARDING INVESTMENT PORTFOLIOS

ders) have about market behaviour and securities performance. Extracting rules can be applied to target securities and factors set ST S . A set of time series is analysed to find patterns or relationships between recurrent sets in the selected data. Data mining techniques, such as a priori algorithm and multidimensional association rules (Han and Kamber, 2001), are commonly used for rules extraction. Shen has used an interesting rough sets (Pawlak, 1982) and SOM hybrid model for generating rules forming the input for a trading system. Rough sets is a mathematical tool for dealing with uncertainty (Shen and Loh, 2004). Rough sets have the following advantages in financial prediction: -Integrated analysis of quantitative and qualitative attributes; -Expressing knowledge in terms of natural language rules; -Discovering knowledge in terms of data set key concepts; and -Rough sets do not need any preliminary information about data, such as securities distribution probabilities or risk beliefs. Shen used a rough SOM algorithm for transforming financial data into rough objects which are used to generate decision rules stating that if x then y, where x is a predicate of technical indicators and y is an investment strategy action.

3. Temporal rules inference with SOM and recurrent neural networks (Giles et al., 1997); and 4. Clustering techniques. The purpose of clustering is to group unsupervised objects into classes or clusters according to similarity measurement (Berkhin, 2002). Two rules govern the process: -Minimise the distance between same cluster members; and -Maximise the distance between clusters Clustering techniques are classified into hierarchical, partitioning relocation and density-based partitioning. Hierarchical clustering groups the data into a tree of clusters and is categorised into being agglomerative and/or divisive, according to the strategy used for building the tree (bottom-up, topdown). Partitioning clustering algorithms divide data into several sets in an iterative relocation process driven by greedy heuristics. Density-based methods group data according to concepts of density, connectivity and boundary. For more details about clustering techniques see Berkhin, 2002. Hierarchical and partitioning techniques have been used for universe reduction and stock indexing in portfolio selection in Craighead and Klemesrud, Dose and Silvano Cincoti, Gavrilov et al., Micciche and Fabd, 1995 and Chung et al. Table 2 summarises such techniques.

Conclusions and further work


The list of financial and computational models presented in this survey is a representative list of academic and scientific efforts aimed at solving the automatic portfolio selection problem. Each model presented here addresses one of the portfolio selection stages. There is a financial and mathematical framework through which an investor can tackle the decision-making process in the case of optimal portfolio design. However, MPT models involve strong assumptions which (in most cases) are not appropriate for the several approaches which have been developed for creating beliefs. The survey presented several computational techniques applied to belief-making but also revealed how techniques such as fuzzy logic have not been explored. The reasoning involved in fuzzy logic may be considered as a strategy for modelling investor beliefs and may be mixed with data mining models for discovering market performance rules. Another interesting still to be explored area is the representation of time series as candlesticks; candlestick representation is a tool for technical analysis aimed at forecasting tendencies through visual chart analysis9. For example, Hernandez et al., (2007) used candlestick as a data representation scheme for stock forecasting with neural networks. This kind of representation may be useful for discovering interesting patterns using data mining and linguistic rules.
9 Murphy (1999) is a good reference for understanding the candlesticks technique.

Interesting patterns and trends


Discovering typical or frequents patterns is one of the current great challenges of mining databases containing time series data. An interesting pattern is a sequence of values which are common (or unusual) when collecting data, given a particular consideration. Temporal patterns occur frequently from the point of view of trends and seasonal effects in securities time series and in general financial series (Hellstrom and Holmstrom, 1998a and 1998b). The concept of seasonal effects states a relationship between series behaviour and calendar days; the calendar thus influences market and securities performance. The day-of-the week and month effect are examples of how the academic community approaches financial series prediction. Stock trends are also an interesting field in portfolio theory. This type of pattern has been widely studied, both theoretical and experimentally, for the followers of technical analysis. Several models have been used for finding interesting patterns in securities series: 1. Prediction rules for data mining with genetic programming (Hetland and Saetrom, 2005); 2. Entropy and statistical dependency analysis (Darbellay and Wuertz, 2000; Cheng, 1999);

114

REVISTA INGENIERA E INVESTIGACIN VOL. 28 No. 1, ABRIL DE 2008 (105-116)

LINARES, HERNNDEZ, GONZLEZ

Artzner, P., Delbaen, F., Eber, J., Heath, D., Coherent measures of risk., MathemaTechnique Category Description tical Finance, Vol. 9, 1999, pp. 203228. PAM (partitioning amongst methods (Berkhin, 2002)]) is used Berkhin, P., Survey of clustering data mifor stock selection, reducing the stocks initial universe, ning techniques., technical report, Accrue PAM Partitioning according to k representative clusters defined by the user and using L1 (Manhattan) as distance measurement (Craghead and Software, San Jose, CA, 2002. Klemesrud) Burmesteir, E., Roll, R., Ross, S., Using maAgglomerative complete link clustering is used for indexing croeconomic factors to control portfolio tracking and enhanced index tracking for stocks. It uses two risk., tech. rep., Insightful, 2003. distance measurements (Dose and Silvano): Cao, L., Tay, F., Financial forecasting u(i) d ( x, y) = 2(1 cxy ) ; cxy := correlatio coefficien n t sing support vector machines., Neural and Computing Applications, Vol. 10, 2001, (ii) d ( x, y) = min{d1 , d 2 } Linkage Hierarchical pp. 184192. 1 T x ay 2 t d1 ( x, y) = minaR t Chan, M.-C., Wong, C.-C., Lam, C.-C., T t =1 xt Financial time series forecasting by neural 2 1 T x ay network using conjugate gradient learning t d 2 ( x, y) = minaR t algorithm and multiple linear regression T t =1 ayt weight initialization., Department of ComR is the index return,T is the time period puting, The Hong Kong Polytechnic UniAgglomerative complete link clustering with Euclidean distance versity. Linkage Hierarchical measurement is used for S&P 500 index tracking (Gavrilov Chen, N.-F., Roll, R., Ross, S. A., Econoetal.). mic forces and the stock market., Journal This technique is used for finding a cross-correlationhip of Business, Vol. 59, No. 3, pp. 383403, between the 500 highly capitalised stocks traded on the New 1986. available at http://ideas.repec.org/ York Stock Exchange from 1987-1998. Data is clustered on a Linkage Hierarchical minimum spanning tree by means of single linkage with a/ucp/jnlbus/v59y1986i3p383-403.html. correlation distance on log returns (Micciche and Fabd, Cheng, C.-H., Entropy-based subspace 1995). clustering for mining numerical data., MasFinancial time series indexing by means of K-means algorithm K-Means Partitioning ters thesis, Department of Computer with Euclidean distance (Chung et al.). Science & Engineering, Chinese University of Hong Kong, 1999. Further work in the field must be orientated towards integrating good practice and models for each stage in the process Chung Fu, T., Lai Ching, F., Luk, R., man Ng, C., Financial in a computer-assisted model helping an investor to build time series indexing based on low resolution clustering. scenarios and portfolio efficient sets having the following feaClements, M. P., Forecasting economic and financial timetures: series with non-linear models., Department of Economics University of Warwick, October 2003. The model must involve quantitative and qualitative inforCraighead, S., Klemesrud, B., Stock selection based on mation in the belief building process; cluster and outlier analysis. Nationwide Financial. Clustering and classification techniques must be used for exDarbellay, G. A., Wuertz, D., The entropy as a tool for anatracting patterns and trends from historical data to support lysing statistical dependences in financial time series., series forecasting and data mining for investment rules; Physica A, D. Vol. 287, No. 3-4, 2000, pp. 429439. Deng, X.-T., Wang, S.-Y., Xia, Y.-S., Criteria, models and Correlation series analysis and data mining techniques must strategies in portfolio selection, AMO Advanced Mosupport knowledge extraction aimed at building portfolio dedeling and Optimisation., Vol. 2, No. 2, 2000, pp. 79 sign models and defining risk measurement; 103. Modern portfolio models must be applied to multi-period Dose, C., Cincoti, S., Clustering of financial time series with portfolio selection; and application to index and enhanced-index tracking portfolio., tech. rep., Universit di Genova. Belief-building approaches (time series forecasting, extracting Dunis, C., Jalilov, J., Neural network regression and alterrules, pattern extraction, candlesticks) must support new native forecasting techniques for predicting financial portfolio design models. variables., tech. rep., Liverpool Business School, 2001, pp. 15 Bibliography Ekern, S., Taxation, political risk and portfolio selection., Economica, Vol. 38, No. 152, 1971, pp. 42130, Amir, R., Evstigneev, I. V., Hens, T., ReinerSchenk-Hopp, K., available at http://ideas.repec.org/a/bla/econom/v38y19 Market selection and survival of investment strategies., 71i152p421-30.html. Tech. Rep. 02-16, University of Copenhagen. Institute of
Table 2: Clustering techniques for financial time series

Economics, Oct. 2002, available at http://ideas.repec. org/p/kud/kuiedp/0216.html.

REVISTA INGENIERA E INVESTIGACIN VOL. 28 No. 1, ABRIL DE 2008 (105-116)

115

EXPLOITING STOCK DATA: A SURVEY OF STATE OF THE ART COMPUTATIONAL TECHNIQUES AIMED AT PRODUCING BELIEFS REGARDING INVESTMENT PORTFOLIOS

El-Yaniv, R., Competitive solutions for online financial problems., ACM Computing Surveys, Vol. 30, pp. 2869, Mar. 1998. Gavrilov, M., Anguelov, D., Indyl, P., Motwani, R., Mining the stock market: Which measure is best?., tech. rep., Department of Computer Science- Stanford University. Giles, C. L., Lawrence, S., Tsoi, A. C., Rule inference for financial prediction using recurrent neural networks., in Proceedings of IEEE/IAFE Conference on Computational Intelligence for Financial Engineering (CIFEr), (Piscataway, NJ), IEEE, 1997, pp. 253259. Giorgi, E. D., A note on portfolio selection under various risk measures., Tech. Rep. iewwp122, Institute for Empirical Research in Economics - IEW, 2002. available at http://ideas.repec.org/p/zur/iewwpx/122.html. Glavan, C. An application of alternative risk measures to trading portfolios., Masters thesis, Finance School, Zurich University, 2004. Goldberg, D., Genetic algorithms in search, optimisation and machine learning., Addison-Wesley Professional, 1989. Han, J., Kamber, M., Data Mining: Concepts and Techniques., San Francisco: Morgan Kaufmann Publishers, 2001. Heckerman, D., Bayesian networks for data mining., Data Mining and Knowledge Discovery, Vol. 1, No. 1, 1997, pp. 79119. Hellstrom, T., Holmstrom, K., Predicting the stock market., Tech. Rep. IMa-TOM-1997-07, Center of Mathematical Modelling - Malardalen University, August 1998a. Hellstrom, T., Holmstrom, K., Predictable patterns in stock returns., Tech. Rep. HEV-BIB-OP-30-SE, Center of Mathematical Modelling - Malarden University, 1998b. Hernandez, G., Linares, M., Rojas, S., On candlestick forecasting with an adaptive coupled dual neural network., in Memorias Congreso Internacional de Inteligencia Computacional CIIC 2007, 2007. Hetland, M. L., Saetrom, P., Evolutionary rule mining in time series databases., Machine Learning, Vol. 58, Feb 2005, pp. 107125. Hutchinson, J. M., A radial basis function approach to financial time series analysis. Tech. Rep. AITR-1457, Massachusetts Institute of Technology, 1993. Kaboudan, M., Genetic programming prediction of stock prices, Computational Economics., M. ol. 16, 2000, pp. 207 136. Kodogiannis, V., Lolis, A., Forecasting financial time series using neural networks and fuzzy system-based techniques., Neural Computing and Applications, Vol. 11, 2002, pp. 90102. Kommo, Y. H., Mean-absolute deviation model for portfolio optimisation and its application to Tokyo stock market., Management Science, Vol. 37, 1991, pp. 519531.

Koza, J., ed., Genetic Programming: On the Programming of Computers by Means of Natural Selectio., The MIT Press, 1992. Markowitz, H., Portfolio selection., Journal of Finance, Vol. 7, 1952, pp. 7791. Lendasse, A., Bodt, E. D., Wertz, V., Verleysen, M., Nonliner financial time series forecasting-application to the bel 20 stock market index., European Journal of Economic and Social Systems, Vol. 14, 2000, pp. 8191. Lendasse, A., Verleysen, M., de Bodt, E., Forecasting timeseries by kohonnen classification., in European Symposium on Artificial Neural Networks 1998 proceedings, 1998. Markowitz, H., The early history of portfolio theory: 16001960., Financial Analyst Journal, 1999. Micciche, S., Abd, F., Mantegna, R. N., Correlation-based hierarchical clustering in financial time series., 1995. Muller, K., Smola, A., Vapnik, V., Using support vector machines for time series prediction., tech. rep., Image Processing Services Research Lab. Murphy, J., Technical analysis of the financial markets., New York Institute of Finance, 1999. Nawrocki, D., A brief history of downside risk measures. Villanova University. Pawlak, Z., Rough sets., International Journal of Information and Computer Sciences, Vol. 11, 1982, pp. 341356. Rombouts, J., Rengifo, E., Dynamic optimal portfolio selection in a var framework., Tech. Rep. 04-05, HEC Montreal, Institut dconomie applique, July 2004, available at http://ideas.repec.org/p/iea/carech/0405.html. Rydberg, T. H., Realistic statistical modelling of financial data., Internat. Statist. Rev., Vol. 68, 2000, pp. 233258. Sharpe, W., Capital asset prices: A theory of market equilibrium under conditions of risk., Journal of Finance, Vol. 19, 1964, pp. 425442. Shen, L., Loh, H. T., Applying rough sets to market timing decisions., Decis. Support Syst., Vol. 37, No. 4, 2004, pp. 583597. Shenoy, C., Shenoy, P. P., Bayesian network models of portfolio risk and return., The MIT Press, 2000. Tay, F., Cao, L., Application of support vector machines in financial time series forecasting., The International Journal of Management Science, vol. 29, 2001, pp. 309317. Van der Hart, J., Slagter, E., Van Dijk, D., Stock selection strategies in emerging markets., Tech. Rep. 01-009/4, Tinbergen Institute, Jan, 2001, available at http://ideas.repec.org/p/dgr/uvatin/20010009.html. William, J. B., Theory of investment value. Harvard University, 1938. Yao, J., Tan, C. L., Poh, H.-L., Neural networks for technical analysis: A study on KLCI., International Journal of Theoretical and Applied Finance, Vol. 2, 1999, pp. 221 241.

116

REVISTA INGENIERA E INVESTIGACIN VOL. 28 No. 1, ABRIL DE 2008 (105-116)

Apndice B: Glosario de Trminos e e Financieros


Accin o
Las acciones son t tulos nominativos de carcter negociable que representan un porcentaje de para ticipacin en la propiedad emisora del t o tulo. Solo pueden ser negociadas las emitidas por sociedades annimas. La rentabilidad de la inversin est ligada a las utilidades obtenidas por la empresa en la o o a que invirti a travs del pago de dividendos, as como la valorizacin del precio de la accin en bolsa. o e o o

Accin Ordinaria o
Accin que tiene la caracter o stica de conceder a su titular derechos econmicos y no econmicos o o provenientes de la participacin en capital de la entidad emisora. Los econmicos estn relacionados o o a con la posibilidad de percibir dividendos y los no econmicos con el derecho a voto en la asamblea. o

Accin Preferencial o
Accin que da a su poseedor prioridad en el pago de dividendos y/o en caso de disolucin de la o o empresa, el reembolso de capital. No da derecho a voto en las asambleas, excepto cuando se especica este derecho.

Accin Privilegiada o
Clase de accin que otorga al titular, adems de los derechos consagrados para las acciones ordinarias, o a los siguientes privilegios: Derecho preferencial para su reembolso en caso de liquidacin hasta la concurrencia de su valor o nominal. Derecho a que de las utilidades se les destine, en primer trmino una cuota determinable, acue mulable o no. La acumulacin no podr extenderse a un per o a odo superior a 5 aos y cualquier n otra prerrogativa de caracter exclusivamente econmico. o En ningn caso podr otorgarse privilegios que consistan en voto mliple, o que priven de sus u a u derechos de modo permanente a los propietarios de acciones comunes.

Autocorrelacin o
Ver Correlacin serial o 69

Agente
Rol o individuo que toma parte dentro de la dinmica de un sistema nanciero. a

Arbitraje
Compra de un activo en un mercado a un precio menor, y venta simultnea de un activo idntico en a e otro mercado a un precio mayor. Esto es hecho sin costo o riesgo.

APT
Arbitrage Pricing Theory. Teor de precios de activos en equilibrio, que se deriva de un modelo de a factores usando diversicacin y arbitraje. Esta teor muestra que el retorno esperado de un activo o a riesgoso es una combinacin lineal de varios factores. o

Beta
Coeciente beta. Medida de la sensibilidad del retorno de un activo a los movimientos en un factor caracter stico, como por ejemplo el retorno del mercado o la tasas de inters. Es tambin una medida e e del riesgo sistemtico. a

Bolsa de Valores
Mercado en el cual compradores y vendedores negocian instrumentos de inversin a travs de los o e comisionistas de bolsa. Las Bolsas de Valores son mercados organizados y especializados, en los que se realizan transacciones con t tulos valores por medio de intermediarios autorizados, conocidos como Casas de Bolsa o Comisionistas de Bolsa. Las Bolsas ofrecen al pblico y a sus miembros las facilidades, mecanismos u e instrumentos tcnicos que facilitan la negociacin de titulos valores susceptibles de oferta pblica, e o u a precios determinados mediante subasta.

Bono
Son valores o t tulos de deuda de largo plazo, que representan una parte de un crdito constituido e a cago de una entidad emisora. Su plazo m nimo es de un ao. Se caracterizan porque el emisor n se compromete como retorno de la inversin a entregar una tasa de inters jada de acuerdo a las o e condiciones del mercado y se representa en pagos anuales denominados cupones, y un valor nal denominado valor facial. Por sus caracter sticas son considerados como t tulos de renta ja.

Burstil a
Concerniente a la bolsa, a las operaciones que en ella se hacen y a los valores cotizables.

CAPM
Capital Asset Pricing Model. Es una teor de valoracin de activos que muestra que las tasas de a o equilibrio de los retornos esperados sobre todos los activos riesgosos, son una funcin de su covarianza o con el portafolio del mercado. 70

Conjunto Eciente
Grca que representa un conjunto de portafolios que maximizan el retorno esperado para cada nivel a de riesgo.

Comisionista de Bolsa
El comisionista de bolsa es un profesional especializado en proporcionar asesor nanciera. Dadas las a condiciones de honorabilidad e idoneidad que involucra su labor,debe ofrecer mltiples alternativas de u negociacin a los inversionista, respaldadas por su conocimiento sobre el comportamiento del mercado o y la informacin de los t o tulos y de las entidades emisoras. La funcin bsica del comisionista es la intermediacin en la compra y venta de t o a o tulos. Por sus servicios cobra una comisin que debe es previamente acordada con el inversionista y se registra en el o comprobante de liquidacin que expide la bolsa. o Las funciones y alcance de los comisionistas de bolsa, denidos bajo autorizacin de la Superino tendencia de Valores y sujetas a las condiciones que je la Sala General son: Intermediacin en la colcocain de t o o tulos. Adquisicin de valores por cuenta propia. o Realizar operaciones por cuenta propia con el n de dar mayor estabilidad a los precios y liquidez del mercado. Constituir y administrar Fondos de Valores. Administrar valores de sus comitentes con el propsito de realizar cobro del capital y sus o rendimientos y reinvertirlo de acuerdo con las instrucciones del cliente. Administrar portafolios de valores de terceros. Otorgar prstamos con sus propios recursos para nanciar la adquisicin de valores. e o Celebrar compraventas con pacto de recompra sobre valores.

Correlacin Serial o
La correlacin de una variable consigo misma, a travs de intervalos de tiempo sucesivos. o e

Dividendo
Pago hecho por una rma a sus accionistas, representado en dinero o en acciones. Tambin se denomina e como el componente de ingreso del retorno sobre la inversin en acciones. o

EMH
Ecient Market Hypothesis.

Entidad Emisora
Ver Emisores de Valores. 71

Emisores de Valores
Son entidades que emiten t tulos valores de participacin o de contenido crediticio para colocarlos en o el mercado, directamente o a travs de Sociedades Comisionistas de Bolsa y obtener recursos. Las e compa emisoras pueden ser Sociedades Privadas Annimas o Limitadas y Pblicas (municipios, nas o u departamentos, etc.). Una persona natural no puede ser emisora de t tulos valores.

Indice General de la Bolsa de Valores de Colombia (IGBC)


Se dene como el indicador burstil del mercado accionaria de la Bosa de Valores de Colmbia. Reeja a las uctuaciones (comportamiento promedio) que por efectos de oferta y demanda o por factores externos del mercado,sufren los precios de las acciones. Es el instrumento ms representativo, gil y a a oportuno para evaluar la evolucin y tendencia del mercado accionario. El IGBC mide de manera o agregada la evolucin de los precios de las acciones ms representativas del mercado. El objetivo o a principal es reejar la variacin en el tiempo del precio de tal forma que cumpla el requisito de o replciabilidad, es decir, que a partir del mismo se pueda conformar un portafolio con las acciones del ndice y as tener una base fundamental para la construccin de productos derivados. o

L nea de Mercado de Capitales


Conjunto eciente de todos los activos, tanto riesgosos como libres de riesgo, que proporciona al inversionista el mejor conjunto de oportunidades posibles de inversin para conformacin de un portafolio. o o

Liquidez
Facilidad y rapidez de conversin de activos en efectivo. o

Mercado Burstil a
Se reere a aquel escenario o sistema de transaccin especialmente organizado para negociar valores o por intermedio de sociedades comisionistas de bolsa u otros agentes especialmente autorizados, en condiciones de transparencia, equidad, igualdad, oportunidad y seguridad de cumplimiento, previstas en las normas legales, y por cuya estricta aplicacin velan las bolsas de valores. o

Mercado de Capitales
El mercado de capitales es una herramienta bsica para el desarrollo econmico de una sociedad, a o en la medida que a travs de este se hace la transicin del ahorro a la inversin. Este moviliza e o o recursos principalmente de mediano y largo plazo, desde aquellos sectores que tienen dinero en exceso (ahorradores o inversionistas) hacia las actividades productivas (empresas, sector nanciero, gobierno) mediante la compraventa de t tulos valores.

Mercado de Dinero
Mercado nanciero para para deuda de corto plazo.

Mercado Eciente
Mercado en el cual los precios revelan totalmente la informacin disponible. o 72

Mercado de Intercambio
Un mercado de intercambio es un sistema nanciero en el cual se transan activos que generalmente son acciones o t tulos (Ejemplo: bolsas de valores, mercados electrnicos, subastas) o

Mercados Financieros
Mercados que negocian con ujos de efectivo en el tiempo, donde el dinero de los ahorradores es puesto para cubrir las necesidades nancieras de las personas que requieren de efectivo.

Mercado Perfecto
Mercado nanciero perfectamente competitivo. Mercado en el cual ningn negociador tiene el poder u de intervenir en el precio de los bienes o los servicios. Los mercados perfectos se caracterizan por las siguientes condiciones: No hay costos de transaccin, ni costos de acceso a la inforamcin del mercado. o o La informacin acerca de oportunidades para prestar o pedir prestado es disponible. o Hay muchos neociadores y ninguno tiene un impacto signicativo sobre los precios del mercado.

Mercado de Renta Variable


Es aquel en donde la rentabilidad de la inversin, esta ligada a las utilidades obtenidas por la empresa o en la cual se invirti y por las ganancias de capital obtenidas por la diferencia entre el precio de o compra y venta. Este mercado esta compuesto por acciones, bonos convertibles en acciones (Boceas), derechos de suscripcin y t o tulos provenientes de procesos de titularizacin donde la rentabilidad no o esta asociada a una tasa de inters espec e ca.

Mercado de Valores
Es el conjunto de agentes, instituciones, instrumentos y formas de negociacin que interactan facilio u tando la transferencia de capitales para la inversin a travs de la negociacin de valores. El mercado o e o de valores es un componente del mercado nanciero que abarca tanto al mercado de dinero como al de capitales.

Modelo de Factores
Modelo en el cual el retorno de las acciones es generado a partir de factores comunes, que se denominan fuentes del riesgo sistemtico. a

Nemotcnico e
Es el cdigo de identicacin de las acciones en el mercado. Para el caso colombiano se utilizan las o o siguentes reglas para denicin de nemotcnicos: o e Para las acciones ordinarias se utiliza el nombre abreviado de la compa inscrita o un nombre na con que el mercado lo identica fcilmente. a 73

Para las acciones preferenciales, en los dos primeros campos del nemotcnico se utiliza la abree viatura PF seguida del nombre abreviado, o nombre con que el mercado identica fcilmente a a la compa inscrita. na Para los Bonos convertibles en acciones, en los dos primeros campos del nemotcnico, se utiliza la e abreviatura BC seguida del nombre abreviado o nombre que el mercado identica a la compa na inscrita.

Opcin o
Derecho, pero no obligacin, para la compra o venta de un activo a un precio establecido, durante un o per odo de tiempo espec co.

Posicin Corta(Short position) o


Representa la venta de un t tulo o activo, mediante la asignacin de una proporcin o negativa dentro o o de un portafolio de inversin. o

Principio de Diversicacin o
Los portafolios altamente diversicados tendrn un riesgo no sistemtico(diversicable) insignicante, a a es decir, el riesgo no sistemtico desaparece en los portafolios; solo el riesgo sistemtico sobrevive. a a

Principio de Separacin o
Establece que la seleccin de un portafolio puede separarse en dos tareas independientes: o Determinacin del portafolio riesgoso ptimo o o Seleccin personal de la mejor mezcla del portafolio riesgoso con un activo libre de riesgo. o

Portafolio de Mercado
De forma conceptual, es un indice ponderado de los valores del universo de activos disponible. En la prctica es un a ndice como el S&P500, que describe el retorno de invertir en toda las acciones del mercado, o por lo menos en las acciones que conforman el ndice. Un portafolio de mercado representa el retorno promedio de los inversionistas.

Retorno
Ganacia o perdida sobre inversiones de capital o activos.

Retorno Esperado
Promedio ponderado de todos los posibles retornos, donde el factor de ponderacin es la probabilidad o de ocurrencia de cada uno. 74

Riesgo
Probabilidad de obtener un resultado diferente el esperado. El riesgo puede ser riesgo de crdito(que e corresponde al emisor de valor) o de mercado(que se deriva de las uctuaciones en los precios o tasas de negociacin). o

S&P 500
El ndice Standard & Poor 500, representa la evolucin del mercado americano. El S&P 500 est como a puesto por 500 de las compa ms importantes de las que cotizan en el mercado estadounidense. nas a Para elegir sus componentes se tienen en cuenta criterios como capitalizacin de la accin en el mero o cado, liquidez y representacin sectorial de cada compa o na. El S&P 500 es un ndice ponderado por capitalizacin burstil. Para su calculo se utiliza una o a frmula en la que se atiende al valor de mercado de cada componente y se aplica un divisor, que es o un coeciente de ajuste para evitar que ciertos hechos corporativos que se produzcan en sus integrantes(por ejemplo ampliaciones de capital), alteren el valor del ndice.

Tipos de Valores
Los tipos de valores son los siguentes: Acciones. Bonos. Papeles comerciales. Certicados de deposito de mercanc as. Cualquier t tulo o derecho resultante de un proceso de titularizacion. Certicados de depsito a trmino (CDT). o e Aceptaciones bancarias. Cdulas hipotecarias. e T tulos de deuda pblica. u

Teror de la Agencia a
Es la teor de la relacin entre principales y agentes. Est envuelve la naturaleza de los costos de a o a resolucin de conictos de inters entre los principales y los agentes. o e

T tulo Valor
Es un instrumento negociable en el cual una persona invierte dinero con la esperanza de obtener una ganancia o rendimiento, que est relacionado con el riesgo, y que debe ser pagado por el emisor del a instrumento. De acuerdo con los derecho sealados por el t n tulo, estos pueden ser de participacin, de o crdito o representativos de mercancias, o t e tulos mixtos.

75

Apndice C: Resumen de Probabilidad y e Estad stica


Experimento aleatorio
Un experimento aleatorio es aquel que proporciona diferentes resultados aun cuando se repita siempre de la misma manera. Es un procedimiento que tiene la propiedad que al ser ejecutado bajo las mismas condiciones puede arrojar diferentes resultados.

Variable aleatoria
Se dene como el resultado de un experimento aleatorio , y matemticamente se expresa como una a funcin o X: que asigna un valor numrico real a cada uno de los elementos del espacio muestral del experimento e aleatorio (ver Figura 1). De forma general las variables aleatorias se denotan con letras maysculas, u mientras que un valor particular se representa con la respectiva letra minscula indexada. Ejemplo si u X es una variable aleatoria que representa el precio de cierre de una accin en el tiempo, entonces xi o es el precio para el instante de tiempo i-simo. e

Figura 1: Variable Aleatoria

77

Media
La media aritmtica o promedio x, de una cantidad nita de nmeros, es igual a la suma de todos ellos e u dividida entre el nmero de sumandos. Expresada de forma ms intuitiva, podemos decir que la media u a (aritmtica) es la cantidad total de la variable distribuida a partes iguales entre cada observacin. e o Por ejemplo, si en una habitacin hay tres personas, la media de dinero que tienen en sus bolsillos o ser el resultado de tomar todo el dinero de los tres y dividirlo a partes iguales entre cada uno de a ellos. Es decir, la media es una medida central de tendencia de una distribucin suponiendo que cada o observacin tiene el mismo peso o importancia en el clculo. o a As dados los valores x1 ,xn , ... , xn , la media aritmtica es igual a: , e x=
1 n n i=1

xi

Valor Esperado
La esperanza o valor esperado de una variable Aleatoria X, se denota E[X] o X . De acuerdo con la informacin disponible, el valor esperado se dene como la media aritmtica en la medida que o e se dispoga de los valores representados como una serie de datos; si la informacin disponible es la o distribucin de probabilidad fX (x) de la variable aleatoria X, el valor esperado se expresa entonces o as : Caso discreto: E[X] = Caso continuo: E[X] =
n i=1

xi fX (xi ) xfX (x)dx

Varianza
Es un estimador de la divergencia o dispersin de una variable aleatoria X con respecto a su valor o esperado E[X] o medida de tendencia central. En el caso de la Teor Moderna de Portafolio, la a varianza es la medida utilizada para cuanticar el riesgo, entendida como la volatilidad asociada con el retorno de los t tulos. La varianza de una variable aleatoria E[X] se dene de la siguiente forma:
2 V AR(X) = X

1 n1
n

(xi E[X])2
i=1

(6.1) (6.2) (6.3)

= E[X E[X]]2 =
i=1

(xi E[X])2 fX (x)

Nota: la varianza muestral se utiliza cuando se dispone de la informacin en formato de series de o datos; de lo contrario se usa la forma basada en la distribucin de los datos, como en el caso de varios o escenarios posibles de retorno esperado.

Desviacin Estndar o a
Es la ra cuadrada positiva de la varianza y se denota con la letra . z 78

Covarianza
Es una medida de la relacin que existe entre 2 variables aleatorias (X,Y) en un espacio de probabilidad, o y se denota XY o COV (X, Y ): 1 COV (X, Y ) = n
n

(xi E[X])(yi E[Y ])


i=1

(6.4) (6.5)

= E[(Xi E[X])(Yi E[Y ])]

La covarianza es una medida de de asociacin lineal entre las variables aleatorias (ver Figura 2): o Si XY > 0: existe una relacin lineal entre las variables; las dos variables crecen o decrecen a o la vez. Si XY = 0: no hay relacin lineal. o Si XY < 0: hay relacin lineal negativa; cuando una variable crece la otra tiende a decrecer. o

Correlacin o
Es una cantidad sin dimensiones que puede emplearse para comparar las relaciones lineales entre pares de variables que tienen unidades distintas. La correlacin entre 2 variables aleatorias X,Y ,se denota o XY o CORR(X, Y ): COV (X, Y ) X Y XY = X Y

XY =

(6.6) (6.7)

La correlacin escala la covarianza por la desviacin estndar de cada variable (ver Figura 3). En o o a esta medida 1 XY 1

79

Figura 2: Covarianza

Figura 3: Correlacin o

80

Apndice D: Desarrollo de la Herramienta e Computacional


Visin o
El ojetivo del proceso de desarrollo es implementar una herramienta para soporte a la toma de decisiones en el proceso de Seleccin de Portafolio. Esta herramienta no tendr las funcionalidades propias o a de un sistema automtico de trading que se encarga de jar posiciones de compra de t a tulos y toma de utilidades de forma automtica. Como es una herramienta de soporte a la toma de decisiones, permia tir al agente identicar expectativas en forma de reglas que se construyen identicando candlesticks a en las series de acciones. La herramienta proporcionar funcionalidad de soporte al proceso de seleccin de portafolio a a o travs de dos componentes arquitectnicos de software que son: e o Adquisicin de datos (PDM-Data Manager): este prototipo proporcionar al usuario la funo a cionalidad para carga y gestin de los datos que sern usados en los procesos de identicacin o a o de formas bsicas y generacin de expectativas. Estos datos son los precios de las acciones moda o elados como series de tiempo. Los precios de las acciones se pueden obtener via internet en las pginas de los mercados burstiles o en pginas de terceros que prestan el servicio de descarga a a a como en el caso de http://nance.yahoo.com. Como dentro de los alcances del proyecto no se encuentra la conexin directa contra un servicio que proporcione los datos de las acciones, la o estrategia a seguir es descargarlos manualmente y luego introducirlos a la base de datos de la aplicacin mediante una interfaz grca que facilite el proceso. La Figura 4 presenta el modelo o a de datos para persistencia en la base de datos. Para efectos de modelado de los precios de las acciones es necesario modelar todas las entidades de datos asociadas con estos. Estas entidades son: mercados, compaias, t n tulos(acciones) y precios. Generacin de expectativas (PDM-Patterns): este componente consume los datos de las series o nancieras, con el objetivo de detectar patrones de tendencia del mercado basados en el modelo de candlesticks del anlisis tcnico. De forma general el modelo de generacin de expectativas a a e o implementar es incluye las siguientes fases: (i) Preprocesamiento - Identicacin formas bsicas: consiste en convertir los datos de las o a series nancieras en patrones candlestick simples a travs de lgica difusa. El prototipo e o asociado con este modulo se llama PDM-Candles y su objetivo es proporcionar al usuario la funcionalidad de transformar una serie de precios de acciones en su representacin de formas o bsicas de candlesticks. Los candlestick individuales (formas bsicas), que se utilizarn para a a a el preprocesamiento son (ver Figura 5): Marubozu (1), Long days (2), Long lower shadow (3), Shaven Head (4), Hanging Man (5), Hammer (6), Spinning Top (7), Inverted Hammer (8), Shooting Star (9), Shaven Bottom (10), Long upper shadow (11), Dojis (12). (ii) Construccin de catlogo: utilizando rboles de prejos se construye un catlogos de reo a a a glas contenidas en el conjunto de datos. El prototipo asociado con este mdulo se llama o 81

Figura 4: Modelo de datos - PDM Data Manager

PDM-Prextree. El objetivo de este prototipo es la construccin de un catlogo de pao a trones candlesticks, basndose en el proceso de reconocimiento de formas bsicas y en la a a organizacin de secuencias de estas mediante rboles de prejos. El prototipo debe proporo a cionar al usuario una interfaz a travs de la cual podr seleccionar varias series de acciones e a sobre las cuales se har el anlisis, y un periodo de anlisis que aplicar para las series a a a a seleccionadas. (iii) Generacin de expectativas: proporciona al usuario horizontes posibles de reglas, con base o en un dia de seleccin denido por el tomador de decisiones. El prototipo asociado con o este mdulo se llama PDM-Patterns y su objetivo es proporcionar al usuario, un ambiente o de soporte a la toma de decisiones en el proceso de diseo de portafolio, basndose en n a expectativas de comportamiento individual de acciones, que son construidas utilizando el modelo de reconocimiento de candlesticks y construccin de catlogo de patrones. o a 82

Figura 5: Formas bsicas a

La arquitectura utilizada es un modelo de cuatro capas general: presentacin, negocio, acceso o a datos y datos (ver Figura 6). La presentacin se implementa como vistas independientes o implementadas en formularios swing con lenguaje Java. La capa de negocio se implementa con un proyecto de servicios(Services) y uno de clases utilitarias(Helpers). La capa de servicios implementa la lgica de negocio de la aplicacin y su objetivo es proporcionar a la capa de o o presentacin servicios que ejecuten la funcionalidad para cada uno de los mdulos. La capa de o o acceso a datos se implementa en un proyecto llamado Data Model. Esta ultima capa utiliza los patrones DAO y VO para el acceso a datos y representacin del modelo relacional. o

Plan de Iteraciones
Para efecto del desarrollo del proyecto, se utiliza un proceso iterativo organizado por fases: Fase de inicio, Fase de construccin, Fase de experimentacin. Cada fase tiene un conjunto de resultados o o materiales asociados a cada, de tal forma que se tengan mecanismos de control y visualizacin de los o alcances obtenidos; estos resultados son documentos respectivos de cada fase y cuatro prototipos de software. La descripcin de cada una de las fases es la siguiente: o 1. Fase de Inicio: consiste en la recopilacin de toda la informacin necesaria para la denicin de o o o los requerimientos propios del modelo a desarrollar. El resultado de esta fase es un documento de estado del arte y un documento de visin sobre el modelo propuesto. Esta fase tiene una o iteracin. o 2. Fase de Construccin: consiste en el desarrollo de los cuatro prototipos que formarn el sistema o a de soporte. Por cada prototipo a implementar se dene una iteracin completa de desarollo. o Estas iteraciones se describen a continuacin: o a) Primera iteracin: el objetivo de esta es implementar el prototito de adquisicin y admino o istracin de datos PDM-DataManager. o b) Segunda iteracin: el objetivo de esta es implementar el prototipo para reconocimiento de o formas bsicas utilizando un sistema clasicador difuso. a c) Tercera iteracin: el ojetivo de esta es implementar el prototipo generador del catlogo de o a patrones PDM-Prextree, utilizando el prototipo anterior. d) Cuarta iteracin: el objetivo de esta es implementar el prototipo para generacin de expeco o tativas de diseo de portafolio. n 83

Figura 6: Arquitectura general

3. Fase de Experimentacin: consiste en la ejecucin de experimentos utilizando los prototipos o o generados. El detalle de esta fase se presenta en el Cap tulo 5.

Modelo de uso
El modelo de uso describe las funcionalidades que proporciona el sistema, desde el punto de vista del usuario y a manera de requerimientos. Las Figuras 7, 8, 9 y 10 presentan los diagramos de casos de uso de los prototipos.A continuacin se detallan los requerimientos de cada uno de los prototipos del o sistema:

PDM-Data Manager
La Figura 7 muestra el diagrama de casos de uso del sistema. Estos casos de uso describen los requerimientos del prototipo desde el punto de vista de la funcionalidad que proporciona al usuario. Estos requerimientos se detallan a continuacin por mdulo: o o Administracin de mercados o REQ-M-01: El usuario podr ver el listado de todos los mercados registrados en el sistema. a REQ-M-02: El usuario podr adicionar y modicar mercados con la siguiente informacin: noma o bre, nemotcnico y descripcin. e o 84

Figura 7: Diagrama casos de uso PDM-Data Manager

REQ-M-03: El usuario podr eliminar mercados, solo si el mercado a eliminar no tiene compa a nas asociadas. Administracin de compa o nas REQ-C-01: El usuario podr ver el listado de todas las compa que estan asociadas a un a nas mercado particular. REQ-C-02: El usuario podr adicionar compa a un mercado y modicarlas luego de la a nas creacin. La informacin de una compa es : nombre, s o o na mbolo, descripcin. o 85

Figura 8: Casos de uso PDM-Candles

REQ-C-03: El usuario podr eliminar compa del sistema, solo si la compa a eliminar no a nas na tiene t tulos asociados. Administracin de t o tulos REQ-T-01: El usuario podr ver el listado de todos los t a tulos registrados en el sistema por compa na. REQ-T-02: El usuario podr adicionar t a tulos a las compa y modicarlos luego de creados. nas La informacin de un t o tulo es: nombre, nemotcnico y descripcin. e o REQ-T-03: El usuario podr eliminar t a tulos del sistema, solo si este no tiene precios asociados. Administracin de precios o REQ-P-01: El usuario podr ver el listado de precios por fecha, asociados a un t a tulo. REQ-P-02: El usuario podr adicionar registros de precios de t a tulos de una compa para na fechas individuales. La informacin del registro de precios es : fecha (d mes, ao), precio de o a, n cierre, precio de apertura, precio mximo, precio m a nimo. REQ-P-03: El usuario podr modicar registros de precios de t a tulos de una compa para na fechas individuales. La informacin del registro que se puede modicar es: precio de cierre, o precio de apertura, precio mximo, precio m a nimo. REQ-P-04: El usuario podr eliminar registros de precios de un t a tulo. REQ-P-05: El usuario podr ingresar varios registros de precios de un t a tulo, a travs de la carga e de un archivo de texto. 86

Figura 9: Casos de uso PDM-Prextree

REQ-P-05: El usuario podr visualizar la grca de candlesticks de los precios de un t a a tulo.

PDM-Candles
La Figura 8 muestra el diagrama de casos de uso del prototipo. Los requerimientos que describen los casos de uso son los siguientes: REQ-CAN-01: El sistema debe proporcionar al usuario la funcionalidad de identicar los patrones bsicos de candlestick sobre una serie de precios. a REQ-CAN-02: Para efectos de la identicacin de los candlesticks bsicos mencionados en la o a visin, el usuario debe seleccionar un rango de tiempo para la serie seleccionada. o REQ-CAN-03:Para el proceso de generacin de resultados el usuario podr seleccionar si la serie o a de datos con sus respectivas formas bsicas ser generada en un archivo csv. a a REQ-CAN-04: El usuario podr seleccionar dos conjuntos de reglas para efectos de identia cacin de las formas bsicas. El conjunto reducido tiene las reglas para las formas Marubozu, o a Long,Spinning top y Doji. El conjunto completo tiene las reglas para todas las formas presentadas en la Figura 5. 87

Figura 10: Casos de uso PDM-Patterns

REQ-CAN-05: El prototipo desplegar a manera de listado los precios de la serie y el nombre de a la gura asociada. Adicionalmente al seleccionar un conjunto de precios en el listado resultado, se visualizar grcamente la imagen de la gura asociada. a a REQ-CAN-06: El prototipo desplegar en un rea de texto, un conteo de las instacias asociadas a a a cada forma bsica. a

PDM-Prextree
La Figura 9 muestra el diagrama de casos de uso del prototipo. Los requerimientos que describen los casos de uso son los siguientes: REQ-PRE-01: El sistema debe proporcionar al usuario la funcionalidad de generar un catlogo a de patrones candlestick a manera de rbol de prejos. a 88

REQ-PRE-02: El sistema debe permitir al usuario seleccionar varias series de tiempo sobre las cuales se realizar el anlisis, y un periodo de anlisis que aplicar para las series seleccionadas. a a a a REQ-PRE-03: El catlogo de patrones se debe presentar en dos vistas a manera de rbol de a a prejos: una vista donde las secuencias de formas bsicas se organizan por estados de la natua raleza, y otra donde el rbol se organiza por secuencias y las hojas del rbol son los estados de a a la naturaleza asociados con una secuencia particular. REQ-PRE-04: Cada nodo del catlogo (en las dos vistas) debe desplegar el nmero de nodos a u hijo y el nivel de entrop asociada con el nodo. a REQ-PRE-05: Para efectos de generacin del catlogo, el usuario podr seleccionar los siguientes o a a parmetros: tamao del patrn (2,3,4,5,6), periodo de las tendencias (5,10,15,20,50), tipo de paa n o trn (body, body+shadows, candle shape), esquema de representacin (candle, candle+relative o o position, candle+color, candle+relative pos+color), medidas de inters de las reglas (conanza, e suporte, entrop a).

PDM-Patterns
La Figura 10 muestra el diagrama de casos de uso del prototipo. Los requerimientos que describen los casos de uso son los siguientes: REQ-PA-01: el sistema debe proporcionar al usuario un listado describiendo las expectativas de comportamiento futuro de las acciones seleccionadas, para un d particular de anlisis. Estas a a expectativas se expresan como porcentajes de ocurrencia de los posibles estados de la naturaleza, que estn asociados con la secuencia de candlesticks que naliza el d de anlisis seleccionado. a a a REQ-PA-02: el sistema permitir seleccionar al usuario el esquema de codicacin de los paa o trones. Para efectos de seleccin de ese esquema se tienen los siguientes parmetros: tamao o a n del patrn (2,3,4,5,6,7,8,9,10), periodo de las tendencias (5,10,15,20,50), tipo de patrn (body, o o body+shadows, candle shape), esquema de representacin (candle, candle+relative position, o candle+color, candle+relative pos+color). REQ-PA-03: el usuario en el sistema, podr seleccionar de forma individual, las series a las cuales a desea hacer el anlisis. a REQ-PA-04: el usuario en el sistema podr visualizar, por serie seleccionada, la secuencia de a candlesticks sobre la cual se generan las expectativas. REQ-PA-05: el usuario podr visualizar el catlogo de patrones, sobre el cual se gener el proceso a a o de extraccin de expectativas. o REQ-PA-06: el usuario podr simular portafolios de inversin y comparar mediante una grca a o a retorno vs varianza, el desempeo de los portafolios generados con todo el universo de seleccin n o y los generados con el subconjunto de activos obtenido por las expectativas.

Manual de usuario PDM-Data Manager


PDM-Data Manager es una aplicacin desarrollada en lenguaje Java 5. Proporciona la funcionalidad o de administracin de datos de las series de tiempo de acciones que son utilizadas por los otros mdulos o o del sistema PDM. La estructura de datos para organizacin de la informacin es Market Company o o Stock Quotes (Esta estructura se presenta en la Figura 4). Los mercados representan entornos nancieros a travs de los cuales los agentes transan t e tulos. Los t tulos o acciones (Stocks) pertenecen a compa que como agentes nancieros ingresan al mercado ofertando acciones. Los precios (quotes) nas 89

de estas acciones se denen por la dinmica del mercado que incluye la ley de oferta y demanda. Para a una accin en particular se denen 4 precios que son cierre, apertura, m o nimo y mximo. Un ejemplo a de estructura es: Market: New York Stock Exchange. Company: Google. Stock: Google. Quotes: close = US 98.2, open: US 97.3, low= US 96.8, high= US 97.6 La Figura 11 muestra la ventana principal del PDM-Data Manager. En el panel izquierdo de la ventana principal se pueden ver cuatro botones que permiten administrar los datos asociados con el modelo: Manage markets (Administracin de mercados). o Manage companies (Administracin de compa o nas). Manage stocks (Administracin de t o tulos ). Manage quotes (Administracin de precios) o

Figura 11: Ventana principal -PDM Data Manager

Administracin de mercados o
Permite crear, editar y eliminar mercados. La ventana principal del mdulo, en la cual se despliega el o listado y los botones de funciones se presenta en la Figura 12. Las funciones de este mdulo son: o 1. Add market: permite agregar nuevos mercados . La informacin requerida se describe a contino uacin: o a) Name: Se reere al nombre del mercado. b) Nemo(Nemotcnico): Se reere a la abreviatura utilizada para identicacin del mercado . e o 90

c) Description: Campo opcional. Se reere a cualquier tipo de informacin relevante acerca o del mercado. 2. Edit market: permite editar todos los campos del registro seleccionado. 3. Delete: permite eliminar el registro seleccionado. Un mercado slo podr ser eliminado cuando o a no haya compa que pertenezcan a ste. nas e

Figura 12: Manage Markets

Administracin de compa o nas


Este mdulo permite crear, editar y eliminar compa La ventana principal del mdulo, en la cual o nas. o se despliega el listado y los botones de funciones se presenta en la Figura 13. Las funciones de este mdulo son: o 1. Add: permite agregar nuevas compa Para adicionar una compaia esta debe pertenecer a nas. n un muercado, en esta medida en el formulario de creacin aparece un combo de seleccin con o o los mercados disponibles. La informacin para la creacin de una compa es: o o na Name : Se reere al nombre de la compa na. Market : Se reere al mercado al cual pertenece la compa Debe seleccionarse de la lista na. desplegable. Symbol: abreviatura para identicacin de la compa o na. Description: Campo opcional. Se reere a cualquier tipo de informacin relevante acerca o de la compa na. 2. Edit: permite editar todos los campos del registro seleccionado. 3. Delete: permite eliminar el registro seleccionado. Una compa slo podr ser eliminada cuando na o a no haya t tulos que pertenezcan a sta. e 91

Figura 13: Manage Companies

Administracin de t o tulos
Este mdulo permite crear, editar y eliminar t o tulos. La ventana principal del mdulo, en la cual o se despliega el listado y los botones de funciones se presenta en la Figura 14. Las funciones son las siguientes: 1. Add: permite agregar nuevos t tulos. Para adicionar un t tulo este debe pertenecer a una compa La informacin requerida para la creacin de un t na. o o tulo se describe a continuacin: o Name: nombre del t tulo. Market: mercado al que pertenece la compa que emite el na Company: compa a la cual pertenece el t na tulo. Symbol: abreviatura o s mbolo que se utiliza para referenciar el t tulo. Description: Descripcin del t o tulo. 2. Edit: permite editar todos los campos del registro seleccionado. 3. Delete: permite eliminar el registro seleccionado. Al eliminar un t tulo se eliminarn todos los a precios pertenecientes a dicho t tulo.

Administracin de precios o
Este mdulo permite crear, cargar precios de un archivo, editar y eliminar precios (Figura 15). Para o realizar cualquiera de las acciones mencionadas anteriormente se debe seleccionar el t tulo respectivo. Para ver en la ventana todos los precios disponibles de un t tulo, se debe ubicar este a travs de los e combos de seleccin Mercado-Compa tulo. Los opciones que proporciona este mdulo son: o na-T o 1. Add: permite agregar nuevas precios, de forma individual. El formulario para adicin de precios o tiene los siguientes campos: 92

Figura 14: Manage Stocks

Date: Se reere al d en el cual se tomaron los precios. a Open: precio de apertura del t tulo. High: precio mximo. a Low : precio m nimo. Close: precio de cierre. 2. Edit: permite editar todos los campos del registro seleccionado. 3. Delete: permite eliminar el registro seleccionado. 4. Load File: permite cargar varios precios simultneamente a partir de un archivos de texto (Figura a 17). Este archivo debe estar organizado por las y columnas, donde cada la es un registro historico del precio. El orden de las columnas debe ser: d mes, ao, precio de apertura, precio a, n mximo, precio m a nimo y precio de cierre, y el archivo puede utilizar como separador ,(coma) o punto y coma(;). Para seleccionar el archivo a cargar se debe hacer click en el botn Browse, o que abrir una ventana en la que se puede buscar el archivo. Para cargar los datos en la Base a de Datos se hace click en Load le; esta operacin lee el archivo seleccionado y la por la va o insertando los precios en la base de datos. Solo los precios nuevos (es decir los precios de las fechas que an no estn en la base de datos son insertados). Si se requieren actualizar los datos u a existentes se deber seleccionar la opcin Replace quotes. a o 5. View Chart: permite ver la grca de velas o candlestick para toda la serie (Figura 18).Sobre la a grca se pueden realizar acercamientos(Figura 19) para ver el detalle de las velas en un rango a de fechas particular; para esto slo es necesario seleccionar con el ratn el rea que se desea o o a ampliar. El acercamiento sobre la grca puede hacerse tantas veces como sea necesario para a lograr el detalle deseado. Para volver al tamao original es suciente con seleccionar un rea con n a el ratn seleccionando primero el punto inferior derecho. o

93

Figura 15: Manage Quotes

Figura 16: Ventanas para creacin o

94

Manual de usuario PDM- Candles


PDM-Data Manager es una aplicacin desarrollada en lenguaje Java 5. Proporciona la funcionalidad o de identicacin de formas bsicas de candlesticks a partir de series de tiempo de acciones con sus o a cuatro precios caracter sticos. En la Figura 20 se presenta la ventana principal del prototipo que se compone de los siguientes elementos grcos: a Panel stock selection: tiene combos para seleccionar la serie de tiempo a convertir. Analysis period panel: tiene combos de seleccin para denir el rango temporal de datos a o utilizar. Results panel: en el se encuentran los elementos para visualizacin de resultados y seleccin del o o conjunto de reglas a utilizar. Adicionalmente tiene un campo de vericacin para indicar si los o resultados se deben generar tambin en un archivo de texto plano. e A continuacin se presenta a manera de tutorial el proceso de identicacin de formas bsicas o o a utilizando PDM-Candles. El primer paso es seleccionar la serie objetivo en los combos Market Company Stock. Al seleccionar una accin disponible se despliega el rango temporal de datos de la o serie. Si el usuario quiere seleccionar un rango diferente al del conjunto, puede hacerlo en los campos espec cos para seleccin de la fecha de inicio y nalizacin del rango. o o El proceso se inicia cuando el usuario da clic en el botn Start. Antes de inciar el proceso, el usuario o debe seleccionar el conjunto de reglas a utilizar (reducido o completo). Por omisin se usa el conjunto o completo. Cuando se ha ejecutado la identicacin de formas bsicas se genera en el panel Results un listado o a ordenado por fecha, con los precios caracter sticos y la forma bsica asociada. Al seleccionar cualquier a la del listado de resultados, se depliega la gura asociada con la forma identicada. Adicionalmente en el panel Patterns count aparecen las formas bsicas identicadas y un conteo de cuantas instancias a en la serie corresponden a cada forma. Si el usuario desea generar un archivo de texto con los resultados del proceso, antes de dar clic en el botn Start, debe seleccionar el campo Generate le, el cual activar el campo para seleccin o a o de la carpeta en la cual se generar el archivo. Para seleccionar la carpeta destino, haga clic en el a botn Browse. La Figura 22 presenta un ejemplo del archivo csv generado. Las columnas generadas o en el archivo son: fecha, precio de cierre, precio mximo, precio m a nimo, precio de cierre, forma bsica a asociada.

Manual de usuario PDM- Prextree


PMD-Prextree es una herramienta de software cuya funcionalidad es construir rboles de prejos, con a secuencias de formas bsicas candlesticks, denominadas patrones. Estos rboles se pueden considerar a a como catlogos de patrones en la medida que cada nodo incluye una medida que dice el nmero de a u hijos asociados con un nodo particular. PDM- Prextree tiene dos ventanas que se presentan en las Figuras 23 y 24. La ventana principal permite seleccionar las series objetivo, y el periodo de anlisis para la generacin del catlogo. La a o a segunda ventana es la de construccin del catlogo, que permite seleccionar los parmetros de cono a a struccin, ver los rboles generados y extraer las reglas del rbol de prejos con varias medidas de o a a inters como el soporte, la conanza y la entrop e a. Para efectos de generacin de los catlogos, en la ventana principal primero se deben seleccionar o a las series objetivo y el periodo de anlisis. Luego se debe hacer click en el botn Start para iniciar a o el proceso de transformacin e identicacin de formas bsicas. Al nalizar esto se activar el botn o o a a o Build prex tree, el cual debe ser presionado para desplegar la ventana de construccin de catlogos o a (Ver Figura 24).

95

Figura 17: Ventana para carga de precios mediante archivo

Figura 18: Grca Candlesticks 1 a

96

Figura 19: Grca Candlesticks 2 a

Figura 20: PDM Candles - Ventana Principal

97

Figura 21: PDM Candles - Resultados

Figura 22: PDM Candles - Archivo CSV generado

98

Figura 23: PDM Prextree - Ventana Principal

En la ventana de generacin de catlogos se pueden seleccionar los siguientes parmetros: o a a Pattern size: nmero de formas bsicas que construyen el patrn. Los valores disponibles son 2, u a o 3, 4, 5, 6. Tendence period: nmero de datos a ser tomados en cuenta para identicar la tendencia pasada u y la conrmacin del patrn (tendencia futura). Los valores disponibles son 5, 10, 15, 20 y 50. o o Pattern type: tipo de patrn a generar. Los valores disponibles son body, body+shadows, candle o shape. Itemset type: formato de generacin del patrn. Los calores disponibles son Candle, Cano o dle+relative position, Candle+color, Candle+relative pos+color. Condence: nivel m nimo de conanza de los patrones en el rbol. a Support: nivel m nimo de soporte de los patrones en el rbol. a Entropy: nivel mximo de entropia de los patrones del rbol. a a Adicionalmente presenta tres paneles en los cuales se visualizan los resultados: Prex tree: despliega el catlogo de patrones organizado de forma natural, es decir, los nodos a representan una forma bsica de los patrones y las hojas son los estados de la naturaleza asociados a (Ver Figura 25). Patterns tree: despliega el catlogo de patrones organizado por estados de la naturaleza. (Ver a Figura 26). Rules: despliega por demanda (cuando se hace clic en el botn View rules) a manera de listado o los patrones en el rbol de prejos, en la forma patron>estado donde estado es el estado de a la naturaleza con mayores ocurrencia para el patrn. Adicionalmente despliega las siguientes o 99

Figura 24: PDM Prextree - Ventana construccin catlogo o a

medidas: ocurrencias del estado de la naturaleza, soporte, conanza y entrop de la regla (Ver a Figura 27).

Manual de usuario PDM-Patterns


PDM-Patterns es una herramienta de software, cuya nalidad es brindar al usuario, soporte al proceso de diseo de portafolio, basado en expectativas de comportamiento futuro de las acciones, presentadas n como un patrn de candlesticks y los posibles estados de la naturaleza asociados( continuation bear, o continuation bull, reversal bear, reversal bull). La Figura 28 presenta la ventana principal de la aplicacin, la cual tiene cuatro paneles que se o describen a continuacin: o Prametros de codicacin de patrn: este panel tiene los parmetros asociados con el esquema a o o a de codicacin a usar para los patrones. o Parmetros de anlisis: este panel tiene los combos de seleccin para el mercado y las compaias a a o n asociadas. Adicionalmente, los campos para seleccin del d de anlisis, y los botones para o a a generacin de reporte y despliegue de informacin adicional. El botn Start inicia el proceso de o o o generacin de expectativas; los botones Show tree y Show candles despliegan respectivamente el o catlogo de patrones (ver Figura 33) y el visor de candlesticks respectivamente (ver Figura 34); a el botn Portfolios despliega el mdulo simulador de portafolios (ver Figura 35). o o Acciones: el panel de seleccin de acciones despliega las series disponibles, con base en la seleccin o o hecha en los combos del panel de parmetros de analisis. a 100

Figura 25: PDM Prextree - Panel rbol de prejos a

Figura 26: PDM Prextree - Panel rbol de patrones a

Reporte: en este panel se despliegan las expectativas generadas con base en los parmetros a seleccionados por el usuario. Estas expectativas se generan por accin, y se presentan como los o posibles estados de la naturaleza que pueden ocurrir a partir del d de anlisis seleccionado, y a a las probabilidades de ocurrencia para cada estado. El mdulo para simulacin de portafolios le permite al tomador de decisiones generar escenarios de o o inversin para el conjunto de activos seleccionado y para el subconjunto generado por las expectativas. o Estos escenarios que se generan como vectores aleatorios de porcentajes de inversin en activos. Con o estos escenarios se calcula el retorno esperado y varianza de ese portafolio particular (ver Seccin ?? o y se graca ese punto en un grca Retorno esperado vs Varianza. con el n de visualizar la frontera a eciente para ese conjunto de activos. El hecho de gracar los portafolios de los activos seleccionados versus los portafolio de los activos de las expectativas, permite visualizar en que condiciones los 101

Figura 27: PDM Prextree - Reglas

Figura 28: PDM Patterns - Ventana Principal

portafolios son dominantes sobre otros.

102

Figura 29: PDM Patterns - Panel parmetros de codicacin a o

Figura 30: PDM Patterns - Panel parmetros de anlisis a a

Figura 31: PDM Patterns - Panel seleccin de acciones o

103

Figura 32: PDM Patterns - Reporte

Figura 33: PDM Patterns - Visor rboles de patrones a

104

Figura 34: PDM Patterns - Visor secuencia de candlesticks

Figura 35: PDM Patterns - Simulador portafolios

105

Bibliograf a
[1] S. Achelis. Technical Analysis from A to Z. McGraw-Hill, second edition, 2001. [2] J. Arlow and I.Neustadt. UML 2 and the Unied Process. Adisson Wesley, 2005. [3] P. Artzner, F. Delbaen, J. Eber, and D. Heath. Coherent measures of risk. Mathematical Finance, 9:203228, 1999. [4] P. Berkhin. Survey of clustering data mining techniques. Technical report, Accrue Software, San Jose, CA, 2002. [5] W. D. Bondt and R. Thaler. Does the stocks market overreact? Journal of Finance, July, 1985. [6] A. Borodin, R. El-Yaniv, and V. Gogan. Can we learn to beat the best stock. Journal of Articial Intelligence Research, 21:579594, May 2004. [7] P. Brockwell and R. Davis. Introduction to Time Series and Forecasting. Springer, 2000. [8] L. Cao and F. Tay. Financial forecasting using support vector machines. Neural and Computing Applications, 10:184192, 2001. [9] L. K. Chan, J. Karceski, and J. Lakonishok. On portfolio optimization: Forecasting covariances and choosing therisk model. Technical Report 7039, National Bureau of Economic Research, Inc, Mar. 1999. available at http://ideas.repec.org/p/nbr/nberwo/7039.html. [10] M.-C. Chan, C.-C. Wong, and C.-C. Lam. Financial time series forecasting by neural network using conjugate gradient learning algorithm and multiple linear regression weight initialization. Department of Computing , The Hong Kong Polytechnic University. [11] T. Chande. Beyond Technical Analysis. John Wiley & sons, 1997. [12] N.-F. Chen, R. Roll, and S. A. Ross. Economic forces and the stock market. Journal of Business, 59(3):383403, 1986. available at http://ideas.repec.org/a/ucp/jnlbus/v59y1986i3p383-403.html. [13] S. Chen, P. Wang, and P. P. Wnag. Computational Intelligence in Economics and Finance. Springer, 2004. [14] S.-N. Chen and S. J. Brown. Estimation risk and simple rules for optimal portfolio selection. Journal of Finance, 38(4):108793, 1983. available at http://ideas.repec.org/a/bla/jnan/v38y1983i4p1087-93.html. [15] C.-H. Cheng. Entropy-based subspace clustering for mining numerical data. Masters thesis, Department of Computer Science & Engineering - Chinese University of Hong Kong, 1999. [16] T. chung Fu, F. lai Ching, R. Luk, and C. man Ng. Financial time series indexing based on low resolution clustering. 107

[17] M. P. Clements. Forecasting economic and nancial time-series with non-linear models. Department of Economics University of Warwick, October 2003. [18] R. Colby. The encyclopedia of technical market indicators. MGrah-Hill, second edition, 2002. [19] S. Craighead and B. Klemesrud. Stock Selection Based on Cluster and Outlier Analysis. Nationwide Financial. [20] G. A. Darbellay and D. Wuertz. The entropy as a tool for analysing statisticaldependences in nancial time series. Physica A, 287(3-4):429439, 2000. [21] G. Das, K. Lin, H. Mannila, G. Renganathan, and P. Smith. Rule discovery from time series. In Proceedings of the 4th international conference of knowledge discovery and data mining. AAAI Press, pages 1622. [22] G. Deboeck. Visual explorations in Finance with Self-organizing maps. Springer, 1998. [23] G. Deboeck. Self-organizing maps facilitate knowledge discovery innance. Financial Engineering News, 1:16, 1999. [24] X.-T. Deng, S.-Y. Wang, and Y.-S. Xia. Criteria, models and strategies in portfolio selection. AMO Advanced Modeling and Optimization, 2(2), 2000. [25] C. Dose and silvano Cincoti. Clustering of nancial time series with application to index and enhanced-index tracking portfolio. Technical report, Universit di GEnova. a [26] C. Dunis and J. Jalilov. Neural network regression and alternative forecsting techniques for predicting nancial variables. Technical report, Liverpool Business School, 2001. [27] S. Ekern. Taxation, political risk and portfolio selection. Economica, 38(152):42130, 1971. available at http://ideas.repec.org/a/bla/econom/v38y1971i152p421-30.html. [28] E. Famma. Ecient capital markets: A review of theory and empirical work. Journal of Finance, 25(2):383417, 1969. [29] M. Gavrilov, D. Anguelov, P. Indyl, and R. Motwani. Mining the stock market: Which measure is best ? Technical report, Department of Computer Science- Stanford University. [30] X. Ge. Pattern matching in nancial time series data. Department of Information and Computer Science University of California, 1998. [31] C. L. Giles, S. Lawrence, and A. C. Tsoi. Rule inference for nancial prediction usingrecurrent neural networks. In Proceedings of IEEE/IAFE Conference on ComputationalIntelligence for Financial Engineering (CIFEr), pages 253259, Piscataway, NJ, 1997. IEEE. [32] E. D. Giorgi. A note on portfolio selection under various risk measures. Technical Report iewwp122, Institute for Empirical Research in Economics - IEW, 2002. available at http://ideas.repec.org/p/zur/iewwpx/122.html. [33] C. Glavan. An application of alternative risk measures to trading portfolios. Masters thesis, Finance School- Zurich University, 2004. [34] J. Gomez, A. Garcia, C. Silva. COFRE: A Fuzzy Rule Coevolutionary Approach for Multiclass Classication Problems. In Proceedings of the IEEE Congress on Evolutionary Computation, September 2005. [35] W. G. Hallerbach. Decomposing portfolio value-at-risk: A sis. Technical Report 99-034/2, Tinbergen Institute, May 1999. http://ideas.repec.org/p/dgr/uvatin/19990034.html. 108 general analyavailable at

[36] J. Han and M. Kamber. Data Mining: Concepts and Techniques. Morgan Kaufmann Publishers, San Francisco, 2001. [37] R. Haugen. Modern Investment Theory. Prentice Hall, 2005. [38] D. Heckerman. Bayesian networks for data mining. Data Mining and Knowledge Discovery, 1(1):79119, 1997. [39] T. Hellstrom and K. Holmstrom. Predictable patterns in stock returns. Technical Report HEVBIBOP-30-SE, Center of Mathematical Modelling - Malarden University, 1998. [40] T. Hellstrom and K. Holmstrom. Predicting the stock market, 1998. [41] G. Hernndez, M. Linares, and S. Rojas. On candlestick forecasting with and adaptive coupled a dual neural network. In Memorias Congreso Internacional de Inteligencia Computacional CIIC 2007, 2007. [42] M. L. Hetland and P. Saetrom. Evolutionary rule mining in time series databases. Machine Learning, 58(2-3):107125, Feb. 2005. [43] J. M. Hutchinson. A radial basis function approach to nancial time series analysis. Technical Report AITR-1457, 1993. [44] J. Ingersoll. Theory of Financial Decision Making. Rowman & Littleeld Publishers, 2000. [45] M. Kaboudan. Genetic programming prediction of stock prices. Computational Economics, 16:136207, 2000. [46] E. Keogh and M. Pazzani. Scaling up dynamic time warping to massive datasets. Technical report, Department of Information and Computer Science University of California, 1999. Department of Information and Computer Science University of California. [47] E. Keogh and M. Pazzani. Derivative dynamical time warping. Technical report, Department of Information and Computer Science University of California, 2001. [48] V. Kodogiannis and A. Lolis. Forecasting nancial time series using neural networks and fuzzy system-bassed techniques. Neural Computing and Applications, 11:90102, 2002. [49] P. Kruchten. The Rational Unied Process: An Introduction. Addison Wesley, third edition, 2003. [50] A. Lendasse, E. D. Bodt, V. Wertz, and M. Verleysen. Non-liner nancial time series forecstingapplication to the bel 20 stock market index. European Journal of Economic and Social Systems, 14:8191, 2000. [51] A. Lendasse, M. Verleysen, and E. de Bodt. Forecasting time-series by kohonnen classication. In European Symposium on Articial Neural Networks 1998 proceedings, 1998. [52] J. Lin, E. Keogh, and W. Truppel. Clustering of streaming time series is meaningless. In DMKD 03: Proceedings of the 8th ACM SIGMOD workshop on Researchissues in data mining and knowledge discovery, pages 5665, New York, NY, USA, 2003. ACM Press. [53] M. Linares, D. Hernndez, and F. Gonzlez. Exploiting stock data: a survey of state of the art a a computational techniques aimed at producing beliefs regarding investment portfolios. In Revista Ingenier e Investigacin, Vol 28 No 1, Abril 2008 (105-116). a o [54] H. Markowitz. Portfolio selection. Journal of Finance, 7:7791, 1952. [55] S. Micciche and F. abd R.N. Mantegna. Correlation based hierarchical clustering in nancial time series. 1995. 109

[56] R. Miner. Dynamic Trading. Dynamic Traders Group, 1997. [57] J. H. Mora. Introduccin a la Teor del Consumidor. Universidad ICESI, 2002. o a [58] E. C. Moreno. Series de Tiempo: Conceptos Bsicos. Universidad Nacional de Colombia a Medell 2000. n, [59] K. Muller, A. Smola, and V. Vapnik. Using support vector machines for time series prediction. Technical report, Image Processing Services Research Lab. [60] J. Murphy. Technical Analysis of the Financial Markets. New York Institute of Finance, 1999. [61] D.Nawrocki. A Brief History of Downside Risk Measures. Villanova University. [62] Z. Pawlak. Rough sets. International Journal of Information and Computer Sciences, 11:341356, 1982. [63] R. Pindyck and D. Rubinfeld. Microeconomics. Prentice Hall, fourth edition, 1998. [64] F. Reilly and K. Brown. Investment Analysis and Portfolio Management. South-Western College Pub, seventh edition, 2002. [65] J. Rombouts and E. Rengifo. Dynamic optimal portfolio selection in a var framework. Technical Report 04-05, HEC Montral, Institut dconomie applique, July 2004. available at e e e http://ideas.repec.org/p/iea/carech/0405.html. [66] S. Ross. The arbitrage theory of capital asset pricing. Journal of Economic Theory, 1976. [67] S. Ross, R. Westereld, and J. Jae. Corporate Finance. McGraw Hill-Irwin, sixth edition, 2002. [68] T. H. Rydberg. Realistic statistical modelling of nancial data. Internat. Statist. Rev., 68:233 258, 2000. [69] W. Sharpe. Capital asset prices: A theory of market equillibrium under conditions of risk. Journal of nance, 19:425442, 1964. [70] W. Sharpe. Ecient capital markets: Ii. Journal of Finance, 46(5):15751617, 1991. [71] L. Shen and H. T. Loh. Applying rough sets to market timing decisions. Decision Support Systems, 37(4):583597, 2004. [72] C. Shenoy and P. P. Shenoy. Bayesian Network Models of Portfolio Risk and Return. The MIT Press, 2000. [73] L. Stevens. Essential Technical Analysis. John Wiley & Sons, 2002. [74] F. Tay and L. Cao. Application of support vector machines in nancial time series forecasting. The International Journal of Management Science, 29:309317, 2001. [75] R. Tsay. Analysis of Financial Time Series. Wiley Interscience, second edition, 2005. [76] R. Voget and A. Tinnirello. Time series analysis and forecasting techniques. Miami, Florida, USA, 2004. WSEAS. [77] R. Weissman. Mechanical Trading Systems. John Wiley & Sons, 2006. [78] C. L. Wilson. Self organizing neural networks for trading common stocks. In IEEE World Congress Neural Networks, 1994.

110

Das könnte Ihnen auch gefallen