Sie sind auf Seite 1von 4

IA004A - Redes Neurais II Campinas, 30 de novembro de 2016

Predio Esportiva Usando Redes Neurais


Silvano Filho

Departamento de Engenharia de Computao e Automao Industrial (DCA)


Faculdade de Engenharia Eltrica e de Computao (FEEC)
Universidade Estadual de Campinas (Unicamp)
Caixa Postal 6101, CEP 13083-970 Campinas, SP, Brasil

silvarjf@gmail.com

Resumo Este artigo descreve um modelo para previso dificultam a criao de modelos precisos de
de resultados esportivos baseado em Redes Neurais e previso.
Sistemas Classificadores. O sistema construdo aplicado
para dados gerados pela fantasy league de futebol Cartola Alguns trabalhos na rea focam na previso
F.C. O modelo tenta contornar caractersticas do problema de resultados para fantasy leagues [2]. Fantasy
que dificultam a previso precisa de resultados. leagues oferecem um contexto propcio
aplicao de minerao de dados, por
Keywords evolutionary algorithms, ensemble classifiers,
neural networks, football prediction.
disponibilizarem algumas estatsticas
atualizadas sobre jogadores, e focarem em
1. Introduo aspectos tcnicos, menos suscetveis a variao
A crescente disponibilidade de dados e o ao longo do tempo. Este trabalho descreve um
aumento do poder computacional tem tornado modelo que tenta prever pontuaes de atletas
popular a aplicao de tcnicas de anlise para o fantasy league Cartola F.C.
estatstica em contextos esportivos. A minerao
de dados pode ajudar tcnicos a avaliar 2. Cartola F.C.
performance de atletas, planejar estratgias e O Cartola F.C. a maior fantasy league do
descobrir talentos. Brasil. A cada rodada do Campeonato Brasileiro
Algumas tcnicas de minerao de dados de Futebol, usurios do sistema escolhem 11
tem sido aplicadas com sucesso tambm para a atletas para compor a sua equipe. Ao final da
previso de resultados [1]. Entretanto, alguns rodada, cada atleta recebe uma pontuao de
esportes, especialmente o futebol, apresentam acordo com a sua performance na rodada, e o
desafios adicionais para esse tipo de abordagem. usurio recebe uma pontuao de acordo com a
O excesso de variveis que influenciam o equipe escolhida. As pontuaes dos atletas so
resultado de uma partida de futebol, o carter definidas com base em parmetros pr-
dinmico do desempenho dos times e a definidos, mostrados na tabela 1.
dificuldade de modelar aspectos sutis do esporte

Scouts de Defesa Scouts de Ataque


Estatstica Pontos Estatstica Pontos
Jogo sem sofrer gols 5 Gol 8
Defesa de Pnalti 7 Assistncia 5
Defesa Difcil 3 Finalizao na Trave 3.5
Roubada de Bola 1.7 Finalizao Defendida 1
Gol Contra -6 Finalizao para Fora 0.7
Carto Vermelho -5 Falta Sofrida 0.5
Carto Amarelo -2 Pnalti Perdido -3.5
Gol Sofrido -2 Impedimento -0.5
Falta Cometida -0.5 Passe Errado -0.3
Tabela 1: Scouts do Cartola F.C
IA004A - Redes Neurais II Campinas, 30 de novembro de 2016

Antes de cada rodada, os usurios tem anlise estatstica, o algoritmo ReliefF mostra os
disposio as estatsticas das rodadas anteriores scouts que mais influenciam a pontuao futura
para cada jogador, o preo de cada jogador, de um jogador. Os scouts so mostrados na
calculado de acordo com as performances Tabela 2 e condizem com o esperado
anteriores, e um campo Status, que indica os intuitivamente.
jogadores que provavelmente vo atuar. A rede foi treinada usando o mtodo de
Levenberg-Marquardt, separando 15% dos
3. Proposta dados para efetuar a validao cruzada e 15%
A proposta deste trabalho usar uma rede dos dados para testes. A rede resultante tem 30
neural MLP para relacionar os atributos neurnios na camada intermediria. O
oferecidos pelo sistema do Cartola F.C antes da histograma dos erros mostrado na figura 1 e os
rodada do Campeonato Brasileiro s pontuaes erros de treinamento so mostrados na tabela 3.
finais de cada jogador aps a rodada. Alm dos
dados oferecidos pelo site, sero utilizadas as
mdias dos scouts dos jogadores adversrios
como atributos para a rede. Dessa forma, a rede
neural tentar se adaptar no s ao histrico do
jogador em questo, mas s caractersticas do
adversrio.
Os dados utilizados sero os do
Campeonato Brasileiro de 2015 [3]. A rede
neural ser treinada com os dados at a 8a
rodada, somente para os atletas que atuaram
nessas rodadas, e o seu desempenho ser
avaliado de acordo com o Erro Quadrtico
Mdio de previso para as rodadas restantes.
Para reduzir o tempo de processamento do
problema, a dimensionalidade ser limitada a 30
atributos. Os 30 atributos mais relevantes sero Figura 1: Histograma dos erros de treinamento da rede
selecionados usando o algoritmo ReliefF. Os neural
neurnios da camada intermediria tero funo EQM
de ativao sigmoidal e o nmero de neurnios
Treinamento 15.7
ser determinado pelo melhor valor do EQM de
Validao 18.9
validao.
Teste 20.0
4. Resultados Preliminares Tabela 3: EQM's de treinamento

Posio Scouts mais relevantes Esperava-se que a rede mantivesse


Goleiros Mando de campo, Finalizaes desempenho similar para os dados das rodadas
Defendidas, Jogos sem tomar gol seguintes, mas isso no se concretizou. A figura
Laterais Mando de campo, Cartes 2 mostra que o EQM inicialmente se mantem
Amarelos prximo do EQM de treinamento, mas, aps
Zagueiros Mdia de gols e de faltas sofridas algumas rodadas, chega a ultrapassar o valor de
pelo adversrio e Mando de campo 160. A figura mostra em vermelho, para
Meias Assistncias, Gols e Finalizaes comparao, o desempenho de uma previsor
Fora nas ltimas rodadas arbitrrio que sempre previsse uma pontuao
Atacantes Impedimentos, Gols e Finalizaes de 10 pontos para qualquer jogador. O previsor
na trave nas ltimas rodadas arbitrrio tem um desempenho muito melhor
Tabela 2: Scouts mais relevantes por posio
que a rede neural treinada. Os resultados
sugerem que a relao real entre entrada e sada
se altera com o tempo, ou com alguma outra
Primeiramente, a etapa de seleo de atributos j varivel ausente no modelo
mostrou resultados interessantes. Fazendo uma
IA004A - Redes Neurais II Campinas, 30 de novembro de 2016

O valor do fitness na rodada t depende do


EQM das previses feitas pelo classificador
naquela rodada (fitness = 0 para classificadores
que no realizarem nenhuma previso). O
parmetro n a meia-vida do classificador, ou
seja, o nmero de rodadas necessrias para o
valor da energia ser reduzido metade, supondo
fitness = 0 sempre. O valor um parmetro a
ser ajustado e reflete qual o valor do fitness a ser
considerado bom. Valores muito pequenos de
exigiro um fitness muito alto para que a
energia do classificador se mantenha. Valores
pequenos de preservam a energia de
Figura 2: EQM da Rede Neural para o restante do classificadores ruins.
campeonato Em situaes onde mais de um classificador
pode atuar, eles competiro, baseado no valores
4.1 Sistemas Complexos Adaptativos de energia. Ao final de cada rodada, a populao
Uma alternativa para contornar o problema de classificadores passa por um processo
encontrado usar um sistema adaptativo. Nesse evolutivo. Os melhores indivduos so
tipo de abordagem, criada uma populao de escolhidos, tambm baseado no valor de
classificadores, cada classificador composto por energia, e uma nova populao formada
uma parte antecedente e uma parte consequente. atravs de mutaes desses indivduos. O
A parte consequente define uma ao a ser processo de mutao consiste numa perturbao
tomada e a parte antecedente especifica gaussiana, cuja varincia um parmetro de
condies para que aquela ao seja tomada. A entrada, nos pesos da rede neural do
qualidade de um classificador determinada por classificador. Adicionalmente, a parte
um valor de energia, que depende da qualidade antecedente pode ser alterada com probabilidade
das decises tomadas por ele no passado. Na pm = 50%, com a adio ou remoo de um
prtica, a populao de classificadores funciona clube na lista de clubes possveis e/ou na lista de
como um time. importante ter uma populao adversrios possveis, ou ainda a alterao da
diversa de classificadores, para atuar em todos regra do mando de campo.
os tipos de situao. A introduo dos operadores de mutao e
Nessa implementao, um classificador s seleo crucial no processo. Atravs deles, o
poder ser usado para jogos de determinados sistema ser capaz de se adaptar s
clubes, contra determinados adversrios e caractersticas do problema ao longo do tempo.
jogando em casa (ou fora), condies que sero Adicionalmente, novas regras mais especficas e
especificadas na parte antecedente. A parte locais podero ser descobertas, aumentando a
consequente determina uma rede neural a ser preciso das previses.
aplicada para aquela situao.
Algumas abordagens treinam os vrios 4. Resultados Finais e Discusso
classificadores separadamente [4]. Aqui, eles Nas execues, determinou-se que novos
sero evoludos em conjunto, formando uma classificadores teriam um energia inicial de 5.
nica soluo (abordagem Michigan). Para esse valor, os parmetros n = 3 e = 35 se
Classificadores que fizerem boas previses mostraram adequados para preservar o valor de
numa rodada sero recompensados com um energia de indivduos relativamente bons. Por
acrscimo no valor da energia, definida por: exemplo, um indivduo recm criado, que faa
previses com EQM = 20 tem sua energia
!
! ! elevada de 5 para 5.6. Se suas previses tiverem
!!! = ! + ! (1) EQM = 40, sua energia ser diminuda para 4.8.
!
Alm disso, o valor da varincia dos pesos da
!
! = (2) rede nas mutaes foi definido como 0,1.
!"#!!
Uma populao de 150 mutaes da rede
treinada anteriormente, com regras aleatrias,
IA004A - Redes Neurais II Campinas, 30 de novembro de 2016

foi inicializada. Ao final de cada rodada, 20 de condies de aplicaes presentes na


iteraes do processo evolutivo so realizadas. populao pode no ser suficiente para abranger
Aps sucessivas execues, os resultados so todas as possibilidades de entradas. Esse cenrio
mostrados na figura 3. ocorreu com frequncia no sistema construdo.
A soluo encontrada foi introduzir indivduos
coringa na populao, que podem ser
utilizados em qualquer ocasio, no passam por
mutao e so sempre mantidos ao longo das
geraes.

5. Concluses e Passos Futuros


O presente trabalho no atinge o objetivo de
realizar previses das pontuaes do Cartola FC
com previso satisfatria. Apesar disso, sugere
uma possvel soluo para um dos principais
obstculos encontrados na previso de
resultados no futebol: Sistemas Classificadores
se comportam bem para problemas dinmicos e
Figura 3: EQM do Sistema Classificador (amarelo) em parecem se adaptar bem s variaes temporais
comparao com a rede neural e um previsor arbitrrio das caractersticas do problema.
Contudo, uma investigao mais aprofundada
necessria, aumentando
EQM
Contudo, uma investigao mais
Rede Neural 124.95
aprofundada necessria. Aumentar o
Classificador 60.31
nmero de indivduos da populao contruibuir
Previsor Arbitrrio 71.38
para aumentar a variedade de regras, mas
Tabela 4: EQM's de previso aumentar consideravelmente o esforo
A figura sugere que o sistema classificador computacional, maior problema da abordagem
capaz de se adaptar s alteraes do problema de sistemas classificadores. Treinar
e manter o EQM ao longo do tempo. Mesmo classificadores a priori, com regras definidas por
que os valores de EQM ainda no sejam um ser humano especialista, pode aumentar a
suficientes para realizar previses com preciso preciso das previses. Introduzir atributos que
relevante, o sistema classificador superou o reflitam a opinio de especialistas tambm pode
desempenho de um previsor arbitrrio, o que contribuir para gerar previses mais relevantes,
indica que algum conhecimento est sendo uma vez que introduziro implicitamente no
efetivamente extrado do problema. processamento informaes que seriam
Um fator relevante no processo evolutivo complicadas de modelar, inerentes natureza do
o nmero de iteraes realizadas ao final de esporte.
cada rodada. Observou-se que um nmero muito
pequeno de iteraes no traz evoluo
significativa para a populao de Referncias
classificadores. Por outro lado, um nmero alto
de iteraes, mesmo que modifique bastante a [1] Maral Haghighat. A Review of Data Mining
caracterstica dos classificadores, no melhora o Techniques for Result Prediction in Sports.
EQM (e frequentemente piora). Esse um Advances in Computer Science: an
International Journal, Novembro 2013.
problema de sobreajuste. Se adaptar demais a
um conjunto restrito de dados pode piorar o [2] Roman Lutz. Fantasy Football Prediction.
desempenho de previses fora desse conjunto. [3] Henrique Gomide. Extrao de dados da API
do Cartola.
Outro aspecto importante diz respeito ao https://github.com/henriquepgomide
compromisso entre presso seletiva e variedade
/caRtola. (acessado em 30/11/2016).
na populao. Numa construo como essa,
[4] Thomas Dietterich. Ensemble Methods in
especialmente importante manter a variedade
Machine Learning. LNCS, 2001.
entre os indivduos. Caso contrrio, o conjunto

Das könnte Ihnen auch gefallen