Beruflich Dokumente
Kultur Dokumente
1
Desafios para a detecção de acesso indevido a
dados e processos automatizados (anomalias)
usando dados de tráfego de rede
Os sistemas de monitoração de tráfego de rede geram volumes demasiadamente grandes para serem
adequadamente e tempestivamente analisados manualmente ou por ferramentas estatísticas simples
(análise de flutuações atípicas, visto que a prevalência de transferências de dados legítimas “mascara” a
ocorrência menor e menos frequente de eventos mal-intencionados. Portanto, para isolar os reais
“outliers”, outras variáveis de contexto e de monitoração de acessos em aplicativos, devem ser levadas
em consideração na análise por algoritmos de picos de tráfego entre um determinado servidor e
unidades de armazenamento, contendo dados confidenciais, Exemplos de variáveis são:
• Campanhas de marketing em curso na organização;
• Fechamento mensal;
• Emissão periódica de relatórios para reguladores (Ex.: ANEEL e ANATEL);
• Dados de trilhas gerados por aplicativos (ERPs, etc.);
• Eventos de faturamento e cobrança de serviços a clientes.
A análise conjunta dessas variáveis (de contexto de negócio, estatísticas de acesso geradas por
aplicativos e informação de tráfego de rede) escapa à capacidade maioria dos algoritmos
convencionais como análise discriminante, regressão multilinear e logística. Por isso usamos
ferramentas de AI, combinando “engines” fornecidos pela nossa parceira Ward Systems, robustos
testados ao longo de mais de 20 anos.
2
As soluções de AI da IntelliSearch
As soluções da Ward Systems são de fato do tipo híbrido, em que a
rede neural (ANN) é supervisionada – durante o ciclo de
treinamento - e tem sua performance otimizada por um algoritmo
genético (ou PSO). Ele seleciona, ao longo de várias “gerações”, as
melhores combinações de parâmetros da rede neural, com as
seguintes vantagens sobre redes neurais “não supervisionadas”:
4.9 SVM LF LS
➢ NeuroShell Classifier;
➢ NeuroShell Predictor;
➢ Chaos Hunter.
Obs.: Os nomes de produtos apresentados neste slide e nos demais são de propriedade da
Ward Systems, parceira da IntelliSearch
7
A IntelliSearch adiciona uma camada de software e
de serviços às ferramentas da Ward Systems
Camada de
tratamento de
dados e
interface de
módulos Chaos
Hunter (*)
NeuroShell NeuroShell
Predictor (*) Classifier (*)
Interface com o
(*) Marcas usuário final
registradas da (web and/or mobile)
8
Ward Systems
Seleção de variáveis
9
Combinando PSO e GA no treinamento
supervisionado da rede
Iniciando com PSO e daí derivando para algoritmos genéticos
Na fase inicial do treinamento (otimização) da Na fase seguinte, após a mudança para uma
ANN, por PSO, a convergência é rápida para um supervisão por GA, os deslocamentos (não
ótimo local ou global no espaço de pesquisa necessariamente convergentes) são menores,
(representado aqui como tridimensional apenas aproximando-se com mais precisão de ótimos
para facilitar a visualização) locais ou globais.
11
Acompanhamento da convergência do modelo
durante o treinamento
12
Matriz de classificações e desvios
(para aplicações classificatórias como mining e cobrança)
13
Curva ROC
14
A IntelliSearch e a Ward Systems
✓ A IntelliSearch tem mais de 12 anos de experiência contínua na
utilização de ferramentas da Ward Systems, e nesse tempo
desenvolveu metodologias e camadas de software adicionais
(interfaces, normalizadores de dados de input e output para redes
neurais, algoritmos de “seeding”).
✓ Nossa longa cooperação com a Ward Systems também nos dá o
privilégio de determos conhecimentos sobre a melhor forma de
configurar os parâmetros de otimização (treinamento de redes
neurais), além de técnicas para seleção de dados de treinamento.
✓ Finalmente, como únicos parceiros ativos no Brasil temos a total
credibilidade e autorização da Ward Systems para prestarmos
suporte local e consultoria relativa a seus softwares.
✓ Pela mesma condição de parceria, conseguimos obter descontos
para nossos clientes, em relação ao preço de lista.
15
Vantagens sobre outras plataformas de AI
✓ Treina rápido e com relativamente poucos dados.
✓ “Time to Market” curto (3 a 4 semanas em média).
✓ Algoritmos exaustivamente testados durante mais de 18 anos, e ao mesmo tempo
mantidos “cutting edge”. Evitam overfitting e o efeito “caixa-preta”. Mais
especificamente:
➢ Turboprop2 (aperfeiçoamento do “Cascade Correlation” de Scott Fahlman;
➢ GRNN (genetic regressive neural network) é uma rede neural probabilística (modelo
desenvolvido por Donald Specht) com treinamento supervisionado por um
algoritmo genético) usando a técnica “one-hold-out” para manter sempre parte da
amostra in-sample como “out-of-sample” para teste de fitting durante o ciclo de
treinamento. Para alguns casos usamos também PSO combinado (em precedência)
com o algoritmo genético.
✓ Os modelos podem ser calibrados para se tornarem mais “otimistas” ou “pessimistas”
na detecção (vide Executável (run-time) pode ser facilmente incorporado a qualquer
plataforma, como DLL, ActiveX, etc.
✓ Para consulta a cases locais e globais há uma lista parcial no website da Ward Systems.
E também nas páginas referentes a “Financial applications” e “business predictions” de
“applications talk”
16
A solução global para detecção de anomalias
de acesso a dados
Informação
de tráfego
de redes
Ferramentas
de analytics
suportadas
por AI
Integração com
estatísticas de
acesso em
aplicativos
17
Proteção de dados confidenciais
➢ Tendo identificado e classificado (“clustering”) as vulnerabilidades detectadas
pelas ferramentas de AI, podemos aplicar algoritmos de scrambling e de
criptografia forte, além de soluções de autenticação “estado da arte” fornecidos
pelo nosso parceiro estratégico, a Cryptomathic
18
Nossas referências em projetos de TI, montagem de
modelos preditivos, e conformidade regulatória
Relação parcial de cases (vide atestados)
Banco Cacique: Otimização do processo de conformidade da filial em relação a Basileia
para a matriz do Société Générale;
FEBRABAN: Suporte técnico e coordenação do projeto de adequação (nacionalização)
das diretrizes do Acordo de Basileia II e III;
Serasa Experian: Montagem e validação de modelos de PD e LGD (parâmetros de
Basileia), usando ferramentas de AI para as IFs clientes da organização. Criação de
criptografia e assinatura digital (usando ferramentas da Cryptomathic);
Desenvolvimento do modelo de dados e de processos do cadastro positivo;
Real Grandeza: Realização de dois PDTIs, em 2012 e 2017;
Stussi-Neves e advogados: Mapeamento e redesenho de dados como parte de um
PDTI;
Nossas parcerias internacionais:
Ward Systems para ferramentas de AI;
Cryptomathic para criptografia, hashing, certificados digitais (além de outras
ferramentas de autenticação) e demais funcionalidades de segurança de informação. 19
Obrigado pela atenção
• Entre em contato conosco para mais detalhes de como
desenvolver e aplicar as ideias aqui apresentadas
+55 11 2844-1871
19