Combate A Fraudes e Vazamento de Informações Sensíveis

Combate a fraudes e vazamento
de dados sigilosos usando AI e

criptografia forte
1
Desafios para a detecção de acesso indevido a
dados e processos automatizados (anomalias)
usando dados de tráfego de rede
Os sistemas de monitoração de tráfego de rede geram volumes demasiadamente grandes para serem
adequadamente e tempestivamente analisados manualmente ou por ferramentas estatísticas simples
(análise de flutuações atípicas, visto que a prevalência de transferências de dados legítimas “mascara” a
ocorrência menor e menos frequente de eventos mal-intencionados. Portanto, para isolar os reais
“outliers”, outras variáveis de contexto e de monitoração de acessos em aplicativos, devem ser levadas
em consideração na análise por algoritmos de picos de tráfego entre um determinado servidor e
unidades de armazenamento, contendo dados confidenciais, Exemplos de variáveis são:
• Campanhas de marketing em curso na organização;
• Fechamento mensal;
• Emissão periódica de relatórios para reguladores (Ex.: ANEEL e ANATEL);
• Dados de trilhas gerados por aplicativos (ERPs, etc.);
• Eventos de faturamento e cobrança de serviços a clientes.
A análise conjunta dessas variáveis (de contexto de negócio, estatísticas de acesso geradas por
aplicativos e informação de tráfego de rede) escapa à capacidade maioria dos algoritmos
convencionais como análise discriminante, regressão multilinear e logística. Por isso usamos
ferramentas de AI, combinando “engines” fornecidos pela nossa parceira Ward Systems, robustos
testados ao longo de mais de 20 anos.
2
As soluções de AI da IntelliSearch
As soluções da Ward Systems são de fato do tipo híbrido, em que a
rede neural (ANN) é supervisionada – durante o ciclo de
treinamento - e tem sua performance otimizada por um algoritmo
genético (ou PSO). Ele seleciona, ao longo de várias “gerações”, as
melhores combinações de parâmetros da rede neural, com as
seguintes vantagens sobre redes neurais “não supervisionadas”:
✓ Impede overfitting aos dados usados no treinamento (in-sample) melhorando

a capacidade de generalização quando atuando sobre dados “off-sample”;
✓ Quanto mais gerações percorridas durante o ciclo de treinamento, melhor o
“fitting” aos dados “off-sample”;
✓ Evita que a rede, durante o ciclo de treinamento, fique presa sobre um
máximo/mínimo local, e em vez disso busque o ponto ótimo “global”.
✓ Elimina o efeito “caixa-preta”, normalmente encontrado em ANNs não
supervisionadas, exibindo quais variáveis têm mais importância na
capacidade preditiva e/ou classificatória.
3
Já são aplicadas há anos na elaboração de modelos de
várias naturezas, como por exemplo:
✓ Parâmetros de risco financeiro, operacional e ambiental;
✓ Projeção de cenário e de parâmetros macroeconômicos;
✓ Projeção de evolução de ativos e de segmentos da economia;
✓ Classificação e categorização (“clustering”) de clientes,

mercados, ativos, incluindo mining para oferta de produtos de
crédito, e classificação de clientes e contratos, para ações de
cobrança e detecção de fraudes.
✓ Predição de parâmetros financeiros e econômicos, incluindo
scoring, PD, LGD, LCC, EL etc.).
4
Em modelagem de score, ANNs têm se mantido no topo
3,1 Neural Networks

O número é o valor do
ranking de cada 3,3 SVM RBF LS
algoritmo. Quanto
menor, melhor.
4.0 Logit regression
4.9 SVM LF LS
5.2 Linear discriminant analysis
5.3 Bayesian probabilistic networks
7.0 Naive Bayesian networks
Fonte: Credit Technology Dec/2015 – Serasa Experian 5

✓ Conforme demonstrado no gráfico anterior, Redes Neurais

superam, em capacidade preditiva e classificatória todas as
outras abordagens utilizadas no mercado (regressão logística,
SVMs Naïve Bayes,...), para aplicações em scoring, tanto no
desempenho máximo quanto no médio.
✓ No caso do desempenho mínimo, as redes neurais puras caem

nas “armadilhas” do overfitting e dos máximos/mínimos locais,
deixando escapar o máximo/mínimo global.
✓ Por isso utilizamos o modelo híbrido, com o ciclo de treinamento

supervisionado por um algoritmo genético e/ou PSO (particle
swarm optimization), que impede o overfitting e garante o
alcance do máximo/mínimo global.
6
Soluções de Redes Neurais otimizadas por
Algoritmos Genéticos da IntelliSearch
➢ NeuroShell Classifier;
➢ NeuroShell Predictor;
➢ Chaos Hunter.
Obs.: Os nomes de produtos apresentados neste slide e nos demais são de propriedade da
Ward Systems, parceira da IntelliSearch
7
A IntelliSearch adiciona uma camada de software e
de serviços às ferramentas da Ward Systems
Camada de
tratamento de
dados e
interface de
módulos Chaos
Hunter (*)
Captura e pré- Integração com

processamento de dados aplicações da
organização
Integração
NeuroShell NeuroShell
Predictor (*) Classifier (*)
Interface com o
(*) Marcas usuário final
registradas da (web and/or mobile)
8
Ward Systems
Seleção de variáveis
9
Combinando PSO e GA no treinamento
supervisionado da rede
Iniciando com PSO e daí derivando para algoritmos genéticos
Na fase inicial do treinamento (otimização) da Na fase seguinte, após a mudança para uma
ANN, por PSO, a convergência é rápida para um supervisão por GA, os deslocamentos (não
ótimo local ou global no espaço de pesquisa necessariamente convergentes) são menores,
(representado aqui como tridimensional apenas aproximando-se com mais precisão de ótimos
para facilitar a visualização) locais ou globais.
Para mais detalhes, acesse: https://pt.scribd.com/document/377499740/Combinando-Particle-

Swarm-Optimization-e-Algoritmos-Geneticos
10
Importância relativa das variáveis
11
Acompanhamento da convergência do modelo
durante o treinamento
12
Matriz de classificações e desvios
(para aplicações classificatórias como mining e cobrança)
13
Curva ROC
14
A IntelliSearch e a Ward Systems
✓ A IntelliSearch tem mais de 12 anos de experiência contínua na
utilização de ferramentas da Ward Systems, e nesse tempo
desenvolveu metodologias e camadas de software adicionais
(interfaces, normalizadores de dados de input e output para redes
neurais, algoritmos de “seeding”).
✓ Nossa longa cooperação com a Ward Systems também nos dá o
privilégio de determos conhecimentos sobre a melhor forma de
configurar os parâmetros de otimização (treinamento de redes
neurais), além de técnicas para seleção de dados de treinamento.
✓ Finalmente, como únicos parceiros ativos no Brasil temos a total
credibilidade e autorização da Ward Systems para prestarmos
suporte local e consultoria relativa a seus softwares.
✓ Pela mesma condição de parceria, conseguimos obter descontos
para nossos clientes, em relação ao preço de lista.
15
Vantagens sobre outras plataformas de AI
✓ Treina rápido e com relativamente poucos dados.
✓ “Time to Market” curto (3 a 4 semanas em média).
✓ Algoritmos exaustivamente testados durante mais de 18 anos, e ao mesmo tempo
mantidos “cutting edge”. Evitam overfitting e o efeito “caixa-preta”. Mais
especificamente:
➢ Turboprop2 (aperfeiçoamento do “Cascade Correlation” de Scott Fahlman;
➢ GRNN (genetic regressive neural network) é uma rede neural probabilística (modelo
desenvolvido por Donald Specht) com treinamento supervisionado por um
algoritmo genético) usando a técnica “one-hold-out” para manter sempre parte da
amostra in-sample como “out-of-sample” para teste de fitting durante o ciclo de
treinamento. Para alguns casos usamos também PSO combinado (em precedência)
com o algoritmo genético.
✓ Os modelos podem ser calibrados para se tornarem mais “otimistas” ou “pessimistas”
na detecção (vide Executável (run-time) pode ser facilmente incorporado a qualquer
plataforma, como DLL, ActiveX, etc.
✓ Para consulta a cases locais e globais há uma lista parcial no website da Ward Systems.
E também nas páginas referentes a “Financial applications” e “business predictions” de
“applications talk”
16
A solução global para detecção de anomalias
de acesso a dados
Informação
de tráfego
de redes
Ferramentas
de analytics
suportadas
por AI
Integração com
estatísticas de
acesso em
aplicativos
17
Proteção de dados confidenciais
➢ Tendo identificado e classificado (“clustering”) as vulnerabilidades detectadas
pelas ferramentas de AI, podemos aplicar algoritmos de scrambling e de
criptografia forte, além de soluções de autenticação “estado da arte” fornecidos
pelo nosso parceiro estratégico, a Cryptomathic
18
Nossas referências em projetos de TI, montagem de
modelos preditivos, e conformidade regulatória
 Relação parcial de cases (vide atestados)
Banco Cacique: Otimização do processo de conformidade da filial em relação a Basileia
para a matriz do Société Générale;
FEBRABAN: Suporte técnico e coordenação do projeto de adequação (nacionalização)
das diretrizes do Acordo de Basileia II e III;
Serasa Experian: Montagem e validação de modelos de PD e LGD (parâmetros de
Basileia), usando ferramentas de AI para as IFs clientes da organização. Criação de
criptografia e assinatura digital (usando ferramentas da Cryptomathic);
Desenvolvimento do modelo de dados e de processos do cadastro positivo;
Real Grandeza: Realização de dois PDTIs, em 2012 e 2017;
Stussi-Neves e advogados: Mapeamento e redesenho de dados como parte de um
PDTI;
Nossas parcerias internacionais:
Ward Systems para ferramentas de AI;
Cryptomathic para criptografia, hashing, certificados digitais (além de outras
ferramentas de autenticação) e demais funcionalidades de segurança de informação. 19
Obrigado pela atenção
• Entre em contato conosco para mais detalhes de como
desenvolver e aplicar as ideias aqui apresentadas
Av. das Nações Unidas, 12495 – 15º andar
04578-000 – São Paulo – SP – Brasil
+55 11 2844-1871
Para uma visão geral das nossas soluções,

acessem nossas páginas no Linkedin e
Facebook
19

Combate A Fraudes e Vazamento de Informações Sensíveis

Hochgeladen von

Dokumentinformationen

Originaltitel

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

Combate A Fraudes e Vazamento de Informações Sensíveis

Hochgeladen von

Copyright:

Verfügbare Formate

Combate a fraudes e vazamento

de dados sigilosos usando AI e

✓ Impede overfitting aos dados usados no treinamento (in-sample) melhorando

✓ Projeção de cenário e de parâmetros macroeconômicos;

✓ Projeção de evolução de ativos e de segmentos da economia;

✓ Classificação e categorização (“clustering”) de clientes,

3,1 Neural Networks

5.2 Linear discriminant analysis

5.3 Bayesian probabilistic networks

7.0 Naive Bayesian networks

Fonte: Credit Technology Dec/2015 – Serasa Experian 5

✓ Conforme demonstrado no gráfico anterior, Redes Neurais

✓ No caso do desempenho mínimo, as redes neurais puras caem

✓ Por isso utilizamos o modelo híbrido, com o ciclo de treinamento

Captura e pré- Integração com

Para mais detalhes, acesse: https://pt.scribd.com/document/377499740/Combinando-Particle-

Av. das Nações Unidas, 12495 – 15º andar

04578-000 – São Paulo – SP – Brasil

Para uma visão geral das nossas soluções,

Das könnte Ihnen auch gefallen