T opicos em Seguranca˘ da Informa˘c~ao Aula BA+MLsendin/Cursos/TSEG/2S2019/aulaBAML.pdf ·...

Post on 26-Apr-2020

2 views 0 download

Transcript of T opicos em Seguranca˘ da Informa˘c~ao Aula BA+MLsendin/Cursos/TSEG/2S2019/aulaBAML.pdf ·...

TSEG-BA

Ivan Sendin

news

Mais chainanalysis

Crash Course emML

Implementacoes

Topicos em Seguranca da Informacao

Aula BA+ML

Ivan Sendin

FACOM - Universidade Federal de Uberlandiaivansendin@yahoo.com,sendin@ufu.br

18 de outubro de 2019

TSEG-BA

Ivan Sendin

news

Mais chainanalysis

Crash Course emML

Implementacoes

Aeroporto Internacional de Miami recebe primeiraATM de Bitcoin

TSEG-BA

Ivan Sendin

news

Mais chainanalysis

Crash Course emML

Implementacoes

Investigacoes da CVM

300 ate o final do ano (124/2018)

Unick Forex

Movimentou de R$2.4 a R$9 bilhoes (?)

Algumas prisoes

B1500 apreendidos

TSEG-BA

Ivan Sendin

news

Mais chainanalysis

Crash Course emML

Implementacoes

WTV

Welcome to Video

Tor hidden service

Coreia do Sul

Pagamento em Bitcoin

Chainalysis in Action: DOJ Announces Shutdown ofLargest Child Pornography Website

DOJ

337 presos em 38 paises

TSEG-BA

Ivan Sendin

news

Mais chainanalysis

Crash Course emML

Implementacoes

WTV

1.3 Milhoes de enderecos BTC

$353,000

Chainalysis Reactor

TSEG-BA

Ivan Sendin

news

Mais chainanalysis

Crash Course emML

Implementacoes

TSEG-BA

Ivan Sendin

news

Mais chainanalysis

Crash Course emML

Implementacoes

TSEG-BA

Ivan Sendin

news

Mais chainanalysis

Crash Course emML

Implementacoes

IC/TCC?

Identificar o comportamento de tipo ”estrela”

Clusters que recebem bitcoins de clusters”conhecidos”

TSEG-BA

Ivan Sendin

news

Mais chainanalysis

Crash Course emML

Implementacoes

IC/TCC?

Labelling de enderecos usando google e redes sociais

TSEG-BA

Ivan Sendin

news

Mais chainanalysis

Crash Course emML

Implementacoes

Machine Learning

Classificacao de clusters

ML caixa-preta

“Prova de conceito”

Resultados de fato exigem mais cuidados...

TSEG-BA

Ivan Sendin

news

Mais chainanalysis

Crash Course emML

Implementacoes

# https://scikit-learn.org/stable/

# https://www.youtube.com/watch?v=cKxRvEZd3Mw

from sklearn import tree

#existem outros...

TSEG-BA

Ivan Sendin

news

Mais chainanalysis

Crash Course emML

Implementacoes

Fonte: https://en.wikipedia.org/wiki/Decision tree learning

TSEG-BA

Ivan Sendin

news

Mais chainanalysis

Crash Course emML

Implementacoes

# caracteristica da casca

SMOOTH=1

BUMPY =0

# a classes

APPLE=0

ORANGE=1

# o vetor caracteristica, peso e casca

# obtidos de dados "reais"

features = [

[140,SMOOTH],

[130,SMOOTH],

[150,BUMPY],

[170,BUMPY]]

# as classes

labels = [APPLE,APPLE,ORANGE,ORANGE]

TSEG-BA

Ivan Sendin

news

Mais chainanalysis

Crash Course emML

Implementacoes

# o treinamento/preparacao

clf = tree.DecisionTreeClassifier()

clf = clf.fit(features, labels)

# a predicao

print clf.predict([[150,BUMPY],[120,SMOOTH],[190,SMOOTH]])

TSEG-BA

Ivan Sendin

news

Mais chainanalysis

Crash Course emML

Implementacoes

luke@xwing:~$ python HelloWorld.py

[1 0 0]

luke@xwing:~$ python HelloWorld.py

[1 0 1]

As macas sao lisas e pequenas

As laranjas sao rugosas e maiores

A fruta [190, SMOOTH] pode ser laranja ou maca

TSEG-BA

Ivan Sendin

news

Mais chainanalysis

Crash Course emML

Implementacoes

Cluster obtidos por H1

Classificacao de clusters

Exchange/Nao Exchange

(apostas, mineracao,..)

TSEG-BA

Ivan Sendin

news

Mais chainanalysis

Crash Course emML

Implementacoes

Como treinar? Como saber se e uma exchange??

walletexplorer.org

De todos os clusters, separe alguns para treinar eoutros para classificar

TSEG-BA

Ivan Sendin

news

Mais chainanalysis

Crash Course emML

Implementacoes

Caracteristicas

N de Txs

N de Enderecos

BTC In

BTC Out

Gini

Bendford: frequencia do i -esimo digito nos valoresdas txs

TSEG-BA

Ivan Sendin

news

Mais chainanalysis

Crash Course emML

Implementacoes

Avaliacao

Implementar a classificacao dos clusters H1

Codigo e resultados

Valor 30.0

3 semanas

Alternativamete: clusterizacao(ML?) dos clustersH1

TSEG-BA

Ivan Sendin

news

Mais chainanalysis

Crash Course emML

Implementacoes

Avaliacao

Implementar a classificacao dos clusters H1

Codigo e resultados

Valor 30.0

3 semanas

Alternativamete: clusterizacao(ML?) dos clustersH1

(As dificuldades sao as mesmas!)

TSEG-BA

Ivan Sendin

news

Mais chainanalysis

Crash Course emML

Implementacoes

Avaliacao II

Alternativa

Determinar o Fluxo de BTC entre Exchanges

Exchanges: walletexeplorer.com/parsing

Txs: por uma janela de tempo

Montar um grafo (grafico) : multigrafo ponderado

Qualidade da solucao: tecnicas, codigo,...

IC

Valor 30.0 / 3 semanas