T opicos em Seguranca˘ da Informa˘c~ao Aula BA+MLsendin/Cursos/TSEG/2S2019/aulaBAML.pdf ·...

21
TSEG-BA Ivan Sendin news Mais chain analysis Crash Course em ML Implementa¸c˜oes T´opicos em Seguran¸ ca da Informa¸ ao Aula BA+ML Ivan Sendin FACOM - Universidade Federal de Uberlandia [email protected],[email protected] 18 de outubro de 2019

Transcript of T opicos em Seguranca˘ da Informa˘c~ao Aula BA+MLsendin/Cursos/TSEG/2S2019/aulaBAML.pdf ·...

Page 1: T opicos em Seguranca˘ da Informa˘c~ao Aula BA+MLsendin/Cursos/TSEG/2S2019/aulaBAML.pdf · 2019-10-18 · TSEG-BA Ivan Sendin news Mais chain analysis Crash Course em ML Implementa˘c~oes

TSEG-BA

Ivan Sendin

news

Mais chainanalysis

Crash Course emML

Implementacoes

Topicos em Seguranca da Informacao

Aula BA+ML

Ivan Sendin

FACOM - Universidade Federal de [email protected],[email protected]

18 de outubro de 2019

Page 2: T opicos em Seguranca˘ da Informa˘c~ao Aula BA+MLsendin/Cursos/TSEG/2S2019/aulaBAML.pdf · 2019-10-18 · TSEG-BA Ivan Sendin news Mais chain analysis Crash Course em ML Implementa˘c~oes

TSEG-BA

Ivan Sendin

news

Mais chainanalysis

Crash Course emML

Implementacoes

Aeroporto Internacional de Miami recebe primeiraATM de Bitcoin

Page 3: T opicos em Seguranca˘ da Informa˘c~ao Aula BA+MLsendin/Cursos/TSEG/2S2019/aulaBAML.pdf · 2019-10-18 · TSEG-BA Ivan Sendin news Mais chain analysis Crash Course em ML Implementa˘c~oes

TSEG-BA

Ivan Sendin

news

Mais chainanalysis

Crash Course emML

Implementacoes

Investigacoes da CVM

300 ate o final do ano (124/2018)

Unick Forex

Movimentou de R$2.4 a R$9 bilhoes (?)

Algumas prisoes

B1500 apreendidos

Page 4: T opicos em Seguranca˘ da Informa˘c~ao Aula BA+MLsendin/Cursos/TSEG/2S2019/aulaBAML.pdf · 2019-10-18 · TSEG-BA Ivan Sendin news Mais chain analysis Crash Course em ML Implementa˘c~oes

TSEG-BA

Ivan Sendin

news

Mais chainanalysis

Crash Course emML

Implementacoes

WTV

Welcome to Video

Tor hidden service

Coreia do Sul

Pagamento em Bitcoin

Chainalysis in Action: DOJ Announces Shutdown ofLargest Child Pornography Website

DOJ

337 presos em 38 paises

Page 5: T opicos em Seguranca˘ da Informa˘c~ao Aula BA+MLsendin/Cursos/TSEG/2S2019/aulaBAML.pdf · 2019-10-18 · TSEG-BA Ivan Sendin news Mais chain analysis Crash Course em ML Implementa˘c~oes

TSEG-BA

Ivan Sendin

news

Mais chainanalysis

Crash Course emML

Implementacoes

WTV

1.3 Milhoes de enderecos BTC

$353,000

Chainalysis Reactor

Page 6: T opicos em Seguranca˘ da Informa˘c~ao Aula BA+MLsendin/Cursos/TSEG/2S2019/aulaBAML.pdf · 2019-10-18 · TSEG-BA Ivan Sendin news Mais chain analysis Crash Course em ML Implementa˘c~oes

TSEG-BA

Ivan Sendin

news

Mais chainanalysis

Crash Course emML

Implementacoes

Page 7: T opicos em Seguranca˘ da Informa˘c~ao Aula BA+MLsendin/Cursos/TSEG/2S2019/aulaBAML.pdf · 2019-10-18 · TSEG-BA Ivan Sendin news Mais chain analysis Crash Course em ML Implementa˘c~oes

TSEG-BA

Ivan Sendin

news

Mais chainanalysis

Crash Course emML

Implementacoes

Page 8: T opicos em Seguranca˘ da Informa˘c~ao Aula BA+MLsendin/Cursos/TSEG/2S2019/aulaBAML.pdf · 2019-10-18 · TSEG-BA Ivan Sendin news Mais chain analysis Crash Course em ML Implementa˘c~oes

TSEG-BA

Ivan Sendin

news

Mais chainanalysis

Crash Course emML

Implementacoes

IC/TCC?

Identificar o comportamento de tipo ”estrela”

Clusters que recebem bitcoins de clusters”conhecidos”

Page 9: T opicos em Seguranca˘ da Informa˘c~ao Aula BA+MLsendin/Cursos/TSEG/2S2019/aulaBAML.pdf · 2019-10-18 · TSEG-BA Ivan Sendin news Mais chain analysis Crash Course em ML Implementa˘c~oes

TSEG-BA

Ivan Sendin

news

Mais chainanalysis

Crash Course emML

Implementacoes

IC/TCC?

Labelling de enderecos usando google e redes sociais

Page 10: T opicos em Seguranca˘ da Informa˘c~ao Aula BA+MLsendin/Cursos/TSEG/2S2019/aulaBAML.pdf · 2019-10-18 · TSEG-BA Ivan Sendin news Mais chain analysis Crash Course em ML Implementa˘c~oes

TSEG-BA

Ivan Sendin

news

Mais chainanalysis

Crash Course emML

Implementacoes

Machine Learning

Classificacao de clusters

ML caixa-preta

“Prova de conceito”

Resultados de fato exigem mais cuidados...

Page 11: T opicos em Seguranca˘ da Informa˘c~ao Aula BA+MLsendin/Cursos/TSEG/2S2019/aulaBAML.pdf · 2019-10-18 · TSEG-BA Ivan Sendin news Mais chain analysis Crash Course em ML Implementa˘c~oes

TSEG-BA

Ivan Sendin

news

Mais chainanalysis

Crash Course emML

Implementacoes

# https://scikit-learn.org/stable/

# https://www.youtube.com/watch?v=cKxRvEZd3Mw

from sklearn import tree

#existem outros...

Page 12: T opicos em Seguranca˘ da Informa˘c~ao Aula BA+MLsendin/Cursos/TSEG/2S2019/aulaBAML.pdf · 2019-10-18 · TSEG-BA Ivan Sendin news Mais chain analysis Crash Course em ML Implementa˘c~oes

TSEG-BA

Ivan Sendin

news

Mais chainanalysis

Crash Course emML

Implementacoes

Fonte: https://en.wikipedia.org/wiki/Decision tree learning

Page 13: T opicos em Seguranca˘ da Informa˘c~ao Aula BA+MLsendin/Cursos/TSEG/2S2019/aulaBAML.pdf · 2019-10-18 · TSEG-BA Ivan Sendin news Mais chain analysis Crash Course em ML Implementa˘c~oes

TSEG-BA

Ivan Sendin

news

Mais chainanalysis

Crash Course emML

Implementacoes

# caracteristica da casca

SMOOTH=1

BUMPY =0

# a classes

APPLE=0

ORANGE=1

# o vetor caracteristica, peso e casca

# obtidos de dados "reais"

features = [

[140,SMOOTH],

[130,SMOOTH],

[150,BUMPY],

[170,BUMPY]]

# as classes

labels = [APPLE,APPLE,ORANGE,ORANGE]

Page 14: T opicos em Seguranca˘ da Informa˘c~ao Aula BA+MLsendin/Cursos/TSEG/2S2019/aulaBAML.pdf · 2019-10-18 · TSEG-BA Ivan Sendin news Mais chain analysis Crash Course em ML Implementa˘c~oes

TSEG-BA

Ivan Sendin

news

Mais chainanalysis

Crash Course emML

Implementacoes

# o treinamento/preparacao

clf = tree.DecisionTreeClassifier()

clf = clf.fit(features, labels)

# a predicao

print clf.predict([[150,BUMPY],[120,SMOOTH],[190,SMOOTH]])

Page 15: T opicos em Seguranca˘ da Informa˘c~ao Aula BA+MLsendin/Cursos/TSEG/2S2019/aulaBAML.pdf · 2019-10-18 · TSEG-BA Ivan Sendin news Mais chain analysis Crash Course em ML Implementa˘c~oes

TSEG-BA

Ivan Sendin

news

Mais chainanalysis

Crash Course emML

Implementacoes

luke@xwing:~$ python HelloWorld.py

[1 0 0]

luke@xwing:~$ python HelloWorld.py

[1 0 1]

As macas sao lisas e pequenas

As laranjas sao rugosas e maiores

A fruta [190, SMOOTH] pode ser laranja ou maca

Page 16: T opicos em Seguranca˘ da Informa˘c~ao Aula BA+MLsendin/Cursos/TSEG/2S2019/aulaBAML.pdf · 2019-10-18 · TSEG-BA Ivan Sendin news Mais chain analysis Crash Course em ML Implementa˘c~oes

TSEG-BA

Ivan Sendin

news

Mais chainanalysis

Crash Course emML

Implementacoes

Cluster obtidos por H1

Classificacao de clusters

Exchange/Nao Exchange

(apostas, mineracao,..)

Page 17: T opicos em Seguranca˘ da Informa˘c~ao Aula BA+MLsendin/Cursos/TSEG/2S2019/aulaBAML.pdf · 2019-10-18 · TSEG-BA Ivan Sendin news Mais chain analysis Crash Course em ML Implementa˘c~oes

TSEG-BA

Ivan Sendin

news

Mais chainanalysis

Crash Course emML

Implementacoes

Como treinar? Como saber se e uma exchange??

walletexplorer.org

De todos os clusters, separe alguns para treinar eoutros para classificar

Page 18: T opicos em Seguranca˘ da Informa˘c~ao Aula BA+MLsendin/Cursos/TSEG/2S2019/aulaBAML.pdf · 2019-10-18 · TSEG-BA Ivan Sendin news Mais chain analysis Crash Course em ML Implementa˘c~oes

TSEG-BA

Ivan Sendin

news

Mais chainanalysis

Crash Course emML

Implementacoes

Caracteristicas

N de Txs

N de Enderecos

BTC In

BTC Out

Gini

Bendford: frequencia do i -esimo digito nos valoresdas txs

Page 19: T opicos em Seguranca˘ da Informa˘c~ao Aula BA+MLsendin/Cursos/TSEG/2S2019/aulaBAML.pdf · 2019-10-18 · TSEG-BA Ivan Sendin news Mais chain analysis Crash Course em ML Implementa˘c~oes

TSEG-BA

Ivan Sendin

news

Mais chainanalysis

Crash Course emML

Implementacoes

Avaliacao

Implementar a classificacao dos clusters H1

Codigo e resultados

Valor 30.0

3 semanas

Alternativamete: clusterizacao(ML?) dos clustersH1

Page 20: T opicos em Seguranca˘ da Informa˘c~ao Aula BA+MLsendin/Cursos/TSEG/2S2019/aulaBAML.pdf · 2019-10-18 · TSEG-BA Ivan Sendin news Mais chain analysis Crash Course em ML Implementa˘c~oes

TSEG-BA

Ivan Sendin

news

Mais chainanalysis

Crash Course emML

Implementacoes

Avaliacao

Implementar a classificacao dos clusters H1

Codigo e resultados

Valor 30.0

3 semanas

Alternativamete: clusterizacao(ML?) dos clustersH1

(As dificuldades sao as mesmas!)

Page 21: T opicos em Seguranca˘ da Informa˘c~ao Aula BA+MLsendin/Cursos/TSEG/2S2019/aulaBAML.pdf · 2019-10-18 · TSEG-BA Ivan Sendin news Mais chain analysis Crash Course em ML Implementa˘c~oes

TSEG-BA

Ivan Sendin

news

Mais chainanalysis

Crash Course emML

Implementacoes

Avaliacao II

Alternativa

Determinar o Fluxo de BTC entre Exchanges

Exchanges: walletexeplorer.com/parsing

Txs: por uma janela de tempo

Montar um grafo (grafico) : multigrafo ponderado

Qualidade da solucao: tecnicas, codigo,...

IC

Valor 30.0 / 3 semanas