Metodologia para detectar Deteccion de Fraude Electoral, La Ley de Benford PRESENTACION

Post on 03-Jul-2015

2.488 views 1 download

description

Este documento describe una metodologia para detectar fraude electoral, atraves de la Ley de Benford dentro la CALIDAD DE INFORMACION

Transcript of Metodologia para detectar Deteccion de Fraude Electoral, La Ley de Benford PRESENTACION

PUNTOS A TRATAR

¢ Introducción.

¢ El Fenómeno del Primer Dígito.

¢ El Desarrollo de la teoría.¢ El Desarrollo de la teoría.

¢ La Ley de Benford.

� Supuestos de una distribución de tipo Benford.� Pruebas de Bondad de ajuste de una distribución

observada a la Ley de Benford.

¢ Aplicaciones de la Ley de Benford.

INTRODUCCIÓN

Existirán números que siguen:

ü una estructura.ü un patrón. ?ü un patrón.ü un modelo. ?

INTRODUCCIÓN

Conjunto de Datos(numéricos)

?Existirá algún

método?(numéricos)

Para saber si estos datos son los que realmente se

esperaban?

Ejemplos-SIMULACIÓN(números pseudoaleatorios)

-ELECCIONES PRESIDENCIALES(nº de votos que se espereraban, fraude electoral)

-EVALUACIÓN DE FUN. MAT.(0,1,1,2,3,5,8,….an= an-1+an-2 SUC. FIBO)

INTRODUCCIÓN

Paquetes (Análisis de datos)

- Forensic Tool Kit.

- ACL.

- IDEA.SISISISI• EL COMO…

• EN QUE SE BASA

Principales controles parala detección de errores

CALIDAD DE LA INFORMACICALIDAD DE LA INFORMACIÓN ÓN ==>>((Gestión de DatosGestión de Datos))

• EN QUE SE BASA

• EL ALGORITMO

• RELACIONES LÓGICO-MATEMÁTICAS

• Y DEMÁS ASPECTOSDE ANÁLISIS INTERNODEL PAQUETE.

La Ley de Benford

INTRODUCCIÓN

Observación.

En esta sesión no se pretende demostrar laLey de Benford

Lo que haremos será:- Dar el fundamento matemático a la Ley deBenford.

- Brindar algunas nociones de aplicabilidad ala Ley.

- Tomar la aplicación más llamativa de laLey, proponer una metodología para sudesarrollo.

EL FENÓMENO DEL PRIMER DÍGITO

El primero en hacer notar que los primeros dígitosde los números no se distribuyen de maneraequiprobable.

Newcomb paso a la historia por sus trabajos tandistintos como:

- Sus teorías sobre el orígenes de losasteroides.

������������� �� �������������� �� �

((astrónomoastrónomo y y matemáticomatemático))������������� �� �������������� �� �

((astrónomoastrónomo y y matemáticomatemático))

asteroides.

- o por afirmar rotundamente que ningúnaeroplano podría volar.

Newcomb observó que las primeras páginas de loslibros tablas de logaritmos1 estabansistemáticamente más desgastadas que lasúltimas.

1 las tablas de logaritmos eran utilizadas para hacer productos, cocientes y raíces,facilitando así la tediosa operación manual [Nigrini, 2000]

EL FENÓMENO DEL PRIMER DÍGITO

Newcomb observó que los números con mantisa 1 estaban máspresentes en la realidad que los que tenían mantisa 2, y éstos más quelos que tenían mantisa 3, etc.

Newcomb afirma (no dá explicación de éste fenómeno, nifundamentaciones matemáticas):

“La Ley de probabilidad de la ocurrencia de números es tal que las mantisas de sus logaritmos son equiprobables”que las mantisas de sus logaritmos son equiprobables”

rcxrx c

1010loglog10 +=⇔×=PROPIEDAD DE LA MANTISA

EL FENÓMENO DEL PRIMER DÍGITO57 años más tarde Frank Benford publica:

“The Law of anomalous numbers”2

A diferencia del trabajo de Newcomb, Benfordno sólo formula la Ley que finalmentetomará su nombre, sino que se dedica a recogeruna cantidad ingente de observaciones (20229):

- Las áreas y longitudes de los ríos.

��������������������������

� ����� ����

(físico de General Electric)

��������������������������

� ����� ����

(físico de General Electric)

- Las áreas y longitudes de los ríos.

- Los pesos atómicos de los elementos de la T.P.

- Estadísticas de la liga Americana de béisbol.

Demuestra que en todas estas series los dígitos queaparecen en los primeros lugares lo hacen con unaprobabilidad desigual, siendo más probable la apariciónde dígitos pequeños que de dígitos grandes…

2 Sin haber conocido el trabajo de Newcomb, y a partir del mismo fenómeno.

EL DESARROLLO DE LA TEORÍA

La repercusión del trabajo de Benford no es inmediata:

Durante los años 40 los trabajos son muy escasos y en su mayoríacríticos (Goudsmit y Furry, 1944; Furry y Hurwitz,1945)

En 1961, Pinkham publica una imprescindible aportación al trabajode Benford:

“Si hay una Ley que gobierna la distribución de los dígitos,

Sin embargo, en 1969 Raimi es quien demuestra finalmente laindependencia de la unidad de medida de la Ley de Benford.

“Si hay una Ley que gobierna la distribución de los dígitos, ésta debe ser necesariamente ESCALA INVARIANTE”

En los años 70 y 80 se inician aproximaciones pragmáticas ypublicaciones importantes al uso de la Ley de Benford.

EL DESARROLLO DE LA TEORÍA

Hill (1996) demuestra algo ya sugerido por Boyle (1994): laLey de Benford o distribución logarítmica de los primerosdígitos:

“Es la distribución de todas las distribuciones3”

En cuanto a su uso:

Christian y Gupta (1993) pero especialmente Nigrini (1994,Christian y Gupta (1993) pero especialmente Nigrini (1994,1996 y 2000), aplica la Ley de Benford, así como lasdistribuciones de los segundos y sucesivos dígitos, paradetectar eventuales fraudes en la contabilidad, los cualesameritan un proceso de contraloría.

3 Esto es, que si tomamos una serie de distribuciones seleccionadas al azar de manerainsesgada, y de estas distribuciones extraemos valores, los primeros dígitos del conjuntode valores convergen a una distribución logarítmica.

LA LEY DE BENFORD

La Ley de Benford, también llamada la Ley del DígitoSignificativo o Ley del Primer Dígito, es unadistribución de probabilidad en los dígitos significativos delos números reales.

La LeyLey dede BenfordBenford es la distribución de probabilidadlogarítmica dada por:

LA LEY DE BENFORD

La LeyLey dede BenfordBenford para el primer dígito nos dará lasiguiente tabla de probabilidades para cada número:

Según esta ley:

El 30% de las veces, la primera cifrasignificativa será un 1, mientras que sóloun 5% de las veces será un 9.

LA LEY DE BENFORD

Ejemplo de cálculo para el 2do, 3er y 4to dígitosignificativo.

American Mathematical Society,

Vol. 123, N° 3 (Mar. 1995), pág. 887-895

Theodore P. Hill:

La Ley de Ley de BenfordBenfordes de

BASE INVARIANTE

LA LEY DE BENFORD

Para los k-ésimos dígitos significativos

Para el k-ésimo dígito significativo

LA LEY DE BENFORD

A partir de la Ley generalizada puede calcularse laprobabilidad de dk condicionada4 a los valores de losdígitos anteriores.

4 Un resultado importante es que los dígitos significativos no son independientes ya que la presenciade un dígito modifica la probabilidad de aparición de los demás.

QUÉ DATOS SATISFACEN LA LEY DE BENFORD?

Es evidente que la LeyLey dedeBenfordBenford no se verifica entodos los posibles conjuntos dedatos numéricos como:

Aquellos procedentes de distribuciones

- uniformes (números de lotería)

- normales (edades de personas).

Tampoco puede verificarse la ley cuando los datostienen limitado el valor del dígito inicial (precios deproductos)

Existe una fuerte dependencia en cuanto a lanaturaleza de los datos (núm. telefónicos, doc. deidentidad se asignan arbitrariamente)

SUPUESTOS DE UNA DISTRIBUCIÓN DE TIPO BENFORD?

ü Sucesiones geométricas (requisitofundamental).

No tener un máximo, ni un mínimoteórico5.

ü Datos que contengan cuatro o más dígitos(dem. cantidad de dígitos importantes, "tres”).(dem. cantidad de dígitos importantes, "tres”).ü Datos que contienen valores similares parafenómenos similares.ü El conjunto de los datos no debecomponerse de números asignados.

5 La razón es que los dígitos que componen estos mínimos y máximos aparecen con unafrecuencia mucho mayor de la esperada por la distribución.

PRUEBAS DE BONDAD DE AJUSTE DE UNA

DISTRIBUCIÓN OBSERVADA A LEY DE BENFORD

Para examinar la bondad de ajuste de los datosobservados a la distribución teórica de Benford sehan adaptado los tests clásicos:

- La prueba de estadístico Z- La prueba de estadístico Z

- La prueba de estadístico χ2 6

- La prueba de Kolmogorov-Smirnoff y- La desviación media absoluta [Nigrini, 2000, pág. 79].

6 Nigrini propone su uso paracalcular la bondad de ajuste de todoslos dígitos respecto a lo esperado porla Ley de Benford.

APLICACIONES DE LA LEY DE BENFORD

Durante muchos años la Ley de Benford no ha sido másque una curiosidad estadística sin fundamentaciónmatemática ni aplicaciones reales.

Hoy la Ley está firmemente basada en la teoría de laprobabilidad, goza del interés del público general ypresenta importantes aplicaciones a la vista.presenta importantes aplicaciones a la vista.

APLICACIONESAPLICACIONES

•La Ley se ha propuesto como un posibletest de evaluación de los resultadosobtenidos, ya sea por medios analíticos ode simulación.

•La Ley de Benford en el estudio de lacomputación científica y la aritmética enpunto flotante.

APLICACIONES DE LA LEY DE BENFORD

APLICACIONESAPLICACIONES

•Se ha utilizado la Ley en cuestionescomo el tiempo de ejecución dealgoritmos de aritmética en puntoflotante, los errores de redondeo y suminimización.

•Donald Knuth, la idea de Knuth es que•Donald Knuth, la idea de Knuth es queun ordenador tiene que manejar datosque probablemente sigan la Ley deBenford. Por tanto, podríamos diseñarordenadores que sean más rápidoscalculando o leyendo de discos duros ymemorias RAM los números queempiezan por 1.

•También se ha pensado en la posibleadecuación de la Ley de Benford a juegosde adivinación y similares. ?

APLICACIONES DE LA LEY DE BENFORD

APLICACIONESAPLICACIONES

• Sin duda la aplicación más llamativa:

DETECCIÓN DE DATOS ERRÓNEOS O FRAUDULENTOS

DESARROLLO DE LA APLICACIÓN MÁS LLAMATIVA

CASO: CÓMO DETECTAR INDICIOS DE FRAUDE ELECTORAL?

Coyuntura

Cómo Detectar Indicios de

Fraude Electoral?

Coyuntura (2009-2010)

Las técnicas de detección de fraudes técnicas de detección de fraudes (FRAUDITOR)

q AnálisisAnálisis EstadísticoEstadístico:: Análisis de regresión, análisis de correlación, análisisde dispersión, La Ley de Benford – Análisis de Frecuencia digital.q PatronesPatrones:: Secuencias, investigación de faltantes y duplicados, análisishistórico de tendencias, análisis de ratios.q TécnicasTécnicas dede análisisanálisis visualvisual:: Análisis de relaciones, análisis de líneas detiempo, gráficos de agrupamiento (clustering)q ProcedimientosProcedimientos analíticosanalíticos dede auditoriaauditoria:: Análisis vertical y horizontal delas cuentas de balance y de resultados; Análisis de índices/ratios históricos.

Etapa de resolución delproblema

Etapa de

Análisis del problema

Diseño o Desarrollo delalgoritmo

Planteamiento del problema

Organización y clasificación de losdatos recogidos

Recolección de la información

Análisis e interpretación de losresultados

Construcción de tablas defrecuencias

Representación tabular o cuadrosestadísticos y gráfica

Técnica Divide y Vencerás

1.Dividir el problemas en k-subproblemas.2.Resolver independientemente los k-subproblemas.3.Combinar las soluciones obtenidas de pasoanterior, para resolver el problema original.

método

estadístico

PROPUESTA METODOLÓGICA

Análisis

Desarrollo

Implementación

ALGORITMO en elmarco de la Ley deBenford.

Etapa deimplementación en el

ordenador

anterior, para resolver el problema original.

Recolección y refinamiento de requisitos

Diseño rápido

* Cuestionario.

* DFD.

Construcción del prototipo

* Codificación del algoritmo y eldiseño del sistema en unprograma.

Evaluación del prototipo por el cliente

* Ejecución del programa.

Refinamiento del prototipo

* Comprobación del programa.

Producto final

paradigma

prototipación

DESARROLLO DE LA APLICACIÓN MÁS LLAMATIVA

CASO: CÓMO DETECTAR INDICIOS DE FRAUDE ELECTORAL?Determinación

de

Variables

Para una mejorinterpretación de losdatos observados sepuede tomar en cuenta losestadísticos:

•Mediana.•Error estándar.•Desviación estándar.•Curtosis.•Coeficiente de Asimetría.

DESARROLLO DE LA APLICACIÓN MÁS LLAMATIVA

CASO: CÓMO DETECTAR INDICIOS DE FRAUDE ELECTORAL?

DESARROLLO DE LA APLICACIÓN MÁS LLAMATIVA

CASO: CÓMO DETECTAR INDICIOS DE FRAUDE ELECTORAL?

DEFINICIONESDEFINICIONES

DESARROLLO DE LA APLICACIÓN MÁS LLAMATIVA

CASO: CÓMO DETECTAR INDICIOS DE FRAUDE ELECTORAL?

DEFINICIONESDEFINICIONES

DESARROLLO DE LA APLICACIÓN MÁS LLAMATIVA

CASO: CÓMO DETECTAR INDICIOS DE FRAUDE ELECTORAL?

DEFINICIONESDEFINICIONES

DESARROLLO DE LA APLICACIÓN MÁS LLAMATIVA

CASO: CÓMO DETECTAR INDICIOS DE FRAUDE ELECTORAL?

ALGORITMOALGORITMO

Pruebas Pruebas del del Análisis Digital.Análisis Digital.

•Las pruebas básicas•Las pruebas avanzadas.•Las pruebas avanzadas.

•PD,•SD, P2D,•P3D,•DN,•U2D,•RN.

DESARROLLO DE LA APLICACIÓN MÁS LLAMATIVA

CASO: CÓMO DETECTAR INDICIOS DE FRAUDE ELECTORAL?

CONJUNTO DE DATOS ANALIZADOSCONJUNTO DE DATOS ANALIZADOS

Elecciones 2002 - Bolivia

Elecciones 2009 - BoliviaElecciones 2009 - Bolivia

Números Pseudoaleatorios

Fraude Electoral, análisis forense Mexico 2006Ley de Benford

http://www.fisica.unam.mx/octavio/

Votación Electrónica

jesus.larrazabal.salas @gmail.comBIBLIOGRAFÍABIBLIOGRAFÍA

GESTIÓN DE DATOS1) Definir la estructura de la base de datos;2) definir e implementar todas las protecciones posibles entre

los datos para detectar y eliminar el máximo número deincongruencias durante la recogida de la información;

3) garantizar que los datos que han sido registrados nocontienen inconsistencias;

4) preparar la matriz de datos para el análisis estadístico,creando las variables necesarias para contrastar lascreando las variables necesarias para contrastar lashipótesis empíricas;

5) emplear las técnicas de análisis estadístico adecuadas;6) evaluar la calidad de las estrategias utilizadas durante todo

el proceso de recogida y manejo de la información; y7) consensuar procedimientos de control para garantizar la

calidad de la gestión de datos que sean aplicables en futurasinvestigaciones, valorando en cada caso los costes de suimplementación.