Algoritmo HPStream
-
Author
juan-camilo-bernier -
Category
Documents
-
view
40 -
download
0
Embed Size (px)
Transcript of Algoritmo HPStream
Algoritmo HPStreamPresentado por: Juan Camilo Bernier Castro
Tcnica: Es
Agrupamiento (Clustering) un algoritmo de ventanas deslizantes del flujo de datos ya que es incremental y capaz de olvidar el pasado
HPStream
Es aplicable para el Agrupamiento Proyectado sobre Flujos de Datos Altamente Dimensionales (Projected Clustering of High Dimensional Data Streams) Agrupamiento: Un conjunto de puntos (de datos) que se quieren repartir dentro de uno o ms grupos de objetos similares, donde la nocin de similitud est definida por una funcin de distancia.
HPStream(2)cada registro X de un conjunto de datos, existe un tiempo T relacionado con el registro X. Tiempo de vida media: f(t0) = f(0) (de tal forma que se reduce el peso de cada registro a la mitad por cada procesamiento) Utiliza distancia Manhattan.
Para
HPStream(3) Cada
cluster es especfico a un grupo de dimensiones, a esos clusters se refieren como projected clusters (agrupamiento proyectado). a la ejecucin del algoritmo, se realiza un proceso de normalizacin para pesar las diferentes dimensiones correctamente.
Previamente
HPStream(4)
HPStream(5)
Utiliza los algoritmos: FindProjectedDist (para encontrar la distancia proyectada). ComputeDimensions(para calcular las dimensiones proyectadas). FindLimitingRadius (para encontrar el radio lmite del cluster).
Bibliografa:
http://charuaggarwal.net/projstream.pdf http://sci2s.ugr.es/docencia/doctoM6/datas treams.pdf http://pwp.etb.net.co/femrojas/Documento s/estado_del_arte_v1.3.pdf