Recomendación Basadaen...
Transcript of Recomendación Basadaen...
Recomendación Basada enGrafos
DenisParraIIC36332016
AgendaSemestral
Problema deRecomendación
• Nuevamente revisitamos elproblema derecomendación.
• Una alternativa válida alosmétodos vistoshastaahora es explotar las relaciones entreitemsenlaformadegrafos.
Hoy
• Associativeretrievaltechniquestoalleviatethesparsity probleminCF(Huangetal.2004)
• ThelinkPredictionProblemforSocialNetworks(Liben-Nowel,Kleinberg,2002)
Paper1
• Zan Huang,Hsinchun Chen,andDanielZeng.2004.Applyingassociativeretrievaltechniquestoalleviatethesparsity problemincollaborativefiltering.ACMTrans.Inf.Syst.22,1(January2004),116-142.
Resumen
• Lidiar conelproblema deescasez deevaluaciones delusuario (ratings)
• Filtrado Colaborativo es estudiado como ungrafo bi-partito.
• Técnicas derecuperación asociativa sonutilizadas sobre elgrafo (SpreadingActivation)
• RESULTADO:Cuando hayescasez deratings,estas técnicas basadas engrafos mejoran losresultado delfiltrado colaborativo.
ElProblema deEscasez (Sparsity)
• Al2004,losproblemas decold-startynew-itemsehabían atacado usando:– Item-BasedCF(Sarwar 2001)– Reducción deDimensionalidad (Golderg 2001)– Híbridos (Balanovic 2002,Basu 1998,Condliff1999,etc.)
• Ninguno delosmétodos mencionados habíatenido consenso absoluto desu éxito
CFcomo Recuperación Asociativa
• Ideabásica:construir ungrafo entreusuarioseitemsyexplorar asociaciones transitivasentreellos.
CFcomo Recuperación Asociativa
• Ideabásica:construir ungrafo entreusuarioseitemsyexplorar asociaciones transitivasentreellos.
3hops 3hops 5 hops
Notación Matricial
• Consideremos lamatriz consumidor/productoA
• Parámetros:M:hops,α=decaimiento (pesoasociado alenlace
Ejemplo
• DadoA
• Luego,para M=3,α=0.5
• Luego,para M=5,α=0.5
Dificultades
• Calcular lapotencia deuna matriz puede sermuy costoso paraun“c”yun“n”muygrandes,locual motiva los3métodosprobados por Huangetal.enelpaper.
Supuesto delaInvestigación
• Losmétodos deSpreadingActivationfuncionarán mejor cuando laredtiene muybaja densidad,encaso contrario puede ocurrirsobre-activación.
Modelos
• ConstrainedLeakyCapacitorModel(LCM)• Branch-and-Bound• HopfieldNet
LCM
• Propuesto por Anderson(1983)
• Pasos:– Identificar nodo-vectorinicial V,setear D(0)– Cálculo denivel deactivación
Donde (1-γ):speedofdecay(0.8),α:efficiency(0.8)– Condición dedetención:enelpaper=10,top50
Branch-and-Bound• Implementación basada en(Chen&Ng1995)• Paso1,Inicialización:Nodo correspondiente alusuario es activado (1),losotros =0.ColaQpriority seinicializa connodo usuario activo.
• Paso2,Cálculo deactivación:Sacar nodos deQpriority,por cada nodo vecino calcular
y agregar/actualizar nodo activado aQoutput
• Paso3,detención:determinada empiricamente (70)
Holpfield Net
• Paralelo conredneuronal.Usuarios eitemssonneuronas.Sinapsis sonlas activaciones.
• Inicialización:igual que las anteriores• Calculo deactivación:
• Condición dedetención:
Estudio Experimental
• Tienda delibros enlinea deChina9,695libros /2,000usuarios /18,771transacciones• Métricas deevaluación:
Precision,Recall,F-1• Yutilityrank
Recordemos hipótesis• H1.Spreadingactivation-basedCFcanachievehigherrecommendationquality thanthe3-hop,User-based(Correlation),User-based(VectorSimilarity),andItem-basedapproaches.
• H2.Spreadingactivation-basedCFcanachievehigherrecommendationqualitythanthe3-hop,User-based(Correlation),User-based(VectorSimilarity),andItem-basedapproachesfornewusers(thecold-startproblem).
• H3.Therecommendationqualityofspreadingactivation-basedCFdecreaseswhenthedensityofuser–iteminteractionsisbeyondacertainlevel(theover-activationeffect).
Resultados
H1:Comparación dealgoritmos bajo condiciones normales
H2:Comparación dealgoritmos conusuarios sparse
Resultados 2
H2:Comparación dealgoritmos enbaseaRecall,conusuarioscold-start
Resultados 3
Resultados 3.2
ComputationalEfficiency
Lecciones
• H1,H2yH3sedemuestran• Sensibilidad delosparámetros:– LCM:noes muy sensible(alfa,gama eiteraciones)– BNB:diferencia en70y100iteraciones es baja,sobre 100baja drásticamente
– HopfieldNet:poca diferencia entreparámetros
Paper2
• Liben-Nowell,D.,&Kleinberg,J.(2007).Thelink-predictionproblemforsocialnetworks.JournaloftheAmericansocietyforinformationscienceandtechnology,58(7),1019-1031.
ElProblema
Definiciones
Imagen desde http://be.amazd.com/link-prediction/
Notación para arXiv deFísica
Métricas 1:distancia enelgrafo
Imagen desde http://be.amazd.com/link-prediction/
Vecinos enComún
Imagen desde http://be.amazd.com/link-prediction/
Jaccard
Imagen desde http://be.amazd.com/link-prediction/
Adamic-Adar
PreferentialAttachment
Imagen desde http://be.amazd.com/link-prediction/
Katz
Espectrales/RandomWalk
• HittingTime
• RootedPageRank
• SimRank
Resultados
Resultados 2
Referencias• Zan Huang,Hsinchun Chen,andDanielZeng.2004.Applyingassociative
retrieval techniques toalleviate thesparsity problem incollaborativefiltering.ACMTrans.Inf.Syst.22,1(January2004),116-142.
• Liben-Nowell,D.,&Kleinberg, J.(2007).Thelink-predictionproblemforsocialnetworks. JournaloftheAmericansocietyforinformationscienceandtechnology,58(7),1019-1031.
• G.Jeh andJ.Widom.SimRank:Ameasureofstructural-context similarity.InProceedings oftheEighthACMSIGKDDInternationalConference onKnowledgeDiscoveryandDataMining,Edmonton,Alberta,Canada,July2002.
• Nguyen,P.,Tomeo,P.,DiNoia,T.,&DiSciascio,E.(2015,May).AnevaluationofSimRank andPersonalizedPageRanktobuildarecommender systemfortheWebofData.InProceedingsofthe24thInternational Conference onWorldWideWebCompanion (pp.1477-1482).InternationalWorldWideWebConferences SteeringCommittee.