Agrupado de frases usando un algoritmo de stemmng

Post on 05-Jul-2015

5.309 views 0 download

description

Explicación de la técnica del agrupado de frases mediante algoritmos de stemming. Aunque la explicación es para utilizar la técnica de manera manual, es aún más interesante desarrollando una macro para EXCEL que automatice los procesos. Esta presentación es la que ha dado soporte a mi ponencia en el Congreso SEO para SEOs de Alicante.

Transcript of Agrupado de frases usando un algoritmo de stemmng

Análisis de

palabras clave

Agrupado de frases

mediante la utilización de

un algoritmo de Stemming

STEMMERS O LEMATIZADORES

Definición

Agrupado de frases con un algoritmo de stemming

Una SERP típica…

…buscamos –por ejemplo- “consultoría SEO”…

…¿cuántas veces has visto que GOOGLE muestra resultados con la expresión de

búsqueda y con variaciones? (plurales, singulares, masculino, femenino, etc.)

Eso se consigue mediante algoritmos de stemming, también denominados

lematizadores.

¿Qué es Stemming (lematizar)?

“Es un método para reducir una palabra a su raíz o

(en inglés) a un stem o lema. Hay algunos

algoritmos de stemming que ayudan en sistemas

de recuperación de información. Stemming

aumenta el recall que es una medida sobre el

número de documentos que se pueden encontrar

con una consulta. Por ejemplo una consulta sobre

"bibliotecas" también encuentra documentos en los

que solo aparezca "bibliotecario" porque el stem de

las dos palabras es el mismo ("bibliotec").”

WikipediaAgrupado de frases con un algoritmo de stemming

La explicación paso a paso del algoritmo de

stemming para idioma español la puedes ver en:

http://snowball.tartarus.org/algorithms/spanish/stem

mer.html

Puedes descargarte una función en PHP y

SNOWBALL

¿De dónde puedes bajar el

algoritmo de stemming?

Agrupado de frases con un algoritmo de stemming

AGRUPADO DE FRASES PARA

CLARIFICAR

Objetivo

Agrupado de frases con un algoritmo de stemming10/06/2012

9

Listado de sugerencias de keywords importado de la herramienta de palabras

clave de GOOGLE ADWORDS…

…¿cuántas veces has observado a la herramienta de palabras clave de

ADWORDS devolverte expresiones que son variaciones entre sí?

Estas son las frases que nos interesa agrupar.

¿Por qué agrupar las frases?

Porque muchas expresiones son variaciones

entre sí

Porque -muy probablemente- GOOGLE mostrará

una página en posiciones similares para esas

mismas variaciones sin necesidad de trabajarlas

todas.

Porque –sobretodo si manejamos grandes

cantidades de expresiones- agruparlas servirá

para clarificar dicho listado y hacerlo más

manejable

Porque esas variaciones son ideales para

utilizarlas al hacer linkbuilding

Agrupado de frases con un algoritmo de stemming

CÓMO SE AGRUPAN LAS FRASES

Técnica

Agrupado de frases con un algoritmo de stemming10/06/2012

14

Vamos a procesar el listado de sugerencias de keywords importado de la

herramienta de palabras clave de GOOGLE ADWORDS…

Extraemos todas las palabras del listado de palabras clave, eliminando

duplicadas y stopwords

Las reducimos a su stem y creamos una tabla

Los valores de dicha tabla serán los stem de cada columna, cuando dicho

stem aparezca en su columna correspondiente de palabras clave

Finalmente, crearemos una columna que concatenará todos los stem de

cada línea

¿Cómo agrupar las frases?

Las palabras cuyos stem concatenados

coincidan, serán un grupo.

Ordenamos por:

Grupo

Búsquedas

La palabra clave que más tráfico aporte será la que

de el nombre al grupo

Agrupado de frases con un algoritmo de stemming

EJEMPLO PRÁCTICO

Ejercicio

Agrupado de frases con un algoritmo de stemming

¡GRACIAS!

@jbmoreno

Agrupado de frases con un algoritmo de stemming