NESM: a named entity based proximity measure for multilingual news clustering

Montalvo, Soto

NESM: a named entity based proximity measure for multilingual news clustering

Una de las tareas esenciales dentro del proceso del Clustering de Documentos es medir la similitud entre éstos. En este trabajo se presenta una nueva medida basada en el número y la categoría de las Entidades Nombradas compartidas entre documentos.


ENTIDAD NOMBRADA
CLUSTERING MULTILINGUE
SIMILITUD DE DOCUMENTOS
NAMED ENTITY
MULTILINGUAL CLUSTERING
DOCUMENT SIMILARITY

H025.4 PRO