Montalvo, Soto

NESM: a named entity based proximity measure for multilingual news clustering

Una de las tareas esenciales dentro del proceso del Clustering de Documentos es medir la similitud entre éstos. En este trabajo se presenta una nueva medida basada en el número y la categoría de las Entidades Nombradas compartidas entre documentos.

Subjects--Topical Terms:
ENTIDAD NOMBRADA
CLUSTERING MULTILINGUE
SIMILITUD DE DOCUMENTOS
NAMED ENTITY
MULTILINGUAL CLUSTERING
DOCUMENT SIMILARITY

Universal Decimal Class. No.: H025.4 PRO