NESM: a named entity based proximity measure for multilingual news clustering
Una de las tareas esenciales dentro del proceso del Clustering de Documentos es medir la similitud entre éstos. En este trabajo se presenta una nueva medida basada en el número y la categoría de las Entidades Nombradas compartidas entre documentos.
ENTIDAD NOMBRADA CLUSTERING MULTILINGUE SIMILITUD DE DOCUMENTOS NAMED ENTITY MULTILINGUAL CLUSTERING DOCUMENT SIMILARITY