Evaluación de herramientas de extracción automática de conceptos dentro de un ambiente de biblioteca digital
Ver/
Citación
Comparte este contenido
Fecha
2005-06-01Otros contribuidores
Metadatos
Mostrar el registro completo del ítemDocumentos PDF
Resumen
El rápido avance de la tecnología ha originado la proliferación de fuentes de información digital.
Esta evolución informática ha provocado la creación de bibliotecas digitales que han ido
convirtiendose poco a poco en un gran pilar para la difusión del conocimiento. Sin embargo, la
información contenida en las bibliotecas digitales aún no está descrita totalmente y su explotación
es aún insuficiente. Recientemente, se ha comprobado que la descripción de la información
usando “metadatos” puede ser primordial para el mejoramiento de la consulta de la información
dentro de una biblioteca digital. Nuestro enfoque está basado en la creación e introducción de
nuevos “metadatos” capaces de describir, en nuestro caso, las tesis doctorales de una biblioteca
digital. Estos “metadatos” corresponden a los conceptos más importantes de cada una de las
tesis. Actualmente, la identificación manual de conceptos es un largo proceso llevado a cabo por
un especialista del área. Por lo tanto, es importante hacer uso de herramientas capaces de extraer
automáticamente conceptos. En este artículo analizamos cuatro herramientas de PLN
(Procesamiento del Lenguaje Natural) capaces de extraer automáticamente los conceptos claves
de un corpus. Estas herramientas son: (1) TerminologyExtractor de Chamblon Systems Inc., (2)
Xerox Terminology Suite de Xerox, (3) Nomino de Nomino Technologies y (4) Copernic
Summarizer de NRC. Este artículo presenta también un prototipo de herramienta de anotación desarrollado para insertar de manera automática conceptos a las tesis digitales.
Palabras clave
Innovaciones tecnológicas; Ciencias de la computación; Desarrollo tecnológico; Ingeniería de sistemas; Investigaciones; Tecnologías de la información y la comunicaciónKeywords
Technological innovations; Computer science; Technology development; Systems engineering; Investigations; Information and communication technologies; ICT's; Digital library; Metadata; Natural language processing; Information extraction; Annotation; Information searchEnlace al recurso
Fuente del recurso
- Revista Colombiana de Computación; Vol. 6 Núm. 1 (2005): Revista Colombiana de Computación; 1-18
Enlace a este registro en el Repositorio Institucional UNAB
http://hdl.handle.net/20.500.12749/9024
Comentarios