Extracción automática de metadatos como soporte para el autoarchivo de objetos digitales en repositorios

View/ Open
Cite
Share this
Date
2014-12-01Other contributors
Metadata
Show full item recordDocuments PDF
Abstract
En este trabajo se propone facilitar al usuario el autoarchivo de sus objetos digitales
educativos en un repositorio institucional. Para esto, se modifica el flujo de carga
estándar de la plataforma DSpace, proponiendo un nuevo flujo para el depósito de
objetos de modo que pueda integrarse en este proceso un extractor de metadatos. Se
presenta una arquitectura abierta de un módulo extractor automático de algunos
metadatos de los documentos. Estos metadatos extraídos automáticamente son luego
validados por el usuario en el proceso de descripción del objeto. Para diseñar el
extractor se analizaron distintas herramientas de extracción y se optó por la
combinación que arrojó mejores resultados. Este módulo se ha diseñado de modo de
poder integrar otras herramientas extractoras. Se ha desarrollado un prototipo en JAVA
de este asistente y se ha experimentado sobre dos corpus de documentos, uno en
idioma Inglés y otro en idioma Español. En este trabajo, se presentan resultados de la
extracción automática de los metadatos Palabras clave, Título y Autores, en
documentos en ambos idiomas, los cuales resultan promisorios. Mediante este
asistente se espera ayudar al usuario en el proceso de carga de objetos digitales
educativos disminuyendo así su trabajo, y mejorando la cantidad y la calidad de los
metadatos cargados.
Lemb keywords
Desarrollo tecnológico; Innovaciones tecnológicas; Investigaciones; Ciencias de la computación; Tecnologías de la información y la comunicación; Ingeniería de sistemasKeywords
Technological innovations; Computer science; Technology development; Systems engineering; Investigations; Information and communication technologies; ICT's; Automatic metadata extraction; Digital objects; Educational; Repositories; Load flowLink to resource
Source
- Revista Colombiana de Computación; Vol. 15 Núm. 2 (2014): Revista Colombiana de Computación; 135-160
Estadísticas Google Analytics
Comments