Filtrado eficiente de documentos XML con XPATH
View/ Open
Cite
Share this
Date
2004Other contributors
Advisor
Metadata
Show full item recordDocuments PDF
Abstract
El gran volumen de datos disponibles, gracias al desarrollo de internet y el crecimiento de la red hacen necesario el uso de aplicaciones de diseminación de información selectiva (SDI); para evitar abrumar a los usuarios con información innecesaria. Debido a esto surgen soluciones viables que llevan a cabo la tarea de entregar al usuario la información requerida, previamente seleccionada y evaluada a través de diferentes técnicas, según sea el caso. Dentro de los mecanismos para la diseminación selectiva de información se encuentra las “Palabras Claves” como técnicas de recuperación. La llegada de XML usada para el intercambio de información y el desarrollo de lenguajes de sentencias (Xpath) para los datos de XML permite mecanismos de filtrado sofisticados que tenga en cuenta información de la estructura y no solo del contenido. Para lograr este filtrado existen mecanismos o algoritmos que lo hacen de manera eficientemente; se ha realizado un estudió teórico de varios de estos algoritmos que permiten filtrar documentos xml con expresiones Xpath, estos algoritmos son. XTrie, Xfilter, Yfilter e IBM Japón. Al aplicar los parámetros propuestos (facilidad de implementación, estructura, analizador, Y diversos aspectos con los experimentos realizados), con base en esto se ha podido determinar que el algoritmo Xfilter es el más apto para desarrollar el filtrado de los documentos por poseer una estructura basada en una Maquina de Estado Finito (MSF esta estructura permite la localización y examinación rápida de los perfiles pertenecientes a los documentos xml), que Se refleja en el QUERY INDEX permitiendo así hacer un casamiento de los documentos Xml y las sentencias Xpath además de usar un método llamado prefiltrado que permite eliminar cualquier sentencia que contiene UN nombre del elemento que no está presente en el documento entrante.
Lemb keywords
Ingeniería de sistemas; Innovaciones tecnológicas; Recuperación de información; XML (Lenguaje de marcado); Lenguajes de marcadoKeywords
Systems engineer; Technological innovations; Selective information dissemination; Finite state machine; Information retrieval; XML (Document markup language); Markup languages
Comments
Collections
- Ingeniería de Sistemas [618]