Análisis de la combinación de modelos de filtrado de información
Ver/
Citación
Comparte este contenido
Fecha
2003-06-03Otros contribuidores
Director / Asesor
Metadatos
Mostrar el registro completo del ítemDocumentos PDF
Resumen
El tema de la sobrecarga de información se ha discutido ampliamente en la literatura referente a la administración y recuperación de información, pero aun sigue siendo un problema sin resolver. La información para cada usuario llega de muy diversas fuentes y representa más datos de los que una persona normal puede manejar. Aplicaciones más recientes emplean tecnologías como el filtrado colaborativo automático o la representación y evaluación de documentos, mediante diversos métodos automatizados, para ayudarle a los usuarios en sus tareas de recepción y análisis de información.
Se parte de conceptos básicos de Recuperación de Información como antesala a la tarea de Filtrado de Información y de sistemas que permiten, además de responder a una consulta de un usuario, recomendarle un conjunto de ítems que también pueden ser de su interés, que es lo que se conoce como Sistemas de Recomendación. Los modelos utilizados para el filtrado de información: Filtrado de Basado en Contenido (Cognitivo) y el Filtrado Colaborativo (Social), se estudian en forma separada y posteriormente se integran en las propuestas que buscan minimizar las debilidades de cada modelo. Un sistema de recomendación basado en filtrado por contenido puro, recomienda ítems similares a aquellos que el usuario ha dado una alta calificación en el pasado, en cambio, un sistema de recomendación con filtrado colaborativo puro identifica los usuarios con gustos similares, para recomendarle al usuario los ítems que a ellos les han gustado. Un sistema híbrido puede incorporar las ventajas de ambos sistemas y minimizar las desventajas que presenta cada modelo en su forma pura.
Como preámbulo a las propuestas de integración, se describen brevemente algunos ejemplos de aplicación, de sistemas de recomendación conocidos, como Metiorew, FAB, Letizia, PTV, MovieLens, WebWatcher entre otros, que son sistemas basados en filtrado por contenido, colaborativo o híbridos.
Para la prueba de cada uno de los modelos estudiados, se utilizó la Base de datos de EachMovie, que es una recopilación de información de películas, realizada por el Centro de Investigación de Compaq, que ejecutó el servicio de recomendación por espacio de 18 meses, para experimentar con el sistema de filtrado colaborativo. Durante este tiempo, 72.916 usuarios dieron 2’811.983 calificaciones (ratings numéricos) para 1.628 películas diferentes (filmes y videos). Este conjunto de datos está disponible para que pueda ser usado por investigadores en el área de filtrado colaborativo, para probar sus algoritmos.
Palabras clave
Recuperación de información; Diseminación selectiva de la información; Sistemas de almacenamiento de información; Sistemas de recuperación de información; Estrategias de búsqueda; Ingeniería de sistemas; Ciencias computacionales; Investigaciones; AnálisisKeywords
Information retrieval; Selective dissemination of information; Information storage systems; Information retrieval systems; Search strategies; Systems engineering; Computer science; Investigations; Analysis; Information overload; Content-based filtering (Cognitive); Collaborative filtering (Social)Enlace a este registro en el Repositorio Institucional UNAB
http://hdl.handle.net/20.500.12749/3331
Comentarios