Mostrar el registro sencillo del ítem
Prototipo de sistema de filtrado de información basado en contenido utilizando Latent Semantic Indexing
dc.contributor.advisor | Calderón Benavides, Maritza Liliana | spa |
dc.contributor.author | Duran Valero, Iván Darío | spa |
dc.contributor.author | Bernal Rodríguez, Jorge Federico | spa |
dc.date.accessioned | 2020-06-26T17:56:30Z | |
dc.date.available | 2020-06-26T17:56:30Z | |
dc.date.issued | 2004-07 | |
dc.identifier.uri | http://hdl.handle.net/20.500.12749/1351 | |
dc.description.abstract | En la actualidad la sobrecarga de información es un problema que se hace más evidente cada día, esto debido a la gran cantidad de información que se publica y transmite en los diferentes formatos como texto, imagen, multimedia, etc. Otros problemas que afectan las búsquedas en Internet son la sinonimia, (palabras diferentes pero que tienen el mismo significado) y la polisemia, (palabras iguales pero que tienen diferentes significados), por lo tanto, estos problemas hacen que las búsquedas cambien de sentido y los usuarios obtengan información que no desean. El objetivo de este proyecto de investigación y desarrollo es comprobar el funcionamiento del modelo Latent Semantic Indexing LSI, mediante la implementación y puesta en funcionamiento de dicho modelo, en un Prototipo de Filtrado de Información Basado En Contenido. | spa |
dc.description.tableofcontents | RESUMEN ABSTRACT INTRODUCCIÓN 1. GENERALIDADES 14 1.1DISEMINACIÓN SELECTIVA DE INFORMACIÓN (DSI). 14 1.2RECUPERACIÓN DE INFORMACIÓN. 15 1.3FILTRADO DE INFORMACIÓN. 16 1.4DIFERENCIAS ENTRE FILTRADO Y RECUPERACIÓN DE INFORMACIÓN. 17 2. TÉCNICAS DE FILTRADO DE INFORMACIÓN. 19 2.1FILTRADO COLABORATIVO O SOCIAL. 20 2.2FILTRADO BASADO EN EVENTOS. 22 2.3FILTRADO BASADO EN REPUTACIÓN. 24 2.4FILTRADO BASADO EN CONTENIDO. 27 3. REPRESENTACIÓN DE DOCUMENTOS. 28 3.1INDEXACIÓN AUTOMÁTICA. 28 3.2ELIMINACIÓN DE STOP-WORDS. 29 3.3MÉTODO DE STEMMING. 30 3.3.1 Algoritmo de Porter 30 3.4IDENTIFICACIÓN DE TÉRMINOS. 32 3.5CALCULO DE RELEVANCIA. 32 3.5.1Frecuencia Absoluta. 33 3.5.2Frecuencia Relativa. 34 3.5.3Frecuencia Inversa de Documentos. 34 3.5.4Calculo de Pesos. 35 4. MÉTODO DE INDEXACIÓN SEMÁNTICA LATENTE (LSI). 37 4.1SINGULAR VALUÉ DESCOMPOSICIÓN. 41 4.2MÉTODO DEL VECTOR ESPACIAL. 43 4.3EVALUACIÓN DEL MÉTODO LSI. 44 4.3.1Recall. 45 4.3.2Precisión. 45 5. IMPLEMENTACIÓN DEL MODELO LATENT SEMANTIC INDEXING LSI 47 5.1 ANÁLISIS Y DISEÑO DEL PROTOTIPO EN UML. 47 5.2 IMPLEMENTACIÓN DEL MODELO LSI. 55 5.2.1 Descripción de la Base de Datos Cistyc Fibrosis CF. 55 5.3 PRUEBAS DEL MODELO. 62 6. CONCLUSIONES. 66 7. RECOMENDACIONES PARA TRABAJOS FUTUROS 68 8. BIBLIOGRAFÍA. 69 | spa |
dc.format.mimetype | application/pdf | spa |
dc.language.iso | spa | spa |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/2.5/co/ | * |
dc.title | Prototipo de sistema de filtrado de información basado en contenido utilizando Latent Semantic Indexing | spa |
dc.title.translated | Prototype of content-based information filtering system using Latent Semantic Indexing | eng |
dc.degree.name | Ingeniero de Sistemas | spa |
dc.coverage | Bucaramanga (Colombia) | spa |
dc.publisher.grantor | Universidad Autónoma de Bucaramanga UNAB | spa |
dc.rights.local | Abierto (Texto Completo) | spa |
dc.publisher.faculty | Facultad Ingeniería | spa |
dc.publisher.program | Pregrado Ingeniería de Sistemas | spa |
dc.description.degreelevel | Pregrado | spa |
dc.type.driver | info:eu-repo/semantics/bachelorThesis | |
dc.type.local | Trabajo de Grado | spa |
dc.type.coar | http://purl.org/coar/resource_type/c_7a1f | |
dc.subject.keywords | Selective dissemination of information | eng |
dc.subject.keywords | Information storage systems | eng |
dc.subject.keywords | Information retrieval systems | eng |
dc.subject.keywords | Automatic indexing | eng |
dc.subject.keywords | Systems Engineering | eng |
dc.subject.keywords | Investigations | eng |
dc.subject.keywords | Analysis | eng |
dc.subject.keywords | Information filtering | eng |
dc.subject.keywords | Topics of interest | eng |
dc.subject.keywords | Information centers | eng |
dc.identifier.instname | instname:Universidad Autónoma de Bucaramanga - UNAB | spa |
dc.identifier.reponame | reponame:Repositorio Institucional UNAB | spa |
dc.type.hasversion | info:eu-repo/semantics/acceptedVersion | |
dc.rights.accessrights | info:eu-repo/semantics/openAccess | spa |
dc.rights.accessrights | http://purl.org/coar/access_right/c_abf2 | spa |
dc.relation.references | Duran Valero, Iván Darío, Bernal Rodríguez, Jorge Federico, Calderón Benavidez, Liliana Maritza (2004). Prototipo de sistema de filtrado de información basado en contenido utilizando Latent Semantic Indexing. Bucaramanga (Santander, Colombia) : Universidad Autónoma de Bucaramanga UNAB | spa |
dc.relation.references | GOOGLE inc. Perfil de la compañía, todo acerca de Google. <http:\\www.google.com.ar/intl/es/profile.html>. Consultada en abril 2004. | spa |
dc.relation.references | AMPUERO Juan. Lengua Española, El léxico español. Estudio semántico. Disponible en: <http://mimosa.pntic.mec.es/~ajuan3/lengua/lex_sem.htm>. Consultada en abril 2004. | |
dc.relation.references | ALEJANDRIA, Diseminación Selectiva de Información. Julio de 1999. Disponible en: <http://alejandria.hacer.ula.ve/DSIP.htm>. Consultada en abril 2004. | |
dc.relation.references | IRINA, KATZAGIANNAKI Electra, PLEXOUSAKIS Dimitris. Information Dissemination Based in Semantic Relations. Grecia. Disponible en : <http://www.ics.forth.gr/isl/publications/paperlink/caiseforum-kp03.pdf>. Consultada en Marzo 2004. | |
dc.relation.references | SANCHEZ Pereira Antonio. La diseminación selectiva de información a través de internet : propuesta de boletín electrónico de información bibliográfica especializada en economía, utilizando la base de datos CLASE. UNAM. Disponible: <http://www.dgbiblio.unam.mx/servicios/dgb/publicdgb/bole/fulltext/volII1/clase.html>. Consultada en febrero 2004. | |
dc.relation.references | TAPASWI Murari. SDI Selective Dissemination of Information. National Information Centre For Marine Sciences. India. Disponible en: <http://ioc.unesco.org/oceanteacher/Information/Course2/sdi1.ppt>. Consultada en abril 2004. | |
dc.relation.references | PONTE Cachafeiro, E., "Diseño de un servicio de Diseminación Selectiva de Información". Info: Congreso Internacional de Información, Vol. 5, 2004. | |
dc.relation.references | FOLTZ Peter. Using Latent Semantic Indexing For Information Filtering. 1990. Disponible en: <http://www-psych.nmsu.edu/~pfoltz/cois/filtering-cois.html>. Consultada en febrerol 2004. | |
dc.relation.references | VAN Setten M. Designing Personalised Information Systems. Telematica Instiuut. 2000. Disponible en: <https://doc.telin.nl/dscgi/ds.py/Get/File-12043/Sota.doc>. Consultada en abril 2004. | |
dc.relation.references | INGWERSEN Peter. Information Retrieval Interaction. Royal School of Library and Information Science. Denmark. 2002. Disponible en: <http://www.db.dk/pi/iri/files/Ingwersen_IRI_Chapter3.pdf>. Consultada en mayo 2004. | |
dc.relation.references | Introducción a los Sistemas de Recuperación de Información. Disponible en: http://www.um.es/gtiweb/fjmm/sarisite/tema1.html. Consultada en enero 2004. | |
dc.relation.references | KJERSTI, Aas. A Survey on Personalized Information Filtering Systems for the World Wide Web. Norwegian Computing Center. Oslo. Diciembre 1997. | |
dc.relation.references | BELKIN, Nicolas y BRUCE CROFT, W. Information Filtering and Information Retrieval: two sides of the same coin?. Comunications of the ACM. Vol 35. No. 12. Diciembre, 1992. | |
dc.relation.references | CALDERÓN Benavides Maritza Liliana, GONZÁLEZ Caro Cristina Nayesca. Prototipo De Sistema De Filtrado De Información Para Dar Apoyo A La Diseminación Selectiva En El Centro De Información Técnica Del Instituto Colombiano De Petróleos. Universidad Autónoma de Bucaramanga. I.S 1589. 2002. | |
dc.relation.references | HERLOCKER J., KONSTAN J., BORCHERS A., and RIEDL J., An algorithmic framework for performing collaborative filtering. In SIGIR´99: Proceedings of the 22 Annual International ACM SIGIR Conference on Research and Development in Information Retrieval. 1999. | |
dc.relation.references | RESNICK, Paul, NEOPHYTOS, Iacovou, SUCHAK, Mitesh, BERGSTROM, Peter, and RIELD, John. GroupLens: An open architecture for collaborative filtering of netnews. En FARUTA, Richard K. y NEWIRTH, Christine M. Proceedings of the ACM 1994 Conference on Computer Supported Cooperative Work. Páginas 175-186. ACM, Octubre 1994. Disponible en: <http://www.cs.umn.edu/Research/GroupLens/cscwpaper/paper.html> Consultada en octubre 2003. | |
dc.relation.references | DELGADO, J.A. Agent - Based Information Filtering and Recommender Systems on the Internet. PhD. Thesis, Nagoya Institute of Technology. Marzo 2000. | |
dc.relation.references | PERKOWITZ, M. y ETZIONI, O. Adaptive Web Sites: Automatically Synthesizing Web Pages. En Proceedings of the American National Conference on Artificial Intelligence AAAI-98. | |
dc.relation.references | GILES, L., BOLLACKER, K. y LAWRENCE, S. CiteSeer An Automatic Citation Indexing System. En Proceedings of the 3rd ACM Conference on Digital Libraries, pp. 89-98, 1998. | |
dc.relation.references | KAUTZ, H., SELMAN, B. y SHAH, M. The Hidden Web. AI Magazine. Summer 1997. AAAI Press. | |
dc.relation.references | KLEINBERG, J. Authoritative sources in a hyperlinked environment. Proc. 9th ACM-SIAM Symposium on Discrete Algorithms, 1998. To appear in Journal of the ACM. 1999. Also appears as IBM Research Report RJ 10076, May 1997. | |
dc.relation.references | KJERSTI, Aas. A Survey on Personalized Information Filtering Systems for the World Wide Web. Norwegian Computing Center. Oslo. Diciembre. 1997. | |
dc.relation.references | MEADOW, Charles T. Text Information Retrieval Systems. Academic Press. 1992. | |
dc.relation.references | VAN RIJSBERGEN, C. J. Information retrieval. Butterworths, 1979. 45p. | |
dc.relation.references | FOX, Christopher. Lexical analysis and stoplists. En: FRAKES, William B. y BAEZA Yates, Ricardo A. Information Retrieval: Data Structures & Algorithms. Upper Saddle River, New Jersey: Prentice Hall PTR, 1992. p.102-130. | |
dc.relation.references | Frakes William, Baeza Yates Ricardo. Information Retrieval Data Strucures & Algorithms. Prentice Hall. 1992. | |
dc.relation.references | YANG, Yiming y PEDERSEN, Jan O. A comparative study on features selection in text categorization. School of Computer Science, Carnegie Mellon University, 1997. | |
dc.relation.references | SALTON, Gerard y BUCKLEY, Chris. Improving Retrieval Performance by Relevance Feedback. Ithaca, New York. Department of computer science, Cornell University, 1987. (Technical Report). | |
dc.relation.references | SALTON, Gerard; BUCKLEY, Chris. Term weighting approaches in automatic text retrieval. Ithaca, New York. Department of computer science, Cornell University, 1987. (Technical Report). | |
dc.relation.references | ROBERTSON, S. E.; WALKER, S. On relevance weights with little relevance information. En Annual International ACM-SIGIR Conference on research and Development in Information Retrieval (SIGIR'97), 1997, Philadelphia, USA. Proceedings. New York ACM Press, 1997. p.16-24 | |
dc.relation.references | SALTON, Gerard. MACGILL, Michael J. Introduction to Modern Information Retrieval. New York: McGRAW-Hill, 1983. 448p. | |
dc.relation.references | KORFHAGE, Robert R. Information Retrieval and Storage. New York: John Wiley & Sons, 1997. 349p. | |
dc.relation.references | Dumais Susan .LSI meets TREC: A status report. The First Text REtrieval Conference (TREC1), National Institute of Standards and Technology Special Publication 500-207, pp. 137-152. Disponible en: <http://lsi.argreenhouse.com/lsi/LSIpapers.html>. Consultada en mayo 2004. | |
dc.relation.references | YU clara, CUADRADO Jhon, CEGLOWSKY Maciej, PAYNE J. Scout. Patterns in Unstructured Data Discovery, Aggregation, and Visualization. 2002. Disponible en: <http://javelina.cet.middlebury.edu/lsa/out/lsa_definition.htm>. Consultada en febrero 2004. | |
dc.relation.references | FOLTZ Peter, DUMAIS Susan. Personalized Information Delivery: An Analysis of Information Filtering Methods. Communications of the ACM, 35(12), 51-60. 1992. Disponible en: < http://www-psych.nmsu.edu/~pfoltz/cacm/cacm.html>. Consultada en abril 2004. | |
dc.relation.references | DOMINGUEZ Javier, ALIAS Pujol Frances, SOCORO Joan. Extracción de tópicos independientes para la Clasificación de textos. Disponible en: <http://web.salleurl.edu/~xavis/cat/ursi2003_xsd.pdf.> Consultada en enero 2004. | |
dc.relation.references | SANTO Orcero David. La matriz fundamental y la matriz esencial. Concepto y aplicaciones. Mayo 2002. Disponible en: <http://www.orcero.org/irbis/fundamental/node5.html>. Consultada en abril 2004. | |
dc.relation.references | DEERWESTER Scott, DUMAIS Susan T., FURNAS George W., LANDAUER Thomas K, HARSHMAN Richard. Indexing by Latent Semantic Analysis.1990. Disponible en: <http://lsi.research.telcordia.com/lsi/papers/JASIS90.pdf.> Consultada en septiembre 2003. | |
dc.relation.references | NAKOS George, JOYNER David. Álgebra lineal con aplicaciones. Edi Internacional Thomson Editores. 1998. | |
dc.relation.references | BERNSTEIN Abraham, CLEARWATER Scott, PROVOST Foster. The Relational Vector-space Model and Industry Classification. Disponible en: < http://kdl.cs.umass.edu/srl2003_upload/files/bernstein-paper.pdf.> Consultada en enero 2004. | |
dc.relation.references | LONGZHUANG Li, YI Shang, and WEI Zhang. Improvement of HITS-based Algorithms on Web Documents. ACM 1-58113-449-5/02/0005 May 2002. Honolulu. Disponible en: <http://www2002.org/CDROM/refereed/643/node5.html>. Consultada en abril 2004. | |
dc.relation.references | Unit RR, Part B1: Basic Vector Space Model. Disponible en: <http://ei.cs.vt.edu/~cs5604/cs5604cnRR/RR-b1.html>. Consultada en noviembre 2003. | |
dc.relation.references | BAEZA yates, Ricardo Y RIBEIRO NETO, Moder Information Retrieval . Edi. Addison – Wesley. 1999. Pág 76 y ss. | |
dc.relation.references | BAEZA Yates Ricardo and RIBEIRO Neto Berthier. Modern Information Retrieval. Cystic Fibrosis Reference Collection. Disponible en: <http://sunsite.dcc.uchile.cl/irbook/cfc.html>. Consultada en abril 2004. | |
dc.contributor.cvlac | Calderón Benavides, Maritza Liliana [0000068900] | spa |
dc.contributor.googlescholar | Calderón Benavides, Maritza Liliana [XihGBWoAAAAJ] | spa |
dc.contributor.orcid | Calderón Benavides, Maritza Liliana [0000-0001-8658-9036] | |
dc.contributor.scopus | Calderón Benavides, Maritza Liliana [15043558200] | |
dc.contributor.researchgate | Calderón Benavides, Maritza Liliana [Liliana_Calderon-Benavides] | |
dc.subject.lemb | Diseminación selectiva de la información | spa |
dc.subject.lemb | Sistemas de almacenamiento de información | spa |
dc.subject.lemb | Sistemas de recuperación de información | spa |
dc.subject.lemb | Indización automática | spa |
dc.subject.lemb | Ingeniería de sistemas | spa |
dc.subject.lemb | Investigaciones | spa |
dc.subject.lemb | Análisis | spa |
dc.description.abstractenglish | At present, information overload is a problem that becomes more evident every day, due to the large amount of information that is published and transmitted in different formats such as text, image, multimedia, etc. Other problems that affect Internet searches are synonymy, (different words but that have the same meaning) and polysemy, (the same words but that have different meanings), therefore, these problems cause searches to change their meaning and users get information they don't want. The objective of this research and development project is to verify the operation of the Latent Semantic Indexing LSI model, through the implementation and commissioning of said model, in a Content-Based Information Filtering Prototype. | eng |
dc.subject.proposal | Filtrado de información | spa |
dc.subject.proposal | Temas de interés | spa |
dc.subject.proposal | Centros de información | spa |
dc.type.redcol | http://purl.org/redcol/resource_type/TP | |
dc.rights.creativecommons | Atribución-NoComercial-SinDerivadas 2.5 Colombia | * |
dc.contributor.researchgroup | Grupo de Investigación Tecnologías de Información - GTI | spa |
dc.contributor.researchgroup | Grupo de Investigaciones Clínicas | spa |
dc.contributor.apolounab | Calderón Benavides, Maritza Liliana [maritza-liliana-calderón-benavides] | |
dc.coverage.campus | UNAB Campus Bucaramanga | spa |
dc.description.learningmodality | Modalidad Presencial | spa |
dc.contributor.linkedin | Calderón Benavides, Maritza Liliana [liliana-calderón-benavides-2031a84] | |
dc.contributor.linkedin | Calderón Benavides, Maritza Liliana [liliana-calderón-benavides-2031a84] |