Mostrar el registro sencillo del ítem

dc.contributor.advisorCalderón Benavides, Maritza Lilianaspa
dc.contributor.authorDuran Valero, Iván Daríospa
dc.contributor.authorBernal Rodríguez, Jorge Federicospa
dc.date.accessioned2020-06-26T17:56:30Z
dc.date.available2020-06-26T17:56:30Z
dc.date.issued2004-07
dc.identifier.urihttp://hdl.handle.net/20.500.12749/1351
dc.description.abstractEn la actualidad la sobrecarga de información es un problema que se hace más evidente cada día, esto debido a la gran cantidad de información que se publica y transmite en los diferentes formatos como texto, imagen, multimedia, etc. Otros problemas que afectan las búsquedas en Internet son la sinonimia, (palabras diferentes pero que tienen el mismo significado) y la polisemia, (palabras iguales pero que tienen diferentes significados), por lo tanto, estos problemas hacen que las búsquedas cambien de sentido y los usuarios obtengan información que no desean. El objetivo de este proyecto de investigación y desarrollo es comprobar el funcionamiento del modelo Latent Semantic Indexing LSI, mediante la implementación y puesta en funcionamiento de dicho modelo, en un Prototipo de Filtrado de Información Basado En Contenido.spa
dc.description.tableofcontentsRESUMEN ABSTRACT INTRODUCCIÓN 1. GENERALIDADES 14 1.1DISEMINACIÓN SELECTIVA DE INFORMACIÓN (DSI). 14 1.2RECUPERACIÓN DE INFORMACIÓN. 15 1.3FILTRADO DE INFORMACIÓN. 16 1.4DIFERENCIAS ENTRE FILTRADO Y RECUPERACIÓN DE INFORMACIÓN. 17 2. TÉCNICAS DE FILTRADO DE INFORMACIÓN. 19 2.1FILTRADO COLABORATIVO O SOCIAL. 20 2.2FILTRADO BASADO EN EVENTOS. 22 2.3FILTRADO BASADO EN REPUTACIÓN. 24 2.4FILTRADO BASADO EN CONTENIDO. 27 3. REPRESENTACIÓN DE DOCUMENTOS. 28 3.1INDEXACIÓN AUTOMÁTICA. 28 3.2ELIMINACIÓN DE STOP-WORDS. 29 3.3MÉTODO DE STEMMING. 30 3.3.1 Algoritmo de Porter 30 3.4IDENTIFICACIÓN DE TÉRMINOS. 32 3.5CALCULO DE RELEVANCIA. 32 3.5.1Frecuencia Absoluta. 33 3.5.2Frecuencia Relativa. 34 3.5.3Frecuencia Inversa de Documentos. 34 3.5.4Calculo de Pesos. 35 4. MÉTODO DE INDEXACIÓN SEMÁNTICA LATENTE (LSI). 37 4.1SINGULAR VALUÉ DESCOMPOSICIÓN. 41 4.2MÉTODO DEL VECTOR ESPACIAL. 43 4.3EVALUACIÓN DEL MÉTODO LSI. 44 4.3.1Recall. 45 4.3.2Precisión. 45 5. IMPLEMENTACIÓN DEL MODELO LATENT SEMANTIC INDEXING LSI 47 5.1 ANÁLISIS Y DISEÑO DEL PROTOTIPO EN UML. 47 5.2 IMPLEMENTACIÓN DEL MODELO LSI. 55 5.2.1 Descripción de la Base de Datos Cistyc Fibrosis CF. 55 5.3 PRUEBAS DEL MODELO. 62 6. CONCLUSIONES. 66 7. RECOMENDACIONES PARA TRABAJOS FUTUROS 68 8. BIBLIOGRAFÍA. 69spa
dc.format.mimetypeapplication/pdfspa
dc.language.isospaspa
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/2.5/co/*
dc.titlePrototipo de sistema de filtrado de información basado en contenido utilizando Latent Semantic Indexingspa
dc.title.translatedPrototype of content-based information filtering system using Latent Semantic Indexingeng
dc.degree.nameIngeniero de Sistemasspa
dc.coverageBucaramanga (Colombia)spa
dc.publisher.grantorUniversidad Autónoma de Bucaramanga UNABspa
dc.rights.localAbierto (Texto Completo)spa
dc.publisher.facultyFacultad Ingenieríaspa
dc.publisher.programPregrado Ingeniería de Sistemasspa
dc.description.degreelevelPregradospa
dc.type.driverinfo:eu-repo/semantics/bachelorThesis
dc.type.localTrabajo de Gradospa
dc.type.coarhttp://purl.org/coar/resource_type/c_7a1f
dc.subject.keywordsSelective dissemination of informationeng
dc.subject.keywordsInformation storage systemseng
dc.subject.keywordsInformation retrieval systemseng
dc.subject.keywordsAutomatic indexingeng
dc.subject.keywordsSystems Engineeringeng
dc.subject.keywordsInvestigationseng
dc.subject.keywordsAnalysiseng
dc.subject.keywordsInformation filteringeng
dc.subject.keywordsTopics of interesteng
dc.subject.keywordsInformation centerseng
dc.identifier.instnameinstname:Universidad Autónoma de Bucaramanga - UNABspa
dc.identifier.reponamereponame:Repositorio Institucional UNABspa
dc.type.hasversioninfo:eu-repo/semantics/acceptedVersion
dc.rights.accessrightsinfo:eu-repo/semantics/openAccessspa
dc.rights.accessrightshttp://purl.org/coar/access_right/c_abf2spa
dc.relation.referencesDuran Valero, Iván Darío, Bernal Rodríguez, Jorge Federico, Calderón Benavidez, Liliana Maritza (2004). Prototipo de sistema de filtrado de información basado en contenido utilizando Latent Semantic Indexing. Bucaramanga (Santander, Colombia) : Universidad Autónoma de Bucaramanga UNABspa
dc.relation.referencesGOOGLE inc. Perfil de la compañía, todo acerca de Google. <http:\\www.google.com.ar/intl/es/profile.html>. Consultada en abril 2004.spa
dc.relation.referencesAMPUERO Juan. Lengua Española, El léxico español. Estudio semántico. Disponible en: <http://mimosa.pntic.mec.es/~ajuan3/lengua/lex_sem.htm>. Consultada en abril 2004.
dc.relation.referencesALEJANDRIA, Diseminación Selectiva de Información. Julio de 1999. Disponible en: <http://alejandria.hacer.ula.ve/DSIP.htm>. Consultada en abril 2004.
dc.relation.referencesIRINA, KATZAGIANNAKI Electra, PLEXOUSAKIS Dimitris. Information Dissemination Based in Semantic Relations. Grecia. Disponible en : <http://www.ics.forth.gr/isl/publications/paperlink/caiseforum-kp03.pdf>. Consultada en Marzo 2004.
dc.relation.referencesSANCHEZ Pereira Antonio. La diseminación selectiva de información a través de internet : propuesta de boletín electrónico de información bibliográfica especializada en economía, utilizando la base de datos CLASE. UNAM. Disponible: <http://www.dgbiblio.unam.mx/servicios/dgb/publicdgb/bole/fulltext/volII1/clase.html>. Consultada en febrero 2004.
dc.relation.referencesTAPASWI Murari. SDI Selective Dissemination of Information. National Information Centre For Marine Sciences. India. Disponible en: <http://ioc.unesco.org/oceanteacher/Information/Course2/sdi1.ppt>. Consultada en abril 2004.
dc.relation.referencesPONTE Cachafeiro, E., "Diseño de un servicio de Diseminación Selectiva de Información". Info: Congreso Internacional de Información, Vol. 5, 2004.
dc.relation.referencesFOLTZ Peter. Using Latent Semantic Indexing For Information Filtering. 1990. Disponible en: <http://www-psych.nmsu.edu/~pfoltz/cois/filtering-cois.html>. Consultada en febrerol 2004.
dc.relation.referencesVAN Setten M. Designing Personalised Information Systems. Telematica Instiuut. 2000. Disponible en: <https://doc.telin.nl/dscgi/ds.py/Get/File-12043/Sota.doc>. Consultada en abril 2004.
dc.relation.referencesINGWERSEN Peter. Information Retrieval Interaction. Royal School of Library and Information Science. Denmark. 2002. Disponible en: <http://www.db.dk/pi/iri/files/Ingwersen_IRI_Chapter3.pdf>. Consultada en mayo 2004.
dc.relation.referencesIntroducción a los Sistemas de Recuperación de Información. Disponible en: http://www.um.es/gtiweb/fjmm/sarisite/tema1.html. Consultada en enero 2004.
dc.relation.referencesKJERSTI, Aas. A Survey on Personalized Information Filtering Systems for the World Wide Web. Norwegian Computing Center. Oslo. Diciembre 1997.
dc.relation.referencesBELKIN, Nicolas y BRUCE CROFT, W. Information Filtering and Information Retrieval: two sides of the same coin?. Comunications of the ACM. Vol 35. No. 12. Diciembre, 1992.
dc.relation.referencesCALDERÓN Benavides Maritza Liliana, GONZÁLEZ Caro Cristina Nayesca. Prototipo De Sistema De Filtrado De Información Para Dar Apoyo A La Diseminación Selectiva En El Centro De Información Técnica Del Instituto Colombiano De Petróleos. Universidad Autónoma de Bucaramanga. I.S 1589. 2002.
dc.relation.referencesHERLOCKER J., KONSTAN J., BORCHERS A., and RIEDL J., An algorithmic framework for performing collaborative filtering. In SIGIR´99: Proceedings of the 22 Annual International ACM SIGIR Conference on Research and Development in Information Retrieval. 1999.
dc.relation.referencesRESNICK, Paul, NEOPHYTOS, Iacovou, SUCHAK, Mitesh, BERGSTROM, Peter, and RIELD, John. GroupLens: An open architecture for collaborative filtering of netnews. En FARUTA, Richard K. y NEWIRTH, Christine M. Proceedings of the ACM 1994 Conference on Computer Supported Cooperative Work. Páginas 175-186. ACM, Octubre 1994. Disponible en: <http://www.cs.umn.edu/Research/GroupLens/cscwpaper/paper.html> Consultada en octubre 2003.
dc.relation.referencesDELGADO, J.A. Agent - Based Information Filtering and Recommender Systems on the Internet. PhD. Thesis, Nagoya Institute of Technology. Marzo 2000.
dc.relation.referencesPERKOWITZ, M. y ETZIONI, O. Adaptive Web Sites: Automatically Synthesizing Web Pages. En Proceedings of the American National Conference on Artificial Intelligence AAAI-98.
dc.relation.referencesGILES, L., BOLLACKER, K. y LAWRENCE, S. CiteSeer An Automatic Citation Indexing System. En Proceedings of the 3rd ACM Conference on Digital Libraries, pp. 89-98, 1998.
dc.relation.referencesKAUTZ, H., SELMAN, B. y SHAH, M. The Hidden Web. AI Magazine. Summer 1997. AAAI Press.
dc.relation.referencesKLEINBERG, J. Authoritative sources in a hyperlinked environment. Proc. 9th ACM-SIAM Symposium on Discrete Algorithms, 1998. To appear in Journal of the ACM. 1999. Also appears as IBM Research Report RJ 10076, May 1997.
dc.relation.referencesKJERSTI, Aas. A Survey on Personalized Information Filtering Systems for the World Wide Web. Norwegian Computing Center. Oslo. Diciembre. 1997.
dc.relation.referencesMEADOW, Charles T. Text Information Retrieval Systems. Academic Press. 1992.
dc.relation.referencesVAN RIJSBERGEN, C. J. Information retrieval. Butterworths, 1979. 45p.
dc.relation.referencesFOX, Christopher. Lexical analysis and stoplists. En: FRAKES, William B. y BAEZA Yates, Ricardo A. Information Retrieval: Data Structures & Algorithms. Upper Saddle River, New Jersey: Prentice Hall PTR, 1992. p.102-130.
dc.relation.referencesFrakes William, Baeza Yates Ricardo. Information Retrieval Data Strucures & Algorithms. Prentice Hall. 1992.
dc.relation.referencesYANG, Yiming y PEDERSEN, Jan O. A comparative study on features selection in text categorization. School of Computer Science, Carnegie Mellon University, 1997.
dc.relation.referencesSALTON, Gerard y BUCKLEY, Chris. Improving Retrieval Performance by Relevance Feedback. Ithaca, New York. Department of computer science, Cornell University, 1987. (Technical Report).
dc.relation.referencesSALTON, Gerard; BUCKLEY, Chris. Term weighting approaches in automatic text retrieval. Ithaca, New York. Department of computer science, Cornell University, 1987. (Technical Report).
dc.relation.referencesROBERTSON, S. E.; WALKER, S. On relevance weights with little relevance information. En Annual International ACM-SIGIR Conference on research and Development in Information Retrieval (SIGIR'97), 1997, Philadelphia, USA. Proceedings. New York ACM Press, 1997. p.16-24
dc.relation.referencesSALTON, Gerard. MACGILL, Michael J. Introduction to Modern Information Retrieval. New York: McGRAW-Hill, 1983. 448p.
dc.relation.referencesKORFHAGE, Robert R. Information Retrieval and Storage. New York: John Wiley & Sons, 1997. 349p.
dc.relation.referencesDumais Susan .LSI meets TREC: A status report. The First Text REtrieval Conference (TREC1), National Institute of Standards and Technology Special Publication 500-207, pp. 137-152. Disponible en: <http://lsi.argreenhouse.com/lsi/LSIpapers.html>. Consultada en mayo 2004.
dc.relation.referencesYU clara, CUADRADO Jhon, CEGLOWSKY Maciej, PAYNE J. Scout. Patterns in Unstructured Data Discovery, Aggregation, and Visualization. 2002. Disponible en: <http://javelina.cet.middlebury.edu/lsa/out/lsa_definition.htm>. Consultada en febrero 2004.
dc.relation.referencesFOLTZ Peter, DUMAIS Susan. Personalized Information Delivery: An Analysis of Information Filtering Methods. Communications of the ACM, 35(12), 51-60. 1992. Disponible en: < http://www-psych.nmsu.edu/~pfoltz/cacm/cacm.html>. Consultada en abril 2004.
dc.relation.referencesDOMINGUEZ Javier, ALIAS Pujol Frances, SOCORO Joan. Extracción de tópicos independientes para la Clasificación de textos. Disponible en: <http://web.salleurl.edu/~xavis/cat/ursi2003_xsd.pdf.> Consultada en enero 2004.
dc.relation.referencesSANTO Orcero David. La matriz fundamental y la matriz esencial. Concepto y aplicaciones. Mayo 2002. Disponible en: <http://www.orcero.org/irbis/fundamental/node5.html>. Consultada en abril 2004.
dc.relation.referencesDEERWESTER Scott, DUMAIS Susan T., FURNAS George W., LANDAUER Thomas K, HARSHMAN Richard. Indexing by Latent Semantic Analysis.1990. Disponible en: <http://lsi.research.telcordia.com/lsi/papers/JASIS90.pdf.> Consultada en septiembre 2003.
dc.relation.referencesNAKOS George, JOYNER David. Álgebra lineal con aplicaciones. Edi Internacional Thomson Editores. 1998.
dc.relation.referencesBERNSTEIN Abraham, CLEARWATER Scott, PROVOST Foster. The Relational Vector-space Model and Industry Classification. Disponible en: < http://kdl.cs.umass.edu/srl2003_upload/files/bernstein-paper.pdf.> Consultada en enero 2004.
dc.relation.referencesLONGZHUANG Li, YI Shang, and WEI Zhang. Improvement of HITS-based Algorithms on Web Documents. ACM 1-58113-449-5/02/0005 May 2002. Honolulu. Disponible en: <http://www2002.org/CDROM/refereed/643/node5.html>. Consultada en abril 2004.
dc.relation.referencesUnit RR, Part B1: Basic Vector Space Model. Disponible en: <http://ei.cs.vt.edu/~cs5604/cs5604cnRR/RR-b1.html>. Consultada en noviembre 2003.
dc.relation.referencesBAEZA yates, Ricardo Y RIBEIRO NETO, Moder Information Retrieval . Edi. Addison – Wesley. 1999. Pág 76 y ss.
dc.relation.referencesBAEZA Yates Ricardo and RIBEIRO Neto Berthier. Modern Information Retrieval. Cystic Fibrosis Reference Collection. Disponible en: <http://sunsite.dcc.uchile.cl/irbook/cfc.html>. Consultada en abril 2004.
dc.contributor.cvlacCalderón Benavides, Maritza Liliana [0000068900]spa
dc.contributor.googlescholarCalderón Benavides, Maritza Liliana [XihGBWoAAAAJ]spa
dc.contributor.orcidCalderón Benavides, Maritza Liliana [0000-0001-8658-9036]
dc.contributor.scopusCalderón Benavides, Maritza Liliana [15043558200]
dc.contributor.researchgateCalderón Benavides, Maritza Liliana [Liliana_Calderon-Benavides]
dc.subject.lembDiseminación selectiva de la informaciónspa
dc.subject.lembSistemas de almacenamiento de informaciónspa
dc.subject.lembSistemas de recuperación de informaciónspa
dc.subject.lembIndización automáticaspa
dc.subject.lembIngeniería de sistemasspa
dc.subject.lembInvestigacionesspa
dc.subject.lembAnálisisspa
dc.description.abstractenglishAt present, information overload is a problem that becomes more evident every day, due to the large amount of information that is published and transmitted in different formats such as text, image, multimedia, etc. Other problems that affect Internet searches are synonymy, (different words but that have the same meaning) and polysemy, (the same words but that have different meanings), therefore, these problems cause searches to change their meaning and users get information they don't want. The objective of this research and development project is to verify the operation of the Latent Semantic Indexing LSI model, through the implementation and commissioning of said model, in a Content-Based Information Filtering Prototype.eng
dc.subject.proposalFiltrado de informaciónspa
dc.subject.proposalTemas de interésspa
dc.subject.proposalCentros de informaciónspa
dc.type.redcolhttp://purl.org/redcol/resource_type/TP
dc.rights.creativecommonsAtribución-NoComercial-SinDerivadas 2.5 Colombia*
dc.contributor.researchgroupGrupo de Investigación Tecnologías de Información - GTIspa
dc.contributor.researchgroupGrupo de Investigaciones Clínicasspa
dc.contributor.apolounabCalderón Benavides, Maritza Liliana [maritza-liliana-calderón-benavides]
dc.coverage.campusUNAB Campus Bucaramangaspa
dc.description.learningmodalityModalidad Presencialspa
dc.contributor.linkedinCalderón Benavides, Maritza Liliana [liliana-calderón-benavides-2031a84]
dc.contributor.linkedinCalderón Benavides, Maritza Liliana [liliana-calderón-benavides-2031a84]


Ficheros en el ítem

Thumbnail
Thumbnail

Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem

Atribución-NoComercial-SinDerivadas 2.5 Colombia
Excepto si se señala otra cosa, la licencia del ítem se describe como Atribución-NoComercial-SinDerivadas 2.5 Colombia