Mostrar el registro sencillo del ítem

dc.contributor.advisorCalderón Benavides, Maritza Lilianaspa
dc.contributor.authorVargas Cogollo, Luis Carlosspa
dc.date.accessioned2020-06-26T21:35:03Z
dc.date.available2020-06-26T21:35:03Z
dc.date.issued2014-07
dc.identifier.urihttp://hdl.handle.net/20.500.12749/3523
dc.description.abstractEste trabajo de investigación trata acerca de la minería de opiniones (opinion mining) basada en la recolección de textos a través de la Web, con el objetivo de realizar un análisis de los sentimientos de los colombianos con base en comentarios expresados en sitios web 2.0, para lo cual se tomó como tema central las elecciones presidenciales de Colombia en el año 2014. Para la captura de opiniones se desarrolló una aplicación web capaz de recolectar tweets basados en una entidad específica; mientras que para la recolección de otros comentarios contenidos en sitios web de noticias, se llevó a cabo un proceso de web crawling. Gracias a estos instrumentos de captura de opiniones fueron recolectados, entre el 9 de mayo y el 15 de junio de 2014, 33570 comentarios relacionados con las elecciones presidenciales. Los comentarios recolectados fueron sometidos a opinion mining por medio de la solución especializada de software SentiStrength, pero antes de esto fue necesario construir una base de conocimientos en español, ajustada al contexto colombiano. La base de conocimientos resultante contiene 2878 términos, y es un aporte al estado del arte porque plantea los cimientos para la creación de bases de conocimientos en castellano con el objetivo de realizar opinion mining frente a procesos electorales, pues a la fecha no existía ninguna base de conocimientos disponible en español. Mediante opinion mining se conoció la imagen que para los ciudadanos reflejó cada uno de los candidatos en las dos vueltas presidenciales, y se construyó un análisis general que permitió comprender mejor las tendencias de los colombianos durante las elecciones presidenciales en Colombia en 2014, y evidenció que para los ciudadanos hubo una perspectiva mayoritariamente negativa acerca de dicho proceso, soportada principalmente en la inconformidad con los candidatos y sus propuestas. Dicha inconformidad se pudo reflejar en los resultados de la minería de opiniones, los cuales indicaron que los candidatos Juan Manuel Santos y Oscar Iván Zuluaga obtuvieron una polaridad o imagen negativa con respecto al resto de candidatos durante la primera vuelta. El análisis general realizado fue contrastado con resultados arrojados por varias encuestas acerca del proceso de elecciones, realizadas por firmas encuestadoras muy reconocidas, hallándose una importante relación entre los resultados de dichas encuestas y los resultados arrojados por la minería de opiniones realizada en este trabajo. Se concluye que la minería de opiniones es un área capaz de identificar tendencias en la población, por lo cual puede ser utilizada para predecir fenómenos o situaciones, incluida la política, y por ende facilitar la toma de decisiones.spa
dc.description.sponsorshipUniversitat Oberta de Catalunya UOCspa
dc.description.tableofcontents1. Introducción 15 1.1 Planteamiento del Problema y Motivación 18 1.2 Hipótesis de Investigación 22 1.3 Objetivos 22 1.3.1 Objetivo General 22 1.3.2 Objetivos Específicos 22 1.4 Estructura de la Tesis 23 2. Marco Teórico 25 2.1 Sentiment Analysis 25 2.1.1 Aplicaciones del sentiment analysis 26 2.1.2 Clasificación de la polaridad de un texto 27 2.1.3 Herramientas disponibles para realizar opinion mining 28 2.1.3.1 SentiStrength 30 2.1.4 Factores que dificultan las tareas de opinion mining 31 2.1.5 Sentiment analysis y la Web 2.0 32 2.2 Redes Sociales de Internet y otros Medios Digitales de Expresión 33 2.2.1 Microblogging 35 2.2.1.1 Twitter 35 2.2.2 Medios digitales de expresión en Colombia 37 2.2.2.1 Diarios on-line 37 2.2.2.2 Revistas on-line 38 2.3 Recuperación de la Información 39 2.3.1 Recuperación de documentos desde la Web 39 2.3.1.1 Web Crawling 40 2.4 Subjetividad, Sentimientos, Opiniones y Emociones en los Seres Humanos 43 2.4.1 Subjetividad 44 2.4.2 Sentimientos 44 2.4.3 Opiniones 45 2.4.4 Emociones 46 2.5 Aspectos Relevantes en el Contexto Político de las Elecciones Presidenciales en Colombia 47 2.5.1 Proceso de elección del Presidente de la República 48 2.5.2 Reseña de los candidatos a la Presidencia de Colombia en el año 2014 49 3. Desarrollo de la Propuesta 52 3.1 Tipo de Investigación 52 3.2 Definición de Población y Muestra 52 3.3 Técnicas de Recolección de Datos 53 3.4 Procedimiento Experimental 54 3.4.1 Instrumentos de captura de opiniones 54 3.4.2 Clasificación de comentarios 59 3.4.2.1 Personalización del idioma de SentiStrength 61 3.4.2.2 Realizando opinion mining con SentiStrength 66 3.4.2.2.1 Cálculo de la polaridad global de un fichero generado por SentiStrength después de haber realizado opinion mining 70 3.5 Confiabilidad del Procedimiento 74 3.6 Plan de Presentación de Resultados 76 4. Resultados 77 4.1 Descripción de los resultados obtenidos mediante la captura de opiniones 77 4.2 Descripción de los resultados obtenidos mediante Opinion Mining 81 4.2.1 Resultados de opinion mining para la candidata Clara López 81 4.2.2 Resultados de opinion mining para el candidato Enrique Peñalosa 85 4.2.3 Resultados de opinion mining para la candidata Marta Lucía Ramírez 89 4.2.4 Resultados de opinion mining para el candidato Juan Manuel Santos 92 4.2.5 Resultados de opinion mining para el candidato Oscar Iván Zuluaga 96 4.2.6 Resultados de opinion mining obtenidos mediante otros hashtag 100 4.2.6.1 Resultados obtenidos para el hashtag #Elecciones2014 100 4.2.6.2 Resultados obtenidos para el hashtag #SegundaVuelta 101 4.3 Análisis general, con base en los resultados de Opinion Mining 102 4.3.1 Análisis basado en la primera vuelta presidencial y sus candidatos 104 4.3.2 Análisis basado en la segunda vuelta presidencial y sus candidatos 107 4.3.2.1 Análisis basado en otros tweets capturados durante la segunda vuelta presidencial 112 4.4 Contraste entre el análisis general y encuestas de Gallup y Datexco 113 4.4.1 Comparación con encuestas realizadas para la primera vuelta 113 4.4.2 Comparación con encuestas realizadas para la segunda vuelta 117 5. Conclusiones 122 5.1 Discusión 122 5.2 Conclusiones 125 6. Recomendaciones y Trabajo Futuro 127 6.1 Contribuciones 127 6.2 Recomendaciones 129 6.3 Trabajo Futuro 130 7. Referencias 131spa
dc.format.mimetypeapplication/pdfspa
dc.language.isospaspa
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/2.5/co/*
dc.titleEmociones y opiniones: un análisis del contexto colombiano a través de opinión miningspa
dc.title.translatedEmotions and opinions: an analysis of the Colombian context through opinion miningeng
dc.degree.nameMagíster en Software Librespa
dc.coverageBucaramanga (Colombia)spa
dc.publisher.grantorUniversidad Autónoma de Bucaramanga UNABspa
dc.rights.localAbierto (Texto Completo)spa
dc.publisher.facultyFacultad Ingenieríaspa
dc.publisher.programMaestría en Software Librespa
dc.description.degreelevelMaestríaspa
dc.type.driverinfo:eu-repo/semantics/masterThesis
dc.type.localTesisspa
dc.type.coarhttp://purl.org/coar/resource_type/c_bdcc
dc.subject.keywordsInformation systemseng
dc.subject.keywordsCommunicationeng
dc.subject.keywordsSystems Engineeringeng
dc.subject.keywordsSoftware managementeng
dc.subject.keywordsSoftware applicationeng
dc.subject.keywordsSoftware developmenteng
dc.subject.keywordsNew technologieseng
dc.subject.keywordsInvestigationseng
dc.subject.keywordsTeachingeng
dc.subject.keywordsWeb 2.0eng
dc.subject.keywordsMicrobloggingeng
dc.subject.keywordsSentiment Analysiseng
dc.identifier.instnameinstname:Universidad Autónoma de Bucaramanga - UNABspa
dc.identifier.reponamereponame:Repositorio Institucional UNABspa
dc.type.hasversioninfo:eu-repo/semantics/acceptedVersion
dc.rights.accessrightsinfo:eu-repo/semantics/openAccessspa
dc.rights.accessrightshttp://purl.org/coar/access_right/c_abf2spa
dc.relation.referencesVargas Cogollo, Luis Carlos (2014). Emociones y opiniones: un análisis del contexto colombiano a través de opinión mining. Bucaramanga (Santander, Colombia) : Universidad Autónoma de Bucaramanga UNAB, Universitat Oberta de Catalunya UOCspa
dc.relation.referencesAGARWAL, A., XIE, B., VOVSHA, I., RAMBOW, O., & PASSONNEAU, R. (2011). Sentiment Analysis of Twitter Data. En LSM 2011, actas del Workshop sobre lenguajes en medios de comunicación social, pág. 30-38.http://aclweb.org/anthology//W/W11/W11-0705.pdf?CFID=262217785&CFTOKEN=33606415spa
dc.relation.referencesARAÚJO, M., GONÇALVES, P., & BENEVENUTO, F. (2013). Measuring Sentiments in Online Social Networks. En WebMedia 2013, actas del 19° simposio brasileño en Multimedia y la Web, pág. 97-104. http://dl.acm.org/citation.cfm?id=2526196spa
dc.relation.referencesBAEZA-YATES, R. & RIBEIRO-NETO, B. (2011). Modern Information Retrieval: The Concepts and Technology behind Search (2a edición). USA: Addison-Wesley.spa
dc.relation.referencesBALAHUR, A. (2011). Methods and Resources for Sentiment Analysis in Multilingual Documents of Different Text Types. Tesis de Doctorado, Departamento de Lenguajes y Sistemas Informáticos, Universidad de Alicante, Alicante, España. http://rua.ua.es/dspace/bitstream/10045/19437/1/tesis_alexandrabalahur.pdfspa
dc.relation.referencesBALAHUR, A. & MONTOYO, A. (2008). Determining the Semantic Orientation of Opinions on Products - a Comparative Analysis. Procesamiento del Lenguaje Natural, vol. 41, pp. 201-208. http://www.sepln.org/revistaSEPLN/revista/41/sec8-art1.pdfspa
dc.relation.referencesBANFIELD, A. (1982). Unspeakable Sentences: Narration and Representation in the Language of Fiction. Routledge & Kegan Paul.spa
dc.relation.referencesBERRY, M. & KOGAN, J. (2010). Text Mining: Applications and Theory. Chichester, Reino Unido: John Wiley & Sons Ltd.http://gendocs.ru/docs/3/2304/conv_1/file1.pdfspa
dc.relation.referencesCASTILLO, C., MENDOZA, M., & POBLETE, B. (2011). Information Credibility on Twitter. En WWW 2011, actas de la 20ª conferencia internacional en World Wide Web, pág. 675-684. http://chato.cl/papers/castillo_mendoza_poblete_2010_twitter_credibility.pdfspa
dc.relation.referencesDAVE, K., LAWRENCE, S., & PENNOCK, D. (2003). Mining the Peanut Gallery: Opinion Extraction and Semantic Classification of Product Reviews. En WWW 2003, actas de la 12ª conferencia internacional en World Wide Web, pág. 519-528. http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.13.2424&rep=rep1&type=pdfspa
dc.relation.referencesEkman, P. (1992). An Argument for Basic Emotions. Cognition & Emotion, pág. 169-200. http://www.paulekman.com/wp-content/uploads/2013/07/An-Argument-For-Basic-Emotions.pdfspa
dc.relation.referencesEkman, P. (1999). Basic Emotions. En T. Dalgleish and M. Power (Eds.). Handbook of Cognition and Emotion. Sussex, U.K.: John Wiley & Sons, Ltd. http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.123.1143&rep=rep1&type=pdfspa
dc.relation.referencesJOACHIMS, T. (1998). Text Categorization with Support Vector Machines: Learning with Many Relevant Features. En ECML 1998, actas de la 10ª conferencia europea en Machine Learning, pág. 137-142. http://www.cs.cornell.edu/people/tj/publications/joachims_98a.pdfspa
dc.relation.referencesKIM, S., & HOVY, E. (2005). Automatic Detection of Opinion Bearing Words and Sentences. En IJCNLP, actas de la Conferencia Conjunta Internacional sobre Procesamiento del Lenguaje Natural, Isla de Jeju, Corea del Sur. http://acl.ldc.upenn.edu/I/I05/I05-2011.pdf?origin=publication_detailspa
dc.relation.referencesLIU, B. (2012). Sentiment Analysis and Opinion Mining. California, EE. UU.: Morgan & Claypool Publishers. http://www.cs.uic.edu/~liub/FBS/SentimentAnalysis-and-OpinionMining.pdfspa
dc.relation.referencesMENDOZA, M., POBLETE, B., & CASTILLO, C. (2010). Twitter Under Crisis: Can we trust what we RT? En SOMA 2010, actas del primer Workshop sobre análisis de medios sociales, pág. 71-79. http://chato.cl/papers/mendoza_poblete_castillo_2010_twitter_terremoto.pdfspa
dc.relation.referencesNASUKAWA, T., & YI, J. (2003). Sentiment analysis: Capturing Favorability Using Natural Language Processing. En K-CAP 2003, actas de la 2ª conferencia internacional sobre la captura del conocimiento, pág. 70-77.http://tredocs.com/tw_files2/urls_41/40/d-39217/7z-docs/7.pdfspa
dc.relation.referencesO’CONNOR, B., BALASUBRAMANYAN, R., ROUTLEDGE, B. & SMITH, N. (2010). From tweets to polls: Linking text sentiment to public opinion time series. En ICWSM ’10, actas de la conferencia internacional AAAI en Weblogs y Social Media, pág. 122-129. http://www.cs.cmu.edu/~nasmith/papers/oconnor+balasubramanyan+routledge+smith.icwsm10.pdfspa
dc.relation.referencesPANG, B. (2006). Automatic Analysis of Document Sentiment. Tesis de Doctorado, Escuela de graduados, Universidad Cornell, Ithaca, Nueva York. http://www.cs.cornell.edu/home/llee/extra/pang-thesis.pdfspa
dc.relation.referencesPANG, B. & LEE, L. (2008). Opinion Mining and Sentiment Analysis. Foundations and Trends in Information Retrieval, vol. 2(1-2): pp. 1-135.http://www.cse.iitb.ac.in/~pb/cs626-449-2009/prev-years-other-things-nlp/sentiment-analysis-opinion-mining-pang-lee-omsa-published.pdfspa
dc.relation.referencesPÉREZ, D., LOZANO, C., LÓPEZ, A., et al. (2012). Sentiment Analysis in Colombian Online Newspaper Comments. Recent Progress in Data Engineering and Internet Technology, vol. 157, pp. 113-119. http://link.springer.com/chapter/10.1007%2F978-3-642-28798-5_16#page-1spa
dc.relation.referencesSARMENTO, L., CARVALHO, P., SILVA, M. & DE OLIVEIRA, E. (2009). Automatic creation of a reference corpus for political opinion mining in user-generated content. En CIKM ’09, actas del primer Workshop internacional sobre Temas de Sentiment Analysis para Opinión Masiva, pág. 29-36. http://xldb.lasige.di.fc.ul.pt/xldb/publications/sarmento09_document.pdfspa
dc.relation.referencesSCHERER, K. (2005). What are emotions? And how can they be measured? Social Science Information, vol. 3(44): pp. 695-729.http://www.affective-sciences.org/system/files/biblio/2005_Scherer_SSI.pdfspa
dc.relation.referencesVAN DEN BOS, G. (2006). APA Dictionary of Psychology. Washington, DC, EE. UU.: American Psychological Association.spa
dc.relation.referencesWIEBE, J. (1994). Tracking Point of View in Narrative. Computational Linguistics, vol. 20(2): pp. 233-287. http://acl.ldc.upenn.edu/J/J94/J94-2004.pdf?origin=publication_detailspa
dc.relation.referencesWIEBE, J., WILSON, T., & CARDIE, C. (2005). Annotating Expressions of Opinions and Emotions in Language. Language Resources and Evaluation, vol. 39(2-3): pp. 119-122. http://www.cs.cornell.edu/home/cardie/papers/lre05withappendix.pdfspa
dc.contributor.cvlachttps://scienti.minciencias.gov.co/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0000068900*
dc.contributor.googlescholarhttps://scholar.google.es/citations?hl=es&user=XihGBWoAAAAJ*
dc.contributor.scopushttps://www.scopus.com/authid/detail.uri?authorId=15043558200*
dc.contributor.researchgatehttps://www.researchgate.net/profile/Liliana_Calderon-Benavides*
dc.subject.lembSistemas de informaciónspa
dc.subject.lembComunicaciónspa
dc.subject.lembIngeniería de sistemasspa
dc.subject.lembGestión de softwarespa
dc.subject.lembAplicación de softwarespa
dc.subject.lembDesarrollo de softwarespa
dc.subject.lembNuevas tecnologíasspa
dc.subject.lembInvestigacionesspa
dc.subject.lembEnseñanzaspa
dc.description.abstractenglishThis research work deals with opinion mining based on the collection of texts through the Web, with the aim of carrying out an analysis of the feelings of Colombians based on comments expressed on 2.0 web sites, For which the central theme was the presidential elections of Colombia in 2014. To capture opinions, a web application capable of collecting tweets based on a specific entity was developed; while for the collection of other comments contained in news websites, a web crawling process was carried out. Thanks to these opinion-capturing instruments, 33,570 comments related to the presidential elections were collected between May 9 and June 15, 2014. The comments collected were submitted to opinion mining through the specialized SentiStrength software solution, but before this it was necessary to build a knowledge base in Spanish, adjusted to the Colombian context. The resulting knowledge base contains 2878 terms, and it is a contribution to the state of the art because it raises the foundations for the creation of knowledge bases in Spanish with the objective of conducting opinion mining in the face of electoral processes, since to date there was no basis of knowledge available in Spanish. Through opinion mining, the image that each of the candidates reflected for the citizens in the two presidential rounds was known, and a general analysis was constructed that allowed us to better understand the trends of Colombians during the presidential elections in Colombia in 2014, and showed that for citizens, there was a mostly negative perspective about said process, mainly supported by disagreement with the candidates and their proposals. This dissatisfaction could be reflected in the results of the opinion mining, which indicated that the candidates Juan Manuel Santos and Oscar Iván Zuluaga obtained a negative polarity or image with respect to the rest of the candidates during the first round. The general analysis carried out was contrasted with the results of various surveys about the election process, carried out by well-known polling firms, finding an important relationship between the results of these surveys and the results of the opinion mining carried out in this work. It is concluded that opinion mining is an area capable of identifying trends in the population, which is why it can be used to predict phenomena or situations, including politics, and therefore facilitate decision-making.eng
dc.subject.proposalWeb 2.0spa
dc.subject.proposalMicrobloggingspa
dc.subject.proposalAnálisis de sentimientospa
dc.type.redcolhttp://purl.org/redcol/resource_type/TM
dc.type.redcolhttp://purl.org/redcol/resource_type/TM
dc.rights.creativecommonsAtribución-NoComercial-SinDerivadas 2.5 Colombia*
dc.contributor.researchgroupGrupo de Investigación Tecnologías de Información - GTIspa
dc.contributor.researchgroupGrupo de Investigaciones Clínicasspa
dc.coverage.campusUNAB Campus Bucaramangaspa
dc.description.learningmodalityModalidad Presencialspa


Ficheros en el ítem

Thumbnail
Thumbnail
Thumbnail

Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem

Atribución-NoComercial-SinDerivadas 2.5 Colombia
Excepto si se señala otra cosa, la licencia del ítem se describe como Atribución-NoComercial-SinDerivadas 2.5 Colombia