Mostrar el registro sencillo del ítem
"Aplicación de técnicas de Web Mining para la búsqueda de patrones de comportamiento en clientes dentro de la Web"
dc.contributor.advisor | García Ojeda, Juan Carlos | spa |
dc.contributor.author | Panesso Tascón, Héctor Fabio | spa |
dc.contributor.author | Murillo Murillo, Carlos Alberto | spa |
dc.date.accessioned | 2020-06-26T21:32:16Z | |
dc.date.available | 2020-06-26T21:32:16Z | |
dc.date.issued | 2005-09 | |
dc.identifier.uri | http://hdl.handle.net/20.500.12749/3305 | |
dc.description.abstract | Este trabajo pretende mostrar datos actualizados sobre el web usage mining (WUM), incluyendo tanto la investigación académica como la industrial, como una buena oferta comercial; también se presenta las muchas posibles aplicaciones del WUM, que es un proceso de aplicación de técnicas de minería de datos. La mine- ría de datos, que se puede definir como un proceso analítico diseñado para explorar grandes cantidades de datos (generalmente datos de negocios y mercados) con el objetivo de detectar patrones de comportamiento consistentes o relaciones entre las diferentes variables para aplicarlos a nuevos conjuntos de datos. Es importante tener en cuenta que en gran porcentaje el éxito en la aplicabilidad de es- tas técnicas radica en la información base de la que se disponga; es decir, los da- tos de entrada (inputs). La WUM esta constituida por tres fases. En este documento se describirán en de- talle cada una de estas fases y se encontrara una taxonomía detallada del trabajo en esta área, incluyendo esfuerzos de investigación para un uso comercial. Asimismo, se describen los objetivos (el general y los específicos) que persigue este trabajo y los tipos de datos de la web que pueden ser usados en el WUM. Luego se muestra se habla del sofware requerido, una aplicación que incluye un informe sobre el macroalgoritmo y los diagramas del software desarrollado como la revisión de software existente en el mercado para generar la información estadística basada en los datos contenidos en el log del sistema. Finalmente también se plantea los resultados de su aplicación, mostrando su análisis estadístico para el caso específico de las necesidades de la Universidad Autónoma de Occidente. | spa |
dc.description.sponsorship | Instituto Tecnológico de Estudios Superiores de Monterrey ITESM | spa |
dc.description.tableofcontents | RESUMEN 1 INTRODUCCIÓN 2 CAPÍTULO 1 4 NUESTRO PROYECTO 4 1.1 HISTORIA 4 1.2 ANTECEDENTES 5 1.3 RESULTADOS ESPERADOS 7 1.4 OBJETIVOS 8 1.4.1 General 8 1.4.2 Específicos 9 CAPÍTULO 2 10 MARCO TEÓRICO DEL PROYECTO 10 2.1 LA WORLD WIDE WEB (WWW) Y EL NAVEGANTE 10 2.2 LA NECESIDAD DE LA MINERÍA DE DATOS O DATA MINING (DM) Y DEL WEB MINING 13 2.2.1 ¿Qué es la minería de datos? 14 2.2.2 Herramientas en la minería de datos 16 2.2.3 ¿Qué es web mining? 18 2.3 DESCUBRIENDO INFORMACIÓN OCULTA, LA POTENCIALIDAD DE LAS HERRAMIENTAS DE DATA MINING 19 2.4 TAXONOMÍA DE WEB MINING 20 2.4.1 Web content mining 22 2.4.2 Web structure mining 24 2.4.3 Web usage mining 25 2.5 EL MEDIO: EL ANALISIS DEL LOG 26 2.5.1 Log del servidor 27 2.6 EVALUACION DEL ESTADO DEL ARTE 34 CAPÍTULO 3 40 EL SOFTWARE UTILIZADO 40 3.1 EL REQUERIMIENTO 40 3.2 EL PROGRAMA PROTOTIPO DESARROLLADO PARA HACER LA EXTRACCION 40 3.2.1 MACROALGORITMO ANALOGS 42 3.2.2 DIAGRAMAS DE FLUJO DE ANALOGS 45 3.3 EL SOFTWARE USADO PARA GENERACION DE REPORTES Y GRAFICOS 50 3.3.1 El Primer candidato: El ANALOG 50 3.3.2 El Segundo candidato: El WEBALIZER 51 3.3.3 El tercer candidato: WEBLOG SESSIONIZTOR Xp 5.0 Beta 52 3.3.4 Nuestra Decisión 54 CAPÍTULO 4 55 CASO DE APLICACIÓN: ESTADISTICAS WEB UNIVERSIDAD AUTÓNOMA DE OCCIDENTE 55 RESUMEN GENERAL 55 INFORME MENSUAL 56 RESUMEN DIARIO 57 RESUMEN HORARIO 58 INFORME DE ORGANIZACIÓN 61 INFORME DE CÓDIGOS DE ESTADO 63 INFORME DE TAMAÑO DE ARCHIVOS 64 INFORME DE TIPOS DE ARCHIVO 66 INFORME DE DIRECTORIOS 68 INFORME DE PETICIONES 70 CAPÍTULO 5 78 CONCLUSIONES Y RECOMENDACIONES 78 5.1 SOBRE EL DATA MINING 78 5.2 SOBRE NUESTRO CASO 79 CAPÍTULO 6 82 GLOSARIO 82 BIBLIOGRAFÍA 85 ANEXO 1 88 PROGRAMA IMPLEMENTADO 88 ANEXO 2 114 MANUAL DE USUARIO ANALOGS 114 ANEXO 3 118 COMPLEJIDAD COMPUTACIONAL 118 ANEXO 4 126 CARTA DE LA UNIVERSIDAD 126 | spa |
dc.format.mimetype | application/pdf | spa |
dc.language.iso | spa | spa |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/2.5/co/ | * |
dc.title | "Aplicación de técnicas de Web Mining para la búsqueda de patrones de comportamiento en clientes dentro de la Web" | spa |
dc.title.translated | "Application of web mining techniques to search for behavior patterns in clients within the Web" | eng |
dc.degree.name | Magíster en Ciencias Computacionales | spa |
dc.coverage | Bucaramanga (Colombia) | spa |
dc.publisher.grantor | Universidad Autónoma de Bucaramanga UNAB | spa |
dc.rights.local | Abierto (Texto Completo) | spa |
dc.publisher.faculty | Facultad Ingeniería | spa |
dc.publisher.program | Maestría en Ciencias Computacionales | spa |
dc.description.degreelevel | Maestría | spa |
dc.type.driver | info:eu-repo/semantics/masterThesis | |
dc.type.local | Tesis | spa |
dc.type.coar | http://purl.org/coar/resource_type/c_bdcc | |
dc.subject.keywords | Data mining | eng |
dc.subject.keywords | Computer program | eng |
dc.subject.keywords | Information storage systems | eng |
dc.subject.keywords | Information retrieval systems | eng |
dc.subject.keywords | Network information service | eng |
dc.subject.keywords | Systems engineering | eng |
dc.subject.keywords | Computational science | eng |
dc.subject.keywords | Investigations | eng |
dc.subject.keywords | Analysis | eng |
dc.subject.keywords | Web usage mining | eng |
dc.identifier.instname | instname:Universidad Autónoma de Bucaramanga - UNAB | spa |
dc.identifier.reponame | reponame:Repositorio Institucional UNAB | spa |
dc.type.hasversion | info:eu-repo/semantics/acceptedVersion | |
dc.rights.accessrights | info:eu-repo/semantics/openAccess | spa |
dc.rights.accessrights | http://purl.org/coar/access_right/c_abf2 | spa |
dc.relation.references | Panesso Tascón, Héctor Fabio, Murillo Murillo, Carlos Alberto (2005). Aplicación de técnicas de web mining para la búsqueda de patrones de comportamiento en clientes dentro de la Web. Bucaramanga (Colombia) : Universidad Autónoma de Bucaramanga UNAB, Instituto Tecnológico y de Estudios Superiores de Monterrey ITESM | spa |
dc.relation.references | DISCOVERING DATA MINING FROM CONCEPT TO IMPLEMENTATION / Cabena, Hadjinian, Stadler, Verhees, Zanasi | spa |
dc.relation.references | Mining Navigation Patterns with Hypertext Probabilistic Grammars/ Jose Bor- ges y Mark Levene / Departamento de Ciencias Computacionales / Universidad de London/199. | spa |
dc.relation.references | MINEit Software Ltd, Facultad de Informatica/ Universidad de Ulster Shore Road, Newtownabbey, Co. / A.G. Buchner, S.S. Anand, M.D. Mulvenna y J.G. Hughes/1999 | spa |
dc.relation.references | WebSIFT: The web Site Information Filter System / Robert Cooley / Departa- mento de Ciencias Computacionales / Universidad de Minnesota / 1999 | spa |
dc.relation.references | WebSIFT: The web Site Information Filter System / Robert Cooley / Departa- mento de Ciencias Computacionales / Universidad de Minnesota / 1999 | spa |
dc.relation.references | Learning to Extract Symbolic Knowledge from World wide web / Mark Craven , Dan DiPasquo / Escuela de Ciencias Computacionales Universidad Carnegie Mellon / Pittsburgh / 1999. | spa |
dc.relation.references | Discovering DATA MINING: From Concept to Implementation, 1/e / Peter Ca- bena, Almaden Research Ctr., San Jose, California. | spa |
dc.relation.references | INSTITUTO COLOMBIANO DE NORMAS TECNICAS. Normas Colombianas para la presentación de trabajos de investigación. Segunda actualización. San- tafe de Bogotá D.C. ICONTEC, 2000 | spa |
dc.relation.references | http://www.geocities.com/CapeCanaveral/Launchpad/7651/dminits.htm / Agos- to / 2000 | spa |
dc.relation.references | http://megamarketing.com.mx/datam.htm / Agosto / 2000 | spa |
dc.relation.references | www.DATA MINING.com / Agosto / 2000 | spa |
dc.relation.references | www.DATA MINING.com / Agosto / 2000 | spa |
dc.relation.references | www.themeasurementgroup.com/Septiembre/2000 | spa |
dc.relation.references | www.http://www.angoss.com/angoss.html/Septiembre/2000 | spa |
dc.relation.references | http://www.imparcial.com.mx/Notas/Semanal/informatica/n14.htm / Agosto30 / 2000 | spa |
dc.relation.references | www.webminer.com/ Agosto / 2000 | spa |
dc.relation.references | http://usability.gov/serverlog/index.html Excelente artículo sobre circunstancias a la hora de extraer información de un log de visitas | spa |
dc.relation.references | http://usability.gov/serverlog/index.html Excelente artículo sobre circunstancias a la hora de extraer información de un log de visitas | spa |
dc.relation.references | http://usability.gov/serverlog/index.html Excelente artículo sobre circunstancias a la hora de extraer información de un log de visitas | spa |
dc.relation.references | http://www.analog.cx/docs/webworks.html. Errores comunes a la hora de leer un log de visitas. | spa |
dc.relation.references | http://www.infovis.net/Revista/num_65.htm. Artículo dentro de infovis.net sobre visualización de logs. Directorio de google sobre analizadores de tráfico. | spa |
dc.relation.references | http://directory.google.com/Top/Computers/Software/Internet/Site_Management /Log_Analysis/ Archivos de ACM.org sobre logs | spa |
dc.relation.references | http://usability.gov/serverlog/index.html Excelente Artículo sobre circunstancias a la hora de extraer información de un log de visitas. | spa |
dc.relation.references | http://www.microsoft.com/usability/webconf/fuller/fuller.htm Juan C. Dursteler recomienda un par de artículos: | spa |
dc.relation.references | http://www.analog.cx/docs/webworks.html. Errores comunes a la hora de leer un log de visitas. Un tono algo negativo | spa |
dc.relation.references | http://www.infovis.net/Revista/num_65.htm. Artículo dentro de infovis.net sobre visualización de logs. Directorio de google sobre analizadores de tráfico. | spa |
dc.relation.references | http://directory.google.com/Top/Computers/Software/Internet/Site_Management /Log_Analysis/ Archivos de ACM.org sobre logs. | spa |
dc.relation.references | http://www.acm.org/archives Archivos de Cadius sobre preferencias a la hora de usar herramientas de log. | spa |
dc.contributor.cvlac | https://scienti.minciencias.gov.co/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0000202568 | * |
dc.contributor.scopus | https://www.scopus.com/authid/detail.uri?authorId=6508349754 | * |
dc.subject.lemb | Data mining | spa |
dc.subject.lemb | Programa para computador | spa |
dc.subject.lemb | Sistemas de almacenamiento de información | spa |
dc.subject.lemb | Sistemas de recuperación de información | spa |
dc.subject.lemb | World Wide Web | spa |
dc.subject.lemb | Servicio de información sobre redes | spa |
dc.subject.lemb | Ingeniería de sistemas | spa |
dc.subject.lemb | Ciencia computacional | spa |
dc.subject.lemb | Investigaciones | spa |
dc.subject.lemb | Análisis | spa |
dc.contributor.corporatename | Instituto Tecnológico de Estudios Superiores de Monterrey (ITESM) | spa |
dc.description.abstractenglish | This work aims to show updated data on web usage mining (WUM), including both academic and industrial research, as well as a good commercial offer; It also presents the many possible applications of WUM, which is a process of applying data mining techniques. Data mining, which can be defined as an analytical process designed to explore large amounts of data (generally business and market data) with the aim of detecting consistent behavior patterns or relationships between different variables to apply them to new sets of data. It is important to bear in mind that a large percentage of the success in the applicability of these techniques lies in the base information that is available; that is, the input data (inputs). The WUM is made up of three phases. In this document each of these phases will be described in detail and a detailed taxonomy of work in this area will be found, including research efforts for commercial use. Likewise, the objectives (general and specific) pursued by this work and the types of web data that can be used in the WUM are described. Then it shows the required software, an application that includes a report on the macroalgorithm and diagrams of the software developed as the revision of existing software on the market to generate statistical information based on the data contained in the system log. Finally, the results of its application are also presented, showing its statistical analysis for the specific case of the needs of the Autonomous University of the West. | eng |
dc.subject.proposal | Minería de uso web | |
dc.subject.proposal | Software | |
dc.type.redcol | http://purl.org/redcol/resource_type/TM | |
dc.rights.creativecommons | Atribución-NoComercial-SinDerivadas 2.5 Colombia | * |
dc.coverage.campus | UNAB Campus Bucaramanga | spa |
dc.description.learningmodality | Modalidad Presencial | spa |