Show simple item record

dc.contributor.advisorGarcía Ojeda, Juan Carlosspa
dc.contributor.authorPanesso Tascón, Héctor Fabiospa
dc.contributor.authorMurillo Murillo, Carlos Albertospa
dc.date.accessioned2020-06-26T21:32:16Z
dc.date.available2020-06-26T21:32:16Z
dc.date.issued2005-09
dc.identifier.urihttp://hdl.handle.net/20.500.12749/3305
dc.description.abstractEste trabajo pretende mostrar datos actualizados sobre el web usage mining (WUM), incluyendo tanto la investigación académica como la industrial, como una buena oferta comercial; también se presenta las muchas posibles aplicaciones del WUM, que es un proceso de aplicación de técnicas de minería de datos. La mine- ría de datos, que se puede definir como un proceso analítico diseñado para explorar grandes cantidades de datos (generalmente datos de negocios y mercados) con el objetivo de detectar patrones de comportamiento consistentes o relaciones entre las diferentes variables para aplicarlos a nuevos conjuntos de datos. Es importante tener en cuenta que en gran porcentaje el éxito en la aplicabilidad de es- tas técnicas radica en la información base de la que se disponga; es decir, los da- tos de entrada (inputs). La WUM esta constituida por tres fases. En este documento se describirán en de- talle cada una de estas fases y se encontrara una taxonomía detallada del trabajo en esta área, incluyendo esfuerzos de investigación para un uso comercial. Asimismo, se describen los objetivos (el general y los específicos) que persigue este trabajo y los tipos de datos de la web que pueden ser usados en el WUM. Luego se muestra se habla del sofware requerido, una aplicación que incluye un informe sobre el macroalgoritmo y los diagramas del software desarrollado como la revisión de software existente en el mercado para generar la información estadística basada en los datos contenidos en el log del sistema. Finalmente también se plantea los resultados de su aplicación, mostrando su análisis estadístico para el caso específico de las necesidades de la Universidad Autónoma de Occidente.spa
dc.description.sponsorshipInstituto Tecnológico y de Estudios Superiores de Monterrey ITESMspa
dc.description.tableofcontentsRESUMEN 1 INTRODUCCIÓN 2 CAPÍTULO 1 4 NUESTRO PROYECTO 4 1.1 HISTORIA 4 1.2 ANTECEDENTES 5 1.3 RESULTADOS ESPERADOS 7 1.4 OBJETIVOS 8 1.4.1 General 8 1.4.2 Específicos 9 CAPÍTULO 2 10 MARCO TEÓRICO DEL PROYECTO 10 2.1 LA WORLD WIDE WEB (WWW) Y EL NAVEGANTE 10 2.2 LA NECESIDAD DE LA MINERÍA DE DATOS O DATA MINING (DM) Y DEL WEB MINING 13 2.2.1 ¿Qué es la minería de datos? 14 2.2.2 Herramientas en la minería de datos 16 2.2.3 ¿Qué es web mining? 18 2.3 DESCUBRIENDO INFORMACIÓN OCULTA, LA POTENCIALIDAD DE LAS HERRAMIENTAS DE DATA MINING 19 2.4 TAXONOMÍA DE WEB MINING 20 2.4.1 Web content mining 22 2.4.2 Web structure mining 24 2.4.3 Web usage mining 25 2.5 EL MEDIO: EL ANALISIS DEL LOG 26 2.5.1 Log del servidor 27 2.6 EVALUACION DEL ESTADO DEL ARTE 34 CAPÍTULO 3 40 EL SOFTWARE UTILIZADO 40 3.1 EL REQUERIMIENTO 40 3.2 EL PROGRAMA PROTOTIPO DESARROLLADO PARA HACER LA EXTRACCION 40 3.2.1 MACROALGORITMO ANALOGS 42 3.2.2 DIAGRAMAS DE FLUJO DE ANALOGS 45 3.3 EL SOFTWARE USADO PARA GENERACION DE REPORTES Y GRAFICOS 50 3.3.1 El Primer candidato: El ANALOG 50 3.3.2 El Segundo candidato: El WEBALIZER 51 3.3.3 El tercer candidato: WEBLOG SESSIONIZTOR Xp 5.0 Beta 52 3.3.4 Nuestra Decisión 54 CAPÍTULO 4 55 CASO DE APLICACIÓN: ESTADISTICAS WEB UNIVERSIDAD AUTÓNOMA DE OCCIDENTE 55 RESUMEN GENERAL 55 INFORME MENSUAL 56 RESUMEN DIARIO 57 RESUMEN HORARIO 58 INFORME DE ORGANIZACIÓN 61 INFORME DE CÓDIGOS DE ESTADO 63 INFORME DE TAMAÑO DE ARCHIVOS 64 INFORME DE TIPOS DE ARCHIVO 66 INFORME DE DIRECTORIOS 68 INFORME DE PETICIONES 70 CAPÍTULO 5 78 CONCLUSIONES Y RECOMENDACIONES 78 5.1 SOBRE EL DATA MINING 78 5.2 SOBRE NUESTRO CASO 79 CAPÍTULO 6 82 GLOSARIO 82 BIBLIOGRAFÍA 85 ANEXO 1 88 PROGRAMA IMPLEMENTADO 88 ANEXO 2 114 MANUAL DE USUARIO ANALOGS 114 ANEXO 3 118 COMPLEJIDAD COMPUTACIONAL 118 ANEXO 4 126 CARTA DE LA UNIVERSIDAD 126spa
dc.format.mimetypeapplication/pdfspa
dc.language.isospaspa
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/2.5/co/*
dc.title"Aplicación de técnicas de Web Mining para la búsqueda de patrones de comportamiento en clientes dentro de la Web"spa
dc.title.translated"Application of web mining techniques to search for behavior patterns in clients within the Web"eng
dc.degree.nameMagíster en Ciencias Computacionalesspa
dc.coverageBucaramanga (Colombia)spa
dc.publisher.grantorUniversidad Autónoma de Bucaramanga UNABspa
dc.rights.localAbierto (Texto Completo)spa
dc.publisher.facultyFacultad Ingenieríaspa
dc.publisher.programMaestría en Ciencias Computacionalesspa
dc.description.degreelevelMaestríaspa
dc.type.driverinfo:eu-repo/semantics/masterThesis
dc.type.localTesisspa
dc.type.coarhttp://purl.org/coar/resource_type/c_bdcc
dc.subject.keywordsData miningeng
dc.subject.keywordsComputer programeng
dc.subject.keywordsInformation storage systemseng
dc.subject.keywordsInformation retrieval systemseng
dc.subject.keywordsNetwork information serviceeng
dc.subject.keywordsSystems engineeringeng
dc.subject.keywordsComputational scienceeng
dc.subject.keywordsInvestigationseng
dc.subject.keywordsAnalysiseng
dc.subject.keywordsWeb usage miningeng
dc.identifier.instnameinstname:Universidad Autónoma de Bucaramanga - UNABspa
dc.identifier.reponamereponame:Repositorio Institucional UNABspa
dc.type.hasversioninfo:eu-repo/semantics/acceptedVersion
dc.rights.accessrightsinfo:eu-repo/semantics/openAccessspa
dc.rights.accessrightshttp://purl.org/coar/access_right/c_abf2spa
dc.relation.referencesPanesso Tascón, Héctor Fabio, Murillo Murillo, Carlos Alberto (2005). Aplicación de técnicas de web mining para la búsqueda de patrones de comportamiento en clientes dentro de la Web. Bucaramanga (Colombia) : Universidad Autónoma de Bucaramanga UNAB, Instituto Tecnológico y de Estudios Superiores de Monterrey ITESMspa
dc.relation.referencesDISCOVERING DATA MINING FROM CONCEPT TO IMPLEMENTATION / Cabena, Hadjinian, Stadler, Verhees, Zanasispa
dc.relation.referencesMining Navigation Patterns with Hypertext Probabilistic Grammars/ Jose Bor- ges y Mark Levene / Departamento de Ciencias Computacionales / Universidad de London/199.spa
dc.relation.referencesMINEit Software Ltd, Facultad de Informatica/ Universidad de Ulster Shore Road, Newtownabbey, Co. / A.G. Buchner, S.S. Anand, M.D. Mulvenna y J.G. Hughes/1999spa
dc.relation.referencesWebSIFT: The web Site Information Filter System / Robert Cooley / Departa- mento de Ciencias Computacionales / Universidad de Minnesota / 1999spa
dc.relation.referencesWebSIFT: The web Site Information Filter System / Robert Cooley / Departa- mento de Ciencias Computacionales / Universidad de Minnesota / 1999spa
dc.relation.referencesLearning to Extract Symbolic Knowledge from World wide web / Mark Craven , Dan DiPasquo / Escuela de Ciencias Computacionales Universidad Carnegie Mellon / Pittsburgh / 1999.spa
dc.relation.referencesDiscovering DATA MINING: From Concept to Implementation, 1/e / Peter Ca- bena, Almaden Research Ctr., San Jose, California.spa
dc.relation.referencesINSTITUTO COLOMBIANO DE NORMAS TECNICAS. Normas Colombianas para la presentación de trabajos de investigación. Segunda actualización. San- tafe de Bogotá D.C. ICONTEC, 2000spa
dc.relation.referenceshttp://www.geocities.com/CapeCanaveral/Launchpad/7651/dminits.htm / Agos- to / 2000spa
dc.relation.referenceshttp://megamarketing.com.mx/datam.htm / Agosto / 2000spa
dc.relation.referenceswww.DATA MINING.com / Agosto / 2000spa
dc.relation.referenceswww.DATA MINING.com / Agosto / 2000spa
dc.relation.referenceswww.themeasurementgroup.com/Septiembre/2000spa
dc.relation.referenceswww.http://www.angoss.com/angoss.html/Septiembre/2000spa
dc.relation.referenceshttp://www.imparcial.com.mx/Notas/Semanal/informatica/n14.htm / Agosto30 / 2000spa
dc.relation.referenceswww.webminer.com/ Agosto / 2000spa
dc.relation.referenceshttp://usability.gov/serverlog/index.html Excelente artículo sobre circunstancias a la hora de extraer información de un log de visitasspa
dc.relation.referenceshttp://usability.gov/serverlog/index.html Excelente artículo sobre circunstancias a la hora de extraer información de un log de visitasspa
dc.relation.referenceshttp://usability.gov/serverlog/index.html Excelente artículo sobre circunstancias a la hora de extraer información de un log de visitasspa
dc.relation.referenceshttp://www.analog.cx/docs/webworks.html. Errores comunes a la hora de leer un log de visitas.spa
dc.relation.referenceshttp://www.infovis.net/Revista/num_65.htm. Artículo dentro de infovis.net sobre visualización de logs. Directorio de google sobre analizadores de tráfico.spa
dc.relation.referenceshttp://directory.google.com/Top/Computers/Software/Internet/Site_Management /Log_Analysis/ Archivos de ACM.org sobre logsspa
dc.relation.referenceshttp://usability.gov/serverlog/index.html Excelente Artículo sobre circunstancias a la hora de extraer información de un log de visitas.spa
dc.relation.referenceshttp://www.microsoft.com/usability/webconf/fuller/fuller.htm Juan C. Dursteler recomienda un par de artículos:spa
dc.relation.referenceshttp://www.analog.cx/docs/webworks.html. Errores comunes a la hora de leer un log de visitas. Un tono algo negativospa
dc.relation.referenceshttp://www.infovis.net/Revista/num_65.htm. Artículo dentro de infovis.net sobre visualización de logs. Directorio de google sobre analizadores de tráfico.spa
dc.relation.referenceshttp://directory.google.com/Top/Computers/Software/Internet/Site_Management /Log_Analysis/ Archivos de ACM.org sobre logs.spa
dc.relation.referenceshttp://www.acm.org/archives Archivos de Cadius sobre preferencias a la hora de usar herramientas de log.spa
dc.contributor.cvlachttps://scienti.minciencias.gov.co/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0000202568*
dc.contributor.scopushttps://www.scopus.com/authid/detail.uri?authorId=6508349754*
dc.subject.lembData miningspa
dc.subject.lembPrograma para computadorspa
dc.subject.lembSistemas de almacenamiento de informaciónspa
dc.subject.lembSistemas de recuperación de informaciónspa
dc.subject.lembWorld Wide Webspa
dc.subject.lembServicio de información sobre redesspa
dc.subject.lembIngeniería de sistemasspa
dc.subject.lembCiencia computacionalspa
dc.subject.lembInvestigacionesspa
dc.subject.lembAnálisisspa
dc.contributor.corporatenameInstituto Tecnológico de Estudios Superiores de Monterrey (ITESM)spa
dc.description.abstractenglishThis work aims to show updated data on web usage mining (WUM), including both academic and industrial research, as well as a good commercial offer; It also presents the many possible applications of WUM, which is a process of applying data mining techniques. Data mining, which can be defined as an analytical process designed to explore large amounts of data (generally business and market data) with the aim of detecting consistent behavior patterns or relationships between different variables to apply them to new sets of data. It is important to bear in mind that a large percentage of the success in the applicability of these techniques lies in the base information that is available; that is, the input data (inputs). The WUM is made up of three phases. In this document each of these phases will be described in detail and a detailed taxonomy of work in this area will be found, including research efforts for commercial use. Likewise, the objectives (general and specific) pursued by this work and the types of web data that can be used in the WUM are described. Then it shows the required software, an application that includes a report on the macroalgorithm and diagrams of the software developed as the revision of existing software on the market to generate statistical information based on the data contained in the system log. Finally, the results of its application are also presented, showing its statistical analysis for the specific case of the needs of the Autonomous University of the West.eng
dc.subject.proposalMinería de uso web
dc.subject.proposalSoftware
dc.rights.creativecommonsAtribución-NoComercial-SinDerivadas 2.5 Colombia*


Files in this item

Thumbnail
Thumbnail

This item appears in the following Collection(s)

Show simple item record

Atribución-NoComercial-SinDerivadas 2.5 Colombia
Except where otherwise noted, this item's license is described as Atribución-NoComercial-SinDerivadas 2.5 Colombia