Show simple item record

dc.contributor.advisorGuerrero Santander, César Daríospa
dc.contributor.authorSalcedo Morillo, Dixon Davidspa
dc.date.accessioned2020-06-26T21:34:54Z
dc.date.available2020-06-26T21:34:54Z
dc.date.issued2011
dc.identifier.urihttp://hdl.handle.net/20.500.12749/3467
dc.description.abstractEste proyecto está enmarcado dentro de la línea de investigación en Telemática del grupo de investigación en tecnologías de la información de la UNAB se planteo como objetivo implementar en lenguaje C un algoritmo de clustering en el estimador de ancho de banda Traceband y evaluar impacto del algoritmo en cuanto a la exactitud en la estimación comparada con el programa original, en un escenario controlado que emule el comportamiento de una red en la internet. Para lograr esto, primero se aborda el estudio de mecanismos de clustering y así determinar el que más se ajuste a la problemática de estimación de ancho de banda disponible, después se estudiará el código de Traceband, tanto en el Sender como el Receiver, para determinar el punto en el cual de tiene que aplicar la técnica de clustering seleccionada. Después de tener definido lo anterior, se implementará el código de clustering en lenguaje C y probar la estimación sobre un testbed de evaluación; y así observar la efectividad del algoritmo implementado haciendo pruebas con diferente tipo y cantidad de tráfico cruzado. Para las pruebas, se crea una infraestructura de red que permite evaluar estimadores de ancho de banda disponibles simulando el comportamiento del internet (Testbed). En dicha infraestructura, se evalúa, el Traceband con y sin el K-means, utilizando Mgen para la generación de tráfico. El estimar el ancho de banda disponible es un problema estudiando por investigadores a nivel mundial dada la necesidad de contar con esta información para mejorar la operación de varias aplicaciones de red tales como el cumplimiento de los acuerdos de nivel de servicio, gestión de redes, ingeniería de tráfico y en tiempo real de los recursos de aprovisionamiento, control de flujo y congestión, la detección rápida de fallas, ataques de red y control de admisión [3]. La implementación del K-means en el Traceband, permite determinar, de que manera la agrupación de los datos de la estimación, puede ayudar a mejorar la exactitud de la estimación del ancho de banda disponible en una infraestructura de red. Adicionando los beneficios que provee, el poder conocer y administrar estos factores críticos, que son relevantes en el rendimiento de la red y los servicios que ésta brinda. Actualmente dentro de la bibliografía revisada, no se encuentra registro de la implementación de una técnica de clustering, dentro de una herramienta de estimación de ancho de banda disponible, como Traceband. Esto contrasta con la gran cantidad de trabajos y contribuciones realizados, en la implementación y uso de las técnicas de clustering en varias áreas de la ciencia; siendo muy efectivas a la hora del análisis de los resultadosspa
dc.description.sponsorshipUniversitat Oberta de Catalunya (UOC)spa
dc.description.tableofcontentsINTRODUCCIÓN 13 1. CONTEXTO DE LA INVESTIGACIÓN 15 1.1 Tema 15 1.2 Definición del problema 15 1.3 Objetivos 17 2. ESTADO DEL ARTE 18 3. FUNDAMENTOS TEÓRICOS 23 3.1 Ancho de banda, Bandwidth en inglés 23 3.1.1 Definición 23 3.1.2 Ancho de Banda Disponible 23 3.1.3 Ancho de banda disponible de extremo a extremo (end to end) 25 3.2 Técnicas de estimación de ancho de banda disponible 27 3.2.1 Métodos PRM (packet rate method) 27 3.2.2 Métodos PGM (packet gap method) 28 3.3 Herramientas de estimación de ancho de banda Disponible (ABETT’S) 31 3.4 Modelo de las cadenas ocultas de markov aplicadas a las herramientas de estimación de ancho de banda (HMM) 33 3.4.1 Definición 33 3.4.2 Aplicaciones 35 3.5 Algoritmos de clustering y sus aplicaciones 38 3.5.1 Definición 38 3.5.2 Algoritmos de agrupamiento 38 3.5.3 Aplicabilidad 39 3.5.4 APRENDIZAJE DE MÁQUINA. 39 3.5.4.1 Aprendizaje supervisado 40 3.5.4.2 Aprendizaje no supervisado 40 3.5.5 K-means 41 3.5.5.1 Inconvenientes 43 3.5.6 Aplicación real de los algoritmos de clustering en herramientas de estimación de ancho de banda disponible 44 3.6 Testbed 45 3.6.1 Definición 45 4. METODOLOGÍA APLICADA 48 4.1 Clustering 48 4.1.1 Clustering Probabilístico 50 4.1.2 Métodos de los k-vecinos (k-medoids) 52 4.1.3 Algoritmo Basado en Densidad 54 4.1.4 Método de las k-medias (K-means) 55 4.1.4.1 Descripción del algoritmo K-means estándar 56 4.2 Algoritmo a utilizar dentro del estimador 58 4.2.1 Implementación del algoritmo 62 4.2.2 Operatividad del k-means en el Traceband 62 5. IMPLEMENTACIÓN DE LA SOLUCIÓN 66 5.1 Instalación las herramientas 66 5.1.1 MGEN 66 5.1.2 Traceband 68 5.2 Descripción del testbed 70 5.3 Diseño de los experimentos 72 5.4 Métricas utilizadas 73 5.4.1 Tiempo de estimación 73 5.4.2 Overhead 73 5.4.3 Error de estimación 73 5.4.4 Ancho de banda disponible con K-means 73 5.5 Procesamiento de la información 74 6. RESULTADOS 76 7. CONCLUSIONES 87 7.1 Traceband con HMM 87 7.2 Traceband con K-means 88 7.3 Traceband con HMM vs Traceband con K-means 89 8. REFERENCIAS BIBLIOGRÁFICAS 91spa
dc.format.mimetypeapplication/pdfspa
dc.language.isospaspa
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/2.5/co/*
dc.titleImplementación y evaluación de un algoritmo de clustering en un estimador de ancho de banda disponiblespa
dc.title.translatedImplementation and evaluation of a clustering algorithm in an available bandwidth estimatoreng
dc.degree.nameMagíster en Software Librespa
dc.coverageBucaramanga (Colombia)spa
dc.publisher.grantorUniversidad Autónoma de Bucaramanga UNABspa
dc.rights.localAbierto (Texto Completo)spa
dc.publisher.facultyFacultad Ingenieríaspa
dc.publisher.programMaestría en Software Librespa
dc.description.degreelevelMaestríaspa
dc.type.driverinfo:eu-repo/semantics/masterThesis
dc.type.localTesisspa
dc.type.coarhttp://purl.org/coar/resource_type/c_bdcc
dc.subject.keywordsClustering techniqueeng
dc.subject.keywordsNetwork infrastructureeng
dc.subject.keywordsTraceband bandwidtheng
dc.subject.keywordsFree softwareeng
dc.subject.keywordsSystems engineereng
dc.subject.keywordsBroadband communication systemseng
dc.subject.keywordsAlgorithmseng
dc.subject.keywordsComputerseng
dc.subject.keywordsResearcheng
dc.identifier.instnameinstname:Universidad Autónoma de Bucaramanga - UNABspa
dc.identifier.reponamereponame:Repositorio Institucional UNABspa
dc.type.hasversioninfo:eu-repo/semantics/acceptedVersion
dc.rights.accessrightsinfo:eu-repo/semantics/openAccessspa
dc.rights.accessrightshttp://purl.org/coar/access_right/c_abf2spa
dc.relation.referencesSalcedo Morillo, Dixon David, Guerrero Santander, Cesar Darío (2011). Implementación y evaluación de un algoritmo de clustering en un estimador de ancho de banda disponible. Bucaramanga (Colombia) : Universidad Autónoma de Bucaramanga UNAB, Universitat Oberta de Catalunya UOCspa
dc.relation.referencesA.K. Jain, M.N. Murty, P.J. Flynn. “Data Clustering: A Review”, Sept, 1999. [En línea]. Disponible: en: http://www.docstoc.com/docs/19887391/Data-Clustering-A-Review.spa
dc.relation.referencesBottou, L., Bengio, Y. Convergence Properties of the K-means Algorithms. Advances in Neural Information Processing”. Systems. MTI Press, 1995.spa
dc.relation.referencesC. Blake, D. Katabi, S. Katti, “Cross-Traffic: Noise or Data?” Computer Science and Artificial Intelligence Laboratory@MIT, No registra. [En línea]. Disponible: http://nms.lcs.mit.edu/~dina/pub/multiQ.pdf. [Consultado: 10 de mayo de 2010].spa
dc.relation.referencesC. Guerrero, "Traceband: Available Bandidth Estimation based on a Hidden Markov Model", Ph.D. dissertation, Murdoch University, Murdoch, WA, Australia, 1999.tesis de la University of South Florida., FL, EEUU, 2009.spa
dc.relation.referencesCarrasquilla Marín, Ulloque Rodríguez, Guerrero Cesar, “Evaluación de técnicas de medición de ancho de Banda disponible “abet’s” http://www.colombiaaprende.edu.co/html/mediateca/1607/articles-109353_archivo.pdf#page=86spa
dc.relation.referencesCesar Guerrero, Miguel A Labrador, "On the Applicability of Available Bandwidth Estimation Techniques and Tools". En: Estados Unidos Computer Communications, ISSN: 0140-3664 ed: v.33 fasc.1 p.11 - 22, 2010[Consultado: 22 de abril de 2010].spa
dc.relation.referencesCesar Guerrero, Miguel A. Labrador, "Traceband: A fast, low overhead and accurate tool for available bandwidth estimation and monitoring". En: Estados Unidos Computer Networks-The International Journal Of Computer And Telecommunications Networking, ISSN: 1389-1286  ed: v.54 fasc.6 p.977 - 990, 2010. [Consultado: 20 de abril de 2010].spa
dc.relation.referencesCristina García Cambronero, Irene Gómez Moreno, “Algoritmos de aprendizaje: KNN & KMEANS”. 14/12/2008. [En línea]. Disponible: www.it.uc3m.es/jvillena/irc/practicas/08-09/06.pdf [Consultado: 20 de mayo de 2010].spa
dc.relation.referencesDUBES, R. C. 1987. How many clusters are best?—an experiment. Pattern Recogn. 20, 6 (Nov. 1, 1987), 645–663.spa
dc.relation.referencesDuda, R.O., Hart, P.E.: Pattern Classification and Scene Analysis. John Wiley & Sons, New York, NY. 1973.spa
dc.relation.referencesE. Hernández, “Algoritmo de clustering basado en entropía para descubrir grupos en atributos de tipo mixto”, agosto de 2006. [En línea]. Disponible: http://www.cs.cinvestav.mx/Estudiantes/TesisGraduados/2006/tesisEdnaHernandez.pdf. Consultado: [5 de enero de 2011].spa
dc.relation.referencesFayyad,U. M., Piatetsky-Shapiro, G., Smyth P., Uthurusamy, R.: Advances in Knowledge Discovery and Data Mining. AAAI/MIT Press, 1996.spa
dc.relation.referencesFiltro K-means (K-Medias). [Web en línea]. Disponible en: <http://celtico-celtico.blogspot.com/>.spa
dc.relation.referencesFisher, D.: Knowlwdge Acquisition via Incremental Conceptual Clustering. Machine Learning, Vol. 2, No. 2 (1987) 139-172.spa
dc.relation.referencesGarre, Cuadrado, Sicilia, “Comparación de diferentes algoritmos de clustering en la estimación de coste en el desarrollo de software,” Universidad del País Vasco, 23 Jun 2005. [En línea]. Disponible: http://www.sc.ehu.es/jiwdocoj/remis/docs/GarreAdis05.pdf. [Consultado: 3 de mayo de 2010].spa
dc.relation.referencesGoogle imágenes, [Documento en línea]. Disponible en: <http://www.google.com.co/imgres?imgurl=http://bp0.blogger.com/_FZfs7LCzurk /RbWgQZC04NI/AAAAAAAAADA/8v2zl6wbIB4/s400/flowchart.jpg>spa
dc.relation.referencesGustavo Mesa, “Cadenas de markov, una sencilla Aplicación”. Mayo de 2007. [En línea]. Disponible: http://www.revistamemorias.com/articulos9/cadenasdemarkov.pdf [Consultado: 23 de junio de 2010].spa
dc.relation.referencesHamerly, G., Elkan, C. “Alternatives to the K-means Algorithm that Find Better Clusterings”. Proc. 11th International Conf. On Information and Knowledge Management CIKM’02. ACM. Virginia, USA (2002).spa
dc.relation.referencesImplementación-de-k-means-en-opencv. [Web en línea]. Disponible en: <reyesalfonso.blogspot.com/.../implementacion-de-k-means-en-opencv.html>.spa
dc.relation.referencesJ. Pérez, M. F. Henriques, R. Pazos, L. Cruz3, G. Reyes, J. Salinas, A. Mexicano “Mejora al algoritmo de agrupamiento K-means mediante un nuevo criterio de convergencia y su aplicación a bases de datos poblacionales de cáncer”. Centro Nacional de Investigación y Desarrollo Tecnológico (CENIDET), México, Secretaría de Saúde do Estado de Pernambuco, Brasil, Instituto Tecnológico de Ciudad Madero, México.spa
dc.relation.referencesJulián Moreno, “Aprendizaje de máquina”. No registra. [En línea]. Disponible: http://pisis.unalmed.edu.co/cursos/material/3004653/1/Presentacion.ppt [Consultado: 18 de abril de 2010].spa
dc.relation.referencesKanungo, T., Mount, D.M., Netanyahu, N.S., Piatko, C.D., Silverman, R., Wu, A.Y.: A “Local Search Approximation Algorithm for k-Means Clustering” Proc. 18th Annual ACM Symposium on Computational Geometry (SoCG’02). Barcelona, Spain (2002) 10-18.spa
dc.relation.referencesKanungo, T., Netanyahu, N.S., Wu, A.Y.: “An Efficient Kmeans Clustering Algorithm: Analysis and Implementation. IEEE Transactions on Pattern Analysis and Machine Intelligence”, Vol. 24, No. 7 (2002).spa
dc.relation.referencesK-means_clustering Disponible en: <http://en.wikipedia.org/wiki/K-means_clustering>spa
dc.relation.referencesK-Mediods. Disponible en internet: <http://en.wikipedia.org/wiki/K-medoids>spa
dc.relation.referencesL.R. Rabiner, “A tutorial on hidden markov models and selected applications in speech recognition”, Proceedings of the IEEE 77 (2) (1989) 257–286.spa
dc.relation.referencesLakshminarayanan, Padmananbhan, Padhye, “Estimaciones del Ancho de Banda en redes de Banda Ancha”, Instituto de Ingeniería Eléctrica, No registra. [En línea]. Disponible: http://iie.fing.edu.uy/ense/asign/perfredes/trabajos/trabajos_2004/EstimacionBW/EstimacionBW.pdf. [Consultado: 8 de mayo de 2010].spa
dc.relation.referencesLópez Yoel, “Evaluación de técnicas de estimación de ancho de banda disponible en una red de computadoras”. Mayo de 2010. [Archivo PDF]. [Consultado: 20 de mayo de 2010]spa
dc.relation.referencesM. Zorrilla, “Procesamiento Paralelo y Distribuido Aplicado al Almacenamiento y Recuperación de Información Documental”, 2001. [En línea]. Disponible: http://www.tesisenred.net/TESIS_UC/AVAILABLE/TDR-0927110-130601//TesisMZP.pdf. Consultado: [3 de enero de 2011].spa
dc.relation.referencesMacQueen, J.: Some Methods for Classification and Analysis of Multivariate Observations. Proc. 5th Berkeley Symp. Math. Statistics and Probability, 1:281-297, 1967.spa
dc.relation.referencesMartínez Francisco., Quetglás Gregorio. “Introducción a la programación estructurada en C.” Maite Simon, 2003. [E-book] Disponible en: http://books.google.es/spa
dc.relation.referencesMehmed, K.: Data Mining: Concepts, Models, Methods, and Algorithms. John Wiley & Sons. 2003.spa
dc.relation.referencesMGen. [Web en línea]. Disponible en: <http://celtico-celtico.blogspot.com/>.spa
dc.relation.referencesO. Sánchez, Algunos métodos para medir distancias a los centroides, [En línea]. Disponible: http://omarsanchez.net/Documents/distancias_totales.pdf [Consultado: 22 de diciembre de 2010].spa
dc.relation.referencesO. Sánchez. “Modelos, Control y sistema de visión”, [Web en línea]. Disponible en: <http://omarsanchez.net/kmeans.aspx>.spa
dc.relation.referencesPaola Bermolen, “Ancho de Banda Efectivo para Flujos Markovianos” http://www.fing.edu.uy/iie/investigacion/grupos/artes/publicaciones/Paola.pdfspa
dc.relation.referencesPelleg, D., Moore, A.: X-means: “Extending K-means with Efficient Estimation of the Number of Clusters”. Proc. 17th International Conf. on Machine Learning (2000).spa
dc.relation.referencesPeña, J.M., Lozano, J.A., Larrañaga, P. “An Empirical Comparison of Four Initialization Methods for the K-Means Algorithm”. Dept. of Computer Science and Artificial Intelligence, University of the Basque, San Sebastian, España.spa
dc.relation.referencesR. Prasad, C. Dovrolis, M. Murray, K. Claffy, Bandwidth estimation: metrics, measurement techniques, and tools, IEEE Network 17 (6) (2003) 27–35. [Consultado: 10 de mayo de 2010].spa
dc.relation.referencesSanchez, “Algoritmos de agrupamiento”. No registra. [En línea]. Disponible: http://omarsanchez.net/Documents/Agrupamiento_kmeans.pdf [Consultado: 21 de abril de 2010].spa
dc.relation.referencesSeetharam Samptur. “Available bandwidth inference based on node-centric clusters”. Abril de 2009. [En línea]. Disponible: http://citeecer.ist.psu.edu [Consultado: 19 de abril de 2010].spa
dc.relation.referencesShriram, Murray, Hyun, Brownlee, Broido, Fomenkov, kc claffy “Comparison of Public End-to-End BandwidthEstimation Tools on High-Speed Links. 2005.spa
dc.relation.referencesSPSS, Inc. Headquarters, Chicago, Illinois. http://www.spss.com/es/spa
dc.contributor.cvlachttps://scienti.minciencias.gov.co/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0000809357*
dc.contributor.googlescholarhttps://scholar.google.es/citations?hl=es#user=_YgBOOcAAAAJ*
dc.contributor.scopushttps://www.scopus.com/authid/detail.uri?authorId=23094317500*
dc.subject.lembIngeniería de sistemasspa
dc.subject.lembSistemas de comunicación de banda anchaspa
dc.subject.lembAlgoritmosspa
dc.subject.lembComputadoresspa
dc.subject.lembInvestigacionesspa
dc.description.abstractenglishThis project is framed within the Telematics research line of the information technology research group of the UNAB, the objective of which was to implement in C language a clustering algorithm in the Traceband bandwidth estimator and evaluate the impact of the algorithm on regarding the accuracy of the estimate compared to the original program, in a controlled scenario that emulates the behavior of a network on the internet. To achieve this, first the study of clustering mechanisms is approached and thus determine the one that best suits the problem of estimating the available bandwidth, then the Traceband code will be studied, both in the Sender and the Receiver, to determine the point at which the selected clustering technique has to be applied. After having defined the above, the clustering code will be implemented in C language and the estimation will be tested on an evaluation testbed; and thus observe the effectiveness of the implemented algorithm by testing with different types and amounts of cross traffic. For the tests, a network infrastructure is created that allows evaluating available bandwidth estimators by simulating the behavior of the internet (Testbed). In this infrastructure, the Traceband with and without the K-means is evaluated, using Mgen for the generation of traffic. Estimating the available bandwidth is a problem studied by researchers worldwide given the need to have this information to improve the operation of various network applications such as compliance with service level agreements, network management, engineering real-time traffic and resource provisioning, flow control and congestion, rapid fault detection, network attacks and admission control [3]. The implementation of K-means in the Traceband, allows to determine, in which way the grouping of the estimation data, can help to improve the accuracy of the estimation of the available bandwidth in a network infrastructure. Adding the benefits it provides, being able to know and manage these critical factors, which are relevant to the performance of the network and the services it provides. Actualmente dentro de la bibliografía revisada, no se encuentra registro de la implementación de una técnica de clustering, dentro de una herramienta de estimación de ancho de banda disponible, como Traceband. Esto contrasta con la gran cantidad de trabajos y contribuciones realizados, en la implementación y uso de las técnicas de clustering en varias áreas de la ciencia; siendo muy efectivas a la hora del análisis de los resultadoseng
dc.subject.proposalTécnica de clusteringspa
dc.subject.proposalInfraestructura de redspa
dc.subject.proposalAncho de banda Tracebandspa
dc.subject.proposalSoftware librespa
dc.rights.creativecommonsAtribución-NoComercial-SinDerivadas 2.5 Colombia*


Files in this item

Thumbnail
Thumbnail

This item appears in the following Collection(s)

Show simple item record

Atribución-NoComercial-SinDerivadas 2.5 Colombia
Except where otherwise noted, this item's license is described as Atribución-NoComercial-SinDerivadas 2.5 Colombia