dc.contributor.advisor | Guerrero Santander, César Darío | spa |
dc.contributor.author | Salcedo Morillo, Dixon David | spa |
dc.date.accessioned | 2020-06-26T21:34:54Z | |
dc.date.available | 2020-06-26T21:34:54Z | |
dc.date.issued | 2011 | |
dc.identifier.uri | http://hdl.handle.net/20.500.12749/3467 | |
dc.description.abstract | Este proyecto está enmarcado dentro de la línea de investigación en Telemática del grupo de investigación en tecnologías de la información de la UNAB se planteo como objetivo implementar en lenguaje C un algoritmo de clustering en el estimador de ancho de banda Traceband y evaluar impacto del algoritmo en cuanto a la exactitud en la estimación comparada con el programa original, en un escenario controlado que emule el comportamiento de una red en la internet. Para lograr esto, primero se aborda el estudio de mecanismos de clustering y así determinar el que más se ajuste a la problemática de estimación de ancho de banda disponible, después se estudiará el código de Traceband, tanto en el Sender como el Receiver, para determinar el punto en el cual de tiene que aplicar la técnica de clustering seleccionada. Después de tener definido lo anterior, se implementará el código de clustering en lenguaje C y probar la estimación sobre un testbed de evaluación; y así observar la efectividad del algoritmo implementado haciendo pruebas con diferente tipo y cantidad de tráfico cruzado. Para las pruebas, se crea una infraestructura de red que permite evaluar estimadores de ancho de banda disponibles simulando el comportamiento del internet (Testbed). En dicha infraestructura, se evalúa, el Traceband con y sin el K-means, utilizando Mgen para la generación de tráfico.
El estimar el ancho de banda disponible es un problema estudiando por investigadores a nivel mundial dada la necesidad de contar con esta información para mejorar la operación de varias aplicaciones de red tales como el cumplimiento de los acuerdos de nivel de servicio, gestión de redes, ingeniería de tráfico y en tiempo real de los recursos de aprovisionamiento, control de flujo y congestión, la detección rápida de fallas, ataques de red y control de admisión [3].
La implementación del K-means en el Traceband, permite determinar, de que manera la agrupación de los datos de la estimación, puede ayudar a mejorar la exactitud de la estimación del ancho de banda disponible en una infraestructura de red. Adicionando los beneficios que provee, el poder conocer y administrar estos factores críticos, que son relevantes en el rendimiento de la red y los servicios que ésta brinda.
Actualmente dentro de la bibliografía revisada, no se encuentra registro de la implementación de una técnica de clustering, dentro de una herramienta de estimación de ancho de banda disponible, como Traceband. Esto contrasta con la gran cantidad de trabajos y contribuciones realizados, en la implementación y uso de las técnicas de clustering en varias áreas de la ciencia; siendo muy efectivas a la hora del análisis de los resultados | spa |
dc.description.sponsorship | Universitat Oberta de Catalunya UOC | spa |
dc.description.tableofcontents | INTRODUCCIÓN 13
1. CONTEXTO DE LA INVESTIGACIÓN 15
1.1 Tema 15
1.2 Definición del problema 15
1.3 Objetivos 17
2. ESTADO DEL ARTE 18
3. FUNDAMENTOS TEÓRICOS 23
3.1 Ancho de banda, Bandwidth en inglés 23
3.1.1 Definición 23
3.1.2 Ancho de Banda Disponible 23
3.1.3 Ancho de banda disponible de extremo a extremo (end to end) 25
3.2 Técnicas de estimación de ancho de banda disponible 27
3.2.1 Métodos PRM (packet rate method) 27
3.2.2 Métodos PGM (packet gap method) 28
3.3 Herramientas de estimación de ancho de banda Disponible (ABETT’S) 31
3.4 Modelo de las cadenas ocultas de markov aplicadas a las
herramientas de estimación de ancho de banda (HMM) 33
3.4.1 Definición 33
3.4.2 Aplicaciones 35
3.5 Algoritmos de clustering y sus aplicaciones 38
3.5.1 Definición 38
3.5.2 Algoritmos de agrupamiento 38
3.5.3 Aplicabilidad 39
3.5.4 APRENDIZAJE DE MÁQUINA. 39
3.5.4.1 Aprendizaje supervisado 40
3.5.4.2 Aprendizaje no supervisado 40
3.5.5 K-means 41
3.5.5.1 Inconvenientes 43
3.5.6 Aplicación real de los algoritmos de clustering en herramientas de
estimación de ancho de banda disponible 44
3.6 Testbed 45
3.6.1 Definición 45
4. METODOLOGÍA APLICADA 48
4.1 Clustering 48
4.1.1 Clustering Probabilístico 50
4.1.2 Métodos de los k-vecinos (k-medoids) 52
4.1.3 Algoritmo Basado en Densidad 54
4.1.4 Método de las k-medias (K-means) 55
4.1.4.1 Descripción del algoritmo K-means estándar 56
4.2 Algoritmo a utilizar dentro del estimador 58
4.2.1 Implementación del algoritmo 62
4.2.2 Operatividad del k-means en el Traceband 62
5. IMPLEMENTACIÓN DE LA SOLUCIÓN 66
5.1 Instalación las herramientas 66
5.1.1 MGEN 66
5.1.2 Traceband 68
5.2 Descripción del testbed 70
5.3 Diseño de los experimentos 72
5.4 Métricas utilizadas 73
5.4.1 Tiempo de estimación 73
5.4.2 Overhead 73
5.4.3 Error de estimación 73
5.4.4 Ancho de banda disponible con K-means 73
5.5 Procesamiento de la información 74
6. RESULTADOS 76
7. CONCLUSIONES 87
7.1 Traceband con HMM 87
7.2 Traceband con K-means 88
7.3 Traceband con HMM vs Traceband con K-means 89
8. REFERENCIAS BIBLIOGRÁFICAS 91 | spa |
dc.format.mimetype | application/pdf | spa |
dc.language.iso | spa | spa |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/2.5/co/ | * |
dc.title | Implementación y evaluación de un algoritmo de clustering en un estimador de ancho de banda disponible | spa |
dc.title.translated | Implementation and evaluation of a clustering algorithm in an available bandwidth estimator | eng |
dc.degree.name | Magíster en Software Libre | spa |
dc.coverage | Bucaramanga (Colombia) | spa |
dc.publisher.grantor | Universidad Autónoma de Bucaramanga UNAB | spa |
dc.rights.local | Abierto (Texto Completo) | spa |
dc.publisher.faculty | Facultad Ingeniería | spa |
dc.publisher.program | Maestría en Software Libre | spa |
dc.description.degreelevel | Maestría | spa |
dc.type.driver | info:eu-repo/semantics/masterThesis | |
dc.type.local | Tesis | spa |
dc.type.coar | http://purl.org/coar/resource_type/c_bdcc | |
dc.subject.keywords | Clustering technique | eng |
dc.subject.keywords | Network infrastructure | eng |
dc.subject.keywords | Traceband bandwidth | eng |
dc.subject.keywords | Free software | eng |
dc.subject.keywords | Systems engineer | eng |
dc.subject.keywords | Broadband communication systems | eng |
dc.subject.keywords | Algorithms | eng |
dc.subject.keywords | Computers | eng |
dc.subject.keywords | Research | eng |
dc.identifier.instname | instname:Universidad Autónoma de Bucaramanga - UNAB | spa |
dc.identifier.reponame | reponame:Repositorio Institucional UNAB | spa |
dc.type.hasversion | info:eu-repo/semantics/acceptedVersion | |
dc.rights.accessrights | info:eu-repo/semantics/openAccess | spa |
dc.rights.accessrights | http://purl.org/coar/access_right/c_abf2 | spa |
dc.relation.references | Salcedo Morillo, Dixon David, Guerrero Santander, Cesar Darío (2011). Implementación y evaluación de un algoritmo de clustering en un estimador de ancho de banda disponible. Bucaramanga (Colombia) : Universidad Autónoma de Bucaramanga UNAB, Universitat Oberta de Catalunya UOC | spa |
dc.relation.references | A.K. Jain, M.N. Murty, P.J. Flynn. “Data Clustering: A Review”, Sept, 1999. [En línea]. Disponible: en: http://www.docstoc.com/docs/19887391/Data-Clustering-A-Review. | spa |
dc.relation.references | Bottou, L., Bengio, Y. Convergence Properties of the K-means Algorithms. Advances in Neural Information Processing”. Systems. MTI Press, 1995. | spa |
dc.relation.references | C. Blake, D. Katabi, S. Katti, “Cross-Traffic: Noise or Data?” Computer Science and Artificial Intelligence Laboratory@MIT, No registra. [En línea]. Disponible: http://nms.lcs.mit.edu/~dina/pub/multiQ.pdf. [Consultado: 10 de mayo de 2010]. | spa |
dc.relation.references | C. Guerrero, "Traceband: Available Bandidth Estimation based on a Hidden Markov Model", Ph.D. dissertation, Murdoch University, Murdoch, WA, Australia, 1999.tesis de la University of South Florida., FL, EEUU, 2009. | spa |
dc.relation.references | Carrasquilla Marín, Ulloque Rodríguez, Guerrero Cesar, “Evaluación de técnicas de medición de ancho de Banda disponible “abet’s” http://www.colombiaaprende.edu.co/html/mediateca/1607/articles-109353_archivo.pdf#page=86 | spa |
dc.relation.references | Cesar Guerrero, Miguel A Labrador, "On the Applicability of Available Bandwidth Estimation Techniques and Tools". En: Estados Unidos Computer Communications, ISSN: 0140-3664 ed: v.33 fasc.1 p.11 - 22, 2010[Consultado: 22 de abril de 2010]. | spa |
dc.relation.references | Cesar Guerrero, Miguel A. Labrador, "Traceband: A fast, low overhead and accurate tool for available bandwidth estimation and monitoring". En: Estados Unidos Computer Networks-The International Journal Of Computer And Telecommunications Networking, ISSN: 1389-1286 ed: v.54 fasc.6 p.977 - 990, 2010. [Consultado: 20 de abril de 2010]. | spa |
dc.relation.references | Cristina García Cambronero, Irene Gómez Moreno, “Algoritmos de aprendizaje: KNN & KMEANS”. 14/12/2008. [En línea]. Disponible: www.it.uc3m.es/jvillena/irc/practicas/08-09/06.pdf [Consultado: 20 de mayo de 2010]. | spa |
dc.relation.references | DUBES, R. C. 1987. How many clusters are best?—an experiment. Pattern Recogn. 20, 6 (Nov. 1, 1987), 645–663. | spa |
dc.relation.references | Duda, R.O., Hart, P.E.: Pattern Classification and Scene Analysis. John Wiley & Sons, New York, NY. 1973. | spa |
dc.relation.references | E. Hernández, “Algoritmo de clustering basado en entropía para descubrir grupos en atributos de tipo mixto”, agosto de 2006. [En línea]. Disponible: http://www.cs.cinvestav.mx/Estudiantes/TesisGraduados/2006/tesisEdnaHernandez.pdf. Consultado: [5 de enero de 2011]. | spa |
dc.relation.references | Fayyad,U. M., Piatetsky-Shapiro, G., Smyth P., Uthurusamy, R.: Advances in Knowledge Discovery and Data Mining. AAAI/MIT Press, 1996. | spa |
dc.relation.references | Filtro K-means (K-Medias). [Web en línea]. Disponible en: <http://celtico-celtico.blogspot.com/>. | spa |
dc.relation.references | Fisher, D.: Knowlwdge Acquisition via Incremental Conceptual Clustering. Machine Learning, Vol. 2, No. 2 (1987) 139-172. | spa |
dc.relation.references | Garre, Cuadrado, Sicilia, “Comparación de diferentes algoritmos de clustering en la estimación de coste en el desarrollo de software,” Universidad del País Vasco, 23 Jun 2005. [En línea]. Disponible: http://www.sc.ehu.es/jiwdocoj/remis/docs/GarreAdis05.pdf. [Consultado: 3 de mayo de 2010]. | spa |
dc.relation.references | Google imágenes, [Documento en línea]. Disponible en: <http://www.google.com.co/imgres?imgurl=http://bp0.blogger.com/_FZfs7LCzurk /RbWgQZC04NI/AAAAAAAAADA/8v2zl6wbIB4/s400/flowchart.jpg> | spa |
dc.relation.references | Gustavo Mesa, “Cadenas de markov, una sencilla Aplicación”. Mayo de 2007. [En línea]. Disponible: http://www.revistamemorias.com/articulos9/cadenasdemarkov.pdf [Consultado: 23 de junio de 2010]. | spa |
dc.relation.references | Hamerly, G., Elkan, C. “Alternatives to the K-means Algorithm that Find Better Clusterings”. Proc. 11th International Conf. On Information and Knowledge Management CIKM’02. ACM. Virginia, USA (2002). | spa |
dc.relation.references | Implementación-de-k-means-en-opencv. [Web en línea]. Disponible en: <reyesalfonso.blogspot.com/.../implementacion-de-k-means-en-opencv.html>. | spa |
dc.relation.references | J. Pérez, M. F. Henriques, R. Pazos, L. Cruz3, G. Reyes, J. Salinas, A. Mexicano “Mejora al algoritmo de agrupamiento K-means mediante un nuevo criterio de convergencia y su aplicación a bases de datos poblacionales de cáncer”. Centro Nacional de Investigación y Desarrollo Tecnológico (CENIDET), México, Secretaría de Saúde do Estado de Pernambuco, Brasil, Instituto Tecnológico de Ciudad Madero, México. | spa |
dc.relation.references | Julián Moreno, “Aprendizaje de máquina”. No registra. [En línea]. Disponible: http://pisis.unalmed.edu.co/cursos/material/3004653/1/Presentacion.ppt [Consultado: 18 de abril de 2010]. | spa |
dc.relation.references | Kanungo, T., Mount, D.M., Netanyahu, N.S., Piatko, C.D., Silverman, R., Wu, A.Y.: A “Local Search Approximation Algorithm for k-Means Clustering” Proc. 18th Annual ACM Symposium on Computational Geometry (SoCG’02). Barcelona, Spain (2002) 10-18. | spa |
dc.relation.references | Kanungo, T., Netanyahu, N.S., Wu, A.Y.: “An Efficient Kmeans Clustering Algorithm: Analysis and Implementation. IEEE Transactions on Pattern Analysis and Machine Intelligence”, Vol. 24, No. 7 (2002). | spa |
dc.relation.references | K-means_clustering Disponible en: <http://en.wikipedia.org/wiki/K-means_clustering> | spa |
dc.relation.references | K-Mediods. Disponible en internet: <http://en.wikipedia.org/wiki/K-medoids> | spa |
dc.relation.references | L.R. Rabiner, “A tutorial on hidden markov models and selected applications in speech recognition”, Proceedings of the IEEE 77 (2) (1989) 257–286. | spa |
dc.relation.references | Lakshminarayanan, Padmananbhan, Padhye, “Estimaciones del Ancho de Banda en redes de Banda Ancha”, Instituto de Ingeniería Eléctrica, No registra. [En línea]. Disponible: http://iie.fing.edu.uy/ense/asign/perfredes/trabajos/trabajos_2004/EstimacionBW/EstimacionBW.pdf. [Consultado: 8 de mayo de 2010]. | spa |
dc.relation.references | López Yoel, “Evaluación de técnicas de estimación de ancho de banda disponible en una red de computadoras”. Mayo de 2010. [Archivo PDF]. [Consultado: 20 de mayo de 2010] | spa |
dc.relation.references | M. Zorrilla, “Procesamiento Paralelo y Distribuido Aplicado al Almacenamiento y Recuperación de Información Documental”, 2001. [En línea]. Disponible: http://www.tesisenred.net/TESIS_UC/AVAILABLE/TDR-0927110-130601//TesisMZP.pdf. Consultado: [3 de enero de 2011]. | spa |
dc.relation.references | MacQueen, J.: Some Methods for Classification and Analysis of Multivariate Observations. Proc. 5th Berkeley Symp. Math. Statistics and Probability, 1:281-297, 1967. | spa |
dc.relation.references | Martínez Francisco., Quetglás Gregorio. “Introducción a la programación estructurada en C.” Maite Simon, 2003. [E-book] Disponible en: http://books.google.es/ | spa |
dc.relation.references | Mehmed, K.: Data Mining: Concepts, Models, Methods, and Algorithms. John Wiley & Sons. 2003. | spa |
dc.relation.references | MGen. [Web en línea]. Disponible en: <http://celtico-celtico.blogspot.com/>. | spa |
dc.relation.references | O. Sánchez, Algunos métodos para medir distancias a los centroides, [En línea]. Disponible: http://omarsanchez.net/Documents/distancias_totales.pdf [Consultado: 22 de diciembre de 2010]. | spa |
dc.relation.references | O. Sánchez. “Modelos, Control y sistema de visión”, [Web en línea]. Disponible en: <http://omarsanchez.net/kmeans.aspx>. | spa |
dc.relation.references | Paola Bermolen, “Ancho de Banda Efectivo para Flujos Markovianos” http://www.fing.edu.uy/iie/investigacion/grupos/artes/publicaciones/Paola.pdf | spa |
dc.relation.references | Pelleg, D., Moore, A.: X-means: “Extending K-means with Efficient Estimation of the Number of Clusters”. Proc. 17th International Conf. on Machine Learning (2000). | spa |
dc.relation.references | Peña, J.M., Lozano, J.A., Larrañaga, P. “An Empirical Comparison of Four Initialization Methods for the K-Means Algorithm”. Dept. of Computer Science and Artificial Intelligence, University of the Basque, San Sebastian, España. | spa |
dc.relation.references | R. Prasad, C. Dovrolis, M. Murray, K. Claffy, Bandwidth estimation: metrics, measurement techniques, and tools, IEEE Network 17 (6) (2003) 27–35. [Consultado: 10 de mayo de 2010]. | spa |
dc.relation.references | Sanchez, “Algoritmos de agrupamiento”. No registra. [En línea]. Disponible: http://omarsanchez.net/Documents/Agrupamiento_kmeans.pdf [Consultado: 21 de abril de 2010]. | spa |
dc.relation.references | Seetharam Samptur. “Available bandwidth inference based on node-centric clusters”. Abril de 2009. [En línea]. Disponible: http://citeecer.ist.psu.edu [Consultado: 19 de abril de 2010]. | spa |
dc.relation.references | Shriram, Murray, Hyun, Brownlee, Broido, Fomenkov, kc claffy “Comparison of Public End-to-End BandwidthEstimation Tools on High-Speed Links. 2005. | spa |
dc.relation.references | SPSS, Inc. Headquarters, Chicago, Illinois. http://www.spss.com/es/ | spa |
dc.contributor.cvlac | Guerrero Santander, César Darío [0000809357] | spa |
dc.contributor.googlescholar | Guerrero Santander, César Darío [_YgBOOcAAAAJ] | spa |
dc.contributor.orcid | Guerrero Santander, César Darío [0000-0002-3286-6226] | spa |
dc.contributor.scopus | Guerrero Santander, César Darío [23094317500] | spa |
dc.contributor.researchgate | Guerrero Santander, César Darío [Cesar-Guerrero-2] | spa |
dc.subject.lemb | Ingeniería de sistemas | spa |
dc.subject.lemb | Sistemas de comunicación de banda ancha | spa |
dc.subject.lemb | Algoritmos | spa |
dc.subject.lemb | Computadores | spa |
dc.subject.lemb | Investigaciones | spa |
dc.description.abstractenglish | This project is framed within the Telematics research line of the information technology research group of the UNAB, the objective of which was to implement in C language a clustering algorithm in the Traceband bandwidth estimator and evaluate the impact of the algorithm on regarding the accuracy of the estimate compared to the original program, in a controlled scenario that emulates the behavior of a network on the internet. To achieve this, first the study of clustering mechanisms is approached and thus determine the one that best suits the problem of estimating the available bandwidth, then the Traceband code will be studied, both in the Sender and the Receiver, to determine the point at which the selected clustering technique has to be applied. After having defined the above, the clustering code will be implemented in C language and the estimation will be tested on an evaluation testbed; and thus observe the effectiveness of the implemented algorithm by testing with different types and amounts of cross traffic. For the tests, a network infrastructure is created that allows evaluating available bandwidth estimators by simulating the behavior of the internet (Testbed). In this infrastructure, the Traceband with and without the K-means is evaluated, using Mgen for the generation of traffic.
Estimating the available bandwidth is a problem studied by researchers worldwide given the need to have this information to improve the operation of various network applications such as compliance with service level agreements, network management, engineering real-time traffic and resource provisioning, flow control and congestion, rapid fault detection, network attacks and admission control [3].
The implementation of K-means in the Traceband, allows to determine, in which way the grouping of the estimation data, can help to improve the accuracy of the estimation of the available bandwidth in a network infrastructure. Adding the benefits it provides, being able to know and manage these critical factors, which are relevant to the performance of the network and the services it provides.
Actualmente dentro de la bibliografía revisada, no se encuentra registro de la implementación de una técnica de clustering, dentro de una herramienta de estimación de ancho de banda disponible, como Traceband. Esto contrasta con la gran cantidad de trabajos y contribuciones realizados, en la implementación y uso de las técnicas de clustering en varias áreas de la ciencia; siendo muy efectivas a la hora del análisis de los resultados | eng |
dc.subject.proposal | Técnica de clustering | spa |
dc.subject.proposal | Infraestructura de red | spa |
dc.subject.proposal | Ancho de banda Traceband | spa |
dc.subject.proposal | Software libre | spa |
dc.type.redcol | http://purl.org/redcol/resource_type/TM | |
dc.rights.creativecommons | Atribución-NoComercial-SinDerivadas 2.5 Colombia | * |
dc.contributor.publons | Guerrero Santander, César Darío [cesar-d-guerrero] | spa |
dc.coverage.campus | UNAB Campus Bucaramanga | spa |
dc.description.learningmodality | Modalidad Presencial | spa |
dc.contributor.linkedin | Guerrero Santander, César Darío [cguerrer] | |