dc.contributor.advisor | Calderón Benavides, Maritza Liliana | spa |
dc.contributor.author | Sánchez Pérez, Andrea Paola | spa |
dc.coverage.spatial | Colombia | spa |
dc.date.accessioned | 2020-12-15T20:05:35Z | |
dc.date.available | 2020-12-15T20:05:35Z | |
dc.date.issued | 2020-11-06 | |
dc.identifier.uri | http://hdl.handle.net/20.500.12749/11937 | |
dc.description.abstract | Este trabajo presenta el resultado de un estudio de la situación académica colombiana basado en el análisis de los resultados de las pruebas estandarizadas SABER 11. A partir de la revisión de la información obtenida de las bases de datos del ICFES, donde se encuentran publicados los resultados históricos de las pruebas que se han aplicado a los estudiantes colombianos de último grado de formación media en el período 2015-2019; se realiza un análisis descriptivo de los resultados por medio de la aplicación de técnicas de minería de datos y de la metodología CRISP-DM (Cross Industry Standard Process for Data Mining), realizando la preparación, comprensión, selección y modelado de datos; permitiendo de esta manera, identificar tendencias, variables personales, académicas, socioeconómicas y familiares que influyen directamente en el desempeño académico de los estudiantes; adicionalmente, con el modelamiento realizado se identifican cuatro clústeres o grupos basados en características similares encontradas.
Se desarrolla una herramienta de visualización que incluye mapas interactivos de Colombia, que presentan la información analizada de forma dinámica y permiten la comprensión geográfica de la misma a nivel regional, departamental y municipal; tanto del total de la población de estudio como de la población de evaluados perteneciente a grupos étnicos. | spa |
dc.description.tableofcontents | INTRODUCCIÓN ................................................................................................. 16
1. FORMULACIÓN DE LA INVESTIGACIÓN ............................................................ 17
1.1. PLANTEAMIENTO DEL PROBLEMA ................................................................... 17
1.2. JUSTIFICACIÓN....................................................................................................... 19
1.3. PREGUNTA DE INVESTIGACIÓN ....................................................................... 20
1.4. OBJETIVOS .............................................................................................................. 20
1.4.1. Objetivo general ................................................................................................... 20
1.4.2. Objetivos específicos .......................................................................................... 20
2. REVISIÓN BIBLIOGRÁFICA Y MARCO TEÓRICO ............................................. 21
2.1. ESTADO DEL ARTE ................................................................................................ 21
2.1.1. Análisis de la situación académica en el mundo ............................................ 21
2.1.2. Análisis de la situación académica en Colombia............................................ 22
2.2. MARCO TEÓRICO................................................................................................... 26
2.2.1. ICFES y evaluación de la educación ................................................................ 26
2.2.2. Minería de datos .................................................................................................. 28
2.2.3. Metodología CRISP-DM ..................................................................................... 30
2.2.4. Mapas interactivos ............................................................................................... 32
2.3. MARCO TECNOLÓGICO ....................................................................................... 33
2.3.1. Procesamiento y modelado de datos: KNIME ................................................ 33
2.3.2. Herramienta de visualización: Tableau ............................................................ 34
3. DISEÑO METODOLÓGICO...................................................................................... 36
7
4. PROPUESTA Y ANÁLISIS DE RESULTADOS ..................................................... 38
4.1. COMPRENSIÓN DEL NEGOCIO ........................................................................... 38
4.2. ENTENDIMIENTO DE LOS DATOS ..................................................................... 41
4.2.1. Recolección de datos.......................................................................................... 41
4.2.2. Descripción del conjunto de datos .................................................................... 42
4.2.3. Descripción de atributos ..................................................................................... 48
4.2.4. Exploración de datos .......................................................................................... 55
4.2.5. Verificación de la calidad de los datos ............................................................. 60
4.2.6. Selección de datos .............................................................................................. 61
4.2.7. Limpieza de datos ............................................................................................... 62
4.3. SELECCIÓN DE TÉCNICA DE MODELADO ....................................................... 63
4.4. MODELAMIENTO Y EVALUACIÓN ....................................................................... 63
4.5. DESARROLLO DE LA HERRAMIENTA DE VISUALIZACIÓN .......................... 76
4.5.1. Visualización de mapa población general ....................................................... 76
4.5.2. Visualización de mapa por etnias ..................................................................... 82
4.5.3. Visualización de estadísticas ............................................................................. 84
4.6. ANÁLISIS DE LA SITUACIÓN ACADÉMICA COLOMBIANA ............................ 85
4.6.1. Población nacional .............................................................................................. 85
4.6.2. Población perteneciente a grupos étnicos ...................................................... 92
4.7. IMPACTO DEL PROYECTO .................................................................................... 96
5. CONCLUSIONES ....................................................................................................... 98
6. RECOMENDACIONES Y TRABAJOS FUTUROS ............................................... 99
REFERENCIAS BIBLIOGRÁFICAS ............................................................................. 100 | spa |
dc.format.mimetype | application/pdf | spa |
dc.language.iso | spa | spa |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/2.5/co/ | * |
dc.title | Mapa de la situación académica colombiana a través del análisis de las bases de datos del ICFES | spa |
dc.title.translated | Map of the Colombian academic situation through the analysis of the ICFES databases | spa |
dc.degree.name | Magíster en Gestión, Aplicación y Desarrollo de Software | spa |
dc.publisher.grantor | Universidad Autónoma de Bucaramanga UNAB | spa |
dc.rights.local | Abierto (Texto Completo) | spa |
dc.publisher.faculty | Facultad Ingeniería | spa |
dc.publisher.program | Maestría en Gestión, Aplicación y Desarrollo de Software | spa |
dc.description.degreelevel | Maestría | spa |
dc.type.driver | info:eu-repo/semantics/masterThesis | |
dc.type.local | Tesis | spa |
dc.type.coar | http://purl.org/coar/resource_type/c_bdcc | |
dc.subject.keywords | Systems engineer | eng |
dc.subject.keywords | Software development | eng |
dc.subject.keywords | Colombian academic situation | eng |
dc.subject.keywords | Icfes databases | eng |
dc.subject.keywords | Saber 11 | eng |
dc.subject.keywords | Interactive map | eng |
dc.subject.keywords | Data mining | eng |
dc.subject.keywords | Academic assessment | eng |
dc.subject.keywords | Academic performance | eng |
dc.subject.keywords | Database administration | eng |
dc.identifier.instname | instname:Universidad Autónoma de Bucaramanga - UNAB | spa |
dc.identifier.reponame | reponame:Repositorio Institucional UNAB | spa |
dc.type.hasversion | info:eu-repo/semantics/acceptedVersion | |
dc.rights.accessrights | info:eu-repo/semantics/openAccess | spa |
dc.rights.accessrights | http://purl.org/coar/access_right/c_abf2 | spa |
dc.relation.references | Blanco, V. (2015a). Análisis del desempeño académico del examen de estado para el ingreso a la educación superior aplicando minería de datos. Tesis, Universidad Nacional de Colombia. | spa |
dc.relation.references | Blanco, V. (2015b). Minería de datos en el contexto educativo colombiano: Prueba SABER 11: Mapa Departamento del Cesar. Obtenido de https://sites.google.com/site/mineriadedatossaber11/ | spa |
dc.relation.references | Chapman, P., Clinton, J., Kerber, R., Khabaza, T., Reinartz, T., Shearer, C., & Wirth, R. (2000). CRISP-DM 1.0 Step-by-step data mining guide. Obtenido de https://www.the-modeling-agency.com/crisp-dm.pdf | spa |
dc.relation.references | Chávez, D. (2019). Minería de datos para mejorar la educación. Crónica mx. Recuperado el 4 de Enero de 2020, de http://www.cronica.com.mx/notas/2019/1111239.html | spa |
dc.relation.references | Consejo Nacional de Política Económica y Social - CONPES. (2018). Documento CONPES 3920. Bogotá. Obtenido de https://colaboracion.dnp.gov.co/CDT/Conpes/Econ%C3%B3micos/3920.pdf | spa |
dc.relation.references | Departamento Nacional de Planeación. (2019). Bases del Plan Nacional de Desarrollo 2018-2022 – Pacto por Colombia, Pacto por la Equidad. | spa |
dc.relation.references | European Data Protection Supervisor. (2014). Report of workshop on Privacy, Consumers, Competition and Big Data. Bruselas. Obtenido de https://secure.edps.europa.eu/EDPSWEB/webdav/site/mySite/shared/Documents | spa |
dc.relation.references | Gaviria, C. F., & Posada, H. M. (2019). Exposición a la contaminación y rendimiento escolar: Evidenciaen los resultados de las pruebas Saber 11 en Colombia. Universidad de Antioquia, Medellín. Recuperado el 16 de marzo de 2020, de https://www.icfes.gov.co/documents/20143/1645080/1+-+Exposicion+a+la+contaminacion+y+rendimiento+escolar+Evidencia+en+los+resultados+de+las+pruebas+Saber+11+en+Colombia.pdf/2187d0b0-634f-a27d-a453-5cb3d1390778 | spa |
dc.relation.references | Gobernación de Amazonas. (2019). Amazonas avanza, Encuentro regional SABER 2019. Leticia. Recuperado el Noviembre de 2019, de 101 http://www.amazonas.gov.co/noticias/amazonas-avanza-encuentro-regional-saber-2019-en-leticia | spa |
dc.relation.references | ICFES. (2015a). Informe Nacional de Resultados: Colombia en PISA 2015. | spa |
dc.relation.references | ICFES. (2015b). Información General Divulgación. Obtenido de https://www2.icfes.gov.co/en/web/guest/informacion-general-divulgacio | spa |
dc.relation.references | ICFES. (2017a). Datos abiertos: Visualizaciones de los Mejores Conjuntos. Obtenido de https://herramientas.datos.gov.co/es/blog/visualizaciones-de-los-mejores-conjuntos | spa |
dc.relation.references | ICFES. (2017b). Reporteador de históricos. Recuperado el Diciembre de 2019, de http://www2.icfesinteractivo.gov.co/historicos | spa |
dc.relation.references | ICFES. (2018a). Consulta de reportes por entidad territorial. Recuperado el Enero de 2020, de ttp://www2.icfesinteractivo.gov.co/ReportesSaber359/consultaReporteEntidadTerritorial.jspx | spa |
dc.relation.references | ICFES. (2018a). Diccionario de variables saber 11 periodo 20142-20182. Obtenido de https://icfesgovco-my.sharepoint.com/personal/dataicfes_icfes_gov_co/Documents/DataIcfes/4.%20Saber11/2.%20Documentaci%C3%B3n/1.%20Saber11/2.%20Diccionarios%20Saber11/Diccionario%20Saber11%202014-2%20a%202018-2.pdf | spa |
dc.relation.references | ICFES. (2018b). Documentación del examen SABER 11. | spa |
dc.relation.references | ICFES. (2018c). Informes de Resultados de invesigaciones ICFES. Recuperado el 16 de marzo de 2020, de https://www.icfes.gov.co/web/guest/resultados-de-investigaciones-2017 | spa |
dc.relation.references | ICFES. (2019). Informe nacional de resultados del examen saber 11° 2018. Bogotá. Recuperado el 15 de marzo de 2020, de https://www.icfes.gov.co/documents/20143/1711757/Informe%20nacional%20resultados%20examen%20saber%2011-%202018.pdf | spa |
dc.relation.references | ICFES. (2019c). Diccionario de variables SABER 11° periodo 20191-20192. Obtenido de https://icfesgovcomy.sharepoint.com/personal/dataicfes_icfes_gov_co/_layouts/15/onedrive.aspx?ct=1589295914045&or=OWA%2DNT&cid=27943174%2D8b52%2Deb60%2Dc2bf%2Dfd8870b02519&originalPath=aHR0cHM6Ly9pY2Zlc2dvdmNvLW15LnNoYXJlcG9pbnQuY29tLzpmOi9nL3BlcnNvbmFsL | spa |
dc.relation.references | ICFES. (2020a). Bases de datos del ICFES. Recuperado el 2019, de ftp://200.41.6.169/ | spa |
dc.relation.references | ICFES. (2020b). Icfes resultados SABER. Obtenido de https://www.icfes.gov.co/resultados-saber-11 | spa |
dc.relation.references | ICFES-Ministerio de Educaión Nacional. (2019). ¿Cómo se construye el Índice de Nivel Socioeconómico (INSE) en el contexto de las pruebas Saber? SABER al detalle. Obtenido de https://www.icfes.gov.co/documents/20143/1519705/Edicion%204%20-%20boletin%20saber%20al%20detalle.pdf | spa |
dc.relation.references | Jiménez, J. (2018). Minería de datos educativos: análisis de los factores económicos, sociales y demográficos que influyen en el desempeño de las pruebas saber-pro en estudiantes de ingeniería en Antioquia. Universidad Pontificia Bolivariana, Medellín. | spa |
dc.relation.references | KNIME A.G. (2020). Chapter 1. KNIME Analytics Platform: an Overview. Obtenido de https://www.knime.com/knime-introductory-course/chapter1 | spa |
dc.relation.references | Koskela, A. (2016). Exploring the differences of Finnish students in Pisa 2003 and 2012 using educational datamining. Tesis, University of Jyväskylä. | spa |
dc.relation.references | Martínez, W., & Turriago, A. (2015). Análisis de distribución geográfica y espacial de los resultados de las Pruebas Saber 11 del Instituto Colombiano para el Fomento de la Educación Superior (ICFES). 2005-2012. Cuadernos Latinoamericanos de Administración, 39-49. Recuperado el Diciembre de 2019, de https://www.redalyc.org/articulo.oa?id=409643604005 | spa |
dc.relation.references | Medranda, N., Palacios, V., & Moromenacho, T. (2018). Los mapas interactivos, herramientas para la participación ciudadana. Correspondencias & Análisis(8), 277-287. doi:https://doi.org/10.24265/cian.2018.n8.1 | spa |
dc.relation.references | MinTIC. (2019). Guía para el uso y aprovechamiento de Datos. Obtenido de https://gobiernodigital.gov.co/623/articles-9407_guia_datos.pdf | spa |
dc.relation.references | Molina, I., Morales, J., & Rodríguez, S. (2019). Incidencia de las TIC en el mejoramiento de las pruebas saber 11: un análisis a partir del modelo TPACK. Bogotá. Recuperado el 16 de marzo de 2020, de https://www.icfes.gov.co/documents/20143/1645080/5+-+Incidencia+de+las+TIC+en+el+mejoramiento+de+las+pruebas+saber+11+un+analisis+a+partir+del+modelo+TPACK.pdf/0f905ba7-2e1e-ef0f-1657-6ce7234745f8 | spa |
dc.relation.references | Paredes, D. (2020). Análisis de Datos y algoritmos de predicción con R. Quito: Licencia Creative Commons Atribución-NoComercial-CompartirIgual 4.0 Internacional | spa |
dc.relation.references | Rodríguez, C., Maldonado, D., & Barrera, F. (2012). Calidad de la Educación Básica y Media en Colombia: Diagnóstico y Propuestas. Universidad de los Andes. Bogotá: Ediciones Uniandes. Recuperado el Diciembre de 2019, de https://www.researchgate.net/publication/248653287_Calidad_de_la_Educacion_Basica_y_Media_en_Colombia_Diagnostico_y_Propuestas | spa |
dc.relation.references | Romero, C., & Ventura, S. (2010). Educational Data Mining: A Review of the State of the Art. Systems, Man, and Cybernetics, Part C: Applications and Reviews, 40, 601-618. doi:10.1109/TSMCC.2010.2053532 | spa |
dc.relation.references | Roser, M., Nagdy, M., & Ortiz, E. (s.f.). Our world in data. Obtenido de Quality of Education: https://ourworldindata.org/quality-of-education | spa |
dc.relation.references | Secretaría de Educación de Bogotá. (2004). La evaluación: Una estrategia a nivel internacional para el mejoramiento de la calidad educativa. Obtenido de http://www.eduteka.org/articulos/EvaluacionBogo | spa |
dc.relation.references | Secretaría de Educación de Boyacá. (2019). Educación para la creatividad y la vida. Histórico de pruebas SAber 3-5-9-11. Años 2012-2018. Boyac | spa |
dc.relation.references | Secretaría de Educación Municipal de Santiago de Cali. (2016). Colombia-Aplicación, análisis y uso de los resultados de las pruebas SABER. Santiago de Cali. Recuperado el Noviembre de 2019, de https://planeacion.cali.gov.co/amda/index.php/catalog/24/related_materials | spa |
dc.contributor.cvlac | https://scienti.minciencias.gov.co/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0000068900 | * |
dc.contributor.googlescholar | https://scholar.google.es/citations?hl=es&user=XihGBWoAAAAJ | * |
dc.contributor.scopus | https://www.scopus.com/authid/detail.uri?authorId=15043558200 | * |
dc.contributor.researchgate | https://www.researchgate.net/profile/Liliana_Calderon-Benavides | * |
dc.subject.lemb | Ingeniería de sistemas | spa |
dc.subject.lemb | Evaluación académica | spa |
dc.subject.lemb | Rendimiento académico | spa |
dc.subject.lemb | Administración de base de datos | spa |
dc.subject.lemb | Desarrollo de software | spa |
dc.identifier.repourl | repourl:https://repository.unab.edu.co | spa |
dc.description.abstractenglish | This work presents the result of a study of the Colombian academic situation based on the analysis of the results of the SABER 11 standardized tests. Beginning with a review of the information obtained from ICFES databases, where test historical results applied to Colombian students of last year of high school between 2015 and 2019 are published; a descriptive analysis was carried out through the application of data mining techniques and the methodology for data analysis: CRISP-DM (Cross Industry Standard Process for Data Mining), which includes data preparation, data understanding, data selection and data modeling; allowing this way to identify trends in results; personal, academic, socioeconomic and family variables that influence the academic performance of students; in addition, with the perform of data modeling a cluster analysis was carried out based on attributes similarities which permitted to identify four different clusters that characterize the study population.
With this work, it was also developed a visualization tool that includes Colombian interactive maps and statistics that present the analyzed information in a dynamic way and allow the user to get a geographic understanding of the results at national, regional and city level for both the general population and population belonging to ethnic groups. | eng |
dc.subject.proposal | Situación académica colombiana | spa |
dc.subject.proposal | Saber 11 | spa |
dc.subject.proposal | Mapa interactivo | spa |
dc.subject.proposal | Minería de datos | spa |
dc.subject.proposal | Base de datos Icfes | spa |
dc.type.redcol | http://purl.org/redcol/resource_type/TM | |
dc.rights.creativecommons | Atribución-NoComercial-SinDerivadas 2.5 Colombia | * |
dc.coverage.campus | UNAB Campus Bucaramanga | spa |
dc.description.learningmodality | Modalidad Presencial | spa |