Explorando la predicción de los resultados de las pruebas de matemáticas en la provincia de Camagüey usando inteligencia artificial

Yoan Ma= rtínez-López

ymlopez= 2022@gmail.com • https://orcid.org/0000-0002-1950-567X

&n= bsp;

Heidy Cabrera Rodríguez

heidy.c= abrera@reduc.edu.cu • https://orcid.org/0009-0006-2122-4160

&n= bsp;

Olga Li= dia Pérez Gónzalez

olguita= pg@gmail.com • https://orcid.org/0000-0003-4475-814X

&n= bsp;

UNIVERSIDAD DE CAMAGÜE= Y

Carlos = de Castro Lozano

carlos@= uco.es • https://orcid.org/0000-0002-4485-6025

UNIVERSIDAD DE CÓRDOBA=

José Mi= guel Ramírez Uceda

p52rauc= j@uco.es • https://orcid.org/0000-0002-5027-7521

PLENITAS=

Ana O. = López Correoso

analope= zcorreoso@gmail.com • https://orcid.org/0000-0002-5027-7521

IPVCE MÁXIMO GÓMEZ BÁE= Z

Recibid= o: 2026-01-12 • Aceptado: 2026-05-06

RESUMEN

El estudio exploratorio de los resultados de las pruebas de ingreso de matemáticas en el nivel medio superior en la provincia de Camagüey tiene = como objetivo contribuir al perfeccionamiento de la enseńanza de la matemática, mejorando la calidad de la formación integral de los estudiantes de preuniversitario y secundaria básica. Además, se realizaron la clasificac= ión de los estudiantes en aprobados o no, en dependencia de los resultados de= la pregunta. Con relación a los algoritmos de clasificación BayesNet, NaiveBayes, Logistic, MultilayerPerceptron y SMO obtuvieron una precisión= (ACC) del 95% o superior en al menos una de las dos solicitudes, mientras que <= span class=3DSpellE>Complement Naive Bayes,= OneR, PART, Ridor y ZeroR obtuvieron una precisión = del 63% o inferior en al menos una de las dos solicitudes.

Palabras clave: preuniversitario; aprendizaje automático; trigonometría; pruebas de ingreso de matemáticas.

ABSTRACT

The exploratory study of mathematics entrance exam results for upper secondary education in the province of Camagüey aims to contribute to the improveme= nt of mathematics education, enhancing the quality of the comprehensive trai= ning of pre-university and basic secondary students. Furthermore, a classifica= tion of students into 'pass' or 'fail' was performed based on the question results. Regarding the classification algorithms, Ba= yesNet, NaiveBayes, Logistic, Mu= ltilayerPerceptron, and SMO achieved an accuracy (ACC) of 95% or higher in at least one of the two requests, while Complement Naive Bayes, OneR, PART, Ridor, and ZeroR obtained an accuracy o= f 63% or lower in at least one of the two requests.

Keywords: pre-college; machine learning; trigonometry; mathematics entrance tests.

INTRODUCCIÓN

Con el fin de destacar la importancia y necesidad de las Ciencias Básicas para el desarrollo sostenible de la sociedad, y sus aportes a la implementación de la Agenda 2030 para solucionar los problemas que generan = los desafíos globales con visión de ciencia (UNESCO, 2019), se han realizado va= rias investigaciones en este sentido. En ese contexto las demostraciones geométr= icas son una poderosa estrategia didáctica para el adiestramiento lógico-lingüís= tico del estudiante, operar con conceptos y propiedades geométricas, propiciar el análisis inductivo deductivo, y uso adecuado del lenguaje matemático (VALDI= VIA, 2024; DÍAZ, 2022; SANTANA, 2023); son, además, una vía muy importante para promover el pensamiento geométrico el cual es considerado como el más impor= tante de la Matemática en el Nivel Medio Superior para promover el pensamiento científico en el estudiante (RODRÍGUEZ Y MONTIEL, 2021). =

Su enseńanza se incluye paulatinamente en los diferentes niveles educativos, a través de la fundamentación de las vivencias del estudiante, deducciones, aplicación de reglas de inferencias, y la solución de ejercici= os de demostración donde tenga que verificar propiedades y relaciones de figur= as geométricas, incluso, para finalmente ser incluido en las pruebas nacionale= s de Matemática para el ingreso a los estudios universitarios, aunque, por lo general se le presta poca atención (CASTILLO, 2024, LARIOS Y RUBIO, 2021).<= o:p>

A pesar de que en los resultados de pruebas nacionales se hacen anál= isis de los resultados atendiendo a la frecuencia de errores cometidos por el estudiante (RODRÍGUEZ, 2026; PÉREZ, 2006, PÉREZ, MARTÍNEZ, TRIANA Y GARZA, 2015), la concepción de la evaluación del aprendizaje hace que se tenga poca información sobre las características de las dificultades de los estudiante= s en las diferentes etapas del proceso de asimilación del estudiante cuando real= iza una demostración geométrica (PÉREZ, 2020).

METODOLOGÍA

La inteligencia artificial (IA) es un campo de la informática que se enfoca en crear sistemas que puedan realizar tareas que normalmente requier= en inteligencia humana, como el aprendizaje, el razonamiento y la percepción. = Las inteligencias artificiales utilizan algoritmos y modelos matemáticos para procesar grandes cantidades de datos y tomar decisiones basadas en patrones= y reglas establecidas a través del aprendizaje automático, que es la capacida= d de una máquina para aprender de forma autónoma a partir de datos sin ser programada específicamente para hacerlo (BOELL, 2025). De esta manera la IA puede mejorar su precisión y eficiencia con el tiempo^{^[1]}.

El aprendizaje automático es un subconjunto de inteligencia artifici= al que permite que un sistema aprenda y mejore de forma autónoma mediante redes neuronales y aprendizaje profundo (VILLALOBOS-MURILLO, 2025), sin tener que= ser programado explícitamente, a través de la ingesta de grandes cantidades de datos. El aprendizaje automático es el proceso mediante el cual se usan mod= elos matemáticos de datos para ayudar a un equipo a aprender sin instrucciones directas. Usa algoritmos para identificar patrones en los datos, y esos patrones luego se usan para crear un modelo de datos que puede hacer predicciones (ROMERO IBARRA, 2025). Con más experiencia y datos, los result= ados del aprendizaje automático son más precisos, de forma muy similar a como los humanos mejoran con más práctica^{^[2]}= ,^{^[3]}.

Weka

Weka es una plataforma de software p= ara el aprendizaje automático y la minería de datos escrito en Java y desarroll= ado en la Universidad de Waikato. Weka es un software libre distribuido bajo la licencia GNU-GPL. Es un entorno pa= ra experimentación de análisis de datos que permite aplicar, analizar y evaluar las técnicas más relevantes de análisis de datos, principalmente las provenientes del aprendizaje automático, sobre cualquier conjunto de datos = del usuario^{^[4]}. Se usó para realizar la ejecuc= ión de los algoritmos de aprendizaje automático y selección de atributos (CASSA= LES, 2025).

Algoritmos de Clasificación=

Bayes: <= /p>

Naive Bayes es un clasificador probabilístico basado en el teorema de Bayes, que incorpora una serie de supuestos simplificadores, entre los cuales destaca la hipótesis de independencia condicional entre las variables predictoras. Estas simplificaciones permiten reducir significativamente la complejidad computacional del modelo, lo que lo convierte en una herramienta eficiente y ampliamente utilizada en tareas de clasificación, pese a que dicha independencia rara vez se cumple de forma estricta en escenarios reales (ODDLEIFSON, 2025; GUTIÉRREZ, 2017). El Naive B= ayes Simple corresponde a una implementación básica de este enfoque, en la cual = los atributos numéricos se modelan mediante distribuciones normales. Esta varia= nte resulta especialmente adecuada cuando las variables presentan un comportami= ento aproximadamente gaussiano y se dispone de conjuntos de datos de tamańo moderado.

Por su parte, el Naive Bayes Updateable es= una extensión del clasificador tradicional que permite la actualización increme= ntal del modelo a medida que se incorporan nuevos datos, mediante el uso de estimadores estadísticos. Esta característica lo hace idóneo para entornos dinámicos o sistemas que requieren aprendizaje continuo (ABDULAMEER, 2025). Finalmente, BayesNet o red bayesiana es un mode= lo gráfico probabilístico que representa un conjunto de variables aleatorias y= sus dependencias condicionales mediante un grafo acíclico dirigido (DAG) (ZHANG, 2025). Este tipo de modelo constituye una de las principales notaciones par= a la representación causal, y resulta especialmente adecuado para el razonamiento bajo incertidumbre. Las redes bayesianas permiten, por ejemplo, inferir la probabilidad de diferentes causas a partir de la observación de ciertos efectos, como en el caso del diagnóstico de enfermedades a partir de síntom= as observados (VERMA, 2025; PRADEEPKUMAR, 2025; BAYAS, 2019).

Algoritmos basados en funciones<= o:p>

RBFNetwork<= span class=3D01CuerpoESP03TEXTOS> (Red de Funciones de Base Radia= l) es un tipo de red neuronal artificial que emplea funciones de base radial p= ara modelar la relación entre las variables de entrada y salida. Estas funcione= s se caracterizan por depender de la distancia entre un punto de entrada y un ce= ntro definido, lo que permite capturar relaciones no lineales de manera eficient= e. Las redes RBF son especialmente útiles en problemas de clasificación y regresión donde los datos presentan estructuras locales bien definidas (MAI= ,2025). SMO (Sequential Minimal Optimization) es un algoritmo diseńado para resolver = el problema de programación cuadrática que surge durante el entrenamiento de l= as Máquinas de Vectores de Soporte (SVM). SMO descompone el problema global en subproblemas más pequeńos y manejables, lo que elimina la necesidad de util= izar costosos solucionadores externos de programación cuadrática (RAWAT, 2025). =

SPegasos es un algoritmo de optimización estocástica asociado al entrenamiento de clasificadores lineales, particularmente en el contexto de máquinas de vectores de soporte. Se fundamenta en el uso de gradiente descendente estocástico para resolver problemas de clasificación a gran escala, ofreciendo una solución eficiente= en términos computacionales (NOROUZI, 2024). El Voted Perceptron es una variante del algoritmo clásico del perceptrón que utiliza un conjunto de perceptrones ponderados para realizar= la clasificación. Cada vez que un ejemplo es clasificado incorrectamente, se c= rea un nuevo perceptrón cuyo vector de pesos se inicializa a partir del percept= rón anterior. La predicción final se obtiene mediante un esquema de votación ponderada (BINSAWAD, 2025). Simple Logistic es = un clasificador basado en regresión logística lineal que emplea el algoritmo <= span class=3DSpellE>LogitBoost con funciones de regresión simples como clasificadores base (CAMBAZARD, 2025). El perceptrón multicapa (MLP) es una= red neuronal artificial compuesta por múltiples capas de neuronas interconectad= as: una capa de entrada, una o varias capas ocultas y una capa de salida. Cada neurona procesa la información recibida mediante una función de activación y transmite el resultado a la siguiente capa. El aprendizaje se realiza media= nte el algoritmo de retropropagación, que ajusta los pesos de las conexiones con el objetivo de minimizar el error de predicción (HUSSAIN, 2025).

Algoritmos perezosos<= /span>

El algoritmo IBk no construye un modelo,= sino que genera una predicción para una instancia de prueba justo a tiempo. El algoritmo IBk utiliza una medida de distancia p= ara localizar instancias "cercanas" en los datos de entrenamiento para cada instancia de prueba y usa esas instancias seleccionadas para hacer una predicción. Es un método de aprendizaje automático que pertenece al grupo de algoritmos de clasificación de instancias cercanas (k-NN). En espańol, IBK = se conoce como "IBK" o "k-NN". Este algoritmo se utiliza p= ara clasificar nuevas instancias en función de su cercanía con una base de datos existente (SYRIOPOULOS, 2025).

<= /span>

Reglas =

ConjunctiveRule es un algoritmo de aprendizaje basado en una única regla conjuntiva capaz de predecir clases tanto numéric= as como nominales. Este enfoque utiliza el operador lógico AND para combinar l= os atributos de entrada, de modo que la clasificación se realiza a partir de la conjunción de los antecedentes con el valor de la clase como consecuente (HUYNH, 2025; ESCALANTE, 2012). Las Decision Ta= bles constituyen una representación estructurada y concisa de reglas de decisión= que especifican las acciones a ejecutar bajo determinadas condiciones. Su funcionamiento es equivalente al de otros enfoques como los árboles de deci= sión o las estructuras condicionales if–then–else y switch–case, facilitando la interpretación y aplicación de las reglas resultantes (KOUSA= R, 2025). ZeroR es un clasificador de referencia que asigna siempre la clase m= ás frecuente del conjunto de datos, sin considerar los atributos de entrada. Aunque su simplicidad limita su capacidad predictiva, resulta útil como lín= ea base para evaluar el desempeńo de otros algoritmos de clasificación (PANTHAKKAN, 2025).

DTNB es un clasificador híbrido que combina una tabla de decisión co= n el algoritmo Naive Bayes. Durante el proceso de aprendizaje, el modelo evalúa distintas particiones de los atributos, asign= ando un subconjunto a la tabla de decisión y otro al clasificador bayesiano, con= el objetivo de maximizar el rendimiento predictivo (AKSHITHA, 2025). JRip implementa un método de inducción de reglas basa= do en el algoritmo RIPPER, que genera de forma iterativa un conjunto de reglas pa= ra cada clase del conjunto de datos. El proceso se repite hasta que todas las clases han sido cubiertas, aplicando técnicas de reducción de error para mejorar la generalización del modelo (KUMAR, 2025). NN= ge es un algoritmo de clasificación inspirado en el enfoque de vecinos más cercanos, que utiliza ejemplos generalizados no anidados. Esta estrategia e= vita la sobregeneralización al impedir la superposic= ión o anidamiento de ejemplos durante el proceso de aprendizaje (HAMAD, 2025). PA= RT es un algoritmo de inducción de reglas que extrae conocimiento a partir de árboles de decisión parciales, generando reglas fácilmente interpretables (KAUR, 2025). Finalmente, Ridor implementa un aprendizaje basado en reglas con excepciones. El algoritmo genera inicialme= nte una regla por defecto y, posteriormente, identifica y ańade excepciones que minimizan la tasa de error, seleccionando aquellas que ofrecen el mejor compromiso entre precisión y simplicidad (LANDGE, 2025).<= /span>

Tree =

DecisionStump es un modelo de aprendizaje automático que consiste en un árbol de decisión de un solo nivel, formado p= or un único nodo interno (raíz) conectado directamente a las hojas. Debido a su simplicidad, suele emplearse como clasificador base en métodos de boosting (AYYAPPAN, 2025). REPTree es un algoritmo de inducción de árboles de decisión y regresión que extiende el método C4.5 mediante el uso de poda por error reducido. Construye árboles utilizando criterios de ganancia o reducción de varianza, maneja valores faltantes mediante la división de instancias y procesa atributos numéricos consideran= do un único punto de corte a la vez (KALAISELVI, 2025). A= DTree (Alternating Decision = Tree) es una generalización de los árboles de decisión tradicionales que alterna nodos de decisión y nodos de predicción. Este enfoque permite combinar múltiples reglas de decisión, siendo necesario ajustar manualmente el númer= o de iteraciones para equilibrar la complejidad del modelo y su precisión. Su construcción ha sido optimizada mediante técnicas heurísticas para acelerar= el aprendizaje (NANDWANA, 2025; ESCALANTE, 2012).

BFTree (Best-First Tree) es un algoritmo de aprendizaje basado en árboles que emplea una estrategia de expansión best-first y se caracteriza por una estructura compuesta por un nodo raíz, nodos inter= nos y hojas, ofreciendo robustez y buen desempeńo predictivo (SHANMUGAM, 2025).= J48 es una implementación en Java del algoritmo C4.5, ampliamente utilizada par= a la construcción de árboles de decisión podados o no podados. Emplea el criteri= o de relación de ganancia para seleccionar atributos, admite datos numéricos e incompletos y aplica técnicas de postpoda para mejorar la generalización del modelo (PRASAD, 2025; ABASZADE, 2017). J48gra= ft es una implementación de código abierto del algoritmo C4.5 incluida en la herramienta de minería de datos WEKA, que extiende J48 incorporando mecanis= mos adicionales para mejorar la estructura del árbol. LADT= ree es un algoritmo que genera árboles de decisión alternativos para problemas multiclase, utilizando la estrategia LogitBoost= como método de aprendizaje base (WANKHEDE, 2025; DOTA, 2015). NBTree es un clasificador híbrido que combina árboles de decisión con clasificador= es Naive Bayes en los nodos hoja, permitiendo capturar t= anto relaciones estructurales como probabilísticas en los datos (SHAHID, 2025; B= ALA, 2003). Random Forest es un método de aprendizaje en conjunto que combina múltiples árboles de decisión generados de forma aleatoria para producir una única predicción. Su capacidad para manejar problemas de clasificación y regresión, junto con su robustez frente al sobreajuste, ha favorecido su am= plia adopción (ABDULRAHMAN, 2025; MARÍN-CASTRO, 2017). Finalmente, Random Tree e= s un árbol de decisión construido mediante un proceso estocástico, en el que en = cada nodo se selecciona aleatoriamente un subconjunto de atributos (KILINÇ, 2026= ).

Descripción de las Bases de conocimiento o de casos

Se tiene una base de conocimient= os, un archivo .csv (Examen), que contienen los resultados de las notas de la pregunta de trigonometría del examen de ingre= so del ańo 2021-2022 de todos los estudiantes preuniversitarios de la provincia Camagüey. Estas bases tienen 22 atributos y 203 instancias La división entr= e la cantidad de instancias da como resultado lo que se conoce como radio de desbalance (IR). Al realizar esta comprobación en la base de datos se obtuv= o un radio de desbalance de 1.2 (la relación entre la cantidad de estudiantes aprobado / desaprobados), lo que demuestra que la misma está balanceada. Los atributos de la base de conocimientos se describen a continuación, ver tabl= a 1:

Tabla 1 Descripción de los atributos de la base de conocimientos: Examen

Variables

Tipo

Valores

a) 1. Por sustituir

Nominal<= /o:p>

I,PC,C

2-Por expresa= r un cuarto a la menos uno como 4

Nominal<= /o:p>

I,PC,C

3-Por aplicar producto de potencias de igual base en MD

Nominal<= /o:p>

I,PC,C

4- Por igualar los exponentes

Nominal<= /o:p>

I,PC,C

5- Por obtener ecuación (1)

Nominal<= /o:p>

I,PC,C

6- Por elevar ambos miembros al cuadrado

Nominal<= /o:p>

I,PC,C

7- Por obtener ecuación (2)

Nominal<= /o:p>

I,PC,C

8- Por factor= izar

Nominal<= /o:p>

I,PC,C

9- Por igualar cada factor a cero la ecuación (2)

Nominal<= /o:p>

I,PC,C

10- Por desec= har senx igual a cero

Nominal<= /o:p>

I,PC,C

11- Por halla= r la solución senx igual a 1

Nominal<= /o:p>

I,PC,C

12- Por compr= obar

Nominal<= /o:p>

I,PC,C

13-Por conjun= to solución

Nominal<= /o:p>

I,PC,C

b)14-Sustituir

Nominal<= /o:p>

I,PC,C

15-Por expres= ar 4 como dos a la dos

Nominal<= /o:p>

I,PC,C

16- Por Aplic= ar la propiedad de los logaritmos

Nominal<= /o:p>

I,PC,C

17-Por identi= dad de logaritmos

Nominal<= /o:p>

I,PC,C

18-Por obtene= r el M.I

Nominal<= /o:p>

I,PC,C

19-Por conclu= ir

Nominal<= /o:p>

I,PC,C

Clase

Nominal<= /o:p>

Aprobado/ Des= aprobado

Nota: I – insuficiente, PC – poco conocido, C - conocido

El atributo Clase contiene la clasificación de los estudiantes teniendo en cue= nta si aprobaban o no esa pregunta de trigonometría. El atributo Puntuación contiene los puntos obtenidos en esa pregunta.

Val= idación cruzada (cross= -validation): La validación cruzada es una técnica para evaluar modelos de ML mediante el entrenamiento de varios modelos de ML en subconjuntos de los datos de entra= da disponibles y evaluarlos con el subconjunto complementario de los datos.

Percentage Split (división porcentual): Dividida aleatoriamente su conjunto de datos en particiones de entrenamiento y de prueba cada vez que evalúe un modelo. Esto puede brindarle una estimación muy rápida del rendimiento y, al igual que usar un conjunto de pruebas suministrado, es preferible solo cuando tiene un conjunto de datos grande.=

RESULTADOS Y DISCUSIÓN

A continuación, se presentan los principales resultados de investigación, ver tablas 2 y 3:

Tabla 2 Resultados de la clasificación para (% cross-validation= )

Algoritmo

ACC (Porcentaje de Clasificación o exactitud)

AUC (Área debajo = de la curva)

BayesNet

93.5961<= /o:p>

0.994

ComplementNaiveBayes

63.5468<= /o:p>

0.621

NaiveBayes

96.5517<= /o:p>

0.989

NaiveBayesSimple

94.0887<= /o:p>

0.983

NaiveBayesUpdateable

96.5517<= /o:p>

0.989

Logistic

96.5517<= /o:p>

0.997

MultilayerPerceptron

96.5517<= /o:p>

0.997

RBFNetwork

95.5665<= /o:p>

0.948

SimpleLogistic

94.0887<= /o:p>

0.989

SMO

95.0739<= /o:p>

0.95

Spegasos

95.5665<= /o:p>

0.96

VotedPerceptron

81.2808<= /o:p>

0.821

IB1

90.6404<= /o:p>

0.904

IBk

91.133

0.952

ConjunctiveRule

81.7734<= /o:p>

0.805

DecisionTable

79.803

0.891

DTNB

88.67

0.954

JRip

82.266

0.841

NNge

86.2069<= /o:p>

0.859

OneR

82.266

0.82

PART

83.2512<= /o:p>

0.851

Ridor

83.7438<= /o:p>

0.835

ZeroR

55.1724<= /o:p>

0.488

ADTree

87.6847<= /o:p>

0.956

BFTree

84.7291<= /o:p>

0.884

DecisionStump

82.266

0.769

J48

79.803

0.835

J48graft=

80.7882<= /o:p>

0.837

LADTree

87.6847<= /o:p>

0.957

NBTree

92.6108<= /o:p>

0.982

RandomForest

90.1478<= /o:p>

0.969

RandomTree

86.6995<= /o:p>

0.868

ACC: En general, los algoritmos de clasificación más precisos fueron= : BayesNet: 95.0739%, Naive= Bayes: 96.5517%, Logistic: 96.5517%m Multilayer Perceptron: 96.5517%; SMO: 95.0739%. Estos algo= ritmos obtuvieron una precisión del 95% o superior en al menos una de las dos solicitudes. Por otro lado, los algoritmos que obtuvieron una precisión más baja fueron: Complement Na= ive Bayes: 63.5468%, OneR: 82.266%, PART: 83.2512%, Ridor<= /span>: 83.7438%, ZeroR: 55.1724%. Estos algoritmos obtuvieron una precisión del 63= % o inferior en al menos una de las dos solicitudes. En resumen, los algoritmos= de clasificación más precisos fueron BayesNet, NaiveBayes, Logistic, MultilayerPerceptron y SMO, mientras que los algoritm= os menos precisos fueron Complement Naive Bayes, OneR, PART, Ridor y ZeroR.

AUC: En general, los algoritmos de clasificación más precisos en el = área debajo de la curva fueron: BayesNet: 0.994 y 0.= 994 Naive Bayes: 0.989 y 0.996, Logi= stic: 0.997 y 0.992, Multilayer = Perceptron: 0.997 y 0.994. Estos algoritmos obtuvieron una precisión del 0.98 o superio= r en al menos una de las dos solicitudes en el área debajo de la curva. Por otro lado, los algoritmos que obtuvieron una precisión más baja en el área debaj= o de la curva fueron: Complement Naive Bayes: 0.621 y 0; Naive Bayes Simple: 0.983 y 0= .996; Naive Bayes Updateable: 0= .989 y 0.996; RBFNetwork: 0.948 y 0.996; Simple Logistic: 0.989 y 0.991. Estos algoritmos obtuvieron = una precisión del 0.62 o inferior en al menos una de las dos solicitudes en el = área debajo de la curva. En resumen, los algoritmos de clasificación más preciso= s en el área debajo de la curva fueron BayesNet, Naive Bayes, Logistic y <= span class=3DSpellE>MultilayerPerceptron, mientras que los algoritmos men= os precisos fueron ComplementNaiveBayes, NaiveBayesSimple, NaiveBayesUpda= teable y RBFNetwork.

Tab= la 3 Resultados de la clasificación (Percentage Spli= t)

Algoritmo

ACC

AUC

B= ayesNet

92.7536<= /o:p>

0.988

C= omplementNaiveBayes

60.8696<= /o:p>

0.608

N= aiveBayes

100

1<= /span>

N= aiveBayesSimple

94.2029<= /o:p>

0.993

N= aiveBayesUpdateable

100

1<= /span>

L= ogistic

85.5072<= /o:p>

0.956

M= ultilayerPerceptron

94.2029<= /o:p>

0.982

R= BFNetwork

94.2029<= /o:p>

0.987

S= impleLogistic

85.5072<= /o:p>

0.969

SMO

91.3043<= /o:p>

0.913

S= pegasos

94.2029<= /o:p>

0.942

V= otedPerceptron

76.8116<= /o:p>

0.824

IB1

85.5072<= /o:p>

0.924

I= Bk

84.058

0.961

C= onjunctiveRule

81.1594<= /o:p>

0.914

D= ecisionTable

79.7101<= /o:p>

0.818

DTNB

86.9565<= /o:p>

0.87

J= Rip

78.2609<= /o:p>

0.782

N= Nge

81.1594<= /o:p>

0.762

OneR

79.7101<= /o:p>

0.795

PART

50.7246<= /o:p>

0.5

R= idor

84.058

0.939

ZeroR

75.3623<= /o:p>

0.71

A= DTree

78.2609<= /o:p>

0.782

B= FTree

89.8551<= /o:p>

0.937

D= ecisionStump

73.913

0.704

J48

81.1594<= /o:p>

0.936

J48graft=

85.5072<= /o:p>

0.969

L= ADTree

92.7536<= /o:p>

0.987

N= BTree

91.3043<= /o:p>

0.926

R= andomForest

78.2609<= /o:p>

0.831

R= andomTree

78.2609<= /o:p>

0.782

ACC: En general, los algoritmos de clasificación más precisos fueron= : BayesNet: 92.7536% y 94.2029%, N= aive Bayes: 100% y 95.6522%, Logistic: 85,5072% y 91.3043%, Multilayer Perce= ptron: 94.2029% y 97.1014%, SMO: 91.3043% y 94.2029%. Estos algoritmos obtuvieron = una precisión del 92% o superior en al menos una de las dos solicitudes. Por ot= ro lado, los algoritmos que obtuvieron una precisión más baja fueron: Complement Naive Bayes: 6= 0.8696%, OneR: 78.2609% y 75.3623%, PART: 50.7246% y 81.1594%, = Ridor: 84.058% y 78.2609%, ZeroR: 75.3623% y 50.7246%. Estos algoritmos obtuvieron= una precisión del 60% o inferior en al menos una de las dos solicitudes. En resumen, los algoritmos de clasificación más precisos fueron BayesNet, NaiveBayes, Logistic, MultilayerPerceptron y SMO, mientras que los algoritmos menos precisos fueron Complement Naive Bayes, OneR, PART, R= idor y ZeroR.

AUC: En general, los algoritmos de clasificación más precisos en el = área debajo de la curva fueron: BayesNet: 0.988 y 0.= 995; Naive Bayes: 1 y 0; Logistic: 0.956 y 0.966; Multilayer = Perceptron: 0.982 y 0.988. Estos algoritmos obtuvieron una precisión del 0.95 o superio= r en al menos una de las dos solicitudes en el área debajo de la curva. Por otro lado, los algoritmos que obtuvieron una precisión más baja en el área debaj= o de la curva fueron: Complement Naive Bayes: 0.608 y 0.994; Naive Bayes Simple: 0.993= y 0.994; Naive Bayes Updatea= ble: 1 y 0.994; RBFNetwork: 0.987 y 0.98; Simple Logistic: 0.969 y 0.982. Estos algoritmos obtuvieron = una precisión del 0.60 o inferior en al menos una de las dos solicitudes en el = área debajo de la curva. En resumen, los algoritmos de clasificación más preciso= s en el área debajo de la curva fueron BayesNet, Naive Bayes, Logistic y <= span class=3DSpellE>Multilayer Perceptron, mi= entras que los algoritmos menos precisos fueron Complement Naive Bayes, Naive Bayes = Simple, Naive Bayes Updateable y = RBFNetwork.

CONCLUSIONES

El estudio exploratorio confirma que el análisis automatizado de los resultado= s en las pruebas de ingreso de matemáticas constituye una herramienta valiosa pa= ra perfeccionar el aprendizaje en el nivel medio superior de Camagüey. Esta aproximación permite identificar patrones de aprendizaje que contribuyen directamente a mejorar la calidad de la formación integral de los estudiant= es en preuniversitario y secundaria básica. Además, se demostró la viabilidad = de utilizar algoritmos de inteligencia artificial para la clasificación precis= a de estudiantes (aprobados vs. desaprobados) basándose en su desempeńo en pregu= ntas específicas de trigonometría. El uso de la plataforma = Weka facilitó la identificación de modelos con altos estándares de fiabilidad pa= ra el contexto educativo analizado. Asimismo, los algoritmos BayesNet, NaiveBayes, Logistic, MultilayerPerceptron y SMO se consolidan como las herramientas más robustas para este dominio, logrando una exactitud (ACC) superior al 95% en las pruebas de validación. En particular, modelos probabilísticos como BayesNet y redes neuronale= s como Multilayer Perceptron mostraron una capacidad excepcional para el razonamiento bajo incertidumbre, alcanzando valores de Área Debajo de la Curva (AUC) de hasta 0.997, lo que garantiza una discriminación casi perfecta entre las clases analizadas. Por otro lado, los resultados revelan que clasificadores básicos o de reglas simples, como Complement N= aive Bayes, OneR y ZeroR, son insuficientes para capturar la complejidad de los datos educativos analizados, con precisiones que descendieron hasta el 63% o inferior. Esto sugiere que la naturaleza de la evaluación del aprendizaje matemático requiere modelos capaces de procesar dependencias no lineales y múltiples atributos simultáneamente. Finalmente, la integración de técnicas= de aprendizaje automático en la evaluación nacional permite trascender el anál= isis tradicional de frecuencia de errores. Esta metodología ofrece una visión más profunda sobre el proceso de asimilación del estudiante, permitiendo a los docentes tomar decisiones informadas para fortalecer la enseńanza de la geometría y la trigonometría antes del ingreso a la educación superior.

REFERENCIAS

Aguilar, J. F. Á. (2020). Minería de datos educativos: Una propuesta= de innovación en la inspección educativa. Supervisión 21, 57(57), 8-8.

= Abaszade, M., Maftonian, M., Babaee, M. y Fadaee, M. (2017). Investigación de la precisión de l= os algoritmos heurísticos y la regresión logit lin= eal para predecir el tipo de comentario del auditor. Inves= tigaciones modernas en Accounting Journal , 4,= 39-73.

Abdulameer, A. G., Hammood, A. S., Abdulwahed, F. M., & Ayyash, A. A. (2025). Naďve = Bayes algorithm for timely fault diagnosis in helical gear transmissions using vibration signal analysis. International Journal on Interactive Design and Manufacturing (IJIDeM), 19(5), 3695-3706. =

Abdulrahman, S. A., & Khlebis, S. F. (2025). Models of Machine Learning to Diagnose Chronic Kidney disease using= a WEKA-based Classifier. Mesopotamian Journal of Artificial Intelligence in Healthcare, 2025, 39-47.

Akshitha, K., Rao, T., Kodiaplli, A., Arabu, U., Reddy, K. R., Ikram, M., & Bahl, A. (2= 025, April). Analysis of the performance of terrorism classification using machi= ne learning. In AIP Conference Proceedings (Vol. 3157, No. 1, p. 080007). AIP Publishing LLC.

Ayyappan, G., & Sathish, B. (2025, June). AI-Driven Brain Tumor Prediction using Feature Extraction and Machine Learning Classifiers. In 20= 25 3rd International Conference on Self Sustainable Artificial Intelligence Systems (ICSSAS) (pp. 1314-1320). IEEE. <= /p>
Bayas, B. O., & Zambrano-Vega, C. (2019). Nuevo clasificador bayesiano simple para el análisis de datos educativos. Universidad y Sociedad, 11(2), 278-285.

Bala, J., K. C. Chang, A. Williams And Y. Weng (2003). A Hybrid Baye= sian Decision Tree for Classification. Workshop on Probabilistic Graphical Models for Classification, Cavtat-Dubrovnik, Croatia.<= o:p>

Boell, M. (2025). La relación con el saber y la inteligencia artific= ial en la educación superior. Trayectorias Universita= rias, 11.

= Binsawad, M. (2025). Enhanced Financial Fraud Detection Using an Adaptive Vo= ted Perceptron Model with Optimized Learning and Error Reduction. Electronics, 14(9), 1875.

= Cambazard, H., Catusse, N., = Chomez, A., & Lagrange, A. M. (2025). Logistic regression to boost exoplanet detection performances. Monthly Notices of the Royal Astronomical Society, 536(2), 1610-1624.

Castillo, M. C. (2024). Elementos de Lógica: aplicados al proceso de enseńanza y aprendizaje= . Editorial U= niversitaria (Cuba).

= Cassales, G. W., Liu, J. J., & Bifet, A. (20= 25). Accelerated weka: GPU machine learning with weka Workbench. Neurocomputing, 130432.

Díaz Cutińo, A. (2022). El tratamiento de los conceptos matemáticos = en la unidad: curvas de segundo grado en la enseńanza preuniversitaria (Doctor= al dissertation, Universidad Matanzas).

Dota, M. A., Cugnasca, C. E., y Barbosa,= D. S. (2015). Comparative analysis of decision tree algorithms on quality of water contaminated with soil/Analise comparativa de algoritmos de arvore de decisao = na classificacao da qualidade da agu= a contaminada por solo. Ciencia Rural, 45(2), 267= -274

Em Pekala (2000.), Dic= cionario de estadística (págs. 244-245). Madrid: McGraw-= Hill.

= Escalante, H. J., Espinosa Guevara, K., Berrones San= tos, J. A., y Saucedo Espinosa, M. A. (2012). Detección automática de fallas de baleros en un proceso de manufactura: Un estudio comparativo. Ingenierías, 15(55), 15-22.

Francia. Unesco. Conferencia general, 40th. Proclamación de un Ańo Internacional de las Ciencias Básicas para el Desarrollo (2022). París, 201= 9. Disponible en: https://unesdoc.unesco.org/ark:/48223/pf0000371464_spaAcceso= el 2 de mayo. 2022.

Gallego, A. J., Rico-Juan, J. R., Calvo-Zaragoza, J., Castellanos, F. J., & Rizo, D. (2019). Desarrollo de un servicio online para el uso de técnicas de aprendizaje automático orientadas a la detección de anomalías e= n la evaluación docente.

Gutiérrez Esparza, G. O., Margain Fuentes, M. D. L., Ramírez Del Rea= l, T. A., y Canul Reich, J. (2017). Un modelo basado en el Clasificador Naďve Bayes para la evaluación del desempeńo docente.= RIED. Revista iberoamericana de educación a distancia.)<= /p>
Hussain, K., Mehmood, K., Yujun, S., Badshah, T., Anees, S. A., Shah= zad, F., ... & Bilal, M. (2025). Analysing LULC transformations using remote sensing data: insights from a multilayer perceptron neural network approach. Annals of GIS, 31(3), 473-500

Huynh, V. Q. P., Beck, F., & Fürnkranz, J. (2025, July). Partial Pre-Post Code Tree: A Memory-Efficient Tree Structure= for Conjunctive Rule Mining. In Proceedings of the 31st ACM SIGKDD Conference on Knowledge Discovery and Data Mining V. 1 (pp. 565-576). <= /span>

= Jeyasingh, M. M., Appavoo, K., y Sakthivel, P (2002). Data Mining for Predict= ion of Clothing Insulation.

Kumar, M. N., Vijayan, T., & Karthik, B. (2025, February). Ensem= ble Classifier-based Intrusion Detection System for WSNs: Optimizing Security Against Evolving Attacks. In 2025 3rd International Conference on Integrated Circuits and Communication Systems (ICICACS) (pp. 01-06). IEEE. =

Kaur Mangat, P., & Kaur, D. S. (2025). A COMPARATIVE STUDY OF MACHINE LEARNING CLASSIFIERS FOR STUDENTS'PERFORMANCE PREDICTION. Available= at SSRN 5724843.

Kalaiselvi, B. (2025). Effects of Data Augmentation by Replicating Instances: Classification Performance by Ensembles of Decision Trees. International Journal of Knowledge Exploration in Computational Intelligenc= e, 1(1), 22-31.

= Kılınç, I., Boyacıoğlu, H., & Kılınç, B. (2026, January). Machine Learning-Based Prediction of Polycyclic Aromatic Hydrocarbon (PAH) Levels in Smoked Fish Using WEKA: Evaluation of Smoking Parameters and Model Performa= nce. In Biology and Life Sciences Forum (Vol. 56, No. 1, p. 1). MDPI.=

López, Gj Y Ruiz, I= m (2016). Sistemas de líneas base de caracteres y palabras para la detección = de ironía en textos breves en espańol. Procesamiento del Lenguaje Natural , 56 , 41-48.<= /o:p>

= Landge, S. R., & Jain, D. (2025, July). Machine Learning Approaches to L= ung Cancer Prediction: A Comparative Study. In Recent Advances in Artificial Intelligence for Sustainable Development (RAISD 2025) (pp. 14-23). <= /span>Atlantis Press.

Marc Sumner, Eibe Frank, Mark Hall(2005): Acelerar la inducción del árbol modelo logístico. En: Novena Conferencia Europea sobre Principios y Práctica del Descubrimiento de Conocimiento en B= ases de Datos, 675-683, 2005.

Magdaleno, D., Miranda, Y., Fuentes, I. E., y García, M. M. (2015). = Comparative study of clustering algorithms using OverallSimSUX similarity function for XML documents. Inteligencia Artificial. Revista Iberoamericana de Inteligencia Artificial, 18(55), 1-11.<= /span>

Mihaljevic, B., Bielza Lozoya, M. C., y Larrańaga Múgica, P. M. (2018). bnclassify: Learning Bayesian network classifiers. R JOURNAL, 10(2), 455-468.

= Marin-Castro, H. M., & Franco-Vázquez, P. E. (2017). Estudio de Herramientas de Minería de Datos para la Tarea de Clasificación. Universidad Politécnica de Victoria, Av. Nuevas Tecnologías, 5902, 1-9.

Mai, J., Leung, C. S., & Wong, E. (2025). Constructing RBF network based on interference robust projected gradient. Journal of the Franklin Institute, 107798.

= Nandwana, B., Pandey, H., Chauhan, D., & Kumari, S. (2025, March). Analy= zing Classification Algorithms for Network Intrusion Detection. In 2025 IEEE International Conference on Interdisciplinary Approaches in Technology and Management for Social Innovation (IATMSI) (Vol. 3, pp. 1-6). IEEE.

Norouzi, M., & Kahriman, E. A. (2024). A machine learning-based early diagnosis model for chronic kidney disease using spegasos. Network Modeling Analysis in Health Informatics and Bioinformatics, 13(1), = 20.

Oddleifson, C., Kilgus, S., Klingbeil, D. A., Latham, A. D., Kim, J.= S., & Vengurlekar, I. N. (2025). Using a naive Bayesian approach to identify academic risk based on multiple sources: A conceptual replication. Journal of School Psychology, 108, 101397.

= Panthakkan, A., Gurjarand, A., Patel, J., & Pa= tel, H. (2025, September). A Comparative Analysis of Ensemble Strategies. In Applications of Artificial Intelligence and Data Science: First Global Conference, AAIDS 2024, London, UK, April 3–5, 2024, Proceedings (p. 49). Springer Nature.

Pradeepkumar, D., Muralidharan, V., Hameed, S. S., & Ravikumar, = S. (2025). Milling Tool Condition Monitoring using Vibration Signals and Histo= gram Features through Machine Learning: A Comparison of Naive Bayes and Bayes Net Algorithms. International Journal of Vehicle Structures & Systems (IJVS= S), 17(2).

Prasad, S., & Arif, M. (2025). Enhancing Classification Efficien= cy Using the J48 Decision Tree Algorithm. International Journal of Advanced Research and Multidisciplinary Trends (IJARMT), 2(1), 174-182. <= /span>

Rawat, D., Jamwal, A. S., Nara, M., Bajaj, R., & Pawar, L. (2025, March). Optimized Ensembled Model for Patient Treatment Using Machine Learn= ing Techniques. In 2025 3rd International Conference on Disruptive Technologies (ICDT) (pp. 984-988). IEEE.

Rodríguez, E. P., Vargas, M. A., & Alfaro, M. P. (2026). Análisis de errores algebraicos que manifiestan docentes en formación de la carrera de Enseńanza de l= a Matemática en la Universi= dad Nacional de Costa Rica: Analysis of algebraic errors displayed by mathemati= cs teacher trainees in the mathematics education program at the National University of Costa Rica. <= span lang=3DES-MX style=3D'font-size:11.0pt;font-family:"Calibri",sans-serif;mso= -ascii-theme-font: minor-latin;mso-hansi-theme-font:minor-latin;mso-bidi-theme-font:minor-lati= n; color:#3B3838;mso-themecolor:background2;mso-themeshade:64;mso-ansi-languag= e: ES-MX'>Revista Digital: Matemática, Educación e Internet, 26(1)<= /span>

Romero Ibarra, J. L. (2025). Análisis integral de algoritmos de clasificación en aprendizaje automático: perspectivas, comparaciones y aplicaciones. Serie Científica de la Universidad de las Ciencias Informátic= as, 18(1), 283-304.

Santana, E. R., González, O. L. P., Rincón, M. E. L., & Moran, D= . G. (2023). Dificultades conceptuales de los estudiantes del nivel medio superi= or en las demostraciones geométricas. Paradigma, 241-263.

Shanmugam, A. E., Kamalakoothan, N. G., Kamalakannan, R. K., & Arvind, S. K. (2025, April). Students performance analysis and focus monitoring system. In AIP Conference Proceedings (Vol. 3279, No. 1, p. 020100). AIP Publishing LLC.

= Syriopoulos, P. K., Kalampalikis, N. G., Kotsiantis, S. B., & Vrahati= s, M. N. (2025). k NN Classification: a review. Annals of mathematics and artificial intelligence, 93(1), 43-75.

Valdivia Sardińas, M. D. L. Á., & Almeida Carazo, B. A. (2024). = Argumentar matemáticamente: habilidad del adiestramiento lógico-lingüístico para aprender= matemática.

Villalobos-Murillo, J., Garita-González, G., & Alfaro Ramírez, B= . J. (2025). Desarrollo de competencias: inteligencia artificial y aprendizaje automático en prácticas supervisadas de estudiantes en computación. = Unici= encia, 39(1), 32-50.

Verma, S., Sharma, A., Jain, S., & Kumar, A. (2025). On the Improvements of the Performance of Bayes-Net Classification for Diagnosis of Diabetes: A Cross-validation Approach. Recent Advances in Electrical & Electronic Engineering, 18(2), 234-243.

Zhang, Y., Dai, W., Yu, H., Liu, S., Hou, J= ., Li, J., & Lin, W. (2025). ABC: Adaptive BayesNet Structure Learning for Computational Scalable Multi-task Image Compression.= arXiv preprint arXiv:2506.15228.

=

=

=

Copyright © 2026, Autores: Martínez López, Yoan, Cabrera Rodríguez, Heidy, Pérez González, Olga Lidi= a, de Castro Lozano, Carlos, Ramírez Uceda, José Miguel, López Correoso, Ana O.=

<= o:p>

E= sta obra está bajo una licencia de Creative Commons Atribución-No Comercial 4= .0 Internacional

=

Variables	Tipo	Valores
a) 1. Por sustituir	Nominal<= /o:p>	I,PC,C
2-Por expresa= r un cuarto a la menos uno como 4	Nominal<= /o:p>	I,PC,C
3-Por aplicar producto de potencias de igual base en MD	Nominal<= /o:p>	I,PC,C
4- Por igualar los exponentes	Nominal<= /o:p>	I,PC,C
5- Por obtener ecuación (1)	Nominal<= /o:p>	I,PC,C
6- Por elevar ambos miembros al cuadrado	Nominal<= /o:p>	I,PC,C
7- Por obtener ecuación (2)	Nominal<= /o:p>	I,PC,C
8- Por factor= izar	Nominal<= /o:p>	I,PC,C
9- Por igualar cada factor a cero la ecuación (2)	Nominal<= /o:p>	I,PC,C
10- Por desec= har senx igual a cero	Nominal<= /o:p>	I,PC,C
11- Por halla= r la solución senx igual a 1	Nominal<= /o:p>	I,PC,C
12- Por compr= obar	Nominal<= /o:p>	I,PC,C
13-Por conjun= to solución	Nominal<= /o:p>	I,PC,C
b)14-Sustituir	Nominal<= /o:p>	I,PC,C
15-Por expres= ar 4 como dos a la dos	Nominal<= /o:p>	I,PC,C
16- Por Aplic= ar la propiedad de los logaritmos	Nominal<= /o:p>	I,PC,C
17-Por identi= dad de logaritmos	Nominal<= /o:p>	I,PC,C
18-Por obtene= r el M.I	Nominal<= /o:p>	I,PC,C
19-Por conclu= ir	Nominal<= /o:p>	I,PC,C
Clase	Nominal<= /o:p>	Aprobado/ Des= aprobado

Algoritmo	ACC (Porcentaje de Clasificación o exactitud)	AUC (Área debajo = de la curva)
BayesNet	93.5961<= /o:p>	0.994
ComplementNaiveBayes	63.5468<= /o:p>	0.621
NaiveBayes	96.5517<= /o:p>	0.989
NaiveBayesSimple	94.0887<= /o:p>	0.983
NaiveBayesUpdateable	96.5517<= /o:p>	0.989
Logistic	96.5517<= /o:p>	0.997
MultilayerPerceptron	96.5517<= /o:p>	0.997
RBFNetwork	95.5665<= /o:p>	0.948
SimpleLogistic	94.0887<= /o:p>	0.989
SMO	95.0739<= /o:p>	0.95
Spegasos	95.5665<= /o:p>	0.96
VotedPerceptron	81.2808<= /o:p>	0.821
IB1	90.6404<= /o:p>	0.904
IBk	91.133	0.952
ConjunctiveRule	81.7734<= /o:p>	0.805
DecisionTable	79.803	0.891
DTNB	88.67	0.954
JRip	82.266	0.841
NNge	86.2069<= /o:p>	0.859
OneR	82.266	0.82
PART	83.2512<= /o:p>	0.851
Ridor	83.7438<= /o:p>	0.835
ZeroR	55.1724<= /o:p>	0.488
ADTree	87.6847<= /o:p>	0.956
BFTree	84.7291<= /o:p>	0.884
DecisionStump	82.266	0.769
J48	79.803	0.835
J48graft=	80.7882<= /o:p>	0.837
LADTree	87.6847<= /o:p>	0.957
NBTree	92.6108<= /o:p>	0.982
RandomForest	90.1478<= /o:p>	0.969
RandomTree	86.6995<= /o:p>	0.868

Algoritmo	ACC	AUC
B= ayesNet	92.7536<= /o:p>	0.988
C= omplementNaiveBayes	60.8696<= /o:p>	0.608
N= aiveBayes	100	1<= /span>
N= aiveBayesSimple	94.2029<= /o:p>	0.993
N= aiveBayesUpdateable	100	1<= /span>
L= ogistic	85.5072<= /o:p>	0.956
M= ultilayerPerceptron	94.2029<= /o:p>	0.982
R= BFNetwork	94.2029<= /o:p>	0.987
S= impleLogistic	85.5072<= /o:p>	0.969
SMO	91.3043<= /o:p>	0.913
S= pegasos	94.2029<= /o:p>	0.942
V= otedPerceptron	76.8116<= /o:p>	0.824
IB1	85.5072<= /o:p>	0.924
I= Bk	84.058	0.961
C= onjunctiveRule	81.1594<= /o:p>	0.914
D= ecisionTable	79.7101<= /o:p>	0.818
DTNB	86.9565<= /o:p>	0.87
J= Rip	78.2609<= /o:p>	0.782
N= Nge	81.1594<= /o:p>	0.762
OneR	79.7101<= /o:p>	0.795
PART	50.7246<= /o:p>	0.5
R= idor	84.058	0.939
ZeroR	75.3623<= /o:p>	0.71
A= DTree	78.2609<= /o:p>	0.782
B= FTree	89.8551<= /o:p>	0.937
D= ecisionStump	73.913	0.704
J48	81.1594<= /o:p>	0.936
J48graft=	85.5072<= /o:p>	0.969
L= ADTree	92.7536<= /o:p>	0.987
N= BTree	91.3043<= /o:p>	0.926
R= andomForest	78.2609<= /o:p>	0.831
R= andomTree	78.2609<= /o:p>	0.782