MIME-Version: 1.0 Content-Type: multipart/related; boundary="----=_NextPart_01DCF35C.97EFACC0" Este documento es una página web de un solo archivo, también conocido como "archivo de almacenamiento web". Si está viendo este mensaje, su explorador o editor no admite archivos de almacenamiento web. Descargue un explorador que admita este tipo de archivos. ------=_NextPart_01DCF35C.97EFACC0 Content-Location: file:///C:/0D0B3CD2/283.Diagramacion2.htm Content-Transfer-Encoding: quoted-printable Content-Type: text/html; charset="windows-1252"
|
Explorando la predicción de los resultados de las pruebas de
matemáticas en la provincia de Camagüey usando inteligencia artificial |
|
Exploring
the prediction of mathematics exam results in Camagüey province using
artificial intelligence |
|
|
|
|
|
Yoan Ma=
rtínez-López |
|
ymlopez=
2022@gmail.com
• https://orcid.org/0000-0002-1950-567X
|
|
|
|
Heidy=
span> Cabrera
Rodríguez |
|
heidy.c=
abrera@reduc.edu.cu
• https://orcid.org/0009-0006-2122-4160 |
|
|
|
Olga Li=
dia Pérez
Gónzalez |
|
olguita=
pg@gmail.com
• https://orcid.org/0000-0003-4475-814X
|
|
|
|
UNIVERSIDAD DE CAMAGÜE=
Y |
|
|
|
Carlos =
de
Castro Lozano |
|
carlos@=
uco.es
• https://orcid.org/0000-0002-4485-6025
UNIVERSIDAD DE CÓRDOBA=
|
|
|
|
José Mi=
guel
Ramírez Uceda |
|
p52rauc=
j@uco.es
• https://orcid.org/0000-0002-5027-7521
PLENITAS=
|
|
|
|
Ana O. =
López
Correoso |
|
analope=
zcorreoso@gmail.com
• https://orcid.org/0000-0002-5027-7521
IPVCE MÁXIMO GÓMEZ BÁE=
Z |
|
|
|
Recibid=
o:
2026-01-12 • Aceptado: 2026-05-06 |
|
RESUMEN |
|
El
estudio exploratorio de los resultados de las pruebas de ingreso de
matemáticas en el nivel medio superior en la provincia de Camagüey tiene =
como
objetivo contribuir al perfeccionamiento de la enseñanza de la matemática,
mejorando la calidad de la formación integral de los estudiantes de
preuniversitario y secundaria básica. Además, se realizaron la clasificac=
ión
de los estudiantes en aprobados o no, en dependencia de los resultados de=
la
pregunta. Con relación a los algoritmos de clasificación BayesNet,
NaiveBayes, Logistic, MultilayerPerceptron y SMO obtuvieron una precisión=
(ACC)
del 95% o superior en al menos una de las dos solicitudes, mientras que <=
span
class=3DSpellE>Complement Naive Bayes,=
OneR,
PART, Ridor y ZeroR obtuvieron una precisión =
del
63% o inferior en al menos una de las dos solicitudes. |
|
Palabras clave: preuniversitario; aprendizaje automático;
trigonometría; pruebas de ingreso de matemáticas. |
|
ABSTRACT |
|
The
exploratory study of mathematics entrance exam results for upper secondary
education in the province of Camagüey aims to contribute to the improveme=
nt
of mathematics education, enhancing the quality of the comprehensive trai=
ning
of pre-university and basic secondary students. Furthermore, a classifica=
tion
of students into 'pass' or 'fail' was performed based on the question
results. Regarding the classification algorithms, Ba=
yesNet,
NaiveBayes, Logistic, Mu=
ltilayerPerceptron,
and SMO achieved an accuracy (ACC) of 95% or higher in at least one of the
two requests, while Complement Naive Bayes, OneR,
PART, Ridor, and ZeroR obtained an accuracy o=
f 63%
or lower in at least one of the two requests. |
|
Keywords:=
b> pre-college; machine learning; trigonometry; mathematics entrance
tests. |
|
|
INTRODUCCIÓN
Con el fin de destacar la importancia y necesidad de las Ciencias
Básicas para el desarrollo sostenible de la sociedad, y sus aportes a la
implementación de la Agenda 2030 para solucionar los problemas que generan =
los
desafíos globales con visión de ciencia (UNESCO, 2019), se han realizado va=
rias
investigaciones en este sentido. En ese contexto las demostraciones geométr=
icas
son una poderosa estrategia didáctica para el adiestramiento lógico-lingüís=
tico
del estudiante, operar con conceptos y propiedades geométricas, propiciar el
análisis inductivo deductivo, y uso adecuado del lenguaje matemático (VALDI=
VIA,
2024; DÍAZ, 2022; SANTANA, 2023); son, además, una vía muy importante para
promover el pensamiento geométrico el cual es considerado como el más impor=
tante
de la Matemática en el Nivel Medio Superior para promover el pensamiento
científico en el estudiante (RODRÍGUEZ Y MONTIEL, 2021).
Su enseñanza se incluye paulatinamente en los diferentes niveles educativos, a través de la fundamentación de las vivencias del estudiante, deducciones, aplicación de reglas de inferencias, y la solución de ejercici= os de demostración donde tenga que verificar propiedades y relaciones de figur= as geométricas, incluso, para finalmente ser incluido en las pruebas nacionale= s de Matemática para el ingreso a los estudios universitarios, aunque, por lo general se le presta poca atención (CASTILLO, 2024, LARIOS Y RUBIO, 2021).<= o:p>
A pesar de que en los resultados de pruebas nacionales se hacen anál=
isis
de los resultados atendiendo a la frecuencia de errores cometidos por el
estudiante (RODRÍGUEZ, 2026; PÉREZ, 2006, PÉREZ, MARTÍNEZ, TRIANA Y GARZA,
2015), la concepción de la evaluación del aprendizaje hace que se tenga poca
información sobre las características de las dificultades de los estudiante=
s en
las diferentes etapas del proceso de asimilación del estudiante cuando real=
iza
una demostración geométrica (PÉREZ, 2020).
METODOLOGÍA
La inteligencia artificial (IA) es un campo de la informática que se
enfoca en crear sistemas que puedan realizar tareas que normalmente requier=
en
inteligencia humana, como el aprendizaje, el razonamiento y la percepción. =
Las
inteligencias artificiales utilizan algoritmos y modelos matemáticos para
procesar grandes cantidades de datos y tomar decisiones basadas en patrones=
y
reglas establecidas a través del aprendizaje automático, que es la capacida=
d de
una máquina para aprender de forma autónoma a partir de datos sin ser
programada específicamente para hacerlo (BOELL, 2025). De esta manera la IA
puede mejorar su precisión y eficiencia con el tiempo[1].
El aprendizaje automático es un subconjunto de inteligencia artifici=
al
que permite que un sistema aprenda y mejore de forma autónoma mediante redes
neuronales y aprendizaje profundo (VILLALOBOS-MURILLO, 2025), sin tener que=
ser
programado explícitamente, a través de la ingesta de grandes cantidades de
datos. El aprendizaje automático es el proceso mediante el cual se usan mod=
elos
matemáticos de datos para ayudar a un equipo a aprender sin instrucciones
directas. Usa algoritmos para identificar patrones en los datos, y esos
patrones luego se usan para crear un modelo de datos que puede hacer
predicciones (ROMERO IBARRA, 2025). Con más experiencia y datos, los result=
ados
del aprendizaje automático son más precisos, de forma muy similar a como los
humanos mejoran con más práctica[2]=
,[3].
Weka
Weka es una plataforma de software p=
ara
el aprendizaje automático y la minería de datos escrito en Java y desarroll=
ado
en la Universidad de Waikato. Weka
es un software libre distribuido bajo la licencia GNU-GPL. Es un entorno pa=
ra
experimentación de análisis de datos que permite aplicar, analizar y evaluar
las técnicas más relevantes de análisis de datos, principalmente las
provenientes del aprendizaje automático, sobre cualquier conjunto de datos =
del
usuario[4]. Se usó para realizar la ejecuc=
ión
de los algoritmos de aprendizaje automático y selección de atributos (CASSA=
LES,
2025).
Algoritmos de Clasificación
Bayes:
Naive Bayes es un clasificador
probabilístico basado en el teorema de Bayes, que incorpora una serie de
supuestos simplificadores, entre los cuales destaca la hipótesis de
independencia condicional entre las variables predictoras. Estas
simplificaciones permiten reducir significativamente la complejidad
computacional del modelo, lo que lo convierte en una herramienta eficiente y
ampliamente utilizada en tareas de clasificación, pese a que dicha
independencia rara vez se cumple de forma estricta en escenarios reales
(ODDLEIFSON, 2025; GUTIÉRREZ, 2017). El Naive B=
ayes
Simple corresponde a una implementación básica de este enfoque, en la cual =
los
atributos numéricos se modelan mediante distribuciones normales. Esta varia=
nte
resulta especialmente adecuada cuando las variables presentan un comportami=
ento
aproximadamente gaussiano y se dispone de conjuntos de datos de tamaño
moderado.
Por su parte, el Naive Bayes Updateable es=
una
extensión del clasificador tradicional que permite la actualización increme=
ntal
del modelo a medida que se incorporan nuevos datos, mediante el uso de
estimadores estadísticos. Esta característica lo hace idóneo para entornos
dinámicos o sistemas que requieren aprendizaje continuo (ABDULAMEER, 2025).
Finalmente, BayesNet o red bayesiana es un mode=
lo
gráfico probabilístico que representa un conjunto de variables aleatorias y=
sus
dependencias condicionales mediante un grafo acíclico dirigido (DAG) (ZHANG,
2025). Este tipo de modelo constituye una de las principales notaciones par=
a la
representación causal, y resulta especialmente adecuado para el razonamiento
bajo incertidumbre. Las redes bayesianas permiten, por ejemplo, inferir la
probabilidad de diferentes causas a partir de la observación de ciertos
efectos, como en el caso del diagnóstico de enfermedades a partir de síntom=
as
observados (VERMA,
2025; PRADEEPKUMAR, 2025; BAYAS, 2019).
Algoritmos basados en funciones<= o:p>
RBFNetwork<=
span
class=3D01CuerpoESP03TEXTOS> (Red de Funciones de Base Radia=
l)
es un tipo de red neuronal artificial que emplea funciones de base radial p=
ara
modelar la relación entre las variables de entrada y salida. Estas funcione=
s se
caracterizan por depender de la distancia entre un punto de entrada y un ce=
ntro
definido, lo que permite capturar relaciones no lineales de manera eficient=
e.
Las redes RBF son especialmente útiles en problemas de clasificación y
regresión donde los datos presentan estructuras locales bien definidas (MAI=
,2025).
SMO (Sequential Minimal Optimization) es un algoritmo diseñado para resolver =
el
problema de programación cuadrática que surge durante el entrenamiento de l=
as
Máquinas de Vectores de Soporte (SVM). SMO descompone el problema global en
subproblemas más pequeños y manejables, lo que elimina la necesidad de util=
izar
costosos solucionadores externos de programación cuadrática (RAWAT, 2025). =
SPegasos
Algoritmos perezosos
El algoritmo IBk no construye un modelo,=
sino
que genera una predicción para una instancia de prueba justo a tiempo. El
algoritmo IBk utiliza una medida de distancia p=
ara
localizar instancias "cercanas" en los datos de entrenamiento para
cada instancia de prueba y usa esas instancias seleccionadas para hacer una
predicción. Es un método de aprendizaje automático que pertenece al grupo de
algoritmos de clasificación de instancias cercanas (k-NN). En español, IBK =
se
conoce como "IBK" o "k-NN". Este algoritmo se utiliza p=
ara
clasificar nuevas instancias en función de su cercanía con una base de datos
existente (SYRIOPOULOS, 2025).
Reglas
ConjunctiveRule es un algoritmo de aprendizaje
basado en una única regla conjuntiva capaz de predecir clases tanto numéric=
as
como nominales. Este enfoque utiliza el operador lógico AND para combinar l=
os
atributos de entrada, de modo que la clasificación se realiza a partir de la
conjunción de los antecedentes con el valor de la clase como consecuente
(HUYNH, 2025; ESCALANTE, 2012). Las Decision Ta=
bles
constituyen una representación estructurada y concisa de reglas de decisión=
que
especifican las acciones a ejecutar bajo determinadas condiciones. Su
funcionamiento es equivalente al de otros enfoques como los árboles de deci=
sión
o las estructuras condicionales if–then–else y switch–case,
facilitando la interpretación y aplicación de las reglas resultantes (KOUSA=
R,
2025). ZeroR es un clasificador de referencia que asigna siempre la clase m=
ás
frecuente del conjunto de datos, sin considerar los atributos de entrada.
Aunque su simplicidad limita su capacidad predictiva, resulta útil como lín=
ea
base para evaluar el desempeño de otros algoritmos de clasificación
(PANTHAKKAN, 2025).
DTNB es un clasificador híbrido que combina una tabla de decisión co=
n el
algoritmo Naive Bayes. Durante el proceso de
aprendizaje, el modelo evalúa distintas particiones de los atributos, asign=
ando
un subconjunto a la tabla de decisión y otro al clasificador bayesiano, con=
el
objetivo de maximizar el rendimiento predictivo (AKSHITHA, 2025). JRip implementa un método de inducción de reglas basa=
do en
el algoritmo RIPPER, que genera de forma iterativa un conjunto de reglas pa=
ra
cada clase del conjunto de datos. El proceso se repite hasta que todas las
clases han sido cubiertas, aplicando técnicas de reducción de error para
mejorar la generalización del modelo (KUMAR, 2025). NN=
ge
es un algoritmo de clasificación inspirado en el enfoque de vecinos más
cercanos, que utiliza ejemplos generalizados no anidados. Esta estrategia e=
vita
la sobregeneralización al impedir la superposic=
ión o
anidamiento de ejemplos durante el proceso de aprendizaje (HAMAD, 2025). PA=
RT
es un algoritmo de inducción de reglas que extrae conocimiento a partir de
árboles de decisión parciales, generando reglas fácilmente interpretables
(KAUR, 2025). Finalmente, Ridor implementa un
aprendizaje basado en reglas con excepciones. El algoritmo genera inicialme=
nte
una regla por defecto y, posteriormente, identifica y añade excepciones que
minimizan la tasa de error, seleccionando aquellas que ofrecen el mejor
compromiso entre precisión y simplicidad (LANDGE, 2025).
Tree
DecisionStump es un modelo de aprendizaje
automático que consiste en un árbol de decisión de un solo nivel, formado p=
or
un único nodo interno (raíz) conectado directamente a las hojas. Debido a su
simplicidad, suele emplearse como clasificador base en métodos de boosting
(AYYAPPAN, 2025). REPTree es un algoritmo de
inducción de árboles de decisión y regresión que extiende el método C4.5
mediante el uso de poda por error reducido. Construye árboles utilizando
criterios de ganancia o reducción de varianza, maneja valores faltantes
mediante la división de instancias y procesa atributos numéricos consideran=
do
un único punto de corte a la vez (KALAISELVI, 2025). A=
DTree
(Alternating=
i> Decision =
Tree)
es una generalización de los árboles de decisión tradicionales que alterna
nodos de decisión y nodos de predicción. Este enfoque permite combinar
múltiples reglas de decisión, siendo necesario ajustar manualmente el númer=
o de
iteraciones para equilibrar la complejidad del modelo y su precisión. Su
construcción ha sido optimizada mediante técnicas heurísticas para acelerar=
el
aprendizaje (NANDWANA, 2025; ESCALANTE, 2012).
BFTree (Best-First
Tree) es un algoritmo de aprendizaje basado en árboles que emplea una
estrategia de expansión best-first
y se caracteriza por una estructura compuesta por un nodo raíz, nodos inter=
nos
y hojas, ofreciendo robustez y buen desempeño predictivo (SHANMUGAM, 2025).=
J48
es una implementación en Java del algoritmo C4.5, ampliamente utilizada par=
a la
construcción de árboles de decisión podados o no podados. Emplea el criteri=
o de
relación de ganancia para seleccionar atributos, admite datos numéricos e
incompletos y aplica técnicas de postpoda para
mejorar la generalización del modelo (PRASAD, 2025; ABASZADE, 2017). J48gra=
ft
es una implementación de código abierto del algoritmo C4.5 incluida en la
herramienta de minería de datos WEKA, que extiende J48 incorporando mecanis=
mos
adicionales para mejorar la estructura del árbol. LADT=
ree
es un algoritmo que genera árboles de decisión alternativos para problemas
multiclase, utilizando la estrategia LogitBoost=
como
método de aprendizaje base (WANKHEDE, 2025; DOTA, 2015). NBTree
es un clasificador híbrido que combina árboles de decisión con clasificador=
es Naive Bayes en los nodos hoja, permitiendo capturar t=
anto
relaciones estructurales como probabilísticas en los datos (SHAHID, 2025; B=
ALA,
2003). Random Forest es un método de aprendizaje en conjunto que combina
múltiples árboles de decisión generados de forma aleatoria para producir una
única predicción. Su capacidad para manejar problemas de clasificación y
regresión, junto con su robustez frente al sobreajuste, ha favorecido su am=
plia
adopción (ABDULRAHMAN, 2025; MARÍN-CASTRO, 2017). Finalmente, Random Tree e=
s un
árbol de decisión construido mediante un proceso estocástico, en el que en =
cada
nodo se selecciona aleatoriamente un subconjunto de atributos (KILINÇ, 2026=
).
Descripción de las Bases de
conocimiento o de casos
Se tiene una base de conocimient=
os,
un archivo .csv (Examen), que contienen los
resultados de las notas de la pregunta de trigonometría del examen de ingre=
so
del año 2021-2022 de todos los estudiantes preuniversitarios de la provincia
Camagüey. Estas bases tienen 22 atributos y 203 instancias La división entr=
e la
cantidad de instancias da como resultado lo que se conoce como radio de
desbalance (IR). Al realizar esta comprobación en la base de datos se obtuv=
o un
radio de desbalance de 1.2 (la relación entre la cantidad de estudiantes
aprobado / desaprobados), lo que demuestra que la misma está balanceada. Los
atributos de la base de conocimientos se describen a continuación, ver tabl=
a 1:
Tabla
1 Descripción de los atributos de la base de conocimientos: Examen=
i>
|
Variables |
Tipo |
Valores |
|
a) 1. Por sustituir |
Nominal |
I,PC,C |
|
2-Por expresa=
r un
cuarto a la menos uno como 4 |
Nominal |
I,PC,C |
|
3-Por aplicar
producto de potencias de igual base en MD |
Nominal |
I,PC,C |
|
4- Por igualar
los exponentes |
Nominal |
I,PC,C |
|
5- Por obtener
ecuación (1) |
Nominal |
I,PC,C |
|
6- Por elevar
ambos miembros al cuadrado |
Nominal |
I,PC,C |
|
7- Por obtener
ecuación (2) |
Nominal |
I,PC,C |
|
8- Por factor=
izar |
Nominal |
I,PC,C |
|
9- Por igualar
cada factor a cero la ecuación (2) |
Nominal |
I,PC,C |
|
10- Por desec=
har senx igual a cero |
Nominal |
I,PC,C |
|
11- Por halla=
r la
solución senx igual a 1 |
Nominal |
I,PC,C |
|
12- Por compr=
obar |
Nominal |
I,PC,C |
|
13-Por conjun=
to
solución |
Nominal |
I,PC,C |
|
b)14-Sustituir |
Nominal |
I,PC,C |
|
15-Por expres=
ar 4
como dos a la dos |
Nominal |
I,PC,C |
|
16- Por Aplic=
ar
la propiedad de los logaritmos |
Nominal |
I,PC,C |
|
17-Por identi=
dad
de logaritmos |
Nominal |
I,PC,C |
|
18-Por obtene=
r el
M.I |
Nominal |
I,PC,C |
|
19-Por conclu=
ir |
Nominal |
I,PC,C |
|
Clase |
Nominal |
Aprobado/ Des=
aprobado |
Nota: I
– insuficiente, PC – poco conocido, C - conocido
El
atributo Clase contiene la clasificación de los estudiantes teniendo en cue=
nta
si aprobaban o no esa pregunta de trigonometría. El atributo Puntuación
contiene los puntos obtenidos en esa pregunta.
Val=
idación
cruzada (cross=
-validation):
La validación cruzada es una técnica para evaluar modelos de ML mediante el
entrenamiento de varios modelos de ML en subconjuntos de los datos de entra=
da
disponibles y evaluarlos con el subconjunto complementario de los datos.
Percentage Split (división porcentual): Dividida aleatoriamente su
conjunto de datos en particiones de entrenamiento y de prueba cada vez que
evalúe un modelo. Esto puede brindarle una estimación muy rápida del
rendimiento y, al igual que usar un conjunto de pruebas suministrado, es
preferible solo cuando tiene un conjunto de datos grande.
RESULTADOS Y DISCUSIÓN
A continuación, se presentan los principales resultados de
investigación, ver tablas 2 y 3:
Tabla 2 Resultados de la clasificación para (% cross-validation=
)
|
Algoritmo |
ACC (Porcentaje de
Clasificación o exactitud) |
AUC (Área debajo =
de
la curva) |
|
BayesNet |
93.5961 |
0.994 |
|
ComplementNaiveBayes |
63.5468 |
0.621 |
|
NaiveBayes |
96.5517 |
0.989 |
|
NaiveBayesSimple |
94.0887 |
0.983 |
|
NaiveBayesUpdateable |
96.5517 |
0.989 |
|
Logistic |
96.5517 |
0.997 |
|
MultilayerPerceptron |
96.5517 |
0.997 |
|
RBFNetwork |
95.5665 |
0.948 |
|
SimpleLogistic |
94.0887 |
0.989 |
|
SMO |
95.0739 |
0.95 |
|
Spegasos |
95.5665 |
0.96 |
|
VotedPerceptron |
81.2808 |
0.821 |
|
IB1 |
90.6404 |
0.904 |
|
IBk |
91.133 |
0.952 |
|
ConjunctiveRule |
81.7734 |
0.805 |
|
DecisionTable |
79.803 |
0.891 |
|
DTNB |
88.67 |
0.954 |
|
JRip |
82.266 |
0.841 |
|
NNge |
86.2069 |
0.859 |
|
OneR |
82.266 |
0.82 |
|
PART |
83.2512 |
0.851 |
|
Ridor |
83.7438 |
0.835 |
|
ZeroR |
55.1724 |
0.488 |
|
ADTree |
87.6847 |
0.956 |
|
BFTree |
84.7291 |
0.884 |
|
DecisionStump |
82.266 |
0.769 |
|
J48 |
79.803 |
0.835 |
|
J48graft |
80.7882 |
0.837 |
|
LADTree |
87.6847 |
0.957 |
|
NBTree |
92.6108 |
0.982 |
|
RandomForest |
90.1478 |
0.969 |
|
RandomTree |
86.6995 |
0.868 |
ACC: En general, los algoritmos de clasificación más precisos fueron=
: BayesNet: 95.0739%, Naive=
Bayes:
96.5517%, Logistic: 96.5517%m Multilayer
Perceptron: 96.5517%; SMO: 95.0739%. Estos algo=
ritmos
obtuvieron una precisión del 95% o superior en al menos una de las dos
solicitudes. Por otro lado, los algoritmos que obtuvieron una precisión más
baja fueron: Complement Na=
ive
Bayes: 63.5468%, OneR: 82.266%, PART: 83.2512%, Ridor<=
/span>:
83.7438%, ZeroR: 55.1724%. Estos algoritmos obtuvieron una precisión del 63=
% o
inferior en al menos una de las dos solicitudes. En resumen, los algoritmos=
de
clasificación más precisos fueron BayesNet,
AUC: En general, los algoritmos de clasificación más precisos en el =
área
debajo de la curva fueron: BayesNet: 0.994 y 0.=
994 Naive Bayes: 0.989 y 0.996, Logi=
stic:
0.997 y 0.992, Multilayer =
Perceptron:
0.997 y 0.994. Estos algoritmos obtuvieron una precisión del 0.98 o superio=
r en
al menos una de las dos solicitudes en el área debajo de la curva. Por otro
lado, los algoritmos que obtuvieron una precisión más baja en el área debaj=
o de
la curva fueron: Complement Naive
Bayes: 0.621 y 0; Naive Bayes Simple: 0.983 y 0=
.996; Naive Bayes Updateable: 0=
.989 y
0.996; RBFNetwork: 0.948 y 0.996; Simple Logistic: 0.989 y 0.991. Estos algoritmos obtuvieron =
una
precisión del 0.62 o inferior en al menos una de las dos solicitudes en el =
área
debajo de la curva. En resumen, los algoritmos de clasificación más preciso=
s en
el área debajo de la curva fueron BayesNet,
Tab=
la 3
Resultados de la clasificación (Percentage Spli=
t)
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
ACC: En general, los algoritmos de clasificación más precisos fueron=
: BayesNet: 92.7536% y 94.2029%, N=
aive
Bayes: 100% y 95.6522%, Logistic: 85,5072% y
91.3043%, Multilayer Perce=
ptron:
94.2029% y 97.1014%, SMO: 91.3043% y 94.2029%. Estos algoritmos obtuvieron =
una
precisión del 92% o superior en al menos una de las dos solicitudes. Por ot=
ro
lado, los algoritmos que obtuvieron una precisión más baja fueron: Complement Naive Bayes: 6=
0.8696%,
OneR: 78.2609% y 75.3623%, PART: 50.7246% y 81.1594%, =
Ridor:
84.058% y 78.2609%, ZeroR: 75.3623% y 50.7246%. Estos algoritmos obtuvieron=
una
precisión del 60% o inferior en al menos una de las dos solicitudes. En
resumen, los algoritmos de clasificación más precisos fueron BayesNet, NaiveBayes,
AUC: En general, los algoritmos de clasificación más precisos en el =
área
debajo de la curva fueron: BayesNet: 0.988 y 0.=
995; Naive Bayes: 1 y 0; Logistic:
0.956 y 0.966; Multilayer =
Perceptron:
0.982 y 0.988. Estos algoritmos obtuvieron una precisión del 0.95 o superio=
r en
al menos una de las dos solicitudes en el área debajo de la curva. Por otro
lado, los algoritmos que obtuvieron una precisión más baja en el área debaj=
o de
la curva fueron: Complement Naive
Bayes: 0.608 y 0.994; Naive Bayes Simple: 0.993=
y
0.994; Naive Bayes Updatea=
ble:
1 y 0.994; RBFNetwork: 0.987 y 0.98; Simple
CONCLUSIONES
El
estudio exploratorio confirma que el análisis automatizado de los resultado=
s en
las pruebas de ingreso de matemáticas constituye una herramienta valiosa pa=
ra
perfeccionar el aprendizaje en el nivel medio superior de Camagüey. Esta
aproximación permite identificar patrones de aprendizaje que contribuyen
directamente a mejorar la calidad de la formación integral de los estudiant=
es
en preuniversitario y secundaria básica. Además, se demostró la viabilidad =
de
utilizar algoritmos de inteligencia artificial para la clasificación precis=
a de
estudiantes (aprobados vs. desaprobados) basándose en su desempeño en pregu=
ntas
específicas de trigonometría. El uso de la plataforma =
Weka
facilitó la identificación de modelos con altos estándares de fiabilidad pa=
ra
el contexto educativo analizado. Asimismo, los algoritmos BayesNet,
NaiveBayes, Logistic, MultilayerPerceptron y SMO se consolidan como las
herramientas más robustas para este dominio, logrando una exactitud (ACC)
superior al 95% en las pruebas de validación. En particular, modelos
probabilísticos como BayesNet y redes neuronale=
s como
Multilayer Perceptron
mostraron una capacidad excepcional para el razonamiento bajo incertidumbre,
alcanzando valores de Área Debajo de la Curva (AUC) de hasta 0.997, lo que
garantiza una discriminación casi perfecta entre las clases analizadas. Por
otro lado, los resultados revelan que clasificadores básicos o de reglas
simples, como Complement N=
aive
Bayes, OneR y ZeroR, son insuficientes para capturar la complejidad de los
datos educativos analizados, con precisiones que descendieron hasta el 63% o
inferior. Esto sugiere que la naturaleza de la evaluación del aprendizaje
matemático requiere modelos capaces de procesar dependencias no lineales y
múltiples atributos simultáneamente. Finalmente, la integración de técnicas=
de
aprendizaje automático en la evaluación nacional permite trascender el anál=
isis
tradicional de frecuencia de errores. Esta metodología ofrece una visión más
profunda sobre el proceso de asimilación del estudiante, permitiendo a los
docentes tomar decisiones informadas para fortalecer la enseñanza de la
geometría y la trigonometría antes del ingreso a la educación superior.
REFERENCIAS
Aguilar, J. F. Á. (2020). Minería de datos educativos: Una propuesta=
de
innovación en la inspección educativa. Supervisión 21, 57(57), 8-8.
=
Abaszade, M., Maftonian, M., Babaee, M. y Fadaee, M. (2017). Investigación de la precisión de l=
os
algoritmos heurísticos y la regresión logit lin=
eal
para predecir el tipo de comentario del auditor. Inves=
tigaciones modernas=
span> en Accounting Journal , 4,=
39-73.
Abdulameer, A. G., Hammood, A. S., Abdulwahed, F. M., & Ayyash, A. A. (2025). Naïve =
Bayes
algorithm for timely fault diagnosis in helical gear transmissions using
vibration signal analysis. International Journal on Interactive Design and
Manufacturing (IJIDeM), 19(5), 3695-3706.
Abdulrahman, S. A., & Khlebis, S. F.
(2025). Models of Machine Learning to Diagnose Chronic Kidney disease using=
a
WEKA-based Classifier. Mesopotamian Journal of Artificial Intelligence in
Healthcare, 2025, 39-47.
Akshitha, K., Rao, T., Kodiaplli, A., Arabu, U., Reddy, K. R., Ikram, M., & Bahl, A. (2=
025,
April). Analysis of the performance of terrorism classification using machi=
ne
learning. In AIP Conference Proceedings (Vol. 3157, No. 1, p. 080007). AIP
Publishing LLC.
Ayyappan, G., & Sathish, B. (2025, June). AI-Driven Brain Tumor
Prediction using Feature Extraction and Machine Learning Classifiers. In 20=
25
3rd International Conference on Self Sustainable Artificial Intelligence
Systems (ICSSAS) (pp. 1314-1320). IEEE.
Bayas, B. O., & Zambrano-Vega, C. (2019). Nuevo clasificador
bayesiano simple para el análisis de datos educativos. Universidad y Sociedad, 11(2),
278-285.
Bala, J., K. C. Chang, A. Williams And Y. Weng (2003). A Hybrid Baye= sian Decision Tree for Classification. Workshop on Probabilistic Graphical Models for Classification, Cavtat-Dubrovnik, Croatia.<= o:p>
Boell, M. (2025). La relación con el saber y la inteligencia artific=
ial
en la educación superior. Trayectorias Universita=
rias,
11.
=
Binsawad, M. (2025). Enhanced Financial Fraud Detection Using an Adaptive Vo=
ted
Perceptron Model with Optimized Learning and Error Reduction. Electronics,
14(9), 1875.
=
Cambazard, H., Catusse, N., =
Chomez,
A., & Lagrange, A. M. (2025). Logistic regression to boost exoplanet
detection performances. Monthly Notices of the Royal Astronomical Society,
536(2), 1610-1624.
Castillo, M. C. (2024). Elementos de Lógica: aplicados al proceso de enseñanza y aprendizaje=
. Editorial U=
niversitaria
(Cuba).
=
Cassales, G. W., Liu, J. J., & Bifet, A. (20=
25). Accelerated
weka: GPU machine learning with weka
Workbench. Neurocomputing, 130432.
Díaz Cutiño, A. (2022). El tratamiento de los conceptos matemáticos =
en
la unidad: curvas de segundo grado en la enseñanza preuniversitaria (Doctor=
al dissertation, Universidad Matanzas).
Dota, M. A., Cugnasca, C. E., y Barbosa,=
D. S.
(2015). Comparative analysis of decision tree algorithms
on quality of water contaminated
with soil/Analise
comparativa de algoritmos de arvore de decisao =
na classificacao da qualidade da agu=
a
contaminada por solo. Ciencia Rural, 45(2), 267=
-274
Em Pekala (2000.), Dic=
cionario
de estadística (págs. 244-245). Madrid: McGraw-=
Hill.
=
Escalante, H. J., Espinosa Guevara, K., Berrones San=
tos,
J. A., y Saucedo Espinosa, M. A. (2012). Detección automática de fallas de
baleros en un proceso de manufactura: Un estudio comparativo. Ingenierías,
15(55), 15-22.
Francia. Unesco. Conferencia general, 40th. Proclamación de un Año
Internacional de las Ciencias Básicas para el Desarrollo (2022). París, 201=
9.
Disponible en: https://unesdoc.unesco.org/ark:/48223/pf0000371464_spaAcceso=
el
2 de mayo. 2022.
Gallego, A. J., Rico-Juan, J. R., Calvo-Zaragoza, J., Castellanos, F.
J., & Rizo, D. (2019). Desarrollo de un servicio online para el uso de
técnicas de aprendizaje automático orientadas a la detección de anomalías e=
n la
evaluación docente.
Gutiérrez Esparza, G. O., Margain Fuentes, M. D. L., Ramírez Del Rea=
l,
T. A., y Canul Reich, J. (2017). Un modelo basado en el Clasificador Naïve Bayes para la evaluación del desempeño docente.=
RIED.
Revista iberoamericana de educación a distancia.)
Hussain, K., Mehmood, K., Yujun, S., Badshah, T., Anees, S. A., Shah=
zad,
F., ... & Bilal, M. (2025). Analysing LULC
transformations using remote sensing data: insights from a multilayer
perceptron neural network approach. Annals of GIS, 31(3), 473-500
Huynh, V. Q. P., Beck, F., & Fürnkranz, J.
(2025, July). Partial Pre-Post Code Tree: A Memory-Efficient Tree Structure=
for
Conjunctive Rule Mining. In Proceedings of the 31st ACM SIGKDD Conference on
Knowledge Discovery and Data Mining V. 1 (pp. 565-576).
=
Jeyasingh, M. M., Appavoo, K., y Sakthivel, P (2002). Data Mining for Predict=
ion
of Clothing Insulation.
Kumar, M. N., Vijayan, T., & Karthik, B. (2025, February). Ensem=
ble
Classifier-based Intrusion Detection System for WSNs: Optimizing Security
Against Evolving Attacks. In 2025 3rd International Conference on Integrated
Circuits and Communication Systems (ICICACS) (pp. 01-06). IEEE.
Kaur Mangat, P., & Kaur, D. S. (2025). A COMPARATIVE STUDY OF
MACHINE LEARNING CLASSIFIERS FOR STUDENTS'PERFORMANCE PREDICTION. Available=
at
SSRN 5724843.
Kalaiselvi, B. (2025). Effects of Data Augmentation by Replicating
Instances: Classification Performance by Ensembles of Decision Trees.
International Journal of Knowledge Exploration in Computational Intelligenc=
e,
1(1), 22-31.
=
Kılınç, I., Boyacıoğlu, H., & Kılınç, B. (2026, January). Machine
Learning-Based Prediction of Polycyclic Aromatic Hydrocarbon (PAH) Levels in
Smoked Fish Using WEKA: Evaluation of Smoking Parameters and Model Performa=
nce.
In Biology and Life Sciences Forum (Vol. 56, No. 1, p. 1). MDPI.
López, Gj Y Ruiz, I=
m
(2016). Sistemas de líneas base de caracteres y palabras para la detección =
de
ironía en textos breves en español. Procesamiento del Lenguaje Natural , 56 , 41-48.
=
Landge, S. R., & Jain, D. (2025, July). =
span>Machine Learning Approaches to L=
ung
Cancer Prediction: A Comparative Study. In Recent Advances in Artificial
Intelligence for Sustainable Development (RAISD 2025) (pp. 14-23). <=
/span>Atlantis Press.
Marc Sumner, Eibe Frank, Mark Hall(2005):
Acelerar la inducción del árbol modelo logístico. En: Novena Conferencia
Europea sobre Principios y Práctica del Descubrimiento de Conocimiento en B=
ases
de Datos, 675-683, 2005.
Magdaleno, D., Miranda, Y., Fuentes, I. E., y García, M. M. (2015). =
Comparative study of clustering
algorithms using OverallSimSUX similarity function for XML documents. Inteligencia Artificial. Revista
Iberoamericana de Inteligencia Artificial, 18(55), 1-11.
Mihaljevic, B., Bielza Lozoya, M. C., y
Larrañaga Múgica, P. M. (2018). bnclassify:
=
Marin-Castro, H. M., & Franco-Vázquez, P. E.
(2017). Estudio de Herramientas de Minería de Datos para la Tarea de
Clasificación. Universidad Politécnica de Victoria, Av. Nuevas Tecnologías,
5902, 1-9.
Mai, J., Leung, C. S., & Wong, E. (2025). Constructing RBF network based on
interference robust projected gradient. Journal of the Franklin Institute,
107798.
=
Nandwana, B., Pandey, H., Chauhan, D., & Kumari, S. (2025, March). Analy=
zing
Classification Algorithms for Network Intrusion Detection. In 2025 IEEE
International Conference on Interdisciplinary Approaches in Technology and
Management for Social Innovation (IATMSI) (Vol. 3, pp. 1-6). IEEE.
Norouzi, M., & Kahriman, E. A. (2024). A machine learning-based
early diagnosis model for chronic kidney disease using spegasos.
Network Modeling Analysis in Health Informatics and Bioinformatics, 13(1), =
20.
Oddleifson, C., Kilgus, S., Klingbeil, D. A., Latham, A. D., Kim, J.=
S.,
& Vengurlekar, I. N. (2025). Using a naive
Bayesian approach to identify academic risk based on multiple sources: A
conceptual replication. Journal of School Psychology, 108, 101397.
=
Panthakkan
Pradeepkumar, D., Muralidharan, V., Hameed, S. S., & Ravikumar, =
S.
(2025). Milling Tool Condition Monitoring using Vibration Signals and Histo=
gram
Features through Machine Learning: A Comparison of Naive Bayes and Bayes Net
Algorithms. International Journal of Vehicle Structures & Systems (IJVS=
S),
17(2).
Prasad, S., & Arif, M. (2025). Enhancing Classification Efficien=
cy
Using the J48 Decision Tree Algorithm. International Journal of Advanced
Research and Multidisciplinary Trends (IJARMT), 2(1), 174-182.
Rawat, D., Jamwal, A. S., Nara, M., Bajaj, R., & Pawar, L. (2025,
March). Optimized Ensembled Model for Patient Treatment Using Machine Learn=
ing
Techniques. In 2025 3rd International Conference on Disruptive Technologies
(ICDT) (pp. 984-988). IEEE.
Rodríguez, E. P., Vargas, M. A., & Alfaro, M. P. (2026). Análisis de errores algebraicos que manifiestan docentes en formación de la carrera de Enseñanza de l=
a Matemática en la Universi=
dad
Nacional de Costa Rica: Analysis of algebraic errors displayed by mathemati=
cs
teacher trainees in the mathematics education program at the National
University of Costa Rica. <=
span
lang=3DES-MX style=3D'font-size:11.0pt;font-family:"Calibri",sans-serif;mso=
-ascii-theme-font:
minor-latin;mso-hansi-theme-font:minor-latin;mso-bidi-theme-font:minor-lati=
n;
color:#3B3838;mso-themecolor:background2;mso-themeshade:64;mso-ansi-languag=
e:
ES-MX'>Revista Digital: Matemática, Educación e Internet, 26(1)
Romero Ibarra, J. L. (2025). Análisis integral de algoritmos de
clasificación en aprendizaje automático: perspectivas, comparaciones y
aplicaciones. Serie Científica de la Universidad de las Ciencias Informátic=
as,
18(1), 283-304.
Santana, E. R., González, O. L. P., Rincón, M. E. L., & Moran, D=
. G.
(2023). Dificultades conceptuales de los estudiantes del nivel medio superi=
or
en las demostraciones geométricas. Paradigma, 241-263.
Shanmugam, A. E., Kamalakoothan, N. G.,
Kamalakannan, R. K., & Arvind, S. K. (2025, April). Students performance analysis and
focus monitoring system. In AIP Conference Proceedings (Vol. 3279, No. 1, p.
020100). AIP Publishing LLC.
=
Syriopoulos, P. K., Kalampalikis, N. G., Kotsiantis, S. B., & Vrahati=
s,
M. N. (2025). k NN Classification: a review. Annals of mathematics and
artificial intelligence, 93(1), 43-75.
Valdivia Sardiñas, M. D. L. Á., & Almeida Carazo, B. A. (2024). =
Argumentar matemáticamente: habilidad del adiestramiento lógico-lingüístico para aprender=
matemática.
Villalobos-Murillo, J., Garita-González, G., & Alfaro Ramírez, B=
. J.
(2025). Desarrollo de competencias: inteligencia artificial y aprendizaje
automático en prácticas supervisadas de estudiantes en computación. =
Unici=
encia, 39(1), 32-50.
Verma, S., Sharma, A., Jain, S., & Kumar, A. (2025). On the
Improvements of the Performance of Bayes-Net Classification for Diagnosis of
Diabetes: A Cross-validation Approach. Recent Advances in Electrical &
Electronic Engineering, 18(2), 234-243.
Zhang, Y., Dai, W., Yu, H., Liu, S., Hou, J=
., Li,
J., & Lin, W. (2025). ABC: Adaptive BayesNet
Structure Learning for Computational Scalable Multi-task Image Compression.=
arXiv preprint arXiv:2506.15228.
=
=
=
|
Copyright © 2026, Autores=
span>:
Martínez López, Yoan, Cabrera Rodríguez, Heidy, Pérez González, Olga Lidi=
a, de
Castro Lozano, Carlos, Ramírez Uceda, José Miguel, López Correoso, Ana O.=
|
|
|
|
|
|
E=
sta
obra está bajo una licencia de Creative Commons Atribución-No Comercial 4=
.0
Internacional |
=