revista cubana

de transformación digital

RNPS 2487 • ISSN 2708-3411

vꢀꢁ. 4 • Nro. 1 • enero-marzo 2023 • e203

artículo original

Método de extracción automática

de requisitos de software a partir

de información textual no estructurada

Method of Automatic Extraction of Software Requirements

from Non-Structured Textual Information

Amanda Hernández Carreras

ahernandezc@ceis.cujae.edu.cu • https://orcid.org/0000-0002-6776-9434

Alfredo Simón Cuevas

asimon@ceis.cujae.edu.cu • https://orcid.org/0000-0001-9648-6209

Universidad Tecnológica de la Habana “JosÉ anTonio ecHeverrÍa”, cUJae, cUba

Anaisa Hernández González

anaisa@ceis.cujae.edu.cu • https://orcid.org/00000-0003-1169-301X

Universidad de granada, españa

Recibido: 2023-01-19 • Aceptado: 2023-02-26

RESUMEN

La obtención de requisitos es una de las fases más importantes y críticas en el

desarrollo de software, debido a la inﬂuencia de sus resultados en el éxito de los

proyectos. El análisis documental constituye una de las técnicas más utilizadas

en este proceso. La ejecución manual de este análisis se ha caracterizado por el

alto consumo de tiempo y la frecuente aparición de errores, motivando el de-

sarrollo de investigaciones enfocadas en su automatización. El procesamiento

del lenguaje natural para la ingeniería de requisitos es un área de investigación

y desarrollo que busca aplicar técnicas, herramientas y recursos de procesa-

miento del lenguaje natural (PLN) al proceso de ingeniería de requisitos (RE),

para colaborar con los analistas humanos en la realización de diversas tareas

lingüísticas. En el trabajo se presenta un método para la extracción automáti-

ca de requisitos de software, a partir de información textual no estructurada.

El método propuesto se enfoca en el análisis sintáctico apoyado en patrones

léxico-sintácticos, análisis de dependencias y un enfoque basado en la combi-

nación de ambas técnicas de educción. Las métricas de precisión, cobertura

y Medida-F fueron computadas, comparando el requisito que se obtuvo con

Método de extracción automática de requisitos de software a partir

de información textual no estructurada

Hꢀꢁꢂáꢂꢃꢀz cꢄꢁꢁꢀꢁꢄꢅ a., sꢆꢇꢈꢂ cꢉꢀꢊꢄꢅ, a., Hꢀꢁꢂáꢂꢃꢀz gꢋꢂzáꢌꢀz, a.

revista cubana

de transformación digital

el elaborado manualmente por el experto. En esta comparación se empleó la

distancia Levenshtein, usando como umbral de aceptación el 60 %. Los resul-

tados demuestran relevancia en el valor de la precisión, por parte de la técnica

de extracción basada en patrones, así como en la cobertura y Medida-F, para

la solución que integra ambas técnicas de extracción de información.

Palabras clave: captura de requisitos, extracción automática de requisitos,

procesamiento de lenguaje natural.

ABSTRACT

Obtaining requirements is one of the most important and critical phases in

software development, due to the inﬂuence of its results on the success of the

projects. Documentary analysis is one of the most used techniques in this pro-

cess. e manual execution of this analysis has been characterized by the high

consumption of time and the frequent appearance of errors, motivating the

development of investigations focused on its automation. Natural Language

Processing for Requirements Engineering (PLNRE) is an area of research and

development that seeks to apply Natural Language Processing (PLN) techni-

ques, tools, and resources to the Requirements Engineering (RE) process, to help

human analysts to carry out various linguistic tasks. In the work, a method for

the automatic extraction of software requirements, from unstructured textual

information, was presented. e proposed method focuses on syntactic analysis

based on lexical-syntactic patterns, on dependency analysis and an approach

based on the combination of both eduction techniques. e Precision, Coverage

and Measure-F metrics were computed by comparing the requirement that was

obtained, with the one elaborated manually by the expert. In this comparison,

the Levenshtein distance was used, using 60% as the acceptance threshold. e

results obtained demonstrate a relevance in the value of precision by the pat-

tern-based extraction technique, as well as in the coverage and F-measure for

the solution that integrates both information extraction techniques.

Keywords: requirements capture, automatic requirements extraction, natural

language processing.

INTRODUCCIÓN

La Ingeniería de Requisitos (IR) constituye una de las etapas más importantes en el desarro-

llo de proyectos de software, ya que su ciclo de desarrollo está basado fundamentalmente en

Método de extracción automática de requisitos de software a partir

de información textual no estructurada

Hꢀꢁꢂáꢂꢃꢀz cꢄꢁꢁꢀꢁꢄꢅ a., sꢆꢇꢈꢂ cꢉꢀꢊꢄꢅ, a., Hꢀꢁꢂáꢂꢃꢀz gꢋꢂzáꢌꢀz, a.

revista cubana

de transformación digital

cómo se capturan, diseñan, implementan, prueban y despliegan los requisitos. La ocurrencia

de errores en los requisitos especiﬁcados puede provocar numerosas consecuencias, como:

retardo en la terminación del proyecto, incremento de los costos e insatisfacción de los solici-

tantes, entre otros (Shadab, 2014).

Entre las actividades que se llevan en la Ingeniería de Requisitos, la captura de requisitos

es la fase más importante y crítica en el proceso, debido al alto consumo de tiempo que se re-

quiere para su ejecución y el impacto negativo que pueden tener sus resultados en el produc-

to ﬁnal (Hendrik, 2013) (Abbasi et al., 2015), y porque la mayor parte de los sistemas fallan

debido a errores en este proceso de captura (Garg, Agarwal, & Khan, 2015). Para lograr un

producto software de calidad, los requisitos deben satisfacer varias características y cumplir

ciertos criterios. Además, un requisito debería ser completo, correcto, realizable, necesario,

priorizable, no ambiguo y veriﬁcable (Alonso, 2016). La delimitación del alcance del proyecto

constituye otro de los elementos críticos de la captura de requisitos (Bourque, Dupuis, Abran,

Moore, & Tripp, 2014), por lo que con el objetivo de reducir los problemas se han deﬁnido nu-

merosas técnicas y herramientas.

Los requisitos provienen de varias partes interesadas que tienen diferentes necesidades,

funciones y responsabilidades, y como tales son propensas a que se produzcan conﬂictos, por

rejemplo, la interferencia, la interdependencia y la incoherencia (Lamsweerde, Darimont, &

Letier, 1998). Además, los requisitos generalmente se especiﬁcan en lenguaje natural, lo que

aumenta la complejidad de la ingeniería de requisitos, debido a la ambigüedad inherente, la

incompletitud y la inexactitud del lenguaje natural (Denger, Berry, & Kamsties, 2003). Estos

factores hacen que las tareas de IR sean desaﬁantes, lentas y propensas a errores, principal-

mente para proyectos grandes, ya que es necesario procesar, analizar y comprender grandes

volúmenes de requisitos (Vlas & Robinson, 2011).

Se han llevado a cabo muchas investigaciones sobre la automatización de diferentes tareas

de RE (Dalpiaz, Ferrari, Franch, & Palomares, 2018). Los enfoques propuestos generalmente

comienzan aplicando un conjunto de pasos de Procesamiento del Lenguaje Natural (PLN),

que extraen información y características lingüísticas de los textos de requisitos y construyen

varias representaciones basadas en PLN. Este trabajo se centra en la automatización de la ex-

tracción de requisitos, apoyándose en herramientas y técnicas de procesamiento de lenguaje

natural.

En Dalpiaz, Ferrari, Franch, & Palomares (2018) se analizan varias publicaciones sobre la

relación entre las tareas de PLN y IR, y se encontraron trabajos que se centran en la identiﬁ-

cación de defectos de calidad y ambigüedad, clasiﬁcación y agrupación de grandes colecciones

de requisitos, extracción de abstracciones clave, generación de modelos y trazabilidad entre

los requisitos de lenguaje natural (NL).

En Hussain, Kosseim, & Ormandjieva (2008), la metodología destinada a mejorar la detec-

ción de los requisitos no funcionales (RNF) en los documentos de requisitos, usa el Stanford

Parser para derivar morfológicamente las palabras y extraer cinco características sintácticas

de cada una de las instancias de entrenamiento (oraciones) del corpus.

Método de extracción automática de requisitos de software a partir

de información textual no estructurada

Hꢀꢁꢂáꢂꢃꢀz cꢄꢁꢁꢀꢁꢄꢅ a., sꢆꢇꢈꢂ cꢉꢀꢊꢄꢅ, a., Hꢀꢁꢂáꢂꢃꢀz gꢋꢂzáꢌꢀz, a.

revista cubana

de transformación digital

En Rolland & Salinesi (2009), el procedimiento que se desarrolla es el enfoque L’Ecritoire

(

Rolland, Souveyet & Ben-Achour, 1998), con una relación bidireccional. Así como los obje-

tivos pueden ayudar en el descubrimiento de escenarios, los escenarios pueden ayudar en el

descubrimiento objetivo. La solución total está en dos partes; se crean escenarios textuales que

son los que producen un objetivo. La correspondencia entre un patrón semántico y el modelo

de escenario deﬁne la relación entre la forma textual de un escenario y su forma conceptual.

En Murugesh & Jaya (2015), una tarea importante para lograr este objetivo es construir

una ontología consistente en un conjunto de conceptos, es decir, entidades, atributos y rela-

ciones basadas en el dominio de aplicación de interés. La ontología construida aquí representa

el conocimiento del dominio y los requisitos son el subconjunto especializado de este.

En el documento descrito en Shah, Patel, & Jinwala (2016), se propone un enfoque semiau-

tomático llamado RNF-Speciﬁer, cuyo objetivo es generar especiﬁcaciones precisas, a partir de

requisitos informales, incluidos los RNF. El enfoque consta de cinco módulos, a saber, prepro-

cesamiento, resolución de ambigüedades, formación de ontologías, generación de diagramas

UML y clasiﬁcación de RNF. Inicialmente, el ingeniero de requisitos recopila el conocimiento

del dominio de los usuarios por medio de varios enfoques de comunicación: cuestionarios,

entrevistas, lista de chequeo, prototipado, reuniones, entre otros. Una vez ﬁnalizada la fase de

comunicación, el ingeniero de requisitos representa la información recopilada por medio de

archivos de texto, documentos, gráﬁcos o modelos UML (o sea, diagramas de caso de uso, de

clase, de secuencia).

En Meth, Maedche, & Einoeder (2013) se explora cómo la cantidad y el tipo de conoci-

miento afectan la calidad de obtención de requisitos en dos simulaciones consecutivas. La

recuperación puede verse como una medida de completitud, comparando el número de requi-

sitos identiﬁcados con el número total de requisitos existentes en un documento.

El documento (Lili, 2010) propone un método para obtener los requisitos del usuario en la

industria de maquinaria, basado en la regla de asociación de texto. El primer paso es el pre-

procesamiento de datos de los requisitos del usuario. El modelo de espacio vectorial se utiliza

para describir los requisitos del usuario. En segundo lugar, se utiliza una teoría mejorada de

la regla de asociación gris para calcular el grado de correlación entre las palabras caracterís-

ticas y los nombres propios de la industria de la maquinaria. Luego se construye la matriz de

candidatos a nombres propios, seleccionando una palabra de mayor grado de correlación. Fi-

nalmente, el requerimiento del usuario se obtiene utilizando la matriz ponderada.

El método de extracción propuesto por Pablo & Marcos (2012) consta de tres pasos orga-

nizados como una cadena de comandos en una canalización:

1

. Análisis de dependencias: cada frase del texto de entrada se analiza mediante el analiza-

dor basado en dependencias DepPattern (Otero & González, 2011).

2

. Cláusulas constituyentes: para cada oración analizada se descubren las cláusulas ver-

bales que contiene, y luego para cada cláusula se identiﬁcan los participantes verbales,

incluidas sus funciones: sujeto, objeto directo, atributo y complementos preposicionales.

Método de extracción automática de requisitos de software a partir

de información textual no estructurada

Hꢀꢁꢂáꢂꢃꢀz cꢄꢁꢁꢀꢁꢄꢅ a., sꢆꢇꢈꢂ cꢉꢀꢊꢄꢅ, a., Hꢀꢁꢂáꢂꢃꢀz gꢋꢂzáꢌꢀz, a.

revista cubana

de transformación digital

3

. Reglas de extracción: se aplica un conjunto de reglas sobre los componentes de la cláu-

sula para extraer los triples objetivos.

Como conclusión de este análisis se identiﬁcaron varias limitaciones, como la inexisten-

cia de disminución de redundancias entre las frases extraídas, el que no existe procesamiento

para el idioma español y el poco uso de la técnica de extracción de información basada en el

análisis de dependencias.

METODOLOGÍA

En esta investigación fue necesario definir el procedimiento que se debe seguir para des-

cribir el método de extracción automática de requisitos de software que se desarrolla (fi-

gura 1). El proceso inicia cuando el usuario carga un archivo en formato texto, no estruc-

turado, ya sea una entrevista, una descripción de proceso, etc.; seguidamente el texto es

preprocesado, con el objetivo de limpiar el texto de ruido y estandarizar para que pueda

ser procesado computacionalmente. Luego se procede, a partir de ese texto preprocesa-

do, a la extracción de los requisitos candidatos por dos vías, análisis sintáctico basado en

patrones léxico-sintácticos y en el análisis de dependencias, mostrando así una solución

final afirmada en la combinación de ambas técnicas de extracción de información. Estos

requisitos extraídos son filtrados, haciendo uso de una estrategia de reducción de redun-

dancias, que se enfoca en eliminar aquellas frases que sean exactamente iguales y aque-

llas que estén contenidas unas dentro de otras, seleccionando la frase más completa. Este

conjunto de frases, luego de haber sido filtrado, se agrupa formando clústeres, a partir de

la similitud semántica que exista por cada dos pares de frases. Estos clústeres son expor-

tados al usuario en un archivo txt, concluyendo así el proceso de extracción automático

de requisitos de software.

Fꢀꢁ. 1 Fꢂujꢃ ꢄꢅ tꢆꢇꢈꢇjꢃ ꢄꢅ ꢂꢇ ꢉꢃꢂuꢊꢀꢋꢌ ꢍꢆꢃꢍuꢅꢉtꢇ (Fuꢅꢌtꢅ: ꢅꢂꢇꢈꢃꢆꢇꢊꢀꢋꢌ ꢍꢆꢃꢍꢀꢇ).

Método de extracción automática de requisitos de software a partir

de información textual no estructurada

Hꢀꢁꢂáꢂꢃꢀz cꢄꢁꢁꢀꢁꢄꢅ a., sꢆꢇꢈꢂ cꢉꢀꢊꢄꢅ, a., Hꢀꢁꢂáꢂꢃꢀz gꢋꢂzáꢌꢀz, a.

revista cubana

de transformación digital

Preprocesamiento

Como se planteó en la subsección anterior, la solución contará fundamentalmente con un

componente para la preparación o preprocesamiento de la información, haciendo uso de

la biblioteca de Procesamiento de Lenguaje Natural para español, SpaCy (Altinok, 2021).

El componente de preprocesamiento se encargará de limpiar y preparar los datos de tex-

to, para que sea fácil de procesar. Algunos de estos pasos incluyen quitar las puntuacio-

nes, transformar el texto a minúscula y segmentar en oraciones. En la figura 2 se muestra

un diagrama de actividades del preprocesamiento, que inicia cuando el usuario carga un

archivo en formato texto. Entre las principales actividades dentro del módulo de prepro-

cesamiento están:

•

ꢀ Tokenización: esta actividad consiste en dividir el texto sin procesar en pequeños trozos.

La tokenización dividirá el texto plano en palabras.

ꢀ Etiquetado PoS (Part of speech): se encarga de clasiﬁcar las partes de las oraciones en

verbo, sustantivo, adjetivo, preposición, entre otras.

ꢀ Lematización: proceso mediante el cual las palabras de un texto que pertenecen a un

mismo paradigma ﬂexivo o derivativo, son llevadas a una forma normal que representa

a toda la clase. En este caso solo se les realiza a los verbos conjugados.

Fꢀꢁ. 2 dꢀꢇꢁꢆꢇmꢇ ꢄꢅ ꢇꢊtꢀꢎꢀꢄꢇꢄꢅꢉ ꢄꢅꢂ ꢍꢆꢅꢍꢆꢃꢊꢅꢉꢇmꢀꢅꢌtꢃ (Fuꢅꢌtꢅ: ꢅꢂꢇꢈꢃꢆꢇꢊꢀꢋꢌ ꢍꢆꢃꢍꢀꢇ).

Extracción de requisitos candidatos

La extracción de requisitos candidatos se enfoca en el análisis sintáctico basado en patrones

léxico-sintácticos y en el análisis de dependencias, además de una solución ﬁnal aﬁrmada en

la concatenación de ambas técnicas de extracción de información. El ﬂujo de este proceso se

muestra en la ﬁgura 3.

El análisis sintáctico tiene como función etiquetar a cada uno de los componentes sin-

tácticos que aparecen en la oración y analizar cómo las palabras se combinan para formar

Método de extracción automática de requisitos de software a partir

de información textual no estructurada

Hꢀꢁꢂáꢂꢃꢀz cꢄꢁꢁꢀꢁꢄꢅ a., sꢆꢇꢈꢂ cꢉꢀꢊꢄꢅ, a., Hꢀꢁꢂáꢂꢃꢀz gꢋꢂzáꢌꢀz, a.

revista cubana

de transformación digital

construcciones gramaticalmente correctas. El resultado de este proceso consiste en generar

la estructura correspondiente a los sintagmas formados por cada una de las unidades léxicas

que aparecen en la oración.

Fꢀꢁ. 3 dꢀꢇꢁꢆꢇmꢇ ꢄꢅ ꢇꢊtꢀꢎꢀꢄꢇꢄꢅꢉ ꢄꢅꢂ mꢋꢄuꢂꢃ extꢆꢇꢊꢊꢀꢋꢌ ꢄꢅ ꢆꢅquꢀꢉꢀtꢃꢉ ꢊꢇꢌꢄꢀꢄꢇtꢃꢉ (Fuꢅꢌtꢅ: ꢅꢂꢇꢈꢃꢆꢇꢊꢀꢋꢌ ꢍꢆꢃꢍꢀꢇ).

Análisis sintáctico basado en patrones léxico-sintácticos

Un patrón es una descripción de la forma que pueden tomar los lexemas de un token. En este

caso se deﬁne como patrón léxico-sintáctico, a aquella secuencia de etiquetas gramaticales

que identiﬁcan la clasiﬁcación gramatical de cada uno de los tokens que conforman el sintag-

ma que se va a extraer.

Para extraer las frases que dan lugar a los requisitos candidatos, se deﬁnieron previamen-

te un conjunto de patrones léxico-sintácticos, que fueron concebidos a partir de un proceso

estadístico realizado a 40 tesis del curso 2020-2021, de la Facultad de Ingeniería Informática,

de la Universidad Tecnológica de La Habana José Antonio Echeverría (CUJAE), donde fueron

tomados cada uno de los requisitos funcionales de los diagramas de casos de uso, dando lugar

a un total de 555 requisitos funcionales analizados. Estos requisitos fueron procesados por

el analizador sintáctico de la biblioteca de SpaCy y a partir de la etiqueta gramatical de cada

tokens fueron formados los patrones. Finalizado el preprocesamiento del texto, partiendo de

la clasiﬁcación gramatical de cada tokens, se realiza un mapeo con los patrones predeﬁnidos

y se generan las frases que dan lugar a requisitos candidatos.

Método de extracción automática de requisitos de software a partir

de información textual no estructurada

Hꢀꢁꢂáꢂꢃꢀz cꢄꢁꢁꢀꢁꢄꢅ a., sꢆꢇꢈꢂ cꢉꢀꢊꢄꢅ, a., Hꢀꢁꢂáꢂꢃꢀz gꢋꢂzáꢌꢀz, a.

revista cubana

de transformación digital

En la tabla 1 se muestra cada uno de estos patrones léxico-sintácticos, los cuales expresan

la estructura de una frase, por ejemplo, «VERB NOUN» representa la frase «VERBO + SUS-

TANTIVO», tal como se aprecia en el ejemplo: «…analizar muestras…»

Tꢇꢈꢂꢇ 1. pꢇtꢆꢃꢌꢅꢉ ꢂéxꢀꢊꢃ-ꢉꢀꢌtáꢊtꢀꢊꢃ (Fuꢅꢌtꢅ: ꢅꢂꢇꢈꢃꢆꢇꢊꢀꢋꢌ ꢍꢆꢃꢍꢀꢇ)

pꢇtꢆꢋꢌ ꢂéxꢀꢊꢃ-ꢉꢀꢌtáꢊtꢀꢊꢃ

VERB NOUN

ejꢅmꢍꢂꢃꢉ ꢄꢅ fꢆꢇꢉꢅꢉ

«...analizar muestras…»

VER NOUN ADJ

VERB DET NOUN

«…analizar muestras bilógicas…»

«…establecer un diagnóstico…»

VERB NOUN ADP NOUN

VERB NOUN ADP DET NOUN

VERB NOUN ADP NOUN ADJ

VERB NOUN ADP NOUN ADP NOUN

VERB NOUN ADJ ADP NOUN

VERB NOUN VERB DET NOUN ADJ

«…incluir detectores de humo…»

«…recoger datos sobre su estructura…»

«…obtener reportes en tiempo real…»

«…exportar base de datos del día…»

«…gestionar tratamientos asociados al paciente…»

«…reproducir voz alertando el billete reconocido…»

«

…ejecutar nodo que tiene implementado el algoritmo

VERB ADJ PRON VERB ADJ DET NOUN ADJ

RSKkNN…»

VERB ADJ PRON VERB DET NOUN AUX

«…ejecutar nodo que crea el árbol IUR-tree…»

VERB CCONJ VERB DET NOUN ADP NOUN «…salvar y restaurar la base de datos…”

VERB ADV ADP NOUN ADP DET NOUN ADJ «…organizar No. de lista de los estudiantes matriculados…»

VERB NOUN CCONJ NOUN

VERB DET NOUN ADJ

VERB DET NOUN CCONJ DET NOUN

VERB ADP NOUN

«…enviar reclamación o protesta…»

«…explicar la propuesta diseñada…»

«…visualizar las delegaciones y sus atletas…»

«…apelar a sanción…»

VERB NOUN ADJ ADP NOUN ADJ

«…cifrar código binario con contraseña modulada…»

VERB NOUN ADJ ADJ ADP DET NOUN ADP «…obtener código binario original en el buffer de

NOUN

memoria…»

VERB NOUN ADP NOUN ADP NOUN

«…enviar correo de petición de acceso…»

Análisis de dependencias

La idea fundamental de dependencia está basada en que la estructura sintáctica de una frase

consiste en relaciones binarias asimétricas entre las palabras de esa frase (Kübler, McDonald,

&

Nivre, 2009). Por tanto, han de establecerse criterios para deﬁnir qué relaciones de depen-

dencia existen, para distinguir de qué forma están relacionadas dos palabras en una frase y

si esas relaciones están etiquetadas o no. Por tanto, a partir de las relaciones asimétricas y los

diferentes criterios, dada una frase en cualquier lenguaje, se puede establecer un árbol sintác-

tico de dependencias etiquetado, como el del ejemplo que se muestra en la ﬁgura 4. Este árbol

fue generado por el analizador sintáctico de la biblioteca SpaCy ejecutado en Jupyter. En este

ejemplo se observa el análisis de dependencias de la frase en español: «Las universidades con-

sideradas cobran tarifas elevadas». Se puede razonar que dada esa frase y conociendo cierta

información sintáctica de cada uno de los tokens que aparecen en esta, se pueden establecer

distintas relaciones de dependencia, donde la raíz de todas es la acción principal de la frase,

dígase el verbo. Con la información contenida en un árbol de dependencias se pueden reali-

zar múltiples tareas, como simpliﬁcación de textos (Caseli, et al., 2009), reconocimiento de la

implicación textual (Herrera, Peñas, & Verdejo, 2005), detección de conceptos negados en una

frase (Ballesteros, Martín, & Agudo, 2010), etcétera.

Método de extracción automática de requisitos de software a partir

de información textual no estructurada

Hꢀꢁꢂáꢂꢃꢀz cꢄꢁꢁꢀꢁꢄꢅ a., sꢆꢇꢈꢂ cꢉꢀꢊꢄꢅ, a., Hꢀꢁꢂáꢂꢃꢀz gꢋꢂzáꢌꢀz, a.

revista cubana

de transformación digital

Fꢀꢁ. 4 Áꢆꢈꢃꢂ ꢄꢅ ꢄꢅꢍꢅꢌꢄꢅꢌꢊꢀꢇꢉ ꢁꢅꢌꢅꢆꢇꢄꢃ ꢍꢃꢆ ꢅꢂ ꢇꢌꢇꢂꢀzꢇꢄꢃꢆ ꢉꢀꢌtáꢊtꢀꢊꢃ sꢍꢇcy (Fuꢅꢌtꢅ: ꢅꢂꢇꢈꢃꢆꢇꢊꢀꢋꢌ ꢍꢆꢃꢍꢀꢇ).

En el trabajo se usará esta técnica de extracción de información como otra vía para la genera-

ción de los requisitos candidatos. Basándose en lo planteado por Pablo & Marcos (2012), se esta-

rá utilizando un patrón para extraer todas las frases con una misma estructura, la combinación

del verbo en conjunto con el sujeto de la oración y el objeto al que se realiza la acción. El patrón

se forma con las etiquetas de dependencias de la biblioteca SpaCy. Se recorre todo el árbol de

dependencias generado por la biblioteca y se extraen las frases cumpliendo con esa estructura.

Reutilizando el ejemplo mencionado antes, la frase generada por este método de extrac-

ción quedaría como se muestra en la tabla 2.

Tꢇꢈꢂꢇ 2. ejꢅmꢍꢂꢃ ꢄꢅ ꢅxtꢆꢇꢊꢊꢀꢋꢌ uꢉꢇꢌꢄꢃ ꢇꢌáꢂꢀꢉꢀꢉ ꢄꢅ ꢄꢅꢍꢅꢌꢄꢅꢌꢊꢀꢇꢉ (Fuꢅꢌtꢅ: ꢅꢂꢇꢈꢃꢆꢇꢊꢀꢋꢌ ꢍꢆꢃꢍꢀꢇ)

pꢇtꢆꢋꢌ

Fꢆꢇꢉꢅ

VERB + nsubj + obj cobran las universidades consideradas tarifas elevadas

Reducción de redundancias

Se incorpora al ﬂujo de la solución una etapa de reducción de redundancias, como se mues-

tra en la ﬁgura 5, con el objetivo de mejorar la calidad de los requisitos extraídos. Durante la

primera prueba se observó que algunos requisitos extraídos aparecían con la siguiente forma:

[

‘incluir inyecciones’, ‘incluir inyecciones regulares’, ‘incluir inyecciones regulares de insuli-

na’]. Como se observa en el ejemplo, el primer requisito está incompleto al ser comparado con

el segundo, y a su vez, ambos están incompletos al ser comparados con el tercero. Es decir,

desde una vista general de los resultados, los requisitos: [‘incluir inyecciones’, ‘incluir inyec-

ciones regulares’] no son relevantes y pudieran ser eliminados para garantizar la reducción de

reiteraciones en los requisitos extraídos, por lo que se estableció una estrategia de reducción

de redundancias que satisfaga esta condición.

Esta estrategia de reducción de redundancias se basó en dos criterios:

1

. Reducir a una, aquellas frases que hagan referencia a un mismo requisito, seleccionando

de ellas la que abarque la mayor cantidad de información y descartando el resto, criterio

que se corresponde con el ejemplo explicado anteriormente. La justiﬁcación de esta de-

cisión está basada en el hecho de que hay patrones que son un subconjunto de otros.

Método de extracción automática de requisitos de software a partir

de información textual no estructurada

Hꢀꢁꢂáꢂꢃꢀz cꢄꢁꢁꢀꢁꢄꢅ a., sꢆꢇꢈꢂ cꢉꢀꢊꢄꢅ, a., Hꢀꢁꢂáꢂꢃꢀz gꢋꢂzáꢌꢀz, a.

revista cubana

de transformación digital

2

. Reducir a una, aquellas frases que sean completamente iguales, almacenando las restantes

en otro archivo independiente a la solución, debido a que el objetivo de la solución propues-

ta es asistir el trabajo del analista-diseñador del software. Se decidió no eliminar ninguna

frase generada y que sea el especialista encargado quien decida la relevancia de esta.

Agrupamiento

La fase de agrupamiento se incorpora a la solución de extracción de requisitos de softwa-

re, luego que el conjunto de requisitos haya pasado por una estrategia de reducción de re-

dundancias, como se muestra en la ﬁgura 5, con el objetivo de mejorar la visualización de

los resultados para una mayor compresión de estos por el analista. Esta fase se encarga de

agrupar en diferentes clústeres aquellas frases que tengan cierta similitud semántica. Para

ello se usó la métrica de similitud semántica de WordNet Similarity (Miller et al., 1990),

Wu-Palmer y el algoritmo de agrupamiento Hierarchical Agglomerative. Para la evaluación

de la calidad del agrupamiento se usó la métrica Sihlouette (Rousseeuw, 1987). Estas métri-

cas se emplean debido a:

•

ꢀ WordNet Similarity: es un paquete de software disponible gratuitamente, que hace posi-

ble medir la similitud semántica y la relación entre un par de conceptos (o synsets). Pro-

porciona seis medidas de similitud y tres medidas de relación, todas basadas en la base

de datos léxica WordNet. Estas medidas se implementan como módulos de Perl que to-

man como entrada dos conceptos y devuelven un valor numérico que representa el gra-

do en que son similares o relacionados. Tres de estas medidas de similitud se basan en

longitudes de camino entre un par de conceptos: lch (Leacock & Chodorow, 1998), wup

(

Wu & Palmer, 1994) y path. lch encuentra el camino más corto entre dos conceptos y

escala ese valor por la longitud máxima del camino que se encuentra en la jerarquía en

la que ocurren. Wup encuentra la profundidad del subsumidor menos común (LCS) de

los conceptos y luego la escala por la suma de las profundidades de los conceptos indivi-

duales. La profundidad de un concepto es simplemente su distancia al nodo raíz. La ruta

de medida es una línea de base que es igual a la inversa de la ruta más corta entre dos

conceptos (Pedersen, Patwardhan, & Michelizzi).

•

ꢀ El agrupamiento aglomerativo jerárquico es una técnica importante y bien establecida

en el aprendizaje automático no supervisado. Los esquemas de agrupamiento aglomera-

tivo comienzan con la partición del conjunto de datos en nodos únicos y fusionan paso

a paso el par actual de nodos más cercanos entre sí en un nuevo nodo, hasta que queda

un nodo ﬁnal que comprende todo el conjunto de datos (Mullner, 2011).

1

ꢀ El valor de Sihlouette (silueta) es una medida de cuán similar es un objeto a su propio

grupo (cohesión) en comparación con otros grupos (separación). La silueta varía de −1 a

+1, donde un valor alto indica que el objeto está bien emparejado con su propio grupo y

1

https://scikit-learn.org/stable/modules/generated/sklearn.metrics.silhouette_score.html

Método de extracción automática de requisitos de software a partir

de información textual no estructurada

Hꢀꢁꢂáꢂꢃꢀz cꢄꢁꢁꢀꢁꢄꢅ a., sꢆꢇꢈꢂ cꢉꢀꢊꢄꢅ, a., Hꢀꢁꢂáꢂꢃꢀz gꢋꢂzáꢌꢀz, a.

revista cubana

de transformación digital

mal emparejado con los grupos vecinos. Si la mayoría de los objetos tienen un valor alto,

la conﬁguración de agrupación en clústeres es adecuada. Si muchos puntos tienen un

valor bajo o negativo, es posible que la conﬁguración de agrupación tenga demasiados o

muy pocos clústeres.

Fꢀꢁ. 5 dꢀꢇꢁꢆꢇmꢇ ꢄꢅ ꢇꢊtꢀꢎꢀꢄꢇꢄꢅꢉ ꢄꢅ ꢂꢃꢉ mꢋꢄuꢂꢃꢉ rꢅꢄuꢊꢊꢀꢋꢌ ꢄꢅ ꢆꢅꢄuꢌꢄꢇꢌꢊꢀꢇꢉ y aꢁꢆuꢍꢇmꢀꢅꢌtꢃ

(Fuꢅꢌtꢅ: ꢅꢂꢇꢈꢃꢆꢇꢊꢀꢋꢌ ꢍꢆꢃꢍꢀꢇ).

RESULTADOS Y DISCUSIÓN

En el estudio experimental de la solución propuesta se evaluaron los requisitos extraídos de

manera automática, de un grupo de casos de estudio deﬁnidos, comparándolos con los requi-

sitos extraídos de forma manual, por un especialista en la materia, de dichos casos de estudios.

Se llevó a cabo la evaluación de estos, empleando las métricas habituales en la clasiﬁcación de

texto, llamadas precisión (P), cobertura (C) y Medida-F (F).

Marco de evaluación

El proceso consiste en comparar sintácticamente los requisitos extraídos de forma manual

con los requisitos extraídos automáticamente. Para ello se usó la métrica de similitud semán-

tica Levenshtein, con un umbral de similitud de 60 %. Esta métrica evalúa la distancia entre

dos cadenas y se usa cuando se quiere identiﬁcar que una cadena es o no la misma que otra.

En este caso, estamos comparando cadenas obtenidas automáticamente contra las obtenidas

por un experto.

Para llevar a cabo la evaluación se ﬁjaron los siguientes objetivos:

•

ꢀ Analizar los resultados al aplicar cada una de las técnicas de extracción de información

en cada uno de los casos de prueba.

Método de extracción automática de requisitos de software a partir

de información textual no estructurada

Hꢀꢁꢂáꢂꢃꢀz cꢄꢁꢁꢀꢁꢄꢅ a., sꢆꢇꢈꢂ cꢉꢀꢊꢄꢅ, a., Hꢀꢁꢂáꢂꢃꢀz gꢋꢂzáꢌꢀz, a.

revista cubana

de transformación digital

•

ꢀ Evaluar el comportamiento de las diferentes técnicas de extracción de información con

cada métrica.

ꢀ Evaluar el comportamiento promedio de los resultados para determinar cuál es la mejor

de las técnicas para la extracción de requisitos de software.

Métricas de análisis de resultados

En la literatura revisada no se identiﬁcaron variantes para medir los resultados de este tipo de mé-

todos, por tanto, como parte de este trabajo, se deﬁnieron un conjunto de métricas, tomando como

base las comúnmente usadas en soluciones de extracción de información: precisión (P), cobertura

(

C) y Medida-F (F). Las métricas son computadas a partir de la comparación entre los requisitos que

se extraen de forma automática, con los requisitos deﬁnidos para cada texto del conjunto de prueba.

•

ꢀ Precisión (P): permite evaluar con que precisión los requisitos extraídas se pueden tomar

realmente como los adecuados. La precisión brinda la proporción de requisitos funcio-

nales extraídos correctamente (requisitos_extraidos_correctos) del total de los requisitos

extraídos, y se calcula como se muestra en la fórmula:

•

ꢀ Cobertura (C): permite evaluar la medida en la que se cubren los requisitos extraídos

automáticamente en comparación con los requisitos identiﬁcados manualmente (requi-

sitos_correctos) y se calcula como se muestra en la fórmula:

•

ꢀ Medida-F (F): permite otorgarle una evaluación general a la propuesta, a partir de las dos

métricas deﬁnidas anteriormente. Un mayor valor de Medida-F signiﬁca un valor razo-

nablemente mayor de la precisión y la cobertura, dado que se corresponde con la media

harmónica de estas dos, y se calcula como se muestra en la fórmula:

Tomando en consideración que los requisitos incluidos en la colección de prueba fueron

elaborados manualmente y puede que no se expresen exactamente como aparece en el texto,

se consideró utilizar un enfoque optimista en el proceso de comparación entre los requisitos.

En concreto, se empleó la distancia Levenshtein para realizar la comparación entre los dos

requisitos, usando como umbral de aceptación el 60 %.

Descripción de la colección de pruebas

La solución propuesta fue evaluada, tomando como referencia la extracción manual de requi-

sitos de software de un conjunto de casos de pruebas, que divergen en dominios y abordan

Método de extracción automática de requisitos de software a partir

de información textual no estructurada

Hꢀꢁꢂáꢂꢃꢀz cꢄꢁꢁꢀꢁꢄꢅ a., sꢆꢇꢈꢂ cꢉꢀꢊꢄꢅ, a., Hꢀꢁꢂáꢂꢃꢀz gꢋꢂzáꢌꢀz, a.

revista cubana

de transformación digital

diferentes temáticas, que se deﬁnieron previamente por el equipo de trabajo (tabla 3). Estos

requisitos fueron comparados sintácticamente con los extraídos de forma automática, y se

obtuvo una tercera lista de requisitos. Posteriormente se evalúan los resultados y se usan las

métricas de evaluación recisión, cobertura y Medida-F.

Tꢇꢈꢂꢇ 3. dꢅꢉꢊꢆꢀꢍꢊꢀꢋꢌ ꢄꢅ ꢊꢇꢉꢃꢉ ꢄꢅ ꢅꢉtuꢄꢀꢃ (Fuꢅꢌtꢅ: ꢅꢂꢇꢈꢃꢆꢇꢊꢀꢋꢌ ꢍꢆꢃꢍꢀꢇ)

cꢇꢆꢇꢊtꢅꢆíꢉtꢀꢊꢇꢉ

ꢃꢆꢇꢊꢀꢃꢌꢅꢉ ꢍꢇꢂꢇꢈꢆꢇꢉ ꢆꢅquꢀꢉꢀtꢃꢉ

cꢇꢉꢃꢉ ꢄꢅ ꢍꢆuꢅꢈꢇ

ꢄꢃmꢀꢌꢀꢃ

seguridad

decoración

comunicación

administración

docencia

recreación

docencia

salud

Sistema de seguridad vivienda

Sistema de seguridad evento deportivo

Decoración de interiores

Inversiones en telefonía ﬁja

Distribución de combustible

Gestión cursos de posgrado

Gestión de reservas de casas de campo

Préstamo de libros

Préstamo de video

Salud mental

Atención a niños

Reserva de habitaciones de un hotel

Agencias de viajes

34

22

21

26

67

23

16

13

614

629

503

583

593

1 074

607

408

405

302

296

2 342

2 224

376

17

18

54

18

16

12

6

13

71

96

18

salud

turismo

25

31

6

Sistema de control para una bomba de insulina

salud

Valoración de los resultados

Las métricas de precisión y cobertura son computadas, comparando el requisito que se obtiene

al extraer información del texto, con el elaborado manualmente por el experto. En esa compa-

ración se empleó la distancia Levenshtein y se usó como umbral de aceptación el 60 %. Los re-

sultados de los experimentos realizados con la colección de prueba se muestran en la tabla 4.

Tꢇꢈꢂꢇ 4. rꢅꢉuꢂtꢇꢄꢃꢉ ꢄꢅ ꢂꢇ ꢅꢎꢇꢂuꢇꢊꢀꢋꢌ ꢄꢅꢂ métꢃꢄꢃ ꢅꢌ ꢊꢃꢂꢅꢊꢊꢀꢋꢌ ꢄꢅ ꢍꢆuꢅꢈꢇ (Fuꢅꢌtꢅ: ꢅꢂꢇꢈꢃꢆꢇꢊꢀꢋꢌ ꢍꢆꢃꢍꢀꢇ)

Uꢉꢇꢌꢄꢃ ꢍꢇtꢆꢃꢌꢅꢉ

ꢂéxꢀꢊꢃ-ꢉꢀꢌtáꢊtꢀꢊꢃ

Uꢉꢇꢌꢄꢃ ꢇꢌáꢂꢀꢉꢀꢉ

ꢄꢅ ꢄꢅꢍꢅꢌꢄꢅꢌꢊꢀꢇꢉ

extꢆꢇꢊꢊꢀꢋꢌ ꢈꢇꢉꢇꢄꢇ

ꢅꢌ ꢅꢌfꢃquꢅ híꢈꢆꢀꢄꢃ

p

c

F

p

c

F

p

c

F

Entrevista 1

30,55 55 39,28 21,42 30 24,99 27,41

85 41,46

Entrevista 2

Entrevista 3

33,33 82,35 47,45 31,03 52,94 39,13 32,39 100 52,27

28,57 55,55 37,73 17,64 16,66 17,14 24,52 72,22 36,61

Entrevista 4

26,31 50 34,48 31,57 30 30,76 26,31

75 38,96

Entrevista 5

Entrevista 6

28,94 61,11 39,28 27,27 33,33 30 27,86 94,44 43,03

35,44 51,85 42,1 47,45 51,85 49,55 38,84 100 55,5

41,37 34,28 37,5 4,54 2,85 3,5 26,53 37,14 30,95

59,25 88,88 71,11 31,25 27,77 29,41 51,28 100 70,17

67,85 100 82,6 50 44,44 47,05 63,41 100 88,13

17,39 30,76 22,22 15.38 15,38 15,38 15,15 38,46 21,73

Descripción de proceso 1

Descripción de proceso 2

Descripción de proceso 3

Descripción de proceso 4

Descripción de proceso 5

Entrevista 7

16,66 26,66 20,51 23,07 20 21,42 18,18 40

25

23,95 92 38,01 21,12 60 31,24 24,34 100 41,8

45,34 100 66,66 17,7 54,83 26,77 31,01 100 51,85

Entrevista 8

Descripción de proceso 6

pꢆꢃmꢅꢄꢀꢃ

2

0 66,66 30,76 6,25 16,66 9,09 16,21 100 31,81

3

3,93 63,94 43,55 24,69 32,62 26,82 30,25 81,59 44,98

Método de extracción automática de requisitos de software a partir

de información textual no estructurada

Hꢀꢁꢂáꢂꢃꢀz cꢄꢁꢁꢀꢁꢄꢅ a., sꢆꢇꢈꢂ cꢉꢀꢊꢄꢅ, a., Hꢀꢁꢂáꢂꢃꢀz gꢋꢂzáꢌꢀz, a.

revista cubana

de transformación digital

De manera general:

•

ꢀ La mayor precisión la muestra el análisis basado en patrones léxicos sintácticos.

ꢀ El valor más elevado de cobertura lo expone el método que combina ambas técnicas de

extracción de información.

•ꢀ El mayor valor de la Medida-F también se aprecia en el enfoque híbrido.

Al analizar el comportamiento promedio de los resultados es posible notar que la técnica

de extracción de información basada en patrones léxicos sintácticos, reporta el mejor com-

portamiento en cuanto a la medida precisión, lo que signiﬁca que esta técnica tuvo una ma-

yor exactitud en el proceso de extracción de requisitos funcionales.

Sin embargo, las métricas de cobertura y Medida-F reportan mayores resultados con el mé-

todo que integra ambas técnicas de extracción de información. Esto implica que, teniendo en

cuenta la medida precisión, el método que combina ambas técnicas abarcó mayor cantidad de

requisitos funcionales en el proceso de extracción.

CONCLUSIONES

En este trabajo se propuso una solución para la extracción automática de requisitos de software,

a partir de información textual no estructurada. El diseño de solución que se formuló empleó

dos técnicas de extracción de información, dígase análisis sintáctico basado en patrones léxi-

cos-sintácticos y análisis de dependencias, así como una solución ﬁnal basada en la combinación

de estas dos técnicas. Se presentaron los resultados preliminares luego de ser realizada una eva-

luación a la solución, con la colección de pruebas confeccionada por el experto, que reúne entre-

vistas o descripciones de procesos y el conjunto requisitos funcionales extraídos manualmente,

que permiten corroborar la precisión y cobertura de los resultados atendiendo a las 3 métricas

computadas: precisión, cobertura y Medida-F. El análisis de los datos muestra que en prome-

dio se obtienen mejores resultados con la técnica de extracción basada en patrones léxicos-sin-

tácticos. Se muestra un mayor valor de presión con la técnica de patrones; sin embargo, el mayor

valor de cobertura lo arroja la solución híbrida.

REFERENCIAS

Alonso Toro Lazo, J. G. (2016). Especiﬁcación de requisitos de software: Una mirada desde la

revisión teórica de antecedentes. Entre Ciencia e Ingeniería, 10(19): 108-115.

Altinok, D. (2021). Mastering SpaCy. Birmingham: Packt Publishing Ltd.

Ballesteros, M., Martín, R., y Agudo, B. D. (2010). JadaWeb: A CBR System for Cooking Recipes.

En Proceedings of Workshop on Computer Cooking Contest (ICCBR 2010). Italy, p. 179.

Bourque, P., Dupuis, R., Abran, A., Moore, J., y Tripp, L. (2014). Guide to the Software Engi-

neering - Body of Knowledge. Recuperado de: http://www. swebok. org.

Método de extracción automática de requisitos de software a partir

de información textual no estructurada

Hꢀꢁꢂáꢂꢃꢀz cꢄꢁꢁꢀꢁꢄꢅ a., sꢆꢇꢈꢂ cꢉꢀꢊꢄꢅ, a., Hꢀꢁꢂáꢂꢃꢀz gꢋꢂzáꢌꢀz, a.

revista cubana

de transformación digital

Caseli, H., Pereira, T., Specia, L., Pardo, T., Gasperin, C., y Aluisio, S. (2009). Building a Brazi-

lian Portuguese parallel corpus of original and simpliﬁed texts. Advances in Computatio-

nal Linguistics, Research in Computer Science, 41: 59-70.

Dalpiaz, F., Ferrari, A., Franch, X., y Palomares, C. (2018). Natural Language Processing for

Requirements Engineering. IEEE Software, 35(5): 115-119.

Denger, C., Berry, D., y Kamsties, E. (2003). Higher quality requirements speciﬁcations throu-

gh natural language patterns. Proceedings 2003 Symposium on Security and Privacy, pp.

8

0-90. IEEE.

Gamallo, P. y González, I. (2011). A gramatical formalism based on patterns of Part of speech

tags. International Journal in Corpus Linguistcs, 16(19): 45-71.

Garg, N., Agarwal, P., y Khan, S. (2015). Recent advancements in requirement elicitation and

prioritization techniques. 2015 International Conference on Advances in Computer Engi-

neering and Applications, pp. 237-240, IEEE.

Hendrik Metha, M. B. (2013). e state of the art in automated requirements elicitation. Re-

quisitos_correctos(10): 1695-1709.

Herrera, J., Peñas, A., y Verdejo, F. (2005). Textual Entailment Recognition Based on Depen-

dency Analysis and WordNet. Part of the Lecture Notes in Computer Science book series,

3944, pp. 231-239.

Hussain, I., Kosseim, L., y Ormandjieva, O. (2008). Using Linguistic Knowledge to Classi-

fy Nonfunctional Requirements in SRS documents. Lecture Notes in Computer Science,

5039, pp. 287-298.

Kübler, S., McDonald, R., y Nivre, J. (2009). Dependency Parsing. Synthesis lectures on human

language technologies, 1(1): 1-127.

Lamsweerde, A., Darimont, R., y Letier, E. (1998). Managing conﬂicts in goal-driven require-

ments engineering. IEEE transactions on Software engineering, 24(11): 908-926.

Leacock, C., y Chodorow, M. (1998). Combining local context and WordNet similarity for

word sense identiﬁcation. WordNet: An electronic lexical database, 49(2): 265-283.

Lili. (2010). Research on User Requirements Elicitation Using Text Association Rule. 2010 In-

ternational Symposium on Intelligence Information Processing and Trusted Computing,

pp. 357-359, IEEE

Abbasi, M. A., Jabeen, J., Hafeez, Y., Batool, D., & Fareen, N. (2015). Assessment of Requirement

Elicitation Tools and Techniques by Various Parameters. Software Engineering, 3(2): 7-11.

Meth, H., Maedche, A., y Einoeder, M. (2013). Is Knowledge Power? e Role of Knowledge in

Automated Requirements Elicitation. Advanced Information Systems Engineering: 25th

International Conference, CAiSE 2013, Valencia, Spain, June 17-21, 2013. Proceedings 25,

pp. 578-593, Springer Berlin Heidelberg.

Miller, G., Beckwith, R. Pellbaum, C., Gross, C. y Miller, C. (1990). Introduction to WordNet:

an on-line lexical database. International Journal of Lexicography, 3(4): 235-244.

Mullner, D. (2011). Modern hierarchical, agglomerative clustering algorithms. arXiv preprint

arXiv:1109.2378.

Método de extracción automática de requisitos de software a partir

de información textual no estructurada

Hꢀꢁꢂáꢂꢃꢀz cꢄꢁꢁꢀꢁꢄꢅ a., sꢆꢇꢈꢂ cꢉꢀꢊꢄꢅ, a., Hꢀꢁꢂáꢂꢃꢀz gꢋꢂzáꢌꢀz, a.

revista cubana

de transformación digital

Murugesh, S., y Jaya, A. (2015). Construction of Ontology for Software Requirements Elicita-

tion. Indian Journal of Science and Technology, 8(29).

Pablo, G., y Marcos, G. (2012). Dependency-Based Open Information Extraction. Proceedings

of the joint workshop on unsupervised and semi-supervised learning in NLP, pp. 10-18.

Pedersen, T., Patwardhan, S., y Michelizzi, J. (2004). WordNet::Similarity-Measuring the Re-

latedness of Concepts. AAAI, vol. 4, pp. 25-29.

Rolland, C., y Salinesi, C. (2009). Supporting Requirements Elicitation through Goal/Scenario

Coupling. Conceptual Modeling: Foundations and Applications, 5600, pp. 398-416.

Rolland, C., Souveyet, C. y Ben-Achour, C. (1998). Guiding goal modeling using scenarios.

IEEE Transation Software Engineering, 24, pp. 1055-1071.

Rousseeuw, P. (1987). Silhouettes: a graphical aid to the interpretation and validation of clus-

ter análisis. Journal of Computational and Applied Mathematics, 20: 53-65.

Shadab Khan, A. B. (2014). Systematic Review of Requirement Elicitation Techniques. Inter-

national Journal of Information and Computation Technology. Indian.

Shah, U., Patel, S., y Jinwala, D. (2016). Speciﬁcation of non-functional requirements: A hy-

brid approach. 22nd International Working Conference on Requirements Engineering.

Gothenburg, Sweden.

Vlas, R., y Robinson, W. N. (2011). A Rule-Based Natural Language Technique for Require-

ments Discovery and Classiﬁcation in Open-Source Software Development Projects. 2011

4

4th Hawaii International Conference on System Sciences, pp. 1-10, IEEE.

Wu, y Palmer. (1994). Verb semantics and lexical selection. 32nd Annual Meeting of the As-

sociation for Computational Linguistics. Mexico. arXiv preprint cmp-lg/9406033.

Este obra está bajo una licencia de Creative Commons Atribución-No Comercial 4.0 Internacional