Método de extracción automática de requisitos de software a partir de información textual no estructurada

Autores/as

  • Amanda Hernández Carreras Universidad Tecnológica de la Habana "José Antonio Echeverría"
  • Alfredo Simón Cuevas Universidad Tecnológica de la Habana "José Antonio Echeverría"
  • Anaisa Hernández González Universidad Tecnológica de la Habana "José Antonio Echeverría"

Palabras clave:

captura de requisitos; extracción automática de requisitos; procesamiento de lenguaje natural

Resumen

La obtención de requisitos es una de las fases más importantes y críticas en el desarrollo de software, debido a la influencia de sus resultados en el éxito de los proyectos. El análisis documental constituye una de las técnicas más utilizadas en este proceso. La ejecución manual de este análisis se ha caracterizado por el alto consumo de tiempo y la frecuente aparición de errores, motivando el desarrollo de investigaciones enfocadas en su automatización. El procesamiento del lenguaje natural para la ingeniería de requisitos es un área de investigación y desarrollo que busca aplicar técnicas, herramientas y recursos de procesamiento del lenguaje natural (PLN) al proceso de ingeniería de requisitos (RE), para colaborar con los analistas humanos en la realización de diversas tareas lingüísticas. En el trabajo se presenta un método para la extracción automática de requisitos de software, a partir de información textual no estructurada. El método propuesto se enfoca en el análisis sintáctico apoyado en patrones léxico-sintácticos, análisis de dependencias y un enfoque basado en la combinación de ambas técnicas de educción. Las métricas de precisión, cobertura y Medida-F fueron computadas, comparando el requisito que se obtuvo con el elaborado manualmente por el experto. En esta comparación se empleó la distancia Levenshtein, usando como umbral de aceptación el 60 %. Los resultados demuestran relevancia en el valor de la precisión, por parte de la técnica de extracción basada en patrones, así como en la cobertura y Medida-F, para la solución que integra ambas técnicas de extracción de información.

Citas

Alonso Toro Lazo, J. G. (2016). Especificación de requisitos de software: Una mirada desde la revisión teórica de antecedentes. Entre Ciencia e Ingeniería, 10(19): 108-115.

Altinok, D. (2021). Mastering SpaCy. Birmingham: Packt Publishing Ltd.

Ballesteros, M., Martín, R., y Agudo, B. D. (2010). JadaWeb: A CBR System for Cooking Recipes. En Proceedings of Workshop on Computer Cooking Contest (ICCBR 2010). Italy, p. 179.

Bourque, P., Dupuis, R., Abran, A., Moore, J., y Tripp, L. (2014). Guide to the Software Engineering - Body of Knowledge. Recuperado de: http://www. swebok. org.

Caseli, H., Pereira, T., Specia, L., Pardo, T., Gasperin, C., y Aluisio, S. (2009). Building a Brazilian Portuguese parallel corpus of original and simplified texts. Advances in Computational Linguistics, Research in Computer Science, 41: 59-70.

Dalpiaz, F., Ferrari, A., Franch, X., y Palomares, C. (2018). Natural Language Processing for Requirements Engineering. IEEE Software, 35(5): 115-119.

Denger, C., Berry, D., y Kamsties, E. (2003). Higher quality requirements specifications through natural language patterns. Proceedings 2003 Symposium on Security and Privacy, pp. 80-90. IEEE.

Gamallo, P. y González, I. (2011). A gramatical formalism based on patterns of part of speech tags. International Journal in Corpus Linguistcs, 16(19): 45-71.

Garg, N., Agarwal, P., y Khan, S. (2015). Recent advancements in requirement elicitation and prioritization techniques. 2015 International Conference on Advances in Computer Engineering and Applications, pp. 237-240, IEEE.

Hendrik Metha, M. B. (2013). The state of the art in automated requirements elicitation. Information and Software Technology, 55(10): 1695-1709.

Herrera, J., Peñas, A., y Verdejo, F. (2005). Textual Entailment Recognition Based on Dependency Analysis and WordNet. Part of the Lecture Notes in Computer Science book series, 3944, pp. 231-239.

Hussain, I., Kosseim, L., y Ormandjieva, O. (2008). Using Linguistic Knowledge to Classify Nonfunctional Requirements in SRS documents. Lecture Notes in Computer Science, 5039, pp. 287-298.

Kübler, S., McDonald, R., y Nivre, J. (2009). Dependency Parsing. Synthesis lectures on human language technologies, 1(1): 1-127.

Lamsweerde, A., Darimont, R., y Letier, E. (1998). Managing conflicts in goal-driven requirements engineering. IEEE transactions on Software engineering, 24(11): 908-926.

Leacock, C., y Chodorow, M. (1998). Combining local context and WordNet similarity for word sense identification. WordNet: An electronic lexical database, 49(2): 265-283.

Lili. (2010). Research on User Requirements Elicitation Using Text Association Rule. 2010 International Symposium on Intelligence Information Processing and Trusted Computing, pp. 357-359, IEEE

Abbasi, M. A., Jabeen, J., Hafeez, Y., Batool, D., & Fareen, N. (2015). Assessment of Requirement Elicitation Tools and Techniques by Various Parameters. Software Engineering, 3(2): 7-11.

Meth, H., Maedche, A., y Einoeder, M. (2013). Is Knowledge Power? The Role of Knowledge in Automated Requirements Elicitation. Advanced Information Systems Engineering: 25th International Conference, CAiSE 2013, Valencia, Spain, June 17-21, 2013. Proceedings 25, pp. 578-593, Springer Berlin Heidelberg.

Miller, G., Beckwith, R. Pellbaum, C., Gross, C. y Miller, C. (1990). Introduction to WordNet: an on-line lexical database. International Journal of Lexicography, 3(4): 235-244.

Mullner, D. (2011). Modern hierarchical, agglomerative clustering algorithms. arXiv preprint arXiv:1109.2378.

Murugesh, S., y Jaya, A. (2015). Construction of Ontology for Software Requirements Elicitation. Indian Journal of Science and Technology, 8(29).

Pablo, G., y Marcos, G. (2012). Dependency-Based Open Information Extraction. Proceedings of the joint workshop on unsupervised and semi-supervised learning in NLP, pp. 10-18.

Pedersen, T., Patwardhan, S., y Michelizzi, J. (2004). WordNet::Similarity-Measuring the Relatedness of Concepts. AAAI, vol. 4, pp. 25-29.

Rolland, C., y Salinesi, C. (2009). Supporting Requirements Elicitation through Goal/Scenario Coupling. Conceptual Modeling: Foundations and Applications, 5600, pp. 398-416.

Rolland, C., Souveyet, C. y Ben-Achour, C. (1998). Guiding goal modeling using scenarios. IEEE Transation Software Engineering, 24, pp. 1055-1071.

Rousseeuw, P. (1987). Silhouettes: a graphical aid to the interpretation and validation of cluster análisis. Journal of Computational and Applied Mathematics, 20: 53-65.

Shadab Khan, A. B. (2014). Systematic Review of Requirement Elicitation Techniques. International Journal of Information and Computation Technology. Indian.

Shah, U., Patel, S., y Jinwala, D. (2016). Specification of non-functional requirements: A hybrid approach. 22nd International Working Conference on Requirements Engineering. Gothenburg, Sweden.

Vlas, R., y Robinson, W. N. (2011). A Rule-Based Natural Language Technique for Requirements Discovery and Classification in Open-Source Software Development Projects. 2011 44th Hawaii International Conference on System Sciences, pp. 1-10, IEEE.

Wu, y Palmer. (1994). Verb semantics and lexical selection. 32nd Annual Meeting of the Association for Computational Linguistics. Mexico. arXiv preprint cmp-lg/9406033.

Descargas

Publicado

2023-03-07

Cómo citar

Hernández Carreras, A., Simón Cuevas, A. ., & Hernández González, A. (2023). Método de extracción automática de requisitos de software a partir de información textual no estructurada. Revista Cubana De Transformación Digital, 4(1), e203. Recuperado a partir de https://rctd.uic.cu/rctd/article/view/203

Número

Sección

Articulos originales - Parte I