Redes Neuronales Recurrentes aplicaciones
En este artículo analizaremos las características y aplicaciones de las redes neuronales recurrentes (RNN).
Redes Neuronales Recurrentes aplicaciones
Por Jhessica Katherine Alvarez Salcedo
Como vimos en el artículo anterior Clasificación de Textos utilizando técnicas de Aprendizaje Profundo en el área de PLN, el aprendizaje profundo agrupa varios modelos que han obtenido resultados relevantes en diversas tareas del procesamiento del lenguaje natural, tal es el caso de las Redes Neuronales Recurrentes (RNN).
Una Red Neuronal Recurrente es una arquitectura que permite procesar y obtener información de secuencias mediante el concepto de recurrencia [2], además toman información de inputs anteriores para influenciar los inputs y outputs actuales. Por ejemplo, al escribir con el móvil, el teclado te muestra una serie de palabras como sugerencias a partir de lo que está escrito. Esas sugerencias son las predicciones que se han hecho basándose en los caracteres que fueron escritos con anterioridad [5].
Por lo tanto, el análisis de vídeo, la subtitulación de imágenes, el procesamiento del lenguaje natural y el análisis de la música dependen de las capacidades de las redes neuronales recurrentes, las cuales capturan activamente sus dependencias secuenciales y temporales [4].
Como se mencionó anteriormente, la característica básica de una red neuronal recurrente es que la red contiene al menos una conexión de retroalimentación, por lo que la activación puede fluir en un bucle.
Las RNN, pueden realizar mapeos de uno a muchos, de muchos a muchos (por ejemplo, traducir el habla) y de muchos a uno (por ejemplo, identificar la voz)[4]. Tienen como desventajas el desvanecimiento o explosión del gradiente( errores cometidos a medida que se entrena la red neuronal). Esto provoca que las RNN no sean suficientes para modelar dependencias de gran tamaño[3]. Se encontraron distintas soluciones a este problema, sin embargo no son el enfoque especial de este artículo.
Algunos Trabajos relacionados con las Redes Neuronales
Análisis de firmas, orientado al estudio, diseño, implementación y evaluación de un sistema para identificación de firmas,considerando una firma en su ejecución como una secuencia temporal de puntos[6].
Análisis de secuencias, un estudio de la importancia de las redes recurrentes y de su naturaleza en análisis de secuencias mediante el desarrollo de una plataforma para implementar redes recurrentes dinámicas, con algoritmo de aprendizaje Backpropagation Trough Times[7].
Pronosticar el rendimiento la acción de Ecopetrol, mediante el estudio de varias configuraciones de RNN, incluyendo como variables de entrada la tasa representativa de mercado (TRM), euro (EUR), precio de cierre de la respectiva acción a estimar y los precios del petróleo (Brent y WTI)[8].
Estimación en la Intención de Agarres para la clasificación de señales electromiográficas, con aplicaciones para control de prótesis de mano [9].
Clasificación de documentos, con un modelo capaz de detectar paráfrasis y clasificar una colección de documentos de acuerdo con su género contextual mediante una Red Neuronal Recurrente de Hopfield[10].
Traducción Automática del Español al Inglés usando redes neuronales profundas con información conceptual de sentencias una nueva arquitectura de traducción automática[11].
Clasificación de noticias, para poder clasificar las noticias escritas en español en positivas o negativas, así como también determinar el efecto de las noticias positivas en ellas [12].
Un paso más allá ha sido la creación de redes neuronales artificiales basadas en ADN, capaces de reconocer patrones de comportamiento molecular, tomar decisiones y responder a los estímulos del entorno[13].
Reconocimiento de imágenes, donde se documentan algoritmos que utilizan alguna arquitectura de redes neuronales para tareas de clasificación, reconocimiento o segmentación en imágenes digitales. Esta revisión presenta los distintos modelos de redes así como sus modificaciones y aplicaciones en el procesamiento de imágenes[14].
Finalmente, encontramos múltiples aplicaciones de las redes neuronales artificiales y las RNN, siendo estas últimas de gran importancia al procesar y obtener información de secuencias, al enfocarse en problemas en los que el contexto es muy importante a la hora de predecir tomando información de inputs anteriores para influenciar los inputs y outputs actuales. Una red neuronal recurrente es una arquitectura robusta para analizar información de tipo no estructurado, siendo este el enfoque principal de este y los artículos anteriores.
Referencias
[1] SOTAQUIRÁ, Miguel. Introducción a las Redes Neuronales Recurrentes. Codificando Bits Junio 8, 2019 [citado 2021-11-28]. Disponible en:
https://www.codificandobits.com/blog/introduccion-redes-neuronales-recurrentes/
[2] SOTAQUIRÁ, Miguel. Tutorial: generación de texto con Redes Recurrentes en Python. Codificando Bits Julio 6, 2019 [citado 2021-11-28]. Disponible en:
https://www.codificandobits.com/blog/tutorial-generacion-de-texto-con-redes-recurrentes-python/
[3] LOPEZ RAMOS, Dionis y ARCO GARCIA, Leticia. Aprendizaje profundo para la extracción de aspectos en opiniones textuales. Rev cuba cienc informat [online]. 2019, vol.13, n.2 [citado 2021-11-28], pp.105-145. Disponible en: <http://scielo.sld.cu/scielo.php?script=sci_arttext&pid=S2227-18992019000200105&lng=es&nrm=iso>. ISSN 2227-1899.
[4] ARANA Carlos, 2021. Redes Neuronales Recurrentes: Análisis de los Modelos Especializados en Datos Secuenciales, CEMA Working Papers: Serie Documentos de Trabajo. 797, Universidad del CEMA [citado 2021-11-28].. Disponible en: https://ucema.edu.ar/publicaciones/download/documentos/797.pdf
[5] TIC Portal.Deep learning: ¿se pueden programar las máquinas para pensar como humanos? 05/04/2021 [citado 2021-11-28].
Disponible en: https://www.ticportal.es/glosario-tic/deep-learning-dl
[6] GARBISU AROCHA, Héctor, Utilización de redes neuronales recurrentes para el análisis de firmas. 2016 .Disponible en: https://accedacris.ulpgc.es/handle/10553/18830?mode=full
[7] BONET CRUZ, Isis, SALAZAR MARTÍNEZ, Sain, RODRÍGUEZ ABED, Abdel, GRAU ÁBALO, Ricardo, GARCÍA LORENZO, Maria Matilde. Redes neuronales recurrentes para el análisis de secuencias. Revista Cubana de Ciencias Informáticas [en linea]. 2007, 1(4), 48-57[fecha de Consulta 9 de Diciembre de 2021]. ISSN: 1994-1536. Disponible en: https://www.redalyc.org/articulo.oa?id=378343634004
[8] GARCÍA RÍOS, D. A. (2020). Una aplicación de redes neuronales artificiales para el pronostico de los rendimientos de la serie de Ecopetrol. [Tesis de Pregrado, Universidad Santo Tomás Colombia]. Repositorio Institucional. Disponible en: http://hdl.handle.net/11634/31765
[9] RASCON-MADRIGAL, L. H. et al. Estimación en la Intención de Agarres: Cilíndrico, Esférico y Gancho Utilizando Redes Neuronales Profundas. Rev. mex. ing. bioméd [online]. 2020, vol.41, n.1 [citado 2021-12-10], pp.117-127. Disponible en: <http://www.scielo.org.mx/scielo.php?script=sci_arttext&pid=S0188-95322020000100117&lng=es&nrm=iso>. Epub 23-Oct-2020. ISSN 2395-9126. https://doi.org/10.17488/rmib.41.1.9.
[10] ITURBE-HERRERA, Alberto; ROJAS-VALDEZ, Armando; CASTRO-SANCHEZ, Noé Alejandro e SIERRA, Gerardo. Detección de paráfrasis basada en la energía, entropía y temperatura textual. RISTI [online]. 2020, n.39 [citado 2021-12-10], pp.35-51. Disponível em: <http://scielo.pt/scielo.php?script=sci_arttext&pid=S1646-98952020000400004&lng=pt&nrm=iso>. ISSN 1646-9895. https://doi.org/10.17013/risti.39.35-51.
[11] BRAGAGNINI MENDIZÁBAl, César Marchelo. Traducción Automática Del Español Al Inglés Usando Redes Neuronales Profundas Con Información Conceptual De Sentencias. 2020. Disponible en: http://hdl.handle.net/20.500.12590/16239
[12] REYES-PAREDES, G. A. (2020). Análisis de sentimientos de noticias escritas usando un modelo basado en la red neuronal long short-term memory para determinar si las noticias positivas mejoran el estado de ánimo de las personas. En Universidad de Lima (Ed.), Innovando la educación en tecnología. Actas del II Congreso Internacional de Ingeniería de Sistemas (pp. 49-61), Lima, 5 y 6 de septiembre del 2019. Universidad de Lima, Fondo Editorial. Dispobible en :https://repositorio.ulima.edu.pe/handle/20.500.12724/11171
[13] BAÑOS, P. ]El ADN Es La Nueva Arquitectura De La Computación.Asociacion Argentina para el progreso de las ciencias. Disponible en: https://aargentinapciencias.org/el-adn-es-la-nueva-arquitectura-de-la-computacion/
[14] RAMÍREZ Q, Juan, CHACÓN M Mario. Redes neuronales artificiales para el procesamiento de imágenes, una revisión de la última década. RIEE&C, Revista de Ingeniería Eléctrica, Electrónica y Computación. 2011. Disponible en: https://www.itson.mx/publicaciones/rieeyc/Documents/v9/art2vf_redes_neuronales_artificiales_para_el_procesamiento_de_imagenes-una_revision_de_la_ultima_decada.pdf
[15] GUARDIA VACA, Denis Leandro y SANDOVAL ALCOCER, Juan Pablo. Una técnica de muestreo para categorizar videos. RevActaNova. [online]. 2018, vol.8, n.4 [citado 2021-12-10], pp.631-650. Disponible en: <http://www.scielo.org.bo/scielo.php?script=sci_arttext&pid=S1683-07892018000200009&lng=es&nrm=iso>. ISSN 1683-0789.
[16] Introducción a Redes Neuronales Recurrentes (RNN). Disponible en:
http://personal.cimat.mx:8181/~mrivera/cursos/aprendizaje_profundo/RNN_LTSM/introduccion_rnn.html