Una profunda inmersión al procesamiento del lenguaje natural

Una inmersión más profunda en el procesamiento del lenguaje natural

number8
19 de mayo de 2020
Sin comentarios

Una red de puntos conectados para visualizar el procesamiento del lenguaje natural

Alexis Alulema - La primera vez que alguien oye hablar del Procesamiento del Lenguaje Natural (PLN), a menudo no lo considera demasiado complicado. Sin embargo, después de pensarlo un poco más, se dará cuenta de lo mucho que la comunidad de la IA ha trabajado en este tema. La tecnología aparece incluso en titulares como éste, publicado en sciencealert.com: La IA de Google ha aprendido a ser "muy agresiva" en situaciones de estrés.

Como sugiere el artículo anterior, esta tecnología podría resultar peligrosa en las manos equivocadas o si se gestiona incorrectamente. Sin embargo, creo que si comprendemos mejor los entresijos de la PNL, llegaremos a la conclusión de que no hay nada "mágico" bajo el capó. Por el contrario, existe un creciente y riguroso cuerpo de trabajo científico sobre la creación de mejores algoritmos para procesar datos y generar soluciones impresionantes.

Las redes neuronales han empezado a ser omnipresentes desde que el aprendizaje profundo experimentó un crecimiento considerable con el big data, la computación en la nube y la aparición de marcos de aprendizaje profundo como TensorFlow o PyTorch. Estos avances son visibles en áreas como la Visión por Computador (CV), donde las predicciones son increíblemente precisas y alcanzan una exactitud de 95-98%. Esta precisión es la base de avances impresionantes en la detección de rostros, la generación de rostros artificiales, los coches autónomos y muchas otras aplicaciones.

Procesamiento del lenguaje natural

En comparación, la PNL alcanza actualmente índices de precisión de alrededor de 80%. A primera vista, puede parecer que la PNL no es tan buena como la CV. Sin embargo, no creo que sea una evaluación justa, ya que el lenguaje es ambiguo y está ligado al contexto. Por ejemplo, un hablante nativo de una lengua puede utilizar y entender cómodamente la jerga regional y las expresiones idiomáticas. En cambio, un hablante no nativo puede tener problemas para entender esas expresiones y expresar ideas similares de otra manera. Estos y otros factores suponen una tarea ingente para los algoritmos de predicción, que deben intentar comprender las expresiones idiomáticas y mucho más debido a la complejidad del lenguaje. Los algoritmos mejor valorados, como el GPT-2, necesitan más de 150 GB de datos para entrenar el algoritmo; para contextualizar, 150 GB de datos de entrenamiento significan días de entrenamiento de algoritmos de redes neuronales en superordenadores.

Le imploro que profundice en este tema revisando mi artículo recientemente publicado, Métodos de aprendizaje profundo en el procesamiento del lenguaje natural. En el artículo, intento clasificar los métodos de aprendizaje profundo de PNL más relevantes para entender cómo utilizarlos e identificar qué situaciones son las más adecuadas para métodos de PNL específicos.

A quién puede interesar este contenido

Este documento es un estado de la cuestión que servirá de punto de partida para investigadores o desarrolladores que quieran familiarizarse con el amplio espectro de técnicas de PNL y cómo aplicarlas de forma óptima en distintos escenarios.

Alexis Alulema
Arquitecto de software sénior e ingeniero de aprendizaje automático

Encuentre a Alexis Alulema en LinkedIn
Encuentre a Alexis Alulema en Twitter
Visite alexisalulema.com

Desde el blog

Una inmersión más profunda en el procesamiento del lenguaje natural

Procesamiento del lenguaje natural

A quién puede interesar este contenido

Entradas recientes

Categorías

Trabajemos juntos

Acerca de

Servicios

Recursos

Industrias