Procesamiento del Lenguaje Natural para que los ordenadores entiendan a los humanos
El Procesamiento del Lenguaje Natural (PLN) es una herramienta que combina la lingüística computacional (modelización del lenguaje humano) con modelos estadísticos y de machine learning para que los ordenadores y dispositivos digitales puedan reconocer, comprender y generar contenidos de texto y voz.
No es que el lenguaje humano sea imperfecto, pero sí contiene multitud de ambigüedades que dificultan la comprensión de los ordenadores y la generación de programas informáticos precisos. La carga de subjetividad de los textos escritos, el estilo en la estructura de las frases o los doble sentidos de muchas palabras son características que dificultan poder trasladar contenidos a un lenguaje informático.
El PLN es una rama de la inteligencia artificial (IA) y posibilita que los dispositivos puedan, entre otras funciones, traducir texto, responder a órdenes escritas u orales de los usuarios, autentificar usuarios por voz, realizar resúmenes de textos complejos o extensos, evaluar el significado de un texto y generar texto o gráficos u otros contenidos a petición a menudo en tiempo real.
Algunos de los análisis que el PLN hace de los textos son morfológico o léxico (analiza las palabras que forman las oraciones), sintáctico (analiza la estructura de las oraciones), semántico (interpreta el significado de las oraciones) y pragmático (elimina del contexto innecesario y el lenguaje figurado).
Cómo funciona el PLN
Aunque no lo sepamos, en nuestra vida cotidiana estamos mucho más cerca del PLN de lo que nos creemos. Lo usamos en los sistemas GPS de voz, en asistentes digitales o cuando usamos los chatbots de atención al cliente. Más allá de estos servicios de asistencia, el PLN se usa cada vez más en la gestión empresarial para automatizar operaciones o gestionar la productividad de los empleados.
- Agentes virtuales. Usan el reconocimiento de voz y generar respuestas con lenguaje natural gracias a la información que han procesado. Los más populares, entre otros, son Siri (Apple) y Alexa (Amazon).
- Reconocimiento de voz (speech to text). Convierte datos de voz en datos de texto. Es necesario para las aplicaciones que siga órdenes de voz o responda a preguntas habladas.
- Etiquetado de partes del discurso (etiquetado gramatical). Proceso para determinar una parte del texto, una palabra o un fragmento de texto en función de su uso y contexto. Hay muchos en casos en los que el doble sentido de una idea expresada textualmente puede producir errores del sistema.
- Desambiguación del sentido de las palabras. Se elige el significado correcto de las palabras en el contexto donde están escritas a través de un proceso de análisis semántico.
- Reconocer nombres de organizaciones o lugares. Identifica palabras como lo que son, por ejemplo el nombre de una ciudad, de un ministerio o el de un país.
- Resolución de correferencias. Esta función relaciona en un texto, por ejemplo, un nombre con las referencias que se le hace a través de pronombres o un segundo significado.
- Comprender la intencionalidad subjetiva. No es fácil que un ordenador interprete bien las palabras referidas a los sentimientos humanos o cualidades personales. El PNL identifica estas palabras y permite que el sistema “entienda” su significado con toda su carga de intencionalidad.
Ventajas del lenguaje natural para las empresas
El PLN es una herramienta que las empresas utilizan regularmente en numerosas actividades para mejorar su eficiencia y las relaciones con sus grupos de interés entra otras aplicaciones.
- Detección de spam. El correo electrónico no deseado o spam puede llegar a ser un problema que colapsa los buzones de entrada de los emails de la empresa. El PLN es capaz de hacer un rastreo entre el buzón de entrada y detectar los posibles spams. Lo hace analizando el lenguaje habitual utilizado en estos emails, que suelen utilizar términos recurrentes o errores gramaticales.
- Traducción de textos. Es una tarea muy utilizada, porque más allá de idiomas “conocidos” como el inglés, las empresas pueden recibir documentación en otras lenguas menos habituales, como el chino o el ruso. El ejemplo más conocido de la aplicación del PLN en la traducción de textos es el servicio Google Translate.
- Chatbots. Su formato es similar a los asistentes de voz, pero en el procesamiento y compresión de los textos que los usuarios y clientes envían en forma de preguntas o consultas. Es una herramienta muy útil, y cada vez más extendida, entre las empresas para relacionarse con sus grupos de interés y ofrecer un servicio de información rápido y eficiente. Ecoembes cuenta desde hace años con el chatbot AIRE que responde a todo tipo de dudas sobre el reciclaje y la economía circular.
- Detectar sentimientos. Es una herramienta imprescindible para la gestión de las redes sociales de las empresas para conocer y procesar reacciones y actitudes de los clientes sobre un producto o servicio. Esta información es muy valiosa para corregir enfoques, anticiparse a posibles crisis de imagen o crear nuevas campañas de marketing. Ecoembes utiliza el PLN para posicionar mejor sus mensajes en redes sociales, detectar inquietudes o dudas sobre el reciclaje y desarrollar nuevas campañas de concienciación social.
- Resumir documentos. En ocasiones las empresas tienen que gestionar informes o documentos digitales muy extenso y complejos. El PLN es capaz de realizar resúmenes fiables rescatando la información esencial que sirva para agilizar la lectura o alimentar bases de datos.