Categorías: Internacional Tecnología

ChatGPT desconoce el 20% del léxico español y comete errores en el 80% restante: estudio

Según datos de OpenAI, cada semana, cien millones de personas usan este chatbot para hacer tareas relacionadas con el lenguaje.

Publicado por: Redacción La-Lista

Desde que llegó al mercado hace un año, ChatGPT, una inteligencia artificial capaz de crear contenidos originales y tareas relacionadas con la lengua, se convirtió en una herramienta de enorme popularidad. Ahora, un estudio señala que desconoce el 20% del léxico español y que comete errores en el 80% restante.

Según datos de OpenAI, la empresa que creadora, cada semana, cien millones de personas usan este chatbot para hacer tareas relacionadas con el lenguaje.

Pero aunque esta herramienta está entrenada para mantener conversaciones y generar textos, se sabe que puede producir respuestas que parecen plausibles pero que son completamente erróneas.

Para evaluar el rendimiento de ChatGPT y su capacidad real, un equipo de investigadores españoles desarrolló una aplicación, denominada ChatWord, que permite evaluar el conocimiento léxico de ChatGPT en varios idiomas.

Para ello, se usó como referencia las palabras recogidas en el diccionario de la Real Academia de la Lengua y las que aparecen en El Quijote de Miguel de Cervantes.

El estudio reveló que de las más de 90 mil palabras incluidas en el diccionario de la Real Academia de la Lengua, el modelo ChatGPT3.5turbo desconoce aproximadamente el 20%, es decir, unas 18 mil palabras.

Una computadora con la portada de ChatGPT, un programa de inteligencia artificial desarrollada por la empresa OpenAI. Foto: EFE/Latif Kassidi

Además, del 80 % restante de las palabras del diccionario y del 90% de las palabras del Quijote, ChatGPT cometió errores en cerca del 5% de los términos.

Un conocimiento muy pobre

El estudio recuerda que un hispanohablante reconoce 30 mil palabras de media, es decir, casi un tercio del léxico español, un dato que puede parecer pobre comparado al de una máquina, advierten los autores.

Pero, “como pasa muchas veces con los sistemas de inteligencia artificial, no es oro todo lo que reluce, y al analizar los significados que da ChatGPT de las palabras, vemos que hay un porcentaje no despreciable en que el sentido que señala es incorrecto”, explica Javier Conde, coautor del trabajo.

“Quizás ChatGPT no sea hoy en día tan sabio como aparenta”, añade.

Además, el estudio recuerda que los modelos de lenguaje de gran tamaño (LLM, por sus siglas en inglés), basados en inteligencia artificial y diseñados para procesar y comprender lenguaje natural en una escala enorme, como ChatGPT, no usan palabras que no conocen.

El estudio reveló que de las más de 90 mil palabras incluidas en el diccionario de la Real Academia de la Lengua, el modelo ChatGPT3.5turbo desconoce aproximadamente el 20%. Foto: EFE

Pero para Pedro Reviriego, también coautor de la investigación, el dato es preocupante porque si estos sistemas solo usan las palabras que conocen, resulta “muy factible un escenario en que el contenido recién generado tenga un número cada vez menor de palabras distintas”, y de escasa riqueza léxica, avisa.

La aplicación ChatWords es un sistema de acceso público, diseñada para ser fácil de usar y ampliar.

Los investigadores quieren evaluar otros idiomas y LLM para comprender mejor el conocimiento léxico que tienen las herramientas de inteligencia artificial y cómo evoluciona a medida que aparecen nuevas versiones y herramientas.

-Con información de EFE.

Entradas recientes

  • Entrevistas

‘Uno se queda con claustrofobia’: Esteban Bigliardi, de ‘La sociedad de la nieve’

Esteban Bigliardi, actor de 'La sociedad de la nieve', platicó con La-Lista sobre sus proyectos cinematográficos y sobre la sexta…

17 mayo, 2024
  • Entretenimiento

Tecate Emblema 2024: Horarios del sábado 18 de mayo

Estos son los horarios de Tecate Emblema 2024 del sábado 18 de mayo donde podrás ver a Christina Aguilera, Calvin…

17 mayo, 2024
  • Entretenimiento

Tecate Emblema 2024: Horarios del viernes 17 de mayo

Estos son los horarios de Tecate Emblema 2024 del viernes 17 de mayo donde podrás ver a Sam Smith, Maneskin,…

17 mayo, 2024
  • Entretenimiento

La actriz Verónica Toussaint muere por cáncer a los 48 años de edad

La intérprete luchó contra la enfermedad a lo largo de tres años.

16 mayo, 2024
  • Poder

Clara Brugada promete apoyo al sector inmobiliario de la CDMX

Se reunió con la Asociación de Desarrolladores Inmobiliarios.

16 mayo, 2024
  • La-Lista Labs

Eruviel Ávila llama al Voto Verde para defender casillas de ‘cochupos’ de la oposición

'Ya se anda hablando por ahí que algunos de la oposición quieren hacer trampa y quieren anular la elección, y…

16 mayo, 2024