Meta calienta la carrera armamentista de IA de la gran tecnología con un nuevo modelo de lenguaje

24 feb (Reuters) – Meta Platforms Inc (META.O) lanzó el viernes a los investigadores un nuevo modelo de lenguaje grande, el software central de un nuevo sistema de inteligencia artificial, calentando una carrera armamentista de IA a medida que las grandes compañías tecnológicas se apresuran a Integrar tecnología en sus productos y atraer inversores.

La batalla pública para dominar el espacio de la tecnología de IA comenzó a fines del año pasado con el lanzamiento de ChatGPT de OpenAI respaldado por Microsoft y ha llevado a los pesos pesados ​​de la tecnología desde Alphabet Inc (GOOGL.O) hasta Baidu Inc de China (9888.HK) a presentar su propio ofrendas .

LAMA de Meta, abreviatura de Large Language Model Meta AI, está disponible bajo una licencia no comercial para investigadores y organizaciones afiliadas al gobierno, la sociedad civil y la academia. Un blog.

Los grandes modelos de lenguaje extraen grandes cantidades de texto para resumir información y generar contenido. Pueden responder preguntas y, por ejemplo, leer oraciones como si estuvieran escritas por humanos.

Últimas actualizaciones

Ver 2 historias más

El modelo, que según Meta requiere «mucho menos» poder de cómputo que las ofertas anteriores, fue entrenado en 20 idiomas con alfabetos latino y cirílico.

«El anuncio de hoy de Meta parece ser un paso adelante en la prueba de sus capacidades creativas de inteligencia artificial para que puedan implementarlas en sus productos en el futuro», dijo Gil Luria, analista senior de software de DA Davidson.

«La IA generativa es una nueva aplicación de IA con la que Meta tiene poca experiencia, pero que es claramente importante para el futuro de su negocio».

READ  Macron confía en China para "hacer que Rusia entre en razón" - DW - 04/06/2023

La IA se ha convertido en un punto brillante para las inversiones en el sector de la tecnología, cuyo lento crecimiento ha provocado despidos generalizados y un recorte en las carreras experimentales.

Meta dijo que LAMA puede superar a los competidores que examinan más parámetros o variables que el algoritmo tiene en cuenta.

En particular, afirmó que una versión de LAMA con 13 mil millones de parámetros superaría a GPT-3, un predecesor reciente del modelo estructurado ChatGPT.

Describió su modelo LAMA de 65 mil millones de parámetros como «competitivo» con Chinchilla70B y PalM-540B de Google, que es más grande que el modelo que Google usó para demostrar su búsqueda basada en el chat de Bart.

Un portavoz de Meta atribuyó el rendimiento a una gran cantidad de datos «más limpios» y «mejoras arquitectónicas» al modelo que mejoraron la consistencia del entrenamiento.

Meta lanzó el modelo de lenguaje grande OPT-175B en mayo del año pasado, dirigido a investigadores, que formó la base de una nueva iteración de su chatbot BlenderBot.

Más tarde introdujo un modelo llamado Galactica, que podía escribir artículos científicos y resolver problemas matemáticos, pero rápidamente retiró la demostración después de producir respuestas incorrectas que parecían oficiales.

Información de Yuvraj Malik y Eva Mathews en Bangalore y Katie Paul en Nueva York; Editado por Shailesh Kuber y Grant McCool

Nuestros estándares: Principios de confianza de Thomson Reuters.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *