One TV San Juan
  • Inicio
  • San Juan
  • Nacionales
  • Deportes
  • Internacionales
Lectura: entrenar modelos con más y más GPUs y datos ya no sirve de mucho
Compartir
Redimensionador de fuentesAa
One TV San JuanOne TV San Juan
Search
  • San Juan
  • Nacionales
  • Deportes
  • Internacionales
Síguenos
Made by ThemeRuby using the Foxiz theme. Powered by WordPress
One TV San Juan > Blog > Tecnología > entrenar modelos con más y más GPUs y datos ya no sirve de mucho
Tecnología

entrenar modelos con más y más GPUs y datos ya no sirve de mucho

Última actualización: noviembre 15, 2024 7 Lectura mínima
Compartir

Se acerca un nuevo modelo de OpenAI llamado Orion. Eso hace unos meses hubiera sido emocionante, pero lo cierto es que las expectativas con respecto a este lanzamiento están a la baja. La sensación es que estamos viviendo una desaceleración de la IA generativa, y hay una persona importante que está totalmente de acuerdo con ese argumento. Una que fue responsable de la creación de ChatGPT, de hecho.

Ilya Sutskever. Este cofundador de OpenAI fue uno de los principales artífices de ChatGPT, pero acabó abandonando la compañía en mayo para luego crear su propia startup de inteligencia artificial, llamada Safe Superintelligence Inc (SSI). Su objetivo es crear una superinteligencia con seguridad «nuclear», pero no lo hará siguiendo el camino que ha marcado OpenAI en los últimos tiempos.


La verdadera revolución de GPT-4o es poder hablar con las máquinas como si nada

La IA generativa se ha estancado. Este experto indicó en Reuters que el enfoque tradicional de desarrollo de modelos de IA generativa se ha estancado. El entrenamiento masivo de un modelo de IA usando un gran conjunto de datos sin etiquetar para que el modelo detecte patrones y estructuras ya no da más de sí, e incluso tratar de hacerlo más y más grande no da ya demasiado resultado, explica. Yann LeCun, máximo responsable de IA en Meta, coincide con esa apreciación y de hecho lleva defendiendo ese argumento desde hace tiempo.

Más no es mejor. En los últimos tiempos hemos visto cómo las grandes empresas que invierten en este tipo de modelos no paraban de usar cada vez más GPUs, que a su vez eran más potentes e ingerían más y más datos, pero la evolución de los últimos modelos respecto a sus antecesores parece no ser tan notable como la que vivimos en 2023 y a principios de 2024.

Tanto entrenamiento para nada. Fuentes consultadas por Reuters indicaban que los laboratorios que desarrollan nuevos modelos de IA están sufriendo retrasos y resultados decepcionantes en su evolución. Los ciclos de entrenamiento pueden costar decenas de millones de dólares y tardar meses en completarse, y lo malo es que no se puede saber por adelantado si el proceso será exitosos. Hay que esperar a que el ciclo termine para averiguar si ha valido la pena y el salto en prestaciones es o no destacable. 

Expectativas a la baja. En Bloomberg confirmaban hoy los datos que aparecieron hace unos días sobre Orion y OpenAI. El modelo no representa de momento un gran salto respecto a GPT-4o, y puede que aun tardemos en verlo para que haya tiempo de pulirlo. En Google la nueva versión de Gemini parece estar pasando por la misma situación según fuentes cercanas a su desarrollo, y Anthropic está retrasando la salida de Claude 3.5 Opus, la versión teóricamente más potente y capaz de su familia. En todos los casos, la situación es la misma: estos nuevos modelos son algo mejores que sus predecesores, pero no lo suficiente para lanzarlos. 

O1
O1

O1 es el modelo de OpenAI que trata de ofrecer mejores respuestas «razonando»: analiza varias posibilidades antes de contestar y elige la que considera más precisa.

Sutskever es optimista. Aun así, este experto explicaba que «la década de 2010 fue la era del escalado [de recursos y entrenamiento], y ahora estamos de nuevo en la era del asombro y el descubrimiento. Todo el mundo busca qué será lo siguiente». La declaración es llamativa, pero poco específica, y no aclara a qué se refiere, algo extraño teniendo en cuenta que el asombro y el descubrimiento acompañaron precisamente a ChatGPT en sus inicios. Ahora nos hemos acostumbrado un poco a estos chatbots, lo que ha reducido esa capacidad de asombro.  En cualquier caso, para él no se trata de escalar sin más, sino de «escalar lo correcto».

Tiene plan B, pero no da pistas. Sutskever no quiso compartir detalles de cómo él y su equipo están trabajando para evitar esas limitaciones de las IAs generativas actuales. Solo indicó que estaba trabajando en un camino alternativo al escalado del entrenamiento, pero no dio detalles. Su trayectoria es notable, así que será interesante saber qué tipo de solución plantea con su startup.

Obligando a la IA a que «razone». Una de las técnicas que se están utilizando para tratar de superar estos problemas es la llamada «test-time compute». En ella se obliga al modelo a que evalúe múltiples respuestas en tiempo real para luego acabar eligiendo la mejor. Es justo lo que hace el modelo o1 de OpenAI, que en cierto sentido «razona» al revisar sus respuestas para tratar de descartar las incorrectas y elegir la más precisa. Otras empresas como Anthropic, xAI, Microsoft y Google están planteando sus propios modelos siguiendo esta misma aproximación.

De las GPUs para entrenar a las GPUs para inferencia. Este tipo de procesos hacen que ahora el interés parezca estar migrando hacia hardware especializado para la inferencia. Jensen Huang ya indicó el mes pasado que habían descubierto que hay una «segunda ley del escalado» que apuesta por tener más y más chips dedicados a la inferencia. Según él, eso ha hecho que «la demanda por Blackwell sea increíblemente alta». Sus nuevos chips especializados de IA pronto comenzarán a estar disponibles en centros de datos, pero también es cierto que la competencia va a intentar aprovechar su oportunidad.

Imagen | OpenAI

En Xataka | El liderazgo de NVIDIA en chips para IA no depende solo de ella misma. Está en las manos de esta empresa surcoreana

Source link

Comparte este artículo
Facebook Twitter Whatsapp Whatsapp Copy Link
Deja un comentario Deja un comentario

Deja una respuesta Cancelar la respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Últimas Noticias

Los playoffs del torneo Apertura: 15 clasificados, varios cruces definidos y un posible Boca-River

Aunque aún resta completarse la postergada fecha 9, este domingo quedaron definidos 15 de los…

mayo 4, 2026

SocialAI es una red social donde tú eres el único humano. En el último experimento digital solo te responde un ejército de bots

Hubo un tiempo en el que estaba de moda ver llegar nuevas propuestas de redes…

septiembre 20, 2024

mejoran la calidad del vino

La agrivoltaica ya estaba ganando terreno como la gran promesa del campo y la energía…

septiembre 20, 2024

Seguir leyendo

Deportes

Los playoffs del torneo Apertura: 15 clasificados, varios cruces definidos y un posible Boca-River

Aunque aún resta completarse la postergada fecha 9, este domingo quedaron definidos…

Por admin mayo 4, 2026
Deportes

El combo que hundió a River: los titulares no respondieron y el recambio pasó en puntas de pie

Una derrota que no modifica el segundo puesto que River ya tenía,…

Por admin mayo 3, 2026
Internacionales

Rudy Giuliani, ex alcalde de Nueva York, se encuentra hospitalizado en estado crítico

El ex alcalde de Nueva York Rudy Giuliani fue hospitalizado este domingo…

Por admin mayo 3, 2026
Deportes

Franco Colapinto, 7° en Miami: un fin de semana perfecto, con Messi y su mejor resultado

MIAMI.- Hay carreras que tienen un especial significado para los pilotos, como…

Por admin mayo 3, 2026
Internacionales

Donald Trump aumenta la presión sobre Cuba y tensa aún más la relación entre Washington y La Habana

Empantanado en la guerra contra Irán y sin visos de que puede…

Por admin mayo 3, 2026
Deportes

Racing y Huracán empataron y se clasificaron; Tigre y Sarmiento eliminados, y habrá clásico cordobés en octavos

En la jornada final, Racing cumplió el objetivo de base y se…

Por admin mayo 3, 2026
Internacionales

Donald Trump dijo que Estados Unidos va a “liberar” desde este lunes barcos que están atascados en el estrecho de Ormuz

El presidente Donald Trump dijo este domingo que Estados Unidos a partir…

Por admin mayo 3, 2026
Deportes

River vs. Atlético Tucumán, en vivo: el minuto a minuto del partido por el torneo Apertura

Bienvenidos al seguimiento al instante del encuentro que, desde las 18.30, en…

Por admin mayo 3, 2026
Deportes

Martín Ojeda, el futbolista argentino que amargó a Lionel Messi y anotó un hat-trick para Orlando City

El “Clásico del Sol” de la Major League Soccer, entre Inter Miami…

Por admin mayo 3, 2026

One TV 29.4 TDA

¡Síguenos!

Welcome Back!

Sign in to your account

Lost your password?