One TV San Juan
  • Inicio
  • San Juan
  • Nacionales
  • Deportes
  • Internacionales
Lectura: entrenar modelos con más y más GPUs y datos ya no sirve de mucho
Compartir
Redimensionador de fuentesAa
One TV San JuanOne TV San Juan
Search
  • San Juan
  • Nacionales
  • Deportes
  • Internacionales
Síguenos
Made by ThemeRuby using the Foxiz theme. Powered by WordPress
One TV San Juan > Blog > Tecnología > entrenar modelos con más y más GPUs y datos ya no sirve de mucho
Tecnología

entrenar modelos con más y más GPUs y datos ya no sirve de mucho

Última actualización: noviembre 15, 2024 7 Lectura mínima
Compartir

Se acerca un nuevo modelo de OpenAI llamado Orion. Eso hace unos meses hubiera sido emocionante, pero lo cierto es que las expectativas con respecto a este lanzamiento están a la baja. La sensación es que estamos viviendo una desaceleración de la IA generativa, y hay una persona importante que está totalmente de acuerdo con ese argumento. Una que fue responsable de la creación de ChatGPT, de hecho.

Ilya Sutskever. Este cofundador de OpenAI fue uno de los principales artífices de ChatGPT, pero acabó abandonando la compañía en mayo para luego crear su propia startup de inteligencia artificial, llamada Safe Superintelligence Inc (SSI). Su objetivo es crear una superinteligencia con seguridad «nuclear», pero no lo hará siguiendo el camino que ha marcado OpenAI en los últimos tiempos.


La verdadera revolución de GPT-4o es poder hablar con las máquinas como si nada

La IA generativa se ha estancado. Este experto indicó en Reuters que el enfoque tradicional de desarrollo de modelos de IA generativa se ha estancado. El entrenamiento masivo de un modelo de IA usando un gran conjunto de datos sin etiquetar para que el modelo detecte patrones y estructuras ya no da más de sí, e incluso tratar de hacerlo más y más grande no da ya demasiado resultado, explica. Yann LeCun, máximo responsable de IA en Meta, coincide con esa apreciación y de hecho lleva defendiendo ese argumento desde hace tiempo.

Más no es mejor. En los últimos tiempos hemos visto cómo las grandes empresas que invierten en este tipo de modelos no paraban de usar cada vez más GPUs, que a su vez eran más potentes e ingerían más y más datos, pero la evolución de los últimos modelos respecto a sus antecesores parece no ser tan notable como la que vivimos en 2023 y a principios de 2024.

Tanto entrenamiento para nada. Fuentes consultadas por Reuters indicaban que los laboratorios que desarrollan nuevos modelos de IA están sufriendo retrasos y resultados decepcionantes en su evolución. Los ciclos de entrenamiento pueden costar decenas de millones de dólares y tardar meses en completarse, y lo malo es que no se puede saber por adelantado si el proceso será exitosos. Hay que esperar a que el ciclo termine para averiguar si ha valido la pena y el salto en prestaciones es o no destacable. 

Expectativas a la baja. En Bloomberg confirmaban hoy los datos que aparecieron hace unos días sobre Orion y OpenAI. El modelo no representa de momento un gran salto respecto a GPT-4o, y puede que aun tardemos en verlo para que haya tiempo de pulirlo. En Google la nueva versión de Gemini parece estar pasando por la misma situación según fuentes cercanas a su desarrollo, y Anthropic está retrasando la salida de Claude 3.5 Opus, la versión teóricamente más potente y capaz de su familia. En todos los casos, la situación es la misma: estos nuevos modelos son algo mejores que sus predecesores, pero no lo suficiente para lanzarlos. 

O1
O1

O1 es el modelo de OpenAI que trata de ofrecer mejores respuestas «razonando»: analiza varias posibilidades antes de contestar y elige la que considera más precisa.

Sutskever es optimista. Aun así, este experto explicaba que «la década de 2010 fue la era del escalado [de recursos y entrenamiento], y ahora estamos de nuevo en la era del asombro y el descubrimiento. Todo el mundo busca qué será lo siguiente». La declaración es llamativa, pero poco específica, y no aclara a qué se refiere, algo extraño teniendo en cuenta que el asombro y el descubrimiento acompañaron precisamente a ChatGPT en sus inicios. Ahora nos hemos acostumbrado un poco a estos chatbots, lo que ha reducido esa capacidad de asombro.  En cualquier caso, para él no se trata de escalar sin más, sino de «escalar lo correcto».

Tiene plan B, pero no da pistas. Sutskever no quiso compartir detalles de cómo él y su equipo están trabajando para evitar esas limitaciones de las IAs generativas actuales. Solo indicó que estaba trabajando en un camino alternativo al escalado del entrenamiento, pero no dio detalles. Su trayectoria es notable, así que será interesante saber qué tipo de solución plantea con su startup.

Obligando a la IA a que «razone». Una de las técnicas que se están utilizando para tratar de superar estos problemas es la llamada «test-time compute». En ella se obliga al modelo a que evalúe múltiples respuestas en tiempo real para luego acabar eligiendo la mejor. Es justo lo que hace el modelo o1 de OpenAI, que en cierto sentido «razona» al revisar sus respuestas para tratar de descartar las incorrectas y elegir la más precisa. Otras empresas como Anthropic, xAI, Microsoft y Google están planteando sus propios modelos siguiendo esta misma aproximación.

De las GPUs para entrenar a las GPUs para inferencia. Este tipo de procesos hacen que ahora el interés parezca estar migrando hacia hardware especializado para la inferencia. Jensen Huang ya indicó el mes pasado que habían descubierto que hay una «segunda ley del escalado» que apuesta por tener más y más chips dedicados a la inferencia. Según él, eso ha hecho que «la demanda por Blackwell sea increíblemente alta». Sus nuevos chips especializados de IA pronto comenzarán a estar disponibles en centros de datos, pero también es cierto que la competencia va a intentar aprovechar su oportunidad.

Imagen | OpenAI

En Xataka | El liderazgo de NVIDIA en chips para IA no depende solo de ella misma. Está en las manos de esta empresa surcoreana

Source link

Comparte este artículo
Facebook Twitter Whatsapp Whatsapp Copy Link
Deja un comentario Deja un comentario

Deja una respuesta Cancelar la respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Últimas Noticias

SocialAI es una red social donde tú eres el único humano. En el último experimento digital solo te responde un ejército de bots

Hubo un tiempo en el que estaba de moda ver llegar nuevas propuestas de redes…

septiembre 20, 2024

mejoran la calidad del vino

La agrivoltaica ya estaba ganando terreno como la gran promesa del campo y la energía…

septiembre 20, 2024

la oportunidad de la energía solar de comerse a los combustibles fósiles para 2030

La energía solar se va perfilando como la opción más accesible y económica a largo…

septiembre 20, 2024

Seguir leyendo

Internacionales

Israel dice que los ataques a Irán continuarán «sin límite de tiempo» hasta lograr «aplastar al régimen»

El ministro israelí de Defensa, Israel Katz, aseguró este miércoles que la…

Por admin marzo 11, 2026
Internacionales

el escudo antimisiles del HMS Dragon que busca frenar los ataques en el Mediterráneo

Tarde pero seguro, el buque de guerra británico HMS Dragon partió en…

Por admin marzo 11, 2026
Deportes

El gol y la asistencia de Enzo Fernández no le alcanzan a Chelsea, que pierde en la casa del campeón de Europa

En la jornada que continuó la serie de partidos de ida de…

Por admin marzo 11, 2026
Internacionales

Esperen un barril de petróleo a 200 dólares

Irán advirtió este miércoles que no será posible bajar el precio del…

Por admin marzo 11, 2026
Deportes

Champions League, en vivo: el minuto a minuto de los duelos de los octavos de final

PSG recibe a Chelsea en París y un duelo reciente entre estos…

Por admin marzo 11, 2026
Internacionales

nuevo llamado del Papa a poner fin a los ataques de Israel

Mientras el Papa lanzaba en la mañana del miércoles en Roma un…

Por admin marzo 11, 2026
Internacionales

La viuda del presidente de Haití ofrece un testimonio desgarrador sobre el magnicidio

Martine Moise describió al tribunal la noche de julio de 2021 cuando…

Por admin marzo 11, 2026
San Juan

San Juan abre las inscripciones para el Concurso Provincial de Ingreso a las Residencias en Salud 2026

La Sección Residencias de la Dirección de Recursos Tecnológicos e Innovación en…

Por admin marzo 11, 2026
Deportes

Sinner esquivó un pelotazo de Fonseca en Indian Wells y ganó un gran partido, pero el brasileño suma elogios

Jannik Sinner y João Fonseca no defraudaron en la noche californiana. La…

Por admin marzo 11, 2026

One TV 29.4 TDA

¡Síguenos!

Welcome Back!

Sign in to your account

Lost your password?