Para este desafío es útil tener conocimiento de microeconomía y específicamente teoría del productor. No se necesitan habilidades de programación, pero puede ser útil entender generalidades sobre cómo funcionan los servidores.
Esto es una adaptación de la idea de Pablo Villalobos en AI Safety Ideas (AISI).
¿Qué tanto podemos escalar la producción en la cadena de suministros de cómputo?
Para poder entender el ritmo de desarrollo de inteligencia artificial (IA), parece importante entender la economía detrás de este. Hoy en día, el desarrollo de modelos de Inteligencia Artificial de punta requiere enormes cantidades de cómputo. Por ejemplo, para entrenar GPT-3, el modelo de lenguaje que hace funcionar ChatGPT, probablemente se necesitó arrendar millones de dólares en servidores y tarjetas gráficas.
Muchos expertos experan que la inversión en inteligencia artificial crezca rápidamente, especialmente a medida que modelos avanzados de IA son usados de manera progresiva para automatizar distintas clases de tareas. Una pregunta abierta es que tan rápidamente puede escalar la producción de infraestructura de cómputo (como datacenters, servidores o tarjetas gráficas) en respuesta a esta presión para entrenar modelos cada vez más avanzados.
Una pregunta concreta puede ser, ¿qué tanto podrían escalar su producción empresas como ASML, TSMC o NVIDIA en una escala de tiempo de 1, 5 o 10 años? ¿Cuáles son los principales cuellos de botella para escalar masivamente la cadena de suministros de cómputo?
Instrucciones
- Leer. Lee The Brief History of Artificial Intelligence (10 min) y Projecting compute trends in Machine Learning (15 min). [Opcional] Para entender el lado de la demanda, puedes leer AI and Compute (5 min) y Compute Trends Across Three eras of Machine Learning (5 min). [Opcional] Para ver investigaciones pasadas al respecto, puedes revisar el artículo Interpreting AI compute trends (5 min) u ojear el reporte AI and Compute (30 min). [Opcional] Para leer sobre los componentes de la cadena de suministro, lee The Semiconductor Supply Chain hasta la página 15 (15 min).
- Ideación. Intenta generar una buena cantidad de ideas (inicialmente, de forma individual) y luego discute con tus compañeres para encontrar la mejor en el montón.
- Escribe. Escribe tu mejor idea. Tu redacción debe incluir un resumen de 500 palabras con:
- Una descripción breve de tu proyecto o modelo.
- Una descripción de cómo la idea planteada ayuda a entender mejor la cadena de suministros, y si es que hay alguna conclusión contraintuitiva.
- Una descripción de las limitaciones del proyecto, además de los supuestos en los que se basa y las formas en que podría fallar.
Además del abstracto o resumen, puedes enviar un PDF con un escrito más extenso, un trabajo de investigación, código, matemáticas, gráficos, etc. sin límite de palabras.
Si bien no es para nada necesario, recomendamos escribir en inglés.
- Envía tu propuesta. Sube tu proyecto en la plataforma de la Thinkathon.