Desde muy joven, David Andre estuvo profundamente fascinado con la inteligencia humana y artificial, una pasión que se encendió al ver a su madre, Cheryl, seguir una carrera pionera como programadora de computadoras. A lo largo de tres décadas, Andre ha aplicado su profunda experiencia en IA y su espíritu emprendedor a diversos campos, incluida la gestión de activos y la tecnología portátil. Sin embargo, es su papel actual como director científico en Alphabet's X, la fábrica de lanzamiento a la luna, lo que realmente le permite cumplir una aspiración de la infancia: liderar un laboratorio científico visionario dedicado a abordar los desafíos más desconcertantes de la humanidad.
Establecido por Google en 2010 y ahora bajo Alphabet, X sirve como un centro de innovación, embarcándose en proyectos ambiciosos que buscan resolver problemas complejos con soluciones tecnológicas radicales. Ha dado origen a filiales pioneras de Alphabet como Waymo, el proveedor de viajes compartidos en vehículos autónomos, y Wing, un pionero en drones de reparto autónomos. Actualmente, más de la mitad de los esfuerzos de X apuntan al cambio climático.
Abordar problemas tan enormes exige no sólo una resolución de problemas ambiciosa y perspicacia técnica, sino también una resiliencia firme ante una alta (y esperada) incidencia de fracasos. En nuestra conversación con Andre en la Cumbre Mundial de IA del otoño pasado en Ámsterdam, compartió cómo mantiene motivado a su equipo, así como las formas en que la IA generativa está abriendo nuevas vías para lograr avances en X. A continuación se incluye una versión editada de nuestra conversación.
S+B: ¿Cómo se crea una cultura de innovación en X?
ANDRÉ: La innovación es algo complicado. Trabajamos mucho para mantener la cultura en X apropiada para ello. Una clave para la innovación es iterar rápidamente y luego aceptar la idea de que la mayoría de las cosas que intentas no van a funcionar. Con eso en mente, siempre vas primero por la parte más difícil del problema, porque si no puedes resolver esa parte, ¿por qué pierdes el tiempo en el resto?
Además de eso, nos enfocamos en lograr una mejora de 10 veces en lugar de 10%. No queremos iterar en nuestro camino hacia una gran solución. Queremos saltar de inmediato hacia lo que será una revolución para el mundo. Nuestro trabajo es crear otras oportunidades para Alphabet que sean del mismo tamaño que Google, y la única manera de hacerlo es abordar problemas realmente grandes.
Lo hacemos con un enfoque basado en cartera en el que comenzamos increíblemente pequeño, a menudo con una sola persona, o incluso parte del tiempo de una persona, en un proyecto. Tenemos docenas de estos sucediendo en cualquier momento. Lo que eso significa es que, de esas docenas de proyectos, esperamos que algunos se detengan y fracasen para que otros puedan tener éxito.
David André habla con s+b sobre IA en la Cumbre Mundial de IA
El director científico del brazo de innovación de Alphabet nos cuenta cómo aplica la IA a los desafíos lunares y por qué ve la IA generativa como una nueva herramienta fundamental en sus esfuerzos.
S+B: ¿Cómo se puede mantener motivados a los empleados cuando sus proyectos fracasan la mayoría de las veces?
ANDRÉ: Todo en lo que trabajamos intenta resolver un gran problema para la humanidad. Cuando nos apasiona más es más fácil conseguir que el equipo tenga la moral alta. Y los fracasos pueden ayudarnos a aprender. Hay un proyecto en el que estamos trabajando llamado Taara, y es un proyecto fascinante porque surgió de otro que fracasó, llamado Loon. Loon se centró en llevar Internet a las personas que viven en zonas rurales donde no hay torres de telefonía móvil. Se trataba de desplegar globos meteorológicos que eran torres de telefonía móvil flotantes. Para que eso funcione, el equipo desarrolló comunicaciones láser punto a punto que enviarían gigabits de información a través del aire entre globos que estaban a una distancia de hasta 20 kilómetros entre sí.
Taara tomó esta tecnología láser y la instaló en terminales que pueden implementar en cualquier parte del mundo (por ejemplo, en torres o edificios) y básicamente transmitir Internet de alta velocidad a donde quieran. Lo están utilizando en 13 países de todo el mundo y su objetivo es conectar a los 3 mil millones de personas que hoy en día no tienen ningún tipo de conectividad.
S+B: Lleva tres décadas en ingeniería informática y ciencia de datos. ¿Qué es lo que más te llama la atención al pensar en cómo ha evolucionado el campo durante ese tiempo?
ANDRÉ: Como bien dices, ha cambiado mucho. Ha habido inviernos. Ha habido veranos. Pero hay dos cosas importantes que siguen siendo ciertas. Primero, los fundamentos importan. Comprender la regresión lineal, una técnica antigua, sigue siendo increíblemente importante, al igual que lo que puede salir mal con ella. El mayor problema que veo en las startups o proyectos que aplican mal el aprendizaje automático o la IA es el ajuste excesivo de sus datos. Es un problema antiguo que todavía está apareciendo.
Número dos, la idea de realizar entrenamiento semisupervisado y no supervisado ha sido mágica para el campo, porque esto ha significado que todos los datos que están disponibles (los documentos en línea, las fotografías en línea) se convierten en datos de entrenamiento para los algoritmos. Así que ahora no es necesario tener estos costosos ejemplos de capacitación supervisada.
Lo último es la llegada del modelo transformador que impulsa los grandes modelos de lenguaje (LLM) actuales. Esto ha significado que se puede pasar del lenguaje natural a prácticamente cualquier cosa: del lenguaje natural al código, de un lenguaje a otro, del lenguaje natural a las imágenes. Y todos ellos están impulsados por la misma tecnología central, lo que ha cambiado las reglas del juego porque ahora, un avance en un campo (digamos, en el procesamiento de la visión) de repente afecta el procesamiento del lenguaje y todo lo demás también, porque todos están usando el mismo modelo.
S+B: Muchos investigadores destacados de IA han dicho que las capacidades avanzadas logradas por los grandes modelos de lenguaje que impulsan la IA generativa los tomaron por sorpresa. ¿Te sorprendieron?
ANDRÉ: Diré que en un momento me sorprendió cuando algunos de mis colegas estaban trabajando en un artículo que utilizaba LLM para resolver problemas matemáticos, llamado artículo de Minerva. Estaba viendo los tipos de resultados que podían obtener y los tipos de problemas que el sistema podía resolver, y quedé impresionado. Porque había estado pensando que los LLM en su mayoría solo predecían la siguiente palabra o token, pero resulta que la arquitectura del transformador permite que todo tipo de razonamiento de nivel superior y todo tipo de algoritmos se ejecuten esencialmente dentro del cálculo que ocurre a medida que se procesan los datos. fluyendo a través de una de estas redes neuronales. Esto le permite resolver problemas increíblemente complicados. Te permite hacer cosas como el razonamiento metafórico. Es una técnica realmente poderosa. Entonces, aunque al principio me sorprendió, una vez que entendí este poder computacional, empezó a tener sentido.
S+B: ¿Cómo han afectado los avances a su enfoque para resolver problemas?
ANDRÉ: Curiosamente, en gran medida se ha mantenido igual. La parte difícil de casi todos los problemas no es la IA o el aprendizaje automático. Lo que realmente importa es todo el tejido conectivo que lo rodea y que une ese algoritmo al mundo real. Si resuelves el problema en la máquina y al final no coincide con lo que realmente intentas hacer, no sirve de nada. Entonces, las cosas que aprendimos en los años 90 al intentar aplicar el aprendizaje automático todavía se aplican porque estábamos construyendo tejido conectivo para hacer coincidir un algoritmo con el mundo real.
La parte difícil de casi todos los problemas no es la IA o el aprendizaje automático. Lo que realmente importa es todo el tejido conectivo que lo rodea y que une ese algoritmo al mundo real”.
S+B: ¿Estás utilizando IA generativa en X en este momento?
ANDRÉ: Utilizamos este tipo de técnicas en muchas de nuestras aplicaciones. A veces son aplicaciones puramente lingüísticas, pero otras veces las aplicamos a ciencias duras y vemos beneficios sorprendentes en áreas que van desde la biología computacional hasta el razonamiento lógico y el razonamiento geoespacial. Personalmente, lo uso cuando programo algo que es bastante básico, generalmente en un lenguaje que no conozco muy bien, pero quiero hacerlo rápidamente. Le preguntaré para empezar. Lo uso un poco para escribir, pero tiendo a encontrar que todavía no está donde necesito que esté para eso.
Lo último que uso es algo llamado diseño inverso. Este es un giro diferente en la IA generativa al que juega la mayoría de la gente hoy en día. Es donde le pides a una computadora que resuelva un problema por ti. Entonces, planteas un problema que quieres resolver. Le proporcionas todos los detalles y restricciones que lo rodean y luego dejas que un gran cálculo lo resuelva por ti. Hay muchas máquinas trabajando en el problema en segundo plano, probando diferentes soluciones hasta que encuentras una que te guste. Ese es el que uso casi todos los días.
S+B: ¿Cómo pueden las empresas posicionarse para seguir aprovechando las innovaciones en IA cuando están sucediendo tan rápidamente en este momento?
ANDRÉ: Lo más importante es empezar ahora, porque siempre desearás haber empezado ayer. Y si aún no has empezado, ahora siempre es el momento adecuado. Lo segundo es empezar a jugar con las herramientas. Trabaje con modelos de lenguaje grandes como Bard; Intente resolver sus problemas con ellos y vea qué sucede. Aprenda dónde fallan. Una vez que vea dónde no funcionan, tendrá el objetivo en qué concentrarse y en qué aprender.
Ciertamente, también es útil contratar más personas con habilidades en matemáticas e inteligencia artificial. Pero hoy todo el mundo puede jugar con estas herramientas. Eso es una gran parte de lo que está sucediendo en este movimiento: está democratizando el acceso a la inteligencia artificial para que todos puedan participar.