Por Katie Paul, Anna Tong y Krystal Hu
NUEVA YORK/SAN FRANCISCO (Reuters) – La destacada informática Fei-Fei Li está creando una empresa que usa un procesamiento de datos visuales similar al humano para hacer que la inteligencia artificial (IA) sea capaz de razonar de forma avanzada, dijeron seis fuentes a Reuters, en lo que supondría un salto adelante para la tecnología.
Li, a quien se considera una pionera en el campo de la IA, recaudó dinero para la empresa en una reciente ronda de financiación inicial.
Entre los inversores estuvo la empresa de capital riesgo de Silicon Valley Andreessen Horowitz, según tres de las fuentes, y Radical Ventures, una empresa canadiense a la que se incorporó como socia científica el año pasado, según otras dos.
Los portavoces de Andreessen Horowitz y Radical Ventures no quisieron hacer comentarios y Li no respondió a los pedidos.
Li es ampliamente conocida como la “madrina de la IA”, un título derivado del apodo de “padrinos” que se utiliza a menudo para referirse a un trío de investigadores que ganaron el premio más importante del mundo de la computación, el Premio Turing, en 2018 por sus avances en la tecnología de IA.
Al describir la startup, una fuente señaló una charla que Li dio en la conferencia TED en Vancouver en abril, en la que dijo que la vanguardia de la investigación involucraba algoritmos que podían extrapolar de manera plausible cómo se verían las imágenes y el texto en entornos tridimensionales y actuar sobre esas predicciones, usando el concepto “inteligencia espacial”.
Para ilustrar la idea, mostró la imagen de un gato con la pata extendida que empujaba un vaso hacia el borde de una mesa. En una fracción de segundo, el cerebro humano podría evaluar “la geometría del vaso, su lugar en el espacio tridimensional, su relación con la mesa, el gato y todo lo demás”, predecir lo que ocurriría y actuar para evitarlo.
“La naturaleza ha creado este ciclo virtuoso de ver y hacer, impulsado por la inteligencia espacial”, afirma.
Su propio laboratorio en la Universidad de Stanford está intentando enseñar a las computadoras “cómo actuar en el mundo tridimensional”, añadió, por ejemplo utilizando un gran modelo lingüístico para conseguir que un brazo robótico realice tareas como abrir una puerta y preparar un sándwich en respuesta a instrucciones verbales.
Li se dio a conocer en el campo de la IA desarrollando un conjunto de datos de imágenes a gran escala llamado ImageNet que ayudó a introducir una generación de tecnologías de visión por computadora capaces de identificar objetos de forma fiable por primera vez.
Con su salto al mundo de las startups, Li se une a una carrera entre las empresas de IA más punteras por enseñar sentido común a sus algoritmos con el fin de superar las limitaciones de las tecnologías actuales, como los grandes modelos lingüísticos, que tienen tendencia a ofrecer falsedades sin sentido en sus respuestas que, por lo demás, se asemejan a las de los humanos.
Muchos dicen que esta capacidad de “razonar” debe establecerse antes de que los modelos de IA puedan alcanzar la inteligencia general artificial, o AGI, en referencia a un umbral en el que el sistema puede realizar la mayoría de las tareas tan bien o mejor que un humano.