¿Puede la IA reemplazar a operadores de Wall Street? Concursos revelan los límites

En una serie de nuevos concursos de negociación entre los principales modelos de IA del mundo, el veredicto hasta ahora es poco halagüeño.

Por

Bloomberg — La IA no está preparada para sustituir a su gestor de fondos, y los experimentos públicos que la ponen a prueba están demostrando por qué.

En una serie de nuevos concursos de negociación entre los principales modelos de IA del mundo, el veredicto hasta ahora es poco halagüeño. La mayoría de los sistemas pierden dinero. Operan demasiado. Toman decisiones salvajemente diferentes cuando se les dan instrucciones idénticas. Y nadie sabe aún si estas deficiencias se desvanecerán con iteraciones más potentes - o si revelan algo fundamental sobre la brecha entre los grandes modelos lingüísticos y cómo funcionan realmente los mercados.

Tomemos el ejemplo de Alpha Arena, dirigido por la startup tecnológica Nof1. En él se enfrentaron ocho grandes sistemas de IA de frontera, incluidos Claude de Anthropic, Gemini de Google, ChatGPT de OpenAI y Grok de Elon Musk, en cuatro competiciones separadas. A cada uno se le entregaron US$10.000 por concurso antes de dejarlos sueltos en acciones tecnológicas estadounidenses durante dos semanas. Los retos implicaban operar con una variedad de señales, actuar a la defensiva, reaccionar ante la competencia y utilizar un alto apalancamiento.

La cartera en su conjunto perdió alrededor de un tercio de su capital. En los 32 conjuntos de resultados, un modelo terminó en beneficios solo seis veces. Grok 4.20 obtuvo el mejor rendimiento durante el reto en el que estuvo al tanto del rendimiento de sus rivales. Realizó solo 158 operaciones; bajo el mismo impulso, Qwen de Alibaba operó 1.418 veces.

Ver más: Corning se dispara en Wall Street: por qué Nvidia apuesta por su fibra óptica para IA

Alpha Arena es uno de los cada vez más numerosos experimentos que ponen a prueba si los LLM pueden realizar el trabajo más difícil de las finanzas: batir al mercado. Aunque estos concursos distan mucho de ser académicamente rigurosos, son la demostración más pública hasta la fecha de lo que ocurre cuando los sistemas intentan asumir algunos de los trabajos más lucrativos y con mayores riesgos de Wall Street.

Los primeros resultados son importantes porque la negociación es un trabajo que la industria financiera se ha mostrado cautelosa a la hora de entregar por completo a la IA. En los últimos años, pesos pesados como JPMorgan Chase & Co. (JPM) o Balyasny Asset Management han puesto la tecnología a trabajar en casi todas partes. Los profesionales de la inteligencia artificial analizan ahora las noticias en las empresas de análisis cuantitativo, redactan memorandos en los fondos de cobertura y detectan fraudes en los grandes bancos, entre otras tareas. Pero “humano en el bucle” sigue siendo el lema cuando se trata de operar con dinero real. Quizás por una buena razón.

“Los LLM no pueden realmente ganar dinero por sí mismos”, dijo Jay Azhang, fundador de Nof1. “Se necesita básicamente un arnés y un andamiaje muy sofisticados y una plataforma de datos para darles siquiera una oportunidad”.

Ver más: Red de ‘insider trading’ en pandemia: excorredor acusado de lucrarse con información robada desde casa

Los LLM son buenos investigando y encontrando y desplegando las herramientas adecuadas para determinadas tareas, dijo. Pero aún no saben hasta qué punto cada una de las muchas variables que hacen oscilar las acciones, incluidas cosas como las calificaciones de los analistas, las operaciones con información privilegiada y los cambios de sentimiento, importa realmente. Tienden a programar mal sus operaciones, a dimensionar incorrectamente las posiciones y a comprar y vender con demasiada frecuencia.

El blog de IA Flat Circle realizó un seguimiento de 11 arenas relacionadas con los mercados, y en todas había al menos un modelo que ganaba dinero. Pero solo en dos de los ámbitos el modelo mediano fue rentable, lo que demuestra que la mayoría tuvo dificultades para batir al mercado.

Este resultado refleja el rendimiento humano, ya que la mayoría de los fondos gestionados activamente también van a la zaga del mercado en general. Y al igual que las personas, los modelos pueden ser propensos a sesgos evidentes. Las arenas muestran que los sistemas de IA toman decisiones muy diferentes con instrucciones idénticas, lo que tiene grandes implicaciones para cualquier empresa que los utilice. Por ejemplo, Azhang dijo que en la última carrera de Alpha Arena, Claude quería sobre todo ir en largo, Gemini no tenía ningún problema en ir en corto, y Qwen se sentía cómodo asumiendo riesgos con un gran apalancamiento.

“Tienen personalidades que hay que gestionar casi como un analista humano”, dijo Doug Clinton, que dirige Intelligent Alpha, una firma con un fondo impulsado por LLM que publica su propio punto de referencia sobre lo bien que la IA predice las ganancias corporativas. Los resultados pueden mejorarse haciendo saber al modelo que está mostrando cierto sesgo, dijo.

El punto de referencia de Intelligent Alpha da acceso a 10 modelos de IA a archivos financieros, previsiones de analistas, transcripciones de beneficios, datos macroeconómicos y hasta 10 búsquedas en Internet. Con su enfoque más limitado, los resultados son más positivos para los LLM. En el cuarto trimestre de 2025, el ChatGPT de OpenAI predijo correctamente la dirección de las estimaciones de beneficios el 68% de las veces, los mejores resultados hasta la fecha. Y los modelos, según Clinton, tienden a mejorar con cada nueva versión.

Secretos de los fondos de cobertura

Evaluar todo esto es difícil. Las elecciones de diseño en todo, desde la frecuencia con la que se ejecutan los modelos hasta los activos con los que operan, marcan una gran diferencia. Y la prueba por defecto para una estrategia de negociación, ejecutarla hacia atrás en la historia para ver cómo habría funcionado, no funciona realmente para la IA.

Un modelo al que se le pregunta en 2026 cómo habría operado en marzo de 2020 ya sabe cómo era marzo de 2020. Esa contaminación, conocida como sesgo de anticipación (lookahead bias), ha desafiado los marcos subyacentes de las finanzas académicas y cuantitativas durante décadas. En su lugar, hay que evaluar los LLM en mercados vivos, de ahí la proliferación de puntos de referencia y arenas.

Tal vez porque en su mayoría pierden dinero, las arenas de negociación de IA tienden a funcionar solo durante cortos periodos de tiempo. Dadas las escasas barreras de entrada, muchos son creados por particulares o empresas emergentes que utilizan las plataformas como plataforma de lanzamiento de otros productos.

Ver más: La mayoría pierde dinero en mercados de predicción: así funcionan Polymarket y los bots

Nof1 está preparando la segunda temporada de Alpha Arena, que dará a cada modelo de IA la capacidad de buscar en la web, reflexionar durante más tiempo, acceder a más fuentes de datos y dar múltiples pasos. Pero, en última instancia, el negocio de la empresa es un sistema que permita a los operadores minoristas crear agentes comerciales de IA para sus propias estrategias.

“Dar dinero a un LLM ahora mismo y que se ponga en marcha... eso todavía no existe”, dijo Azhang.

La mayoría de los experimentos públicos son aún demasiado breves y ruidosos para respaldar conclusiones firmes, considera Jim Moran, que escribe el blog Flat Circle y que anteriormente cofundó el proveedor de datos alternativos YipitData. Estos ámbitos también tienen desventajas naturales, como el acceso limitado a la investigación de valores propios y una ejecución inferior.

“Si cogiéramos a uno de estos agentes de uno de estos ámbitos y lo trasladáramos para que operara dentro de un fondo de cobertura de gama alta, debería obtener mejores resultados”, afirmó.

Alexander Izydorczyk, exjefe de ciencia de datos del fondo de cobertura Coatue Management y ahora en NX1 Capital, escribió recientemente que ningún robot de negociación de IA que él rastree ha mostrado aún una ventaja duradera. Argumentó que las arenas están limitadas por lo que no pueden ver en sus datos de entrenamiento: las técnicas cuánticas prácticas utilizadas dentro de los herméticos talleres de negociación.

Sugirió que el mismo secretismo es también un anticipo de hacia dónde se dirigirá finalmente cualquier IA que empiece a funcionar.

“Pero los principiantes a veces ven cosas que los titulares no pueden”, escribió Izydorczyk en su blog personal. “Los forasteros, si tienen éxito, también aprenderán rápidamente que el éxito en mercados líquidos y competitivos paga mejor que el seguidor marginal de X”. Cuando las estrategias de negociación de los agentes de LLM empiecen a funcionar, no se oirá hablar de ellas durante un tiempo".

Lea más en Bloomberg.com