¿Costes de entrenamiento de IA divididos por casi diez y rendimientos que rivalizan, e incluso superan, a los de Google Search? Esa es la promesa de ZeroSearch, el nuevo truco de Alibaba para hacer que sus inteligencias artificiales sean más autónomas.
¿Y si tu inteligencia artificial ya no necesitara a Google para volverse más lista? Esa es la idea loca (pero brillante) detrás de ZeroSearch, una tecnología desarrollada por los investigadores de Alibaba. Imagínate: en lugar de acosar a los motores de búsqueda externos con millones de consultas costosas para aprender, la IA ahora se entrena en circuito cerrado, en su propio arenero digital. Una pequeña revolución que bien podría cambiar las reglas del juego en el mundo de la IA.
23/05/2025 01:47 Jérôme¿El secreto de ZeroSearch? Un gran modelo de lenguaje (LLM) – esos cerebros digitales que impulsan IA como ChatGPT – entrena a otro para convertirse en un experto en búsqueda de información. Imagínalo como un sabio anciano que enseña el arte de la biblioteca a un joven discípulo, ¡pero sin pisar nunca una biblioteca real! Este "LLM de simulación" primero aprende observando cómo un humano interactuaría con un motor de búsqueda real. Luego, armado con ese conocimiento, genera por sí mismo los documentos, relevantes o no, que el "LLM aprendiz" (el modelo de política) usará para entrenarse. Todo esto sin enviar ni una sola consulta al exterior durante esta fase de aprendizaje intensivo.
Google I/O 2025: cuando la IA organiza tu correo y hace las compras
En el corazón de ZeroSearch está el aprendizaje por refuerzo (RL). Es como enseñar a un perro a dar la patita dándole una golosina cada vez que lo logra. Excepto que aquí, la IA (el modelo de política) aprende a buscar bien recibiendo "recompensas" virtuales cuando encuentra la información correcta simulada por su compañero, el LLM de simulación. El gran truco es que toda esta fase de entrenamiento intensivo se hace internamente, sin recurrir a motores de búsqueda externos reales.
El "LLM de simulación" es la piedra angular de ZeroSearch. Tras una fase inicial de ajuste donde aprende a imitar el estilo y tipo de resultados de un motor de búsqueda real (generando documentos "útiles" y otros deliberadamente "ruidosos" o menos relevantes), se convierte en el proveedor oficial de documentos de entrenamiento. La idea es que los LLM ya almacenan una cantidad fenomenal de conocimiento durante su pre-entrenamiento inicial; la diferencia con un motor de búsqueda real radicaría principalmente en el estilo de los textos devueltos.
ZeroSearch no se limita a abrumar a su aprendiz con un torrente de información. Utiliza una estrategia de "aprendizaje curricular". Es como un programa escolar: se empieza con ejercicios fáciles y luego se aumenta gradualmente la dificultad. El LLM de simulación comienza proporcionando documentos claros y de alta calidad, luego, poco a poco, degrada la calidad, introduciendo "ruido" e información más ambigua. Esto obliga al modelo en entrenamiento a agudizar su pensamiento crítico y su capacidad para separar el grano de la paja, como tendría que hacer frente a la jungla de información de la web real.
Los resultados anunciados por Alibaba son para levantar cejas. Según el documento de investigación, un modelo ZeroSearch con un LLM de simulación de 14 mil millones de parámetros habría superado a Google Search en varias pruebas de preguntas y respuestas. Más concretamente, en un promedio de siete bancos de prueba, este ZeroSearch (Qwen-2.5-7B-Instruct con un LLM de simulación SFT-14B) obtuvo una puntuación de 33.97, frente a 32.47 de una configuración equivalente usando la API de Google Search. Incluso un modelo de simulación más pequeño, de 7 mil millones de parámetros, superó a la búsqueda real con una puntuación de 33.06.
Google I/O 2025: IA en tus gafas y al volante, la nueva apuesta de hardware de Google
El argumento contundente de ZeroSearch es su costo. Entrenar una IA para buscar información mediante API comerciales como la de Google (a través de SerpAPI) puede convertirse rápidamente en un agujero financiero. Para unas 64,000 solicitudes de búsqueda, la factura ascendería a unos 586.70 dólares. Con ZeroSearch y su LLM de simulación de 14 mil millones de parámetros ejecutándose en cuatro GPU A100, el costo se reduce a solo 70.80 dólares. ¡Eso es una reducción de casi el 88%! Para estructuras más pequeñas o laboratorios de investigación, esta diferencia es colosal.
Más allá del ahorro, ZeroSearch plantea una cuestión más fundamental: la autonomía de las IA. Al aprender a "googlearse a sí mismas" en un entorno controlado, estas IA podrían perfeccionarse de manera más independiente, reduciendo su dependencia de los gigantes tecnológicos y sus costosas API. Es una perspectiva que podría "nivelar el campo de juego", como señala el informe, democratizando el acceso a la creación de IA avanzadas. Alibaba incluso ha liberado el código, los conjuntos de datos y los modelos pre-entrenados como código abierto, para fomentar que la comunidad se involucre en el tema.
Irónicamente, para aprender a prescindir de los motores de búsqueda reales durante su entrenamiento intensivo, el LLM de simulación de ZeroSearch primero debe aprender de las interacciones con esos mismos motores. Es una fase de arranque indispensable. Así, aunque el objetivo es la independencia, el sistema incorpora indirectamente los patrones y quizás incluso algunos sesgos de los motores existentes.
¿Sabías que?
Uno de los desafíos técnicos de ZeroSearch es enseñar al LLM de simulación a generar no solo documentos relevantes sino también documentos "ruidosos" o menos útiles. Para ello, los investigadores simplemente modifican algunas palabras en la instrucción (el "prompt") dada al LLM de simulación, por ejemplo, pidiéndole que genere un documento "útil" o, por el contrario, un documento "ruidoso". ¡Un truco simple para un resultado complejo!
¿Qué es DeepSeek? La IA china que hace tartamudear a Silicon Valley
ZeroSearch es sin duda un avance técnico ingenioso que sacude el mundo del entrenamiento de IA. La promesa de una reducción drástica de costos y un mayor control sobre el proceso de aprendizaje es tentadora, especialmente para los actores más pequeños del sector. Si esta tecnología cumple todas sus promesas, podría acelerar la innovación y diversificar el panorama de la IA.
Por supuesto, no todo es color de rosa. La incapacidad de acceder a información en tiempo real sigue siendo un obstáculo, y los riesgos de "colapso del modelo" (donde la IA termina diciendo tonterías por alimentarse de sí misma) o de amplificación de los sesgos presentes en los datos iniciales son desafíos serios a abordar.
Entonces, ¿ZeroSearch, futuro sepulturero de Google para el entrenamiento de IA o simple (pero ingeniosa) optimización? Una cosa es segura: al enseñar a sus IA a pescar en su propio acuario, Alibaba nos demuestra que, en materia de inteligencia artificial, aún nos queda mucho por reflexionar... ¡para ahorrarnos el trabajo!
Fuentes:
https://www.techrepublic.com/article/news-alibaba-zerosearch-ai-training-costs/Jerome
Experto en desarrollo web, SEO e inteligencia artificial, mi experiencia práctica en la creación de sistemas automatizados se remonta a 2009. Hoy en día, además de redactar artículos para descifrar la actualidad y los desafíos de la IA, diseño soluciones a medida e intervengo como consultor y formador para una IA ética, eficiente y responsable.