Clock IA > ZeroSearch: AI Alibaby, która uczy się szukać bez Google – czy to rewolucja?
ZeroSearch: AI Alibaby, która uczy się szukać bez Google – czy to rewolucja?

ZeroSearch od Alibaba: gdy sztuczna inteligencja uczy się "googlować siebie", by zrewolucjonizować swoje szkolenie (i oszczędzać pieniądze)

Koszty trenowania sztucznej inteligencji zmniejszone niemal dziesięciokrotnie, a wydajność konkurująca, a nawet przewyższająca Google Search? To obietnica ZeroSearch, nowego pomysłu Alibaby na zwiększenie autonomii swoich systemów AI.

A gdyby Twoja sztuczna inteligencja nie potrzebowała już Google'a, by stać się mądrzejsza? To właśnie szalony (ale genialny) pomysł stojący za ZeroSearch, technologią opracowaną przez naukowców Alibaby. Wyobraź sobie: zamiast zasypywać zewnętrzne wyszukiwarki milionami kosztownych zapytań w celu nauki, AI trenuje teraz w zamkniętej pętli, we własnej cyfrowej piaskownicy. Mała rewolucja, która może zmienić zasady gry w świecie sztucznej inteligencji.

24/05/2025 02:47 Jérôme

Sztuczna Inteligencja ucząca się w trybie "incognito"

Sekret ZeroSearch? Duży model językowy (LLM) – te cyfrowe mózgi napędzające AI takie jak ChatGPT – szkoli inny, aby stał się ekspertem w wyszukiwaniu informacji. Wyobraź to sobie jako starego mędrca uczącego młodego ucznia sztuki bibliotecznej, ale bez wchodzenia do prawdziwej biblioteki! Ten "symulacyjny LLM" najpierw uczy się, obserwując, jak człowiek korzystałby z prawdziwej wyszukiwarki. Następnie, uzbrojony w tę wiedzę, sam generuje dokumenty – zarówno trafne, jak i nietrafne – które "uczeń LLM" (model polityki) wykorzysta do treningu. Wszystko to bez wysyłania jakichkolwiek zapytań na zewnątrz podczas tej intensywnej fazy nauki.

Czym jest DeepSeek? Chińska sztuczna inteligencja, która przyprawia Dolinę Krzemową o zawrót głowy

Kluczowa Koncepcja 1: Uczenie przez wzmacnianie symulowane, czyli jak stać się mistrzem bez wychodzenia z domu

Sercem ZeroSearch jest uczenie przez wzmacnianie (RL). To trochę jak uczenie psa sztuczki za pomocą smakołyków. Tyle że tutaj AI (model polityki) uczy się skutecznego wyszukiwania, otrzymując "wirtualne nagrody" za znalezienie właściwych informacji symulowanych przez swojego kompana, symulacyjny LLM. Największa sztuczka polega na tym, że cały ten intensywny trening odbywa się wewnętrznie, bez korzystania z zewnętrznych wyszukiwarek.

Kluczowa Koncepcja 2: Symulacyjny LLM – cyfrowy "partner treningowy"

"Symulacyjny LLM" to fundament ZeroSearch. Po początkowej fazie dostosowywania, w której uczy się naśladować styl i typ wyników prawdziwej wyszukiwarki (generując zarówno dokumenty "użyteczne", jak i celowo "zaszumione" lub mniej trafne), staje się głównym dostawcą materiałów treningowych. Chodzi o to, że LLM już podczas wstępnego treningu zgromadził ogromną wiedzę; różnica w stosunku do prawdziwej wyszukiwarki dotyczy głównie stylu zwracanych tekstów.

Kluczowa Koncepcja 3: Uczenie programowe, czyli stopniowe zwiększanie trudności

ZeroSearch nie zalewa ucznia potokiem informacji. Stosuje strategię "uczenia programowego". To jak szkolny program: zaczyna się od łatwych ćwiczeń, a potem stopniowo zwiększa trudność. Symulacyjny LLM najpierw dostarcza jasne, wysokiej jakości dokumenty, a następnie stopniowo obniża ich jakość, wprowadzając "szum" i bardziej niejednoznaczne informacje. To zmusza uczący się model do wyostrzenia krytycznego myślenia i umiejętności oddzielania ziarna od plew, tak jak musiałby to robić w dżungli prawdziwego internetu.

Google, uważaj na siebie?

Wyniki ogłoszone przez Alibabę mogą budzić zdziwienie. Według dokumentu badawczego, model ZeroSearch z symulacyjnym LLM o 14 miliardach parametrów przewyższył Google Search w kilku testach pytań i odpowiedzi. Konkretnie, w średniej z siedmiu testów, ten ZeroSearch (Qwen-2.5-7B-Instruct z symulacyjnym LLM SFT-14B) uzyskał wynik 33.97, w porównaniu do 32.47 dla konfiguracji korzystającej z API Google Search. Nawet mniejszy model symulacyjny, z 7 miliardami parametrów, osiągnął lepszy wynik (33.06) niż prawdziwa wyszukiwarka.

Granice AI: czy wyścig po moc obliczeniową to już za mało, by uczynić je naprawdę inteligentnymi?

Wartość do zapamiętania: 88% oszczędności – to daje do myślenia!

Największym atutem ZeroSearch jest koszt. Szkolenie AI do wyszukiwania informacji przez komercyjne API, takie jak Google (przez SerpAPI), może szybko stać się finansową przepaścią. Dla około 64 000 zapytań koszt wyniósłby około 586,70 dolarów. Dzięki ZeroSearch i symulacyjnemu LLM o 14 miliardach parametrów działającemu na czterech GPU A100, koszt spada do zaledwie 70,80 dolarów. To redukcja o prawie 88%! Dla mniejszych firm czy laboratoriów badawczych ta różnica jest ogromna.

Stawka: W kierunku bardziej autonomicznych (i tańszych) AI

Poza oszczędnościami, ZeroSearch porusza bardziej fundamentalną kwestię: autonomii AI. Ucząc się "googlować siebie" w kontrolowanym środowisku, te AI mogłyby doskonalić się bardziej niezależnie, zmniejszając zależność od gigantów technologicznych i ich kosztownych API. To perspektywa, która mogłaby "wyrównać szanse", jak podkreśla raport, demokratyzując dostęp do tworzenia zaawansowanych AI. Alibaba udostępniła kod, zbiory danych i wstępnie wytrenowane modele jako open source, zachęcając społeczność do zgłębienia tematu.

Paradoks: uniezależnić się od wyszukiwarek, ale nie do końca

Ironicznie, aby nauczyć się obywać bez prawdziwych wyszukiwarek podczas intensywnego treningu, symulacyjny LLM ZeroSearch musi najpierw nauczyć się z interakcji z tymi samymi wyszukiwarkami. To niezbędna faza inicjacji. Choć celem jest niezależność, system pośrednio wchłania schematy, a może nawet pewne uprzedzenia istniejących wyszukiwarek.

Czy wiedziałeś?

Jednym z technicznych wyzwań ZeroSearch jest nauczenie symulacyjnego LLM generowania nie tylko trafnych dokumentów, ale także "zaszumionych" lub mniej użytecznych. Aby to osiągnąć, badacze modyfikują kilka słów w poleceniu ("prompcie") dla symulacyjnego LLM, np. prosząc o wygenerowanie dokumentu "użytecznego" lub, przeciwnie, "zaszumionego". Prosta sztuczka dla złożonego efektu!

Capgemini, SAP i Mistral AI: nowe sojusz na rzecz generatywnej sztucznej inteligencji pod ścisłą kontrolą

ZeroSearch to niewątpliwie sprytne techniczne osiągnięcie, które wstrząsa światem treningu AI. Obietnica drastycznego obniżenia kosztów i większej kontroli nad procesem uczenia jest kusząca, szczególnie dla mniejszych graczy w branży. Jeśli ta technologia spełni obietnice, może przyspieszyć innowacje i zdywersyfikować krajobraz AI.

Oczywiście, nie wszystko jest idealne. Brak dostępu do informacji w czasie rzeczywistym pozostaje problemem, a ryzyko "zapaści modelu" (gdy AI zaczyna bredzić, karmiąc się własnymi danymi) lub wzmocnienia uprzedzeń obecnych w początkowych danych to poważne wyzwania.

Czy ZeroSearch to przyszły grabarz Google'a w treningu AI, czy tylko (choć genialna) optymalizacja? Jedno jest pewne – ucząc swoje AI "łowić" we własnym akwarium, Alibaba pokazuje, że w dziedzinie sztucznej inteligencji wciąż musimy główkować... by oszczędzać nasze własne!

Źródła:

https://www.techrepublic.com/article/news-alibaba-zerosearch-ai-training-costs/
https://www.webpronews.com/zerosearch-how-alibabas-self-training-framework-slashes-llm-search-costs-by-88/

Jerome

Ekspert w dziedzinie tworzenia stron internetowych, SEO i sztucznej inteligencji, moje praktyczne doświadczenie w tworzeniu zautomatyzowanych systemów sięga 2009 roku. Dziś, oprócz pisania artykułów mających na celu rozszyfrowywanie aktualności i wyzwań AI, projektuję rozwiązania szyte na miarę oraz działam jako konsultant i szkoleniowiec w zakresie etycznej, wydajnej i odpowiedzialnej AI.

Facebook - X (Twitter) - Linkedin
Clock IA > ZeroSearch: AI Alibaby, która uczy się szukać bez Google – czy to rewolucja?