Urodzona w 2023 roku DeepSeek, chińska firma zajmująca się sztuczną inteligencją, podbiła świat technologii dzięki wydajnym modelom i podejściu "open source". Mistrzyni w Chinach, zagrożenie dla USA – uosabia ona nową zimną wojnę technologiczną.
W takim razie, czym właściwie jest DeepSeek? Ledwo zdążyliśmy powiedzieć "algorytm", a już mamy DeepSeek, a bardziej formalnie Hangzhou DeepSeek Artificial Intelligence Basic Technology Research Co., Ltd., która od momentu powstania znalazła się w centrum światowej sceny AI. Wyobraźcie sobie technologiczną kometę: błyskawiczne postępy, oszałamiająca efektywność kosztowa i filozofia open source (czyli dostępny i modyfikowalny kod), która wywraca dotychczasowe schematy do góry nogami. Rezultat? W Chinach to prawdziwy hit, swoisty motor narodowej innowacji. W Stanach Zjednoczonych? Atmosfera jest raczej pełna niepokoju, a DeepSeek postrzegana jest jako potencjalne zagrożenie dla bezpieczeństwa narodowego. Czy to więc tylko rozkręcony start-up, czy może pionek w znacznie większej strategii? Zajrzyjmy za kulisy.
24/05/2025 02:37 JérômeZa DeepSeek stoi Liang Wenfeng, prezes firmy i współzałożyciel High-Flyer, jednego z wiodących chińskich funduszy hedgingowych specjalizujących się w handlu kwantowym wspieranym przez sztuczną inteligencję. To nie jest drobny szczegół: High-Flyer zainwestował co najmniej 420 milionów dolarów jako kapitał początkowy. Zapomnij o obrazie start-upu powstałego w garażu; tutaj mówimy o strategicznej inkubacji przez już dobrze ugruntowaną jednostkę technologiczno-finansową. Jeśli w kwietniu 2025 roku baza danych Tracxn klasyfikowała DeepSeek jako „niefinansowaną” przez zewnętrzny kapitał wysokiego ryzyka, to dlatego, że firma najpierw korzystała z własnych środków, co pozwoliło jej skupić się na badaniach i rozwoju, z dala od typowych presji. Ale wobec rosnącego zapotrzebowania na jej chatbota, firma rozważała otwarcie się na zewnętrzne finansowanie.
DeepSeek nie próżnował, wypuszczając całą serię dużych modeli językowych (LLM) w rekordowym czasie. To trochę jak szef kuchni, który w ciągu kilku miesięcy serwuje kilka dań z gwiazdkami Michelin:
Sekret tej efektywności? Sprytne wybory architektoniczne. DeepSeek wykorzystuje m.in. architekturę Mieszanki Ekspertów (MoE): wyobraź sobie zespół specjalistów, gdzie tylko odpowiedni ekspert jest angażowany do konkretnego zadania. To bardziej wydajne niż mobilizowanie całego zespołu do każdego pytania. DeepSeek-V3, na przykład, aktywuje „tylko” 37 miliardów z 671 miliardów parametrów na token. Dodaj do tego techniki takie jak Wielogłowa Uwaga Latentna (MLA), aby poprawić efektywność wnioskowania (moment, gdy SI „myśli”), oraz trening w precyzji mieszanej FP8, aby oszczędzać pamięć i moc obliczeniową. Te innowacje to sprytna odpowiedź na amerykańskie ograniczenia w eksporcie najnowocześniejszych układów.
Firma nie poprzestaje na tym i we współpracy z Uniwersytetem Tsinghua rozwija nowatorskie techniki treningowe, takie jak Generatywne Modelowanie Nagród (GRM), gdzie model generuje własne informacje zwrotne, oraz Samooceniające się Dostrajanie Krytyczne (SPCT), gdzie uczy się oceniać własne odpowiedzi. Cel? Bardziej autonomiczne SI, wymagające mniejszej ludzkiej kontroli, aby się doskonalić.
Jednym z kluczowych składników sukcesu DeepSeek jest jego zaangażowanie w open source. Model R1, na przykład, został udostępniony na licencji MIT, bardzo liberalnej. To strategia, która ma na celu uczynienie SI bardziej dostępną i kontrastuje z „zamkniętymi” modelami wielu amerykańskich konkurentów. To podejście, połączone z deklarowaną wyjątkową efektywnością kosztową (koszt treningu R1 miał wynieść zaledwie 5,6 miliona dolarów), demokratyzuje dostęp do zaawansowanej SI. To trochę jak podanie przepisu na danie gourmet z tanich składników: każdy może spróbować!
W Chinach DeepSeek jest wynoszony pod niebiosa. Aplikacja stała się jedną z najczęściej pobieranych w App Store Apple krótko po premierze. W styczniu 2025 roku miała ponad 22,2 miliona aktywnych użytkowników dziennie w kraju, co stanowi około 30-39% jej globalnej bazy. Chwalona jako klejnot narodowej innowacji, technologia DeepSeek jest wdrażana przez podmioty publiczne, a nawet konkurentów.
Kilka lokalnych rządów (np. Pekinu, Shenzhen, Chongqing...) używa jej do bezpieczeństwa publicznego, zarządzania miastem, monitorowania opinii publicznej czy propagandy. Grupa Mediów Internetowych Prowincji Shandong wykorzystuje ją do analizy nastrojów społecznych. Wsparcie państwa jest namacalne: DeepSeek jest częścią Korytarza Innowacji Naukowo-Technologicznej Hangzhou Chengxi, agencji rozwoju gospodarczego wspieranej przez państwo. Raporty wskazują nawet na silne poparcie i wpływ Komunistycznej Partii Chin poprzez SASAC (organ nadzorujący majątek państwowy) oraz organizacje wojskowe i wywiadowcze.
To uznanie wpisuje się w ścisłe ramy regulacyjne. „Tymczasowe Środki Administracyjne dla Usług Generatywnej Sztucznej Inteligencji” z 2023 roku wymagają np. ocen bezpieczeństwa i przestrzegania „właściwego kierunku politycznego”. Warunki korzystania z DeepSeek stanowią, że podlegają one prawom Chińskiej Republiki Ludowej. Ta integracja mechanizmów cenzury jest jednym z powodów jej sukcesu w Chinach.
Firma jest też symbolem sukcesu w kształceniu lokalnych talentów: analiza jej zespołu badawczego wykazała, że prawie wszyscy jego członkowie byli kształceni w Chinach, tworząc „jednokierunkowy transfer wiedzy” na korzyść kraju.
Pierwsza praca w branży technologicznej i AI: podwójna kara dla młodych absolwentów?
Po drugiej stronie Pacyfiku przyjęcie było co najmniej chłodne. Premiera modelu R1 została nazwana „sputnikowym momentem SI” przez inwestora venture capital Marca Andreessena, wywołując pewną panikę na rynkach. Choć aplikacja odnotowała skok pobrań, jej adopcja przez amerykańskie firmy pozostaje marginalna (0,2% w styczniu 2025), obciążona wątpliwościami co do wiarygodności i, przede wszystkim, ogromnymi obawami o bezpieczeństwo.
Raport z kwietnia 2025 (zobacz raport w języku angielskim) Specjalnego Komitetu Izby Reprezentantów ds. Komunistycznej Partii Chin rzucił kłody pod nogi, oskarżając DeepSeek o:
Skutek: komitet zalecił zakaz używania chińskich modeli SI przez agencje federalne. W ślad za tym amerykańska marynarka wojenna, NASA, Pentagon oraz stany takie jak Wirginia, Teksas i Nowy Jork zakazały jej używania na urządzeniach i systemach rządowych.
Problemy z bezpieczeństwem danych są liczne. Polityka prywatności DeepSeek wskazuje na przechowywanie danych w Chinach, zgodnie z chińskim prawem. Oceny wykazały słabe szyfrowanie i potencjalne luki. Badanie Cisco wykazało, że DeepSeek R1 nie zablokował żadnych szkodliwych zapytań, podczas gdy GPT-4o od OpenAI – 14%. Wyciek danych miał ujawnić ponad milion wrażliwych rekordów. Firma została też oskarżona o przekazanie danych użytkowników z Korei Południowej do Chin i USA bez ich zgody, na co DeepSeek odpowiedział, że miało to na celu poprawę doświadczeń użytkowników i zostało wstrzymane. Etycznie, DeepSeek miałby umożliwiać generowanie złośliwego oprogramowania i wykazywać tendencyjność prowojenną w scenariuszach polityki zagranicznej.
Microsoft jednak zaskoczył, współpracując z DeepSeek, aby zintegrować R1 ze swoją platformą chmurową Azure i do przetwarzania lokalnego na komputerach Copilot+, być może w celu dywersyfikacji oferty lub zaspokojenia specyficznych potrzeb prywatności.
Czy wiedziałeś?
DeepSeek, mimo początkowego dużego finansowania przez High-Flyer Quant, zdołał opracować swój model R1 za szacunkowy koszt treningu wynoszący zaledwie 5,6 miliona dolarów. To osiągnięcie każe zastanowić się nad kolosalnymi wydatkami zwykle związanymi z najnowocześniejszą SI i pokazuje, że innowacje algorytmiczne mogą czasem ważyć tyle, co góry gotówki.
DeepSeek to znacznie więcej niż zwykła firma technologiczna. To symbol chińskich ambicji w dziedzinie SI, zdolny do szybkich innowacji mimo ograniczeń. Uosabia też zachodnią nieufność wobec technologii potencjalnie powiązanych z rywalizującym państwem. Z jednej strony – innowacje open source, które mogą zdemokratyzować SI. Z drugiej – alarmy bezpieczeństwa, które zapalają się na czerwono.
Jej historia ilustruje możliwą „bałkanizację” globalnej SI, gdzie technologie rozwijałyby się w izolacji, hamując globalną współpracę, ale może stymulując zaciętą rywalizację w odrębnych blokach. Sprawa DeepSeek przypomina nam przede wszystkim, że wyścig w dziedzinie sztucznej inteligencji jest już nierozerwalnie związany z globalnymi układami sił.
Więc ostatecznie, czym jest DeepSeek? Niedocenionym geniuszem, wilkiem w przebraniu open source’owego chatbota, czy może po trochu jednym i drugim? Jedno jest pewne: w wielkim cyrku SI najbardziej zaskakujące numery często burzą program. A dla nas, widzów ciekawych świata, to raczej ekscytujące!
Jerome
Ekspert w dziedzinie tworzenia stron internetowych, SEO i sztucznej inteligencji, moje praktyczne doświadczenie w tworzeniu zautomatyzowanych systemów sięga 2009 roku. Dziś, oprócz pisania artykułów mających na celu rozszyfrowywanie aktualności i wyzwań AI, projektuję rozwiązania szyte na miarę oraz działam jako konsultant i szkoleniowiec w zakresie etycznej, wydajnej i odpowiedzialnej AI.