Clock IA > Czym jest DeepSeek? Chińska sztuczna inteligencja, która przyprawia Dolinę Krzemową o zawrót głowy
Czym jest DeepSeek? Chińska sztuczna inteligencja, która przyprawia Dolinę Krzemową o zawrót głowy

DeepSeek: wschodząca (i kłopotliwa) gwiazda chińskiej sztucznej inteligencji, która na nowo definiuje wyścig technologiczny

Urodzona w 2023 roku DeepSeek, chińska firma zajmująca się sztuczną inteligencją, podbiła świat technologii dzięki wydajnym modelom i podejściu "open source". Mistrzyni w Chinach, zagrożenie dla USA – uosabia ona nową zimną wojnę technologiczną.

W takim razie, czym właściwie jest DeepSeek? Ledwo zdążyliśmy powiedzieć "algorytm", a już mamy DeepSeek, a bardziej formalnie Hangzhou DeepSeek Artificial Intelligence Basic Technology Research Co., Ltd., która od momentu powstania znalazła się w centrum światowej sceny AI. Wyobraźcie sobie technologiczną kometę: błyskawiczne postępy, oszałamiająca efektywność kosztowa i filozofia open source (czyli dostępny i modyfikowalny kod), która wywraca dotychczasowe schematy do góry nogami. Rezultat? W Chinach to prawdziwy hit, swoisty motor narodowej innowacji. W Stanach Zjednoczonych? Atmosfera jest raczej pełna niepokoju, a DeepSeek postrzegana jest jako potencjalne zagrożenie dla bezpieczeństwa narodowego. Czy to więc tylko rozkręcony start-up, czy może pionek w znacznie większej strategii? Zajrzyjmy za kulisy.

24/05/2025 02:37 Jérôme

Od funduszy hedgingowych do sieci neuronowych: narodziny giganta

Za DeepSeek stoi Liang Wenfeng, prezes firmy i współzałożyciel High-Flyer, jednego z wiodących chińskich funduszy hedgingowych specjalizujących się w handlu kwantowym wspieranym przez sztuczną inteligencję. To nie jest drobny szczegół: High-Flyer zainwestował co najmniej 420 milionów dolarów jako kapitał początkowy. Zapomnij o obrazie start-upu powstałego w garażu; tutaj mówimy o strategicznej inkubacji przez już dobrze ugruntowaną jednostkę technologiczno-finansową. Jeśli w kwietniu 2025 roku baza danych Tracxn klasyfikowała DeepSeek jako „niefinansowaną” przez zewnętrzny kapitał wysokiego ryzyka, to dlatego, że firma najpierw korzystała z własnych środków, co pozwoliło jej skupić się na badaniach i rozwoju, z dala od typowych presji. Ale wobec rosnącego zapotrzebowania na jej chatbota, firma rozważała otwarcie się na zewnętrzne finansowanie.

Przepis DeepSeek: mieszanka pikantnych innowacji

DeepSeek nie próżnował, wypuszczając całą serię dużych modeli językowych (LLM) w rekordowym czasie. To trochę jak szef kuchni, który w ciągu kilku miesięcy serwuje kilka dań z gwiazdkami Michelin:

  • Modele ogólne (Seria V): Już w listopadzie 2023 roku pierwszy model o 67 miliardach parametrów radził sobie lepiej niż niektórzy konkurenci. Potem nadszedł DeepSeek-V2 w maju 2024 (236 miliardów parametrów, z czego 21 miliardów aktywnych na „token” – podstawową jednostkę tekstu dla SI), a w grudniu 2024 roku DeepSeek-V3, potwór o 671 miliardach parametrów (z czego 37 miliardów aktywnych).
  • Myśliciele (Seria R): Model R1, wprowadzony w styczniu 2025 roku, wzbudził sensację dzięki zaawansowanym zdolnościom rozumowania, szczególnie w matematyce, rywalizując z o1 od OpenAI. Jego następca, R2, oczekiwany na początku 2025 roku, obiecuje jeszcze więcej: wielojęzyczność, generowanie kodu i możliwości multimodalne (rozumienie tekstu, obrazu, dźwięku...). Plotki mówią nawet o wykorzystaniu chińskich układów Huawei Ascend 910B i 1,2 biliona parametrów.
  • Koderzy (Seria Coder): DeepSeek Coder (listopad 2023) już radził sobie z ponad 80 językami programowania. Jego wersja V2 (lipiec 2024) obsługiwała 338 języków, z 236 miliardami parametrów i pamięcią kontekstową na 128 000 tokenów. Praktyczne rozwiązanie dla programistów na całym świecie!
  • Złote rączki (Multimodalne): Dzięki DeepSeek-VL (Vision-Language) oraz możliwościom multimodalnym w DeepSeek-V2 i planowanym w R2, SI uczy się widzieć i słyszeć świat, oprócz czytania o nim.

Sekret tej efektywności? Sprytne wybory architektoniczne. DeepSeek wykorzystuje m.in. architekturę Mieszanki Ekspertów (MoE): wyobraź sobie zespół specjalistów, gdzie tylko odpowiedni ekspert jest angażowany do konkretnego zadania. To bardziej wydajne niż mobilizowanie całego zespołu do każdego pytania. DeepSeek-V3, na przykład, aktywuje „tylko” 37 miliardów z 671 miliardów parametrów na token. Dodaj do tego techniki takie jak Wielogłowa Uwaga Latentna (MLA), aby poprawić efektywność wnioskowania (moment, gdy SI „myśli”), oraz trening w precyzji mieszanej FP8, aby oszczędzać pamięć i moc obliczeniową. Te innowacje to sprytna odpowiedź na amerykańskie ograniczenia w eksporcie najnowocześniejszych układów.

Firma nie poprzestaje na tym i we współpracy z Uniwersytetem Tsinghua rozwija nowatorskie techniki treningowe, takie jak Generatywne Modelowanie Nagród (GRM), gdzie model generuje własne informacje zwrotne, oraz Samooceniające się Dostrajanie Krytyczne (SPCT), gdzie uczy się oceniać własne odpowiedzi. Cel? Bardziej autonomiczne SI, wymagające mniejszej ludzkiej kontroli, aby się doskonalić.

Sztuczna inteligencja w biurze: 7 na 10 pracowników już z niej korzysta w Korei Południowej, a wkrótce u nas?

Open source i obniżone ceny: magiczna mikstura?

Jednym z kluczowych składników sukcesu DeepSeek jest jego zaangażowanie w open source. Model R1, na przykład, został udostępniony na licencji MIT, bardzo liberalnej. To strategia, która ma na celu uczynienie SI bardziej dostępną i kontrastuje z „zamkniętymi” modelami wielu amerykańskich konkurentów. To podejście, połączone z deklarowaną wyjątkową efektywnością kosztową (koszt treningu R1 miał wynieść zaledwie 5,6 miliona dolarów), demokratyzuje dostęp do zaawansowanej SI. To trochę jak podanie przepisu na danie gourmet z tanich składników: każdy może spróbować!

W Chinach: owacje na stojąco i czerwony dywan

W Chinach DeepSeek jest wynoszony pod niebiosa. Aplikacja stała się jedną z najczęściej pobieranych w App Store Apple krótko po premierze. W styczniu 2025 roku miała ponad 22,2 miliona aktywnych użytkowników dziennie w kraju, co stanowi około 30-39% jej globalnej bazy. Chwalona jako klejnot narodowej innowacji, technologia DeepSeek jest wdrażana przez podmioty publiczne, a nawet konkurentów.

Kilka lokalnych rządów (np. Pekinu, Shenzhen, Chongqing...) używa jej do bezpieczeństwa publicznego, zarządzania miastem, monitorowania opinii publicznej czy propagandy. Grupa Mediów Internetowych Prowincji Shandong wykorzystuje ją do analizy nastrojów społecznych. Wsparcie państwa jest namacalne: DeepSeek jest częścią Korytarza Innowacji Naukowo-Technologicznej Hangzhou Chengxi, agencji rozwoju gospodarczego wspieranej przez państwo. Raporty wskazują nawet na silne poparcie i wpływ Komunistycznej Partii Chin poprzez SASAC (organ nadzorujący majątek państwowy) oraz organizacje wojskowe i wywiadowcze.

To uznanie wpisuje się w ścisłe ramy regulacyjne. „Tymczasowe Środki Administracyjne dla Usług Generatywnej Sztucznej Inteligencji” z 2023 roku wymagają np. ocen bezpieczeństwa i przestrzegania „właściwego kierunku politycznego”. Warunki korzystania z DeepSeek stanowią, że podlegają one prawom Chińskiej Republiki Ludowej. Ta integracja mechanizmów cenzury jest jednym z powodów jej sukcesu w Chinach.

Firma jest też symbolem sukcesu w kształceniu lokalnych talentów: analiza jej zespołu badawczego wykazała, że prawie wszyscy jego członkowie byli kształceni w Chinach, tworząc „jednokierunkowy transfer wiedzy” na korzyść kraju.

Pierwsza praca w branży technologicznej i AI: podwójna kara dla młodych absolwentów?

W Stanach Zjednoczonych: zimny prysznic i zgrzytanie zębów

Po drugiej stronie Pacyfiku przyjęcie było co najmniej chłodne. Premiera modelu R1 została nazwana „sputnikowym momentem SI” przez inwestora venture capital Marca Andreessena, wywołując pewną panikę na rynkach. Choć aplikacja odnotowała skok pobrań, jej adopcja przez amerykańskie firmy pozostaje marginalna (0,2% w styczniu 2025), obciążona wątpliwościami co do wiarygodności i, przede wszystkim, ogromnymi obawami o bezpieczeństwo.

Raport z kwietnia 2025 (zobacz raport w języku angielskim) Specjalnego Komitetu Izby Reprezentantów ds. Komunistycznej Partii Chin rzucił kłody pod nogi, oskarżając DeepSeek o:

  • Przesyłanie danych Amerykanów do Chin za pośrednictwem infrastruktury powiązanej z China Mobile (uznaną przez Waszyngton za firmę wojskową).
  • Prawdopodobne wykorzystanie nielegalnych technik „destylacji modeli” (kopiowanie możliwości konkurencyjnych modeli) ze szkodą dla amerykańskich rozwiązań.
  • Omijanie kontroli eksportowych dotyczących układów scalonych.
  • Cenzurowanie opinii anty-KPCh i dostosowywanie wyników do propagandy partii.

Skutek: komitet zalecił zakaz używania chińskich modeli SI przez agencje federalne. W ślad za tym amerykańska marynarka wojenna, NASA, Pentagon oraz stany takie jak Wirginia, Teksas i Nowy Jork zakazały jej używania na urządzeniach i systemach rządowych.

Problemy z bezpieczeństwem danych są liczne. Polityka prywatności DeepSeek wskazuje na przechowywanie danych w Chinach, zgodnie z chińskim prawem. Oceny wykazały słabe szyfrowanie i potencjalne luki. Badanie Cisco wykazało, że DeepSeek R1 nie zablokował żadnych szkodliwych zapytań, podczas gdy GPT-4o od OpenAI – 14%. Wyciek danych miał ujawnić ponad milion wrażliwych rekordów. Firma została też oskarżona o przekazanie danych użytkowników z Korei Południowej do Chin i USA bez ich zgody, na co DeepSeek odpowiedział, że miało to na celu poprawę doświadczeń użytkowników i zostało wstrzymane. Etycznie, DeepSeek miałby umożliwiać generowanie złośliwego oprogramowania i wykazywać tendencyjność prowojenną w scenariuszach polityki zagranicznej.

Microsoft jednak zaskoczył, współpracując z DeepSeek, aby zintegrować R1 ze swoją platformą chmurową Azure i do przetwarzania lokalnego na komputerach Copilot+, być może w celu dywersyfikacji oferty lub zaspokojenia specyficznych potrzeb prywatności.

Czy wiedziałeś?

DeepSeek, mimo początkowego dużego finansowania przez High-Flyer Quant, zdołał opracować swój model R1 za szacunkowy koszt treningu wynoszący zaledwie 5,6 miliona dolarów. To osiągnięcie każe zastanowić się nad kolosalnymi wydatkami zwykle związanymi z najnowocześniejszą SI i pokazuje, że innowacje algorytmiczne mogą czasem ważyć tyle, co góry gotówki.

Sztuczna inteligencja uprzedzona, sprawiedliwość pogwałcona: jak nasze algorytmy uczą się dyskryminacji

SI w ogniu geopolitycznej rozgrywki

DeepSeek to znacznie więcej niż zwykła firma technologiczna. To symbol chińskich ambicji w dziedzinie SI, zdolny do szybkich innowacji mimo ograniczeń. Uosabia też zachodnią nieufność wobec technologii potencjalnie powiązanych z rywalizującym państwem. Z jednej strony – innowacje open source, które mogą zdemokratyzować SI. Z drugiej – alarmy bezpieczeństwa, które zapalają się na czerwono.

Jej historia ilustruje możliwą „bałkanizację” globalnej SI, gdzie technologie rozwijałyby się w izolacji, hamując globalną współpracę, ale może stymulując zaciętą rywalizację w odrębnych blokach. Sprawa DeepSeek przypomina nam przede wszystkim, że wyścig w dziedzinie sztucznej inteligencji jest już nierozerwalnie związany z globalnymi układami sił.

Więc ostatecznie, czym jest DeepSeek? Niedocenionym geniuszem, wilkiem w przebraniu open source’owego chatbota, czy może po trochu jednym i drugim? Jedno jest pewne: w wielkim cyrku SI najbardziej zaskakujące numery często burzą program. A dla nas, widzów ciekawych świata, to raczej ekscytujące!

Jerome

Ekspert w dziedzinie tworzenia stron internetowych, SEO i sztucznej inteligencji, moje praktyczne doświadczenie w tworzeniu zautomatyzowanych systemów sięga 2009 roku. Dziś, oprócz pisania artykułów mających na celu rozszyfrowywanie aktualności i wyzwań AI, projektuję rozwiązania szyte na miarę oraz działam jako konsultant i szkoleniowiec w zakresie etycznej, wydajnej i odpowiedzialnej AI.

Facebook - X (Twitter) - Linkedin
Clock IA > Czym jest DeepSeek? Chińska sztuczna inteligencja, która przyprawia Dolinę Krzemową o zawrót głowy