Technologia

DeepSeek obniżył cenę AI, a amerykańska bańka liczyła na coś przeciwnego

Susan Hill

DeepSeek, chińskie laboratorium wyrosłe z ilościowego funduszu hedgingowego, uparcie robi to, co amerykańska branża AI uznała za niemożliwe. Buduje modele działające blisko czołówki, trenuje je za ułamek tego, co wydają rywale w Stanach, a potem publikuje wagi, by każdy mógł je pobrać i uruchomić. Każda premiera otwiera ten sam spór: wycena całego amerykańskiego sektora AI opiera się na założeniu, które DeepSeek po cichu rozmontowuje, że inteligencja musi pozostać droga.

To założenie nie jest abstrakcyjne. Podtrzymuje setki miliardów dolarów budowanych centrów danych, kursy producentów układów i dostawców chmury obecnych w niemal każdym funduszu indeksowym oraz miesięczną subskrypcję, którą wielu czytelników już płaci za chatbota. Jeśli rywal dostarcza porównywalne wyniki znacznie taniej i rozdaje oprogramowanie, premia za rzadką i kosztowną moc obliczeniową wygląda mniej jak fosa, a bardziej jak zakład.

Twierdzenie DeepSeeka dotyczy wydajności, nie magii. Inżynierowie postawili na architekturę mieszanki ekspertów, która przy każdym zapytaniu budzi tylko część modelu, na intensywne użycie obliczeń niższej precyzji i na potoki treningowe dostrojone do pracy na mniejszej liczbie układów, częściowo objętych restrykcjami eksportowymi. Najczęściej powtarzana liczba dla jednego z głównych treningów mieściła się poniżej sześciu milionów dolarów. Porównywalne treningi amerykańskie kosztują wielokrotnie więcej, gdy zsumować pełny rachunek.

Sposób publikacji modelu liczy się tak samo jak jego koszt. DeepSeek udostępnia otwarte wagi, więc programista w São Paulo, laboratorium uniwersyteckie w Warszawie czy start-up w Seulu mogą pobrać model i uruchomić go na własnych maszynach, bez płacenia amerykańskiemu dostawcy za każde zapytanie i bez wysyłania danych za granicę. Jest w tym ironia: kontrole eksportu, które miały spowolnić chińską AI przez odcięcie najpotężniejszych układów, najwyraźniej skłoniły DeepSeeka do wyciskania więcej z mniej, a te oszczędne metody jadą teraz wszędzie tam, dokąd trafiają otwarte wagi.

Dla kogoś, kto po prostu używa tych narzędzi, natychmiastowym skutkiem jest wybór. Tańsze modele ciągną w dół ceny subskrypcji, wprowadzają sprawniejszych asystentów na zwykłe laptopy i telefony i osłabiają argument za przywiązaniem się do jednego dostawcy. To, co wyglądało na usługę do wynajęcia, zaczyna wyglądać na oprogramowanie, które można mieć na własność.

Mówienie o bańce wymaga dużych zastrzeżeń. Liczba poniżej sześciu milionów dolarów obejmuje jeden finalny trening, a nie badania, ślepe uliczki, pensje ani sprzęt, które go umożliwiły, więc zestawianie jej z całkowitymi wydatkami amerykańskiego laboratorium to porównywanie dwóch różnych rzeczy. Otwarte wagi to też nie otwarte źródło; dane treningowe i pełna metoda pozostają prywatne. A argument o wydajności tnie w obie strony. Zapytane o DeepSeeka, kierownictwo Microsoftu sięgnęło po paradoks Jevonsa, dawną obserwację, że gdy zasób staje się tańszy w użyciu, jego łączne zużycie raczej rośnie, niż spada. Tańsza inteligencja może po prostu oznaczać, że świat kupuje jej znacznie więcej, co byłoby dobrą wiadomością dla sprzedających moc obliczeniową, a nie złą.

To też nie pierwszy raz, gdy ogłasza się śmierć bańki. To samo laboratorium wywołało kiedyś największą jednodniową utratę wartości giełdowej w historii USA, wymazując w jedno popołudnie blisko sześćset miliardów dolarów u jednego producenta układów, po czym patrzyło, jak akcje odrabiają niemal wszystko w ciągu tygodni. Wielkie amerykańskie firmy AI nie odpowiedziały mniejszymi wydatkami. Zebrały więcej i zbudowały większe. Każde twierdzenie, że bańka w końcu pękła, musi przetrwać fakt, że właśnie ci z największymi pieniędzmi na stole podwajają stawkę.

To, co DeepSeek naprawdę zrobił, trudniej udramatyzować niż pękniętą bańkę. Odebrał wygodę zakładania, że czołowe amerykańskie laboratoria chroni mur kapitału nie do przeskoczenia. Jeśli zdolność z czołówki da się tanio przybliżyć i rozdać za darmo, wartość przestaje tkwić w posiadaniu modelu. Przenosi się na dystrybucję, na produkty zbudowane wokół modelu i na tego, kto trzyma klienta. Następny test jest już w kalendarzu, choć bez wpisanej daty: każda nowa premiera DeepSeeka otwiera to samo pytanie i ląduje na rynku, który zobowiązał się wydawać więcej, nie mniej, w przekonaniu, że skala wciąż wygrywa. Rozstrzygnie się to w wynikach kwartalnych i prognozach inwestycji najbliższych miesięcy, a nie w wątku na forum ogłaszającym koniec walki.

Dyskusja

Jest 0 komentarzy.