Technologia

LongCat 2.0 od Meituan pokonał GPT-5.5 w programowaniu bez chipów Nvidia

Susan Hill

LongCat 2.0 ma 1,6 biliona parametrów, przetwarza okno kontekstowe o rozmiarze miliona tokenów i właśnie wyprzedził GPT-5.5 od OpenAI na wiodącym benchmarku inżynierii oprogramowania w rzeczywistych warunkach. Zbudował go Meituan — firma, którą większość ludzi poza Chinami zna, jeśli w ogóle, jako aplikację do zamawiania jedzenia.

Model uzyskał 59,5 punktu na SWE-bench Pro wobec 58,6 punktu GPT-5.5. Różnica wydaje się niewielka, lecz kontekst sprawia, że osiągnięcie jest imponujące. Meituan wytrenował LongCat 2.0 na ponad 50 000 krajowych chińskich akceleratorów AI — bez sprzętu Nvidia, którego Chiny nie mogą importować w dużych ilościach od 2022 roku. Producent chipów nie został oficjalnie potwierdzony, ale środowisko techniczne wskazuje na Huawei Ascend 910B. Jeśli tak jest, byłoby to pierwsze publiczne i weryfikowalne osiągnięcie modelu trenowanego na chipach Huawei na poziomie topowych systemów.

LongCat 2.0 używa architektury Mixture-of-Experts: przy każdym zapytaniu aktywuje się od 33 do 56 miliardów parametrów, co zapewnia szybkie działanie bez potrzeby posiadania drogiego sprzętu. Okno kontekstowe o rozmiarze miliona tokenów pozwala załadować całą bazę kodu w jednej sesji. Na SWE-bench Multilingual model uzyskał 77,3 punktu; na Terminal-Bench, testującym nawigację w prawdziwym środowisku Unix, osiągnął 70,8.

Przed oficjalnym ogłoszeniem model działał na platformie OpenRouter pod nazwą kodową „Owl Alpha” przez mniej więcej dwa miesiące. Deweloperzy, którzy z niego korzystali, zauważyli jego niezwykłe zdolności programistyczne, nie wiedząc, skąd pochodzi. Meituan potwierdził po premierze, że Owl Alpha to właśnie LongCat 2.0 w fazie wczesnej ewaluacji.

Licencja MIT mówi tylko część prawdy. Mimo że jest jedną z najbardziej otwartych i permisywnych dostępnych, wagi modelu nie zostały jeszcze opublikowane. Zarówno repozytorium na GitHub, jak i karta modelu na Hugging Face informują „wkrótce”. Dostęp do LongCat 2.0 jest na razie możliwy wyłącznie przez hostowane API — pobieranie, dostrajanie ani uruchamianie lokalnie nie są jeszcze dostępne.

Meituan przetwarza codziennie ponad 50 milionów zamówień żywnościowych i cicho zbudował wewnętrzny model językowy o nazwie Zhichi. LongCat 2.0 to jego pierwszy publiczny model i, biorąc pod uwagę wyniki benchmarków, jeden z najpotężniejszych systemów do kodowania dostępnych na otwartej licencji.

Gdy wagi zostaną opublikowane, LongCat 2.0 wejdzie w bezpośrednią rywalizację z Llama 4.1 od Meta i DeepSeek-V4 Pro. Odpowiedź na pytanie o krajowe chipy, które to umożliwiły, będzie mieć konsekwencje daleko poza światem AI.

Tagi: , , , , ,

Dyskusja

Jest 0 komentarzy.