AI čipy Huawei Ascend zatím na Nvidii nemají. Vývojáři modelů hlásí kritické chyby
Čínský Huawei se na domácím trhu potýká s problémy v oblasti AI čipů Ascend. Tyto supervýkonné procesory měly postupně nahradit čipy americké Nvidie. Jenomže softwarové řešení je plné chyb a zákazníci si proto stěžují na problémy s výkonem i komplikace při přechodu na architekturu Huawei.
redaktorka
Vzhledem k tomu, že USA loni výrazně zpřísnily sankce na vývoz čipů Nvidia do Číny, potřeboval čínský trh urychleně zaplnit mezeru. Čímž se de facto rozběhl technologický závod o opanování tohoto klíčového segmentu. Do čela se poměrně záhy dostala společnost Huawei se svými extrémně výkonnými AI čipy Ascend, které měly umožnit místním firmám pokračovat ve vývoji, výuce a aplikaci velkých jazykových modelů (LLM).
Několik zasvěcených osob z oboru, včetně inženýra AI v jedné z partnerských společností, však uvedlo, že čipy Ascend stále výrazně zaostávají za leckterými čipy Nvidie. Na vině jsou podle informací deníku Financial Times (FT) problémy se stabilitou, pomalejším propojením a horším softwarem, respektive výpočetní architekturu, kterou Huawei pojmenoval CANN (Compute Architecture for Neural Networks).
Tu si můžeme představit jako mozek čipu, protože díky ní lze v podstatě ovládat výkon hardwaru a řídit práci a efektivitu celého procesorem osazeného zařízení. Svou vlastní hardwarovou a softwarovou architekturu má samozřejmě i Nvidia, konkrétně jde o platformu CUDA, která je pro vývojáře obvykle snadno použitelná a dokáže výrazně urychlit zpracování dat.
Mezi těmi, kdo si na CANN stěžují, jsou i vlastní zaměstnanci Huawei. Jeden z výzkumníků, který si nepřál být jmenován, uvedl, že kvůli němu je používání produktu Ascend obtížné a nestabilní a práce na jeho testování je ztížena.
„Když se vyskytnou náhodné chyby, je kvůli špatné dokumentaci velmi složité zjistit, odkud pocházejí. Talentovaní vývojáři pak musejí pročítat zdrojový kód, aby zjistili, kde přesně se problém nachází. Jenomže to pak všechnu naši práci dost zpomaluje.“
Financial Times citují dalšího čínského inženýra, který hovoří o situaci ve společnosti Baidu, která také využívá čipy Huawei Ascend. Ty údajně často padají, což komplikuje práci na vývoji a výcviku modelů umělé inteligence.
Výzkumník z Huaweie jeho slova pak potvrzuje a vysvětluje, že k pádům dochází, protože je těžké hardware správně používat. „Špatných výsledků lze dosáhnout vlastně poměrně snadno. Lidé toho totiž o samotném hardwaru mnoho nevědí,“ říká.
Ačkoliv se Huawei odmítla k informacím FT vyjádřit, snaží se evidentně situaci zachránit a vysílá své inženýry do terénu, aby pomohli zákazníkům, jako jsou například právě Baidu – ale také iFlytek či Tencent – problémy vyřešit přímo na místě.
Mnohé firmy se totiž potýkají i s obtížným přechodem z produktů Nvidie na Huawei a specialisté jim pomáhají i s převodem kódu, jenž byl původně napsaný v CUDA, do CANN. Což přeloženo z „ajťáčtiny“ do češtiny znamená, že Huawei momentálně pomáhá svým zákazníkům k tomu, aby k práci na velkých jazykových modelech mohli bez problémů používat čipy Ascend. A mohli tak konečně plně nahradit čipy Nvidie.
O což se mimochodem čínský gigant i nadále intenzivně snaží. Proto v současnosti pracuje na vývoji čipu Ascend 910C, který již začal testovat u různých čínských internetových a telekomunikačních partnerů, aby prověřil jeho celkový potenciál i výkonnostní efektivitu. Dílčí výsledky testů naznačují, že by tento čip měl dokázat velmi dobře konkurovat AI čipu Nvidia H100, který se (spolu s dalšími Nvidia AI čipy) v Číně prodávat nesmí.