DeepSeek: A túlbefektetés határán vagy a Jevons-paradoxon kezdetén?

picture

2025. január 27-e az Nvidia „fekete hétfőjeként” vonul be a történelembe, hiszen a vállalat piaci értéke egyetlen nap alatt 589 milliárd dollárral csökkent. A DeepSeek berobbanása alapjaiban kérdőjelezi meg a mesterséges intelligenciával kapcsolatos fejlesztésekbe ölt dollármilliárdok indokolhatóságát és megtérülését.

A DeepSeek – amely eredetileg a High-Flyer hedge fund egyik divíziójaként indult – modelljének kalibrálása „csupán” 5,6 millió dollárba került, amelyhez H800 GPU-kat használtak fel. Ez a chip a H100 módosított változata, amelyet az exportszabályok miatt kifejezetten a kínai piacon értékesítenek. A módosítás lényege, hogy a kínai verziónak alacsonyabb adatátviteli sebessége van, ami gyengébb összteljesítményhez vezet.

Azonban a modellfejlesztők megpróbálták különböző innovatív megoldásokkal ledolgozni ezt a hátrányt, például 8 tizedesjegyet használtak 16 vagy 32 helyett a kalkulációk elvégzésekor, ami jelentős hatékonyságnövekedést okozott. Ugyanakkor vannak, akik vitatják azt, hogy a DeepSeek ne rendelkezett volna eleve H100 GPU-val, ahogy arra Elon Musk és Alexandr Wang (Scale AI CEO-ja) is felhívták a figyelmet, akik 50 000 darabra saccolják a kínaiak chiparzenálját.

Jelenleg azt nem lehet 100 százalékos pontossággal eldönteni, hogy kinek lehet igaza, de ha elhisszük a kínaiak verzióját, akkor nekik sikerült egy olyan modellt létrehozniuk, amely a teljesítményével felülmúlja a Szilícium-völgy technológiai óriásainak fejlesztéseit. Mindezt úgy, hogy a hiperskálázó cégek már egyértelműen az Nvidia újabb, korszerűbb H100 vagy akár H200 GPU-it használják – mint például az OpenAI, a ChatGPT fejlesztője.

JOGGAL MERÜL FEL A KÉRDÉS, HOGY HA EGY RÉGEBBI, OLCSÓBB GPU-VAL ILYEN EREDMÉNYT LEHET ELÉRNI, AKKOR MIÉRT KÖLTENEK A HIPERSKÁLÁZÓK GIGANTIKUS ÖSSZEGEKET MESTERSÉGES INTELLIGENCIA-INFRASTRUKTÚRÁRA, AMELYEK JAVARÉSZÉT A CHIPVÁSÁRLÁS VISZI EL?

Jelenleg az AI iparágának négy legnagyobb hiperskálázó szereplője az Amazon (AWS), a Microsoft (Azure), az Alphabet (Google Cloud) és a Meta, akik a becslések szerint 2024-ben összesen 213 milliárd dollárt fektettek be mesterséges intelligenciával kapcsolatos projektekbe. Hogy érzékeltessük a számok nagyságát: ez az összeg meghaladja Magyarország 2023-as GDP-jét, dollárban és folyó áron kifejezve.

Elképesztő összegek repkednek tehát az AI körül, amit Sundar Pichai, az Alphabet CEO-ja 2024 júliusában úgy érvelt meg, hogy:

Az alulbefektetés kockázata számukra (AI terén) drámaian nagyobb, mint a túlbefektetésé.

Ez a kijelentés tökéletesen tükrözi az elmúlt negyedévek hangulatát, de kérdés, hogy a DeepSeek berobbanása hogyan változtat a status quo-n; ha változtat-e egyáltalán, hiszen közel sem biztos, hogy a hiperskálázók a kevesebb beruházás irányába fognak elmozdulni. Jelenleg nem tudjuk, hogy a mérleg melyik irányba billenhet el, hiszen az is lehet, hogy a Jevons-paradoxon kibontakozásának első szakaszában vagyunk, ahogyan erre Satya Nadella, a Microsoft CEO-ja is utalt a hétfő esti Twitter bejegyzésében:

A Jevons-paradoxon ismét lecsap! Ahogy a mesterséges intelligencia egyre hatékonyabbá és hozzáférhetőbbé válik, úgy fogjuk látni, hogy használata az egekbe szökik, és olyan árucikké válik, amiből nem tudunk betelni.

Jevons-paradoxon

A Jevons-paradoxon, Jevons-hatás vagy visszapattanó hatás a közgazdaságtanban egy jelenség, miszerint azok a technológiai fejlesztések, amelyek egy erőforrás felhasználásának hatékonyságát javítnák, ahelyett hogy csökkentenék az erőforrás használatát, akár növelhetik is azt. 1865-ben az angol William Stanley Jevons közgazdász figyelte meg, hogy technológiai fejlesztések, amelyek a szén hatékonyabb felhasználását tették lehetővé, a szén nagyobb mennyiségű felhasználásához vezettek az ipar több területén.

Jelen blogbejegyzés a szerző magánvéleményét tükrözi, amely nem feltétlenül egyezik a Concorde Csoport hivatalos álláspontjával.


Ajánló

picture

Jensen Huang: az Nvidia mögött álló zseni

Olvasási idő: 6 p
Az alázatos munkában hisz, nem abban, hogy az ideális munkahelyen mindig mindenki jól érzi magát. Huangnak hatalmas rajongótábora lett, Tajvanban gyakorlatilag popsztárként kezelik.
picture

Teljesen felforgatja a tőzsdéket a mesterséges intelligencia

Olvasási idő: 5 p
Könnyen előállhat egy olyan helyzet, hogy a masszív 2022-es esések után július közepére az S&P 500 index megközelítse 2022 eleji élete csúcsát. Ha ennél is tovább emelkedik a piac, akkor könnyen lehet, hogy az idei év a mesterséges intelligencia mániájának az éveként vonul majd be a tőzsdetörténelembe.
picture

Ma már mindenki az AI-ról beszél, nem a metaverzumról

Olvasási idő: 2 p
A ChatGPT-vel sokak szemében vált az AI valós technológiai jövőképpé, amellyel érdemes és kell is foglalkozni. A vállalatok sorra hagynak fel a metaverzummal kapcsolatos projektjeikkel, a Meta azonban hosszú távon továbbra is lát benne fantáziát.