hogyan-torheti-meg-az-intel-mi-mindenutt-strategiaja

A vállalatok számára testreszabott genAI modellekre és az ipari szabványos Ethernetre összpontosítva az Intel látja a módját, hogyan nyerheti vissza dominanciáját a számítástechnika új korszakában.

Kép forrása: https://www.intel.com/content/www/us/en/newsroom/news/vision-2024-enterprise-ai-gaudi-3-open-systems-strategy.html#gs.7tgiel

Az Intel Vision éves konferenciáján Pat Gelsinger vezérigazgató ambiciózus ütemtervet vázolt fel, amely a generatív mesterséges intelligenciát (genAI) minden lépésben tartalmazza.

Az Intel hardverstratégiájának középpontjában az új Gaudi 3 GPU áll, amelyet kifejezetten az adatközpontokban a genAI-t megalapozó nagyméretű nyelvi modellek (LLM) képzésére és futtatására terveztek. Az Intel beveti a Xeon 6 processzorok új sorozatát is – melyek némelyike beépített neurális feldolgozó egységgel (NPU vagy “AI gyorsító”) rendelkezik majd, amelyet munkaállomásokban, PC-kben és átjáróeszközökben használnak. Az Intel azt is állítja, hogy Xeon 6 processzorai elég jók lesznek a kisebb, testreszabottabb LLM-ek futtatásához, amelyek várhatóan egyre elterjedtebbek lesznek.

Az Intel előadta, hogy a chipjei olcsóbbak lesznek, és barátságosabb ökoszisztémát használnak, mint az Nvidia.

Gelsinger kulcsbeszédében az Nvidia népszerű H100 GPU-jához hasonlította, mondván, hogy a Gaudi 3 AI gyorsító átlagosan 50%-kal jobb következtetést és átlagosan 40%-kal jobb energiahatékonyságot biztosít “a költségek töredékéért”. Az Intel azt is állítja, hogy a Gaudi 3 a különböző típusú LLM-ek betanításában is felülmúlja a H100-at – és ezt akár 50%-kal gyorsabban is képes megtenni.

Az IDC Research szerint a rendkívül nagyméretű LLM-ek képzéséhez szükséges szerver- és tárolóinfrastruktúra az LLM-ek csillapíthatatlan számítás- és adatéhsége miatt az AI infrastruktúra piacának egyre nagyobb részét fogja kitenni. Az IDC előrejelzése szerint a világméretű AI hardverpiac (szerver és tároló), beleértve a generatív AI futtatásához szükséges hardvereket is, a 2021-es 18,8 milliárd dollárról 2026-ra 41,8 milliárd dollárra fog nőni, ami a teljes szerver- és tárolópiac közel 20%-át teszi ki az infrastruktúrapiacnak.

Az adatközponti szerverekben való gyorsan növekvő alkalmazás mellett a genAI várhatóan 2030-ra több mint 1,8 milliárd darabra növeli a PC-kbe és más mobil eszközökbe szánt, eszközre szerelt AI-chipszetek számát. Az ABI Research szerint ugyanis a laptopok, okostelefonok és más formátumok egyre inkább készülékbe épített AI-képességekkel lesznek ellátva. Laikusan fogalmazva, az Intel azt szeretné, ha Xeon chipjei (és NPU-i) az asztali, mobil és átjáróeszközök meghajtására szolgálnának. Az Intel következő generációs Core Ultra processzora – a Lunar Lake – várhatóan még idén megjelenik, és több mint 100 platformtera művelet/másodperc (TOPS) és több mint 45 NPU TOPS értékkel rendelkezik majd, amely a genAI használatra alkalmas PC-k új generációját célozza meg.

Bár az NPU-k már évtizedek óta léteznek gépi tanulási rendszerekhez, az OpenAI ChatGPT megjelenése 2022 novemberében fegyverkezési versenyt indított el a chipgyártók között, hogy a leggyorsabb és legképzettebb gyorsítókkal szolgáljanak a genAI gyors bevezetéséhez.

Kép forrása: https://www.intel.com/content/www/us/en/newsroom/news/vision-2024-enterprise-ai-gaudi-3-open-systems-strategy.html#gs.7tgiel

Az Nvidia a versenytársakkal szemben előnnyel indult. Az Nvidia eredetileg számítógépes játékokhoz tervezett mesterséges intelligencia chipjei – a grafikus processzorok (GPU-k) – a gyorsítók sajátos formáját jelentik, de a hagyományos CPU-khoz képest költségesek. Mivel a GPU-kkal az Nvidia képes volt kihasználni a genAI aranylázát, a vállalat gyorsan a harmadik legértékesebb vállalat lett az Egyesült Államokban. Piaci értékelésben csak a Microsoft és az Apple előzi meg.

Az iparági elemzők egyetértenek abban, hogy az Intel versenyképességi terve szilárd, de meredek hegyet kell megmásznia ahhoz, hogy utolérje az Nvidia-t, a gyár nélküli chipgyártót, amely az adatközpontok AI GPU-piacának mintegy 90%-ával és a teljes AI chippiac 80%-ával büszkélkedhet.

Raj Joshi, a Moody’s Investors Service vezető alelnöke szerint idővel az Nvidia adatközponti üzletágának több mint fele a felhőben futtatott AI-szolgáltatásokból fog származni. “A lecke nem maradt el az olyan felhőszolgáltatók, mint a Google és az Amazon számára, amelyek mindegyike saját GPU-kkal rendelkezik az AI-központú munkaterhelések támogatására” – mondta.

“Lényegében csak egyetlen szereplő van, amely az Nvidia és az AMD GPU-kat biztosítja, és ez a tajvani TSMC, amely ma a félvezetők vezető fejlesztője, mind technológiáját, mind piaci részesedését tekintve” – mondta Joshi.

Az Intel nem gyár nélküli. Régóta uralja a nagy teljesítményű CPU-k tervezését és gyártását, bár a genAI miatti legújabb kihívások a számítástechnikai tájkép alapvető változásait tükrözik.

Ironikus módon az Intel Gaudi 3 chipjét a TSMC gyártja a korábbi 7 nanométeres (nm) eljárással szemben az 5 nm gyártástechnológiával.

GenAI ma az adatközpontokban, holnap az élekben

Az adatközpontok továbbra is nagy számban fognak CPU-kat telepíteni az internetes szolgáltatások és a felhőalapú számítástechnika támogatására, de egyre inkább GPU-kat telepítenek az AI támogatására – és Benjamin Lee, a Pennsylvaniai Egyetem mérnöki és alkalmazott tudományok karának professzora szerint az Intelnek nehézségei vannak a versenyképes GPU-k tervezésével.

Alvin Nguyen, a Forrester Research vezető elemzője szerint az Intel Gaudi 3 GPU-ja és Xeon 6 CPU-ja alacsonyabb költséggel és kisebb energiaigénnyel jár, mint az Nvidia Blackwell H100 és H200 GPU-jai. Az olcsóbb, hatékonyabb chip segít enyhíteni a genAI-eszközök kielégíthetetlen energiaigényét, miközben még mindig “teljesítőképesek” maradnak – mondta.

A gyorsító mikroprocesszorok a genAI két elsődleges célját szolgálják: a képzést és a következtetést. A mesterséges intelligencia képzésével foglalkozó chipek hatalmas mennyiségű adatot használnak fel a neurális hálózati algoritmusok betanításához, amelyeknek aztán pontos előrejelzéseket kell készíteniük, például a következő szót vagy kifejezést egy mondatban vagy a következő képet. A chipeknek tehát arra is szükségük van, hogy gyorsan következtessenek arra, hogy mi lesz az a válasz egy kérésre (lekérdezésre).

Az LLM-eket azonban ki kell képezni, mielőtt hasznos választ tudnának levonni egy lekérdezésre. A legnépszerűbb LLM-ek az internetről származó hatalmas adathalmazok alapján adnak válaszokat, de néha pontatlanok vagy egyenesen bizarrak lehetnek, mint például a genAI hallucinációk esetében, amikor a technológia teljesen elszabadul.

Alan Priestley, a Gartner Research elemzős alelnöke szerint míg a mai GPU-k elsősorban a masszív LLM-ek számításigényes képzését támogatják, a jövőben a vállalatok kisebb genAI LLM-eket akarnak majd, amelyek saját adathalmazokon alapulnak – nem pedig egy cégen kívüli óceánból származó információkon.

Az Nvidia árazása egyelőre egy olyan nagy teljesítményű terméken alapul, amely kiválóan kezeli az LLM-ek intenzív kiképzésének igényeit – mondta Priestley. Az Nvidia pedig azt kérhet a termékért, amit akar, de ez azt jelenti, hogy a riválisok viszonylag könnyen alákínálhatnak a piacon.

RAG a megmentő

Ebből a célból az Intel Gelsinger az Intel Xeon 6 processzorokat hívta segítségül, amelyek képesek a retrieval augmented generation (Visszaellenőrző funkcióval elláttot létrehozás; „RAG”) folyamatok, futtatására. A RAG optimalizálja az LLM kimenetét azáltal, hogy egy külső tudásbázisra hivatkozik (hozzáfér) a hatalmas online adathalmazokon kívül, amelyeken a genAI LLM-eket hagyományosan képzik. A RAG szoftver segítségével egy LLM valós időben hozzáférhet egy adott szervezet adatbázisaihoz vagy dokumentumkészleteihez.

Egy RAG-képes LLM például segítséggel láthatja el az egészségügyi rendszer betegeit gyógyszerelési tanácsokkal, időpont-ütemezéssel, vénybeváltásokkal, valamint orvosok és kórházi szolgáltatások megtalálásával. A RAG az ügyfélrekordok bevitelére is használható a pontosabb és kontextuálisan megfelelőbb genAI-alapú chatbot-válaszok támogatása érdekében. A RAG folyamatosan keresi és beépíti az említett külső forrásokból származó frissítéseket is, vagyis a felhasznált információk naprakészek.

A RAG és a szűkebb értelemben vett LLM-ek előtérbe helyezése kapcsolódik az Intel bizalmas számítástechnikai és Trusted Domain (Megbízott tárhely) biztonsági erőfeszítéseihez, amelyek célja, hogy a vállalkozások úgy használhassák fel adataikat, hogy közben meg is védjék azokat.

“És ezekkel a modellekkel kapcsolatban az Intel azt mondja, hogy sokkal kisebb rendszerben – egy Xeon processzoron – lehet őket futtatni. Vagy futtathatod ezeket a modelleket egy NPU-val kiegészített processzoron” – mondta Priestley. “Akárhogy is, megcsinálhatod anélkül, hogy milliárdokat fektetnél be hatalmas hardverinfrastruktúra-tömbökbe.“

“A Gaudi 3, a Granite Rapids vagy a Sierra Forrest Xeon processzorok nagy nyelvi modelleket tudnak futtatni olyan típusú dolgokhoz, amelyekre egy vállalkozásnak szüksége lesz” – mondta Priestly.

Az Intel az ipari szabványos Ethernet használatára is fogadkozik, szembeállítva azt az Nvidia által a szabadalmaztatottabb InfiniBand nagy teljesítményű számítógépes hálózati buszra való támaszkodással.

Ethernet vagy Infiniband?

Egy e heti médiabeszélgetés során Das Kamhout, az Intel Xeon szoftverekért felelős alelnöke elmondta, hogy a Gaudi 3 chipek várhatóan “rendkívül versenyképesek” lesznek az árképzés, a vállalat nyílt szabványai és a chipbe integrált hálózat miatt, amely adatközpont-barát Ethernetet használ. A Gaudi 3 24 Ethernet-porttal rendelkezik, amelyeket a többi Gaudi chip közötti kommunikációra, majd a szerverek közötti kommunikációra használ.

Ezzel szemben az Nvidia InfiniBandet használ a hálózatépítéshez, valamint egy saját szoftverplatformot, a Compute Unified Device Architecture (CUDA) nevű rendszert; a programozási modell olyan API-t biztosít, amely lehetővé teszi a fejlesztők számára a GPU-erőforrások kihasználását anélkül, hogy a GPU-hardverek speciális ismereteire lenne szükség. A CUDA platform vált a genAI gyorsított számítások iparági szabványává, és csak az Nvidia hardverével működik.

Az Intel a saját platform helyett egy nyílt Ethernet hálózati modell létrehozásán dolgozik a genAI szövetek számára, és a Vision konferencián egy sor AI-optimalizált Ethernet-megoldást mutatott be. A vállalat az Ultra Ethernet Consortiumon (UEC) keresztül dolgozik a nagyméretű, mindenhogyan skálázható AI-szövetek tervezésén.

“Az AI-fejlesztők… egyre inkább el akarnak szakadni a CUDA használatától, ami sokkal jobban szállíthatóvá teszi a modelleket” – mondta a Gartner Priestley.

Új chipes fegyverkezési verseny

Sem az Intel, sem az Nvidia nem tudott lépést tartani a genAI-felhasználások tűzvihara okozta kereslettel. Az Nvidia GPU-i már akkor is népszerűek voltak, ami miatt a vállalat részvényeinek árfolyama 2023 januárja óta közel 450%-kal ugrott meg. És tovább nyomul előre: a múlt hónapban tartott GTC AI konferenciáján az Nvidia bemutatta a H100 utódját, a Blackwell B200-at, amely akár 20 petaflops számítási teljesítményt nyújt.

Eközben az Intel a Vision konferenciáján beharangozta a Xeon processzorok hatodik generációját, amelynek része a Sierra Forest, az első “E-Core” Xeon 6 processzor, amely foglalatonként 144 maggal kerül az ügyfelekhez, “fokozott hatékonyságot demonstrálva” az IDC Research alelnöke, Peter Rutten szerint. Az Intel állítása szerint pozitív visszajelzéseket kapott a Sierra Forest chipet tesztelő felhőszolgáltatóktól.

Az Intel legújabb Xeon 6-os processzorcsaládját az adatközpontokban, felhőben és átjáró eszközökben való felhasználásra szánja, de ezek a chipek kisebb és közepes méretű LLM-eket fognak kezelni.

Az Intel az év második negyedévében tervezi a Granite Rapids processzor kiadását is. “A termék, amely az Intel 3 nm-es eljárásán készül, ugyanazt az alaparchitektúrát használja, mint a Sierra Forest, amivel könnyen hordozható, a megnövekedett mag és wattonkénti teljesítmény, valamint a jobb memóriasebesség mellett” – írta Rutten a jelentésben. Az Intel állítása szerint a Granite Rapids processzor akár 70 milliárd paramétert tartalmazó Llama-2 modelleket is képes futtatni.

Forrester Nguyen szerint az Intel következő generációs Xeon 6 és Core Ultra processzorai kulcsfontosságúak lesznek ahhoz, hogy a vállalat különböző felhasználási esetekben, beleértve a képzést, a hangolást és a következtetést, különböző helyeken (azaz a végfelhasználók, az átjárók és az adatközpontok között) képes legyen AI-megoldásokat kínálni. A Xeon és Core Ultra processzorokat azonban a kisebb és közepes méretű nagy nyelvi modellek számára forgalmazzák. Az Intel új Gaudi 3 processzora kifejezetten genAI felhasználásra készült, és az Intel szóvivője szerint a 176 milliárd vagy annál több paramétert tartalmazó LLM-eket célozza majd.

“A folyamatos AI [chip] ellátási lánc hiányosságok azt jelentik, hogy az Intel termékekre lesz kereslet, ami garantálja a munkát mind az Intel termékek, mind az Intel foundry számára” – mondta Nguyen. Az Intel kinyilvánított hajlandósága arra, hogy más vállalatok is használják az öntödei szolgáltatásait, és megosszák a szellemi tulajdonukat – az általuk kifejlesztett technológia licencelését – azt jelenti, hogy a hatókörük olyan piacokra is kiterjedhet, amelyekkel jelenleg nem foglalkoznak, például a mobilok esetében.

Post Views: 830