Itt a válasz, hogy beérik-e az NVIDIA-t az AMD AI-chipek

Hirdetés

Legfrissebb anyagok

Mobilarena témák

PROHARDVER! témák

IT café témák

GAMEPOD témák

LOGOUT témák

Új hozzászólás Aktív témák

#30 Abu85 HÁZIGAZDA ddekany #29

Új Válasz 2023-07-11 12:49:48 #30
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Abu85

HÁZIGAZDA

válasz ddekany #29 üzenetére

A kialakítása. A Grace és a Hopper monolitikus. Az AMD tudatosan tervezte úgy a MI300-at, hogy a chipleteket ki tudja cserélni. Később amúgy lesz ilyen dizájn is az NV-től, de a jelenlegi pletykák szerint az NV még egy darabig ezt a Superchip dizájnt fogja erőltetni. Ez az optimális az NVLinknek. Nem véletlenül csinálják így. Az AMD-nél Infinity Fabric számára más lehetőségek is vannak, mert sokkal mélyebben van integrálva, mint az NVLink az NV-nél. Nyilván utóbbit meg tudja még oldani az NV, de időbe telik.
#29 ddekany nagyúr Abu85 #26

Új Válasz 2023-07-11 12:28:58 #29
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

ddekany

nagyúr

válasz Abu85 #26 üzenetére

Amúgy mi akadályozza meg az nVidia-t abban, hogy a Grace-t (ARM mag) és a Hoppert (GPU) egy lapkára tegye? Mint ahogy az AMD az x86 magokkal teszi ezt.
#28 consono nagyúr ddekany #27

Új Válasz 2023-07-11 10:19:21 #28
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

consono

nagyúr

válasz ddekany #27 üzenetére

"Otthonra" is érdekes lenne a váltás, mert egy 24 GB-s RX7900 jóval olcsóbb, mint egy 24GB-s RTX4090, de gyakorlatilag senki nem foglalkozik ezzel. Nem találtam teszteket, semmit, csak inkompatibilitási problémákat még, de ősszel elvileg jön a hivatalos támogatás: [link]. Bár ügyes emberek már most is hajtják: [link] "Under ROCm 5.6 with a batch size of 1, it can achieve 19it/s, which is comparable to most of the benchmarks for RTX 4080 and RTX 3090."
#27 ddekany nagyúr julius666 #25

Új Válasz 2023-07-11 09:27:16 #27
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

ddekany

nagyúr

válasz julius666 #25 üzenetére

Majd elválik, ez a mostani nyomulás bejön-e. A legtöbb nem jön be, de amúgy ez nem idegen más high-tech cégtől sem (pl. Intel). Most épp bíztató jelek vannak, örülsz. Otthoni AI-ra meg még pár évig bizonyosan az nVidia marad a biztos megoldás. Ők kezdték (érdemben), szóval eltart egy ideig, míg sikerül a monopóliumukat, a megszokást kikezdeni, nyilván. De ez most amúgy a szerver oldali nagy-AI-modell oldalról szól. Ott elég, ha árverseny alakul ki nVidia-val, mert az akármi LLM gigamodell csoda mindkettőn értelmesen fut, ugyan abból a forráskódból, minkét esetben kifejezetten AI-ra kifejleszetett hardveren.
#26 Abu85 HÁZIGAZDA julius666 #25

Új Válasz 2023-07-10 11:27:36 #26
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Abu85

HÁZIGAZDA

válasz julius666 #25 üzenetére

A ROCm már évek óta van, és lényegében az összes ma megvásárolható Instinct gyorsító támogatja. Nyilván ez bővülni fog jövőre a Versal termékcsaláddal, amit nem véletlenül építenek be. Ezért vették meg a Xilinxet.
Heterogén érába egyelőre csak az AMD szállít valamit. Lásd MI300, aminek a mintáit elkezdték kiküldeni a megrendelőknek. Másnak nincs is meg a hasonló projektje, ami egybetokozza az eltérő hardvereket. Az Intelnek az XPU-ja majd 2026-ban jön, az NV meg az ARM felvásárlásának befuccsolásával nem gondolkodik egybetokozáson. Emiatt van az, hogy a nagy szuperszámítógépes projekteket éppen tarolja le az AMD. Lásd Frontier, El Capitan, stb. Meg ugye amiatt, hogy a CUDA már nem probléma, mert ott a Hipify, és a CUDA kódod egy nap alatt HIP C++ kód lesz. Emiatt sem erőlködnek az Exascale projekteknél az NV-vel, mert már az AMD is képes megenni a CUDA kódot egy tök egyszerű automatikus konverteren keresztül. Ezért nyeri az Intel és az AMD az Exascale projekteket, mert egyszerűen már nem szükségszerű az NV-hez ragaszkodni. Ha szükségszerű lenne, akkor a top500 dobogóján lenne NV gyorsítós gép, mint régen, de ma már nincs. Vagy a green500 top 10-ben is főleg NV gyorsítók lennének, és nem hét AMD-s gép.
#25 julius666 addikt Abu85 #24

Új Válasz 2023-07-10 10:19:01 #25
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

julius666

addikt

válasz Abu85 #24 üzenetére

Nagyon szépek és jók ezek a tervek (papír mindent elbír), de ha megvalósulnak sincs semmiféle garancia arra, hogy nem úgy fog végbemenni, hogy kijön a ROCm-ből egy új főverzió (akár új néven) "na most már tényleg komolyan gondoljuk" jeligére, a régi vasakon meg hogy-hogynem már nem fog futni, vagy nem úgy, "nem megfelelő az architektúra tudása", vagy valami hasonló indokkal...
Már 2010 előtt is arról cikkeztél, hogy az AMD lesz itt a heterogén éra királya (GPGPU címszó alatt futott még akkor talán), azóta hány befuccsolt légvárat láttunk tőlük, hányan égették meg magukat akik arra számítottak, hogy be fognak jönni az ígéretek? Zöld oldalon meg azóta is tökéletesen működik a CUDA...
Én erről beszéltem feljebb. Nem lehet, hogy ez itt a probléma gyökere? Hogy nem a zöldek zsebében van az ipar, hanem egyszerűen csak senkinek nincs kedve pénzt égetni az AMD bénázásaival, szépen kivár mindenki amíg nem kezd el végre a diasorokon kívül, a valóságban is konzisztensen, generációkon átívelően stabilan szállítani az AMD?
#24 Abu85 HÁZIGAZDA julius666 #21

Új Válasz 2023-07-09 22:21:44 #24
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Abu85

HÁZIGAZDA

válasz julius666 #21 üzenetére

ROCm mindig lesz, hiszen a Xilinx megvásárlásakor felvázolták, hogy megszűnik a Vitis, és minden Xilinx holmi támogatása átkerül a ROCm-be.
Ez két lépcsőben megy majd végbe. Az első kör jövőre fog befutni, és a ROCm XRT interoperációval fog működni, és így lesznek elérhetők a Xilinx hardverek. A Vitis és az XRT API teljesen kukázva lesz ekkorra. A következő szint 2025, és akkor már az XRT interoperáció is eltűnik. Minden AMD gyorsító HIP C++-on keresztül lesz elérhető a ROCm futtatási környezeten keresztül.
Így fog kinézni a stack végül:
Ez azért lesz egyébként 2025-ben bevezetve, mert ekkorra lesz az AMD-nek a semi-custom üzletágán belül a custom packaging egy szolgáltatás. Onnantól kezdve xy cég odamehet az AMD-hez, és legózhat majd chipleteket a tokozásra. Nem kell külön gyorsítót venni, megveszed az egész csomagot a processzorral egy tokozáson. Az Instinct MI300 ennek az előszele, ami a CPU-t és a GPU-t rakja egy tokozásra, de később lehet majd kérni hozzá FPGA-t, ACAP-ot, az egésznek az lesz a lényege, hogy a CPU mellett ugyanarra a tokozásra rádobhass mindent, amire szükséged van megrendelőként, és ezek a hardverek ugyanazt a memóriát címezzék.
Ugyanerre megy egyébként mindenki, lásd Intel XPU projekt, csak ez sokat csúszik végül, de a koncepciója ennek ugyanaz, ami az AMD-nél a legózás. Az NV is ugyenerre megy, lásd Superchip dizájnok, csak az NV-nek nincs annyiféle hardverkonstrukciója, mint az Intelnek és az AMD-nek. Volt idő, amikor felmerült pletykaként a Lattice felvásárlása, csak annyira elhúzott mindenkitől a Xilinx ezen a piacon, hogy az NV valószínűleg nem mert belevágni, és inkább az ARM után mentek. Abból meg végül nem lett semmi.
#23 julius666 addikt consono #22

Új Válasz 2023-07-09 18:29:22 #23
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

julius666

addikt

válasz consono #22 üzenetére

Nyilván a kutya nem akar 1050-en dolgozni AI vonalon, nem ezért írtam. Az, hogy mindenre elérhető a CUDA régóta és se runtime se support problémák nem nagyon vannak az a platform kiforrottságát és megbízhatóságát mutatja. Zöld oldalon én nem félnék attól, hogy ha kijön a következő generáció akkor elfeledkezik a gyártó a vackomról.
#22 consono nagyúr julius666 #21

Új Válasz 2023-07-09 18:00:10 #22
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

consono

nagyúr

válasz julius666 #21 üzenetére

Hát, azért ez túlzás.... Meg igazán kit érdekel az, hogy a CUDA megy e 1050-en, vagy mi a helyzet az RX580 ROCm támogatásával? A lényeg az, hogy a kurrens, támogatott nagy memóriás VGA-k ára és teljesítménye hogy áll. Ha a PyTorch támogatja a CUDA-T és a ROCm-t is, kit érdekel a múlt? Pont az LLM-nél szerintem teljesen irrelevásak a régi kártyák. Hobbira érdekes max.
#21 julius666 addikt ddekany #20

Új Válasz 2023-07-09 15:03:59 #21
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

julius666

addikt

válasz ddekany #20 üzenetére

Az, hogy 1 vason ment valami tesztben az nem válasz a kérdésemre...
MI250 egyébként hivatalosan is supportált, nincs ebben semmi újdonság, az lenne a nagyon-nagyon szomorú (de sajnos számomra az se lenne meglepő) ha nem ment volna rajta... [link]
Akkor még egyszer: CUDA megbízhatóan megy hosszú idő óta mindenen IS. Nem csak pár dedikált gyorsító kártyán. És a supporttal sincs igazán gond, megy minden patentül Win, Linux, anyámkínja alatt, míg AMD oldalon ki tudja ROCm amire most supportált meddig lesz az és a tényleges gyakorlatban mekkora szívást jelent. Ott alapvetően egy kiforratlan platformról van szó még mindig.
Jó dolog a verseny és ha van alternatíva, de a szereplők akik (mondjuk) AI trainelő/model futtató farmot akarnak építeni nem kevés pénzért azért elvárhatják, hogy ne legyen szívás support vonalon. Az AMD-nek ebbe éveken át rengeteg pénzt, effortot kellett volna beletolnia, hogy ez a sztori igazán hihető legyen. Ez látványosan elmaradt, inkább csak a félrenézés meg a bénázás meg ment, most meg hogy atombombaként szólt az AI az OpenAI-s termékek piacra kerülése után megy a kapkodás. Igény lenne rá, de szvsz kár csodára várni (sajnos).
#20 ddekany nagyúr julius666 #19

Új Válasz 2023-07-09 14:05:19 #20
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

ddekany

nagyúr

válasz julius666 #19 üzenetére

A teszt (amit linkeltem korábban) most már előző generációsnak mondható, ténylegesen megvásárolható vason futott, a most azonnal elérhető szoftver réteggel, ami ugyan csak kishíján előző generációs (mert a Trident ROCm még nincs kész, de csinálják).
#19 julius666 addikt ddekany #17

Új Válasz 2023-07-09 13:46:02 #19
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

julius666

addikt

válasz ddekany #17 üzenetére

Akkor nem értetted a kérdést: nem arra vonatkozott, hogy az egyes nyílt szoftver keretrendszerek mennyire támogatják a ROCm-t, hanem hogy az AMD a ROCm-el milyen saját vasait támogatja és mennyire. Mert eddig is ez volt a fő baj, a szoftveres világ szerintem nagyon szívesen ugrana az alternatívákra ha valósak lennének, nem pedig csak tervek papíron...
#18 DarkByte addikt

Új Válasz 2023-07-06 10:17:01 #18
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

DarkByte

addikt

Amíg a szoftveres/framework támogatottságban hátul kullognak, lehet akármilyen jó vasuk sajnos. A CUDA tulajdonképpen monopol. Talán a tinygrad és hasonló projektek idővel ezt megtörik, de jelenleg az Nvidia elhúzott a mezőnytől ML/AI tekintetben.
#17 ddekany nagyúr julius666 #15

Új Válasz 2023-07-06 07:58:25 #17
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

ddekany

nagyúr

válasz julius666 #15 üzenetére

A teszt is erről szólt, hogy történt előrelépés. CUDA egyenlőre még élvezi, hogy ő volt az első, és nem volt versenytársa, de ennek a kényelmes szitunak azért valószínű, hogy hamarosan vége. A szoftveres világ nem szeretné, ha verseny nélkül szabná meg nekik az nVidia az árat. Egyértelmű a mozgolódás abba az irányba, hogy a gyakorlatban is fussanak változatos vasakon a mindenféle AI keretrendszerek.
#16 Dr. Akula félisten

Új Válasz 2023-07-06 05:24:06 #16
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

Dr. Akula

félisten

"A jövőben pedig be is érhetik ezeket."
Egy messzi messzi galaxisban?
#15 julius666 addikt ddekany #9

Új Válasz 2023-07-05 16:20:01 #15
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

julius666

addikt

válasz ddekany #9 üzenetére

ROCm által supportált vasak terén történt már előrelépés, vagy még mindig katasztrofális? Azért a CUDA megbízhatóan megy hosszú idő óta mindenen IS, ez elég nagy fegyvertény ha valaki GPGPU/AI kapcsán beruházáson töri a fejét (akár kicsiben, akár nagyban).
AMD-nek ilyen téren eléggé tragikus a track recordja...
#14 #52931072 törölt tag renoirba #11

Új Válasz 2023-07-05 16:12:29 #14
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#52931072

törölt tag

válasz renoirba #11 üzenetére

Majd amikor kipukkad a lufi és elfogy az út, az éllovas ugrik elsőnek a szakadékba. Nem olyan rossz másodiknak lenni, ahol nincs harmadik futó. Az első helyezett mögött szélárnyékban vagy és az irányt is mutatja, neked csak vigyázni kell, hogy lásd merre kocog éppen.
Amikor meg majd beéri az amd, akkor majd azzal jönnek az nv hívei, hogy ott dlss42, amit bekapcsolva úgy néz ki mintha kétszer annyit számolna. .
#13 --Disztroj-- senior tag

Új Válasz 2023-07-05 15:38:54 #13
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

--Disztroj--

senior tag

Mindig benézem a hölgyet Falusi Mariannak
#12 Balu77 őstag ddekany #9

Új Válasz 2023-07-05 12:38:11 #12
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Balu77

őstag

válasz ddekany #9 üzenetére

Állítólag van valami szoros együttműködés a Microsoft és az Amd között AI terén. Előbbi szoftveres oldalról adhat lökést. Vagy kék halált.
#11 renoirba csendes tag

Új Válasz 2023-07-05 12:27:14 #11
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

renoirba

csendes tag

Az amd nem mostanában fogja lekörözni vagy akár utolérni az nvidiát. Hardverben és szoftverben is rosszabbak. Sajnos messze a másodikak már jó ideje.
#10 ddekany nagyúr copass #8

Új Válasz 2023-07-05 11:14:53 #10
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

ddekany

nagyúr

válasz copass #8 üzenetére

Illetve szoftver jobbítás terén valószínűleg tud előre lépni az AMD, az ős idők óta támogatott eddig egyeduralkodó CUDA-hoz képest. Majd utána látjuk csak rendesen, hogy a két vas hogyan viszonyul egymáshoz.
#9 ddekany nagyúr consono #6

Új Válasz 2023-07-05 11:11:42 #9
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

ddekany

nagyúr

válasz consono #6 üzenetére

PyTorch 2.0 + ROCm: [link]. De majd jön a ROCm támogatás OpenAI Triton-hoz, azzal lesz talán még érdekesebb. Szóval ja, a nVidia CUDA egyeduralmán kezdenek megjelenni repedések. Eleve a PyTorch 2 nagyon ráfeküdt, hogy alternatív hardvernek lehessen ép elmével támogatni.
#8 copass veterán Balu77 #7

Új Válasz 2023-07-05 11:03:38 #8
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

copass

veterán

válasz Balu77 #7 üzenetére

egyelőre érjék el ugyanazt a teljesítményt, aztán lehet a fogyasztásról beszélni.
#7 Balu77 őstag

Új Válasz 2023-07-05 10:49:03 #7
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Balu77

őstag

A kérdés hogy fogyasztás tekintetében a két megoldás hogy áll? Mert ugyebár az is fontos szempont hogy mennyi a számítási teljesítmény/fogyasztás mérce.
#6 consono nagyúr

Új Válasz 2023-07-05 09:59:40 #6
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

consono

nagyúr

AMD oldalon milyen API-t lehet ML-re használni? Még mindig ROCm? Mintha a PyTorch is támogatná már azt, meg talán az Intel API-ját is. A végén még itt is lesz verseny és elmúlik a CUDA egyeduralma?
#5 ddekany nagyúr

Új Válasz 2023-07-05 09:04:00 #5
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

ddekany

nagyúr

Ez még az a legújabb előtti generáció, hardver és AMD szoftver terén is. Az lesz az igazán döntő csata, amikor a H100+Grace és a MI300x lesz összeeresztve, úgy hogy már Triton-al megy a hardver absztrakció.
#4 Abu85 HÁZIGAZDA Cassi #3

Új Válasz 2023-07-05 08:23:37 #4
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Abu85

HÁZIGAZDA

válasz Cassi #3 üzenetére

Az biztos nem a véletlen műve. Az egy 24 GB-os GPU, és a VRAM kell ehhez a munkához. Jobban, mint bármi más.
#3 Cassi őstag

Új Válasz 2023-07-05 08:21:40 #3
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Cassi

őstag

"A MosaicML közölte: az AMD nem fizetett nekik a tanulmányért"
Hát persze hogy nem. Az meg a véletlen műve, hogy a cég minden dolgozója 7900 XTX-en játszik mostanában.
#2 copass veterán Abu85 #1

Új Válasz 2023-07-05 07:48:49 #2
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

copass

veterán

válasz Abu85 #1 üzenetére

az se nagyon, mert csak 80%-át tudja!
#1 Abu85 HÁZIGAZDA

Új Válasz 2023-07-05 07:11:35 #1
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Abu85

HÁZIGAZDA

Ki gondolta volna, hogy egy GPU-dizájnnak megy a mátrixszorzás.