- Egyedülálló akkumérettel futott be a OnePlus Nord CE5
- Magisk
- Megjelent a Poco F7, eurós ára is van már
- Google Pixel topik
- Samsung Galaxy S24 Ultra - ha működik, ne változtass!
- One mobilszolgáltatások
- Samsung Galaxy Watch6 Classic - tekerd!
- Fotók, videók mobillal
- Honor 200 - kétszázért pont jó lenne
- Okosóra és okoskiegészítő topik
Új hozzászólás Aktív témák
-
Én valahogy úgy képzelem, hogy az egy SIMD-be tartozó MIMD-ek (vagy mind a 16, vagy csak a fele, a jó ég tudja) egyidőben ugyanazokat a VLIW-eket hajtják végre más-más adatokon (na ez egy jó mondat lett). Ez ügyesen programozva állati nagy rugalmasságot jelent - de tényleg ügyesen kell programozni. Lehet egyébként, hogy itt vannak elásva a szellőztetett performancia-gondok - új a dolog, sokat kell még hangolni a dispatch stratégián (ez biztos), ill. a shader fordítón (ez ''csak'' valószínű). Az nVidiának azért sokkal több ideje volt ezekre - abban pl. majdnem biztos vagyok, hogy az irdatlan shader órajel nem volt az eredeti design része
Btw. nem ismerem a konkrét műszaki hátteret, de az eredmény szempontjából ugyanezt játszotta el az ATI az X1-es szériával is.
Na asszem ezt sírba tettük. Már csak meg kellene jelenni a kártyának
gbors -
De jót röhögtem most - azon vitatkozunk már több lépésben, hogy másképp csoportosít a látásunk
De végre leesett.
Nekem egy SIMD azt a 2 oszlopnyi (8+8) 5-way MIMD egységet jelenti, amik 0 pixel távolsággal össze vannak zsúfolva, innen a 16 egység / SIMD, és 4 ilyen SIMD van. Nézd meg amúgy a 4-es sorszámú ábrát (azt, amin nincs belinkelve az eredeti linken a fórumba - tréfás fiúk), ezen a HD2600 és a HD2400 látszik, és ott 3 (egyenként 8 elemű) és 2 (egyenként 4 elemű) SIMD-ről beszélnek. -
asszem elvesztettem a fonalat
az ATIs (bocsánat, AMDs) prezentáció 4 unitról (SIMD Arrays) beszél, ezek mindegyike 16 feldolgozó egységet tartalmaz (ezek az 5+1-es MIMD-ek, vagy ahogy a prezentáció írja, VLIW végrehajtók). Én azt vettem ki belőle, hogy a 4 unit egy-egy SIMD egységként működik, igen hasonlóan ahhoz, ahogy a G80-ban 8 SIMD egységbe van szervezve a 128 stream processor. -
-
Persze, sokmindenhez kell szögfüggvény, csak az nem állt össze a fejemben, hogy mitől kell most hozzá hirtelen ilyen HW támogatás. De a T&L változása jó érvnek tűnik, meg az előbb említett geometry shaderek is.
A füstölésről. Egyik oka biztosan az, hogy amíg az nVidia-nál már egy ideje szempont a fogyasztás (nyilván nem utolsósorban a hűtés miatt, de ez most mindegy), addig az ATI erre nagy ívben sz**ni tűnik. De hogy ez önmagában megmagyarázza a 1.5-szeres / tranzisztor fogyasztást, azt még én sem hiszem
SIMD-ek és MIMD-ek: a cikkbe belenéztem, alkalomadtán végig elolvasom, thx. Ami még érdekes, hogy az R600 is hasonlóan van szervezve, ott a 64 processing unit van 4 SIMD-be szétpakolva, bár azt nem tudom, hogy azokon belül van-e további olyan bontási lehetőség, ami a G80-nál (logikus lenne, hogy legyen). -
A crossbar vezérlő nekem is eszembe jutott, biztosan költségesebb a ring bus-nál, de szerintem nem ez a nagyságrend.
Igen, sok mindenre lehet használni kedvenc szögfüggvényeinket, de eddig megvoltunk ilyen egységek nélkül - miért kellett pont most bedobni? (...) Egy tippem mondjuk támadt közben, a geometry shadingben lehet hasznuk.
Jót derültem a tranzisztorszámos eszmefuttatáson - végül is miért ne lehetne hamis a 730M-s adat?Tartok tőle viszont, hogy a fogyasztás tényleg annyi sok lesz...
-
Igen, a nyers lóerő összehasonlítható, kérdés, hogyan veszi ennek hasznát a vezérlés. Agyaltam a dolgon, igazából azért piszkálja a csőrömet ennyire ez a 64 transzcendens egység, mert nem látom, mi szükség van rájuk
Jawohl, csak shaderről beszélünk, részemről azért, mert az R600 memóriavezérlője annyival fejlettebb, mint a G80-é, hogy eszembe sem jutott, hogy azon a fertályon lehet szűk keresztmetszet. Azt mondod, az ATI alulkalkulálta a ROP-okat? Azzal megnyernék a 2007-es év balekja díjatMondjuk egy ilyen bakit akár egy 2950-esben tudnak korrigálni.
Itt a teszt, ill. egy prezentáció, amiben tesztadatok is vannak: [link]
És akkor már csak egy kérdés: ha az R600 nemtranszcendens MAD-jai egyenértékűek G80 stream processzoraival, akkor hogy lehet a <10% különbség a két chip tranzisztorszáma között?
gbors -
Hmmm, köszönöm a részletes magyarázatot, némileg szakszerűbb volt, mint az egyszerű meg a bonyolult unit
Viszont a magyarázatod megerősített abban, hogy a két architektúra általánosan csak nehézkesen összehasonlítható:
Bár elsőre kissé elhűltem a nyolcutas SIMD-ek láttán, igazából ennek óriási jelentősége nincsen - a feldolgozandó adatok jellege miatt megfelelő munkaszervezés esetén a 8-way SIMD a gyakorlati esetek túlnyomó részében jól fogja közelíti a 8 önálló egységet (nyilván nem 100%-osan, ellentétben az előző üzenetemben írtakkal). Feltételezem, hogy ezzel a megoldással egy rakás tranzisztort spóroltak.
Az R600 miatt azért vakarom a fejem, mert a 4+1 egység alapú szervezés mögött (ami ráadásul a fentiek alapján MIMD) makacsul valamilyen funkcionális célt sejtek, tipikusan bizonyos műveletsorok ''olcsóbb'' végrehajtását - ezért is beszéltem összetartozó műveletről. Viszont ez a megközelítés egy lényegesen nagyobb tudású feladatvégrehajtót feltételez, aminek a hatékonysága (különösen az életciklusa elején) a bemenő adatok függvényében erősen szórhat.
És igen, a számok alapján valóban 50%-kal gyorsabb kellene legyen az R600 - de nekem sincs jó érzésem. Láttam egy állítólag ATI-tól kiszivárgott tesztet, itt szélsőséges körülmények között 2x gyorsabb volt, mint az X1950XTX - pont ott, ahol már a 8800 Ultra is kb. 2x gyorsabb a volt királynál.
gbors -
Pedig tényleg nem hasonlítható direktbe össze - többek között azért sem, mert a 320-ból 256 ilyen fajta (egyszerű), 64 meg olyan (bonyolult(abb)). Célszerűbb úgy nézni az R600-at, hogy 64 általános processzora van, amelyek 1 órajel alatt több összetartozó műveletet is el tudnak végezni. Ezzel áll szemben az nVidia iszonyúan megpörgetett 128 stream processzora, 1 művelet / ciklussal. Szerintem csak konkrét esetre nézve lehet összevetni, általánosan elég nehéz.
Btw. míg a 8800 Ultráról feltételezhető, hogy GPU limitált esetben 0 stream processzor lógatja a lábát, az R600-nál a 320 unitot nézve ebben egyáltalán nem vagyok biztos.
gbors
Új hozzászólás Aktív témák
Hirdetés
- Debrecen és környéke adok-veszek-beszélgetek
- Audi, Cupra, Seat, Skoda, Volkswagen topik
- AMD Ryzen 9 / 7 / 5 7***(X) "Zen 4" (AM5)
- AMD K6-III, és minden ami RETRO - Oldschool tuning
- One otthoni szolgáltatások (TV, internet, telefon)
- Kertészet, mezőgazdaság topik
- Luck Dragon: Asszociációs játék. :)
- Egyedülálló akkumérettel futott be a OnePlus Nord CE5
- bitpork: MOD Júni 28- Augusztus 2- szombat jelen állás szerint.
- Magisk
- További aktív témák...
- ÖRÖK GARANCIÁVAL - OLCSÓ, LEGÁLIS SZOFTVEREK 0-24 KÉZBESÍTÉSSEL - Windows - Office - LicencAruhaz.hu
- Bomba ár! Dell Latitude E5570 Touch - i5-6300U I 8GB I 256SSD I 15,6" FHD I HDMI I CAM I W10 I Gari
- LG 45GS95QE - 45" Ívelt OLED / 2K WQHD / 240Hz 0.03ms / NVIDIA G-Sync / FreeSync Premium / HDMI 2.1
- Xiaomi Redmi Note 12 Pro 5G 128GB, Kártyafüggetlen, 1 Év Garanciával
- Olcsó Laptop! Dell Latitude 7280. I5 7300U / 8GB DDR4 / 256GB SSD
Állásajánlatok
Cég: PCMENTOR SZERVIZ KFT.
Város: Budapest
Cég: CAMERA-PRO Hungary Kft
Város: Budapest