Keresés

Új hozzászólás Aktív témák

  • Petykemano

    veterán

    válasz namaste #69 üzenetére

    AZT Meg tudod mondani, hogy a geometriában, raszterizálásban és ropban korlátosság design choice, vagy limitáció?

  • con_di_B

    tag

    válasz namaste #66 üzenetére

    "Nem a skalár egység miatt van a magas fogyasztás."

    https://en.wikipedia.org/wiki/Graphics_Core_Next

    Amennyire en ertem egy wavefront 64 szeles, amit ugy szolgal ki a rendszer, hogy egy valojaban 16 szeles SIMD mag 4 egymast koveto utasitasa lesz garantaltan ugyanaz. Ez egy eleg tipikus design, a szelessegben van elteres. Aztan egy CU-n belul van 4x ezekbol a SIMD magokbol, tehat osszesen 4x16 szeles feldolgozorol beszelunk (fizikailag), szoval osszesen 64 VALU CU-nknent.

    Ehhez jon pluszba egy azaz egy darab SALU. 1/(64+1) logikusan nem kene, hogy annyira durva fogyasztast adjon ki, maximum akkor, ha vannak olyan extra funkcioi, amit a VALU-k nem tudnak, de a "bekotes" maga az nem egy ilyen komplikalt feature. Ha egy SFU (double-precision trigonometriaia fuggvenyek es hasonlo alig hasznalt dolgok) lenne fizikailag a SALU-ba epitve, az lehetne ilyen, de akkor az nem fair osszevetes, mert olyan meg van a tobbi hardverben is.

    Es akkor ez egy szandekosan sarkitott, konzervativ becsles volt, mert ott vannak meg a TMU-k is stb. a CU-ban, amik szinten nem a SALU extra fogyasztasa fele billentik a merleg nyelvet.

    Azt nem ketlem, hogy az AMD-sek tenyleg ezt mondtak Abu-nak, hogy azert magas a fogyasztas. De mondanak azok sokmindent, es sajnos nem mindig stimmel.

    "Persze ha csökkentik a feszültséget, akkor először a skalár egységet kapcsolják le, ugye?"

    A SALU esszencialis resze egy CU-nak, egyaltalan nem tud nelkule mukodni, szoval azt se lekapcsolni nem fogjak, se kulon nem lehet az orajelet, feszultseget allitani, semmi ilyesmi. Ez a narrativa, hogy a SALU az egy "bindless mode" gyorsito ennyiben kicsit santit, foleg, hogy mint mondtam, jo az masra is.

    Visszaterve a fogyasztas reszere, bizonyos programoknal viszont a fordito nem fog semmilyen ertelmes modot talalni a SALU hasznalatara a bekotesen kivul, ebben az esetben viszont a SALU az ido 99%-ban konkretan idle. Na, ha ertelmesen implementaltak, akkor ilyenkor sem kene sokat fogyasztania...

    "A bekötésnél pontosan hogyan segít a CPU? Mert renderelés közben (pl. texturázás) nincs idő a CPU-hoz fordulni."

    Az igazi hardcore kobunkos GPU-knal ez annyira durva, hogy meg utemezo sincsen normalisan, hanem a driver a command buffer-be beforditja elore, hogy melyik reszegyseg mit fog csinalni, es igy, mar elore behuzalozva erkeznek a parancsok, nincs min gondolkodni ugymond. Bizonyos mertekig meg a Kepler is ilyen volt.

    Nagy vonalakban abban van elteres, hogy mekkora merteku az utemezes szabadsaga a GPU-n, mert ahol keves, ott tobb parhuzamos task mellett rossz lesz a hatekonysag. (Ezert lovagol az AMD annyira az async compute-on, mert az o rendszeruk rugalmas, ebben jo.)

    Es igen, amit mondtal, hogy nincs ido a CPU-hoz szaladgalni menet kozben, ez igy igaz, ezert praktikus okokbol kell elore eldonteni az utemezest. Amit Abu mond az Intelrol, azt nem tudom, siman lehet, hogy nekik belefer.

    Ez az utemezes kozpontu nezet amit az elobb irtam ez persze inkabb a compute nezet, mert minket tobbnyire a maximalis savszelesseg erdekel, nem annyira az alacsony kesleltetes. Grafikaban ugyanezt onnan szoktak nezni, hogy ha minden vackot bele kell gyogyitani a command buffer-be, akkor gyakorlatilag semmit sem lehet skalazodni tobbszalu vegrehajtas mellett sem, mert a normalis driver oldali utemezeshez kb. elore kene latnod a jovobe, hogy a tobbi szal mit csinal majd, ez pedig nem valami eselyes. A masik baj, hogy ha tul sok globalis allapotod van, akkor meg felpercenkent le kell allni szinkronizalni, es emiatt erosen limitalt lesz, hogy hany rajzolasi parancsot tudsz kipreselni a rendszerbol egysegnyi ido alatt.

    Az AMD rendszere elmeletben ez utobbiban is jo lehetne, csak a gyakorlatban inkabb savszelesseg orientalt a rendszer, szoval csak azert mert nem dobja fel a talpat a rendszer egy pillanat alatt, ha razuditasz par tizezert draw call-t, attol meg nem feltetlenul lesz nagyon bajnok a kesleltetese.

    Ja es a vegere: ez a rendszer viszont utemezovel es mindennel egyutt viszont mar nyilvan fogyaszt. Lehet, hogy igy ertettek a SALU koltseget, hogy SALU + ACE + HWS + franctudja meg mik kellenek ehhez.

Új hozzászólás Aktív témák