Keresés

Új hozzászólás Aktív témák

  • Menthirist

    veterán

    válasz Sinesol #96 üzenetére

    Nem teljesítményben végtelen. Szerintem itt arra kell gondolni, mintha dx11.0 alatt lenne 8 változóneved (A0-A7-ig mondjuk), amibe betehetsz adatokat, struktúrákat. A fejlesztőnek úgy kell mindent megcsinálnia, hogy beleférjen. Dx11.1 alatt 64 változóneved lehet. Tier 3 esetén pedig végtelen. Tehát nem arról van szó hogy akár egyetlen változó mögötti értéket használjon valami kiszámíthatatlan feladathoz (tehát egyetlen UAV-vel meg is ölte a gpu teljes teljesítményét), hanem arról, hogy ha a fejlesztőnek úgy kényelmes az algoritmusa szempontjából, hogy szétválogassa a végeredményeket 100 különböző változónévre, (mondjuk A0-A19, B0-B19, C0-C19, D0-D19, E0-E19), akkor úgy csinálja. Ha neki úgy kényelmes hogy továbbra is csak 8 legyen, akkor 8 lesz. Lehet hogy 1000 változón akar csak egy-egy összeadást végezni, ami mocskosul gyorsan végezne, neki meg úgy kényelmes hogy A0-tól A999-ig mind külön változóba kerüljön, akkor úgy oldja meg. Ettől még ugyanúgy bele kell férnie a gpu teljesítménykorlátaiba, tehát nem tud 1000 hajszimulációt csinálni. Az UAV (unordered-access view) gyakorlatilag mintha csak egy kis adattár lenne lefoglalva (ha jól értelmeztem), míg az hogy milyen műveleteket végzünk az ezekben tárolt dolgokkal, már egész más. Meg lehet 2 uav tartalmán végzett számításokkal is ölni az egész gépet, míg lehet hogy 1000-rel sem lenne kihasználva a fele sem.

    Szóval összességében csak kevéssé korlátozza a programozót abban, hogy bizonyos funkcionális limitációkat betartson, jobban lehetőség van arra figyelni, hogy simán a hardver limitjeibe férjenek bele.

Új hozzászólás Aktív témák