- Android alkalmazások - szoftver kibeszélő topik
- Xiaomi 13T és 13T Pro - nincs tétlenkedés
- Realme GT 2 - aláírjuk
- Leépíti a Sony az európai piacot?
- Samsung Galaxy A54 - türelemjáték
- Samsung Galaxy S24 - nos, Exynos
- Xiaomi 15 - kicsi telefon nagy energiával
- Eurós árlista a Google Pixel 10 telefonokhoz
- Ne legyetek bátorak, ha ezt a rollert választjátok - OOTD T10
- Légies iPhone halvány színei
Új hozzászólás Aktív témák
-
Abu85
HÁZIGAZDA
Az AMD azt mondta még januárban, hogy Full HD-ben azért működnek jobban az RDNA 2 dizájnok, mert ilyenkor sok bájt jut egy pixelre a 128 MB-os cache-ből. Ez a felbontás növelésével romlik, mert több a pixel, de a cache kapacitása állandó. 4K-ban is menne durván az RDNA 2, ha lenne rajta 256 MB-os IC, csak az a baj, hogy arányaiban az nem éri még meg a tranzisztorköltséget.
Persze ez az egész játékfüggő. Tehát nehéz általánosítani.
-
Abu85
HÁZIGAZDA
A féreglyuk elméleti lehetőség. Közel sem biztos, hogy egy civilizáció el tud érni olyan fejlettségi szintet, hogy negatív energiával féreglyukat kreáljon. Elméletben el lehet rajta gondolkodni, de a gyakorlati kivitelezés tekintetében naprendszer méretű objektumok megépítésére van szükség hozzá.
-
Abu85
HÁZIGAZDA
válasz
drotsztyuart #122 üzenetére
Nem, ugyanis ha vannak is UFO-k (sőt, bizonyos, hogy van élet a földön kívül), olyan elképesztően nagyok a távolságok a világegyetemben, hogy szinte lehetetlen azokat áthidalni. Az emberek gondolhatják azt, hogy láttam már földönkívülit, de ez maximum annak a következménye, hogy nem tanították az iskolában az általános relativitást.
-
Abu85
HÁZIGAZDA
Eleve a másik ALU Int32-t is csinál, aminél a warpok közötti függőség jóval ritkább, az szinte mindig befogható. Emellett nem csak az alu kapacitás a végleges teljesítmény meghatározója. Sőt, manapság számos olyan új játék van, ami már shaderek szintjén is cache-aware optimalizálást használ, vagyis a konkurens wave-ek számát egy shaderben direkt visszafogják, hogy nagyobb legyen a cache hit, ezt a leg-leg-legújabb játékok kiegészítik cache-aware leképezőkkel is. Ilyen az új EGO motor (Dirt 5), az új Anvil (AC Valhalla), az új Frostbite (Star Wars Squadron). Ezeknél már a konkurens wave-ek száma is annyira alacsony, hogy szinte minden hardveren a sárga zónában mennek, vagyis alapvetően jó ha egy wave-nek van elég adat futni.
Egyébként az NV például ezeket a cache-aware optimalizálásokat nem ajánlja. Nem azért, mert nem lehet vele nyerni, hanem azért, mert sok a buktatója. Ha jól csinálja egy fejlesztő, akkor simán kihoz belőle +10-15%-ot, ami jó, de ha nem optimalizálnak jól, akkor ott találja magát a GPU, hogy nincs adat egy wave-et sem futtatni, ami gond. És sajnos relatíve könnyű utóbbi helyzetbe belefutni, borzalmasan jól le kell profilozni egy alkalmazást, hogy egy GPU-nál jól működjön a lokalitási elv kihasználása. És sokszor ez sem elég. A hagyományos, erőforrás-allokációra való optimalizálásnál csak az lebeg a szemed felett, hogy a wave-ekkel a hardver zöld zónájában legyél. Erre mindegyik hardver hasonlóan reagál, és valljuk be jelentős különbség az LDS és a regiszterek tekintetében sincs. Ellenben, ha a cache hitre gyúrsz, akkor úgy azért igencsak eltér a Turing, az Ampere, az RDNA, a GCN, stb. Még ha mindegyik hardveren el is éred, hogy konkurens wave-ben még a sárga tartományban legyél, akkor is az a hardver produkálja majd a legtöbb cache-hitet, amelyben egy multiprocesszor illetve szimplán az egész GPU durván ki van tömve cache-sel. Ez korunk nagy problémája egyébként, mert az új konzolokon nagyon sokat lehet nyerni ebből, míg PC-n a sok különböző architektúra miatt sok a buktató, de fejlesztőként elgondolkozol rajta, hogy csak a PC-re érdemes-e most belekezdened százezer sornyi shadert átírni. Ritkán lesz majd igen a válasz. És ez a friss játékokban már inkább hatással van a teljesítményre. -
Abu85
HÁZIGAZDA
Hát a 3 GHz a Navi 22-nek nem lesz meg, ugyanis 2950 MHz az órajellimitje. Az majd a még kisebb Navi esetében lesz realitás.
#104 gbors : Az Ampere-ben nehéz etetni a második FP32 futószalagot. A gond az, hogy ugyanazon az ütemezőn vannak, tehát ugyanazok a warpok futhatnak rajtuk. De az esetek jó részében a programozók nem figyelnek arra, hogy a warpok ne függjenek egymástól, mert minden korábbi architektúrában úgy volt, hogy egy adott ciklusban csak egy tömb állt egy ütemező rendelkezésére. Tehát a shader kódok nagy részében a warp sajnos függnek egymástól, és emiatt vagy az egyik futószalag működik, vagy a másik. A kettő együtt nagyon ritkán használható.
-
Új hozzászólás Aktív témák
Hirdetés
- Android alkalmazások - szoftver kibeszélő topik
- Bambu Lab 3D nyomtatók
- Milyen TV-t vegyek?
- Építő/felújító topik
- Xiaomi 13T és 13T Pro - nincs tétlenkedés
- Synology NAS
- Realme GT 2 - aláírjuk
- AMD Ryzen 9 / 7 / 5 9***(X) "Zen 5" (AM5)
- Iszonyatos mennyiségű hulladékkal járhat a Windows 10 terméktámogatásának vége
- Filmvilág
- További aktív témák...
- ZOTAC GAMING GeForce RTX 4090 AMP Extreme AIRO videókártya, garanciával eladó
- MSI RTX 3080 Ti SUPRIM X 12GB GDDR6X Videokártya! BeszámítOK
- Eladó PNY GeForce RTX 4070 Ti SUPER 16GB OC XLR8
- ROG Astral GeForce RTX 5080 16GB GDDR7 OC Edition - 32 HÓNAP IPON GARANCIA
- MSI GeForce VENTUS 3X RTX 3070 Ti 8GB OC GDDR6X 256bit videokártya
- Bomba ár! Dell Latitude E7450 - i5-5GEN I 8GB I 256SSD I 14" FHD I HDMI I Cam I W10 I Garancia!
- LG OLED Televíziók: KÉSZLETKISÖPRÉS -30%
- Honor Pad X8 64GB, Wi-Fi, 1 Év Garanciával
- 130+131+132+133 - Lenovo Legion Pro 7 (16IRX9H) - Intel Core i9-14900HX, RTX 4080
- Lèpj be a jövőbe! Kamatmentes rèszletre is!
Állásajánlatok
Cég: Promenade Publishing House Kft.
Város: Budapest
Cég: PCMENTOR SZERVIZ KFT.
Város: Budapest