- iPhone topik
- Magisk
- Mobil flották
- Hat év támogatást csomagolt fém házba a OnePlus Nord 4
- Huami Amazfit Bip okosóra
- Samsung Galaxy S25 - végre van kicsi!
- Ford SYNC 3 infotainment rendszer teszt
- Samsung Galaxy S25 Ultra - titán keret, acélos teljesítmény
- Xiaomi 15 - kicsi telefon nagy energiával
- Xiaomi 14T Pro - teljes a család?
Új hozzászólás Aktív témák
-
Duck663
őstag
Gondoltam elég ha utalok rá, de nem. Ez: "Azt viszont továbbra sem látom sehol alátámasztva, hogy az Ampere ALU-struktúrájában kellene keresni a relatíve jobb 4K-s teljesítmény okát abban a pár játékban."
És hogy miért is?! Érzem, hogy ez lenne a következő kérdés, úgyhogy most ezt megelőzöm. Elméletileg megduplázták a FP32-es teljesítményt, elméletileg, gyakorlatban nem, de az nem számít, ami számít, hogy mindenképpen van pozitív hozadéka, így az órajel változtatásával nagyobb mértékben változik a számítási kapacitás, mint a korábbi generációknál, és ha erre a játék az átlagtól nagyobb FPS változással reagál, akkor az ennek a kialakításnak köszönhető. -
Kansas
addikt
Én azért nem nézek sok játékos átlagot, mert semmi értelmét nem látom. Egyszerre az ember egy játékkal játszik. Pl AC Odyssey-vel játszok, Valhallával is biztosan fogok, de pl a Horizon Zero Dawn teljesen hidegen hagy, innentől kezdve számomra, ha én akarnék VGA-t venni(nem akarok, konzolon tolom az AC-kat is), a két AC játék számítana, a HZD meg kicsit sem.
Persze szeretek én is minél több játékot tartalmazó teszteket nézni, de egyesével, nem átlagot vonva, hogy egy esetleges számomra érdektelen játék ne torzítsa a "végeredményt", se föl, se le.
Azt viszont nem mondtam, hogy az ALU struktúrában van a magyarázat, az FP32-es trükközés csak egy példa volt, hogy az is számíthat. Én az Ampere kártyák architektúráját említettem, és abba a GPU-n kívül a VRAM is beletartozik(meg az összes egyéb komponens a NYÁK-on és körülötte).
A CPU-limit azért érdekes kérdés, mert bőven függhet a GPU-tól illetve a játék motorjától is, hogy milyen körülmények között lesz a CPU a limitáló tényező. Például amit említesz az "utilizációs bottleneck" az pont egy ilyen jelenség(már ha jól értelmezem, mit értesz alatta)... -
Duck663
őstag
-
Kansas
addikt
Nos, van egy rossz hírem: a te elemzésedhez hasonlót csináltam a Metro Exodus kapcsán a CB teszt eredményei alapján(RDNA2 adatok hiányában RDNA1-et, Turingot és a szemlééetesség kedvéért a 3090-et belevéve), de míg megírtam, eldobta magát a login session-öm, és hülye fejjel nem tettem ki vágólapra az egész irományt küldés előtt, szóval buktam az egészet.
Bár eszem ágában sincs az egészet újra megcsinálni, a lényegi konklúziót azért leírom újra, a CB adatok alapján ellenőrizheti bármikor bárki akinek van ráérő ideje/kedve.
Szóval: mindhárman tévedtünk, úgy tűnik. Te azért mert a CPU limitre fogtad, ami a Metro esetében egyáltalán nincs jelen, ellenben a skálázódás-különbség látványos a 3080 és 3090 esetén, míg jelentősen kisebb mértékű a 3070 esetében. És ez utóbbiból fakad a HU és az én tévedésem, ugyanis a HU elemzése a 3070 megjelenése előtt 3 héttel jött ki, tehát nem tartalmazhatott 3070-es méréseket, amik viszont kulcs-jelentőségűeknek bizonyultak szerintem. Ugyanis arra engednek következtetni, hogy a jelentősen jobb 4K-ra skálázódás szvsz a VRAM-beli különbségekre vezethető vissza: kisebb mértékben a mennyiségre(a 3070 8GB-ja 4K-ban már tud limitálni némelyest) leginkább viszont a GDDR6 helyett GDDR6X használata miatt, ami jelentős sávszélesség-növekedéssel járu.i. : igazán lehetne tenni valamit a fórum-motorral, gáz ez így, hogy a küldés folyamán történő új authentikáció eldobja a komplett komment tartalmát. Azt se bánnám, ha egy hosszú komment írása közben nem járna le a session.
-
Abu85
HÁZIGAZDA
Az AMD azt mondta még januárban, hogy Full HD-ben azért működnek jobban az RDNA 2 dizájnok, mert ilyenkor sok bájt jut egy pixelre a 128 MB-os cache-ből. Ez a felbontás növelésével romlik, mert több a pixel, de a cache kapacitása állandó. 4K-ban is menne durván az RDNA 2, ha lenne rajta 256 MB-os IC, csak az a baj, hogy arányaiban az nem éri még meg a tranzisztorköltséget.
Persze ez az egész játékfüggő. Tehát nehéz általánosítani.
-
Abu85
HÁZIGAZDA
Eleve a másik ALU Int32-t is csinál, aminél a warpok közötti függőség jóval ritkább, az szinte mindig befogható. Emellett nem csak az alu kapacitás a végleges teljesítmény meghatározója. Sőt, manapság számos olyan új játék van, ami már shaderek szintjén is cache-aware optimalizálást használ, vagyis a konkurens wave-ek számát egy shaderben direkt visszafogják, hogy nagyobb legyen a cache hit, ezt a leg-leg-legújabb játékok kiegészítik cache-aware leképezőkkel is. Ilyen az új EGO motor (Dirt 5), az új Anvil (AC Valhalla), az új Frostbite (Star Wars Squadron). Ezeknél már a konkurens wave-ek száma is annyira alacsony, hogy szinte minden hardveren a sárga zónában mennek, vagyis alapvetően jó ha egy wave-nek van elég adat futni.
Egyébként az NV például ezeket a cache-aware optimalizálásokat nem ajánlja. Nem azért, mert nem lehet vele nyerni, hanem azért, mert sok a buktatója. Ha jól csinálja egy fejlesztő, akkor simán kihoz belőle +10-15%-ot, ami jó, de ha nem optimalizálnak jól, akkor ott találja magát a GPU, hogy nincs adat egy wave-et sem futtatni, ami gond. És sajnos relatíve könnyű utóbbi helyzetbe belefutni, borzalmasan jól le kell profilozni egy alkalmazást, hogy egy GPU-nál jól működjön a lokalitási elv kihasználása. És sokszor ez sem elég. A hagyományos, erőforrás-allokációra való optimalizálásnál csak az lebeg a szemed felett, hogy a wave-ekkel a hardver zöld zónájában legyél. Erre mindegyik hardver hasonlóan reagál, és valljuk be jelentős különbség az LDS és a regiszterek tekintetében sincs. Ellenben, ha a cache hitre gyúrsz, akkor úgy azért igencsak eltér a Turing, az Ampere, az RDNA, a GCN, stb. Még ha mindegyik hardveren el is éred, hogy konkurens wave-ben még a sárga tartományban legyél, akkor is az a hardver produkálja majd a legtöbb cache-hitet, amelyben egy multiprocesszor illetve szimplán az egész GPU durván ki van tömve cache-sel. Ez korunk nagy problémája egyébként, mert az új konzolokon nagyon sokat lehet nyerni ebből, míg PC-n a sok különböző architektúra miatt sok a buktató, de fejlesztőként elgondolkozol rajta, hogy csak a PC-re érdemes-e most belekezdened százezer sornyi shadert átírni. Ritkán lesz majd igen a válasz. És ez a friss játékokban már inkább hatással van a teljesítményre. -
Kansas
addikt
Képzeld, megnéztem, és ahogy a HardwareUnboxed tesztben úgy a GamersNexusnál, itt a PH-n de még az általad linkelt Computerbase tesztben(bár a fura grafikon-elrendezés nem könnyíti meg az észrevételét) is látható a tendencia, pl a 6800XT és a 3080 közt, hogy az AMD még fölényben van 1080p-n, kisebb fölényben 1440p-n és az NV átveszi a vezetést 4K-ban. Pl Tomb Raider-ben...
Nyugodtan nézd meg újra... nekem egyelőre munkanapom van, de munkaidő után szívesen belemegyek részletesebben.
Egyelőre annyi, hogy nem véletlen, hogy az általános konklúzió az, hogy 4K-ban az NV a menő. FHD-ban pedig az AMD... persze vannak olyan játékok, ahol az egyik gyártó minden felbontásban viszi a koronát, de a tendencia attól még látszik. -
Kansas
addikt
Ahogy gondolod, érvek ellen amúgy is be voltál oltva ebben a thread-ben.
Ha sima CPU vagy vegyes limitről lenne szó, akkor nem csak és kizárólag az Ampere kártyákat érintené ez a jelenség, hanem pl. az RX6900XT-t is. Te a HU logikájában és hozzáértésében látod a hibát, én a tiédben. Kettőtök közül nem a tiéd van mérésekkel alátámasztva.#109 b. : és azt is elmagyaráznád, ez miben mond ellent annak amit én írtam? Gyakorlatilag inkább saját magának és a CPU-limites elméletének mond ellent.
-
Kansas
addikt
Szerintem rossz oldaláról közelítettük meg a jelenséget, ha "varázslatos architektúrális limit"-ről beszélsz. Nincs ilyen "varázslatos" limit.
Próbáljuk meg akkor a másik oldalról, hátha úgy könnyebb átütni a "bántsák az NVidiát" reflexeden.
Tehát, újrafogalmazva ugyanazt: Az Ampere architektúrában van egy olyan kúl új feature(a DLSS mellett), ami magas GPU terhelés mellett (tipikusan 1440p feletti felbontásokon, tehát 4K/8K) extra erőforrásokat tud bevonni az FP32-es számításokba azáltal, hogy az INT32 operációkra épp nem használt INT32 feldolgozótömbök használhatóak FP32 utasítások végrehajtására is. A gyakorlati végeredmény, hogy ezek a VGA-k az esetek egy jelentős részében jobban skálázódnak 1440p-ről felfelé, mint a saját korábbi termékek és a konkurens VGA-k.
Egyébként biztosra veszem, hogy ez nem csak a játék felbontásának növeléséhez jöhet jól, hanem egyéb FP32-számolásigényes feladatokhoz is.
És azt is, hogy enélkül az architektúrális sajátosság nélkül kevésbé szerepelnének jól az RTX 30xx kártyák az RX6xxx Radeonok ellen 4K-ban...Így fogalmazva jobban tetszik?
-
Abu85
HÁZIGAZDA
Hát a 3 GHz a Navi 22-nek nem lesz meg, ugyanis 2950 MHz az órajellimitje. Az majd a még kisebb Navi esetében lesz realitás.
#104 gbors : Az Ampere-ben nehéz etetni a második FP32 futószalagot. A gond az, hogy ugyanazon az ütemezőn vannak, tehát ugyanazok a warpok futhatnak rajtuk. De az esetek jó részében a programozók nem figyelnek arra, hogy a warpok ne függjenek egymástól, mert minden korábbi architektúrában úgy volt, hogy egy adott ciklusban csak egy tömb állt egy ütemező rendelkezésére. Tehát a shader kódok nagy részében a warp sajnos függnek egymástól, és emiatt vagy az egyik futószalag működik, vagy a másik. A kettő együtt nagyon ritkán használható.
-
Kansas
addikt
Igen, ezt a CPU-limites magyarázatot én is hallottam, de nem meggyőző hogy mindig az lenne mögötte(bár kétségkívül előfordul), nekem a HU-féle magyarázat logikusabbnak tűnik, és teszteredményekkel is alá van támasztva.
Plusz, a 3070 kapcsán ne felejtsd el, hogy onnantól lefele az Ampere kártyákon ugyanolyan "mezei" GDDR6 VRAM van, mint a Radeonokon, míg a 3080/3090-en GDDR6X, jelentősen magasabb sávszélességgel. Arról nem beszélve, hogy a 3070-et 4K-ban a 8GB VRAM mennyiség is limitálhatja már... ez utóbbi ki fog derülni a 3060 tesztekből, hogy így van-e... -
UMbikes
csendes tag
viszont mivel kevés cu van valószínűleg elmebeteg módon húzható lesz. szerintem simán hozhatja a 2800mhz-et is egy red devil vagy egy strix változat, persze nem gyári oc szinten, hanem manuálisan kíváncsi leszek a tesztekre, de eddig nem igazán látom ennek a kártyának a piacát.
Új hozzászólás Aktív témák
Hirdetés
- Lenovo ThinkPad T570, T580, P51s, P52s eredeti Lenovo, külső akkumulátor eladó
- iPhone 11 Pro Max 12 hónap garanciával
- ÁRGARANCIA!Épített KomPhone i5 14600KF 32/64GB RAM RTX 5070 12GB GAMER PC termékbeszámítással
- Azonnali készpénzes Sony Playstation 5 lemezes és digitális felvásárlás személyesen/csomagküldéssel
- Samsung Galaxy S23 Plus 256 GB Kártyafüggetlen 1Év Garanciával
Állásajánlatok
Cég: PCMENTOR SZERVIZ KFT.
Város: Budapest