- Változó design, tekerhető lünetta: megjött a Galaxy Watch8 és a Classic
- Samsung Galaxy S25 Ultra - titán keret, acélos teljesítmény
- Kiszivárgott a Pixel 10 Pro
- Google Pixel 8 Pro - mestersége(s) az intelligencia
- Samsung Galaxy S21 FE 5G - utóirat
- Samsung Galaxy Watch (Tizen és Wear OS) ingyenes számlapok, kupon kódok
- Feljutott a G96 a Moto széria csúcsára
- Motorola Edge 40 - jó bőr
- Vékonyabb lett, jobb kamerát kapott, de az akku maradt a régi: itt a Fold7
- Motorola Moto Tag - nyomom, követ
Aktív témák
-
nu warte bitte... ha jól látom az RV770 ábrákon, akkor a memóriavezérlők (és mögöttük a memóriák) kutyaközönséges crossbar módszerrel kapcsolódnak a ROP-okhoz és az L2 cache-hez. hogy ez okosabban működik, mint az nVidia megoldása, az a crossbar intelligensebb megvalósításának köszönhető, nem a HUB-nak. vagy nem jól látom?
janos666: én nem vagyok az az oltogatós típus
de csak hogy egy példát mondjak: 9800GTX+ vs HD4850:
- GF: 128 shader, 1836MHz
- R: 800 ALU, 625MHz
- elméleti GF variáns, ahol az órajelek különbsége 2x: 188 shader, 1250MHzezzel számolva, a 4850-esben 940 ALU-nak kellene lenni, hogy utolérje a 9800GTX+-t. ehhez képest 800 van neki, és gyorsabb. ez a gondom az 5-ös szorzós "szabállyal"
-
ki mondta, hogy jó volt a ringbus?
na persze, jó az, csak van pár hibája:
- átlagosan lassabb, mint a crossbar
- a felépítése miatt kialakulhat torlódás, amit valahogy fel kell oldani - ennek egy játékban általában látható jele van
- de a fő bűne az, hogy sok tranzisztorba kerül, és az az RV770 tervezési elveivel nem fért összea HUB-ba nem kell túl nagy dolgokat beleképzelni: az RV770 memóriavezérlő nagy erőssége nem a HUB, hanem:
- az átszervezett cache hierarchia
- a crossbar vezérlők odapakolása a nagy fogyasztók közvetlen közelébea HUB csak annyiban segít be, hogy a kis sávszélesség-igényű fogyasztók rajta keresztül beszélgetnek, és nem zavarnak bele a nagy zabálók és a memória kommunikációjába.
Bluegene: az 1 nVidia SP = 5 ATI SP "egyenlet" egy teljesen véletlen egybeesés, ami sokban múlik a kártya egyéb elemein (pl. ROP-ok). ha monduk a 3870-et és a 9800GTX+-t hasonlítod így össze, akkor messze nem ilyen összefüggés fog kijönni.
rocket: nagy jelentősége nincs, de a pontosság kedvéért, nem vec5D-k a számolóegységek (ami egy 5-utas SIMD lenne), hanem 5-utas MIMD-ek, azaz egy ilyen egység "korrektül" szuperskalár.
-
hát, a ROP-ra nem tudok jó magyar kifejezést
amúgy a ROP sok mindennel foglalkozik - megkapja a beszínezett pixeleket a shaderektől, és utána már ő foglalkozik velük (egymás mögötti pixelek, (részleges) átlátszóság kezelése,stb.). ha ez megvan, akkor a postprocessing (utófeldolgozás) effekteket is vezérli (AA, HDR, motion blur, megatöbbi), és ha minden kész, akkor kitolja a szanaszét számolt pixelt a backbufferbe (az a képernyő, amire rajzol a VGA, de nem látod - ha kész a kép, akkor belőle lesz a front buffer).
a shader utilizáció semmi más, mint amit szó szerint jelent - meglepne, ha a HD4870 1200GFlops-nyi számítási kapacitásából akár csak a fele ki lenne használva.
triangle setup: mielőtt a képet felépítő háromszögeket vadul elkezdené a VGA textúrázni, megvilágítani, stb., azelőtt megnézi, hogy ki lehet-e szórni néhányat közülük - tipikusan azokat dobja ki először, amik nem kerülnek a látható képernyőre, ill. amiket nem szemből, hanem hátulról látunk, meg még biztos egy csomó szempontja van. a kidobott háromszögek mennyisége tipikusan több, mint ami a képre kerül - akár 3-5-ször annyi is lehet.
de amúgy tudom javasolni, hogy a fogalmaknak olvassatok utána - sokkal részletesebben le vannak ezek a dolgok írva 100 helyen, mint amilyen hosszú válasz egy fórumon valaha is várható
-
válasz
tzsolesz #361 üzenetére
az RV700-as széria ROP-jai kétszer gyorsabbak z-fill és AA melletti color fill terén, mint az RV670-é, ezért nem olyan vészes, hogy fele annyian vannak.
a memória sebessége nekem is rejtély, minden bizonnyal sokat segített rajta az átszervezett cache, ill. a lokalizált crossbar vezérlők, de akkor is nehezen hihető, hogy a majdnem kétszeres sávszélességgel rendelkező 3850-nel így tudja tartani a lépést. bár, a 12%-kal nagyobb core órajel is elfed ezt-azt.a héten volt nálam egy 4670, azon lefuttattam az összes tesztet, 3850-et sajnos csak jövő hét végén kapok - akkor majd kiderül, mennyire egyenletes a 4670 teljesítménye
-
csak egy apróság, nem a textúrázás dominál manapság sem, az egyik szűk keresztmetszet a backend (ROP-ok) környékén van elásva, ld. 4830 VS 4850, másrészt pedig az ALU kihasználtság a Radeonokban továbbra is a béka segge alatt van, de még az nVidia skalár ALU-i sem pörögnek éppen 100%-on...
-
-
nem lenne nagyon vészes növelni az SP-k számát, csak nincs sok értelme. nézd meg, mit tud egymáshoz képest a 4830 és a 4850 (pl. itt - ez itt a reklám helye
) - ha a 4830 a 4850 órajelén menne, akkor minimális lenne a különbség a legtöbb helyen, pedig 25%-kal több ALU (és TEX) van a 4850-ben...
a magasabb órajel sokkal inkább hozna extra teljesítményt. -
Tehát akkor az FP16-os csatornák blending előtti feldolgozása a probléma, ugye jól értelmezem?
Az interpolátoros dolog nekem nagyon furcsa. Az RV770-ben van 32 db, gondolom full speed mennek 64 bites adatokig bezárólag. A GT200-ban elméletileg 240 van, és ráadásul a shader órajelen mennek, a sebességükről annyit olvastam, hogy 32-biten (=FP10) full speed, gondolom 64 biten lehet half speed, de akkor is, ez bődületes kapacitás. No persze, ezt a kapacitást jelentősen megnyirbálja, hogy a special instruction ugyanezekkel az erőforrásokkal dolgozik, de számomra még így is hihetetlen, hogy a 32 interpolátor teljesítménye alá bírnak menni. Pedig a Vegas tényleg ezt mutatja.
-
jönnek a komplex shaderek, geometry shaderek és FP16 blending ... komolyabb deferred rendering, és fény-árnyék kezelési technikák DX10.1-gyel.
az FP16 blending miért fog fájni az nVidiának? a GTX280-ban 32 blender van, amik FP16-os csatornákat 1 órajel alatt processzálnak. ez pont annyi, mint ami a 4870X2 két chipjén összesen rendelkezésre áll - épp csak az órajel miatt gyorsabb blendingben a Radeon.
más. én is leteszem a két centemet az RV740 kapcsán: nekem logikusabbnak tűnik, hogy az RV770LE-t (4830) váltsák le vele, mert ha jók a yieldek, akkor a harvestinget nagyon gyorsan be kell fejezni. Ha mondjuk 480SP mellé 750MHz-es az órajel, akkor ALU-ban és TEX-ben ugyanott van, 128-bit + gDDR5 szintén pipa, egyedül a 8 ROP marad szűk keresztmetszetnek - ami talán nem is baj, mert a 4830 amúgy is túl közel van a 4850-hez...
Aktív témák
Hirdetés
- Milyen légkondit a lakásba?
- Változó design, tekerhető lünetta: megjött a Galaxy Watch8 és a Classic
- Hamarosan rézhiánytól szenvedhet az egész chipgyártás
- Kazy Computers vélemények - tapasztalatok
- Házimozi belépő szinten
- Audi, Cupra, Seat, Skoda, Volkswagen topik
- Samsung Galaxy S25 Ultra - titán keret, acélos teljesítmény
- Windows 11
- BestBuy topik
- Töltőtoll kedvelők/használók topicja
- További aktív témák...
- Új FULL HD webkamera + Számla
- ÁRCSÖKKENTÉS TP-Link Archer C1200 Router eladó (1200 Mb/s Wi-Fi)
- Epson Expression 12000 XL Nagyformátumú A3 szkenner
- Xiaomi Redmi Note 12s 256GB, Kártyafüggetlen, 1 Év Garanciával
- Bomba ár! Dell Inspiron 5405 - Ryzen5 4500U I 8GB I 256SSD I 14" FHD I HDMI I Cam I W11 I Garancia!
Állásajánlatok
Cég: PCMENTOR SZERVIZ KFT.
Város: Budapest
Cég: CAMERA-PRO Hungary Kft
Város: Budapest