- Motorola Moto G56 - bátyja árnyékában
- Bővebb Google-támogatást kap sok Garmin óra
- Változó design, tekerhető lünetta: megjött a Galaxy Watch8 és a Classic
- Google Pixel topik
- Samsung Galaxy Watch6 Classic - tekerd!
- Honor Magic5 Pro - kamerák bűvöletében
- Légies iPhone halvány színei
- iPhone topik
- Apple Watch Sport - ez is csak egy okosóra
- Nothing Phone 2a - semmi nem drága
Új hozzászólás Aktív témák
-
dezz
nagyúr
''Én valahogy úgy képzelem, hogy az egy SIMD-be tartozó MIMD-ek (vagy mind a 16, vagy csak a fele, a jó ég tudja) egyidőben ugyanazokat a VLIW-eket hajtják végre más-más adatokon (na ez egy jó mondat lett).''
Igen, én is ezt próbáltam leírni az egy oszlopba tartozós szöveggel. -
dezz
nagyúr
Jahh, már értelek.
Néztem én azt a 4-es lapot már, de ott is egy-egy sort vettem egybetartozónak. De valószínű, hogy tényleg inkább dupla-oszloponként kell nézni.
Bár ettől még kérdéses a számomra, miért nevezi ezeket a blokkokat az AMD SIMD-nek. Végülis minden MAD egységen más-más műveletet végezhet, így ez az egész egy ''super-MIMD'' cucc. Mondjuk valószínű, hogy úgy túl bonyolult lenne a kezelésük, így az egy oszlopba tartozó, azon belül ugyanolyan sorszámú (magyarán egymás alatti) MAD egységekkel ugyanazt a műveletet végezteti a belső scheduler (Ultra-Threaded Dispatch Processor).
Érdekes. Más kialakítás, de lényegében hasonló működtetés... (R600/G80.) -
dezz
nagyúr
Nézd a képet: [link]
Egy unitban 2x 5(+1 branch, de azt most hagyjuk) egység van, te honnan szeded ezt a 16-os számot? (16*4*8(sor) = 512!)
Naszóval, azt tudjuk, hogy egy ilyen 5-way blokk az itt MIMD, azaz mind más műveletet végezhet. Aztán valamilyen oknál fogva 2-2 ilyen van egy unitban. Most hogy miért nevez az AMD egy ilyen 4 unitból álló sort SIMD-nek, azt nem tudom. Talán úgy értik, egy-egy sor egy adott shaderkódot futtat.
A G80 shader tömbje 16db 8-way SIMD MAD egységből áll (plusz ott vannak az interpolátor és spec. funct. egységek), amik szintén párosával vannak rendezve, 8db unitba. De úgy alakul a végrehajtás, hogy minden ilyen unit más-más kódot futtathat, szép egymás utánban az utasításokat, csak éppen egyszerre 16 pixelen. -
dezz
nagyúr
Egyébként asszem mégis ''kőbe lehet vésni'' azt a (2x)8-way SIMD működést G80-nál:
''There are 128 such processors (called SPs by NVIDIA) in a full G80, grouped in clusters of 16, giving the outward appearance of an 8-way MIMD setup of 16-way SIMD SP clusters. Inwardly, each 16 SP cluster is further organised in two pairs of 8 (let's call that 8x2) and the scheduler will effectively run the same instruction on each half cluster across a number of cycles, depending on thread type.'' [link] (Tudom, már nem mai.)
(A ''8-way MIMD'' a 8db clusterre vonatkozik, azok külön-külön legalább mást csinálhatnak.)
Szó van egyébként az elemzésben arról, hogy elvileg a shader procik tudnak ilyet, hogy dual-issue a MADD and MUL, viszont a szerzők, és mások ennek semmi jelét nem látták.
Még valami: itt is vannak ám trigonometriai utasítások, a special function egységek leple alatt. Ezek számát tekintve ellentmondás van eme elemzés, és a korábban linkelt tábla között. -
dezz
nagyúr
Nos eddig volt jó kis bedrótozott T&L, ezt most már szépen shader-programokkal kell csinálni. Talán nem kell hozzá szögfüggvény?
Nem vagyok túlzottanotthon a shaderprogramozásban, de mintha eddig is használatosak lettek volna szögfüggvények egyébre is. Nem tudom, be volt-e ilyen építve, de ha így nem, akkor textúrás táblázattal volt megoldva. Csak az ugye nem olyan pontos.
Jahh, az a 730M-s adat. Tudtommal az egy becslés, ami a die méretből és a 80nm (vs. 90nm) vonalszélességből indul ki.
Viszont valaminek el kell füstölnie a wattokat... Szerinted mi? -
dezz
nagyúr
A crossbaros memvezérlő is elég sok tranyóba kerülhet a G80-ban. Meg gondolom, az is, hogy G80-on külön vannak a MAD és interpolator/INT/spec. funct. egységek.
Nem 64 transcendens egység, hanem a 320-ból 64 tud ilyet is. Hogy érted, hogy mi szükség sin, cos, stb.-ra? Ha elég gyors, szükségtelenné teszi a textúrába tett táblázatokat, memóriahozzáféréseket spórolva.
Ez a ROP-os dolog szerintem inkább csak FUD.
[Szerkesztve] -
dezz
nagyúr
Persze, a pontos teljesítmény mindig az adott alkalmazástól fog függeni. De azt akartam mondani, hogy a MAD (valahol MADD-nak írják) egységek száma, és az általuk pl. mp-enként végrehajtható utasítások száma azért összemérhető.
Nem tudom, mennyire gyakorlati v. elméleti az az összehasonlító tábla, szal azért még ne véssük kőbe ezt a 8-way SIMD dologot G80-nál.
Az R600-zal kapcsolatban 4+1 egységről beszélni félrevezető lehet, mert a korábbi genek voltak 4+1-esek (vec4+1 scalar), most meg 5 scalar egység van (+1 külön branch), amik fp MAD-ot, és int műveleteket tudnak, és egy tud transcendentalt is, de emiatt nem szokás külön venni.
Itt a shader teljesítményről van szó, hogy összességében hogy teljesítenek, az ugye függ egyéb dolgoktól is, mint pl. a ROP egységek száma. R600-ban állítólag ebből nincs túl sok, talán ezért volt ő is ''csak'' 2x gyorsabb, mint az X1950XTX. Meg tudnád egyébként osztani azt a tesztet? -
dezz
nagyúr
Hát nem egészen.
Amit te ''egyszerű''-nek írsz, az a legtöbbet használt, fullos floating point MAD egység, integer supporttal (bitwise ops is). A ''bonyolultabb'' csak abban különbözik, hogy transcendentális (sin, cos, stb.) függvényeket is tud. Mindez úgy csoportosul, mintha 64db 5(+1)-way MIMD egység lenne, amiben az 5 független utasítás superscalarban hajtódik végre, azzal a kitétellel, hogy transcend. op csak egy lehet ebből. (A +1 az ugrás lehet.)
A G80 meg nem 128-way superscalar, hanem 16db 8-way SIMD MAD egység, plusz 16db 2-way SIMD interpolátor és spec. funct. egység (4 clk/op) van van. Azaz egy MAD egység ugyanazt az 1 utasítást hajtja végre 8 adaton. Azonban ha nem tudsz összeszedni 8 adatot 1-1 utasításra, akkor csökken a kihasználtság.
Szóval simán összehasonlítható pl. MAD ops/s szempontból, de más szempontból is.
Nézd csak meg ezt: [link]
Órajeleket is figyelembe véve, kevert MAD, MUL, és ADD utasításokat véve az R600 másfélszer gyorsabb, 100%-os G80 MAD egyéség kihasználtságot feltételezve. Mi van, ha nem jön össze a 100%...?
[Szerkesztve] -
dezz
nagyúr
''#98: ja tudom az X1950XTX is jobb a gtxnél csak dx6ban kell nézni''
Szókiforgatós hangulatban vagy, vagy ez default?
''a 320stream meg nem hasonlitható össze az nvidia 128ával ezt már sokan elmondták!''
De igen, nagyon is összehasonlítható! Csak az órajel is számít persze, de ezt oda is írtam. Meg azt is, hogy milyen a kihasználtsága, de ezt is odaírtam. Vagy neked így már túl bonyolult volt? -
dezz
nagyúr
BIOS/tápfesz témára: biztos, hogy emelték a feszt, mert az Ultra GTX órajeleken is többet fogyaszt. (Bár a stream proc. órajel nem teljesen egyértelmű.)
-
dezz
nagyúr
Gondolkodni?
128 stream proc. vs. 320 stream proc.
1350 MHz (GTX) vs. ~750-800 MHz.
DX10-ben 60-80%-os kihasználtság vs. ~100%-os kihasználtság. (Állítólag.)
Akkor most ezt add össze.
Egyébként, mint írtam, nem komplett DX10 programokról volt szó, hanem egyes featúrékról.
(Belinkelném, de még keresem.)
Ha igazak a hírek, a 2900XT DX9-ben tényleg gyengébb a GTX-nél, az XTX meg valószínű hónapokkal később jelenik meg. DX10 játékból meg ilyen 2-3 lesz idén elvileg. Akkor hova erőlködjenek - gondolhatják. Meg különben is: ha lassú is lesz a G80 DX10-ben, mire ez kiderül, már eladott az Nvidia x ezer Ultrát is, szal max. ők röhöghetnek a markukba...
#96: miért kellene kint lennie? Az X1950TXT elég jól teljesít, hacsak nem 2560-ban játszol, a DX10-es cuccok meg még csak most kezdenek csörgedezni.
[Szerkesztve]
Új hozzászólás Aktív témák
Hirdetés
- GAINWARD RTX 4070 Ti SUPER Phoenix 16GB GDDR6X - 3 év garancia
- Eladó PNY GeForce RTX 4070 Ti SUPER 16GB OC XLR8
- MSI RTX 3080 Ti SUPRIM X 12GB GDDR6X Videokártya! BeszámítOK
- BESZÁMÍTÁS! SAPPHIRE NITRO+ RX 7900 XTX 24GB GDDR6 videokártya garanciával hibátlan működéssel
- Gigabyte RX 6800 16Gb Aorus (LCD kijelzős)
- Apple iPhone 13 128GB, Kártyafüggetlen, 1 Év Garanciával
- Xbox Ultimate előfizetések
- Csere-Beszámítás! Olcsó Számítógép PC Játékra! R5 1500X / RX 570 8GB / 16GB DDR4 / 250SSD + 2TB HDD
- Intel X540-T2 dual-port 10GbE RJ45 hálózati vezérlő (10Gbit, 2 port, áfás számla, garancia)
- ÁRCSÖKKENTÉS TP-Link Archer C1200 Router eladó (1200 Mb/s Wi-Fi)
Állásajánlatok
Cég: CAMERA-PRO Hungary Kft
Város: Budapest
Cég: PCMENTOR SZERVIZ KFT.
Város: Budapest