- Samsung Galaxy S24 FE - később
- Android szakmai topik
- Honor Magic5 Pro - kamerák bűvöletében
- Légies iPhone halvány színei
- Vékonyabb lett, jobb kamerát kapott, de az akku maradt a régi: itt a Fold7
- Google Pixel topik
- Redmi Note 10 Pro - majdnem minden stimmel
- Azonnali navigációs kérdések órája
- Samsung Galaxy S22 és S22+ - a kis vagány meg a bátyja
- Instagram közösségi fényképezés
Új hozzászólás Aktív témák
-
dezz
nagyúr
''Én valahogy úgy képzelem, hogy az egy SIMD-be tartozó MIMD-ek (vagy mind a 16, vagy csak a fele, a jó ég tudja) egyidőben ugyanazokat a VLIW-eket hajtják végre más-más adatokon (na ez egy jó mondat lett).''
Igen, én is ezt próbáltam leírni az egy oszlopba tartozós szöveggel. -
dezz
nagyúr
Jahh, már értelek.
Néztem én azt a 4-es lapot már, de ott is egy-egy sort vettem egybetartozónak. De valószínű, hogy tényleg inkább dupla-oszloponként kell nézni.
Bár ettől még kérdéses a számomra, miért nevezi ezeket a blokkokat az AMD SIMD-nek. Végülis minden MAD egységen más-más műveletet végezhet, így ez az egész egy ''super-MIMD'' cucc. Mondjuk valószínű, hogy úgy túl bonyolult lenne a kezelésük, így az egy oszlopba tartozó, azon belül ugyanolyan sorszámú (magyarán egymás alatti) MAD egységekkel ugyanazt a műveletet végezteti a belső scheduler (Ultra-Threaded Dispatch Processor).
Érdekes. Más kialakítás, de lényegében hasonló működtetés... (R600/G80.) -
dezz
nagyúr
Nézd a képet: [link]
Egy unitban 2x 5(+1 branch, de azt most hagyjuk) egység van, te honnan szeded ezt a 16-os számot? (16*4*8(sor) = 512!)
Naszóval, azt tudjuk, hogy egy ilyen 5-way blokk az itt MIMD, azaz mind más műveletet végezhet. Aztán valamilyen oknál fogva 2-2 ilyen van egy unitban. Most hogy miért nevez az AMD egy ilyen 4 unitból álló sort SIMD-nek, azt nem tudom. Talán úgy értik, egy-egy sor egy adott shaderkódot futtat.
A G80 shader tömbje 16db 8-way SIMD MAD egységből áll (plusz ott vannak az interpolátor és spec. funct. egységek), amik szintén párosával vannak rendezve, 8db unitba. De úgy alakul a végrehajtás, hogy minden ilyen unit más-más kódot futtathat, szép egymás utánban az utasításokat, csak éppen egyszerre 16 pixelen. -
dezz
nagyúr
Egyébként asszem mégis ''kőbe lehet vésni'' azt a (2x)8-way SIMD működést G80-nál:
''There are 128 such processors (called SPs by NVIDIA) in a full G80, grouped in clusters of 16, giving the outward appearance of an 8-way MIMD setup of 16-way SIMD SP clusters. Inwardly, each 16 SP cluster is further organised in two pairs of 8 (let's call that 8x2) and the scheduler will effectively run the same instruction on each half cluster across a number of cycles, depending on thread type.'' [link] (Tudom, már nem mai.)
(A ''8-way MIMD'' a 8db clusterre vonatkozik, azok külön-külön legalább mást csinálhatnak.)
Szó van egyébként az elemzésben arról, hogy elvileg a shader procik tudnak ilyet, hogy dual-issue a MADD and MUL, viszont a szerzők, és mások ennek semmi jelét nem látták.
Még valami: itt is vannak ám trigonometriai utasítások, a special function egységek leple alatt. Ezek számát tekintve ellentmondás van eme elemzés, és a korábban linkelt tábla között. -
dezz
nagyúr
Nos eddig volt jó kis bedrótozott T&L, ezt most már szépen shader-programokkal kell csinálni. Talán nem kell hozzá szögfüggvény?
Nem vagyok túlzottanotthon a shaderprogramozásban, de mintha eddig is használatosak lettek volna szögfüggvények egyébre is. Nem tudom, be volt-e ilyen építve, de ha így nem, akkor textúrás táblázattal volt megoldva. Csak az ugye nem olyan pontos.
Jahh, az a 730M-s adat. Tudtommal az egy becslés, ami a die méretből és a 80nm (vs. 90nm) vonalszélességből indul ki.
Viszont valaminek el kell füstölnie a wattokat... Szerinted mi? -
dezz
nagyúr
A crossbaros memvezérlő is elég sok tranyóba kerülhet a G80-ban. Meg gondolom, az is, hogy G80-on külön vannak a MAD és interpolator/INT/spec. funct. egységek.
Nem 64 transcendens egység, hanem a 320-ból 64 tud ilyet is. Hogy érted, hogy mi szükség sin, cos, stb.-ra? Ha elég gyors, szükségtelenné teszi a textúrába tett táblázatokat, memóriahozzáféréseket spórolva.
Ez a ROP-os dolog szerintem inkább csak FUD.
[Szerkesztve] -
dezz
nagyúr
Persze, a pontos teljesítmény mindig az adott alkalmazástól fog függeni. De azt akartam mondani, hogy a MAD (valahol MADD-nak írják) egységek száma, és az általuk pl. mp-enként végrehajtható utasítások száma azért összemérhető.
Nem tudom, mennyire gyakorlati v. elméleti az az összehasonlító tábla, szal azért még ne véssük kőbe ezt a 8-way SIMD dologot G80-nál.
Az R600-zal kapcsolatban 4+1 egységről beszélni félrevezető lehet, mert a korábbi genek voltak 4+1-esek (vec4+1 scalar), most meg 5 scalar egység van (+1 külön branch), amik fp MAD-ot, és int műveleteket tudnak, és egy tud transcendentalt is, de emiatt nem szokás külön venni.
Itt a shader teljesítményről van szó, hogy összességében hogy teljesítenek, az ugye függ egyéb dolgoktól is, mint pl. a ROP egységek száma. R600-ban állítólag ebből nincs túl sok, talán ezért volt ő is ''csak'' 2x gyorsabb, mint az X1950XTX. Meg tudnád egyébként osztani azt a tesztet? -
dezz
nagyúr
Hát nem egészen.
Amit te ''egyszerű''-nek írsz, az a legtöbbet használt, fullos floating point MAD egység, integer supporttal (bitwise ops is). A ''bonyolultabb'' csak abban különbözik, hogy transcendentális (sin, cos, stb.) függvényeket is tud. Mindez úgy csoportosul, mintha 64db 5(+1)-way MIMD egység lenne, amiben az 5 független utasítás superscalarban hajtódik végre, azzal a kitétellel, hogy transcend. op csak egy lehet ebből. (A +1 az ugrás lehet.)
A G80 meg nem 128-way superscalar, hanem 16db 8-way SIMD MAD egység, plusz 16db 2-way SIMD interpolátor és spec. funct. egység (4 clk/op) van van. Azaz egy MAD egység ugyanazt az 1 utasítást hajtja végre 8 adaton. Azonban ha nem tudsz összeszedni 8 adatot 1-1 utasításra, akkor csökken a kihasználtság.
Szóval simán összehasonlítható pl. MAD ops/s szempontból, de más szempontból is.
Nézd csak meg ezt: [link]
Órajeleket is figyelembe véve, kevert MAD, MUL, és ADD utasításokat véve az R600 másfélszer gyorsabb, 100%-os G80 MAD egyéség kihasználtságot feltételezve. Mi van, ha nem jön össze a 100%...?
[Szerkesztve] -
dezz
nagyúr
''#98: ja tudom az X1950XTX is jobb a gtxnél csak dx6ban kell nézni''
Szókiforgatós hangulatban vagy, vagy ez default?
''a 320stream meg nem hasonlitható össze az nvidia 128ával ezt már sokan elmondták!''
De igen, nagyon is összehasonlítható! Csak az órajel is számít persze, de ezt oda is írtam. Meg azt is, hogy milyen a kihasználtsága, de ezt is odaírtam. Vagy neked így már túl bonyolult volt? -
dezz
nagyúr
BIOS/tápfesz témára: biztos, hogy emelték a feszt, mert az Ultra GTX órajeleken is többet fogyaszt. (Bár a stream proc. órajel nem teljesen egyértelmű.)
-
dezz
nagyúr
Gondolkodni?
128 stream proc. vs. 320 stream proc.
1350 MHz (GTX) vs. ~750-800 MHz.
DX10-ben 60-80%-os kihasználtság vs. ~100%-os kihasználtság. (Állítólag.)
Akkor most ezt add össze.
Egyébként, mint írtam, nem komplett DX10 programokról volt szó, hanem egyes featúrékról.
(Belinkelném, de még keresem.)
Ha igazak a hírek, a 2900XT DX9-ben tényleg gyengébb a GTX-nél, az XTX meg valószínű hónapokkal később jelenik meg. DX10 játékból meg ilyen 2-3 lesz idén elvileg. Akkor hova erőlködjenek - gondolhatják. Meg különben is: ha lassú is lesz a G80 DX10-ben, mire ez kiderül, már eladott az Nvidia x ezer Ultrát is, szal max. ők röhöghetnek a markukba...
#96: miért kellene kint lennie? Az X1950TXT elég jól teljesít, hacsak nem 2560-ban játszol, a DX10-es cuccok meg még csak most kezdenek csörgedezni.
[Szerkesztve]
Új hozzászólás Aktív témák
Hirdetés
- Nyaralás topik
- Lexus, Toyota topik
- Hamarosan rézhiánytól szenvedhet az egész chipgyártás
- AMD K6-III, és minden ami RETRO - Oldschool tuning
- Milyen asztali (teljes vagy fél-) gépet vegyek?
- World of Tanks - MMO
- Videós, mozgóképes topik
- Pécs és környéke adok-veszek-beszélgetek
- EAFC 25
- Akciókamerák
- További aktív témák...
- Csere-Beszámítás! MSI Suprim X RTX 3080 10GB Videokártya!
- GAINWARD RTX 4070 Ghost OC 12GB - ÚJ! 3 év garancia
- ASUS TUF Gaming GeForce RTX 3090 24GB GDDR6X
- BESZÁMÍTÁS! Gigabyte AORUS MASTER RX 6800 XT 16GB GDDR6 videokártya garanciával hibátlan működéssel
- Csere-Beszámítás! Sapphire Nitro+ RX 6700XT 12GB Videokártya!
- BESZÁMÍTÁS! GigabyteA620M R5 7500F 32GB DDR5 500GB SSD RX6700XT 12GB Bitfenix Nova Mesh Enermax 750W
- LG 55G4 - 55" OLED evo - 4K 144Hz & 0.1ms - MLA Plus - 3000 Nits - NVIDIA G-Sync - FreeSync Premium
- BESZÁMÍTÁS! Intel Core i9 9900K 8 mag 16 szál processzor garanciával hibátlan működéssel
- AKCIÓ! Gigabyte B760M i5 14600KF 64GB DDR4 512GB SSD RTX 3080 10GB Corsair 4000D Airflow 1000W
- Samsung Galaxy S22 Ultra 512GB, Kártyafüggetlen, 1 Év Garanciával
Állásajánlatok
Cég: PCMENTOR SZERVIZ KFT.
Város: Budapest
Cég: Promenade Publishing House Kft.
Város: Budapest