Hirdetés
- Motorola G86 - majdnem Edge
- Google Pixel 9 Pro XL - hét szűk esztendő
- QWERTY billentyűzetes, üzenet-fókuszú androidos mobil a Clicks Communicator
- CES 2026: Minden kiszivárgott bemutatója előtt a Motorola új csúcstelefonjáról
- Mobilhasználat külföldön
- Xiaomi 13T és 13T Pro - nincs tétlenkedés
- Milyen okostelefont vegyek?
- Samsung Galaxy S21 FE 5G - utóirat
- Visszatérnek a Samsung tervezte CPU-magok és GPU az Exynos 2800-ban?
- Yettel topik
-
Mobilarena
A legtöbb kérdésre (igen, talán arra is amit éppen feltenni készülsz) már jó eséllyel megtalálható a válasz valahol a topikban. Mielőtt írnál, lapozz vagy tekerj kicsit visszább, és/vagy használd bátran a keresőt a kérdésed kulcsszavaival!
Új hozzászólás Aktív témák
-
5% a különbség, ami lehet, hogy a gaming vegáknál már ki is fog egyenlítődni.
a fiji egy elég érdekes eset volt, mert a tesztek szerint arányosan skálázódott a memóriasávszél változására. azaz addig oké, hogy a sávszélesség maga nagy, de úgy néz ki, hogy akkor is szükséges egy bizonyos mértékű buszsebesség is, és ez a fijinél nem volt meg.nyilván a fejlesztők a világ összes erőforrását fel tudnák használni, ha rendelkezésre állna.

-
do3om
addikt
-
Yutani
nagyúr
válasz
Malibutomi
#29797
üzenetére
Jó, de hát itt mindenki tudja, hogy a több = jobb. Most meg jön az AMD a kevesebbel? Hát visszafelé fejlesztenek?

-
HSM
félisten
Véletlenül se számolj olyasmikkel, mint hogy időközben lett egy utasítás előbetöltés, plusz kétszerakkora L2 már a Polarisban is. Ja, igen, és a renderelési módban is történik változás a pletykák szerint. Ez mind az architektúra sávszélesség igényét igyekszik csökkenteni.
Ébresztő, a Fury két generációval korábi cucc volt.
-
do3om
addikt
válasz
velizare
#29785
üzenetére
Most hogy nem jött nekik össze a gyorsabb ram, vagy nem tudom ez szándékos-e,vagy árban van jelentős eltérés, így már nem is kell neki a nagy sávszélesség?
Közben meg a furynál az ment hogy kicsit visszafogja a és jöttek is később lehetőségek amikkel ugye 600Mhz-re lehetett állítani. Ha jól emlékszem.
Na most a sokkal gyorsabb karira elég a fury-nál lassabb ram?Persze tudom szinte biztos hogy van valami új találmány amivel most nem is kell a nagy sávszélesség mert ez is igen jó, és lesz is róla írás hogy ez így is mekkora jó dolog mert HBM2,és a csoda ficsőrrel ez a szávszél majd sokkal többnek felel meg.
![;]](//cdn.rios.hu/dl/s/v1.gif)
-
Abu85
HÁZIGAZDA
válasz
#85552128
#29790
üzenetére
Mert az van rajta. Az a 16 GB-nyi HBM2 egy High Bancwith Cache, ahogy mondjuk a másik modelleknél az x GB-nyi GDDR5 vagy HBM is. Csak a Vega 10 esetében van a vezérlőben egy HBCC is, plusz multiprocesszoronként van egy ATS egység, a másik két modellnél ezek hiányoznak. Tehát ezeken mindin a szoftver fog gondoskodni arról, hogy a High Bancwith Cache-ükben ott legyen a szükséges adat.
A VRAM-ot azért nem használja az AMD, mert annak az elfogadott definíciója a szegmentált fizikai címzésű hardverekre vonatkozik, de a GCN az MMU miatt nem ilyen architektúra. Különösebb jelentősége egyébként ennek nincs.
-
Abu85
HÁZIGAZDA
válasz
#85552128
#29787
üzenetére
A High Bandwith Cache nem egyenlő a High Bandwith Cache Controllerrel. Mindegyiken HBC található, mert oda lehet rakni a GPU számára szükséges adatokat. Csak amíg a Vega 10 esetében ezt egy lapkába épített vezérlő megoldja (HBCC), addig a másik két modellnél a szoftverben kell gondoskodni erről.
-
a fiji sávszéle 4 chip miatt jött ki annyira. a hbm rev1 és rev2 implementációja ugyanolyan széles buszt tesz lehetővé modulonként. ezt a szélességet felszorzod a memóriavezérlő órajelével, és megkapod a sávszélességet (feltéve, ha szinkronban jár a kettő, de általában ez a helyzet).
az pedig nv úgy tűnik, hogy a voltával sem fog hbm-et hozni a gaming szegmensbe.@->Raizen<-: nem írt itt senki olyat, hogy ne lennének azok.
-
do3om
addikt
válasz
#45185024
#29771
üzenetére
Már volt rólla szó de ott azt hiszem a 4-8GB HBM miatt volt valami magyarázat, nem annyi lap megy rá és nem úgy jön ki, de itt a 16Gb-os, ott jónak kéne lenni.
Szóval: mért ilyen lassú rajta a híres HBM2? Még a Fury X-et sem éri el?
Az NV-nek aki innen a fórumról már régen megtudtuk semmi tapasztalata, évekre lemaradtak és sokkal később lesz HBM mint az AMD-nek (persze szokás szerint beelőzték). Na náluk 900GB/s a HBM2. -
válasz
Petykemano
#29778
üzenetére
1024-gyel csak a byte-ot váltjuk. Ill. a HDD / SSD gyártók már azt sem

-
Malibutomi
nagyúr
válasz
Petykemano
#29778
üzenetére
Nem kell semmit valtani egybol a tflops erteket kapod meg.
core szam *2 es * orajel
-
Petykemano
veterán
válasz
Malibutomi
#29777
üzenetére
a flops-ot megáról gigára, gigáról terára 1000-rel és nem 1024-gyel váltjuk?
-
Malibutomi
nagyúr
válasz
Petykemano
#29775
üzenetére
4096*2*1500=12.288TFLOPS
-
Jack@l
veterán
válasz
Petykemano
#29768
üzenetére
Polaris megjelenés előtt volt, csodák meg nincsenek.

-
#45185024
törölt tag
INSTICT RACK

Aki érti... érti
-
#45185024
törölt tag
válasz
golya87
#29769
üzenetére
Érdekes dolgot kérdeztél.
Lehet ahhoz van köze hogy a fiji 175Wattos TDPvel jön
a MI25 meg 300 Wattból.
Azt is kérdezhetnéd ha egyik 28 nanométeren jött a másik 14-en akkor miért fogyaszt dupláját, fordítva logikusabb lenne...
Szóval szerintem egyszerűen hőtan, nincs venti nagy hőleadó felület, jön a menetszél és elviszi.
Aztán lehet egyszerűen a Polariszétól nyákban nincs eltérés és spóroltak
-
golya87
őstag
Nézegettem a MI25-ről készült grafikát és felmerült bennem egy kérdés.
Ha ez is HBM-es és egy GPU-s kártya, akkor mi indokolja, hogy legalább olyan hosszú, mint a Polaris alapú gyorsító? -
Petykemano
veterán
válasz
Jack@l
#29757
üzenetére
Fiji, Tonga : gfx8
Polaris: gfx8.1
Vega: gfx9Nem egyszerre tervezték.
A gfx8-at 20nm-re tervezték. Valószínűleg amikor kiderült, hogy nem lesz 20nm, akkor portolták amit tudtak 28nm-re. A polaris ennélfogva - ha hiszunk az elnevezésnek - tekinthető a gfx8 befejezésének. Ez végül 14nm, amiről ugye tudjuk, hogy valójában 20nm finfet, ez adhatott némi könnyebséget a portolásban. Ugyanakkor ha figyelembe vesszük azt, hogy a gfx8 eredetileg 20nm planarra készült volna és hogy a frekvencia nagyrészt design kérdése, az megmagyarázná a polaris maximális frekvenciáját.Állítólag a vega lesz az első olyan gpu, amit már teljesen raja koduri vezénylete alatt készítenek.
Ezek alapján lehet mindent mondani, de azt nem, hogy ugyanazok, vagy hogy egyszerre tervezték volna a vegát és a polarist
-
stratova
veterán
válasz
Jack@l
#29764
üzenetére
Nem nyomja le gépi tanulásban Pascal V100-at ez tény, bár hasonló célra azért létezik más kártyája is NV-nek, pl a Tesla P100, amiből a kisebbik PCI-E verzió is vagy 2.000.000 Ft
Szóval szerintem méregetik ezt több téren is GP102-höz, nyilván ahhoz aminél az adott tesztcsokorban jobb, az 1/16 arányú DP FP valóban nem tartozik ezek közé. -
Abu85
HÁZIGAZDA
válasz
Raymond
#29758
üzenetére
Nem tudod ezeket kiváltani. Ezek mind azért jönnek mert az aktuális megoldások nagyon lassúak, és ezeknél sokszor még az emulació is jobb. A Ballot préselésnél megspórolja az atomi műveleteket, esetlegesen marha sokat. Persze megoldható naiv megközelítéssel is, de ha ez elég lenne nem dolgoznának a szabványalkotók a Ballot szabványosításán. A prefix sum esetében a vektorutasítások hozzáférhetnek a szomszédos lane-el adataihoz anélkül, hogy az LDS-be kellene írni bármit is. Ha arra van szükséged, hogy a wave-ek a létrehozásuk sorrendjében fussanak le, akkor muszáj a ordered countot használni. Erre egyébként nem a Microsoft nevével keress rá, mert az az SM6-os függvénynév. Ajánlott a GCN ordered atomics, a ds_ordered_count, ezek variációi. A Microsoft specifikációja az XBox One másolata, ami meg az AMD ds_ordered_counthoz van igazítva. Az meg világos, hogy találsz róla kérdést, hogy miképp működik nem GCN-en, mert más hardver nem erre lett szánva, viszont fícsőr szempontjából tök hasznos, hogy csupán egy függvény a háttérben mindent sorrendben "varázsol meg".
A barycentric eseteben sincs más lehetőség. Opció persze az alternatív eljárás a geometry shaderrel, de olyan lassú lesz, hogy inkább érdemes pixel shader kódot írni a barycentric koordinátákra építve. Egyszerűen meg a legrosszabb hardveres emuláció is gyorsabb lesz a geometry shadernél.
Nagyon sok esetben mindegy, hogy xy gyártó emulálja. A régi megoldásnál az emulált is lényegesen jobb. Valószínűleg ezért nem érdekli a Microsoftot annyira, hogy minden gyártót figyelembe vegyen. Annyira túlkoros az SM5 feldolgozási modellje, hogy még a legrosszabb emulációk is előnyt jelentenek ehhez képest. De a gyártókat mondjuk érdekelni fogja, hogy az architektúráikon hogyan viselkednek az egyes függvények a konkurensekhez képest. -
Raymond
titán
válasz
#45997568
#29760
üzenetére
"Na meg a passziv hutes is erdekes, ha kapna rendes hutest vajon mit produkalna"
Hogy ezt minden egyes ilyen kartyanal be kell irni attol fuggetlenul melyik gyartotol van:A kartya nem passzivan van hutve, csak nem a kartyan magan van a venti, hanem a hazban. Ott az utolso elotti kepen jobbra fent az a negy/nyolc darab atszellozteti az egeszet rendesen.
-
Jack@l
veterán
válasz
Petykemano
#29762
üzenetére
Csak deep learningre(főleg FP8 FP16) meg a konkurencia új arhitektúrája sokszor jobb... (a tesla v100 250 wattal: deep learning 112 TFLOPS)
@Malibutomi: tarts észben még egy hétig, akkor nem lesz meglepi

-
Malibutomi
nagyúr
válasz
Jack@l
#29757
üzenetére
Tenyleg, dejo mas chipek tervezesenel is ott voltal?
A Vegaban van egy csomo ujdonsag, az biztos veletlen maradt ki a Polarisbol..de tudom azok igazabol nincsenek is, mind hazugsag, hisz ez csak egy Fury 14nm-en szerinted, mindig elfelejtem...akkor viszont igazabol elobb terveztek mint a Polarist nem?
Nem en mondom hogy mas arch hanem az AMD(meg a sok felsorolt valtozas a Polarishoz kepest)
-
#45997568
törölt tag
válasz
#45185024
#29759
üzenetére
Itt mar csak 300W a TDP 1500-as orajel mellett, mindemellett eleg jol szamol, erdekes, az arazasa erdekelne illetve a szoftver kornyezetre. Na meg a passziv hutes is erdekes, ha kapna rendes hutest vajon mit produkalna

Vetetni kellene bentre egyet "tesztelni", csak ezt nem verem at sehogy a fonoksegen
, max R&D 
-
#45185024
törölt tag
AMD bejelenti az Instinct MI25 részleteket.
Itt is 16 GB. Tanuljunk hát mélyen,,,12.3 TFLOPs -
Raymond
titán
Ahhoz kepest hogy fogalmad sincs hol hasznaljak pontosan es mennyire befolyasolja vagy nem a sebesseget (mert harmadszor nem foglak megkerni hogy ird le, ha tudnad mar itt lenne valahol) eleg mereszen irogatsz roluk ott a #29734-ben:
"A WaveBallot nem annyira kellemetlen."
"A GlobalOrderedCountIncrement az rémálom lesz."
"A barycentric nem akkora para a technikai oldalról."
A legszebb hogy itt legalabb beirod magadtol is azt amit mondok:
"nem kérhető az az érintet játékoktól (Doom, DE: MD, BF1, Civ6, SE4, RE7: Bio, WH40K: DoW3, SGW 3), hogy a szabványos shadert futtassák."
Erted mar? Az fut egy jateknal ami a jobb megoldas. Olyan hogy "szabvany shader" csak papiron letezik. Nem fognak egy jatekba egy szett megoldas beepiteni mert eppen konzolon ez megy es amikor atmegy PC-re es a felhasznaloknal levo 90%+ kartya nem tamogatja akkor nem fogjak szettarni a kezuket es "hat ez van" hanem olyan megoldas hasznalnak ami fut megfeleloen. Ugyanugy mint eddig sok evtizede meg kevesbe egyoldalu piaci foleny mellett is tettek.
Egyebkent megneztem mert kivancsi voltam mi az a nagy huho es tragedia a GlobalOrderedCountIncrement korul mert talan mar azert felfigyeltem volna ra, de ez lett az eredmenye:
Az elso 7 talalat az MSDN/Technet kulombozo nyelvu ugyanazon cikkere mutat, a 8-ik a (milyen meglepo!) #29737-ben emlitett Sebastian Aaltonen twitter-ere mutat a 9-ik pedig a PH!-s SM6.0 cikkre. A kepen nem lathato 10-ik pedig ide: PH! Forum AMD vs. NVIDIA
-
Jack@l
veterán
válasz
Malibutomi
#29711
üzenetére
Ja, kár hogy egyszerre tervezték... (de nyilván más arch, ha te mondod)
-
Abu85
HÁZIGAZDA
válasz
Petykemano
#29755
üzenetére
Inkább azt kérhették, hogy a nyelvet vigyék már közelebb a hardverek működéséhez. Azért a mai specifikációkkal a HLSL eléggé egy lane-re vagy egy szálra (de nem olyan szálra, mint a CPU-nál) van szabva, holott a hardvereknek már az lenne a jó, ha a wavefrontokra lenne kialakítva. [link] - itt elég jól leírják: For earlier shader models, HLSL programming exposes only a single thread of execution. New wave-level operations are provided, starting with model 6.0, to explicitly take advantage of the parallelism of current GPUs - many threads can be executing in lockstep on the same core simultaneously. Egyszerűen jóval közelebb kerül a nyelv ahhoz, ahogy a hardver működik. És ez nem az erőforrás problémája, hanem csupán azé, hogy a shader model 5.0 majdnem tíz éves. Akkor nem kellett több, de ma már kell.
-
Petykemano
veterán
Tehát azt mondod, hogy a fejlesztők, meg a MS kértek olyan új funkciókat, amikkel effekteket tudnak hatékonyabban, gyorsabban és a konzolon szűkös erőforrásokkal gazdaságosabban bánva megvalósítani.
Majd ezeket a hardveres képességeket az AMD átvitte a kártyáira is. Talán abban a reményben, hogy majd a peogramkód is jön rá a konzolról. De ez nem így történik, hanem mégis az nvidia kap optümalizációt.
Az amd a fejlesztők kedvében járva és a konzolos megréndelés miatt vágja el magát azoktól a hardveres optimalizációktól, változtatásoktól, amelyek hatékonyabbá, versenyképesebbé tennék a hardverét a jelen szoftveres környezetben, abban a reményben, hogy makd ezek égyszer hasznosulnak, és talán egyszer majd a fejlesztők értékelik a kérésüknek alájátszott hardveres képességeket.
És most a shader model 6 érkezésével már majd könnyenkiaknázhatól lesznek ezek a hardveres képességek, amikor már majd az nvidia volta architektúrája is érkezik a támogatással.
-
Abu85
HÁZIGAZDA
válasz
Raymond
#29750
üzenetére
Ma shader model 6.0-t nem használnak sehol, most tart a publikus tesztelése a rendszernek, és az őszi Creators frissítésben lesz élesítve, addig nem lehet használni. AGS4.0-t és SPIR-V kiterjesztéseket használnak, ami az sm 6-tal érkező függvények egy részét tartalmazza. Ezek gyorsítását pedig nem lehet lemérni, mert ahogy korábban mondtam nem kérhető az az érintet játékoktól (Doom, DE: MD, BF1, Civ6, SE4, RE7: Bio, WH40K: DoW3, SGW 3), hogy a szabványos shadert futtassák.
(#29751) Szaby59: Véletlen nem az alsó sorra írta az MS, nem nagy ügy.

-
#85552128
törölt tag
válasz
->Raizen<-
#29748
üzenetére
Az RX 560 olyan jó lesz hozzá, hogy proci se kell mellé: [link]

-
Raymond
titán
"Ezek a függvények egyébként gyorsítják az egyes algoritmusokat."
Oh no, really?

Nem azt kerdeztem hogy gyorsitanak-e valamit vagy nem mert ahogy olvashattad a hozzaszolasomban vilagos hogy gyorsitanak *valamin*, azt kertem ha annyira fontosak hogy remalom es hasonlo jelzokkel illeted oket akkor tegyel mar le valamit az asztalra es irj egy-ket peldat hogy hol hasznaljak ma es mennyi pluszt hoznak kb. ahoz kepest ha nem lennenek. Mert ahogy mar az elobb irtam ezek tamogatasa vagy annak hianya ha nem is teljesen lenyegtelenek a PC-n (csak mert semmi nem 100%-os) a gyakorlatban azok, mert nem erdekes hogy nincs. Ha van, OK, ha nincs akkor meg van mas. Egyszeruen nincs szamottevo hozzajarulasa a frametime resukalasahoz igy senki nem sir miatta hogy nincs.
-
Abu85
HÁZIGAZDA
válasz
->Raizen<-
#29748
üzenetére
A Forza 7 nagyjából ugyanaz lesz, mint a Forza Horizon 3 a legutolsó patch-csel. A fejlesztések jó részét visszaportolták. Egyébként ez már jóval több magot használ a leképezéshez, mint egy. A gépigény egy picit kisebb lesz, mint az utolsó frissítéssel futó FH3-nál, mert bizonyos változásokat nem lehetett egyszerűen visszaportolni, így ezeket inkább hagyták a Forza 7-re.
-
Abu85
HÁZIGAZDA
És ehhez még hozzászólva az egész szituáció azért baj a Microsoftnak, mert egy multiplatform fejlesztésnél jó esély van arra, hogy a konzolon is a rossz hatásfokú kódot szállítja a fejlesztő, holott ott van a lehetőség a jóval gyorsabb kód biztosításra. Tehát ahhoz, hogy a multiplatform címekkel ez megváltozzon biztosítani kell a PC-hez is nagyjából ugyanazt a shader nyelvet, és nagyjából ugyanazokat a lehetőségeket. Innen már persze elő lehet venni, hogy bár a Microsoftot alapvetően jó szándék vezérli, azért pusztán a saját érdekei dominálnak, és az érdekük az, hogy ne ők igazodjanak az egyes gyártókhoz, hanem majd ezek az egyes gyártók igazodnak hozzájuk. Alapvetően megtehetik. A legtöbb függvény még emulálva is jóval gyorsabb, mint a ma használt, tíz éves nyelvre (és ez megjelenéskor sem volt valami acélos) kialakított eljárás az adott problémára.
-
Abu85
HÁZIGAZDA
válasz
Petykemano
#29743
üzenetére
Itt az új shader nyelvvel nem elsődlegesen az a cél, hogy a gyártókra optimalizáljanak. A probléma ott van, hogy a konzol által kínált lehetőségek messze kerültek attól, ahol a PC tart. Ezért egy csomó dolgot a konzolon sokkal gyorsabban meg lehet oldani. Ehhez képest a hardver gyakorlatilag megvan a PC-n, csak a shader nyelv lassan egy évtizede nem változott jelentősen miközben a hardverek már teljesen másképp működnek, mint tíz évvel ezelőtt. A shader model 6.x erre a különbségre reagál.
Például nagyon kirívó példa (ezzel szokott az MS előjönni), hogy amíg a konzolon a préselésre speciális op-kód van, addig PC-n itt mindig az atomi műveletekre építenek a fejlesztők, és ez tulajdonképpen wave-enként annyi atomi műveletet igényel, amennyi lane van az adott wave-ben. Ez marhára rossz hatásfokú, tehát még emulációval is sokkal előrébb lesznek a hardverek, mert lassan egy évtizedes különbség van a shader nyelv és a hardver képességei között. -
#45997568
törölt tag
válasz
->Raizen<-
#29742
üzenetére
Nem is Teged celoznak a High End kartyakkal
players-t meg ne feltsd
tudtommal 2 eves kor korul kell bilizni, remelem azert mar kinottel belole, nyugtass meg minket 
Na jo, megkomolyodok, Vega osszefoglalo, nem sok ujdonsag, am felrazni es felfrissiteni az informaciokat jo lehet

-
stratova
veterán
válasz
->Raizen<-
#29742
üzenetére
Ettől nem félteném, viccelődött

-
Petykemano
veterán
válasz
Raymond
#29738
üzenetére
Egyenként jelentéktelenek és nagyon nagyon távol vannak abu csodálatos epikus leírásának jókai bablevesétől.
De ha veszel 20 egyenként a teljes munkában 1%-ot számító aoróságot, vagy 10 komolyabb 2%-ot számítót, akkor közel 20% difi kijöhet. Ez mondjuk a végén sorsdöntő lehet, múlhat ezen 100-200 dollár eladott példányonként.Ilyenek nyilván az nvidiánál is vannak, tehát ha 10-20 apróságot az amdre nem optimalizálnak, másik 10-20 apróságra meg odafigyelnek az 30-40%-os különbség is lehet a leadott teljesítményben.
Nem állítom, hogy egy fejlesztésnél nem számít a költség, de Szerintem az a baj, hogy amíg az nvidia ilyen mértékben a vezérürü, addig az lesz az optimalizációs költség célpontja.
-
#45997568
törölt tag
válasz
#35434496
#29739
üzenetére
Azert ne igyal elore a medve borere, meg barmi lehet
Mondjuk ahogy en latom itt paran elore okoskodnak (hm, okoska... na mind1
) hogy mi lesz bar meg semmi hivatalos info nem jott 
Mondjuk ahogy nezem tenyleg a Volta-val fog versenyezni
Az ezzel kapcsolatos eszrevetelek mehetnek a vs-be 
-
Abu85
HÁZIGAZDA
válasz
Raymond
#29738
üzenetére
Tehát szerinted az teljesen rendben van, hogy a konzolon rendkívül sűrűn használt Ballot függvényt úgy hozza a Microsoft PC-re, hogy pont 64 bites a visszatérési maszkja, ami véletlenül pont annyi, amennyi a GCN működéséhez ideális, és pont több annál, amivel az Intel és az NV architektúrája hatékonyan működni tud? Mert szerintem egyáltalán nincs rendben. Ha valaki így akarja használni, akkor ott vannak az AMD saját kiterjesztései, mindenkinek joga van hozzányúlni, de egy szabványalkotó legyen már független.
Semmiféle funkciót nem hozott a GCN4. Nem a hardver teszi a GCN-t azzá amilyen, hanem az, hogy a Microsoft eldöntötte, hogy márpedig a shader model 6.x az lesz PC-n, ami konzolon. Az igazság az, hogy a sokat használt funkciókat tekintve semmivel sem jobb a GCN4, mint a Pascal, csak az AMD mázlista a Microsofttal. Ha most Pascal lenne a konzolokban simán el tudom képzelni, hogy a Pascalra szabott shader model jönne, nyilván a Microsoft nem azért kedvez az AMD-nek, mert szereti őket, hanem azért, mert azzal a saját konzoljának segít.
Ezek a függvények egyébként gyorsítják az egyes algoritmusokat.
-
#35434496
törölt tag
Remélem a 1080 Ti ellen készülő Sapphire Vapor-X VEGA nem csak alázza hanem ketté is hugy@zza a konkurenciát.

Úgy érzem hosszú idő után újra lesz Sapphire kártyám.

-
Raymond
titán
Bocs, de mar megint ott vizionalsz problemat es "remalmokat" ahol nem lesznek mert senkit nem erdekel igazan. Ez hogy valamihez van vagy nincs tamogatas az egy dolog, a masik meg az hogy mennyire befolyesolyak a teljesitmenyt globalisan. Magyarul egy X funkcio hasznalata mennyi idot ker egy frametime-bol. Mert mondjuk ha X funcio az egyik hardveren 10x gyorsabb mint a masikon de az osszes frame-enkenti munka talan 2%-at kepviseli akkor hiaba gyorsabb valami 10x, a az elonye csak 100 vs. 98.2 lesz. Es akkor meg aranylag bokezuen bant az ember az aplikalasall, mert itt reszfunkciokrol beszelunk.
A masik dolog meg az hogy a GCN4 nevetsegesen alacsony piaci reszesedese miatt gyakorlatilag mindegy milyen fantasztikus funkcikat hoz, ezek a gyakorlatban lenyegtelen dolgok.
Vagy ha olyan problemas mondjuk a WavePrefixSum vagy az GlobalOrderedCountIncrement tamogatasanak hianya, ird mar le hol es mennyire mutatkozna ez meg, mert en nem tudok olyan esetrol hogy ezek olyan problemak lennenek amitol a fejlesztok kardra vetnek magukat.
Itt mindig ugy vannak a GCN (vagyis AMD) funkciok leirva mint a vilagehseget megoldo adomanyok az emberisg szamara, de mindig teljes izolacioban vannak megitelve. Nem egy-ket funkcio tamogatasa vagy hianya tesz egy termeket nyerove vagy bukassa, egy GPU azert tobb dologbol all es tobb fajta munkat vegez mind frame elkeszitesenel.
-
Abu85
HÁZIGAZDA
válasz
Petykemano
#29735
üzenetére
A játékokban már az elmúlt évben megjelentek ezek a funkciók, legalábbis egy részük. Most azon van a Microsoft, hogy szabványosítva legyenek, így ne csak az AMD-n működjenek. Csak ugye a szabványosítást lehet úgy csinálni, hogy lemásolják az Xbox One-hoz használt shader nyelvet és ahhoz illesztenek egy IR-t, vagy csinálhatnák normálisan is, ahogy a Khronos, bár ez lassabb módszer.
A fejlesztők sok dolgot akarnak. Érdemes egyébként nézni most Sebastian Aaltonen twitterjét. A szemünk előtt hozza PC-re a Claybookot. Ígért PC-re vonatkozó bejegyzéseket és folyamatosan szállítja azokat: [link] , [link] , [link] , [link] , [link]
-
Petykemano
veterán
Az eddigi tapasztalatok alapján nagyon egyszerű: a játékokban nem fognak megjelenni ezek a funkciók, amíg az nvidia készülékeknek ezt emulálni kell és az emuláció költséges.
Badumm tsssMerthát miért akarna a fejlesztő rosszat a felhasználók többségének?
És az nvidia vígan veri...Majd amikor megjelenik a támogatás a chipben, a játékokban is bekerül és aztán meg úgy veri.
Egyébként ez nem jelentő azt, hogy a gcn rossz, és az nvidia arch a tuti. Lehetne fordítva is, ha gcn lenne a többségi kártya és arra optimalizálnánáak. Ez legalább annyit számít.
-
Abu85
HÁZIGAZDA
válasz
stratova
#29733
üzenetére
A WaveBallot nem annyira kellemetlen. Azt csak azért szokás felhozni, mert például a SPIR-V-ben meg van oldva normálisan, míg a DXIL-ben rá van szabva az AMD-re, miközben a Microsoft elvileg független ebből a szempontból.
A WavePrefixSum kellemetlenebb. Az egy órajel vs. sok órajel az emuláció miatt. Az így sokszor gyorsabb, kérdés, hogy sikerül az emulációt megoldani gyártóknak. Ezt az AMD-nek is meg kell csinálni, mert GCN1/2-ben nincs külön utasítás.
A GlobalOrderedCountIncrement az rémálom lesz. Arra annyira rá kell gyúrni a hardvert, hogy az emuláció egyenlő a használhatatlansággal. Ennek az a titka, hogy a multiprocesszorokon belül legyen utasítás-előbetöltés, illetve egy belső szupergyors tároló a szinkronizálásra. Az utasítás-előbetöltés azért kell, mert a multiprocesszor egy wave-re lesz kényszerítve, tehát nagyon gyors szálszintű teljesítmény kell, míg a tárolóra azért van szükség, hogy ne kelljen egy csomó késleltetéssel számolni a szinkronizációnál. Ez egy eléggé GCN4-re szabott dolog így.
A barycentric nem akkora para a technikai oldalról. Ott az lesz a baj, hogy például az NV eleve nagyon sokat spórol az LDS-sel, és egy eleve minimum működésre szabott tárolóból még le kell szippantani a kapacitásának harmadát vagy negyedét, mert valahol tárolni kell a koordinátákat. Az Intelnél van bőven kapacitás, de annyira magas az L3 késleltetése, hogy az fájni fog ennél a műveletnél. -
stratova
veterán
Az összteljesítmény szempontjából milyen mértékű lassulással kell számolni ott, ahol emulálni kell az általad írtakat. Vagy megfordítva, mekkora gyorsulást eredményez ez az érintett GCN kártyákon? Illetve mely játékok PC-s portja épít ezekre (azon túl, hogy általánosságban most AMD partnere Besheda)?
-
Abu85
HÁZIGAZDA
válasz
Yutani
#29727
üzenetére
Beáldozni beáldozhatja, csak most pont nem lenne logika benne, amikor ezekre épül a shader model 6.0 és 6.1. Nyilván nem mindegy, hogy az új wave intrinsics függvényeket emulálják, vagy hardveresen van rá utasítás, illetve támogatás.
Az SM6.0 aktuális állapota alapján a WaveBallot, a WavePrefixSum, a GlobalOrderedCountIncrement eléggé GCN-re van szabva. Ezeket mindenképpen emulálni kell a többi architektúrán. A WaveBallot esetében az a baj, hogy 64 bites unsigned integer bitmaskkal tér vissza, és 64 bites skalárregisztere csak a GCN-nek van, tehát a többi architektúrán ezt le kell emulálni, hogy a hardver által kezelt regiszterhez igazodjon a működése. A WavePrefixSum-ra van egy konkrét utasítás a GCN3-tól, míg a többi architektúrán ezt is emulálni kell. A GlobalOrderedCountIncrement függvényre pedig konkrét hardverdizájn van kialakítva a GCN-ben a multiprocesszorok közötti szinkronizálásra, míg a többi architektúránál a VRAM-ot vagy jobb esetben az utolsó szintű gyorsítótárat kell használni ehhez.
Az SM6.1-nél a barycentric bevezetése abból a szempontból problémás lesz, hogy a GCN eleve úgy van tervezve, hogy az LDS a barycentric koordinátákat tárolja. A többi hardveren ez megoldható, de nem így tervezték őket, az NV-nél eleve nagyon kicsi az LDS a multiprocesszorokhoz mérve, míg az Intel erre a célra a nagyon lassú L3-at használja.
Most ezt nincs értelme leváltani, mert pont az a lényege a Microsoft új shader nyelvének, hogy amit megírnak konzolra azt csak copy-paste formában hozzák PC-re.A SPIR-V egyébként sokkal jobban kialakított IR, mint a DXIL. Nem igazán kedvez egyik architektúrának sem, de persze a Microsoft is érthető. Nekik bőven jó, ha a konzol specifikációk élnek PC-n is. Majd az IHV igazodik hozzá.
-
#45185024
törölt tag
válasz
TTomax
#29722
üzenetére
"az AMD egy gpuval akar lefedni minden piacot."
Igen ezt én is így érzem...
Amúgy szerintem nem azért nem volt 490 590 mert hogy a fogyasztás jujj nem birták volna megcsinálni 2800 shaderrel
Hanem egyszerűen azért mert a módosított 480 ment a Pro-kba és ha van 490 akkor a sérült lett volna a 480
annyi sérült meg nem lett volna amennyi kell
)
Amúgy találtam a TitánX-eidnek házat
tweaktown is lehozta ezt a customos történetet
AIB custom Radeon RX Vega to ship in early August
The new rumors point to AIB partners shipping custom Radeon RX Vega graphics cards in early August, with AMD set to launch at least two RX Vega graphics cards at first.
Ami jelentheti hogy a ép és sérült is kap egy customot meg at s hogy a vezes mellé kijön a kis vega is customba
és ezt a mondatot le szeretném fordítani mert eszméletlen jó
"az elkövetkező 6 hét lesz egy csodálatos utazás. "
és Ti a szerencsések itt töltitek velünk ezt a csodálatos hat hetet amiben minden titokra fény derül

-
HSM
félisten
válasz
TTomax
#29725
üzenetére
Ez sajnos elkerülhetetlen, mivel eléggé különböző a két cég architektúráink felépítése, következésképpen egyik ebben lesz jó, a másik abban. Eredmény: "hullámzó teljesítmény".
A kérdés az, mennyire lesz jó abban, ami fekszik neki, illetve mennyire fog "szenvedni" abban, ami annyira nem. Plusz ugye a piaci részesedés, Nv-re kénytelen lesz a fejlesztő optimalizálni, plusz kérdés, bekerülhet-e egyáltalán olyan opció, ami alatt az kifeküdne, és mondjuk a Vegán meg szárnyalna... Szval eléggé összetett a kérdés. -
TTomax
félisten
Igen,csak ezzel az a baj,hogy egy hullámzó teljesítményt ad.Értsd ahol éppen fekszik neki ott szárnyal,ahol meg nem ott meg szenved,és abban ismét biztatunk hogy a túloldal mindent el fog követni hogy az utóbbi váljon valóra.Gamer kártya kellene nem gamernek álcázott proff...
-
HSM
félisten
válasz
TTomax
#29723
üzenetére
Teljesen jogos észrevétel.

A képlet egyszerű. A Maxwell vonalas energiahatékonyságnak ára van. Ha az AMD a belső felépítésbeli előnyös tulajdonságait ki fogja használni a kód, akkor máris lehetnek energiahatékonyabbak is, mert a sebesség kompenzálhatja a fogyasztást. Ha nem, akkor meg nem nekik lesz a leggyorsabb a kártyájuk. -
TTomax
félisten
válasz
#45997568
#29718
üzenetére
És azt is tudjuk,hogy ez engem mennyire érdekel,pont annyira mint téged.
Elárulok neked egy titkot az FE az 1:1 ben RX lesz -8GB VRAM.Hatalmas nagy játékokra nem igazán lesz lehetőség ha csak te azt nem annak értékeled hogy a feszt visszaveszik meg az órajelet.Gyanítom a legerősebb RX ismét csak AIO-s lesz,mint a Fijinél,nem hinném hogy lesz belőle custom.Ez mind annak a következménye,hogy az AMD egy gpuval akar lefedni minden piacot.
-
Dtomka
veterán
válasz
#45997568
#29718
üzenetére
Ha nem nagy kérés akkor tudnál, úgy írni, hogy ékezeteket is használsz? Biztosan csak engem zavar
(gyartyak --> gyártják)
No offense!"lassan szivarogni fognak a reszletek."
Eddig is így volt, most már gyorsulhatna az infóáramlás. Mert még a végtelenül türelmes embereknek is elfogy... -
HSM
félisten
válasz
Petykemano
#29719
üzenetére
Kérdés, hogy akar-e az AMD Maxwell-szerű architektúrát. Ha van egy kis eszük, akkor nem most fogják sutba dobni a saját konstrukciójuk előnyös tulajdonságait.

Persze, ennek könnyen lehet az az ára, hogy perf/watt-ban nem lesznek olyan jók, de szerintem nem is ott kéne kimaxolni a dolgokat. Legyenek ők a leggyorsabbak, máris menni fog a bolt.
-
Petykemano
veterán
válasz
Raymond
#29713
üzenetére
Ez a legpesszimistább becslése az ismeretlen tényezőknek, ami azt feltételeti, hogy az amd képtelen a 3 éve piacon lévő maxwell előnyős fogyasztását adó jellegzetességeket és az órajellel való skálázódást megépíteni. Pedig több jel is mutat arra, hogy a gfx9 jobban különbözik majd elődeitől, mint a gfx8.1 különbözött a gfx8-tól.
-
#45997568
törölt tag
válasz
TTomax
#29699
üzenetére
Azert azt tudjuk mennyire adok a velemenyedre

Az FE fogyasztasa az egy dolog, az RX-eke alakulhat egeszen maskeppen is fuggoen a PCB-tol illetve mennyi feature lesz engedelyezve, orajelek...
Ha ugyanaz lenne akkor nehezen lehetne ertelmezni az FE megoldast mint prof kartya. Meg par het es kiderul, mar gyartyak a partnerek a kartyakat, lassan szivarogni fognak a reszletek.
-
Raymond
titán
válasz
Malibutomi
#29715
üzenetére
Nem kopkod senki, egyszeruen az elvarhato tulajdonsagokrol van szo. Persze fan szemszogbol mashogy nez ki mert nem eppen idealis a helyzet a 300W es 375W-al, de ez van.
Egyebkent az hogy az AMD-s kartyaidban volt 20% nem jelent itt semmit ket okbol - az egyetlen eddigi HBM-es nem nem volt es az eddigi Polaris-oknal sincs a Vega-nal pedig minden osszejon ezek kozul. Persze lehet itt almodozni, csak szerintem tobb ertelme lenne az ismert tenyek szerint beloni az elvarasokat mert aztan csak a magyarazas marad megint. Jo lenne ha kijon a Vega 1600Mhz-el es meg lenne benne 20% tuning? Perszehogy jo lenne, csak ez nagyon-nagyon valoszinutlen.
Es meg mindig itt van az amirol a multkor szinten volt szo - a teljesitmeny. Az hogy 300W meg OK, ha a megfelelo teljesitmeny is jon vele, es itt arrol van szo hogy a custom tulfeszitett GF1080-ak 220-230W mellett hozott teljesitmenyet azert illene szepen tulszarnyalni. Eddig se compute-ban voltak elmaradva de ugy nez abban amiben igen nem huztak tulsagosan bele a 90GPix/s spec-bol itelve - a GF1070 tobbet hoz itt a maga 120GPix/s teljesitmenyevel, meg az alacsony orajelu FE is 100 folott van, nem beszelve a GF1080 es GF1080Ti teljesitmenyerol.
-
stratova
veterán
válasz
#85552128
#29709
üzenetére
Szerintem attól függ hogyan profilozzák, a max board TDP ezzel a lendülettel Fury X-en 400+ (lásd Furmark) de barátok közt is 375 W ezzel szemben a peak 280 W ami közel áll az AMD által megadott 275 W Typical Board Power-hez.
Ugyanez a lapka, más profilozással és értelemszerűen más órajellel R9 Nano-ként 191-209 W-ot kér 1x8 pinnel. -
Malibutomi
nagyúr
válasz
Raymond
#29713
üzenetére
Nem bizom semmiben, csak megvarom mit mutat valos, nem kopkodok elore mint egyesek.
A 300W meg elmegy a csucskartyanal, Az hogy 275 vagy 300 mar doszt mindegy.Aa vizes 375W meg nyilvan csak annyit jelent hogy annal a TDP limit ki van love a viz miatt, mehet ameddig mehet, melegedes nem gond.
Az orajelet majd meglatjuk, vegulis 12.5TFLOPS-al indult ha jol emlekszem aztan lett 13, vegul mar 13.5.
Szoval akarmi lehet, lehet jo AMD szokas szerint a vegletekig huzzak, bar nekem szinte minden AMD kartyamban volt ~20%. Fury nem volt, de 290X-bol volt haromfele is es mind ment, pedig arra is azt volt mondva hogy nem huzhatok. Persze lehet szerencses vagyok. -
Raymond
titán
válasz
Malibutomi
#29711
üzenetére
Meg mindig az ilyenekben bizol?
A multkori diskurank ota van uj info - 300W es 375W board power es FE-n. Nagy vonalakban:RX580 -> Vega = 2304 -> 4096 = +78% = 185W -> 329W
329W minusz a VRAM sporolas minusz meg amit egy kis csiszolassal sporolsz a gyartasnal es ott vagy a 300W-nel vagy epp a 375W-nal mert meg kell neki nyomni hogy az a 13GFlops meglegyen barmi aron igy meg talan +50Mhz-ert is az egekig tekerik a feszt es a fogyasztast.
-
#35434496
törölt tag
Julisuban jön a 1080 Ti ellen valami VEGA?
-
do3om
addikt
válasz
Malibutomi
#29705
üzenetére
Az biztos hogy az a marketinganyagot nem én csináltam!
Nem illik az AMD anyag az AMD topikba, ok akkor töröld

-
TTomax
félisten
válasz
velizare
#29700
üzenetére
Igen,és 250Wnak kellene lennie... és még mielőtt,nem nem az a +25W a gond a Fijihez,vagy +50W a nagy pascalhoz képest,hanem az irány a gond...
(#29702) stratova
Komoly hiba így összehasonlítgatni,mert nem lehet...le lehet venni a fogyasztást bőven,csak nem lesz meg az órajel,nekem ez brute force szagu,és könnyen lehet hogy Fiji lesz ebből is,ahol mindent ki kellett tekerni,de legalább most nem szólnak hírek arról hogy OC dream...Na mindegy nemsokára lesznek tesztek is,még bö egy hét. -
stratova
veterán
válasz
TTomax
#29699
üzenetére
Azért irtam garantált 1600-at mert a linkelt kártyáknál innen indul a móka. Bár sajnos Anandtech csak FE-t tesztelt, még ott is 1600+on tekert 1080 Ti játékok alatt. Sajnos nem tudnék akár csak hasonló szellemben gyártott AMD NV kártyákat egymás mellé állítani a közelmúltból.
Csak vegyük észre, ha egy 3584 ALU-s Pascal képes 1600-2000 MHz tartományban 300+ W-ot szippantani, akkor miért meglepő egy 375 W-os 4096 ALU-s Vega 1600-as (tfh turbó) órajellel, egy bevallottan nem maximum órajelre kihegyezett dizájnnál?
Nem szerencsés ha valóban ennyit eszik, de szerintem messze nem meglepő. -
füles_
őstag
Amúgy is miért fogyasztana ilyen sokat, ha a Vega 10 specifikációi kvázi teljesen megegyeznek a Fiji (275W) specifikációival. A HBCC vagy a túl magas órajel végett? Mert a 14 nm-es gyártástechnológiával csökken a fogyasztás (maga a die is kisebb), a DSBR (nem fogom folyton kiírni, mert hosszú
) szintén csökkenti a fogyasztást.
Új hozzászólás Aktív témák
A topikban az OFF és minden egyéb, nem a témához kapcsolódó hozzászólás gyártása TILOS!
MIELŐTT LINKELNÉL VAGY KÉRDEZNÉL, MINDIG OLVASS KICSIT VISSZA!!
A topik témája:
Az AMD éppen érkező, vagy jövőbeni új grafikus processzorainak kivesézése, lehetőleg minél inkább szakmai keretek között maradva. Architektúra, esélylatolgatás, érdekességek, spekulációk, stb.
- OTP Bank topic
- Folyószámla, bankszámla, bankváltás, külföldi kártyahasználat
- Motorola G86 - majdnem Edge
- Milyen videókártyát?
- Tőzsde és gazdaság
- AMD K6-III, és minden ami RETRO - Oldschool tuning
- Spórolós topik
- Google Pixel 9 Pro XL - hét szűk esztendő
- eGPU tapasztalatok
- Sorozatok
- További aktív témák...
- Honor 200 Lite 256GB, Kártyafüggetlen, 1 Év Garanciával
- AKCIÓ!!! HP ZBook Power 15 G8 Mobile Workstation i7-11850H 32GB 1000GB Nvidia RTX A2000
- iPhone 15 Pro Max 256GB Blue Titanium -1 ÉV GARANCIA -Kártyafüggetlen, MS4242, 100% Akksi
- ÁRGARANCIA!Épített KomPhone i5 14400F 32/64GB RAM RX 9060 XT 8GB GAMER PC termékbeszámítással
- Lenovo T450s notebookok - 14", i5-i7, 4-12GB RAM, eu vil.bill, számla, gar
Állásajánlatok
Cég: Laptopszaki Kft.
Város: Budapest
Cég: PCMENTOR SZERVIZ KFT.
Város: Budapest

![;]](http://cdn.rios.hu/dl/s/v1.gif)


gyorsabb. itt kb. 945MHz-ra jön ki a memóriabusz sebessége.

Hogy ezt minden egyes ilyen kartyanal be kell irni attol fuggetlenul melyik gyartotol van:



)



