- Ennyibe kerülnek a Huawei Pura modellek Európában
- Magisk
- Motorola Edge 40 - jó bőr
- Nothing Phone 2a - semmi nem drága
- Képeken az egyik kameráját elvesztő Sony Xperia 10 VI
- Mindent megtudtunk az új Nokia 3210-ről
- Fotók, videók mobillal
- Android szakmai topik
- Motorola Edge 30 Neo - wake up, Jr...
- iPhone topik
Hirdetés
-
Spyra: akkus, nagynyomású, automata vízipuska
lo Type-C port, egy töltéssel 2200 lövés, több, mint 2 kg-os súly, automata víz felszívás... Start the epic! :)
-
Sokat fogyaszt az AI, egyre több az adatközpont, kell az atomenergia
it Az AI-t kiszolgáló adatközpontok olyan nagy energiaigénnyel bírnak, hogy egyre több atomenergiára van szükség.
-
Ilyen lesz a SteamWorld Heist II
gp A folytatás a tervek szerint a nyár folyamán, pontosabban augusztus elején érkezik.
Új hozzászólás Aktív témák
-
Kansas
addikt
Ez most akkor hogy is van?
Azt eddig is tudtuk, hogy AMD nem használ DL-t az FSR/RSR- hez, de hogy a DLSS-hez se kell, az új - illetve mintha rémlene egy cikk amit olvastam arról, hogy ez a DLSS 2 megjelenésével némelyest változott, de egyszer olvastam és azóta se tslálom...
Illetve én eddig úgy tudtam, erre valók a Tensor core-ok... vagy ez sem így van, és az NV pusztán üzletpolitikai szempontok alapján köti a DLSS-t az RTX GPU-khoz?[ Szerkesztve ]
Nincs olyan MI, ami képes lenne szimulálni az emberi hülyeséget... ha valaha lesz, annak tuti az emberi hülyeség lesz az oka... A Föld erőforrásai közül a legjobban az ész van elosztva - mindenki meg van róla győződve, hogy több jutott neki, mint másoknak.
-
Pikari
őstag
Szituáció: Hiányzik egy random hárombetűs technológia, amiről országonként 10 ember tud.
Következmény: 5 ezer emberből egy észreveszi, hogy nem elég részletes valahol a kavics széle.
Sajtó: Pánikol a világ.
A Dunning−Kruger-hatás az a pszichológiai jelenség, amikor korlátozott tudású, kompetenciájú vagy képességű emberek rendkívül hozzáértőnek tartják magukat valamiben, amiben nyilvánvalóan nem azok.
-
Egon
nagyúr
Komoly pánik van, bizony: a saját szememmel láttam, hogy a plázákban, munkahelyeken, hivatalokban, utcákon-tereken, mindenki fel-alá rohangál, és azt kiabálja: "NemleszDLA-áááá-mindmegdöglünk-áááááááááááá!!!".
Beindult a szokásos verkli. 1-2 órán vagy napon belül jön majd valami AMD-fényező hír.
"Bonyolult kérdésre egyszerű választ keresni helyénvaló, de ritkán célravezető megoldás" (Wayne Chapman)
-
Abu85
HÁZIGAZDA
Nem arról van szó, hogy nem használ a DLSS neuronhálót, hanem a teljes futószalagnak egyetlen, nagyjából a teljes munkafolyamat 3-4%-át kitevő részén használják csak. Egyszerűen máshol nincs értelme, mert nem ad még jobb eredményt a hagyományos algoritmusoknál. Szóval egy DLA-val eleve nem tudna mit kezdeni a DLSS. Nem úgy van megírva az elérhető kód, hogy használni tudjon egy ilyen hardveres részegységet. Emiatt teljesen lényegtelen, hogy lesz-e az új Switch-ben DLA. Ez például az autóiparban hasznos, mert ott tudod hasznosítani a tudását, de játékosoknak még teljesen mindegy, hogy van-e ilyen részegységük.
A Tensor igazából nem szükséges a DLSS-hez sem. Volt is olyan verziója a rendszernek, ami hozzá sem nyúlt a Tensor magokhoz. Ez azért van, mert a Tensor és a normál feldolgozók ugyanazokat a regisztereket érik el, tehát nem igazán tudnak egymás mellett működni, mert csúnyán felemészti a regiszternyomást a két résegység aktivitása. És ez az oka annak, amiért a játékok nem igazán nyúlnak a Tensor magokhoz. Egyszerűen kell a regiszter a normál shaderekhez, és nem engedhetik meg azt, hogy a regisztereket elvegyék a tensorok, mert akkor meg az adatelérés késleltetése fogja a teljesítményt felemészteni. A DLSS is főleg ezért alkalmaz csak egy helyen neuronhálót, mert egyszerűen sokkal lassabb lenne, ha több helyen alkalmazná, miközben nem is lenne jobb a képminőség.
[ Szerkesztve ]
Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
-
paljani
aktív tag
Ugyan használva vannak a Tensor magok DLSS (FG) alatt, de valójában NEM kellenének annak a működéshez. Ráadásul emberünk még azt is kiméricskélte, hogy mekkora (százalékos) perf.impactja van ha nincsenek használva (FSR és XeSS alatt).
Itt vannak az eredmények meg az adatsorok: link
Helyesebben az állítás így hangzik tehát: Tehat
nemCSAK uzletpolitikai szempontok alapjan koti a DLSS-t RTX-hez. -
Abu85
HÁZIGAZDA
FG alatt nincsenek. A Tensor magok csupán akkor vannak használva, amikor a DLSS eldönti, hogy miképp kombinálja a korábbi képkockáról származó előzménymintákat. Ennyi. Ez a teljes munkamenet egy egészen kicsike része.
Képgenerálás alatt az OFA van használva, ami megint egy külön hardveres részegység, itt azért lehet nagyobb a mért Tensor terhelés, mert azon keresztül megy némi adatkommunikáció, de valós számítást maga az OFA végez.
A kritikus komponensei a DLSS-nek valóban nem igényelnek tensor magokat, nem is szükséges hozzá neuronháló.
[ Szerkesztve ]
Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
-
-
paljani
aktív tag
Mire alapozod a "sokkal lassabban" kijelentésed? Ex-has(ra ütéssel)?
Emberünk 2% körüli "teljesítményvesztést" mért FSR-re (DLSS 50% vs FSR 52%) computeban, ami 50 framenként kemény 1 darab frame. Ez a sokkal lassabb??? Ráadásul a régebbi kártyákon (amiken nincs tensor mag) álom az 50 FPS, hogy észre lehessen venni a különbséget.
Az a rossz user experience, amikor valamit (valamilyen sebességgel)tudna a vasad, de üzletpolitikai okokból letiltják a f*szba...
-
Abu85
HÁZIGAZDA
A lapkában van benne. De nem hiszem, hogy az NV jelöli, hogy hol. Eleve a kiadott lapkakép is nagyon erősen photoshoppolt.
De az OFA az tényleg létezik, és az Ampere óta ott van a lapkán, csak az Ada kapott egy erősebb hardverelemet. Viszont ettől még a képgeneráláshoz ez sem szükséges, csak az NV csinálja így. Valójában a képgenerálás megoldható tisztán SIMD-ből is. Sőt, az utóbbi időben felmerült, hogy OFA nélkül még jobb is lenne a működése.
[ Szerkesztve ]
Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
-
Busterftw
veterán
Lattam a tesztet, de itt a tensor coret teszteli, arrol kellene osszehasonlitas, hogy nem tensor magon hanem "siman" hogy fut a rendszer.
Pontosan erre alapozom a kijelentesem, hogy a dedikalt hardveres gyorsitas gyorsabb, mint a nem dedikalt. Ez a tesztbol nem derul ki.Illetve utana o is mondja a kovetkezot, korrekciokent:
"it became clear that the tensor cores were averaging low numbers, but were actually just completing the upscale very quickly, then sitting idle. When looking at dlss balanced with a much higher pollling interval, it actually hits a peak usage of 90%."
Aztan a kommentekbol:
"tl;dr tensor Cores are substantially more efficient at the task than General Compute processing, allowing plenty of headroom for substantially better quality results over the competition." -
paljani
aktív tag
válasz Busterftw #12 üzenetére
Nem, te NEM azt írtad, hogy a hardveres gyorsítás gyorsabb, hanem azt, hogy a nem hardveres implementáció SOKKAL lassabb.
Ne tekergesd utólag, főleg, hogy kerek-perec visszaolvasható..1. Az FSR NEM használ tensort, tehát ő (meg az intel féle is) computeból végzi el ugyanazt, amit az nvidia tensorral. Így szépen lehet látni, mekkora overhead ha nem tensor hanem compute a megoldás. Hát a jelek szerint nem sok…
2. Amit elsőre bekopiztál az semmit nem mond (és főleg téged sehol se támaszt alá semmiben) csak azt, hogy tensor magok terhelését hogyan lehet értelmezni ill. növelni. Ettől még nem fognak kelleni…
3. A második kopi egyrészt a hatékonyságról szól másrészt meg nettó nvidia felszopás (a hatékonyság nem feltétlen jelent gyorsabbat…) és mint olyan értelmezhetetlen számomra. Eddig sem a - felskálázási - minőségről volt szó, hanem arról hogy valóban kellenek-e a tensor magok. Ne tereljél össze-vissza!
-
paljani
aktív tag
Értem, hogy “létezik” az OFA csak azt nem értem, hogy miért van “eldugva” a vas hozzá. Mindenhol a neten. Tekintve az nvidia marketingtevékenységét az elmúlt huszonpár évből minimum gyanús, hogy nincs/nem volt mindenhol az arcába tolva a vas része marketinganyagokban a - hozzám hasonló - átlagparasztoknak.
Őszintén nem lepődnék meg, ha előbb-utóbb kiderülne, hogy a dedikált vas az inkább csak dedikált erőforrás valamelyik vasból, de bizonyosan tévedek.
-
És akkor most mi is az a DLA?
Automata váltósként a legjobb barátom az akkumulátor.
-
Busterftw
veterán
Nem ezt irtam, azt irtam, hogy a normal, nem dedikalt (nem Tensor) hardveren ugyan fut, de lassabb.
Ezt irtam:Tehat Tensor core-n gyorsabban futnak, mintha nem Tensor coren futna.
Ettol fuggetlenul mindketto hardveres implentacio.1."Az FSR NEM használ tensort, (meg az intel féle is) computeból végzi el ugyanazt"
Ugyanazt nem vegzi el, mert a DLSS mashogy mukodik es mas eredmenyt/minoseget ad.
Amugy meg Intel GPU-kon is van dedikalt AI magok.
A vita szempontjabol teljesen irrelavans, hogy az FSR hogy fut.
Azt kellene itt bemutatni, hogy a DLSS normal compute magokon, Tensor core nelkul milyen sebesseggel fut."2. Amit elsőre bekopiztál az semmit nem mond"
De pontosan mindent elmond, hiszen a dedikalt Tensore core magas terheles utan hamar vegez, hiszen pont ez a leyege, a felskalazas es az algoritmus gyorsan fusson le, maskulonben tankol az FPS."Eddig sem a - felskálázási - minőségről volt szó, hanem arról hogy valóban kellenek-e a tensor magok. Ne tereljél össze-vissza!"
Nem terelek, a hatekonysagbol adodik itt minden. A dedikelt Tensor magok gyorsabban es hatekonyabban vegzik el a muveletet, novelve a teljesitmenyt es csokkentve a latencyt. -
Abu85
HÁZIGAZDA
Ilyen dedikált AI gyorsító, ami van a "Tegra" rendszerchipekben. Az autoiparban hasznos.
#14 paljani : Az OFA az tényleg benne van a lapkában. De mint mindig az efféle fixfunkciós hardverelemeknek a hátránya a bedrótozottság. Egyszerűen nem tudsz vele mit tenni, ha nem elég jók a képességei. Emiatt képgeneráláshoz hosszabb távon valószínűleg jobb lesz a SIMD, mert az programozható.
#16 Busterftw : Az Intelnél az XeSS is csak a korábbi képkockáról származó előzménymintákkal kapcsolatban használja a neuronhálót. Egyszerűen máshova nincs haszna, vagy ha van, akkor annyira rossz a GPU-k statikus erőforrás-allokációra vonatkozó dizájnja ilyen szempontból, hogy nem éri meg a dedikált részegységeket erre áldozni annak az árán, hogy megnő az adatelérés késleltetése, vagyis összességében lassul az egész feldolgozás. A neuronhálók alkalmazásának akkor lesz nagyobb haszna, ha a dedikált részegységek is saját regiszterterületet kapnak.
[ Szerkesztve ]
Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
-
félisten
Erre példa amúgy az RTX Voice is amúgy, ahol a GTX kártyákon 10-25 % körüli teljesítményvesztést is okozott néha,de 10-15 % alap volt.
[link]
A tensor magokat a DLSS nél finomításhoz haszálják és akár kiegészíti az OFA működését.
Az alapból már letréningelt hálót haszálva felsimer bizonyos mintázatokat a következő képgeneráláshoz. Elméletileg pl a Framegeneration nem használ minden képkockánál mozgásvektorokat, ( ha egyáltalán használ) az OFA működésére alapul amit kiegészít a tensor mintázat felismerési funkcióval. Pont az általad mutatott teszt világít rá erre minél több FPS-t generál a felskálázó annál jobban hazsnálja a tensor magokat az előzmény képkockák vizsgálatához.
Ha jól tudom a VSR meg csak tensor alapú.
A fő érdekesség az lenne hogy megvizsgáljuk a hibák számát és a képminőséget, mert valószínűleg abban játszik szerepet és ennek nem feltétlenül kell látszódnia a z FPS számban.
A DLSS a három eljárás közül a legjobb minőség.[ Szerkesztve ]
"A számítógépek hasznavehetetlenek. Csak válaszokat tudnak adni." (Pablo Picasso) "Never underrate your Jensen." (kopite7kimi)
-
-
félisten
Azért nézd meg mit írnak a tesztedben.
Nem cáfoltad meg azt amit írt Busterftw.
Az egy RTX 4090 kártya.
Sokkal fejlettebb tensormagokkal és hatalmas számítási teljesítménnyel
Egyételműen látszik, hogy a DLSS nagyon is a tensor magokra alapozezt írjáka konlúzióban is a tesztedben. Tehát ha a DLSS nem tensor alapú kártyákon menne még mindíg nem tudod megmondani azt hogy mit mutatna.
"
Correction: when bringing the resolution of the report way, way up it became clear that the tensor cores were averaging low numbers, but were actually just completing the upscale very quickly, then sitting idle. When looking at dlss balanced with a much higher pollling interval, it actually hits a peak usage of 90%. That said, the upscaling process takes ~100-200 microseconds, averaging around 20% usage. So the conclusion of overkill probably still stands, but at least it's using the performance."Do note this is on the 4090.
The older and slower rtx 20 cards will have more usage
Edit - Also the Fp8 part is wrong
The 20 series which supports dlss cant do FP8 or sparsity. So DLSS isnt using FP8 or sparsity.
It's likely using Int8 and not Floating Point. I believe Alex from DF also said Int8 is used for DLSS.
So the 4090 Int8 without sparsity is 660 TOPs
The 2070 was 119.4.
So assuming 4% on the 4090 is 26.4 tops
That would mean about 22% of tensor usage in the 2070. The 2060 or 3050 will have even more usage.
Again these are estimates. But even in these its a pretty good usage
[ Szerkesztve ]
"A számítógépek hasznavehetetlenek. Csak válaszokat tudnak adni." (Pablo Picasso) "Never underrate your Jensen." (kopite7kimi)
-
paljani
aktív tag
Továbbra is úgy vagyok ezzel mint a Yetivel, ráadásul az Nvidia is csak ennyit mond:
“NVIDIA® GPUs, starting with the NVIDIA Turing™ generation, contain a hardware accelerator for computing optical flow and stereo disparity between frames (referred to as NVOFA in this document), which works independently of graphics/NVIDIA CUDA® cores. With end-to-end optical flow calculation offloaded to NVOFA, the graphics/CUDA cores and the CPU are free for other operations.”.Tehát nem CUDA és nem CPU. És ennyi. Yeti.
-
paljani
aktív tag
+Raymond
Te se vetted, mi? Pedig leírtam már. Na de akkor fussunk neki nocheinmal: DLSS-es úgy van megírva, hogy használja a tensorokat az FSR meg nem. Ezeket lehet összehasonlítani nyilván nem alma-alma, de maximum ennyit lehet tenni, legalább a vas ugyanaz. Felteszem, ha az AMD meg tudta csinálni minimal overhead mellett akkor az Nvidianak is menne.. de nem megy. Ehelyett inkább tiltják.
(Amúgy a tensor mag kihasználtság amit példának hoztál (22% a 2070-esnél még mindig azt jelenti, hogy 78% szabad szóval miért is tiltott rajtuk az FG?!? Értem én, hogy mehet feljebb de ahhoz meg teljesítmény kéne ami meg a 2070-esben nincs. Szóval na…)
[ Szerkesztve ]
-
Busterftw
veterán
Igen, sokkal lassabb.
"Ebbe áltam bele, mert a teszt amit találtam kemény 2% difit bírt kimérni."
A teszteden hol van az, hogy normál magokon milyen sebességgel és latencyvel fut a DLSS?
Nincsenek Ilyen mérések.
A linkelt tesztedben egy 4090-el mérte a DLSS-t, Tensor magokon.Már írtam, hogy az FSR nem ugyanaz mint a DLSS és egyáltalán nem működik. FSR 2.0 bezárólag biztosan nem használ AI-t/neurális hálót, FSR 3 framegennél nem tudom.
"78% szabad"
Igen a játékot magát meg majd a ventik futtatják a kártyán nem?
Amikor a legtöbb modern játék 95%+ loadon nyomatja a kártyákat.[ Szerkesztve ]
-
gabyka
aktív tag
A nagy világ-pánikra való tekintettel, vettünk pár karton lisztet, cukrot, wc-papírt, macskakaját, uborkakonzervet. Szerintem mi túléljük a világvégét...
Komolyan szükség van ezekre a címekre? -
Raymond
félisten
En nem vettem?? Te nem vagy kepes felfogni hogy azon a teszten nem latsz smmit abbol hogy hogyan fut a DLSS tensor nelkul mert nincsenek ott olyan adatok. Az hogy az FSR hogyan fut teljesen lenyegtelen mert a ketto nem ugyanaz!
Privat velemeny - keretik nem megkovezni...
-
félisten
Szerintem te nem fogod fel hogy ebből nem tudsz következetést levonni ,mert a tesztben nincs olyan, hogy egy tensor mag nélküli hardveren fusson a DLSS.
Tehát semmit nem tudsz vele megcáfolni és bizonyítani amit Buster állítot.Az világosan látszik a teszben hogy a csúcson 90% pillanatnyi kihasznátságot is elérnek a tensor magok DLSS hazsnálatával a készítő álítása, illetve korrekciós kiegészítése alapján .
1, A DLSS kifejezetten kihasználja tensor magokat
2, egy 4090 ben 3. generációs tensor magok vannak és az egyik legfejletteb kártya ebből a szemponból, tehát régebi generációkra hatványozottan igaz a kihasználtság megléte.
A kékockagenerálás fokozza a tensorok kihasználtságát, tehát amit Abu ír szintén igaz, hogy a képkockák közt z OFA segítségére van.
Az FSR behozása képletben teljesen ireleváns a vitátok alapjában, mert Buster azt írta hogy szerinte futtaható a DLSS tensor nélkül, csak sokkal lassabb lenne, ami pont általad linlelt teszt állításai alapján sokkal ésszerűbb megállapítás,még ha nem is tény, azzal kiegészítve a részemről, hogy vagy/ és roszabb lenne a minősége, nem feltétlenül a sebességre lenne hatással.
NVidia kártyákon meglévő hardverelemre van optimalizálva az a szoftver és annak hiánya erőforrást vonna el a kártyán vagy a működési minőségét befolyásolná .Az XeSS nek is van már ilyen Intel ARC-ra optmalizált változata ami kizárólag Intel kártyán fut. Azokban a tensor mag neve Xe Matrix Extension (XMX) AI és az arra optimalizált XeSS minősége közel DLSS minőségű .
Ha már behoztad az FSR-t ,az AMD megoldásának egyelőre a hátránya a Minősége a másik kettő, hardverhez kötöt verzióhoz, nem a sebessége, előnye az univerzális felhasználhatósága.
Nvidia nem hozott ilyen általános verziót, ebben igazad van.[ Szerkesztve ]
"A számítógépek hasznavehetetlenek. Csak válaszokat tudnak adni." (Pablo Picasso) "Never underrate your Jensen." (kopite7kimi)
-
Kansas
addikt
"Nvidia nem hozott ilyen általános verziót, ebben igazad van."
De, igazából hozott, a NIS(Nvidia Image Scaling) pont az az NVidia számára, mint az RSR az AMD-nek. Igaz, olyan szempontból nem általános, hogy más gyártó kártyáin is futna, lévén driver-alapú megoldás, cserébe fut elvileg minden NV kártyán.
NIS vs RSR teszt.[ Szerkesztve ]
Nincs olyan MI, ami képes lenne szimulálni az emberi hülyeséget... ha valaha lesz, annak tuti az emberi hülyeség lesz az oka... A Föld erőforrásai közül a legjobban az ész van elosztva - mindenki meg van róla győződve, hogy több jutott neki, mint másoknak.
-
paljani
aktív tag
Szerintem te nem fogod fel hogy ebből nem tudsz következetést levonni ,mert a tesztben nincs olyan, hogy egy tensor mag nélküli hardveren fusson a DLSS.
—- Dehogynem, van egy generic megoldás (FSR) meg eg HW-bound (DLSS) ugyanzt csinálják ugyanazon a vason. A körülményeket tekintve ennél közelebbi mérésre nincs lehetőség. Legfeljebb a lokál nvidia fanclubnak nem tetszik az eredmény (ez mondjuk tény).
Tehát semmit nem tudsz vele megcáfolni és bizonyítani amit Buster állítot.
—- Tegyük fel így van, ugyanezen logika mentén TI sem állíthattok semmit a “tensormentes” DLSS teljesítményére, lehet sokkal gyorsabb is lenne! Erős kijelentés mi? Bizonyítsd az ellenkezőjét ezen logika mentén… -
félisten
Más elven működik a 3 eljárás, tehát ugyan azt csinálják, ráadásul most már az alapok is hasonlóak a FSR 2.0 óta, de más elven és úton.
Pont azért linkeltem be neked az RTX Voicet ami Tensor alapú, fut tensort nem tartalmazó hardveren,de az általános teljesítmény 10-20 % részét lemarta a tensor mag hiánya egy GTX kártyán, ami amúgy raszterben hasonló vagy gyorsabb mint az RTX társa.
Mivel a DLSS ezen verziója ezekre a hardeverkre van írva , ML eljárást alkalmaznak a tökéletes futattáshoz, ezért ha sebességvesztést nem is tapasztalsz feltétlenül, ( amúgy szerintem igen)de jobb minőséget kaphatsz.
Tehát nem csak egy dimenzióban érdeme s gondokodni. Erről szól a DF Resident Evil tesztje [link] ahol a DLSS-t modderek ültették be a játékba 1-2 napos munkával. ÉN azt gondolom a DLSS nem tud futni a tensor magok megkerülése nélkül,csak ha driveresen felkészítik az eljárást rá,de az ugye nincs. Pc-n,Miért is lenne, ha ott a tensor mag már 3 generáció óta. -hogy ML alapú helyett mondjuk DP4a vagy akár anélküli legyen, mint az FSR. Egyszerűen maga a DLSS eljárás így van megírva.
A Switchen megolják majd,hogy ne kelljen hozzá,de szerintem az egy FSR szintet fog hozni finamikus felskalazaskent.
Ettől függetlenül az FSR elfogadható munkát végez varázslatok nélkül is és a DLSS is biztos megoldható lenne tensor nélkül is, ha akarná az Nvidia csak kérdés lenne e ára,mert az Intel se véletlenül használ 2 féle eljárást a minőség miatt.9[ Szerkesztve ]
"A számítógépek hasznavehetetlenek. Csak válaszokat tudnak adni." (Pablo Picasso) "Never underrate your Jensen." (kopite7kimi)
-
SindaNarmo
tag
Csak a sebességben kellene hogy különbség legyen, ha nem akkor vagy elrontották a köztes réteget vagy csináltak olyan sebesség optimalizációt ami ront a minőségen.
Pl eddig még nem találtam olyan tesztet ahol az xess-t hasonlítják össze önmagával (van hardveres gyorsítás vs nincs).
-
Busterftw
veterán
" Atyaég… Végig a tensorok loadjáról volt szó"
Igen, te meg arrol beszelsz, hogy "normal" magokon hogy futna a DLSS nem?
Nem ezt kifogasolod? Ott szerinted mihez adodna a DLSS load, ha nincs Tensor core?Mi meg pont ezt mondjuk, hogy ha nincs dedikalt gyorsito (tensor core) akkor "normal" magokon sokkal lassabban fut, ezert nincs.
[ Szerkesztve ]
-
paljani
aktív tag
Kolléga! Értelek és még abban is egyetértek nagyrészt amit leírtál.
(N+1. Alkalommal leírva) Abba álltam bele, hogy a másik kolléga szerint egy tensor mentes DLSS SOKKAL lassabb lenne, ami szerintem továbbra sem igaz (lásd FSR tesztek ugyanazon a vason ill. elfogadva, hogy minősége nem teljesen lenne ugyanolyan - de még így is egy választható kompromisszum lenne-lehetne a régebbi kártyák birtokosainak). Egyszerűen a patkány nvidia patkány módon lockol bizonyos funkciókat amiknek nem HW-es korlátai vannak (?) VAGY nem kéne, hogy HW-es korlátai legyenek (bizonyos kompromisszumokkal ebben eddig sem vitatkoztam)! És ezt a hozzáállást védik itt egy páran… agyam eldobom! -
paljani
aktív tag
El van nézve, szemmel láthatólag ennyire futja neked szellemileg: ugyanazon a vason futtatott két felskálázó eljárásra azt írni, hogy nem UGYANAZT csinálják…
Neked két autó (mondjuk pl. egy dízel VW meg egy benzines KIA) sem UGYANAZT csinálja? Eljuttat A-ból B-be? Csak mert más van a motorháztető alatt?
(Személyeskedhetsz tovább, esélyesen te fogsz hamarabb megsértődni. Ha még nem tetted…) -
Raymond
félisten
"Neked két autó (mondjuk pl. egy dízel VW meg egy benzines KIA) sem UGYANAZT csinálja? Eljuttat A-ból B-be? Csak mert más van a motorháztető alatt? "
Na, talan igy most megerted:
Abbol hogy leteszteled hogy a KIA-val 5 liter benzin kellett hogy eljuss A-bol B-be, abbol te megmondod hogy a VW-nek ugyanahhoz mennyi dizel kellett?
Privat velemeny - keretik nem megkovezni...
-
Busterftw
veterán
Tehat nem ugyanugy mukodnek.
"lásd FSR tesztek ugyanazon a vason"
Az FSR nem DLSS es a teszteden nincs semmi adat arrol, hogy a DLSS hogy fut normal magon. Egy 5 eves is megerti a kulonbseget."Egyszerűen a patkány nvidia patkány módon lockol"
Egyszeruen nem teheti meg, hogy rossz elmenyt biztositson az usereknek.
Az RT sem volt es most sem elerheto azokon a kartyakon, ahol nincs dedikalt Tensor core.
Ez nem patkanysag, hanem egyeszuen jatszhatatlan es negativ elmenyt kerulik el."A “sokkal lassabb” compute magokon volt pár százalék… "
Nem volt par szazalek, semennyi % nem volt, mert nem hoztal DLSS tesztet ami nornal magokon futott. Olyan tesztet hoztal, ami tobb generacio Tensor core-n futott."agyam eldobom! "
A fentiek alapjan ez mar reg megtortent. -
paljani
aktív tag
Te kevered az "UGYANAZT" az "UGYANÚGY"-gyal. És próbálod eladni, hogy én nem értem... Oké.. semmi baj, beszélgettem már tőled sokkal hülyébbekkel is életemben (csak nem sokkal).
Abbol hogy leteszteled hogy a KIA-val 5 liter benzin kellett hogy eljuss A-bol B-be, abbol te megmondod hogy a VW-nek ugyanahhoz mennyi dizel kellett?
--- Tekintsünk el elegánsan, hogy az eredeti példám az UGYANAZ-ra vonatkozott és keressük a választ a tiedre (mert miután besz*ptad gyorsan tekertél egyet rajta), kicsit azért közelítsünk merthogy a vas mindkét (három az XeSS-sel) esetben UGYANAZ volt . Legyen a példa egy VW Passat (B9, 2019 facelift), mert ennek van 2.0 TD és TSI változata is, majdnem azonos teljesítménnyel. A hivatalos kombinált fogyasztási adatok:
1. 2.0 TSI DSG (190 lovas) -> 6.3 Liter / 100 km
2. 2.0 TDI DSG (190 lovas) -> 4.5 liter /100 kmNa de hogyan lehet következtetni a dízel fogyasztásából a benzinesére (vagy fordítva)? A vas ugyanaz, transzmisszó szintén csak a motorban különböznek (+tömeg difi). Tisztára mint a 4090-esen futtatott DLSS vs FSR vs XeSS.
1. A benzinmotorok hatásfoka 35-36 százalék, a dízeleké azonban 40-45 százalék (+14-25%).
2. A dizel "energiatartalma" literenként ~46.7MJa benziné ~38,6MJ (+20%)
3. A benzines tömege 1455 kg a dízelé 1485 kg (+2%)Számoljunk: 4.5 (dízel) * 1.14...1.25 (hatásfok) * 1.2 (magasabb energiatartalom) * 0.98 (tömeg) = 6.032...6.615 Liter/100km benzin. Hoppá... ~5%-os hibahatárral (jelen esetben +/- 0.3 liter) át lehet őket számítani egymásba. (ha tudnánk legalább az egyik motor hatásfokát fixre, teljesen pontos lehetne a számítás!)
Ezt akkor fordítsuk át itt FSR vs. DLSS kérdésre. Feltéve, hogy az nvidia legalább olyan jó tensor mentes DLSS-t tud írni mint az FSR akkor az FSR sebességét és extra workloadját jó közelítési alapnak lehet venni ugyanazon a vason. Ha meg még jobbat is tudna írni, akkor meg pláne oda lenne a sokat hangoztatott "SOKKAL LASSABB" mumusotok...
-
Raymond
félisten
En nem probalom ugy eladni hogy te nem erted, hanem minden hozzaszolassal bizonyitod hogy alap dolgokat nem tudsz osszefuggesbe hozni. Es nem tekertem semmit semmin, csak meg mindig nem vagy kepes felfogni es most mar annyira beleastad magad hogy azt se tudod merre van a felfele.
Privat velemeny - keretik nem megkovezni...
-
paljani
aktív tag
Innen már csak ismételni tudom önmagamat:
"..Feltéve, hogy az nvidia legalább olyan jó tensor mentes DLSS-t tud írni mint az FSR akkor az FSR sebességét és extra workloadját jó közelítési alapnak lehet venni ugyanazon a vason...".
Az hogy szerinted ilyet "nem lehet csinálni" meg "alap dolgokat nem ért aki ilyet csinál" meg "blah-blah-blah" az kolléga nem az én korlátoltságom.
-
Raymond
félisten
Nem ugyanazt csinalja a DLSS es az FSR, abbol hogy az FSR hogyan teljesit egy kartyan nem tudsz meg semmit arrol hogy a DLSS hogyan teljesitne rajta tensor nelkul. Ugyanott vagyunk ahol a legelejen. Irhatsz meg oldalnyi hozzaszolasokat a temaban, ezen nem fog valtozni semmi.
Privat velemeny - keretik nem megkovezni...
-
mekker
őstag
Lemaradtam az utóbbi kb. 3 év hardveres fejleményeiről. Ez a tensor-mag, meg a gyorsítás nem "csak" arról szól, hogy van egy GPU-hoz nagyon hasonló hw-egység, ami natív integerrel, meg feles pontosságú floatokkal v. számolásra lett tervezve? Tehát nem lesz jelentősen lassabb így se, mert nem egy komoly bottleneck a hagyományos hardver sem, csak hamarabb kell elővenni a töltőt. Legalábbis egy Switch esetében nem hinném, hogy hú de nagyon ki kéne élezni bármelyik aspektusát is a hardvernek.
Данное сообщение (материал) создано и (или) распространено иностранным средством массовой информации, выполняющим функции иностранного агента, и (или) российским юридическим лицом, выполняющим функции иностранного агента.
Új hozzászólás Aktív témák
- Óra topik
- Call of Duty: Modern Warfare III (2023)
- Ukrajnai háború
- bb0t: Gyilkos szénhidrátok, avagy hogyan fogytam önsanyargatás nélkül 16 kg-ot
- Luck Dragon: Asszociációs játék. :)
- Ennyibe kerülnek a Huawei Pura modellek Európában
- AMD GPU-k jövője - amit tudni vélünk
- Sokat fogyaszt az AI, egyre több az adatközpont, kell az atomenergia
- Autós topik látogatók beszélgetős, offolós topikja
- Robogó, kismotor
- További aktív témák...
- EDIFIER R1700BTS hangfal pár makulátlan, új állapotban, 2 év hivatalos garanciával, alkalmi áron
- LG OLED55B23LA 2 Év GYÁRI GARANCIA
- Apple iPhone XR 128GB, Kártyafüggetlen, 1 Év Garanciával
- Gamer PC , i7 12700KF , RTX 3080 Ti , 64GB DDR5 , 960GB NVME , 1TB HDD
- Intel PC , i5 8500 , 1660 6GB , 32GB DDR4 , 512GB NVME , 500GB HDD
Állásajánlatok
Cég: Promenade Publishing House Kft.
Város: Budapest
Cég: Ozeki Kft.
Város: Debrecen