- Feljutott a G96 a Moto széria csúcsára
- Változó design, tekerhető lünetta: megjött a Galaxy Watch8 és a Classic
- Samsung Galaxy Fit 3 - keveset, de jól
- Vékonyabb lett, jobb kamerát kapott, de az akku maradt a régi: itt a Fold7
- Honor Magic V3 - mágikus realizmus
- Yettel topik
- Motorola Edge 40 - jó bőr
- Samsung Galaxy S25 Ultra - titán keret, acélos teljesítmény
- iPhone topik
- Honor Magic6 Pro - kör közepén számok
Új hozzászólás Aktív témák
-
MaUser
addikt
De ehhez tovabbra is boven eleg a cuda.
morgyi Macro helyett ma regen vannak .net beepulok amikkel joval gyorsabb vagy ha ma excel.
-
MaUser
addikt
-
MaUser
addikt
Nem az a kérdés, hogy mire kell több szál.
De, pontosan ez a fő kérdés. Jelenleg ugyanis kép- és videofeldolgozáson kívül szinte semmihez nem kell. Amihez máshoz kellhet, az meg GPU függő volt eddig is. És innentől kezdve el is jutottunk oda, hogy miért tarolt az intel a semmire sem jó GMA-kkal anno. Mert egyszerűen ha már van youtube gyorsításod, az elég a vevők 99,99%-ának. A maradék 99%-a meg gamer, a többi meg úgyis valami ws-t használ.
A probléma, hogy megírod a programot, de egy kalap kaki lesz, mert egy CPU szálon a sebessége egy kalap túró / nem energiahatékony.
Én nem ezt látom. Egy 2500k-val évek óta elvagyok és nem érzem lassúnak. Ahol az, ott meg célhw kell(ene).
Az egyszálas teljesítmény / fogyasztás arány (x86 vonalon) egy ideje alig javul, az utóbbi években igencsak lelassult.
Felső kategóriában lassult, de hát ennek főleg a konkurencia hiánya az oka, illetve, hogy nincs motiváció a felhasználók felé. (És már vissza is értünk oda, amit az elején kérdeztem, hogy minek gpgpu. Nincs rá program.) Alsó kategóriában viszont iszonyat a gyorsulás, az új atomok már igen jók és rácáfolnak mindenre amit az ember x86-tól elvárt volna.
Az újabb gyártástechnológiákkal is vannak problémák (lásd 20nm), örökké nem lehet csíkszélt csökkenteni.
Ezt minden évben elmondják, sőt én még egyetemen azt tanultam, hogy 20nm alá nem lehet fizikailag bemenni, aztán már alatta vagyunk.
A kérdés az, hogy hogyan lehetne sokkal jobb teljesítményt és energiahatékonyságot elérni?
Nem, a kérdés, hogy PC szinten akarunk-e jobbat elérni. Jelenleg úgy néz ki nincs rá komoly igény egyszerűen.
Vannak már jó ideje masszív többszálasításra tervezett architektúrák, melyek már bizonyítottak (mindenhol van GPU), s energiahatékonyságban is igencsak jók egy CPU-hoz viszonyítva.
Igen, csak ezek az architektúrákat célhw-ek. A kérdés, hogy célhw-re miért akarunk nem általános programot írni? Minek futtassak egy sima progit gpu-n, amikor nulla párhuzamosítható rész van benne?
.
Ezekre kéne felhasználás terén is valahogy építeni, masszívan. Már amit lehet, már ha van értelme, már ha lehet.
Igen, csak jelenleg úgy néz ki, hogy nincs, mivel nincs ami kihasználná.
Így egyelőre még csak próféciák vannak, komoly eredmények nélkül, de jelenleg egyszerűen nincs más út. A FPGA alig valahol, a SIMD kiterjesztések a kutyának sem kellenek, stb., GPU viszont már szinte mindenhol van. Ezzel kell kezdeni valamit. Hacsak nem valaki hirtelen jön valami jobb ötlettel.
Ó dehogy nincs más út. Pl. rengeteg kis fab van, akik pl. a saját cégüknek gyártanak cél-asic-et. Valahol ez éri meg. Egy gpu soha nem lesz 0.5€, egy cél asic viszont röhögve (autóipar pl.).
SIMD egyébként baromi jó példa az igény hiányára. Ott a lehetőség (MMX-ek, stb.), elterjedtek és mégsem áll neki szinte senki. Jó esetben legalább a fordítónak engedélyezik a használatukat. Miért? Mert nincs rá igény és nem éri meg ráfordításban. Miért érne meg ez gpgpu-nál? Egyszerű pénzügyi kérdés. Egy jó swfejlesztő óránként 50-100€-ba fáj a cégnek, egy r&d-n dolgozó meg 100-500€-ba. Óránként. Ilyen árak mellett nagyon ritkán éri meg belemászni optimalizációba, ahelyett, hogy leakasztasz egy kész cuda-t vagy simán nem törődsz vele.
De ha már törődni kell, akkor meg minek gpgpu? Van ezer féle különböző cpu/gpu kombó, az eredmény kiszámíthatatlan. Akkor sokkal inkább már fpga irány. Lesz egy fix méretű, szabadon programozható fpga tömböd procinként és máris ismeret sebességed van legalább generáción belül és valóban gyors lehetsz. Fpga-ra pedig idővel amúgy is a compiler fog fordítani. Lesz egy #pragma-d és az adott lib-et, kódrészletet majd szépen a fordító megoldja opcionális kódpath-ként ami futhat fpga-n ha van (és valóban gyors lesz) vagy marad cpu-n/gpu-n ha nincs fpga. Itt már valóban lenne gyorsulás. Nyilván tématerülettől függ, de a sajátomon azt látom, hogy egy nagyságrendet lehet nyerni cpu többszálúsításával, kb. ugyanennyit gpu-val (ha mindkettő van, akkor is csak egy nagyságrendnél vagyunk!), még fpga-nál 2-3 nagyságrendet. A vicc egyébként hogy nem csak én vagyok ilyen "okos", nem véletlenül vette meg az Intel az egyik nagy fpga gyártót és éppen vásárolják fel a másikat is.
Egyébként fpga-cpu merge volt bőven korábban is, de az árak miatt buktak idővel (lsi, stb.). Egy xeon proci árázásába viszont bele fog ez már férni bőven. Idővel meg visszajtunk a transmeta-hoz, újrakonfigurálható perifériákkal. Ha kell jobb képfeldolgozás selfi-khez, kapsz rá egy fpga szeletet és kész. Ha kell jobb hang, akkor kapsz arra egyet, stb.
Szerk: vagyis az intel megcsinál(hat)ja azt az alterával, amit az amd akart az ati-val. Csak hát egy fpga ezerszer szélesebb körben használható, mint egy erősen kötött gpu. Cserébe nehezebb is a feladat, de intelnél van pénz. Ráadásul az fpga-k ára ma a gyárás miatt magas. Házon belüli fabok esetén a sok millió akár milliárd dolláros költségek könnyebben faraghatóak lesznek, főleg ha immár lesz gyártási darabszám is.
-
MaUser
addikt
Kb. ez az a kérdés, amit évek óta minden ilyen "juj de jó a gpugpu, ma is megváltja a világot valahogy egy újítással és az mindennél jobb" cikknél felteszek. Válasz viszont nincs. Szóval mire kell nekünk gpgpu, azon túl, hogy az AMd ebbe az irányba vergődött megfelelő r&d hiányában?
Nézzük, milyen esetek vannak ma:
- semmire nem kell több szál
- néha kéne több szál, de igazából ezt egy pár magos proci megoldja (pl. async műveletek -> bár ez igazából gy magon is elmegy jó fordítónál/sdk-nál és ma már a legtöbb architektúrára ilyen van)És ezzel kilőttük az esetek 99.99%-át. Mire kéne gpgpu? Ar-re? Hololensbe mi is van most?
Btw. tfh. képet szerkesztünk, videózunk, modellezünk és kellenek gyors mátrix műveletek konvolúcióhoz, sparse mátrixozáshoz, véges elem számításokhoz, stb. Ekkor adunk neki fix cuda supportot és kész. Övék a piac 75-90%-a consumer/profi szinten. Vagy csináljuk ocl-lel, ha nagyon szabványosodni akarunk (nem akarunk, mert előjönnek a cikkben említett problémák).
Új hozzászólás Aktív témák
Hirdetés
- A fociról könnyedén, egy baráti társaságban
- Épített vízhűtés (nem kompakt) topic
- Milyen videókártyát?
- Feljutott a G96 a Moto széria csúcsára
- Windows 11
- Változó design, tekerhető lünetta: megjött a Galaxy Watch8 és a Classic
- Samsung Galaxy Fit 3 - keveset, de jól
- AMD K6-III, és minden ami RETRO - Oldschool tuning
- Vékonyabb lett, jobb kamerát kapott, de az akku maradt a régi: itt a Fold7
- Milyen asztali (teljes vagy fél-) gépet vegyek?
- További aktív témák...
- ÁRGARANCIA!Épített KomPhone i5 10600KF 16/32/64GB RAM RX 7600 8GB GAMER PC termékbeszámítással
- AKCIÓ! ASRock B85M Pro4 B85 chipset alaplap garanciával hibátlan működéssel
- Apple iPhone 13 . 128GB , Kártyafüggetlen , 100% akku
- Bomba ár! Dell Latitude E7440 - i5-4GEN I 8GB I 500GB I 14" HD I HDMI I Cam I W10 I Gari!
- AKCIÓ! Gigabyte H610M i5 12400F 32GB DDR4 512GB SSD Intel ARC A770 16GB Rampage SHIVA 650W
Állásajánlatok
Cég: CAMERA-PRO Hungary Kft
Város: Budapest
Cég: PCMENTOR SZERVIZ KFT.
Város: Budapest