- Android alkalmazások - szoftver kibeszélő topik
- Google Pixel 7a - venni vagy nem venni?
- Apple iPhone 16 Pro - rutinvizsga
- Bemutatkozott a Poco X7 és X7 Pro
- Apple iPhone 13 Pro Max - őnagysága
- Samsung Galaxy S23 Ultra - non plus ultra
- Poco X6 Pro - ötös alá
- Magisk
- Samsung Galaxy S25 - végre van kicsi!
- Fotók, videók mobillal
Új hozzászólás Aktív témák
-
flugi
tag
ha sok alkalmazást, sok komponenst akarsz felgyorsítani, az természetesen alkalmazásonként, komponensenként lesz 2 hét
Nem mellesleg nem akarsz h263 encodert optimalizálni, mivel szinte mindegyik tuningolt encoder függvénypointer tömbökben címezget, amit nem lehet megfogni pragmákkal.
A képnézegetőn nincs mit gyorsítani. Az effektek némelyikén lehet, hogy van mit. Ezek megvizsgálása, hogy lehet-e pragmázni, és rápróbálni a pragmákat, hogy gyorsabb lett-e, ez viszont megint a 2 hetes munkaidő alatt megvan mindenestül, persze effektenként (legyenek akárhány sorosak).
-
con_di_B
tag
Most csak egy szerencsétlen megfogalmazáson rágódsz. Az ő eszközükkel magának az "elemi forrásfájlnak" (magyarul amiből kernelt kéne fordítani) a hossza az ami nem igazán releváns, értelemszerűen, más jellegű kódkomplexitásra (pl. funkcionális) ez már nem igaz.
Nekem inkább az a problémám az elképzeléssel, hogy erre csak akkor lehet jó heurisztikákat mondani, hogy mit, hogy érdemes megírni/"lefordítani", ha már vannak helytálló best practices módszertanaink. Na ilyenek ma még nincsenek. Persze, rengeteg szép whitepaper volt/van, de a gyakorlatban minden ilyen elég könnyen be tud dőlni, elég egy driverfrissítés, amiben megoldanak valamit aminek eddig is gyorsnak illett volna lennie, csak eddig nem volt az... Vagy épp, hogy soha nem oldják meg...
-
flugi
tag
furcsa módon, de igen, ha eleve alkalmas a kód. Ilyenkor a ciklusmag mérete irreleváns, a párhuzamosítási pont létezése a feltétel, és ilyen pontból kevésnek kell lennie, különben érdemi gyorsulás nem elérhető, tehát nem eleve alkalmas a kód.
Félreértés ne essék, eleve alkalmas kódból kevés van, de egy kellőképpen elegáns programban azért könnyebb találni gyorsítható részeket, mint egy asm betétekkel gazdagon díszített hackorgiát.
-
flugi
tag
majdnem pontosan így van, de szerencsére vannak magasszintű párhuzamosságot adó megoldások is, amiket könnyű lehet lecserélni. Például egy OpenMP alapú multithread megoldás triviálisan alakítható át az esetek zömében.
Egy socket szintű grid implementációt görgető rendszer meg nem fog tudni alkalmazkodni.
Nemrég dolgunk volt egy batárnagy fortran programmal. Nem kívánom senkinek.
-
flugi
tag
Amire ez hasonlít, az az MS AMP. Vagy a mi cuccunk: http://www.youtube.com/user/MrFlugi#p/a/u/0/31xKQ_9MN_k
Az a lényege, hogy ha a kódod olyan, hogy az algoritmus gyorsabban menne GPU-n, akkor a fordítóval elintézzük, hogy azon is fusson. Ez tényleg 2 heti meló.
Újraírni az algoritmust, hogy GPU barát legyen, az meg sok idő.
-
con_di_B
tag
LoL
Egy dologra egyébként jó lehet: meglévő C/C++/Fortran kódbázis HPC-sítésére. Viszont ha azok a kódok már eleve HPC-re vannak, akkor smemi szükségük ilyen megoldásokra, mert már eleve valamelyik natív környezetben lettek elosztott rendszerként lefejlesztve, ha meg most akarják átmókolni, akkor jobban járnának ha inkább újraírnák, csak még nem tudják.
-
vinibali
őstag
nagyon erősnek tűnik a kezdeményezés. kíváncsi leszek ha az FSA mellett teszi majd le voksát az új XBOX lesze-e még ennek létjogosultsága?
-
con_di_B
tag
És erre mi szükség van az OpenCL mellett? Csak a reference cardot néztem át, de abban nem láttam semmit, amit abban ne lehetne.
-
moli.hu
őstag
az elérhető gyorsulás nagyon függ az adott programkódtól, de a tapasztalatok azt mutatják, hogy két hetes munkával a kétszerestől kezdve akár a tízszeres gyorsulás is elérhető.
2 hetes munkaval?
-
radi8tor
MODERÁTOR
Ez nekem kínai.
Hangolják össze jobban a drivereket a játékokkal.
Új hozzászólás Aktív témák
Hirdetés
- Telefon felvásárlás!! Samsung Galaxy S24/Samsung Galaxy S24+/Samsung Galaxy S24 Ultra
- ÁRGARANCIA!Épített KomPhone i5 12400F 16/32/64GB RAM RTX 4060 Ti 8GB GAMER PC termékbeszámítással
- LENOVO ThinkBook 13s - 13.3" FullHD IPS - i5-10210U - 8GB - 256GB SSD - Win11 - MAGYAR
- DELL PowerEdge R730xd 26SFF rack szerver - 2xE5-2680v3 (24c/48t, 2.5/3.3GHz), 64GB RAM, 10G, H730p
- Bomba ár! Dell Latitude E5450 - i5-5GEN I 8GB I 500GB I 14"FHD I HDMI I Cam I W10 I Gari!
Állásajánlatok
Cég: Promenade Publishing House Kft.
Város: Budapest
Cég: PCMENTOR SZERVIZ KFT.
Város: Budapest