- Samsung Galaxy A56 - megbízható középszerűség
- Karaktere biztos lesz az első Nothing fejhallgatónak
- One mobilszolgáltatások
- Milyen okostelefont vegyek?
- Magisk
- Google Pixel 9 Pro XL - hét szűk esztendő
- Realme GT Master Edition - mestermunka
- Ilyen lesz a Fairphone 6
- Keretmentesít a Galaxy S25 FE
- Nem lett arányos a fogyókúra
Új hozzászólás Aktív témák
-
sghc_toma
senior tag
kijott az Ati Stream SDK 2.0-beta4, mukodik vele a GPU gyorsitas.. meg tamogatja a 64 bites Windows-okat, koztuk a Win7-et is.. [link]
-
sghc_toma
senior tag
sry, hogy csak most valaszolok, kicsit el voltam havazva..
kosz, hogy kiprobaltad a progit!
otthon en is ki akartam probalni win alatt.. 64 bites Win7-re nem ment az OpenCL SDK (azt mondja, legalabb XP kell neki.. fura, mert OpenCL driver meg van Win7-re).. az Ati SDK-val meg meg nem volt idom foglalkozni.. talan a heten.."de-de az az én gépem lesz"
na, akkor jol sejtettem -
sghc_toma
senior tag
válasz
sghc_toma #33 üzenetére
javitottam.. meg a peldaprogiban volt egy masik csunya bug is: az eredmeny ellenorzesekor abs-ot hasznaltam fabs helyett, igy egy esetleges hibas szamolas utan is azt kaptuk volna, hogy 1000-bol 1000 sikerult
karicska: esetleg megprobalnad a peldaprogit forditani/futtatni ugy, hogy a 147. sornal kezdodo kommentezett blokkot is beleforditod? OSX-en nem akar mukodni, nem tudom miert.
// es meg valami, ami nagyon off: ismeros volt a nick-ed, rakerestem az e-mail cimedre, latom ELTE-s vagy.. veletlenul nem a nagytetenyi uti koliban laksz? van itt a halon egy gep karics-pc, vagy valami hasonlo nevvel, ez elegge hasonlit a karicska-hoz
..
-
sghc_toma
senior tag
jogos, koszonom
rogton javitom...
meg ha mar szoba jottek az address space-ek, talan erdemes megemliteni, hogy az x lehetne __constant, mert ugysem valtozik az erteke, es a konstans memo cache-elve van (legalabbis CUDA architekturan)..nVidia-nak Win-re es Linux-ra van egy OpenCL Visual Profiler nevu cucca, bar meg csak beta..
-
sghc_toma
senior tag
nincs mit..
az FX570m 256 megajanak nagy resze felhasznalhato globalis memoriakent (nem az egesz, mert ugye ott van meg a kepernyobuffer, konstans memoria, stb. is), igy felfert egyben a ket darab 96 megas vektor a kartyara.. azert ha vesz az ember ilyen 1-2 giga memoval rendelkezo kartyakat, azokon mar jol el lehet ferni..exp-et, log-ot megkoveteli a szabvany, tehat az OCL-t tudo hardverek tudjak..
-
sghc_toma
senior tag
lehet, hogy felreerthetoen fogalmaztan.. azt, hogy nagy vektorok kezelese hardverfuggo, nem ugy ertettem, hogy a driver feladata egy nagy buffert szetbontani kezelheto darabokra.. annyit akartam vele mondani, hogy minden hardver kulonbozo mennyisegu memoriaval rendelkezik, es hogy egy adott architektura akar lehet olyan is, hogy nem tud nagy bufferekkel optimalisan dolgozni (nem tudom, hogy van-e ilyen, de ki tudja)..
gyakorlatilag ez ugy nez ki, hogy az eszkozon elerheto valamilyen mennyisegu globalis, konstans, lokalis, es privat memoria.. ezeket az adatokat az OCL runtime-tol le lehet kerdezni.. ezek, es az alkalmazas memoriaigenyenek tudataban neked kell beosztanod, hogy hogyan gazdalkodsz a memoval.. nagyon nagy adatok eseten mondjuk egy kezelheto darabra lefuttatod a kernelt, visszaolvasod az eredmenyt, aztan futtatod megint a kernelt egy masik adatdarabon, es igy tovabb..
1-2 evet talan nem kell varni, beta driverek mar most is vannak.. ATI vonalon nem tudom, mi a helyzet, de nVidia-ek ugye a CUDA architekturara epitettek az OpenCL implementaciojukat, az meg mar eleg kiforrott..
ja, es ebben a Quadro-ban az a 256 mega/32 stream proci kombo keves tud lenni neha, akkor mar inkabb valami 512MB-os FX770m/HD3650, vagy hasonlo -
sghc_toma
senior tag
koszonom szepen, a hibat javitottam..
maga a szabvany a float-ot koveteli meg, de az OpenCL-ben is (mint OpenGL-ben) vannak extension-ok, es letezik double preciosion extension.. tehat igazabol hardverfuggo a dolog, nekem pl. a videokartyam (FX570m) nem tamogatja ezt a kiegeszitot, a procim meg igen (meg jo)..
masik kerdesedre is az a valaszom, hogy implementacio-fuggo.. OCL csak egy szabvany, az, hogy ezt hogyan valositjak meg a hardvergyartok a sajat architekturajukra, teljesen rajtuk mulik.. eddig csak nVidia kartyara programoztam, ott nem lehet gond az 5-10 megabajt meretu buffer.. pl a saxpy-s peldaprogi 25165824-es vektormerettel is tok jol mukodik.. ez ugye ket darab 96 megas vektort jelent (egy olyan kartyaval, amin csak 256 mega memo van)..
-
sghc_toma
senior tag
igen, a hardverek kozotti kulonbseg eltuntetese az OpenCL feladata.. ez benne a szep, neki tulajdonkeppen mindegy, milyen hardver van alatta.. elvileg.. persze ahhoz, hogy optimalis kodot tudjal irni, ismerned kell az adott architekturat.. pl. nVidia-nal figyelni kell a bank conflict-okra, coalescing-re, ATI-nal nem tudom, hogy van ez.. szoval siman lehet, hogy egy alkalmazasban minden tamogatott architekturara kulon kernelt kell irni, kulon work-group/work-item kiosztast kell hasznalni..
-
sghc_toma
senior tag
JanR (#14): kosz szepen!
tlac (#15):
jo, hogy kerdezted ezt a dolgot, mert egy kicsit elcsesztem a cikkben.. mentsegemre legyen szolva, hogy az Apple doksiban is el van rontva, illetve az OpenCL eszkoz infokat lekerdezve is rossz adatokat kapok..a cikkben ezt irtam a Compute Unit-okrol:
Az OpenCL eszköz (device) az a hardver, amin a párhuzamos feldolgozás történik. Ezekben a hardverekben több, úgynevezett számolási egység (compute unit) van - tulajdonképpen ezek hajtják végre az utasításokat. Például egy videokártya minden stream processzora, és egy CPU minden magja is egy számolási egység.nos, ez igy nem igaz, itt a Compute Unit-ot ki kell cserelni Processing Element-re.. a Compute Unit a Processing Element-ek egy csoportja (az nVidia multiprocessor-nak hivja, es egy multiprocesszor 8 darab procit tartalmaz).. nagyjabol az a helyzet, hogy egy work-group work-item-jeit futtatja egy compute unit.. az, hogy ez konkretan hogyan van megoldva, implementacio-fuggo, nVidia kartyakra a CUDA doksiban szepen le van irva, hogy is tortenik ez.. gondolom ATI-eknak is van valami dokumentaciojuk, nekem csak nVidiam van, igy csak azzal foglalkoztam..
tehat OCL-ben te be tudod allitani a work-group meretet, illetve a work-item-ek szamat; az, hogy ez konkretan hogyan kerul kiosztasra a CU-k/PE-k kozt, az OpenCL runtime dolga..
// cikk atirasa folyamatban...
-
sghc_toma
senior tag
feltennem en, csak nem tudom foditani.. Windows-ra legjobb tudomasom szerint csak beta SDK-k vannak mind ATI, mind nVidia reszrol.. regisztralni kene, de nincs kedvem fel kilometeres regisztracios lapokat kitoltogetni
ja, meg jelenleg csak virtualis gepen van Win-em, azt is telepiteni kene.. azert hetvegen lehet, hogy raszanom magam..
-
sghc_toma
senior tag
tobal (#4): persze, megy nVidia-val, Macbook (Pro) -kban is nV kartyak vannak..
DarkByte (#6): Windows-os OpenCL tamogatasrol nem tudok semmit, mikor utoljara neztem, csak valami kiszivargott beta dolgok voltak..
Sanyix (#7): keszulget Java binding OCL-hez: [link].. btw, van .NET, es C++ wrapper is.. -
sghc_toma
senior tag
ezt csinalja a peldaprogi:
"... a BLAS csomag SAXPY függvényét fogjuk megvalósítani. A SAXPY fog két vektort, az elsőt megszorozza egy skalárral, majd az eredményt hozzáadja a második vektorhoz (y = a * x + y)."
konkretan veletlenszeruen general ket float vektort (x, y), meg egy float skalart (a), ezeket feltolti a VGA memoba, majd a GPU elvegzi rajtuk a SAXPY-t.. vegul visszaolvassa az eredmenyt a rendszermemoba, es osszehasonlitja egy CPU-s szamolas eredmenyevel..
Új hozzászólás Aktív témák
Hirdetés
- Mibe tegyem a megtakarításaimat?
- Motorolaj, hajtóműolaj, hűtőfolyadék, adalékok és szűrők topikja
- EAFC 25
- Milyen TV-t vegyek?
- Milyen légkondit a lakásba?
- Gumi és felni topik
- Milyen routert?
- Samsung Galaxy A56 - megbízható középszerűség
- Home server / házi szerver építése
- Kazy Computers - Fehérvár - Megbízható?
- További aktív témák...
- HP core i5-ös fémházas Folio 9470m kifogástalan állapotban!! AkciÓÓ!
- A legolcsóbb!!! Dell Latitude 6. gen. core i5-ös notebook olcsón!!!! AkciÓÓ!
- Olcsó Laptop! Dell Latitude 7280. I5 7300U / 8GB DDR4 / 256GB SSD
- MSI Thin GF63 12VF 15.6" FHD IPS 5-12450H RTX 4060 16GB 512GB NVMe magyar vbill gar
- Apple iPhone 16 Pro Max - Desert Titanium - 256GB 1 ciklus 100% akku! 1 év garancia! Új készülék!
- Csere-Beszámítás! Felsőkategóriás számítógép PC Játékra! I9 13900KF / RTX 4080 / 32GB RAM / 1TB SSD
- BESZÁMÍTÁS! Logitech G923 kormány + Driving Force Shifter garanciával hibátlan működéssel
- Csere-Beszámítás! AMD Ryzen 9 9900X Processzor!
- Quadro FX 570 eladó
- Corsair K100 Air wireless (CH-913A01U-DE) DE SN - A1E4G325503IVC
Állásajánlatok
Cég: Promenade Publishing House Kft.
Város: Budapest
Cég: PC Trade Systems Kft.
Város: Szeged