- Samsung Galaxy S23 és S23+ - ami belül van, az számít igazán
- Külföldi SIM-ek itthon
- Szívós, szép és kitartó az új OnePlus óra
- Okosóra és okoskiegészítő topik
- Bemutatkozott a Poco X7 és X7 Pro
- Google Pixel topik
- Légies iPhone halvány színei
- Egyesíti a Google az Android és a ChromeOS rendszereket
- Yettel topik
- Xiaomi Smart Band 8 - folyamatosan
Új hozzászólás Aktív témák
-
con_di_B
tag
A "Tree search" egy teljesen szintetikus teszt (értsd, nem az a lényeg, hogy mit old meg, hanem az, hogy mit terhel) ami kifejezetten arra készült, hogy extrém divergens kódvégrehajtást eredményezzen. Elméletben ez persze nem fair a masszívan SIMD hardverekkel szemben, de a gyakorlat azt mutatja, hogy ezek között is lényegi különbség van a divergencia kezelése terén, amit érdemes mérni.
A "bemegyünk a gráfba és jól eltévedünk" jellegű problémáknál ezen kívül az is szempont, hogy ennél a fajta divergenciánál nem csupán a vezérlés nehéz, hanem a memória-elérés mintája is a lehető legrosszabb.
Éppen ezért ebben a tesztben azok a hardverek tudnak jó eredményt elérni, amelyek 1) nem annyira érzékenyek a divergens vezérlésre 2) jól kezelik (gyorsítótárazzák) a legordasabb memória-eléréseket is.
Ezeket a problémákat hagyományosan nem szeretik GPU-ra átültetni, de az OpenCL messze nem csak a GPU-król szól.
Folyamatpárhuzamosságról ebben az esetben nincs szó.
-
Abu85
HÁZIGAZDA
Nagyon jó flow control hardver kell hozzá. Ezzel jól kezelhető a branch-divergency.
Közben kiderült a Xeon Phi-ről, hogy nem is olyan megosztott az az L2 cache. Konkrétan minden maghoz saját tartozik, és a másik maghoz tartozó L2 tárat se írni se olvasni nem tudják. Az Intel ezt nem pont így ígérte, de mindegy. Ez is ad némi magyarázatot az eredményekre.
-
Meteorhead
aktív tag
A programozóknak az OpenCL-lel nem az a bajok, hogy programozni kell benne (bár igen, sajnos létezik az a 70%-os programozói réteg, aki egy mezei host oldali párhuzamos kóddal sem bánik el, sem task, sem data parallel esetben), hanem az a baja, hogy isszonyatosan verbose és macera az interface-e.
Egy olyan egyszerű problémát megoldani, hogy egy GPU képes-e double-ben számolni, vagy csak floatot lehet használni kernelben olyan trágya módon lehet megoldani, hogy az ember csinál egy #define REAL float/double sort a kernel kódba, amit runtime kell a kódba beleírni, mert akkor derül ki, hogy az adott hardver amin fut képes-e rá. Igen, C++-an léteznek template-k. Ilyenekre találták ki őket. (Igen, AMD-nek van már static C++ OpenCL compilere, de az a kód nem lesz hordozható)
OpenCL-ben nincs dinamikus memóriaallokáció (ami állatira megnehezíti a legegyszerűbb hatékony reduction kódok írását, mert egy csomó méretet host oldalról kell beleinjektálni a kódba, hogy compile-time konstans legyen.
Tisztában vagyok vele, hogy a rengeteg feature amit korábban felsoroltam az egy magasabb szintű absztarkciót szolgál, de el nem tudom mondani, hogy mennyivel egyszerűbb lenne az életem, ha STL tárolókat használhatnék egészen az utolsó függvényig, ami feldogolgozza az adatokat, és nem kéne közbeékelnem egy cl:
uffert, és a köré épített egész masinériát. Fejlesztési idő ÓRIÁSI mértékben lerövidülne.
Egyébként értem amit mondasz, hogy van egy fajta programozói lustaság, (bár nekem azért van munkám, mert kevesen értenek ehhez) de tényleg macera. Olyan programot írni, ami minden user gépén fut állati macera írni, és OpenCL C99 kernel nyelve ehhez csak hozzárak. Csak a template-ek már megváltásként hatnának.
Új hozzászólás Aktív témák
- Hálózati / IP kamera
- AMD Navi Radeon™ RX 9xxx sorozat
- Gitáros topic
- Samsung Galaxy S23 és S23+ - ami belül van, az számít igazán
- AMD GPU-k jövője - amit tudni vélünk
- Kormányok / autós szimulátorok topikja
- Medence topik
- Formula-1
- Audi, Cupra, Seat, Skoda, Volkswagen topik
- Milyen billentyűzetet vegyek?
- További aktív témák...
- BESZÁMÍTÁS! SAPPHIRE Pulse OC RX 9060 XT 16GB GDDR6 videokártya 27% áfa 3 év garancia
- Gigabyte RX 6800 16Gb Aorus (LCD kijelzős)
- GIGABYTE AORUS RTX 4070 Ti ELITE 12GB - 20 hónap garancia
- Msi Mech 2x Radeon RX 6600 XT GAMING X 8G
- BESZÁMÍTÁS! Gigabyte AORUS MASTER RX 6800 XT 16GB GDDR6 videokártya garanciával hibátlan működéssel
- BESZÁMÍTÁS! ÚJ AMD Ryzen 5600X 5700X 5800X 5900X processzor 3 év garancia 27% áfa termékbeszámítás
- Telefon felvásárlás!! Xiaomi Redmi Note 12, Xiaomi Redmi Note 12 Pro, Xiaomi Redmi Note 12 Pro+
- BESZÁMÍTÁS! Asus B450 R7 2700X 16GB DDR4 512GB SSD RTX 2070 8GB Rampage SHIVA TT 500W
- BESZÁMÍTÁS! Gigabyte A620M R5 7500F 32GB DDR5 512GB SSD RX 6700 XT 12GB Rampage SHIVA Chieftec 700W
- Apple iPhone SE 16GB, Kártyafüggetlen, 1 Év Garanciával
Állásajánlatok
Cég: Promenade Publishing House Kft.
Város: Budapest
Cég: PCMENTOR SZERVIZ KFT.
Város: Budapest