- Android alkalmazások - szoftver kibeszélő topik
- VoLTE/VoWiFi
- Magisk
- Ezek a OnePlus 12 és 12R európai árai
- Redmi Note 13 Pro 5G - nem százas, kétszázas!
- Milyen okostelefont vegyek?
- Motorola Edge 60 és Edge 60 Pro - és a vas?
- Hat év támogatást csomagolt fém házba a OnePlus Nord 4
- Xiaomi 11 Lite 5G NE (lisa)
- Honor 200 Pro - mobilportré
Új hozzászólás Aktív témák
-
LordX
veterán
Egy példát mondj, amiről vita van. Max valami iszonyatosan speciális eset, amivel csak minden február 30.-án találkozik a programozó.
OpenCL-ben programoztam, ami majdnem az összes létező CPU-n és GPU-n futott: AMD GCN, nVidia Fermi+Maxwell, Intel Haswell+Skylake, Qualcomm Adreno 330, Mali T624, Mali T760 GPU-kon és x86 (Intel és AMD runtime-al), ARM CPU-kon teszteltem. Kizárólag PowerVR és FPGA-k alatt nem. Soha semmi olyan problémába nem futottam bele, hogy valamit egyik gyártó így értelmezett, a másik úgy. Ami szabványos kód, amit a Khronos SPIR fordító megevett, az mindenhol lefordult, ha nem számítom azt, ami nyilvánvalóan bug.
És mivel a legtöbb OpenCL implementáció frontendje CLang alapú, még a bugok is többnyire ugyanazok. Nem véletlenül az LLVM-IL volt az alapja a SPIR 1.2-nek.
A SPIR-nek meg marhára nem az volt a célja eredetileg, hogy a nem egyértelmű dolgokat megoldja, arra elég lett volna az, hogy módosítják a szabványt (ahogy egyébként ezt csinálják is, az OpenCL 1.2-nek van vagy 10 revíziója, némelyik az után jött, hogy már megvolt a nem-draft 2.0), hanem hogy ne kelljen forráskódot szállítani, ha nem akarsz binárist (és nem akarsz, mert az még gyártón belül se kompatibilis). Teljesen életszerűtlen és logikátlan az, amit mondasz, hogy van egy szabvány, ami itt meg ott nem egyértelmű, és a szabvány testülete ezeket nem javítja ki annak ellenére, hogy gőzerővel dolgoznak folyamatosan új verziókon, hanem behoznak egy teljesen új szabványt, hogy majd az megoldja.
-
LordX
veterán
Hát, véleményem szerint az aktuális OpenCL-hez képest az aktuális CUDA szar.. 1.2-nél persze jobb a 3 éves CUDA is, csak azt már mindenki (lassan including mobil GPU) meghaladta az nVidiát kivéve.
Azért használja mindenki a CUDA-t, mert mindenki CUDA-t használ. Arra vannak hülyére optimalizált libek.
-
LordX
veterán
Az OpenCL forditók közötti eltérés nem értelmezésbeli eltérés... Vagy szabványban megengedett implementációs különbségekről van szó, vagy bugról.
Bugok a SPIR-V finalizerek közt is fognak eltéréseket hozni, úgyhogy ezt a szálat most hagyjuk.
Az implementációs különbség meg olyan, hogy egyik esetben 64 szál lehet egy workgroupban, a másikban 256, a harmadiknál a legszélesebb használt adattipustól függően 4/8/16, hogy az egyikben 4k __local memory van, a másikban 32k, stb. Itt vagy megirod a kódod a legkisebb közös többszörösre, és mindenhol lassú leszel, vagy #ifdef __AMD__ #elif __INTEL__ #else #endif (vagy dinamikusan kéred le, effektive ugyanaz). És ezen a SPIR-V se segit semmit.
Új hozzászólás Aktív témák
- Gumi és felni topik
- Android alkalmazások - szoftver kibeszélő topik
- VoLTE/VoWiFi
- Lefőtt a júliusi hardverpárlat
- AMD K6-III, és minden ami RETRO - Oldschool tuning
- Xbox Series X|S
- Intel Core Ultra 3, Core Ultra 5, Ultra 7, Ultra 9 "Arrow Lake" LGA 1851
- A fociról könnyedén, egy baráti társaságban
- Luck Dragon: Asszociációs játék. :)
- Magisk
- További aktív témák...
- HPE Aruba PoE+ L3 switch raktárról azonnal elérhető!
- BESZÁMÍTÁS! HP Victus 16-D0655NG notebook - i5 10400H 16GB DDR4 512GB+1TB SSD RTX 3060 6GB WIN10
- ALIENWARE Area-51 R6 Threadripper Edition 1920X
- ÁRGARANCIA!Épített KomPhone i5 13400F 16/32/64GB RAM RTX 5070 12GB GAMER PC termékbeszámítással
- Bowers/Wilkins Px7 S2 fejhallgatók
Állásajánlatok
Cég: PCMENTOR SZERVIZ KFT.
Város: Budapest
Cég: Promenade Publishing House Kft.
Város: Budapest