- Google Pixel 8 Pro - mestersége(s) az intelligencia
- Xiaomi Smart Band 10 - a hetedik napon megpihen
- Vivo X200 Pro - a kétszázát!
- Mobil flották
- Vékonyabb lett, jobb kamerát kapott, de az akku maradt a régi: itt a Fold7
- Írországban lezárult, az USA-ban csak most indul az Apple dráma
- Motorola G86 - majdnem Edge
- Légies iPhone halvány színei
- iPhone topik
- Android alkalmazások - szoftver kibeszélő topik
Új hozzászólás Aktív témák
-
petXYZW
tag
Pontosan ezt a választ vártam.
Ez esetben a tesztnek, a "kód-divergencia", "random memory-access pattern" vagy hasonló nevet kellet volna adni, nem pedig, hogy "tree search".
Ugyanis így már teljesen világos a GPU lemaradása.
A "tree search" tehát azért nem szerencsés elnevezés, mert a gráfkeresőket lehet a GPU számára emészthetővé tenni olyan módon, hogy a divergenciából eredő lassulás ne jelentkezzen és a memória elérés minták ne legyenek olyan "ordasak". Ráadásul olyan előnyi is lesznek a megközelítésnek ami kifejezetten kedvez a GPU-nak.
-
petXYZW
tag
"flow control hardver kell hozzá."
Én nem hiszem, hogy ez az oka! Úgy gondolom, hogy egyszerűen feladat-párhuzamos a kód és ez fekszik a Xeon Phi-nek, míg a másik kettőnek kevésbé. Nekem ez a véleményem, de pont ezért írtam, hogy ez esetben jó lenne látni, milyen a konkrét kereső algoritmus és milyen problématérben keres. Ha egyáltalán ezt takarja a "tree search" a CLBenchmark fejlesztőinél...
-
petXYZW
tag
válasz
Meteorhead #26 üzenetére
Most erre mit mondjak...minden szavaddal egyet tudok érteni és megértem.
Az tény, ha bármit szeretnél létrehozni ami GPU-n fut, és nem két vektort ad össze, ahhoz tényleg "akarni kell" és egy adag szop@s garantált, amitől elmehet az ember kedve.
-
petXYZW
tag
válasz
Meteorhead #16 üzenetére
"Azt, hogy virtuális függvényeket , függvénypointereket, polymorphizmust orrvérzésig használhat az ember számokban nem kifejezhető, és a GPUk azt nagyon soká fogják csak tudni. A HW hiába tudná már, nincs API amin keresztül rendesen ki is lehetne használni (portable módon meg aztán végképp)."
Szerintem ezek a dolgok nem arra valók, hogy valamilyen dedikált "computational task"-ban szerepeljenek, hanem alapvetően absztrakciót, programozást elősegítő eszközök, módszerek, valóban összetett problémák megoldásához.
A "programozóknak" az nem tetszik, hogy az OpenCL-ben programozni kell...
-
petXYZW
tag
A CLBenchmark "tree search" algoritmusára kíváncsi lennék!? Vajon miért marad el a két "GPU based" megoldás a Xeon Phi-től. Illetve sejtem miért...
Új hozzászólás Aktív témák
Hirdetés
- 4090 BESZAMITAS!! Gainward Phantom RTX 5090 32GB (Bontatlan,Alza Garancia)
- Nvidia RTX 4070 Gainward ghost Video Kártya
- MSI GeForce VENTUS 3X RTX 3070 Ti 8GB OC GDDR6X 256bit videokártya
- ZOTAC GAMING GeForce RTX 3090 Trinity OC 24GB GDDR6X (6 Hónap Garancia)
- MSI RTX 3080 Ti SUPRIM X 12GB GDDR6X Videokártya! BeszámítOK
- Thinkpad X230 legenda: i7 CPU, IPS kijelző, 12 GB, dupla SSD, magyar villbill, webcam, fingerprint
- Apple iPhone 12 Pro 128GB Kártyafüggetlen 1Év Garanciával
- Bomba ár! Dell Latitude E5440 - i5-4GEN I 8GB I 320GB I DVDRW I 14" HD+ I HDMI I Cam I W10 I Gari!
- Telefon felvásárlás!! Apple Watch SE/Apple Watch SE 2 (2022)
- BESZÁMÍTÁS! ASUS ROG STRIX B550-F GAMING alaplap garanciával hibátlan működéssel
Állásajánlatok
Cég: PCMENTOR SZERVIZ KFT.
Város: Budapest