- Vivo X200 Pro - a kétszázát!
- Samsung Galaxy S25 Ultra - titán keret, acélos teljesítmény
- Milyen okostelefont vegyek?
- Samsung Galaxy S23 Ultra - non plus ultra
- Youtube Android alkalmazás alternatívák reklámszűréssel / videók letöltése
- Android alkalmazások - szoftver kibeszélő topik
- Tesztpadon az exynosos Galaxy Z Flip7 FE
- Samsung Galaxy S25 - végre van kicsi!
- Xiaomi 15 - kicsi telefon nagy energiával
- iPhone topik
Új hozzászólás Aktív témák
-
Abu85
HÁZIGAZDA
Nem létezik olyan, hogy teljesen optimális. Ha létezne, akkor mindenki olyat tervezne. Két dolog határozza meg, hogy egy architektúra milyen felépítést tartalmaz. Egyrészt nyilván az elérendő cél, másrészt ebből kiindulva az, hogy az alapdizájnnal a tervezett módosítások mellett ebből mi és hogyan kivitelezhető.
A gyártók egy adott alapra 4-8 generációt is felépítenek. Az Intelt, az AMD-t és az NV-t is limitálják bizonyos olyan döntések, amelyeket az alapok tervezésénél hoztak meg. Ha az aktuális alapot nézzük, akkor az AMD-nél ez a GCN, az Intelnél a Gen1, míg az NV-nél a Fermi. Az Intelnél látszik, hogy az alap mennyire limitálhat, mert náluk már olyan limitek is megjelennek, amelyeket csak óriási gyorsítótárakkal tudnak ellensúlyozni. Az NV és az AMD alapja még nem tart itt. -
namaste
tag
Egy utasítás csak HP, SP vagy DP számokkal dolgozik, az ütemezőtől függ, hogy képes-e egyszerre kiadni egy SP és egy DP utasítást végrehajtásra.
Nem tudok olyan algoritmust, ami egy kernelen belül vegyesen használ SP és DP számokat.Kutatnak olyan módszereket, amelyek két fázisban dolgoznak:
1. SP-ben gyorsan és energiatakarékosan kiszámolnak egy előzetes, kevésbé pontos eredményt,
2. a megkapott részeredményt átkonvertálják DP-re és DP számokkal tovább számolva egy pontosabb megoldást kapnak.Esetleg még szóba jöhet, hogy egymástól független, eltérő pontosságú számokat használó feladatokat párhuzamosan futtatnak. Pl. gépi tanulás (HP), képfeldogozás (SP), n-body (DP). Ha lenne is ilyen, ki kell mérni, vajon megéri-e, azaz gyorsabb.
-
Loha
veterán
NV-nál a Keplertől kezde az FP64-es (Dupla Pontosságú) számításokat külön FP64-es CUDA magok végzik, amik az FP32-es (SP) számítások alatt pihennek, viszont az FP32-es egységekkel párhuzamosan is képesek FP64-es számításokon dolgozni.
Az FP32-es számításokat a dedikált FP32-es CUDA magok végzik, amik Pascaltól kezdve képesek lesznek dupla sebességgel az FP16-os számításokra is.
AMD-nél (Hawaii) az FP32-es számolóegységek végzik az FP64-es és FP16-os számításokat is, fele, illetve dupla sebességgel.
(#18) MongolZ: Szerintem valószínű, hogy az NV is kísérletezett már korábban a HBM-el, csak nem épített rá terméket mint az AMD.
Új hozzászólás Aktív témák
Hirdetés
- Temu
- Zalaegerszeg és környéke adok-veszek beszélgetek
- Gyúrósok ide!
- Vivo X200 Pro - a kétszázát!
- Kerékpársportok
- Samsung Galaxy S25 Ultra - titán keret, acélos teljesítmény
- Vác és környéke adok-veszek beszélgetek
- Parkside szerszám kibeszélő
- Elite: Dangerous
- Luck Dragon: Asszociációs játék. :)
- További aktív témák...
- Laptop felvásárlás , egy darab, több darab, új , használt ! Korrekt áron !
- BESZÁMÍTÁS! Samsung Odyssey G9 OLED 240Hz Dual QHD 0,03ms monitor garanciával hibátlan működéssel
- Xiaomi Redmi Note 14 Pro 256GB, Kártyafüggetlen, 1 Év Garanciával
- AKCIÓ! ASRock H310CM i3 9100F 8GB DDR4 240GB SSD 1TB HDD GTX 1060 3GB AeroCool Strike-X 500W
- Vidd haza a jövő RAM-ját már ma!
Állásajánlatok
Cég: PCMENTOR SZERVIZ KFT.
Város: Budapest
Cég: CAMERA-PRO Hungary Kft
Város: Budapest