Hirdetés
Új hozzászólás Aktív témák
-
thgergo
tag
válasz
joysefke
#3573
üzenetére
Értelmezésem szerint az SSE, AVX stb vektorműveleteknek előnye akkor van, ha a skalár kódban néha néha szükség van vektorműveleteket letudni. Különben ott a GPU/Xeon phi vagy másegyéb gyorsító a célfeladatra pl FPGA.
Pl. Egy vektorművelet offloadja pl gpu-ra: ~8000 ns legalább.
Persze lehet, ugyanez egy APU-nál csak 100-500 ns, de erről nem találtam sehol adatot.
Egy L1, L2, L3 cache lényegesen jobb, 3...20 ns, AVX műveletekkel is! DRAM is 100-200 ns...
Más:
AVX2 és AVX512 kód között csak pár % teljesítményelőnyt tapasztaltam, intel MKL, cascade lake csodákkal. Feltehetően azért, mert az 512 bit széles AVX unit képes egyszerre két db 256 széles AVX2 végrehajtására is... Tehát az igazi előny így elveszik, hagytam a csodába az AVX512 kódot innentől fogva.Linus @ AVX-512:
Van az AVX512-nak további fregmentációja is. Az intel össze vissza mesterségesen letiltogatja az AVX512 képességeket, drágább termékek felé terelve az embereket:
Xeon Scalable Bronze, Silver, és Gold 5000: 1 db AVX FMA egység
Xeon Scalable Gold 6000, 8000, 9000: 2 db AVX FMA egység
Core i9-ként brandelt verziókban mégis engedélyezve van a 2 db AVX FMA unit (!)
Új hozzászólás Aktív témák
- Samsung SyncMaster 930BF 19" 1280 x 1024 DVI!
- Azonnali készpénzes AMD Radeon RX 6000 sorozat videokártya felvásárlás személyesen/csomagküldéssel
- Gamer/streamer mikrofon, állvány és USB HUB kitűnő árakon!
- Eladó Samsung Galaxy S22 8/128GB / 12 hó jótállás
- Bontott, vadiúj, SPACE BLACK MacBook Pro 14" M4 10C/10G 16GB 512GB Gar.: 1 év APPLE világgarancia
Állásajánlatok
Cég: NetGo.hu Kft.
Város: Gödöllő
Cég: PCMENTOR SZERVIZ KFT.
Város: Budapest


