Keresés: - AMD CPU-k jövője - amit tudni vélünk - Mobilarena Hozzászólások

Hirdetés

Legfrissebb anyagok

Mobilarena témák

PROHARDVER! témák

IT café témák

GAMEPOD témák

LOGOUT témák

Keresés

Új hozzászólás Aktív témák

#3577 thgergo tag joysefke #3573

Új Válasz 2020-07-14 19:19:20 #3577
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

thgergo

tag

válasz joysefke #3573 üzenetére

Értelmezésem szerint az SSE, AVX stb vektorműveleteknek előnye akkor van, ha a skalár kódban néha néha szükség van vektorműveleteket letudni. Különben ott a GPU/Xeon phi vagy másegyéb gyorsító a célfeladatra pl FPGA.
Pl. Egy vektorművelet offloadja pl gpu-ra: ~8000 ns legalább.
Persze lehet, ugyanez egy APU-nál csak 100-500 ns, de erről nem találtam sehol adatot.
Egy L1, L2, L3 cache lényegesen jobb, 3...20 ns, AVX műveletekkel is! DRAM is 100-200 ns...
Más:
AVX2 és AVX512 kód között csak pár % teljesítményelőnyt tapasztaltam, intel MKL, cascade lake csodákkal. Feltehetően azért, mert az 512 bit széles AVX unit képes egyszerre két db 256 széles AVX2 végrehajtására is... Tehát az igazi előny így elveszik, hagytam a csodába az AVX512 kódot innentől fogva.
Linus @ AVX-512:
Van az AVX512-nak további fregmentációja is. Az intel össze vissza mesterségesen letiltogatja az AVX512 képességeket, drágább termékek felé terelve az embereket:
Xeon Scalable Bronze, Silver, és Gold 5000: 1 db AVX FMA egység
Xeon Scalable Gold 6000, 8000, 9000: 2 db AVX FMA egység
Core i9-ként brandelt verziókban mégis engedélyezve van a 2 db AVX FMA unit (!)

Új hozzászólás Aktív témák

Aktív témák

Hirdetés

Új fizetett hirdetések

Üzleti előfizetők hirdetései

Állásajánlatok

Senior PHP programozó/ fejlesztő

Cég: NetGo.hu Kft.

Város: Gödöllő

Részletek

Laptop Szervizes

Cég: PCMENTOR SZERVIZ KFT.

Város: Budapest

Részletek