- Apple iPhone 16 Pro - rutinvizsga
- Samsung Galaxy A56 - megbízható középszerűség
- Nothing Phone (3a) és (3a) Pro - az ügyes meg sasszemű
- One mobilszolgáltatások
- Mi nincs, grafén akku van: itt a Xiaomi 11T és 11T Pro
- VoLTE/VoWiFi
- Mobil flották
- Xiaomi 15 - kicsi telefon nagy energiával
- Google Pixel 8a - kis telefon kis késéssel
- Samsung Galaxy S25 - végre van kicsi!
Új hozzászólás Aktív témák
-
Abu85
HÁZIGAZDA
Nagyon nem futnak rajta optimálisan a vektorok, ha nem a célzott szélességű hardver van a magban. Rengeteg kézi finomhangolás kellene, amit kb. senki sem akar megcsinálni.
Az SVE abból a szempontból van fényévekkel az AVX előtt, hogy nincs is definiálva a vektormotor hossza. A programozó nem is tudja ezt, és nem is dolgozhat egy bizonyos hosszra. Tehát a hardver oldalán mindegy, hogy 128 bites vagy 2048 bites a vektormotor hossza, mindenféle alacsony szintű finomhangolás nélkül lineárisan skálázódik ugyanannak a kódnak a teljesítménye az egyre szélesedő vektormotorral. Az AVX erre megközelítőleg sem képes. Ilyen formában tök hasztalan vagdalni.
Az alapvető probléma az, hogy az AVX koncepció szintjén nagyon durván el van baszva az alapoknál. Ha valami skálázhatót akarunk, akkor az AVX-et úgy ahogy van ki kell dobni a kukába.
Volt egyébként az x86/AMD64-es magoknál erre megoldás az XOP-vel. Az alapjaiban egy nagyon átgondolt, skálázhatóságra tervezett rendszer volt, csak senki sem támogatta. Most nyilván már erősen visszasírja az ipar, látva azt, hogy az AVX-512-vel nem lehet mit kezdeni.
-
ddekany
veterán
Gondolom nem lenne olyan szempontból értelme, hogy az AVX2-es megvalósítása egy funkciónak kicsit gyorsabb lenne, mint keskeny feldolgozós AVX-512 megvalósítása. Persze értem, kompromisszum, mert viszont ha nagy magra jut a szál, akkor meg gyorsabb. De ez lehet egy ok, amiért nem voltak erre motiváltak.
A másik, hogy az új és kiszélesített regisztereket megvalósítását nem tudod megúszni azzal, hogy a feldolgozás keskenyebb. De nem tudom mennyi overhead ez egy little CPU-ban, lehet nem sok, de ez is bosszantó. Meg nyilván a fele szélességű AVX-512 megvalósítás többi része is visz extra tranzisztorokat.
Ránéztem SVE-re. Alapvetően kihat az utasítás készletre az, hogy a binárisnak ne kelljen feltételeznie semmilyen feldolgozó szélességet, és mégis minden optimálisan legyen "felszeltelve".
Új hozzászólás Aktív témák
- Apple iPhone 16 Pro - rutinvizsga
- TCL LCD és LED TV-k
- Argos: Szeretem az ecetfát
- RAM topik
- Intel Core i3 / i5 / i7 / i9 10xxx "Comet Lake" és i3 / i5 / i7 / i9 11xxx "Rocket Lake" (LGA1200)
- sziku69: Fűzzük össze a szavakat :)
- Vicces képek
- Intel Core i5 / i7 / i9 "Alder Lake-Raptor Lake/Refresh" (LGA1700)
- Kivégzi a Firewire-t az új macOS verzió?
- World of Tanks - MMO
- További aktív témák...
- ÁRGARANCIA!Épített KomPhone Ryzen 7 7700X 32/64GB RAM RTX 5070 GAMER PC termékbeszámítással
- Országosan a legjobb BANKMENTES részletfizetési konstrukció! Dell G15 5530
- 0% THM 3 havi részlet! Beszámítás, 27% áfa, Sapphire Nitro+ RX 9070XT 16GB készletről
- Lenovo Thunderbolt 3 kábel (4X90U90617)
- HP 200W (19.5V 10.3A) kis kék, kerek, 4.5x3.0mm töltők + tápkábel, 928429-002
Állásajánlatok
Cég: Promenade Publishing House Kft.
Város: Budapest
Cég: CAMERA-PRO Hungary Kft
Város: Budapest