- Google Pixel topik
- Milyen okostelefont vegyek?
- Vékonyabb lett, jobb kamerát kapott, de az akku maradt a régi: itt a Fold7
- Huawei Watch GT 5 Pro - egészség + stílus
- Netfone
- Sony Xperia 1 V - kizárólag igényeseknek
- MIUI / HyperOS topik
- Xiaomi 13T és 13T Pro - nincs tétlenkedés
- Android alkalmazások - szoftver kibeszélő topik
- Honor 200 Pro - mobilportré
Új hozzászólás Aktív témák
-
P.H.
senior tag
A SIMD integer (egész számos) feldolgozást tradicionálisan FPU-műveletnek szokás nevezni, mivel az egész az x87 80 bites regisztereinek 64 bites részén működve indult (az MMX, 3DNow! utasítások MM0-MM7 regisztereken dolgoztak, amik a 8 db FPU-regiszter alsó 64 bitje), mégha időközben már rendelkezésre áll is külön 128, majd 256 bites regiszterkészlet számukra (SSEx esetén XMM0-XMM7 - 64 bit esetén XMM0-XMM15 - és AVX-nek YMM0-YMM15, utóbbiak alsó 128 bitje a számozásnak megfelelő XMM regiszter). Ezért kellett most egy Windows 7 OS-patch, hogy task-váltáskor a teljes 256 bites AVX-regiszterek tartalma mentődjön, anno is kellett a Win98-cal ilyen patch az SSE-regiszterekhez; tehát ez eddig kétszer történt meg ~30 év alatt, ezért nem közismert.
Az AMD ezt a részt - megintcsak tradicionálisan - el is különíti a felépítésben FPU néven, náluk még mindig körül is rajzolható az a CPU-terület, amely a lebegőpontos és az összes SIMD-integer feldolgozást végrehajtja, az Intel viszont ugyanazon végrehajtó egységeken hajtja végre a SISD és SIMD egész számos műveleteket (mostmár a Haswell-lel 256 bites az integer ALU, a képeken 'SSE integer ALU').
Az AVX2 azért fontos, mert a legtöbb esetben a video-, kép- és hangfeldolgozó programok egész adatokon dolgoznak, és a pontosság megtartása végett sokszor egy trükköt alkalmaznak: a feldolgozás elején eggyel nagyobb méretre konvertálják (8 bit byte -> 16 bit word vagy 16 bit word -> 32 bit doubleword) a bemeneti adatokat, majd megszorozzák 8-cal vagy 16-tal: így lebegőpontos helyett fixpontos módon, de 0.125 vagy 0.075 pontossággal számolnak. Ennek jelentősége, hogy Intel-nél egy vektoros integer összeadás/kivonás időigénye SIMD esetben is 1 órajel, addig egy lebegőpontosé 3; vagy egy vektoros lebegőpontos szorzásé 5, míg egy egész számosé 3; a 8/16-tal szorzása és 'visszaosztása' pedig az egész algoritmus elején és a végén 1-1 órajel SSE4.1 utasításokat alkalmazva.
Az már az Intel üzletpolitikáján múlik, hogy az AVX2-vel is megcsinálják-e azt, amit az AVX-szel, hogy kimarad a kisebb (Pnetium/Celeron) CPU-kból. A korábbi integer SSE2 és 4.1 ereje abból adódik, hogy a leglassabb Celeron is ismerte a Pentium 4-es időkben, kár lenne ezt az AVX2-vel kihagyni (főleg annak tekintetében, hogy a Jaguar tud AVX-et, a low-end laptopokban megszokott SB/IB Pentium pedig nem).
Új hozzászólás Aktív témák
- Ritkaság! Csere-Beszámítás! Intel I9 13900KS Processzor!
- AMD Ryzen 7 5700X3D - Új, 1 év garancia - Eladó!
- AMD Ryzen 7 2700X / 8 mag / 16 szál / Beszámítás OK!
- AMD Ryzen R5 2600 / 6 mag / 12 szál / Beszámítás OK!
- BESZÁMÍTÁS! ÚJ AMD Ryzen 5600X 5700X 5800X 5900X processzor 3 év garancia 27% áfa termékbeszámítás
- Csere-Beszámítás! Prémium felsőkategóriás Gamer PC! X870 / R9 9950X / 9070XT / 64GB DDR5
- Gyors, Precíz, Megbízható TELEFONSZERVIZ, amire számíthatsz! Akár 1 órán belül
- Huawei P20 Lite 64GB, Kártyafüggetlen, 1 Év Garanciával
- ÁLTALÁNOS IGAZGATÓHELYETTES tábla
- Apple iPhone 14 Plus 128GB, Kártyafüggetlen, 1 Év Garanciával
Állásajánlatok
Cég: Promenade Publishing House Kft.
Város: Budapest
Cég: PCMENTOR SZERVIZ KFT.
Város: Budapest