- Google Pixel 3 - egyszerűen nagyszerű
- iPhone topik
- Xiaomi 13T és 13T Pro - nincs tétlenkedés
- Huawei P30 Pro - teletalálat
- Fotók, videók mobillal
- Samsung Galaxy S24 Ultra - ha működik, ne változtass!
- Motorola Edge 40 - jó bőr
- Yettel topik
- Samsung Galaxy S21 FE 5G - utóirat
- Google Pixel 8 Pro - mestersége(s) az intelligencia
Hirdetés
-
VR játék lesz az Alien: Rogue Incursion
gp Az év végén érkező program PC-re, Meta Quest 3-ra és PlayStation VR2-re érkezik a tervek szerint.
-
Rossz üzlet az EV-kölcsönzés
it Küszködik az EV-kölcsönzés miatt a Hertz Global, még több EV-t adnak el.
-
Toyota Corolla Touring Sport 2.0 teszt és az autóipar
lo Némi autóipari kitekintés után egy középkategóriás autót mutatok be, ami az észszerűség műhelyében készül.
-
Mobilarena
OLVASD VÉGIG ALAPOSAN MIELŐTT ÚJ HOZZÁSZÓLÁST ÍRNÁL!!!
Új hozzászólás Aktív témák
-
#95904256
törölt tag
válasz Zeratul #1701 üzenetére
Pedig illene nekik, ugyanis az x87 utasítások jó része megfeleltethető egy-egy SSE skalár műveletnek is ( mindössze a cél/forrás regiszterek mások ).
Egyébként úgy tudom hogy a K8 FPU trigonometriában gyorsabb mint a K7-es.
Aztán semmi másban, vagy még rosszabbak is a késleltetései... -
dezz
nagyúr
válasz #95904256 #1702 üzenetére
Mitől ennyivel gyorsabb a Core2 x87-ben? Annak is csak 1 FMUL/FDIV és 1 FADD egysége van. Azok hatékonysága ennyivel jobb?
Viszont, van itt az FPU-val kapcsolatban valami érdekesség a K10-ben: nem csak az eredeti FPU lett némileg nagyobb (a 128 bitesre bővítés miatt), hanem minden maghoz tartozik egy 2. FPU blokk is! (Nincs kéznél a die fotó linkje, de gondolom, megvan a kép neked is, vagy valamelyik korábbi hsz-ben megtalálható.) Nem lehet, hogy az valami ''titkos fegyver'', amit csak újrafordítás által lehet kihasználni?
[Szerkesztve] -
dezz
nagyúr
Na, erről a képről beszéltem: [link]
Vagy az van, hogy valójában közel 2x-esére duzzadt [majdnem azt írtam, duzzant - nem is rossz jó ] az FPU a szélesítés miatt, és a sárga keret eredetileg rosszul lett elhelyezve, azaz valójában nincs itt semmilyen ''2nd FP unit''?
[Szerkesztve] -
#95904256
törölt tag
Mitől ennyivel gyorsabb a Core2 x87-ben? Annak is csak 1 FMUL/FDIV és 1 FADD egysége van.
Mennyi az az ennyi? És ki mondta hogy gyorsabb, és mihez képest?
x87-es kódban a K7/K8/Core(2) közel egyformán teljesít. Bár van egy kis eltérés itt-ott, de ezek kb. kompenzálják is egymást. Talán egy pici előnyben van a Core(2) a gyorsabb összeadás/kivonás miatt, mivel az az egyik leggyakoribb művelet. -
dezz
nagyúr
válasz #95904256 #1705 üzenetére
Neeem! Nézd meg te is figyelmesebben! Szerk: Akár a sárga keretes magnál is ott lehetne ez a felirat, mivel ott is ott van, a kereten kívül.
#1706: Tudtommal azonos órajelen számottevően gyorsabb a Core2 x87-ben is, lásd pl. SuperPI eredmények, és más x87 alapú programok.
[Szerkesztve] -
#95904256
törölt tag
-
-
dezz
nagyúr
És hogy mihez képest 2x akkora (tehát a keretben, illetve a részletezett képen látható, plusz az a ''2.''): hát a Rev. F-ben lévőhöz képest. Vagy másként, a ''1st'' és a ''2nd'' összesen 2x akkora, mint a ''1st'' egyedül.
#1710: Légyszi értsd már meg, hogy az FPU (a ''1st'') már eleve ott van a magban. Nem ittad meg még a kévédat, vagy mi van?
szerk: Továbbá azt is láthatod, hogy a ''2nd''-ben nincs benne minden, mint ami a ''1st''-ben, hiányzik kb. a negyede.
[Szerkesztve] -
#95904256
törölt tag
dezz:Viszont, van itt az FPU-val kapcsolatban valami érdekesség a K10-ben: nem csak az eredeti FPU lett némileg nagyobb (a 128 bitesre bővítés miatt), hanem minden maghoz tartozik egy 2. FPU blokk is! (Nincs kéznél a die fotó linkje, de gondolom, megvan a kép neked is, vagy valamelyik korábbi hsz-ben megtalálható.) Nem lehet, hogy az valami ''titkos fegyver'', amit csak újrafordítás által lehet kihasználni?
Na, arról lehet szó hogy amit eredetileg linkeltél képet a ''2nd FP unit'' egység felirattal az a 128 bitre bővített SSE műveletek felső 64 bitjéért felelős egység.
[Szerkesztve] -
dezz
nagyúr
válasz #95904256 #1712 üzenetére
Na ebben igazad van, jobban megnézve (amit időközben én is megtettem ) tényleg ott van az a ''2nd unit'' is. Akkor tehát arról van szó, hogy a sárga keretből ezt véletlenül kihagyták.
#1713: Lehetséges. Bár fura, hogy nem egy-egy nagy, 128 bites egység van, hanem 2x 2db 64 bites...
Csak azt nem tudom, hogy valósítják így meg a shuffle-ket. Bár arra a Core2-ben is külön egységek vannak, de itt ilyenek nincsenek...
[Szerkesztve] -
#95904256
törölt tag
-
dezz
nagyúr
Közben - ha jól - látom, hogy shuffle csak az SSSE3-ban van, ami (szintén) nincs AMD vonalon. Úgy tűnik, SSE3-ig tartott a kompatibilitás ezen a téren, most meg már eleve külön utakon indulnak el. (Bár még nem hasonlítottam össze az SSE4-et és 5-öt, hasonlítanak-e valamennyire.) Ja, egyébként több SSE4 utasítás is 3 operandusos, csak a 3. operandus mindig az XMM0, nem választható, így nem szerepel a szintaxisban.
[Szerkesztve] -
dezz
nagyúr
válasz #95904256 #1720 üzenetére
Tegyük hozzá, a kitevő ''biased'', és a mantissza helyett itt ''significand'' van (vagy legalábbis itt annak hívják).
1.5 16-Bit Floating-Point Data Type
SSE5 introduces a new 16-bit floating-point data type and two instructions (CVTPS2PH and CVTPH2PS) to convert 16-bit floating-point values to and from single-precision format.
The 16-bit floating-point data type, shown in Figure 1-4 on page 8, includes a 1-bit sign, a 5-bit exponent with a bias of 15 and a 10-bit significand. The integer bit is implied, making a total of 11 bits in the significand. The value of the integer bit can be inferred from the number encoding. Table 1-10 on page 8 shows the floating-point encodings of supported numbers and non-numbers. -
Thrawn
félisten
Different songs for different moods. łłł DIII Thrawn#2856 łłł Look! More hidden footprints! łłł D4BAD łłł WoT: s_thrawn łłł
-
Hakuoro
aktív tag
-
rauschie
senior tag
a k10 kétmagon gyorsabb lesz a c2nél?
mármint ugye a natív négymag előny, de a kétmag az intelnél is natív?
persze nem tudni semmit még, de mire lehet számítani? -
rauschie
senior tag
válasz Hakuoro #1726 üzenetére
tiszta.
de a k10 kétmagon vajon gyorsabb lesz? mert a nagy pénzeket tuti hogy az intel sem a kentsfieldből szakítja, inkábbcsak(''csak''??) presztizskérdés. nem értek a processzorokhoz, de azt mindenki tudja, hogy a k10nek ütnie kell, mert ha nem akkor gondok lehetnek. azonos órajelen +10% akár elég lenne, csak ugye az intel köztudottan jóval tőkeerősebb cég és nekik nem lenne akkora érvágás árakkal korrigálni a teljesítmánykülömbséget mint most az amd-nek. -
Joshi
titán
-
slett27
addikt
Ez alapján a teszt alapján (foglalmam sincs milyen FPU-t tesztelő programmal teszteltek ), a nyers számításban a Barcelona előnye azonos órajelen kb 30%. A Penryn átlagban 10-15%-al lesz gyorsabb a Core2-nél, tehát 30-15=15% gyorsulás ?
Ismét csak találgatás, de ha ez igaz ez kevés lesz. Amúgy az ár is legalább annyira fog dominálni, mint a sebesség, fogyasztás ~10W különbség azonos kategóriájú prociknál, hmmm, hát nemtudom, harmadlagos...
[Szerkesztve]"Ismerősöm szerint az ő Logitech Z-623-as rendszere (bizonyos esetekben) jobban szól, mert felére feltekerve is adja a mélyet, szétveri a házat a gettób@szó számokban !" by Rasiel :DDD
-
dezz
nagyúr
''AM2 és AM2+ között valami különbségnek lennie kell, egyébként nem adtak volna más jelölést neki.''
Szótár->visszafelé kompatibilitás.
Különbségek:
AM2: single power plane, HT1.0
AM2+: split power planes (külön fesz a magoknak és az IMC/NB-nek), HT3.0
''Az AM2 HT link sebessége biztosan szűk keresztmetszet lesz a Phenomnak''
Már miért lenne az? Most ki tudod használni fullosan akár a HT1.0-át? (Ugye tudod, hogy a memória-elérésben ez nem számít?)
''de gondolom alacsonyabb órajelen is üzemelni fog''
''viszont így nem kapunk teljes értékű processzort''
LOL, miért, ha eleve AM2 lenne, akkor többet tudna???
Miért baj, hogy újabb alaplapban 1-2 új fícsör is lesz?
7600GT: BIOS frissítés kell majd, más nem.
slett27: Szerintem 2 vs. 2,3 GHz esetén 30% az azonos órajelen több, mint 30%.
Egészen pontosan (78/60) * (2,3/2) = 1,495 -> tehát 50%-kal gyorsabb azonos órajelen (ebben a tesztben)...
Gondolom, ez valami specFP, vagy más ipari szabvány teszt, nem csak egy in-house hack.
[Szerkesztve]
[Szerkesztve] -
#95904256
törölt tag
válasz slett27 #1737 üzenetére
Szerintem FPU teljesítményben lesz egy kis előnye a K10-nek, de nem sok.
K10 FPU előnyei:
- egyszerre indított szorzás és összeadásnál lehet két memória operandus
- nem illeszkedő memória operandusok kezelése (128 bit)
- gyorsabb szorzás (dupla pontosságnál)
- gyorsabb négyzetgyökvonás
- gyorsabb sin/cos számítás
- gyorsabb hatványozás ( ez nem 100% )
Penryn FPU előnyei:
- gyorsabb összeadás
- gyorsabb komparálás
- gyorsabb osztás
- gyorsabb valós <-> egész konverziók (SSE, FIxxx)
- gyorsabb tanges képzés
[Szerkesztve] -
dezz
nagyúr
válasz #95904256 #1733 üzenetére
Ez kifelejtettem. Már most ki lehet próbálni, mennyit számít a HT: nyomjatok egy tesztet úgy, hogy visszaveszitek a HT szorzóját. 800MHz vs. 1000 MHz még kb. semmit sem számít.
#1739: Gondolom, itt az x87 kódra gonolsz (régi v. új regiszterekkel), mert a SIMD kód végrehajtása is az FPU dolga.
Nos, szerintem 1-szálas x87-ben kb. egálban lesznek, vagy akár a Core még gyorsabb is lesz ebben (az állítólagos SuperPI és Cinebench eredményeket nézve). Többszálas esetben viszont a natív design és a közös L3 sokat dobhat a dolgokon K10-nél.
SIMD-ben jóval gyorsabb lesz a K10, mint a Core2, viszont nagy kérdés, hogy alakul a K10 vs. Penryn eset. Ugyan SSE3-ig itt is gyorsabb lesz a K10, azoban SSE4 használatánál már esetenként szépen elhúzhat a Penryn.
[Szerkesztve] -
dezz
nagyúr
A linkedre kattintva nekem nem indul el semmi ''magától'', de feltételezem, a ''CPU face off: AMD Opterons vs. Intel Clovertown'' videora gondolsz. Nos, akkor olvasd csak el a #1738-ast...
Egyébként a specFP, illetve a többi ipari szabvány tesztprogram nem csak sima x87 kód (mint pl. a SuperPI), hanem az egész procit, sőt a memóriát is igénybe veszi.
[Szerkesztve] -
slett27
addikt
akosf : a kimerítő választ
dezz: már megint rosszul számoltam.
Remélem az FPU erőssége megmutatkozik játékokban, nekem az lenne a fontos."Ismerősöm szerint az ő Logitech Z-623-as rendszere (bizonyos esetekben) jobban szól, mert felére feltekerve is adja a mélyet, szétveri a házat a gettób@szó számokban !" by Rasiel :DDD
-
#95904256
törölt tag
dezz:#1739: Gondolom, itt az x87 kódra gonolsz (régi v. új regiszterekkel), mert a SIMD kód végrehajtása is az FPU dolga.
Nem. FPU alatt értettem itt az x87 és SSE műveleteket is.
Épp azért ahogy írtad is: SIMD kód végrehajtása is az FPU dolga
A legtöbb SIMD utasítás lassabb K10-en mint Core2-ön. -
dezz
nagyúr
válasz #95904256 #1747 üzenetére
Hmm, akkor miért nem említetted a Penrynnél az SSE4-et? Illetve a már Core2-nél is meglévő SSSE3-at (pl. shuffle-k).
Vagy K10-nél a 256 bites elérésű L1i-t (bár nem tudom, ez mennyit számít - de gondolom, nem véletlenül csinálták, és emlegetik elsősorban az FPU-val kapcsolatban).
''A legtöbb SIMD utasítás lassabb K10-en mint Core2-ön.''
Ezt mire alapozod? Az utasítások latency értékeinek összehasonlítására?
Mindenesetre, nem tudom, ez hogy lehetne, ha egyszer a Core2 jóval kevesebb, mint 2x olyan gyors, mint a K8, miközben a K10 kb. 2x gyosabb lesz SIMD-ben, mint a K8. Meg ugye itt van ez a bizonyos teszt, amiben 50%-kal gyorsabb azonos órajelen a K10, mint a Core2 - ez mitől lehet akkor? (A natív 4-magosság és a L3 önmagában nem igazán lenne elég ahhoz, hogy a lassabból másfélszer gyorsabbat csináljon [kivéve, ha befér az egész kód+adatok a cache-ekbe, de a specFP-kre, és társaikra ez nem jellemző].)
[Szerkesztve] -
#95904256
törölt tag
dezz:Hmm, akkor miért nem említetted a Penrynnél az SSE4-et? Illetve a már Core2-nél is meglévő SSSE3-at (pl. shuffle-k).
Kellett volna? Ez legyen a te dolgod.
Egyébként nem hiszem hogy ezektől kapna szárnyra a Penryn FPU-ja.
Ugyanis az FPU-ról volt szó...
dezz:Vagy K10-nél a 256 bites elérésű L1i-t.
Ennek már elég nehéz meghatározni az FPU-ra gyakorolt teljesítményét.
Szerinted mennyire jelentős? Egyébként nem említettem a beépített memóriavezérlőt sem.
akosf:A legtöbb SIMD utasítás lassabb K10-en mint Core2-ön.
dezz:Ezt mire alapozod? Az utasítások latency értékeinek összehasonlítására?
Igen, arra. Ennél egyértelműbb kapcsolatot nem is lehetne találni.
Vagy te miben mérenéd az utasítások végrehajtási sebességét?
dezz:Mindenesetre, nem tudom, ez hogy lehetne, ha egyszer a Core2 jóval kevesebb, mint 2x olyan gyors, mint a K8, miközben a K10 kb. 2x gyosabb lesz SIMD-ben, mint a K8. Meg ugye itt van ez a bizonyos teszt, amiben 50%-kal gyorsabb azonos órajelen a K10, mint a Core2 - ez mitől lehet akkor?
Aki akarja futtassa csak ezt a tesztet és gyönyörködjön benne hogy 50%-kal gyorsabb a K10. Szerintem még mindig feladat függő hogy mikor melyik CPU szerepel jobban. Vagy úgy gondolod hogy ezt az 50%-ot minden másban is hozni fogja? -
dezz
nagyúr
válasz #95904256 #1749 üzenetére
''Kellett volna?''
Hát már hogy ne kellett volna, ha - természetesen - minden lényegeset fel akarsz sorolni...?
''Egyébként nem hiszem hogy ezektől kapna szárnyra a Penryn FPU-ja.''
Hát már hogy ne, ha egyszer így bizonyos műveletek gyorsabban elvégezhetők?
''Ugyanis az FPU-ról volt szó...''
Igen, és? Most beszéltük meg, hogy a SIMD is az FPU-hoz tartozik.
''Ennek már elég nehéz meghatározni az FPU-ra gyakorolt teljesítményét.
Szerinted mennyire jelentős? Egyébként nem említettem a beépített memóriavezérlőt sem.''
Éppen most írtam le, hogy nem tudom, ez mennyit számít, de az AMD az FPU-val kapcsolatban emlegette, és hogy ezért írtam ide.
''Igen, arra. Ennél egyértelműbb kapcsolatot nem is lehetne találni.''
Oké, csak nem voltam benne biztos, ezért megkérdeztem.
''Vagy te miben mérenéd az utasítások végrehajtási sebességét?''
Az egyes utasítások végrehajtási idejét nyilván ebben. Mondjuk nem csak ez számít.
''Aki akarja futtassa csak ezt a tesztet és gyönyörködjön benne hogy 50%-kal gyorsabb a K10. Szerintem még mindig feladat függő hogy mikor melyik CPU szerepel jobban. Vagy úgy gondolod hogy ezt az 50%-ot minden másban is hozni fogja?''
Szerinted ha így gondolnám, miért emeltem ki minden esetben, hogy ebben a tesztben?
Akkor a kérdés kicsit szájbarágósabban: hogy lehetne akár 1 (spec-féleség, de nem túl spéci ) tesztben 50%-kal gyorsabb FP műveletekben a K10, ha valójában lassabb FP műveletekben?
ps. a megszólított (boldos) kiemelése csak akkor szükséges, ha másnak is válaszolsz egy hsz-en belül. Az OFF tag használatát meg érdemes lenne meghagyni az OFF dolgoknak...
[Szerkesztve]
Új hozzászólás Aktív témák
A topikban az OFF és minden egyéb, nem a témához kapcsolódó hozzászólás gyártása TILOS!
Az ide nem illő hozzászólások topikja:[link]
MIELŐTT LINKELNÉL VAGY KÉRDEZNÉL, MINDIG OLVASS KICSIT VISSZA!!
A topik témája:
Az AMD éppen érkező, vagy jövőbeni új processzorainak kivesézése, lehetőleg minél inkább szakmai keretek között maradva.
- EA Sports WRC '23
- exHWSW - Értünk mindenhez IS
- sh4d0w: Rebel Moon - Ne nézd meg!
- Filmvilág
- Facebook és Messenger
- Politika
- NVIDIA GeForce RTX 3080 / 3090 / Ti (GA102)
- Google Pixel 3 - egyszerűen nagyszerű
- antikomcsi: Való Világ: A piszkos 12 - VV12 - Való Világ 12
- Háztartási gépek
- További aktív témák...