- Honor Magic6 Pro - kör közepén számok
- Samsung Galaxy S23 Ultra - non plus ultra
- Ilyen lehet a Samsung Galaxy Watch7 Ultra
- Yettel topik
- Samsung Galaxy S23 és S23+ - ami belül van, az számít igazán
- iPhone topik
- Bivalyerős lett a Poco F6 és F6 Pro
- MIUI / HyperOS topik
- Egyre közelebb a Poco F6 startja
- Google Pixel 6/7/8 topik
Hirdetés
-
Közönségkedvenc Galaxy vált One UI 6.1-re
ma Ezen a héten sem tétlenkedett a Samsung szoftverfejlesztő csapata.
-
Beszáll a kézikonzolok világába a PC-s házairól elhíresült az Antec
ph Csak éppen nem saját fejlesztésű dizájnnal, hanem korábbi koncepció átnevezésével.
-
DOOM: The Dark Ages címmel jön a sorozat új része?
gp Lehetséges, hogy a következő játék az eddigiektől drasztikusan különböző helyszíneken és időszakban játszódik.
-
Mobilarena
OLVASD VÉGIG ALAPOSAN MIELŐTT ÚJ HOZZÁSZÓLÁST ÍRNÁL!!!
Új hozzászólás Aktív témák
-
#95904256
törölt tag
-
#95904256
törölt tag
válasz slett27 #1737 üzenetére
Szerintem FPU teljesítményben lesz egy kis előnye a K10-nek, de nem sok.
K10 FPU előnyei:
- egyszerre indított szorzás és összeadásnál lehet két memória operandus
- nem illeszkedő memória operandusok kezelése (128 bit)
- gyorsabb szorzás (dupla pontosságnál)
- gyorsabb négyzetgyökvonás
- gyorsabb sin/cos számítás
- gyorsabb hatványozás ( ez nem 100% )
Penryn FPU előnyei:
- gyorsabb összeadás
- gyorsabb komparálás
- gyorsabb osztás
- gyorsabb valós <-> egész konverziók (SSE, FIxxx)
- gyorsabb tanges képzés
[Szerkesztve] -
#95904256
törölt tag
dezz:#1739: Gondolom, itt az x87 kódra gonolsz (régi v. új regiszterekkel), mert a SIMD kód végrehajtása is az FPU dolga.
Nem. FPU alatt értettem itt az x87 és SSE műveleteket is.
Épp azért ahogy írtad is: SIMD kód végrehajtása is az FPU dolga
A legtöbb SIMD utasítás lassabb K10-en mint Core2-ön. -
#95904256
törölt tag
dezz:Hmm, akkor miért nem említetted a Penrynnél az SSE4-et? Illetve a már Core2-nél is meglévő SSSE3-at (pl. shuffle-k).
Kellett volna? Ez legyen a te dolgod.
Egyébként nem hiszem hogy ezektől kapna szárnyra a Penryn FPU-ja.
Ugyanis az FPU-ról volt szó...
dezz:Vagy K10-nél a 256 bites elérésű L1i-t.
Ennek már elég nehéz meghatározni az FPU-ra gyakorolt teljesítményét.
Szerinted mennyire jelentős? Egyébként nem említettem a beépített memóriavezérlőt sem.
akosf:A legtöbb SIMD utasítás lassabb K10-en mint Core2-ön.
dezz:Ezt mire alapozod? Az utasítások latency értékeinek összehasonlítására?
Igen, arra. Ennél egyértelműbb kapcsolatot nem is lehetne találni.
Vagy te miben mérenéd az utasítások végrehajtási sebességét?
dezz:Mindenesetre, nem tudom, ez hogy lehetne, ha egyszer a Core2 jóval kevesebb, mint 2x olyan gyors, mint a K8, miközben a K10 kb. 2x gyosabb lesz SIMD-ben, mint a K8. Meg ugye itt van ez a bizonyos teszt, amiben 50%-kal gyorsabb azonos órajelen a K10, mint a Core2 - ez mitől lehet akkor?
Aki akarja futtassa csak ezt a tesztet és gyönyörködjön benne hogy 50%-kal gyorsabb a K10. Szerintem még mindig feladat függő hogy mikor melyik CPU szerepel jobban. Vagy úgy gondolod hogy ezt az 50%-ot minden másban is hozni fogja? -
#95904256
törölt tag
akosf:''Ugyanis az FPU-ról volt szó...''
dezz:Igen, és? Most beszéltük meg, hogy a SIMD is az FPU-hoz tartozik.
Na, ne bosszants...
A SIMD utasításoknak csak egy része lebegőpontos, amelyeket ugyanaz az FPU hajt végre mint amelyik az x87 utasításokat. A másik része meg nem lebegőpontos és ezeket nem az FPU hajtja végre. Pl. ez utóbbiak közé tartozik az SSSE3 és az SSE4 utasítások.
Ajánlom figyelmedbe ezt az ábrát: [link]
A port0, port1, port2 körül nézelődj...
dezz:Szerinted ha így gondolnám, miért emeltem ki minden esetben, hogy ebben a tesztben? Akkor a kérdés kicsit szájbarágósabban: hogy lehetne akár 1 tesztben 50%-kal gyorsabb FP műveletekben a K10, ha valójában lassabb FP műveletekben?
Ezt a hozzászólást olvastad? : [link]
ps: A megszólítottat azért írom oda és emelem ki vastagon mert olvashatóbbá teszi a szöveget. Az általad használt megoldás nehezebben átlátható, legalábbis nekem biztosan. Feltételezem másnak is.
Az OFF-tag használatát épp ezért használtam, de látom egyeseket zavar. Átgondoltam a dolgot. Tiszteletlenségnek tűnhet hogy valakit ''OFF''-ban idézek, így a jövöben ezt nem teszem. Köszönet a szemléletkiigazításért...
ps2: ... -
#95904256
törölt tag
-
#95904256
törölt tag
válasz robyeger #1790 üzenetére
Két mag esetén már a Win2000 is képes arra hogy terhelés szerint ossza ki a magokra a feladatokat, így míg az egyik magon futnak a Windows dolgai, addig a másikon futhat a teszt jóval kisebb mérési hibával mint ha egy magon futtatnám a Windows-t. Ezt már egyszer próbáltam és az eredmények ezt támasztják alá.
Egyébként interrupt maszkolt DOS-t (Win98?) kívánok használni a teszthez. Ami egyébként garantálja hogy a második mag cseppet sem fog zavarni.
robyeger: másodsorban a 2Ghz elég kevés
Miért is? A teszt nincs időhöz kötve. Legfeljebb tovább fog tartani. Sőt, ha egy mérés idejét minél nagyobbra veszem annál pontosabb eredmény kapok. Én meg nem sietek. Ráadásul így biztosabb hogy a RAM nem lesz szűk keresztmetszet.
[Szerkesztve] -
#95904256
törölt tag
válasz robyeger #1799 üzenetére
robyeger: Azt hogy pl. egy SSE utasítás miként terheli a magokat (milyen mikroutasítások sorozataként hajtja végre a proci) nem tudod befolyásolni, hiába DOS alatt futatod az x86-os utasításaid.
Valóban nem tudom befolyásolni. De nem is akarom. Elég tudnom hogy ha egy programot elindítok az egyik magon, akkor annak az összes utasítása azon a magon fog lefutni.
robyeger: A magasabb órajel azért kell, hogy a különböző alapórajel és szorzó beállítások között markánsabb transzfer teljesítmény különbség képződjön.
Valami konkrétumot tudnál mondani?
Mert pl. a 2000MHz-es mag esetén az álábbi beállítások tesztelésére gondoltam:
CPU=10*200=2000 ; HT=5*200=1000 ; RAM=2000/5=400
illetve
CPU=8*250=2000 ; HT=4*250=1000 ; RAM=2000/5=400
Itt 25%-os a CPU alapórajelének különbsége úgy hogy a többi órajlfüggő komponens változatlan frekvencián működhet, így a mérési hiba szinte jelentéktelen. És a lényeg az hogy magórajel változásának és a mérési hiba hányadosának értéke legyen minél nagyobb. Ennek a hányadosnak kell ''látványosnak'' lennie hogy az eredményt ne lehessen kifogásolni. Itt a mérési hiba közel nulla lesz, vagyis ha kimérek valami különbséget ( amiben egyelőre kételkedem hogy létezik ), akkor azt el kell fogadni hogy úgy van.
szerk.: Bocsánat, lehet hogy a RAM-nak osztója van...
[Szerkesztve] -
#95904256
törölt tag
Na, érzeni már a lőporszagot?
-
#95904256
törölt tag
válasz Dare2Live #1862 üzenetére
Dare2Live:Csakhát k10 nagyon nemveri el Xeonokat ill ahol elveri ott a régi opi is elverte.
Bocsánat hogy kérdezősködöm, de a ''nagyon nem veri''-t hogy kell nálad értelmezni?
a, nagyon nem veri = kicsit veri
b, nagyon nem veri = el sem éri a szintjént
c, nagyon nem veri = messze elmarad tőle
d, egyéb... -
#95904256
törölt tag
Szerintem nem az IMC a legnagyobb előnye az AMD-nek az Intel-lel szemben, hanem a szuper gyors HT busz. Ha jól sejtem ez az a pont amire az Intel-nek nincs versenyképes megoldása. Kár hogy nem csücsül mindenki otthonában egy 4P-s rendszer...
Az AMD elsődlegesen a szerverek piacára gyúr... -
#95904256
törölt tag
Én az AMD processzorok Intel-lel szembeni legnagyobb előnyéről beszéltem.
Ebből meg csak egy lehet. Melyik legyen, IMC vagy HT busz?
Az AMD IMC-je az Intel külső memóriavezérlőjével szemben akár 30%-kal nagyobb teljesítményre képes. Főképp a kisebb késleltetési idő miatt.
A HT busz megfelelője Inteles vonalon szintén a külső memóriavezérlő, hiszen ezen keresztül zajlik a processzorok ( nem a 2(4) mag ) közti kommunikáció. Itt az AMD megoldás előnye még nagyobb a fenti 30%-nál. Nem?
szerk.: Igaz, hogy IMC nélkül nehéz lenne elképzelni a HT buszt.
[Szerkesztve] -
-
#95904256
törölt tag
-
#95904256
törölt tag
Ezt a L3-L2 cache-s dolgot nem értem.
Mi a trükk abban hogy az L3-ban való kereséssel együtt nem mozdul rá az IMC az adott címre? Hisz az L2 és L3 mérete közel azonos ( 512kB vs. ~512kB ). Ha az L2-ben nem találja meg a keresett adatot, alig több az esélye hogy L3-ban benne van. Az csak akkor lenne jelentős ha az L3 mérete jóval nagyobb lenne az L2-nél.
Aki ismeri a cache találatok eloszlását, az nagyon jól tudja hogy a cache-nek egy kis részén van a legtöbb találat ( ezért is van egy gyorsabb L1 az L2 előtt ), a nagyobb részén pedig egyre csekélyebb. Ahhoz hogy a csekély mértékű találatokból is találat legyen, bizony nagy méretű memóriára van szükség.
Mi késztette az AMD-t hogy beáldozzák a gyors memóriahozzáférést a gyors magközi kommunikációért? -
#95904256
törölt tag
De ennyi erővel megoldhatták volna azt is hogy a 4x512kB L2-ből gyúrnak össze egy 2MB-os osztott L2-őt és akkor kapunk egy még gyorsabb magközi átvitelt valamint megmarad a gyors memóriahozzáférés is. Igaz, a teljes cache méret a fele lenne, de kisebb lenne a magméret is. Mint ismeretes az IMC miatt a cache mérete nem túl jelentős az AMD processzoroknál. ( Hasonlítsd csak össze a 2x512kB-os illetve 2x1MB-os Windsor magos processzorok eredményeit... )
-
#95904256
törölt tag
Természetesen egyszerűbb tervezni egy új egységet és hozzátoldani a régihez, mint a régit módosítani. A napi gyakorlat igazolja...
Részemről nem is gond hogy ez toldozott-foldozott feelinget kölcsönöz a K10-nek...
Viszont kár hogy ez a teljesítményen is meglátszik...
Az L3 nélküli változatokról mit tudni még?
Van olyan élő roadmap amin szerepel ilyesmi? -
#95904256
törölt tag
válasz VaniliásRönk #1934 üzenetére
Imádom az efféle okosságokat.
-
#95904256
törölt tag
Mit értesz az alatt hogy x86-os arhitektúra?
Illetve az alatt hogy kezd kimúlni?
Szerintem az x86-os utasításkészlettel nincs baj. Tény hogy egy rögzített utasítás és opernadus hosszúságú utasításkészlet sokmindent egyszerűsítene ( rövidebb pipeline, egyszerűbb dekóderek, egyszerűbb out of order szervezés ), de ez csak egy bizonyos mértékű hátrányt jelent, nem korlátot.
Mint ismeretes az x86-os utasításkészletet sikerült már eddig is bővíteni ( x87, MMX, SSEx, 3DNow! és az aprók ), így a fejlesztésére a jövőben is lehetőség van. Akár több operandussal is. Gondolok itt pl. az AMD-féle SSE5-re vagy a CPU építendő GPU erőforrásaira.
A számítási teljesítmény legnagyobb ( na ebbe, valaki megint bele fog kötni ) korlátja maga a programkód, illetve az abban szereplő függőségek. Ezt csak úgy lehet feloldani ha sikerül a kódot párhuzamosítani. Ekkor pedig arra van szükség hogy minnél több végrehajtó egység legyen. Az már ''mellékes'' hogy x86-os utasításokkal vagy mással vezéreljük ezeket. -
#95904256
törölt tag
Egy AMD marketinges azt mondaná hogy negatív nyereséget értek el...
szerk.: Na meg persze egy AMD-fan is...
[Szerkesztve] -
#95904256
törölt tag
válasz Michell #1967 üzenetére
Hm... nem egy embert ismerek aki úgy vesz számítógépet hogy Dell-t, HP-t, IBM-et vagy hasonló gépet vett, vagy csak simán a Tesco-sat... még csak azt sem tudja hogy milyen processzor van benne... sőt még azt sem hogy mi az a processzor... nem hogy tuningpotenciál.
A másik terület ahol egy halom processzor elkel azok a különféle alkalmazások. Pl. szerverek, számítógépvezérlésű gépek, beágyazott rendszerek. Itt meg egyszerűen szinte senki sem kockáztatja meg hogy a gyári specifikációban megadottakat túllépje, mert ha valami ''baj'' történik ebből adódóan akkor súlyos kártérítési összegeket varrhatnak a nyakába.
Marad valóban egy kis réteg, aki elmondhatja XY szomszédnak hogy mi a jó, mi a frankó. De olyat is láttam aki csak okoskodik. Belőlük talán még több is van mint azokból akik nem csak tapasztalják a dolgokat, de értik is...
Kíváncsi lennék hogy pl. az összes eladott processzor hány százalékát tuningolják, de nagy jó esélye van annak hogy úgy kezdődik ez a szám hogy ''nulla egész...''.
[Szerkesztve] -
#95904256
törölt tag
-
#95904256
törölt tag
Használt már valaki Barcelona magos processzort?
Vagy ez csak sokára jut el hozzánk? -
#95904256
törölt tag
Ezt a selejt dolgot hogy érted?
A cikkben az áll hogy ez egy újratervezett hárommagos chip lesz. Tehát nem a selejtes négymagosokból készül.
Vagy arra gondolsz hogy a 13%-kal kisebb lapkaméret miatt javul a kihozatal? Elvileg pár százalékos javulás tényleg összejöhet, attól függően hogy mennyi és milyen eloszlású a kritikus hiba a wafferen... -
#95904256
törölt tag
válasz VaniliásRönk #2029 üzenetére
A lényeg, hogy gazdasági megfontolásból történik az egész, nem műszaki okból.
-
#95904256
törölt tag
válasz #65675776 #2038 üzenetére
Mindenki emlegeti ezeket az L3 nélküli Phenomokat...
...de melyik roadmap-en látni ilyet?
Eddig csak régebben láttam olyan roadmap-eket ahol az L3 mellett N/A volt, pár kisebb model mellett ( amelyek nem is kaptak volna Phenom nevet ). Azonban olyasmi híreket is olvastam már hogy ezeket a kisebb modeleket törölték az útitervből... -
#95904256
törölt tag
SocketF alaplap? Még itt a Prohardveren is árulnak...
Nézz be az apróhirdesék közé. A Schenker bazárban láttam az alábbit:
MB MSI K9SD Master-A8R,SW HT2000,Dual socketF,SATA 3 év 112 135 Ft
MB MSI K9ND Master-S4R,nForce 55Pro,Dual skt.F,SAS 3 év 125 163 Ft
Bár szerintem az e-bay.com -ról olcsóbban is hozzájuthatsz...
...talán még gyorsabban is mint ha úgy rendeled meg.
szerk.: [link]
Tyan S2912G2NR Thunder n3600R Dual Socket ( F ) board 270 USD-ért...
[Szerkesztve] -
#95904256
törölt tag
Megjött az MSI Speedster 945GT, így majdnem lett Core / Core2 összehasonlítás, de kiderült hogy másik processzorhűtő kell. A K8 teszt szintén késik egy elkönyvelt banki átutalás miatt...
-
#95904256
törölt tag
Sziasztok!
Megtenné valaki hogy lefuttatná a [link] -en található programocskát egy AM2-es gépen, majd megírná az eredményt és hogy milyen processzor és RAM beállítások mellett történt? (órajelek, szorzók, commandrate,...)
A program nem csinál mást, mint megméri hogy a legrosszabb esetben mennyi idő alatt jut el a RAM-ból az adat egy általános regiszterbe. A futásidő géptől függően akár 1-2 perc is lehet. Előre is köszönöm... -
#95904256
törölt tag
Sempron 2600+ 1600MHz, DDR-400 CL3 CT2: 219 clocks
E4300 3024MHz, DDR2-840 CL4 CT2: 211 clocks -
#95904256
törölt tag
válasz VaniliásRönk #2061 üzenetére
Köszönöm. Athlon64 2600MHz: 274 feljegyeztem...
Kezdem fogni a fejem. Van egy egyszerű programom, melynek majdnem minden második utasítása egy közel véletlenszerű, az előző értéktől függő memóriaolvasás. Hiába az 1-2 órajeles utasításvégrehajtás, ha ennyit késik az adat. Ajjaj...
szerk.: Ráadásul nem férnek be a cache-be, mert több GB-ról van szó...
[Szerkesztve] -
#95904256
törölt tag
válasz #95904256 #2064 üzenetére
Sempron 2600+ 1600MHz, DDR-400 CL3 CT2: 219 clocks
E4300 3024MHz, DDR2-840 CL4 CT2: 211 clocks
E4300 2797MHz, DDR2-933 CL5 CT2: 207 clocks
Természetesen ez utóbbi eredmény a rosszabb! Hiszen egy lassabb processzor órajelében mérve kisebb az érték. De legalább látszik a RAM órajel hatása.
szerk.: Pontosabban az FSB : DRAM 4:5 -> 2:3 váltás értéke.
Kár hogy csak CL5 mellett...
[Szerkesztve] -
#95904256
törölt tag
Előbb mértem egy 1,8GHz-es Celeron-t, 632 órajelre...
Te 200 alá behozod?
Egyébként hogy értsük is mit jelentenek ezek a számok, íme egy programrészlet:
MOV ESI,[ESI]
MOV ESI,[ESI]
MOV ESI,[ESI]
...
Ez az xxx órajel azt adja meg hogy két egymást követő utasítás közt mennyi ideig lógatja a processzor a lábait... Ezt hívhatjuk igazán energiatakarékos programnak.
szerk.: A 250 körüli érték olyan IPC = 0,004-et jelent...
[Szerkesztve]
Új hozzászólás Aktív témák
A topikban az OFF és minden egyéb, nem a témához kapcsolódó hozzászólás gyártása TILOS!
Az ide nem illő hozzászólások topikja:[link]
MIELŐTT LINKELNÉL VAGY KÉRDEZNÉL, MINDIG OLVASS KICSIT VISSZA!!
A topik témája:
Az AMD éppen érkező, vagy jövőbeni új processzorainak kivesézése, lehetőleg minél inkább szakmai keretek között maradva.
- Quad Core AMD Phenom II X4 945 (HDX945WFK4DGM) processzor
- Intel I7 12700KF 14mag/20szál - Új, Tesztelt - Eladó! 85.000.-
- Eladó AMD FX-6300 / AMD FX-9370 processzor garanciával hibátlan működéssel
- AMD AM4 Processzorok - Ryzen 3 / 5 / 7 / 9 - Új - Garanciás
- Beszámítás! Intel Core i7 4790K 4mag 8szál processzor garanciával hibátlan működéssel
Állásajánlatok
Cég: Ozeki Kft.
Város: Debrecen
Cég: Promenade Publishing House Kft.
Város: Budapest