- iPhone topik
- Apple M2 Ultrákon futhatnak az iPhone egyes AI funkciói
- Milyen okostelefont vegyek?
- Fotók, videók mobillal
- Samsung Galaxy S22 Ultra - na, kinél van toll?
- Poco X6 5G - egy Redmi álruhában
- Samsung Galaxy S21 és S21+ - húszra akartak lapot húzni
- A vártnál kevesebb iPad Pro fogyhat
- Redmi Note 13 Pro 5G - nem százas, kétszázas!
- Yettel topik
Hirdetés
-
Három éve fontos döntést hozott az AI-ról az Apple
it A Bloomberg szerint saját chipekkel működtetné az AI-szervereket az Apple.
-
Dead Island 2 - Túl a 7 millió játékoson
gp Továbbra is érkeznek majd frissítések, a készítők nem engedik el a kezünket.
-
Akciófigyelő: kedvezményekkel indít az Ulefone Armor tablet/telefon páros
ma Az Armor Pad 3 Pro és az Armor 26 Ultra árából sokat enged a gyártó.
-
Mobilarena
OLVASD VÉGIG ALAPOSAN MIELŐTT ÚJ HOZZÁSZÓLÁST ÍRNÁL!!!
Új hozzászólás Aktív témák
-
#95904256
törölt tag
válasz Oliverda #1341 üzenetére
Te tudod?
Mivel jobb ötletem nem volt így vettem a fáradtságot és levadásztam két die fotót a netről. Ezekből megnéztem hány pixel a cache, majd arányítottam a teljes képhez...
Conroe: 220 millió tranzisztor, ennek 38%-a az L2 cache ( 84 millió )
Wolfdale: 410 millió tranzisztor, ennek is 38%-a az L2 cache (156 millió ).
Ami azt jelenti hogy a +50% cache az 72 millió tranzisztort jelent.
Ebből már számolható a kérdésre a válasz: 72 / ( 410 - 220 ) = 38%. -
#95904256
törölt tag
Vasárnap ismét demózik az AMD japánban.
- 3GHz Phenom FX
- RD790 chipset
- HD2900XT
[link] -
#95904256
törölt tag
Épp ma kezdtem el irogatni egy kis programocskát amivel letesztelhető pár utasítás latency értéke. Ugyanis készülök a K10/Penryn megjelenésre.
Na, de visszatérve az FPU esetében említett +6 órajeles késleltetésre, azt kell mondjam hogy az meglehetősen jól el van rejtve, ugyanis a cím az integer regiszterekből generálódik, a CPU meg elég jól képes előre látni. Ezért a tényleges futásidő szempontjából ez már nevezhető ideális esetnek. Egyébként van valami információd arra vonatkozóan hogy kb.milyen gyakran fordulnak elő a nem idális esetek? Ráadásul ezen eseteknél sem mindig a +6 órajel késleltetés érzékelhető. -
#95904256
törölt tag
-
#95904256
törölt tag
válasz Balala2007 #1364 üzenetére
Nem ismerem az Everest-nek ezt a funkcióját, de tényleg jónak tűnik!
Azonban hiányolok belőle jó pár utasítást... -
#95904256
törölt tag
válasz Balala2007 #1367 üzenetére
Szuper vagy! Köszönöm.
Épp pár órája ütöttem le egy Dothan-t meg egy Yonah-ot az ebay-en hogy majd letesztelhessem, de úgy látom felesleges volt.
Hogy konkrétan mi hiányzik? Hm... csak párat mondanék ami hirtelen eszembe jutott, de ha kell később összeírom egy privát üzenetben.
XCHG reg,reg
XCHG reg,mem // ez különösen érdekes eredményt tud adni
PUSH/POP reg/mem
PUSHFD/POPFD
JMP short/near // ez különösen fontos
Jcc shot/near // ez még a JMP-nál is fontosabb
SHRD/SHLD reg,reg/mem,i
BT/BTS/BTR/BTC reg/mem,reg/i // a BTC-t különösen fontosnak tartom
INC/DEC reg/mem // bocsánat most látom K8-nál már van regiszteres!
AAA/AAD/AAM/AAD/DAA/DAS/XLAT
CBW/CWD/CDQ
CLD/STD // meglepő eredményt adhat az STD!
CLC/STC/CMC/SETcc
LOOP short/near // mondjuk ezt ritkán fordítják a fordítók
(REP) LODS/STOS/MOVS/SCAS/CMPS(B/W/D) // ezt viszont sokat
LEAVE/ENTER // a legtöbb fordító a LEAVE-t használja...
FLD/FST(P) reg/mem // mondjuk ezt nem egyszerű tesztelni
FILD/FIST(P)/FRNDINT // FRNDINT különösen fontos, mert ugyan FILD+FISTP pár gyorsabb lenne a fordítók mégis ezt használják
FLDZ/FLPI/FLD1/FLDxx
FNSTSW/FNSTCW/FLDCW // szinte az összes FPU komparálásnál és truncate-nél használják
FIADD/FIMUL
FABS
FPREM/FPREM1 // maradék képzés! milyen jó is forgásszögeknél...
FSIN/FCOS/FSINCOS // ha már a szögeknél tartunk
FPTAN/FPATAN // ezt se egyszerű tesztelni...
FSCALE/F2XM1/FYL2X/FYL2XP1 // mert hatványozni néha kell és csak ez van rá...
Az SSE,MMX,3DNow! -ra nem térnék ki most, de ott is hiányzik pár dolog.
Bár most hogy közben több eredményt is megnéztem úgy tűnik az SIMD bővült.
Pl. bekerült a SHUFPS, amit pár órája még hiányoltam a letöltött EVEREST-ből. -
#95904256
törölt tag
válasz slett27 #1373 üzenetére
slett27 : Lehet jobb lenne ha IBM felvásárolná az AMD-t többre jutna....
Ebben még lehet is valami. Hisz az IBM tervezi hogy a következő generációs Power7 processzorának egyik-másik változata lábkompatibilis lesz az Opteron-nal. Igaz mintha a SUN is tervezne ilyesmit. Persze 2010 előtt ne nagyon várjunk ilyet... -
#95904256
törölt tag
[link]
Szóval az K10-Agena ellenfelének szánt Penryn-Harpertown processzorok november 11-től lesznek kaphatóak. Az árak magukért beszélnek. Csak arra lennék kíváncsi hogy az E5405 FSB-je is 1333 vagy azt kisebbre vették... -
#95904256
törölt tag
Meglehetősen nagy. Még tavaly januárban vette meg az AMD a Z-RAM technológiát, mondván hogy az jól fog jönni a 65nm-es CPU-khoz. Ráadásul a Z-RAM csak a SOI-val együtt használható. Az AMD meg épp erre van berendezkedve. A Z-RAM-ról még annyit illik tudni hogy kb. 1/5-e a helyigénye a mostani SRAM-okhoz képest. Ez az info esetleg felhasználható ahhoz hogy a már közismert die-fotók cache méretéből lehessen erre a technológiára következtetni...
szerk.: [link] alapján meghatározható?
[Szerkesztve] -
#95904256
törölt tag
válasz VaniliásRönk #1405 üzenetére
Hm...
Szerintem a fotón látható K8-F 2x1024 kB-os L2 gyorsítótára és a K10-H 2MB-os osztott gyorsítótára közt méretben alig van különbség! Az ötszörös, de még a kétszeres méretbeli különbség is már nagyon látványos lennye. Lehet hogy mégsem jó ez a módszer?
szerk.: 65nm vs. 90nm ?
[Szerkesztve] -
#95904256
törölt tag
Remek összefoglaló!
Különösen ez a sor tetszett benne:
Thirdly, K10 processors can now use unaligned loading even for Load-Execute instructions that combine loading with the data operations.
szerk.: Ugyanis 32 bites módban a 8 SSE regiszter nekem eddig mindig szűk keresztmetszetnek tűnt. Ez legalább segít a dologon, mégha speciálisan K10-re is kell fordítani a kódot.
[Szerkesztve] -
#95904256
törölt tag
Interjú Hector Ruizzal: [link]
Újdonság nincs benne, de pár apró részletre fény derül hogy miért is késik a Barcelona. A ''natív négy mag'' összehozása nagyobb falatnak bizonyult mint gondolták, ráadásul minden egyes technikai probléma orvoslása kb. hat-hat hetet igényel. Ezért csúsznak már lassan hat hónappal az eredetileg tervezett megjelenési időponthoz képest. -
#95904256
törölt tag
válasz Gyuri27 #1424 üzenetére
Persze, de érdekfeszítő dolgok nincsenek benne.
Az interjú első fele tulajdonképp arról szól hogy Ruiz úr az Intelt vádolja azzal hogy főképp az OEM partnerekkel olyan viszonyt alakított ki ami a piaci szabályokat felrúgja, így ez ellen lépéseket fognak tenni. Tkp. lesz egy újabb per az Intellel.
Az interjú közepén esik pár szó a Barcelonáról, melyben azt Ruiz úr azt az egekig magasztalja. Itt esik szó arról is hogy még mindig technológiai problémákkal küzdenek. Egy kicsit elszámolták magukat ezen a téren.
Majd az interjú végén Ruiz úr egészségi állapota felől érdeklődnek, valamint hogy nem gondolkodik-e már a visszavonuláson. De természetesen esze ágában sincs neki. -
#95904256
törölt tag
Mi történik akkor ha két CPU is dolgozik ugyanazon a memóricímen lévő adattal és mindkettő CPU-n futó folyamat egyszerre szeretné módosítani?
-
#95904256
törölt tag
Igazából olyasmire gondoltam pl. hogy fut egy modulo képző program (több százezer bit hosszú adatokkal) és egy bizonyos tartományban ( pl. ami 4Gbiten (512MB-on) ábrázolható ) a modulo eredményeket 1-1 bit bebillentésével jelzi illetve érzékeli hogy már volt ilyen eredmény ( pl. BTS utasítás ). Ilyenkor párhuzamosan futhatna több modulo-képzés egy közös bittáblával, ami OS szinten osztott memóriaterület...
Viszont ez a cache-vonalért történű küzdelem is érdekes. Honnan tudja egyik-másik CPU hogy a másik CPU mely memóriacímeket birtokolja? Minden egyes memóriaírásnál lekérdezi pl. a HyperTransport-ton keresztül hogy az adott vonal foglalt-e már egy másik CPU által? Ez egy 8 CPU-s rendszerben erősen visszafoghatja a memória írási sebességet...
Vagy van ennél jobb megoldás? -
#95904256
törölt tag
A HT órajelének mivel kell szinkronban lennie? Minden bizonnyal azzal közös órajelforrásra támaszkodik, akár felszorozza azt, akár leosztja.
szerk.: Ha nincs szinkronban semmivel ( pl. vezérlőjeles handshake-t használ? ) akkor meg teljesen mindegy hogy mi az órajel forrása, a lényeg hogy stabil legyen és előállítható legyen belőle a kívánt HT órajel.
[Szerkesztve] -
#95904256
törölt tag
válasz EQMontoya #1480 üzenetére
A HT órajelének csak van valami funkciója, nem?
Gondolom, azért van órajelre szüksége mert különféle áramköröket kell szinkronozni vele. Természetesen lehet más okból is ( pl. a karórákban lévő kvarckristály pusztán időalapot szolgáltat, mégis kvázi-szinkronban van a többi karórával, különben mindenkinek más időtartamot jelentene egy-egy perc vagy óra... ).
Szóval ha szinkron miatt van, akkor melyik áramkörrel közös az órajel és miért?
Ha meg más miatt van, akkor mire használja a HT busz az órajelet?
szerk: P.H. által a 1476-os hozzászólásban linkelt kép alapján a HT és a DRAM órajelének láthatóan semmi köze egymáshoz. Pedig a RAM is az alapórajelről megy, nem?
[Szerkesztve] -
#95904256
törölt tag
A szinkron az adott szakterületen nem csak (nagyjából) azonos frekvenciát, hanem kifejezetten azonos frekvenciát és fix fázist (!) jelent.
Nem. A szinkron önmagában sem frekvenciát, sem fázist nem jelent.
A szinkronizálás egy művelet, a szinkron pedig ennek a folytonosságát jelenti. -
#95904256
törölt tag
válasz robyeger #1509 üzenetére
a gyakorlat ellentmond annak, hogy minden magórajelen megy, amúgy is akkor hol a szorzó és minek van dísznek?
Lehet hogy nem figyeltem, de hol van gyakorlati ellentmondás? Ki lehet mérni?
A szorzó meg azért van ott hogy egyszerűbb legyen a CPU-t körülvevő hardver. Egyrészt sokkal drágább egy mikrohullámú ( 1GHz felett ) órajelgenerátor kiépítése és árnyékolása mint egy kisebb frekvenciás órajel felszorzása egy CPU-ba integrált PLL áramkörrel. -
#95904256
törölt tag
válasz kicsivocsok #1515 üzenetére
Egy rendszerben legalább egy valamit 30%-kal túl kell hajtani ahhoz hogy elképzelhető legyen egy ugyanilyen mértékű növekmény. A processzor órajele csak 20%-kal nőtt, tehát valami mást gyorsítottak 30%-kal...
-
#95904256
törölt tag
Várj dezz! Látom te érted hogy mit is javasolt robyeger. Bevallom én első nekifutásra nem értettem meg, de még neki futok újra. Már elindítottam egy AM2 rendszer beszerzésést, de processzort még nem választottam. Melyik X2 lenne ideális egy ilyen teszthez? Gondolok itt arra hogy említve lett a DDR500-at támogató Venice mag. Eddig csak fél füllel hallottam hogy ilyesmi is létezik...
-
#95904256
törölt tag
válasz robyeger #1529 üzenetére
Hali robyeger!
Na, újra nekirugraszkodtam hogy megértsem a dolgot. Ha jól értettem, akkor azt kellene kimutatni hogy a processzoron belül vannak olyan részek amik magórajelen mennek és vannak amelyek nem. Példaként az SRQ-t hoztad fel.
Az állítás szerint egy döntő méréshez az alábbiakat kell garantálni:
- állandó RAM sebesség
- állandó HT sebesség
- állandó magórajel = változó alapórajel x szorzó
Ha ezek mellett változtatom az ''alapórajel x szorzó'' értéket, akkor eltérő teljesítményűek lesznek a konfigurációk.
A kérdésem az hogy minek a teljesítményében várható növekmény?
( memória / cache / integer / float-point ... teljesítmény ) -
#95904256
törölt tag
Hali dezz!
Szerintem közel jársz az igazsághoz. A C2Q négy magját bizony erősen visszafoghatja a szűk memóriasávszélesség. Még P.H. mutatott nekem épp egy Prohardver!-es teszteredményt ami ezt jól példázza. [link] Itt a PhotoWorxx benchmark alatt a C2Q csak 20% előnyre tett szert egy C2D-hez képest. Nem lehetséges hogy a 3DMark is beleütközik ebbe a korlátba?
Tudna valaki egy C2D és egy C2Q eredményt is megadni?
szerk.: Kicsit nézelődtem a neten, a C2Q és C2D közt 3DMark06 alatt kb. 70% különbség van azonos órajelen. Nos lehet hogy az AMD négymagosa ennél jobbat produkál egy kétmagoshoz képest...
[Szerkesztve] -
#95904256
törölt tag
válasz Balala2007 #1600 üzenetére
Bakter... erre meg hogy akadtál? Melyik CPU lesz képes SSE5-re?
Egyébként itt nem csak három, de négy operandusos műveleteket is említenek.
Pl.: FMADDPS dest,src1,src2,src3... naggyon döfi -
#95904256
törölt tag
Azt a Phenom logót felejtsd el. A hivatalos egészen másképp néz ki.
Ez csak valami alfa verziós CPU-Z lehetett...
szerk.: Nem tudom hogy a Super PI milyen algoritmust használ, de az természetesen előfordulhat hogy egyik másik program szinte semmit sem gyorsul az K10-en.
[Szerkesztve] -
#95904256
törölt tag
válasz Zoli329 #1630 üzenetére
És nyilván nemcsak SuperPi-nél van így. Én tudom, hogy régi program meg stb nade akkoris. Ha ebben nem lett gyorsabb valószínű sokminden másban sem.
Ha jól értelmezem, akkor arra akarsz rávilágítani hogy ha a K10 SuperPI-ben alig gyorsabb a K8-nál, akkor már valószínű hogy sokminden másban is csak alig lesz gyorsabb?
Ezt felejtsd el. Amilyen változatosak a programok olyan változatos lesz a gyorsulás mértéke is. A K10 legalább a Core2 sebességét fogja nyújtani szinte mindenben. Persze mindig lesznek olyan programok melyek egyik-másik processzornak jobban fekszenek, hisz azok belső felépítése is elég változatos. -
#95904256
törölt tag
Ha jól értem akkor az hogy ''nem procilimites'' az azt jelenti hogy szinte mindegy hogy egy gyors vagy még gyorsabb processzorral zajlik le a mérés, az eredmény ettől nem változhat, igaz?
Ez esetben a 2,5GHz -> 3,0GHz CPU tuning nem okozhatta a 3Dmark pontszám ilyen mértékű emelkedését. -
#95904256
törölt tag
válasz slett27 #1662 üzenetére
A SuperPI csak a régi utasításkészletet használja, így a K8 vs. K10 összehasonlításban nem is várható jelentős gyorsulás. Az Intel-nél azért érezhető ekkora különbség a Core(2) és a régebbi magok közt, mert az Intel régebbi CPU-i voltak lassúak. A Core2 fejlettebb out of order motorja és a kisebb utasítás latency értékei miatt domborít ekkorát.
-
#95904256
törölt tag
válasz Zeratul #1701 üzenetére
Pedig illene nekik, ugyanis az x87 utasítások jó része megfeleltethető egy-egy SSE skalár műveletnek is ( mindössze a cél/forrás regiszterek mások ).
Egyébként úgy tudom hogy a K8 FPU trigonometriában gyorsabb mint a K7-es.
Aztán semmi másban, vagy még rosszabbak is a késleltetései... -
#95904256
törölt tag
Mitől ennyivel gyorsabb a Core2 x87-ben? Annak is csak 1 FMUL/FDIV és 1 FADD egysége van.
Mennyi az az ennyi? És ki mondta hogy gyorsabb, és mihez képest?
x87-es kódban a K7/K8/Core(2) közel egyformán teljesít. Bár van egy kis eltérés itt-ott, de ezek kb. kompenzálják is egymást. Talán egy pici előnyben van a Core(2) a gyorsabb összeadás/kivonás miatt, mivel az az egyik leggyakoribb művelet. -
#95904256
törölt tag
-
#95904256
törölt tag
dezz:Viszont, van itt az FPU-val kapcsolatban valami érdekesség a K10-ben: nem csak az eredeti FPU lett némileg nagyobb (a 128 bitesre bővítés miatt), hanem minden maghoz tartozik egy 2. FPU blokk is! (Nincs kéznél a die fotó linkje, de gondolom, megvan a kép neked is, vagy valamelyik korábbi hsz-ben megtalálható.) Nem lehet, hogy az valami ''titkos fegyver'', amit csak újrafordítás által lehet kihasználni?
Na, arról lehet szó hogy amit eredetileg linkeltél képet a ''2nd FP unit'' egység felirattal az a 128 bitre bővített SSE műveletek felső 64 bitjéért felelős egység.
[Szerkesztve]
Új hozzászólás Aktív témák
A topikban az OFF és minden egyéb, nem a témához kapcsolódó hozzászólás gyártása TILOS!
Az ide nem illő hozzászólások topikja:[link]
MIELŐTT LINKELNÉL VAGY KÉRDEZNÉL, MINDIG OLVASS KICSIT VISSZA!!
A topik témája:
Az AMD éppen érkező, vagy jövőbeni új processzorainak kivesézése, lehetőleg minél inkább szakmai keretek között maradva.
- A fociról könnyedén, egy baráti társaságban
- Kerékpárosok, bringások ide!
- Projektor topic
- Samsung Galaxy Tab S6 Lite 2024 - a visszatérő
- Óvodások homokozója
- Dead Island 2 - Túl a 7 millió játékoson
- Skoda, VW, Audi, Seat topik
- iPhone topik
- Sub-ZeRo: Euro Truck Simulator 2 & American Truck Simulator 1 (esetleg 2 majd, ha lesz) :)
- Politika
- További aktív témák...
Állásajánlatok
Cég: Promenade Publishing House Kft.
Város: Budapest
Cég: Ozeki Kft.
Város: Debrecen