- Samsung Galaxy S23 és S23+ - ami belül van, az számít igazán
- Milyen okostelefont vegyek?
- Mobil flották
- iPhone topik
- Huawei Mate 50 Pro - blendemonda
- Samsung Galaxy Watch6 Classic - tekerd!
- Honor 200 Pro - mobilportré
- Megérkezett a Google Pixel 7 és 7 Pro
- Samsung Galaxy Watch7 - kötelező kör
- Redmi Note 13 Pro 5G - nem százas, kétszázas!
Új hozzászólás Aktív témák
-
S_x96x_S
addikt
válasz
Petykemano #5399 üzenetére
viszont a 3nm érdekes ..
Az Apple + Intel 2022H2 -ben rárepül a TSMC 3nm -re ..az AMD-s (desktop) Granite Ridge (3nm) meg 2023 -ra van ki-irva ..
vagyis ~1 évvel későbbA mobil meg 2024 ; vagyis +2 év az Apple/Intel után ...
ajajj .. -
Petykemano
veterán
Warhol helyett Brecken ridge néven emlegetik az idei Vermeer utódot.
[link]
Ez állítólag nem a csomag, hanem a CCD kódneve.Fura. Ott van a sor.végén egy Granite ridge is.
Most vagy az is CCD kódnév,
Vagy változik az AMD nevezéktana (esetleg vele együtt a komplett roadmap) és végül a Raphael sem Raphael lesz. Vagy a kódnév csak időbeliséget jelöl és a zen 3D egy új megoldás.
Az is különös, hogy azt követően már sehol nincs jelölve, hogy valamelyik gen 3d Stacked lenne. -
S_x96x_S
addikt
Anandtech: (july14) AMD Threadripper Pro Review: An Upgrade Over Regular Threadripper?
"If you absolutely need up to 2 TB of eight-channel memory over 256 GB, you need TR Pro. If you absolutely need memory with ECC, then TR Pro has validated support. If you absolutely need 128 lanes of PCIe 4.0 rather than 64, then TR Pro has it. If you absolutely need Pro features, then TR Pro has it." -
S_x96x_S
addikt
> > a heterogén ( CPU + GPU ( + FPGA )) programozásé a jövő"
> Ezt nyomták a Caveri APU-nál is ezer éve... [link]
> Aztán a forradalom valamiért mégis elmaradt,
> pedig a hardver azóta is adott (lenne) hozzá.Az átállás folyamatban -és csendben zajlik ..
csak még nem annyira látható
az extrém módon fregmentált X86-os consumer piacon.
Még az X86 CPU feature Leveleket is most próbálják szoftveresen szabványosítani .De:
- Konzol szinten ez már a mainstream, a forradalmon már túl vagyunk..
- persze az OpenCL még a gyerekbetegségeit nyögi, de alternativa
- az Intel OneAPI meg még teljesen új ..Mindeközben az Apple tudatosan építi a saját heterogén homokozóját ..
amiben a szoftvert és a hardvert ( NPU, GPU, CPU ) - eléggé össze-optimalizálja. -
paprobert
őstag
válasz
Petykemano #5387 üzenetére
A mostani konzolgenerációban a PC-s játékoknak elméletben (7 mag + SMT miatt) 14 mag kellene, ami elméletben még skálázódna. Valamint a flegmán mellé dobott PC-s overhead, csak tippelni lehet hogy mennyi lesz, címenként eltérően, + maga a Windows.
Szóval értelme lesz a 8+ magnak, de valóban, egyre kevésbé fog megtérülni.
Nincs még Zen2@3.5GHz-et 30-60 fps-re taksáló cím a piacon, mert ahhoz át kell szabni a játékmenetet is, úgy néz ki. Az első kóstoló a next-gen elvárásokból talán a Battlefield 128-as multiplayer részlege lesz.
-
HSM
félisten
válasz
S_x96x_S #5393 üzenetére
"Valamint a legtöbb párhuzamosítást - át lehet lökni a GPU-ra ..
Vagyis a heterogén ( CPU + GPU ( + FPGA ))
programozásé a jövő"
Ezt nyomták a Caveri APU-nál is ezer éve... [link] Aztán a forradalom valamiért mégis elmaradt, pedig a hardver azóta is adott (lenne) hozzá.#5394 Busterftw : "a CCX desgin ellegge eltero volt mindentol ami addig megjelent es mainstream volt"
Az OS és a szoftverek szintjén teljes mértékben ugyanaz a megoldandó probléma, mint a Core2 Quadnál. Vannak magok, amik egymással gyorsan tudnak adatot cserélni (közös L2 a Quadnál, közös L3 a CCX-nél) és vannak, amik lassan, és ezt a feladatok kiosztásánál/ütemezésénél érdemes figyelembe venni.Fun fact, annak idején épp az AMD demózta bőszen, mikor megjelentek a világ első natív négymagosával, hogy ez bizony mennyivel jobb, mint a konkurencia kétszer kétmagos felépítése...
"Currently Intel’s quad core implementation relies on it having two Core 2 dies on a single package. It can easily pull this off because it doesn’t integrate the memory controller into the CPU. This allows more cores to be added as needed.
However, this creates an inherent performance problem, since both die are only connected only through the CPU front side bus (FSB). Sending data from core one to three means that it has to be sent out of the CPU to the northbridge and then back again creating a massive additional latency and reducing the bandwidth available for memory access.
Discussion between cores one and two or three and four is okay, because they are on the same piece of silicon, but still 50% of the time there’s a latency problem.
" [link]
Pontosan ez történik a CCX-ek esetén is, ha a szomszéd CCX-el kell adatot cserélni, arra csak a memóriavezérlőn keresztül van mód, hiába fizikailag egy csip. Ez a probléma "szűnt meg" az 5600X és 5800X modelleken, mivel azokon egy csip egy CCX, minden mag egyforma gyorsan fér az adatokhoz.Azzal viszont teljes mértékben egyetértek, hogy a fő probléma, hogy hogyan ütemezd a feladatokat a magok között, adott esetben power plan függően, a különböző elérhető kis/nagy magszámok mellett.
Bár tegyük hozzá, 16 magot megfelelően skálázódó módon ellátni szálakkal egyébként sem feltétlenül egyszerű, hát még ilyen "egzotikus" felépítésű CPU-k esetén.
-
Busterftw
nagyúr
-
S_x96x_S
addikt
válasz
Petykemano #5385 üzenetére
> Nem állítom, hogy sok értelme lenne
> a magszám emelésének a mainstreamben.a problém az, hogy a ZEN-es chipleteknek optimálisnak kell lenni mind a 3 piacra ( Szerver .. ahol jó a sok magszám ; Consumer/Desktop/Mobil - ahol már kevésbé hatékony "csak" ezt nyomni )
Nem véletlen, hogy a ZEN5 -nél már két chiplet típusból lehet legózni.Ha egyszerre mindenre optimalizálni akarsz -
akkor minden piacon csak az átlagot lehet elérni.Valamint a legtöbb párhuzamosítást - át lehet lökni a GPU-ra ..
Vagyis a heterogén ( CPU + GPU ( + FPGA ))
programozásé a jövőAz Apple az M1-nél tisztán az "érezhető" felhasználói élményre fókuszált, és korán elvetették csak a thread/mag szám növelést.
Viszont nekik egyáltalán nem kell a "Cloud" igényekre is fókuszálni ..
( a másik véglet az IBM-es Power cpu az SMT8 - al. )érdekes (M1-hez kapcsolódó) blog a témában : https://www.tbray.org/ongoing/When/202x/2021/07/12/Slow-M1
"
In the benchmark above, the M1 has something like half the effective threads offered by the Intel & AMD competition. So, is it surprising that the M1 still competes so well?
Nope. Here’s the dirty secret: Making computer programs run faster by spreading the work around multiple compute units is hard. In fact, the article you are reading will be the seventy-sixth on this blog tagged Technology/Concurrency. It’s a subject I’ve put a lot of work into, because it’s hard in interesting ways.
I guarantee that the Lightroom engineers at Adobe have worked their asses off trying to use the threads on modern CPUs to make the program feel faster. I can personally testify that over the years I’ve spent with Lightroom, the speedups have been, um, modest, while the slowdown due to camera files getting bigger and photoprocessing tools more sophisticated have been, um, not modest.
A lot of times when you’re waiting, irritated, for a computer to do something, you’re blocked on a single thread’s progress. So GHz really can matter." -
S_x96x_S
addikt
válasz
hokuszpk #5384 üzenetére
>> Mindenesetre kiváncsi leszek az 5950X utódjára ..
> vajon lesz -e avx 512 ?elnézést, nem voltam teljesen pontos ..
az 5950X "idei" utódjára gondoltam, ami az "Alder Lake-S" ellenfele lesz.
persze ki tudja milyen számozást kap ..ami ismert:
- VCache valószínüleg lesz benne ..
- és AVX-512 valószínüleg nem ( az csak a ZEN4-nél várható ( +1 év ))spekuláció:
- Szerintem már az 5Ghz-et is tudni fogja, csak reszeltek annyit a gyártástechnológián ...
- Talán még az I/O die is kap egy kis refresht ..spekuláció: A CB R20 -nál szerintem a +VCache nem sokat jelent ..
legalábbis az alapján feltételezem, hogy a CB teszt még akkor is jól feküdt a ryzeneknél, amikor még ZEN1-es alacsony cache -volt.
( De azért jó lenne ha tévednék .. )
Megj:
A ZEN4 - jövő év ~Q2/~Q3 körül várható
és annak már az "Raptor Lake" - ellen kell állnia a sarat.
Míg az "Alder Lake" egy első generációs Gen5-ös konfig lesz
a "Raptor Lake" már egy javított iteráció ( XeGraph + max24core)
és így ez már nem lesz könnyű ellenfél a ZEN4-nek - ami még első generációs Gen5
-
HSM
félisten
És még egy gondolat, hogy persze borítékolható, hogy majd jönnek a "cherry picked" mérési eredmények azon néhány szoftverből, amik gond nélkül skálázódnak akárhány, akármilyen magokra is, mint pl. a Cinebench... Aztán meg lehet vakarózni, hogy bizonyos alkalmazásokban meg miért nem köszön vissza a várt eredmény... Ahogy az első három generációs Ryzenek is meglepően erős Cinebench versenyzők voltak, miközben azért néhol nem teljesítettek ilyen szépen a konkurenseikhez képest.
#5390 Busterftw : "meglevo OS-ra jott a mas felepites."
Éppen ezaz, nem jött másféle felépítés. Ilyen rendszerek a win10 megjelenése előtt már legalább 5-6 évvel is léteztek, lásd Core2 Quad és kétprocesszoros munkaállomások."Intel biztos odatette magat a Microsoftnal, hogy alljanak ra a temara."
A probléma, hogy nem lehet minden erőből megoldani. Biztos lesz pár szoftver, ami bemutatóra majd jól leoptimalizálnak, de egyébként ez nem fog jól működni automatikusan csak úgy magától, erőből. Ehhez a szoftvereket is finomhangolni kellene. Ráadásul az optimum változhat, hogy mennyire az energiatakarékos és mennyire a gyors működés a preferencia."Sok licensz az."
Nekik mindegy. Így is úgy is elkel a licensz a gépen. -
Busterftw
nagyúr
Azert Windows 10 es Ryzen eseteben mas volt a helyzet, mert ott meglevo OS-ra jott a mas felepites.
Itt viszont a Microsoft mar ugy fejleszthette a Windows 11-et, hogy hybrid felepites tamogatva legyen indulaskor.
Persze nem mondom, hogy nem lesznek gondok, csak mas a ket eset szerintem.
Intel biztos odatette magat a Microsoftnal, hogy alljanak ra a temara. A Microsoftnak sem mindegy, mert a laptopok 80%-a Intellel kel el. Sok licensz az. -
HSM
félisten
válasz
Petykemano #5387 üzenetére
"Tehát a több mag (6-=>8) nem kell úgy, mint egy falat kenyér"
Ez szvsz csak attól függ, mire és hogy használod a géped.Illetve hogy pl. egy játéknál hol húzzák meg a minimum igényt. CPU-igényesebb címeknél azért már jópár éve szükséges a 6 mag az optimális futáshoz, és a 8-nak is azért jópár helyen van relevanciája, ha nem csak a V-sync + 60 FPS a cél.
"A mai 8 magos ugyanolyan elavult lesz 3 év (2 generáció) múlva mint a valamivel olcsóbb 6 magos."
Vélhetőleg igen. Ugyanakkor az az akár 25% exta tempó a plusz magokból lehet a különbség egy itt-ott bedadogó játék és egy végig vajsimán futó között az a 3 év alatt."a Monet is azért készül, mert "túl jó" a kihozatal"
Ez egyébként logikus lépés. A 8-magos lapka felét kidobnák a kukába, ha olcsó 4-magosként árulnák, és egy olcsó tömegterméknél a fogyasztás és órajel sem feltétlen olyan kritikus tényező, így egy olcsóbb, régebbi gyártósor bevetése teljesen logikus üzleti lépésnek tűnik. Vélhetőleg így az is optimalizálja a költségeket, hogy nem kell a kétféle lapkát egy tokozásra tenni hanem egyben van minden."Ezért fejleszttette az Intel a Windows 11-et, nem?"
Erre engedd meg, hogy röviden annyit írjak: haha.
Viccen kívül, meg lehet nézni, hány év szenvedés után is köhögős a Ryzen-CCX felépítés kezelése, pedig egy 10+ éve létező dolog, gondolj csak a Core2 Quad felépítésére, éppen ugyanez, két kétmagos lapka volt egy négymagos, de felhozhatnám példának a két vagy több foglalatos szervereket is. Az eredmény? Meg lehet nézni, hogy hol van játékokban a 3800XT egy 5600X-hez képest (sokszor sehol) [link] , amikor "nyers erőben" vagy 10%-al gyorsabb [link] .
Ha ennyire szenvedős annak is a kezelése, hogy kb. egyforma erős, egyforma felépítésű, de egymással néhány magkupac esetén nem egyforma gyorsan kommunikálni képes magokat hatékonyan használjanak, akkor az milyen lesz, amikor nem "csak" ez lesz az akadály, hanem különböző kódok különböző sebességgel is fognak a különböző felépítésű magokon futni?
Ráadásul a tervek alapján lesz mindenféle magszám, kicsi nagy ahányféle kombinációt csak el tudsz képzelni. Elég reális esélyt látok, hogy a legjobb verzió optimalizálás szempontjából az lesz, ha fixen a nagy magokra kényszerítik az appot és le is van tudva ez az őrület. Megjegyzem, úgy hallottam, androidon is sokszor így "optimalizálnak" a különböző magokra, vagy itt fusson minden, vagy ott.
Én azt gondolom, ezek a kis magok leginkább csak arra lesznek jók, hogy a gyártó ne maradjon le a "magszám háborúban". Az átlag usernek ez csak plusz fejfájás lesz, ahogy szerintem a szoftverfejlesztőknek is. -
válasz
Petykemano #5387 üzenetére
Véleményem szerint egy ideig maradunk a mostani szinten, mivel nincs szoftver oldalról sem olyan nagy demand, ami indokolná az átlag felhasználó számára a 8+ magos CPU-t. A 6/12 konfiguráció érzésem szerint néhány évig az arany középút lesz. De még ennyi sem kell az átlagnak, a korábbi mainstream csúcs 4/8 processzorok is elegendők a lesznek egy ideig (akiknek elég volt anno a 2/4 évekig, azokat kiszolgálja a 4/8 ugyanúgy évekig).
Abban totál igazad van, hogy egy modernebb, de kevesebb magos proci (5600X) sokkal többet ér, mint egy régebbi több magos (1800X). Ebből a példából látszik, hogy nincs elősébb sokkal valaki, ha azonos generáción belül fejleszt később több magra, legalábbis a 6 vs 8 mag esetén ez igaz. Más kérdés, hogy alaki 4/4 prociról fejleszt azonos generáción belül 8/16-ra. Ennek lenne is értelme, de eléggé workload függő a dolog.
-
Petykemano
veterán
"Szerintem annak még épp van/lenne értelme felhasználói oldalról, hogy 6 helyett 8 magot kapj ugyanannyiért."
Úgy értettem, hogy ha ez így lenne, akkor a növekvő felhasználói értéknek mindenki örülne, de persze a mindennapokban kevés hasznát látná. Tehát a több mag (6-=>8) nem kell úgy, mint egy falat kenyér, mint régen (1=>2, 2=>4)Én arra számítottam, hogy a zen4-gyel majd magszámot emelnek és szépen csúszik le a stack. $200 alá a 6 mag, $200-300 közé a 8 mag, $300-400 közé a 12 mag.
Azt, hogy nem éri meg úgy értettem, hogy egy felhasználónak nem biztos, hogy megér $50-100-t 6 helyett 8 magot venni. A mai 8 magos ugyanolyan elavult lesz 3 év (2 generáció) múlva mint a valamivel olcsóbb 6 magos.
Legalábbis én ezt látom, szerintem nincs lényeges különbség egy 1600X és egy 1800X között. Mindkettőt kenterbe veri egy 5600X.Az üzleti részét értem.
Azt is, hogy az árakat leginkább az befolyásolja, hogy mennyire megy el amit gyártanak azon az áron, amin kínálják. És ebben értelemszerűen a TSMC és más beszállítók árai és keresleti-kínálati viszonyai meghatározók.Azt mondják, a Monet is azért készül, mert "túl jó" a kihozatal. Nem éri meg 4 magosként eladni a lapkákat, ami működnek 6 v 8 magosként is és eladhatók is akként, annyiért.
Akkor lesz változás az árazásban, ha olyan híreket hallunk, hogy túltermelés van a félvezetőpiacon és a TSMC leállít vagy elhalaszt valamilyen gyárépítést és Abu azt írja majd: "hiába szeretné az Apple jövőre a legújabb -1nm-es gyártástechnológián kihozni új processzorát. Lehet, hogy az Apple bele is tolná a fejlesztéshez szükséges pénzt, de utána a TSMC nem tudná megtölteni a gyárakat rendeléssel. Mindenki igyekszik maradni a magas volumennel rendelkező, olcsóbban gyártó és olcsóbban tervezhető gyártósorokon."
"Esetleg az Alder Lake hozhat a maga módján 6+ magot olcsón, de a kis magos megoldásnak is meglesznek szerintem a maga buktatói, szoftveres oldalról a sok kis mag érzékenyebb lehet a programok skálázódási korlátaira, mint ugyanannyi, vagy akár kevesebb nagy."
Ezért fejleszttette az Intel a Windows 11-et, nem? -
HSM
félisten
válasz
Petykemano #5385 üzenetére
Szerintem annak még épp van/lenne értelme felhasználói oldalról, hogy 6 helyett 8 magot kapj ugyanannyiért. Üzletileg viszont nem lenne túl kifizetődő, hiszen igazán olcsón a "hibatűrőbb" 6 magos verziót tudják adni, legalábbis amíg egy csipen fizikailag 8 mag van.
A jelenlegi felhozatalban éppen a 8 mag feletti, ami a jelenlegi megoldásokkal már bizonytalanabbul skálázódik (ott jön be a második chiplet), és úgy tűnik, a konkurenciánál is 8 mag lesz a plafon, ahol még nincsenek ott a kisbetűs részek (Alder Lake).
Ezek alapján én azt gyanítom, az árazási struktúra nem fog jelentősen változni a következő generációnál.
Esetleg az Alder Lake hozhat a maga módján 6+ magot olcsón, de a kis magos megoldásnak is meglesznek szerintem a maga buktatói, szoftveres oldalról a sok kis mag érzékenyebb lehet a programok skálázódási korlátaira, mint ugyanannyi, vagy akár kevesebb nagy. -
Petykemano
veterán
válasz
S_x96x_S #5382 üzenetére
"AMD Raphael with up to 16 cores"
Én egy pár éve még nagy híve voltam a magszám emelésnek. Az szerintem kétségbevonhatatlan, hogy nagy felszabadító ereje volt az első 1-2 zen generációnak, hisz kiszabadított minket a 4/8 felső korlátból.Nem állítom, hogy sok értelme lenne a magszám emelésének a mainstreamben. Tehát az, hogy $200-300 szinten mondjuk ne 6 magos procit lehessen kapni jövő évtől, hanem már 8 magosat, az igen csekély előnyt jelentene. Ha úgymond ingyen jönne a következő generációk során, akkor persze nem mondanék nemet.
Annak viszont semmi értelme, hogy úgy emelgessék a magszámot, hogy közben az ár is emelkedik. Mármint 24 magos cpu-t most is lehet kapni- drágábban. És azt most is csak az veszi meg, akinek szüksége van rá.
A sokmagos forradalom szerintem egyelőre elmaradt.
Egyrészről úgy tűnik, nem valósul meg hardver oldalról. Vagyis nem kapunk mondjuk 3-4 évente 2-vel több magot ugyanazért a pénzért. Nagyjából az lett - és valószínűleg marad is - standard, amit az AMD beállított a zen1 megjelenésével.
Másrészről szinte minden téren megmaradt az a helyzet, hogy a +20% IPC az minden körülmények között +20% IPC, míg a +50% v +33% magszám az hát csak bizonyos speciális körülmények között ér tényleg annyit.
Nem éri meg azért magas magszámú cpu-t venni, hogy a magas magszám majd hosszútávon is kielégítő lesz, mert mire IPC szempontjából kiöregszik, addigra majd hozzáskálázódnak a programok a sok maghoz. Kivéve persze ha biztosan olyan programot használsz, ami biztosan ki is használja a magas magszámot.Számomra például nagyon elgondolkodtató a pletykált Monet. Reméljük olcsón fogják adni. Mindenesetre azt elég valószínű, hogy bucira fogja verni az 1600-tól 2700X-ig mindent, pedig csak négy magos.
"Mindenesetre kiváncsi leszek az 5950X utódjára ..
Vajon lesz-e +20% CB R20 eredmény?"
Egész pontosan a Raphael-re gondolsz, vagy a Vermeer-X-re? -
S_x96x_S
addikt
válasz
S_x96x_S #5382 üzenetére
update:
Patrick Schur@patrickschur_
Raphael
- up to 16 Cores
- up to 170 W
- 5 nm -
S_x96x_S
addikt
AMD Raphael with up to 16 cores
ExecutableFix claims that AMD’s upcoming Zen4 based series for desktops will be limited to 16 cores.
https://videocardz.com/newz/amd-raphael-zen4-desktop-cpus-likely-limited-to-16-coresegyéb:
Vajon Intel Core i9-12900K - 8C+8c magja -tényleg pariban van
a ZEN3-as 16 magos 5950X -el ( Cinebench R20) ?Persze a DDR5 és a >5Ghz sokat jelent, de akkor azok a "small" magok
nem lesznek annyira gyengék.
Elméletileg a CB R20 már támogatja az AVX-512 -öt, És az Intel eléggé beleszól a fejlesztésbe is, de AVX512 csak az erős magokban van.Mindenesetre kiváncsi leszek az 5950X utódjára ..
Vajon lesz-e +20% CB R20 eredmény?
-
S_x96x_S
addikt
4700S .. vajon mennyi hibás chip lehet, ha 80
rendszer alapja lesz ???
( habár a PS5 chipet folyamatosan gyártják a következő pár évben is,
vagyis nem lehet probléma az utánpótlással ..)"AMD has confirmed to Tom's Hardware that 80 systems based on its mysterious 4700S Desktop Kit will come to market, with official sales of the first systems obviously already underway."
PS5 CPU Inside? AMD Says Eighty Different 4700S Designs Coming
https://www.tomshardware.com/news/ps5-cpu-inside-amd-says-eighty-4700s-desktops-coming -
S_x96x_S
addikt
új ZEN3-as ( akár 16 magos) Threadripper - Szeptemberben?
Videocardz: AMD Ryzen Threadripper 5000 allegedly launches in August, features faster xGMI
"According to the latest rumors, Threadripper 5000 could debut in August with availability expected in September.The series are to offer up to 64 cores and 128 threads, but SKUs with 16 cores are supposedly also considered. Full specs of Chagall have not yet been confirmed though." -
válasz
Petykemano #5377 üzenetére
Köszi a táblát. Windows 7 rendszerek arányának több mint duplázódása is az újranyitásra utal.
-
Petykemano
veterán
Itt egy másik érdekes kép az eladott PC példányszámokról:
[link]Ha jól értem, akkor a 2020 februári előrejelzés és a 2021 februári előrejelzés között évi 100millió gép különbség van. Nyilván az előrejelzés tényadatokra épül, de arra nem vállalkoznék ez alapján, hogy megmondjam, 2020 és 2021 eddigi hónapjaiban mennyivel volt magasabb tényleges eladásszám / kereslet az előző évekhez képest.
-
Petykemano
veterán
válasz
Petykemano #5375 üzenetére
ITt egy érdekes kép ehhez:
[link]
Az intel processzorok arányával együtt nőtt a korábban csökkenőben levő GTX 1060 is.
Úgy tűnik, talán tényleg csak internetkávézók nyitottak újra. -
Ueda
senior tag
Először látok assembly optimalizálást a zstd tömörítőben :
Még a legelején vannak, nem lehet tudni, milyen lesz a végső változat.
A táblázatban átlag 20 % gyorsulást (speedup) látok.
[https://github.com/facebook/zstd/pull/2722] -
Petykemano
veterán
válasz
S_x96x_S #5373 üzenetére
Én nem vonnék le messzemenő következtetéseket.
Az ilyen hirtelen ugrások általában nem valamilyen cpu piaci mozgás következményei.
Lehet, hogy elindult egy új játék, ami KÍnában népszerű
Lehet, hogy újranyitottak az internet kávézók, amik eddig "a covid miatt" zárva tartottak.
Lehet, hogy a lezárt bányászat miatt a gépeken adtak túl, és azok valami olcsó intel procik voltak.
Lehet, hogy a lezárt bányászat miatt a gépekből új internetkávézók nyíltak.Egyébként egy 4 magos GF12-es zen3 még talán engem is érdekelne. Bár az valószínűleg valami forrasztott cucc lenne, nem AM4.
-
válasz
S_x96x_S #5373 üzenetére
Én majd arra leszek kíváncsi, ez is ilyen anomália féle a Steamben, vagy tényleg trendforduló. Játékosok között több a DIY vásárló szerintem, mindfactorynál nem igazán látszik, hogy lassítana az AMD. Arról meg nem hallottam, hogy OEM-eknél hiány lenne AMD-ből (ettől még lehet persze
)
Múltkori anomália Steam surveyben, de előtte is van egy pár százalékos elmozdulás, ami aztán vissza is állt következő hónapban az enyhén javuló AMD trendre.
Milyen érdekes a steam survey-ben ez is:
Bal oszlopban az egyik kategóriában meg van nevezve egy gyártó, AMD-nek esélye sincs. -
S_x96x_S
addikt
a mindfactory stat csak az érem egyik oldala:
a másik oldal:
Intel erased all the market share gains AMD CPUs made this year
Nearly three out of four CPUs on the Steam Hardware Survey are Intel chips.a cikk felsorol pár okot :
- GPU hiány miatt az iGPU -s chipek keresettebek.
és itt jelenleg nem nagyon van kinálata az AMD-nek- az Intel jeletősen árat csökentett és megfordultak a szerepek
"it's like AMD and Intel suddenly swapped personalities, with the latter now the one with the bang-for-buck proposition."
------------------
amúgy az AMD ha megkésve is :
- próbálja visszaportolni GF-ra az új APU-kat.
- és megjelentetni az 5000G-s chipeket - augusztusban.És az hogy Kínában betiltották a Mining-ot, a globális GPU készleteknek is jót tesz ---> "X" -es (igpu mentes) CPU-kat jobban megéri venni.
És itt van még a technológia váltás (DDR5,Gen5,..) sokan kivárnak .. -
qwe8585
csendes tag
válasz
Petykemano #5369 üzenetére
Jöhetnének végre a nem X változatok.
-
S_x96x_S
addikt
-
S_x96x_S
addikt
CXL-to-Gen-Z bridge
" CXL™ Consortium and Gen-Z Consortium™ MoU Update: A Path to Protocol""CXL focuses on enabling coherent node-level computing, whereas Gen-Z focuses on fabric connectivity at the rack and row level."
-
S_x96x_S
addikt
HPC piacon - az AMD megállíthattalan ..
Nem véletlen, hogy viszi tovább az AMD a stratégiát ..
és már a 128 mag van megcélozva ..Top500 June 2021 Our New Systems Analysis AMD Wins Big
HPC-nél a magszám/socket igenis számít .. lásd utolsó oszlop ...
-
S_x96x_S
addikt
(piac)
RISC-V -t nagyon nyomják a kínaiak (is)
XiangShan open-source 64-bit RISC-V processor to rival Arm Cortex-A76Amúgy állítólag az AI a trójai falova a RISC-V -nek amivel be tud jutni a Szerverközpontokba. ( Datacenters)
AI IS RISC-V’S TROJAN HORSE INTO THE DATACENTER
(Jim Keller is most AI + Risc-V -el foglalkozik .. )(teszt)
ASUS PN51 Mini PC review: This AMD-powered compact workstation is a beastAMD-powered super-compact mini PC.
(AMD Ryzen 5 5300U; AMD Ryzen 5 5500U; AMD Ryzen 7 5700U) -
S_x96x_S
addikt
> Utóbbiban egyáltalán nem említik a régebbi alaplapokkal
> való kompatibilitást, ez volt, amit ellentmondásosnak találtam.előfordul néha.
felületes volt az AMD sajtóközlemény,
felületes volt a techpowerup újságírója, aki lehozta a hirt.az Anandtech-nél (utána/rá)kérdeztek: "AMD has confirmed that .."
és a Prohardver is beletette már ezt az "új" infót. -
TRitON
aktív tag
válasz
S_x96x_S #5358 üzenetére
Amit olvastam:
PH: "A vállalattól megtudtuk, hogy a korábbi generációs X470-es és B450-es vezérlőhidak támogatása az alaplapgyártóktól függ, ami annyit jelent, hogy a partnereknek nem kötelező kiadni egy kompatibilis BIOS-t, de a szükséges AGESA elkészült, így megtehetik, ha akarják."
[link]
TPU: "Built in the Socket AM4 package, the processors are compatible with AMD 500-series chipset motherboards."
[link]
Utóbbiban egyáltalán nem említik a régebbi alaplapokkal való kompatibilitást, ez volt, amit ellentmondásosnak találtam. Wishful thinking: ha az eddigi összes AM4 CPU (kivéve a Bristol Ridge-et muhaha) kapott az MSI-től támogatást a B450-es alaplapokhoz, bízom benne, hogy ez is fog. Nem szeretnék alaplapot is venni a jelenlegi árak mellett. -
S_x96x_S
addikt
> Mi a jelenlegi tényállás az 5700G vs. B450 témában?
> Ellentmondásos infókat olvastam.tényleg az Alaplap gyártótól függ.
https://www.asrock.com/mb/AMD/B450m%20Pro4/#CPU
Az 5700G a "P5.00" -BIOS-al került be, ami "2021/3/18" dátumú.
Jelenleg az "5.10" és az "5.20" BIOS is megjelent.ASRock B450M Steel Legend
Az 5700G a "P3.90" ( 2021/3/11) -BIOS-al került be támogatási listára.
Azóta a "4.00" és a "4.10" -es is megjelent.MSI B450 Tomahawk
még nem szerepel az 5700G a CPU listában.
( utolsó BIOS - 2021-04-26(Béta) )
Talán majd a következő hónapokban ..Gigabyte B450 AORUS M (rev. 1.X)
nem látom az 5700G-t.
utolsó BIOS (2021-05-10)
Talán majd a következő hónapokban .. -
S_x96x_S
addikt
válasz
Petykemano #5356 üzenetére
> A Windows 11 nem kompatibilis már
a Windows-on sok múlott ..
"elméletileg" a Win11 - már 64bit only lesz.
"Windows 11 will be 64-bit only. This doesn’t mean 32-bit applications aren’t supported, but 32-bit processors won’t be able to install the OS. Given that 64-bit CPUs debuted in the consumer market 18 years ago, we’re pretty fine with dropping 32-bit OS support." [link]a Linux-os világban meg a "Feature Levels" kezd népszerű lenni.
"... The latest GCC and Clang releases both support the notion of x86-64 micro-architecture feature levels and Glibc 2.33 added the HWCAPS bits for at run-time being able to dynamically load more optimized libraries for the given CPU being used where there is such library/libraries present on the system. This work can allow for Linux distributions to provide more optimized packages that would allow making use of AVX and other newer instruction set extensions without raising the base requirement for all users.
Various Linux distributions have been looking at making use of HWCAPS / x86-64 micro-architecture feature levels and for openSUSE Leap / SUSE Linux Enterprise they are too at least for prominent key system libraries.
The x86_64-v2 feature level that openSUSE Leap / SLE is pursuing assumes the CPU can handle SSE4.2, SSSE3, POPCNT, and CMPXCHG16B. Most CPUs for the past number of years can support at least x86_64-v2 -- basically CPUs going back to the Intel Nehalem days. It's with v3 and higher where the support gets a bit more tricky due to requiring AVX2.
The x86_64-v2 HWCAPS for libraries of important base system components is currently part of the feature planning for the next SLE / Leap release and hopefully that will pan out without needing to slip for another cycle." [Phoronix]Ami érdekes, hogy az Enterprise világban ( nem a Consumer )
néha elég őskori szoftverekkel dolgoznak.
( Cobol, Fortran, Mainframe, .. )
és mivel van pénzük és befolyásuk az érdekérvényesítésre
emiatt van is rá támogatás.De a consumer kategóriában annyira el vannak aprózódva az ügyfelek - és annyira nem tudnak érdeket érvényesiteni,
hogy a gyártó cégek pár év után dobják a támogatást.
( lásd 5000G B450 chipset támogatás lebegtetése )Az ARM ökoszsiztémának eddig 2 fő lába volt
és ezek élesen elkülönültek
- embed/IOT/microcontrollers ..
- consumer-mobile ( gyors iteráció )De az X86-os világban nincs / nem is volt éles határ ..
és ami eddig előny volt, az már kezd súlyos teher lenniVégre - Le kellene ülni az AMD -nek és az Intelnek
és közösen kitalálni az X86-A64 jövőjét .. -
S_x96x_S
addikt
> Mi a jelenlegi tényállás az 5700G vs. B450 témában?
> Ellentmondásos infókat olvastam.nem tudom, ( és nem tudom mit olvastál )
szerintem a konkrét alaplapgyártónál kellene utána érdeklődni.
de az eddigi régi ~hivatalos infók[1] alapján a 400-as chipset-set támogatás második körös .. ( kisebb a prioritása mint az 500-nak )
vagyis
- később érkezik
- és az alaplapgyártóra van bízva.Ettől függetlenül Béta bios - akár augusztus elején már elképzelhető
( de az is lehet, hogy pár alaplaphoz nem lesz még ... )
nem tudom.[1] Chipset Support
AMD has confirmed that X570, B550, and A520 motherboards will support the new 5000G processors. X470 and B450 motherboards might also be supported, but that depends on the motherboard manufacturer. At this time, for anyone lucky enough to get one on the open market, special Beta BIOSes will be needed to enable full performance. [Anandtech] -
Petykemano
veterán
válasz
S_x96x_S #5354 üzenetére
Az apple egy kuriózum
Az már inkább érdekes, hogy a hagyományos arm miképp engedheti meg magának, hogy eldobjon régi fícsöröket, és az x86 meg miért nem.Azt gondolom, ez abdisztribúciós csatornán múlik.
Az android fő csatornája a play store volt. Nagyon ritkán forgott kézen apk. Vagyis végfelhasználó ritkán szembesült azzal, hogy a régi verzója nem megy.
Ehhez képest x86-on elég gyakori lehetett a nyafogás.De azért szerintem már így is vannak régi dolgok, amik nem működnek. Dosos játékok. Azokhoz már egy ideje dosbox kell.
A Windows 11 nem kompatibilis már az első generációs ryzenekkel sem. Talán lassan itt is elindul az elengeDés.
Bár jim Keller azt mondta, kezdetben azért gondolták, hogy a risc jobb, mert a cisc prociknak kellett egy nagy rom és ha az ahhoz szükséges tranzistorokat inkább számításra használjuk... de ma meg már olyan pici az a rom, hogy szabadszemmel alig kivehető.
-
S_x96x_S
addikt
Ryzen 7 5700G
"limited to the OEM market until the full retail launch on August 5, 2021."
https://www.tomshardware.com/news/amd-ryzen-7-5700g-review -
S_x96x_S
addikt
válasz
Petykemano #5352 üzenetére
> persze én arra számítok, hogy az x86 magok
> picit mindig többet fognak.fogyasztani, mint az arm magok.azért az ARM ökoszisztéma eléggé dolgozik
a "ballasztok" leválasztásánpl. kernel support heterogén módra, ha nem minden mag támogatja a 32-bites végrehajtást. [1] -> Kevesebb tranzisztor, amit másra lehet használni ..
Az Apple M1 a 32-es mód eldobását már régen meglépte,
és mostmár az X2 és az A510 is. [2]az X86-A64 oldalán meg csak hízik és hizik .. anélkül
hogy a régi dolgokat elengedné. Mint a kisgömböc a mesében ..
de ennek a vége az lesz, hogy ki fog durrani, annyi tranzisztor kell bele.
Ez így zsákutca ..
és lehet, hogy az Intel részben emiatt is beruházott a SiFive-ra ( RISC-V).
( mint egy lehetséges tartalékterv )
Meg amúgy Pat Gelsinger vezette az Itaniumos projektet az elején.De vajon az AMD-nek mi a tartalék terve ?
---------------------
[1] Linux 5.14 ARM64 Preps For When Not All The CPU Cores Support 32-bit Execution
https://www.phoronix.com/scan.php?page=news_item&px=Linux-5.14-ARM64[2]
"While Arm is declaring that shift to happen in 2023, for all intents and purposes it’s already happening next year for most global users. Both the Cortex-X2 flagship core and the Cortex-A510 little cores are AArch64-only microarchitectures that are no longer able to execute AArch32 code. With that said, sharp readers will note that two out of three CPUs isn't a complete shift, and the reason for that is because the Cortex-A710 actually still supports AArch32. Arm states that the reason for this is primarily to meet the needs of the Chinese mobile market, which lacks the homogeneous ecosystem capabilities of the global Play Store markets,
... "
https://www.anandtech.com/show/16693/arm-announces-mobile-armv9-cpu-microarchitectures-cortexx2-cortexa710-cortexa510 -
S_x96x_S
addikt
válasz
Petykemano #5352 üzenetére
> Közben az Intel sem tétlenkedik.
> Elsők között lesznek megrendelői a TSMC 3nm-nek.
> Az szerintem 2023.igen ..
kemény verseny lesz:
az Apple és az Intel azonos gyártástechnológián mérik össze magukat ..
csak az ISA és a chiptervezési know-how számít.
Ha itt az Intelnek nem sikerül meggyőzően bizonyítani ..
akkor nagyon gyors átmenet lesz a mobil/Notebook piacon az ARM felé.(szerver) Az AMD-nek az adhat reményt,
hogyha 3nm-en még nem lesz elérhető a Vcache.
mert azzal TALÁN tudná kompenzálni az 5->3nm es +10-15%-ot. [1]Amúgy a 2022H2-ből bármi lehet ..
akár a legkorábban 2022Decemberi piacra lépés. ( Legalábbis az Apple-nek könyebb az esete - kontroll alatt tartja a teljes gyártási láncot .. )2022H2 volume production[1]
[1] "Compared to 5nm, the 3nm process, has a 10-15% speed improvement at the same power or a power reduction of 25-30% at the same speed, with a logic density improvement of 1.7x, an SRAM density improvement of 1.2x and an analogue density improvement of 1.1x."
> Amúgy ha már itt tartunk, meglepne, ha a nuvia
> chipeket 2023-ban nem 3nm-en gyártanák.
> És akkor az már lehet, hogy meg is magyarázza a fogyasztástA Nuvia számai - belső szimuláción alapultak,
amit vagy elhiszünk vagy sem ..
( A Qualcomm elhitte nekik és meg is vette őket )
de ehhez az is kellett, hogy
a Nuvia mögött az Apple A/M(elődeinek) a fejlesztői vannak.Amúgy a Qualcomm nem csak az Intel-lel
hanem a TSMC-vel is flörtöl ..van is egy angol szó erre: Frenemy
És ez az AMD és az Intel kapcsolatára is igaz. -
Petykemano
veterán
válasz
S_x96x_S #5350 üzenetére
Bocs, nem tudtam befejezni...
Az amazon egyben a legesélyesebb és a legkevésbé esélyes is. Valahogy összerakták a gravitont. Biztosan készül már a graviton 3 is a V1 v N2 magokra építve.
Annál persze a zen2+50% biztosan jobb. Ha jól emlékszem, akkor már a A77 elérte a x86 magok IPC-jét, csak nem éri el az 5GHz-et. Szerverben viszont épp azért versenyképes, mert ott minden 3-3.5GHz-et megy.
Ehhez képest az M1 alacsonyabb frekvencián versenyképes az 5GHz-es x86 magokkal.
Ez a zen2+50% elég jól.hangzik ma. De 2023-ban?
Azért számoljunk.
Zen2-höz képest a zen3 +15%. Jövő évben kijön a zen4, ami remélhetőleg rátesz a zen3-ra 15-20%-ot. És ott van még a v-cache is, ami itt-ott szintén jelenthet 15%-ot.
Tehát a peak performance előrelépés éppenséggel x86 oldalról is meglehet.
Viszont a fogyasztás egy érdekes kérdés.
A gyári Arm magok esetén szerintem nem igazán tapasztalható az, hogy lényegsen jobb fogyasztással rendelkezne az arm. Az M1 viszont igen erős. Nyilván mert annyival alacsonyabb frekvencián hozza.
Nyilván a Nuvia is széles designnel oldja meg.Szóval az a kérdés, hogy a TSMC 5nm-e vajon milyen előrelépést hozhat, illetve hogy nem viszi-e el a töbv tranzisztor.
Abu valahol mintha említette volna, hogy legnagyobb jelentősége annak van, hogy full EUV.A verseny mindenképpen örömteli.
Közben az Intel sem tétlenkedik. Elsők között lesznek megrendelői a TSMC 3nm-nek. Az szerintem 2023.
Amúgy ha már itt tartunk, meglepne, ha a nuvia chipeket 2023-ban nem 3nm-en gyártanák. És akkor az már lehet, hogy meg is magyarázza a fogyasztást. Persze én arra számítok, hogy az x86 magok picit mindig többet fognak.fogyasztani, mint az arm magok. -
S_x96x_S
addikt
piac/versenytárs/
új főnöke van a Qualcomm-nak ;
és mind a mobil(Notebook)mind a szerver piacon nyomulnának.Nem tudom kinek licenszelnék a Nuvia magokat,
lehet, hogy az AWS cserélné le a Gravitont?Qualcomm to Challenge Intel With Nuvia-Designed Notebook Chips
"It also plans to license Nuvia cores for third-party datacenter SoCs."
"Nuvia was originally co-founded by ex-Apple engineers in a bid to build Arm-based system-on-chips (SoCs) for servers. Based on the company's own simulations, its Phoenix core could deliver at least 50% higher peak performance than AMD’s Zen 2 and Intel’s Sunny Cove cores at 1/3 of power (4.50W vs. 14.80W) in Geekbench 5, which looked very competitive. The Phoenix core could also outperform Apple's A13 Lightning cores, which essentially means that the company claimed the core was considerably better than Arm's generic Cortex A-series cores that are widely used in smartphones, tablets, and some PC-oriented SoCs. "
https://www.tomshardware.com/news/qualcomm-promises-nuvia-socs-for-pcs-in-2023magabiztos .. lenyomnák az Apple-t is.
Qualcomm CEO Says They Can Beat Apple M1 With Nuvia Team Driving Laptop Chip Design -
S_x96x_S
addikt
Charlie: ( 3 kiemelés a 16 -ból .. )
"Genoa delayed to mid-22 vs the formerly assumed (by Charlie) early 2022. It's a delay for technical reasons, not for marketing ones - Charlie doesn't know the details but expects it to be a bug. Could be anything really, but doesn't think it's a major issue at all."
Intel: "Launch BIOSes for SPR are scheduled to arrive in late Q2, so expect volume to come afterwards. "Q3 launch wouldn't surprise". Similar situation to ICL-SP - "launch" in March, but no availability until May."
Intel: "Realistically there's very little on the roadmaps right now that will stop AMD". -
S_x96x_S
addikt
válasz
Petykemano #5342 üzenetére
Lassan már a 128 mag is kevés lesz ..
de legalább a "verseny" kihozza a maximumot a designokból - mindkét oldalon.
( videokardz -os linkből linkelve )
-
Petykemano
veterán
AMD Daytona vs Gigabyte
MilanEddig ez elerülte a figyelmemet. Az AT újratesztelte a Milan-t egy másik alaplapban (GB) és eltűnt a korábban tapasztalt magasabb Idle power
-
hokuszpk
nagyúr
válasz
Petykemano #5344 üzenetére
mekkoria meglepi lesz, ha kiderul, hogy mar a Zen3+ mag van backportolva
-
hokuszpk
nagyúr
válasz
Petykemano #5342 üzenetére
"AMD Monet: Zen3 on 12nm node"
nocsak. valahol mondtam, hogy fogunk latni 12nm -re visszaportolt csodakat, de valami sima kisebb Navira ment el a tipp.
-
Petykemano
veterán
Backporting - erre vártunk.
Monet
4 magos pici apu.
Zen3 magokkal
GF 12LP+ gyártástechnológán készítve./pletyka/
-
hokuszpk
nagyúr
válasz
Petykemano #5342 üzenetére
"128 magos zen4 kódneve: Bergamo"
hat az Atalantanak most nagyon megy, de megse egy Roma, Juve vagy Milan
-
Petykemano
veterán
MLiD videója szerint a 128 magos zen4 kódneve: Bergamo
[link]Hozzáteszem: a videóban többször hangsúlyozza, hogy ez nem 100%.
Csak azért jegyzetelem le, hogy legyen nyoma, ha kódnevekre keresnénk.Elég valószínű, hogy a 128 magos zen4 létezik.
Persze lehet az AMD részéről csupán egy backup plan, ha az egyik Arm gyártó (esetleg az intel) előállna valami ütős termékkel.
Ebből a szempontból az intel nem tűnik versenytársnak (mármint minden szempontból). Az AdoredTV által bemutatott Sapphire rapids infók alapján az 56 mag elég nagy lapkákból áll össze (~1500mm2) annak ellenére, hogy már 10nm-es. Viszont a fentebb említett speckó utasításokkal (AMX, AVX512, stb) bizonyos specializált részterületeken előremutató lehet és persze ugye az is igaz lehet továbbra is, amit Abu mondott, hogy az eladási volumen nagy része alacsonyabb magszámú termékekből áll.Szóval lehet, hogy csak backup plan az AMD részéről egy potenciális ARM versenytárssal szemben. De az is lehet, hogy végül lesz belőle termék.
Említésre került, hogy a 128 mag cloud szolgáltatóknak menne.
Az nem teljesen világos, hogy csak a magok száma miatt miért kéne külön platformot csinálni? Tehát valami trükközés a magszámon kívül kell legyen még. Még annak se feltétlenül kellene különálló platformot jelentenie, ha - a GCP-ben elhelyezett Milanhoz hasonlóan - le van tiltva az SMT.
Például:
- más az IOD, több memóriacsatornát tud kezelni.
- Esetleg tartalmaz valamilyen olyan módosítást, ami SMT nélkül mégiscsak magasabb egyszálas teljesítményt ad.
- v-cache
- LSI (~EMIB) használata (Nyilván minél több a mag, annál több a inter-chiplet kommunikáció is, amiben éppenséggel gyengélkedik már a Milan is)
- HBM2 (hát talán ez a legkevésbé valószínű)Lehetne olyan prózai is az ok, hogy a 96 mag elfér ugyanakkora helyen, mint az eddigi kialakítások, de a 128 mag már nem.
Mindenesetre az sajnálatos kicsit, hogy az Executablefix által renderelt képek alapján nem látszik változás arra vonatkozóan, hogy miként huzalozzák össze a chipleteket (LSI) Ami arra utal, hogy az egzotikus AM5 kupak alatt sincs semmi érdekes.
-
S_x96x_S
addikt
válasz
hokuszpk #5338 üzenetére
> es ha igazam van, akkor az Intel megint bealdozza a biztonsagot a
> sebessegert,nem pont fordítva ?
most isszák a levét a régi dolgoknak
és mivel nincs már más
kénytelenek a biztonságos-és-lassú utat választani.> de ez csak addig lesz oke, amig meg nem jonnek az elso
> hirek az inkonzisztenssé / korrupttá váló adatbazisokrol.éppen a TSX- inkonzisztens ;
nem tudják mikrokóddal se megjavítani - ezért kell kikapcsolni.
2.5 évet tököltek rajta .. és ha lett volna jobb megoldás,
akkor nem ezt választják ...muszály kikapcsolni .. (mert tényleg az lesz,
hogy az Intel az inkonzisztencia szinonimája lesz )Ennél az is jobb, hogyha lassan/hagyományosan és biztonságosan - szoftveresen oldják meg tranzakció kezelést.
"A memory ordering issue is what is reportedly leading Intel to now deprecate TSX on various processors. There is this Intel whitepaper updated this month that outlines the problem at length. As noted in the revision history, the memory ordering issue has been known to Intel since at least before October 2018 but only now in June 2021 are they pushing out microcode updates to disable TSX by default."
-
S_x96x_S
addikt
Phoronix: AMD EPYC Milan Performance Across 11 Different 2021 Linux Distributions
Az Inteles - ClearLinux a legjobb az EPYC-re
Az UBUNTU a végén .. -
hokuszpk
nagyúr
válasz
S_x96x_S #5332 üzenetére
nemastam magam bele, de tippre a TSX az ilyen in-memory adatbazisoknal jatszana, es ha igazam van, akkor az Intel megint bealdozza a biztonsagot a sebessegert, de ez csak addig lesz oke, amig meg nem jonnek az elso hirek az inkonzisztenssé / korrupttá váló adatbazisokrol.
-
S_x96x_S
addikt
Versenytárs:
Az Intel Sapphire Rapids -ban 2 újdonság is van1.) Advanced Matrix Extensions (AMX),
(ezzel szerintem az Intel az nVidiás CUDA-ra is válaszolni akar)
Kérdés, hogy melyik ZEN-be kerülhet be ..2.) Data Streaming Accelerator (DSA).
"a high-performance data copy and transformation accelerator for streaming data from storage and memory or to other parts of the system through a DMA remapping hardware unit/IOMMU."
ez meg talán a DirectStorage koncepció Szerveres változatának néz ki felületesen. ( jól jön a HBM2e - DDR5 - OptaneDisk közötti adatmozgatásoknál )persze ezek papiron nagyon jól néznek ki.
és kb 6 hónapos előny garantált az Intelnek a bevezetésnél.Az AMD ( aki bár általában óvatos és keveset igér - ami jó )
de ettől függetlenül - valamit meg kell mutatnia 2021H2-ben
hogy az ügyfeleiben tartsa a lelket.
- én pl. HBM -et várok EPYC-re integrálva.az AMD-nek se Optane-ja, se AMX-e nem lesz ... de valami meglepit csak fel tud mutatni .. amire még az Inteles-es Raja is csettint egyet ..
-
S_x96x_S
addikt
válasz
Petykemano #5333 üzenetére
> 16GB DDR5
The first 32GB DDR5 RAM kit lands at retail for $311 and it’s already sold out
https://www.pcgamer.com/the-first-32gb-kit-of-ddr5-4800-ram-lands-at-retail-for-dollar311-and-its-already-sold-out/"What about pricing? A couple of weeks ago, TeamGroup said its 32GB DDR5-4800 memory kit would be available to purchase by the end of the month for $400. It's actually a bit cheaper—Amazon and Newegg both had it listed for $311 before the kit sold out."
---
DDR4 4600 -as Newegg - Bestselling árak ( 2x16Gb )
kb 350$ - körül vannak.
persze latency meg sok más dolog is bele játszik ..
de még a DD4-4000-res árak is nagyon szórnak 180$ - 420$ látok mindenfélét ..de majd meglátjuk ...
-
S_x96x_S
addikt
válasz
Petykemano #5333 üzenetére
> Tudom, persze az elején mindig nagyon drága,
szerintem
az "alap" 4000Mhz körüli DDR5 -ösök
olcsóbban fognak kijönni mint a 4000Mhz-es DDR4-esek.a DDR4 -ből a 4000Mhz körüli/felettiek már a prémiumos termékek
nehezebb gyártani is .. a TOP30 % -ban vannakDDR5 -ből meg a 4000Mhz-es még mindig a bottom 30% -ban.
Nem melegszenek annyira, nem a válogatott chipek kerülnek ide.Ráadásul most a memóriagyártók már csak DDR5-ös gyárakat csinálnak vagy állítják át a gyárakat DDR5-re.
Vagyis a DDR4-es keresletre - sokkal kisebb DDR4-es kinálat jut.
Vagyis az is lehet, hogy a DDR5 - az év végi DDR4-es árakhoz képest már relative olcsóó lesz .. ( ugyanakkora teljesítményt értve )
DDR4 memory is becoming more expensive ahead of the DDR5 era
By Paul Lilly April 21, 2021
A market research firm says PC DRAM prices could jump by as much as 28 percent this quarter.
https://www.pcgamer.com/ddr4-memory-is-becoming-more-expensive-ahead-of-the-ddr5-era/ -
poci76
aktív tag
válasz
Petykemano #5333 üzenetére
Ennek az lenne a feltétele, hogy a memóriaárak jelentősen csökkenjenek.
-
Petykemano
veterán
16GB DDR5
Elég szellős.
Tudom, persze az elején mindig nagyon drága, de erre nagyon hamar fel fog szerintem kerülni egy másik 4-es pakk és ha két modult veszel, akkor az már 64GB.
A kép alapján úgy tűnik, rá fog férni - még mindig egy oldalra - annak kétszerese is a felső sorban. 2 modullal az már 128GBVan egy olyan érzésem, hogy a memória kapacitás jelentősen meg fog nőni a következő néhány évben.
2-3 év múlva lehet, hogy már 64GB-os gépeket fogunk venni (vagy csak nézni) -
S_x96x_S
addikt
versenytárs - Ajjjajjjj ..
Az Intel csendben letiltja a TSX -et
egyes Skylake és Coffee Lake prociknál ...
Intel To Disable TSX By Default On More CPUs With New Microcode"Intel is going to be disabling Transactional Synchronization Extensions (TSX) by default for various Skylake through Coffee Lake processors with forthcoming microcode updates. Yes, this does mean performance implications for workloads benefiting from TSX. This change has seemingly not been talked about much at all publicly and I just happened to become aware of it when looking through new kernel patches."
-
S_x96x_S
addikt
Labilis (Intel/AMD) CPU-k
, Corruption Execution Errors (CEEs); “mercurial” cores, szívás+++
már kb 1 hónapos hír, de érdekes lehet,
video: https://www.youtube.com/watch?v=QMF3rqhjYuM
"HotOS 2021: Cores That Don’t Count (Fun Hardware)"
aminek a lényege,
hogy egyes CPU-k furcsa - nehezen detektálható ( "csendes" ) hibákat generálnak. Hasonló mint az ECC memória problémaköre, csak ez CPU-ra.- kb 1/1000 CPU érintett
- egyes CPU-k, bizonyos esetekben elég labilis eredményeket kalkulálnak
- extrém következmények is lehetnek .. pl. ha valaki ilyen CPU-n titkosít akkor nem biztos, hogy vissza tudja kódolni az anyagát ..pár link:
Google kutatásról: http://muratbuffalo.blogspot.com/2021/06/cores-that-dont-count.html
Facebook kutatásról: http://muratbuffalo.blogspot.com/2021/06/silent-data-corruptions-at-scale.html
https://www.theregister.com/2021/06/04/google_chip_flaws/https://www.extremetech.com/computing/323476-cpu-manufacturers-are-pushing-the-boundaries-of-cmos-and-starting-to-pay-for-it
"The idea that CPUs would become less reliable as transistor density increased is a topic people like Bob Colwell, the lead designer on Intel’s 1995 Pentium Pro, were talking about 20 years ago. This is the first report I’ve ever seen in that time suggesting that CPUs from both AMD and Intel could now suffer from various silent errors that may otherwise go undetected in the moment and that the problem is industry-wide.
This incident has some similarities to the old Pentium FDIV bug, but only nominally. The FDIV flaw was silent in most cases, but the issue affected every Pentium Intel had built, and it affected them immediately. According to Google, some chips don’t show evidence of flaws until they’re at a certain age. Google is actively working on writing software to detect CEEs and it calls on both Intel and AMD to test CPUs more effectively before shipping them." -
S_x96x_S
addikt
-
S_x96x_S
addikt
válasz
Petykemano #5328 üzenetére
> 2684 a táblázatban levő legmagasabb turbo frekvencia.
az külső GPU .. saját hűtéssel .. nem APU
szerintem:A ZEN3 -as chip (~Package W) minimum 10W-ot fogyaszt üresben is [1]
ha meg adagolja az adatokat a iGPU-nak, akkor lehet, hogy 15-20W
emiatt nem lehet a teljes fogyasztási keretet az iGPU-ra áttenni.
vagyis a 2684 * 0,75 ~ 2Ghz
( de én 2.3Ghz felett APU-t nem igen várnék az N6-sal se .. )
Ettől még örülnék, ha neked lenne igazad és én tévednék.
az okoskodásomat arra építem, hogy
valami üresjárati fogyasztást a CPU-ra is allokálni kell ..
Legalább 3-5-10 W -ot. ami beleszámít a közös hő-keretbe.
Az AMD Ryzen Embedded - V3000 -ben benne van szinte
minden .. vagyis a hálózatra, az USB , a SATA kezelésre is kell allokálni valami fogyasztást.
[1]
[link] -
Petykemano
veterán
-
S_x96x_S
addikt
válasz
Cathulhu #5325 üzenetére
> SiFive-nak van nem open source ipje?
az én értelmezésem szerint
A RISC-V IP ( referencia design és ISA ) Open Source -os ..de mintha a SiFive -nek egy egyedi Apple Silicon hoz hasonló
megoldása IS lenne
( custom design - ami a publikus "szabad" ISA-t implementálja )
és a legújabb design nem találod meg a repojukban
https://github.com/sifive
( vagy csak én nem találom a "Performance P550 core"-t, mert béna vagyok. )
Vagyis csak egy része open-source-os , pont annyira, hogy a saját ügyfeleik életét megkönnyítsék.
https://github.com/sifive/freedom-e-sdkHa teljesen "szabad licenszű kell " akkor ott van még a Rocket-Chip
https://github.com/chipsalliance/rocket-chip -
S_x96x_S
addikt
válasz
Petykemano #5322 üzenetére
> .. hogy 65-95W-os TDP keretben az IGP frekvencia tudna-e feljebb
> menni? Mondjuk esetleg 2.5-2.7Ghz-re.talán ..
valami okosabb chip-en belüli smartshift / GPUturbo kell ..
a PS5-ben ( ~ AMD Design )
jelenleg 2.23 Ghz a beállított "tető" .. és az N7-es technológia
Hátha az N6-os egy picivel jobb lesz. -
S_x96x_S
addikt
válasz
Petykemano #5323 üzenetére
hát igen ... keményen jön fel a RISC-V is.
Ráadásul a SiFive nem csak az Intel 7nm-en nyomul
hanem TSMC (5nm! )
és a Samsung-al is együtt dolgozik.persze ha az Intel megveszi .. ki tudja mi lesz a Samsung és a TSMC-s együttműködéssel.
Ráadásul az Intel 2022 -re igéri a 7nm-en , a saját chipjét 7nm-en meg 2023-ra.
"The time scale for this platform coming to market is quite interesting. Despite Intel recently committed to bringing its 7nm to market in 2023 with the compute tile for its Meteor Lake processor as its first 7nm product, we’re being told that Horse Creek silicon will be ready in 2022, which would make Horse Creek its first 7nm product. For what it is worth, it’s unlikely that the Intel RISC-V solution is tile-based, but it might be easy enough to bring a small RISC-V chip development platform to market around then. The chip is likely to be small, so that might work in favor of its costs as well. A question does remain as to whether Intel’s involvement here is purely in the hardware, or whether there will be an Intel-based software stack to go along with it."
-
Petykemano
veterán
-
-=MrLF=-
senior tag
válasz
Petykemano #5316 üzenetére
tegnap jött cikk is: [link]
-
awexco
őstag
válasz
Petykemano #5319 üzenetére
Ha nem lesz nagyon kiherélve az igp elég frankó laposok lesznek belőle .
Bár fura , h nem 5nm-en jön ... Jövőre gyárt ott az amd is úgyrémlik. -
awexco
őstag
válasz
Petykemano #5316 üzenetére
ddr5 ?
-
S_x96x_S
addikt
AM4 - igéretes otthoni gép ..
sajnos csak Gen3-as M.2 -e van ( nem Gen4 ) de minden másban majdnem tökéletes.
( viszont 4 DDR RAM! és egy mini PCIe Kártyahely )"DeskMini Max is a 9L desktop PC equipped with an ASRock X300-ITX motherboard that supports a wide range of AM4 Ryzen processors from 2000 up to 5000 series (maximum 105W). It is worth noting that this is not a standard Mini-ITX motherboard, but a custom extended version that packs four full-sized memory modules as well as a full-length PCIe interface."
https://videocardz.com/newz/asrock-deskmini-max-features-mysterious-amd-radeon-p120-itx-graphics-card
-
Petykemano
veterán
AMD Ryzen Embedded - V3000
Zen 3 (6 nm) - FP7r2
- up to 8 Cores / 16 Threads
- 20x PCIe 4.0 lanes (8x dGPU)
- 4x DDR5-4800 (ECC)
- two 10G ethernet PHYs
- 2x USB 4.0
- 15-30 W and 35-54 W models
- up to 12 CUs (RDNA2)(~Rembrandt)
[link] -
Petykemano
veterán
válasz
paprobert #5314 üzenetére
"Csak arra utalok, hogy az AMD akkor fogja használni a TSMC polcról levehető, pénzbe kerülő technológiáját, ha kikerülhetetlen falba ütközik a további skálázásban a saját rendelkezésre álló eszközeivel."
Értem és ezzel egyet is értek. Én magam is felvetettem azt a kérdést, hogy tök jó, hogy nagyon magas sávszélesség állna rendelkezésre a CCD és az IOD között és az L4$ is papíron jól hangzik, de vajon ténylegesen mennyit profitálna belőle a cpu?Szerintem egyébként az energiafogyasztás terén szorít a cipő.
Egyrészt a 2pJ/bit sok, ehhez képest kísérleti jelleggel votl már 0.56pJ/W is TSMC+ARm alapon
Másrészt a milan Epyc Idle fogyasztása 100-110W. [link]De ha ezt megoldja csak az IOD alacsonyabb csíkszélessége és/vagy a nagyobb L3$, az is jó lehet.
-
paprobert
őstag
válasz
Petykemano #5313 üzenetére
A moduláció típusa, a vezeték két végén lévő en- és decoder karakterisztikája, ill a vezetékek száma adott esetben, mind tud fejlődni. Networkingnél látjuk, ami ennek az élvonalában halad, hogy rengeteget volt a fejlődés azonos fizikai médiumon keresztüli adatátvitelben az elmúlt években, azaz van tér a fejlődésre.
Vagy másik példa erre a PCIe, amely alatt az összes cég, ill. konzorcium próbálja propagálni a saját zárt(abb) szoftverrétegét.
Vagy pl. kis csúsztatással a GDDR6X is emiatt gyorsult."De ezzel arra utalsz, hogy az AMD nem fogja használni a TSMC packaging technológiát, hanem sajátot fejleszt?"
Csak arra utalok, hogy az AMD akkor fogja használni a TSMC polcról levehető, pénzbe kerülő technológiáját, ha kikerülhetetlen falba ütközik a további skálázásban a saját rendelkezésre álló eszközeivel.
-
Petykemano
veterán
válasz
paprobert #5311 üzenetére
"Az IF törvényszerűen követi az egységnyi idő alatt egy vezetéken átküldhető adatmennyiség rekordját, tisztes távolságból. Ha ebben fejlődés van, minden interconnect képes gyorsulni."
Nem teljesen értem ezt a megjegyzést. De ez nem biztos, hogy Te hibád, lehet, hogy én vagyok alul- vagy félretájékozott. Távol van tőlem, hogy magamat ezeknek a technológiáknak a beható ismerőjének tüntessem fel, épp csak morzsákat csipegetek.Tudomásom szerint az Infinity Fabric egy linkje egy 32bit széles busz viszonylag magas frekvencián. Tehát persze, ahogy ezt a frekvenciát tudják növelni, úgy nőhet a sávszélesség is és persze a magas frekvencia biztosan segít a viszonylag nagy távolságban levő chipek közötti késleltetés letornászásában.
Ez a megoldás költséghatékony, mivel nincs gigantikus interposer.
Viszont - tudomásom szerint a magas frekvencia miatt - az adattovábbítás költsége (áramfelvétel és hő) magas (2pJ/bit)Felfogásom szerint a régi jó interposer azt tette lehetővé, hogy
- vékony busz helyett széles buszt lehessen használni, ami adja a sávszélességet
- magas helyett alacsony frekvencián lehessen használni, ami jelentősen csökkenti az energiaigényt
- a chipek egymáshoz közel való ültetése pedig javít a késleltetésenUgyanezt teszi lehetővé az EMIB és az LSI is, úgy, hogy nem teszi szükségessé a 1000mm2-es interposer használatát egy EPYC esetén.
"Szerintem az AMD meg akarja úszni hogy TSMC-only technológiára építse fel az egész portfólióját, annak ellenére hogy egyébként szimbiózisban vannak jelenleg. A 3D cache egy viszonylag kockázatmentes projekt ehhez képest. Az új foglalattal lesz új tracing topológia is, azaz ha nagyobb sávszélességgel terveznek, a lehetőség meglesz a kiépítésére házon belül is."
Nem tudom, ezt ma még meg lehet úszni?
A célt érteni vélem, hogy ne legyen teljes függőség. De ezzel arra utalsz, hogy az AMD nem fogja használni a TSMC packaging technológiát, hanem sajátot fejleszt? -
S_x96x_S
addikt
Linux: "Pass-Through DMA controller for EPYC processors"
AMD Continues Working To Mainline Their PTDMA Driver For Linux
https://www.phoronix.com/scan.php?page=news_item&px=AMD-PTDMA-Linux-Driver-v10"The PTDMA hardware allows for high bandwidth memory-to-memory and I/O copy operations. Now mid-way through 2021 that AMD PTDMA Linux driver remains in the works and is up to its tenth driver revision while waiting to see if it's now ready for mainline or further changes are still deemed necessary.
This AMD PTDMA controller and driver is optimized for use with AMD Non-Transparent Bridge (NTB) devices and not general purpose DMA. NTB is used for in connecting multiple separate memory systems to the same PCI Express fabric. The PTDMA driver supports the 0x1498 (PCI device ID) controller found within EPYC processors since 7002 "Rome"."
-
paprobert
őstag
válasz
Petykemano #5310 üzenetére
Az IF törvényszerűen követi az egységnyi idő alatt egy vezetéken átküldhető adatmennyiség rekordját, tisztes távolságból. Ha ebben fejlődés van, minden interconnect képes gyorsulni.
"Lehetséges volna, hogy a zen4-be kerüli AVX512 támogatás magával hozza a IFOP cseréjét LSI-re?"
Szerintem az AMD meg akarja úszni hogy TSMC-only technológiára építse fel az egész portfólióját, annak ellenére hogy egyébként szimbiózisban vannak jelenleg. A 3D cache egy viszonylag kockázatmentes projekt ehhez képest.
Az új foglalattal lesz új tracing topológia is, azaz ha nagyobb sávszélességgel terveznek, a lehetőség meglesz a kiépítésére házon belül is. -
Petykemano
veterán
érdekes olvasmány arról, hogy miért döntött az AMD interposer helyett az IFOP megoldás mellett
Talán azt is magyarázza kicsit, hogy miért nincs L4$ és az AMD miért inkább az L3$-t növelgeti. az IFOP késleltetése viszonylag magas és linkenként csak 55GB/s a sávszélessége. Azt gyanítom, hogy nagyon kevés hatása lett volna, ha erre az alapra építenek rá egy az IOD-ban található L4$-t. Nem lett volna elég alacsony a késleltetés és a sávszélesség is szűk lett volna.
Olvastam a hétvégén egy cikket az EMIB-ről is. Az tulajdonképpen egy embedded interposer, ami a chipek széleit köti össze, ellentétben a hagyományos interposerrel, amire az összes lapkát rá kell ültetni - és emiatt az EPYC-nél túlságosan nagy interposert kellett volna alkalmazni.
Én azt gondolom, hogy 1000mm2-es interposert ezután se fognak használni.
Szerintem a következő lépcső a TSMC LSI nevezetű technológiájáa, ami megfelel az intel EMIB-nek.Az IFOP megoldás késleltetése és energiafogyasztása magas. A megnövelt méretű L3$ célja éppenséggel lehet az, hogy minél kevesebb adatot kell mozgatni az IFOP-on (CCD<->IOD<->DDR) keresztül.
Az LSI használata csökkentené a késleltetést és lehetővé tenné a CCD és az IOD közötti szélessávú kapcsolatot. Nem tudom mennyit, de olyasfélét, mint amit egy HBM igényel. (Természetesen az LSI használata lehetővé tenné azt is, hogy a CCD-k egyenként HBM-et kapjanak)
Azt viszont nem tudom, hogy ilyen szélessávú hidak használata - azon kívül, hogy lehetővé tenne egy L4$ kialakítását az IOD táján - vajon mire adna lehetőséget, vajon mit lehetne kezdeni vele?
Az AVX-ről (AVX512-ről) mondják, hogy nagyon cache és memóriaintenzív. Ami nem meglepő, hiszen sok adaton elvégzett vektorművelet. Ez valószínűleg egy dimenzióval fokozódik, ha mátrixműveletekről is beszélünk.
Lehetséges volna, hogy a zen4-be kerüli AVX512 támogatás magával hozza a IFOP cseréjét LSI-re?
-
S_x96x_S
addikt
32 magos szerver CPU-k .. (1 socket )
STH: Intel Xeon Gold 6314U v AMD EPYC 7543P the 1S 32-core Optionsa fekete az AMD ..
"Overall, Intel can claim a lower price by almost 5%. AMD can, however, claim that it has 20-33% better performance as well as additional PCIe Gen4 connectivity. Intel has its newer instructions and Optane PMem 200 support. Still, for the majority of buyers, it seems fairly clear that at list price, AMD has a better value proposition here."
"Overall, Intel made a lot of headway in this generation. At list pricing, we would probably recommend that the majority of our readers look at the AMD EPYC 7543P over the Intel Xeon Gold 6314U. AMD has more performance with the same core count, thus more performance per core. In other segments, having an AMD EPYC platform means more PCIe Gen4 connectivity. Still, there are many single-socket servers that have 0-1 expansion cards and 1-4 drives where Intel is now very competitive."A verseny jó
-
S_x96x_S
addikt
válasz
Petykemano #5307 üzenetére
> notebookok terén
a DigiTimes szerint az Intel notebook-os tortáját (~piaci részesedését) nem csak az AMD - hanem az Apple is eszegeti.
"Intel is expected to lose nearly 50% of its orders from Apple in 2021 and will eventually obtain no orders from the client. Losing Apple's 10% market share and seeing AMD staying firmly with another 10%, Intel's share in the notebook market is likely to slip below 80% in 2023, the sources noted." ( fizetős DigiTimes alapján - macroumors szemlézte)
Most az Intelre már nagyobb fenyegetést jelent az ARM (Apple silicon)
mint az AMD, azon egyszerű ok miatt, hogy az AMD-től sokkal egyszerűbb visszaszerezni a piacot a szoftver kompatibilitás miatt.De ha CPU ISA-t is váltanak az ügyfelek,
akkor onnan nehezen váltanak vissza Intelre. ( X86-ra) -
Petykemano
veterán
válasz
S_x96x_S #5306 üzenetére
Figyelemre méltó ugrás a notebookok terén - még ha ez csupán benchmarkokat jelent is, akkor is arra utal, hogy több az AMD noti, többet tesztelnek, talán több van a polcokon is és többen veszik meg kipróbálni, hogy milyen. A benchmarkból persze mindenképp csak az enthusiast réteg látszik.
-
S_x96x_S
addikt
AMD vs Intel Market Share ( benchmark alapon )
https://www.cpubenchmark.net/market_share.html
https://news.ycombinator.com/item?id=27553451 -
S_x96x_S
addikt
válasz
Petykemano #5302 üzenetére
> ARM .. X86 ... SMT
igen .. a célpiac kulcs
más a piac -> más az optimális kiépítés.
Az ARM Server chipek (jelenleg) tisztán Cloud fókuszúak ..
Ezért itt az egyszállúság előny.
Az X86 piaca vegyes .. itt az SMT2 a sweet spot .. ( céges belső szerverek vs cloud )Az IBM-es POWER chipek tisztán belső céges gépek ( van valami minimális cloud, de nem jellemző )
itt már --> SMT2, SMT4, SMT8 -
S_x96x_S
addikt
válasz
Petykemano #5301 üzenetére
> aZ x86 dekóder limitációról:
> "For a while we thought variable-length instructions
> were really hard to decode. But we keep figuring out how to do that.azért nem könnyű :-)
A probléma igazából az, hogy azt a trükköt amit az X86 -nál kitalálnak, az ARM dekodolásánál is fel lehet használni .. vagyis az előny megmarad. (az én laikus - naiv és leegyszerűsített nézőpontom szerint)
a ZEN3 akár 6 dekodólt utasítást is végre tudna hajtani órajelenként,
de csak 4-et tud dekódolni ..
Ha megvan a micro-op cache-ben, akkor jó .. ha nem, akkor meg vár a dekodolóra."The throughput of the Zen 3 is now as high as six instructions per clock cycle. This may be six integer instructions or six floating point/vector instructions, or any mix of these. This is a record so far. It can do three memory operations per clock. The clock frequency is 3.8 GHz with boosts up to almost 5 GHz.
A serious bottleneck is a decoding rate of 4 instructions or 16 bytes per clock. To compensate for this, the Zen 3 has a micro-op cache with 4096 entries after the decoder.The bottleneck in the decoder appears to be difficult to overcome. This is a consequence of the messy x86 code structure where instructions can have any length from 1 to 15 bytes, and it is complicated to determine the length of each instruction. Intel processors have the same bottleneck and the same decoding rate. The programmer must make sure the critical part of a program fits into this micro-op cache if you want to get the maximum throughput. It is important to avoid loop unrolling where possible in order to economize the use of the micro-op cache. (The Clang compiler often makes excessive loop unrolling).
The AMD Zen 3 has a higher instruction-per-clock throughput and a bigger micro-op cache than the best current Intel processors. This makes the Zen 3 the best choice for many applications. The Zen 3 does not support the AVX512 instruction set, however. Therefore, Intel processors are likely to be faster for software that can utilize the 512-bit vector instructions. AMD have focused on higher throughput where Intel have focused on larger vectors.
"
https://www.agner.org/forum/viewtopic.php?t=56Kérdés, hogy a ZEN4-nek milyen széles lesz a dekódere.
még ha meg is duplázzák 8-ra - mint az M1-nél ..
az ARM-et mindig sokkal egyszerűbb lesz skálázni dekodolás szempontjából. -
HSM
félisten
válasz
Petykemano #5288 üzenetére
"ez utóbbi tulajdonképpen miben különbözik attól, mintha mondjuk egy mag áramtalanítaná az AVX512 vagy egyéb részeit (regisztereket, cache-t, ALU-kat stb), amit épp nem használ"
Abban, hogy ami ott van, azt nem tudod áramtalanítással olyanná tenni, mintha nem lenne ott. Pl. a mag többi részét is hozzá kell igazítani, a jelutakat is hosszabbítja, így kikapcsolva is indirekten növeli a többi rész fogyasztását.Ez az OS tudta nélküli kis mag használat viszont hasznos lehet áramfogyasztás csökkentő célokra, az Arm-féle megvalósításnak is volt ilyen működési módja [link] . Ebben kevesebb elvérzési lehetőséget látok, mint a konkurens elképzelésben. Bár a leghasznosabb egy kapcsolható megoldás lenne, ha működhetne automatikus átkapcsolással, de ha olyan a munkafolyamat, mondjuk egy reboot árán átkapcsolhatnád, hogy elérhető legyen minden magod külön külön a takarékos mag utasításkészletével.
Egyébként vicces valahol (miközben mérnöki szempontból tökéletesen érthető és szükségszerű), hogy a mai napig előfordulnak ilyen problémák a nem heterogén felépítés miatt. Egy CCX itt, egy CCX ott, egy erős mag itt, egy gyengébb mag ott... És ezek még viszonylag hasonló képességű holmik voltak mondjuk egy tervezett 8+16-os Alder Lake utódhoz képest...
Lesz itt felfordulás még emiatt szvsz.
#5289 Petykemano : A CMT koncepciója szvsz jó volt. A Bulldozer piaci szerepléséhez más, szerencsétlen körülmények is hozzájárultak. Egyébként logikusnak tűnik az osztott FPU az AVX512-re. Kérdés, ezzel nem-e dobjuk kukába a használatának előnyeit. Illetve az első generációs Zen fele szélességű FPU-ja sem bizonyult rossz kompromisszumnak, lehet lenne értelme az AVX512-nél is bevetni, elkerülendő a mag túlzott "kiszélesedését".
-
Petykemano
veterán
válasz
S_x96x_S #5297 üzenetére
Kétféle véleményt láttam megjelenni:
1) "Báháháhá, az SMT letiltásával nyert egyszálas teljesítmény x86 utolsó halálhörgés kísérte próbálkozása, mielőtt az Arm végleg letaszítaná a trónról egyszálas teljesítményben különösen ha figyelembe vesszük a perf/W mutatót is."
2) Az elmúlt években a legnagyobb igyekezet ellenére is több SMT-vel kapcsolatba hozható sebezhetőség felbukkant. A szálak között megoszott erőforrások, cache-ek, bufferek, stb olyan sebezhetőséget rejtenek - most vagy akár a jövőben -, hogy bölcsebb és biztonságosabb már élből tiltani virtualizált környezetben, ahol nem biztosítható, hogy ugyanaz a mag biztosan ne kerülhessen kiosztásra két különböző szervezet vagy projekt számáraÉrdekes egyébként a megoldás.
a GCP-ben vCPU-t bérelsz, ami gyakorlatilag ez hardveres szálat jelent.
Állítólag az Amazonnál hardveres magot bérelsz, az SMT-t ingyen adják. -
Petykemano
veterán
válasz
S_x96x_S #5299 üzenetére
aZ x86 dekóder limitációról:
"For a while we thought variable-length instructions were really hard to decode. But we keep figuring out how to do that. You basically predict where all the instructions are in tables, and once you have good predictors, you can predict that stuff well enough. So fixed-length instructions seem really nice when you're building little baby computers, but if you're building a really big computer, to predict or to figure out where all the instructions are, it isn't dominating the die. So it doesn't matter that much."
Új hozzászólás Aktív témák
Hirdetés
- Linux kezdőknek
- Milyen billentyűzetet vegyek?
- Audi, Cupra, Seat, Skoda, Volkswagen topik
- D1Rect: Nagy "hülyétkapokazapróktól" topik
- BestBuy ruhás topik
- Milyen széket vegyek?
- Philips LCD és LED TV-k
- Az NVIDIA ipari AI-felhőt épít a németeknek, együtt az OpenAI és a Google
- Nintendo Switch 2
- Túra és kirándulás topic
- További aktív témák...
- 16GB-os SODIMM (notebook) DDR4 RAM bazár - nézz be, lesz, ami kell neked!
- HP 15-af105nh laptop (15,6FHD/AmdQuad/4GB/128SSD/Magyar) - Akku X
- JOYOR S5 Pro 10" Elektromos Roller 26Ah Akkumulátorral Moddolt!
- XPS 13 9310 13.4" FHD+ IPS i7-1185G7 16GB 512GB NVMe ujjlolv IR kam gar
- Megkimélt Apple iPhone 8 Plus 64GB Fekete szinben, 100% akkuval, kártyafüggetlen, garanciával
- LG 65QNED87T / 65" - 164 cm QNED / 4K UHD / 120Hz & 3ms / HDR 10 Pro / FreeSync Premium / HDMI 2.1
- Országosan a legjobb BANKMENTES részletfizetési konstrukció! Vásárolj okosan, fizess kényelmesen!
- Telefon felvásárlás!! iPhone 14/iPhone 14 Plus/iPhone 14 Pro/iPhone 14 Pro Max
- Bomba ár! HP ProBook 430 G3 - i5-6GEN I 8GB I 256SSD I HDMI I 13,3" HD I Cam I W10 I Garancia!
- Thinkpad T480s 24GB RAM 1TB SSD (erős, könnyű, vékony gép) Windows 11
Állásajánlatok
Cég: PC Trade Systems Kft.
Város: Szeged
Cég: CAMERA-PRO Hungary Kft
Város: Budapest