Hirdetés
- Poco F6 5G - Turbó Rudi
- Android alkalmazások - szoftver kibeszélő topik
- Samsung Galaxy S23 Ultra - non plus ultra
- Samsung Galaxy S24 Ultra - ha működik, ne változtass!
- Yettel topik
- Bemutatkozott a Poco X7 és X7 Pro
- Samsung Galaxy A52s 5G - jó S-tehetség
- Android 16-ra nyitott az egyik legmenőbb csukható
- Samsung Galaxy S25 Ultra - titán keret, acélos teljesítmény
- Samsung Galaxy Z Fold7 - ezt vártuk, de…
Új hozzászólás Aktív témák
-
Petykemano
veterán
Érdemes megnézni ezt a 20perces tesztet, ami nagyvonalakban a N6-on készült 6800U és az N4-en készült M2 összehasonlítására fókuszál.
Megalázó vereség helyett egy erős verseny látható. Az M2 előnye a fogyasztás és akkuidő vonatkozásában nagyvonalakban magyarázza a gyártástechnológiai előny.
[link] -
Petykemano
veterán
Ezek, hogy az x86 haldoklik és hogy van élet az x86 halálát követően - elég sarkos kijelentések.
Az x86 részleges monopóliumának lehet, hogy vége, de szerintem az, hogy kinyíltak lehetőségek még nem jelenti az x86 halálát.
Az Apple az egyetlen cég, amely az x86 ISAval dolgozó AMD és Intel kínálatával versenyképes (bizonyos szempontból jobb) processzort tudott tervezni ARM alapon. A gyári arm processzorok IPC tekintetében versenyképesek és ezért a szerverek terén láthatólag tudnak érvényesülni, de a desktop/notebook piacon még hiányzik a teljesítmény. (Amit.az apple IPC-vel, az x86tal dolgozó cégek pedig frekvenciávak hoznak)Természetesen a lehetőségek jók. Az Arm alapon tervező cégek nyilván megpróbálnak majd benyomulni azokra a piacokra, ahol jelenkeg X86 van. Desktop, szerver, konzol. De számos kézikonzol valósul meg manapság x86 alapon.
Csábító, hogy arm alapon saját magadnak is tervezhetsz, de olyan területen, ahol korábban x86 volt, komolyan ezzel eddig csak az Apple és az Amazon élt.
Ezzel együtt azt.el kell ismerni, hogy fordított irány.ritkább, az x86 nem nyomul azokra a területekre, ahol az arm dominál. Ennélfogva csak veszíthet.
Viszont amíg nem válik.általánossá.az Apple által arm alapon produkált előny, ami egyértelművé tenné az ARM ISA felsőbbrendűségét, addig én inkább egy hosszabban elhúzódó haláltusát.várnék,.semmint gyors fűbeharapást.
Persze tévedhetek.
-
HSM
félisten
Azonos órajelen lenne csak ezt értelme nézni. Illetve azonos csip-revíziókkal. Illetve az sem mindegy, hogy mennyi az eközben elvégzett munka. A kisebb L2-es modell azért is lehet elméletben hűvösebb, látszólag "takarékosabb", mert többet kell várnia adatra a memóriából, hiszen kevesebb esetben tud segíteni az L2.
-
S_x96x_S
addikt
> "...1 Golden Cove helyigénye a becslések szerint
> körülbelül 2 Milan(teljes Zen3) magnak felel meg.- A "Golden Cove" eléggé új architektúra;
És ebben is benne van "Jim Keller"-nek a keze nyoma. ( mint a ZEN -nél )- Az AVX-512 és az új AMX kiterjesztés elég sok helyet elfoglal;
és ezek mind hiányoznak a ZEN3-ból.
(talán a kettő együtt - akár 1/3 is lehet helyfoglalásban a teljes magnak)
És csak duplázzuk meg a vektor pipe-linekokat és .. és még több tranzisztort kell beálldozni. ...AVX512/AMX: Az AMD szerencséje, hogy a Desktop- AlderLake-en a Big-Little miatt ezt nagyrészt nem lehet elérni, de szerver szinten elég ütős tud lenni, hogyha a program ki tudja használni.
Az én értelmezésemben az AVX-512 közelit a GPU-k sűrűségéhez;
és nem könnyű hatékony és gyors magokat tervezni erre.
Mert látott már valaki hatékony - 4.5 Ghz-en működő GPU-t ?
- Az nVidia A100 -nak pl. a Boost Clock-ja ~1.41GHz !
- Az RTX 3090 -nek meg 1.70 Ghz ..
A korai Inteles AVX-512 implementációknál - annyira átmelegedett a chip; hogy az AVX-512 -es utasításoknál vissza kellett szabályozni magát .. csak, az volt a probléma, hogy a teljes rendszert lefolytotta."So how does this affect you, if you mix a little AVX-512 with your real workload? We use the Xeon Silver 4116 CPUs, with a base frequency 2.1GHz, in a dual socket configuration. From a figure I found on wikichip it seems that running AVX-512 even just on one core on this CPU will reduce the base frequency to 1.8GHz. Running AVX-512 on all cores will reduce it to just 1.4GHz."
https://blog.cloudflare.com/on-the-dangers-of-intels-frequency-scaling/------------
Szóval az AMD-nek egy jól implementált
AVX-512 -öt kell kihoznia a ZEN4-ből - elsőre!A TSNC N5 - azért segíthet a megnövekedett tranzisztorigény kielégitésében.
-
HSM
félisten
Volt egy jó írás még a Renoir-ról, van benne magméret összehasonlítás a teljes L3-as verzióval: [link]
Illetve szerintem érdekes, hogy egy ilyen Renoir 15W-os verzióban gyorsabb Cinebench-ben (2935 pont, forrás: [link] ), mint az új 12900K takarékos magjai (2572 pont, [link] forrás: [link] ).
Illetve az is rendkívül érdekes lenne, illetve szerintem akár alternatív opció lehet AMD oldalon, hogy különbözőképpen paraméterezni firmware-ből a magjaikat. Pl. egy "szoftveres" takarékos mód, ahol néhány magot megjelölnek "takarékos" magnak, és az OS ide rakhatja a kis igényű dolgokat, és ezek a magok ilyenkor nem turbóznának, hanem egy hatékonyságra optimalizált órajelen működnének, mint a mobil csipek esetén is.
Egyébként a jelenlegi magjaikon is lehet ilyesmit "buta" módon, én pl. előfordult, hogy kikapcsoltam a turbót a Ryzen 3600-asomon, mert kb. elfelezte a fogyasztást és bőven elég nagyon sok mindenre 3,6Ghz-en is, lásd mérésem [link] .
Ha a hybrid magdizájn rákényszeríti a szoftvereket, hogy külön kezeljék az erős/hatékony magokat, így külön magdizájn (és ezzel járó hátrányok) nélkül is tudnának ebből profitálni.Az meg már csak hab lenne a tortán, ha pl. lenne egy magasabb és alacsonyabb cache méretű verziója a csipleteknek, amiket lehetne kombinálni. Pl. elvileg lesz egy speciális Zen4 verzió [link] , elég komoly számok a dupla sűrűség és energiahatékonyság, több, mint 1.25X-ös sebesség mellett, bár nyilván itt azért érdemes megvárni azért a tényleges eredményeket.
-
S_x96x_S
addikt
> Lehet nem ártana, ha maga a proci képes lenne programozási nyelvet futtatni.
de Melyik programozási nyelvet? És mi lesz a többivel?
amúgy az már nem X86 lenne
Jelenleg a legtöbb programozási nyelvet - le lehet fordítani gépi kódra ..
amit a hardver tovább fordít mikrokódra> Hiszen az assembly használata úgyis hanyagolva van,
> csupán a fordításra korlátozódik.Miért lenne hanyagolva?
szinte mindennek az az alapja ..A C / C++ is ugyanolyan forráskód - mint az assembler ..
nagyrészt fordításra van használva ... csak magasabb absztrakciós szint ... -
HSM
félisten
"tehát mindenképpen plusz (emberi) munkaráfordítás kell."
Nem vagyok különösebben jártas a fordítók lelkivilágában, de nem úgy van, hogy ha lehetőséget biztosítasz bizonyos utasítások használatára, akkor azokat akár automatikusan is képes bizonyos szituációkban felhasználni? Nyilván, az ideális eredményhez kell emberi ráfordítás is (optimalizáció), de tudtommal nem minden esetben elengedhetetlen.#4569 S_x96x_S : Valami kavarás dereng régebbről, AVX1-2, FMA3-4, ez sem ment egyszerűen...
[link] -
Petykemano
veterán
A big.LITTLE, vagy hibrid multithreading szerintem nem elsősorban a magszám növelhetőségét célozza.
Szerintem arról van szó, hogy
1) vannak olyan szoftverek, amik 1 szálon, vagy legalábbis kevés szálon tudnak tudnak csak működni. Viszonylag kevés az olyan szoftver, ami sok magra egyenletesen skálázódik. A játékok egy olyan köztes terület, ahol ügyködnek a több magra való skálázódáson, de mindmáig meghatározó az, hogy a 1-2-3 szálon mennyire erős egy processzor.
2) az IPC növelése jelentős fogyasztás és területigénnyel rendelkezik. (valószínűleg a frekvencia növelése is)És a lényeg: ahhoz, hogy azoknál a programoknál teljesítménynövekedést érjenek el, amik rosszul skálázódnak, az IPC-t kell növelni. De azoknál a programoknál, amik jól skálázódnak a magok számával, nem feltétlenül szükséges az összes szál kezeléséhez magas IPC-jű mag. Azokhoz a programokhoz, amelyek jól skálázódnak, előnyösebb lehet 1 magas IPC-jű mag helyett 2-3 olyan, aminek az IPC-je 30%-kal alacsonyabb, de negyedakkora helyet foglal és negyedannyit fogyaszt.
Tehát a kényszer nem a magszám növelésének irányából jön, hanem az IPC növelés tranzisztor és energia költségeiből, amit azokban az esetekben, amikor több magot ki tud használni egy applikáció, hatékonyságra optimalizált magokkal kompenzálnak.
Nekem úgy tűnik, hogy az intel ezt az utat választotta. Nem állítom, hogy ez a helyes.
-
joysefke
veterán
Konkért példa, x265 kódolás, 4 mag avx2-vel vagy 6 mag avx/2 nélkül
Ez Sse4.2 vs Avx2? Mert ebben az esetben az Avx2 alternatívája (Sse4.2) is vektorkód. Az 50%-os gyorsulás pedig kb hihető az Avx regiszretek szélességéből (+100%) adódóan.
Ha az Avx2 "alternatívája" a sima skalár kód, akkor nem, nem tudod /aligha tudod több maggal a vektorkódot helyettesíteni. Nem branchelő/branchelést kiküszöbölő kódnál akkora gyorsulást tud hozni az Avx2, hogy egy Avx-es szál lenyomhat nyolc skalárt.
A kérdés nekem az, hogy az Avx512 ad-e annyi plusszt az Avx2-höz képest, hogy az alkalmazásfejlesztőnek megérje a vesződséget.
Új hozzászólás Aktív témák
- NVIDIA GeForce RTX 5080 / 5090 (GB203 / 202)
- LEGO klub
- Hardcore café
- Poco F6 5G - Turbó Rudi
- OLED monitor topic
- OLED TV topic
- Fejhallgató erősítő és DAC topik
- Eleinte nem kíméli majd a pénztárcákat a Panther Lake
- Android alkalmazások - szoftver kibeszélő topik
- The Crew sorozat
- További aktív témák...
- Nintendo Switch 2
- piaggio vespa et4 ( papírok nékül )
- ASUS TUF A15 FA507 - 15.6"FHD 144Hz - Ryzen 7 7435HS - 16GB - 1TB - Win - RTX 4050 - 2+ év garancia
- iKing - Samsung Galaxy A56 5G 5G sebesség, nagy kijelző, stabil üzemidő 8/256 GB
- Asus TUF A15 FA507NUR 15.6" FHD IPS Ryzen 7 7435HS RTX 4050 16GB 512GB NVMe magyar vbill gar
- ÁRGARANCIA!Épített KomPhone i5 10400F 16/32/64GB RAM RTX 3060 12GB GAMER PC termékbeszámítással
- Gamer PC-Számítógép! Csere-Beszámítás! I7 12700E / RTX 3060Ti / 32GB DDR4 / 512GB Nvme SSD
- Sound Blaster AE-7 (B-Stock)
- Apple Watch Ultra, Újszerű,Dobozával, 12 hónap garanciával
- Kezdő Gamer PC-Számítógép! Csere-Beszámítás! I5 7500 / GTX 1050Ti / 16GB DDR4 / 128SSD+1TB HDD
Állásajánlatok
Cég: Laptopműhely Bt.
Város: Budapest
Cég: NetGo.hu Kft.
Város: Gödöllő


