Keresés

Új hozzászólás Aktív témák

  • joysefke

    veterán

    válasz S_x96x_S #52 üzenetére

    32, 48 és 64 (128 !?) magnál extrém minimális az a visszafogás amitől te tartasz.

    Honnan veszed, hogy "extrém minimális" lesz sok mag mellett? Egyrészt még nincs kint, másrészt jelenleg a ZEN-nél sem minimális ez: mind deszktopon mind szerveren vannak olyan feladatok ahol lényegesen gyengébben muzsikál a ZEN+ mint a konkurencia ezek pedig jelenleg a CCX<-IF->CCX kommunikációra vezethetőek vissza.

    Deszktopon ez úgy tűnik semennyire nem fog változni, ugyanúgy megmarad a <4-mag> <=IF=> <4-mag> rendszer mint potenciálisan szűk keresztmetszet kicsit javított késleltetésekkel. Játékokban ez továbbra is vissza fog ütni.

  • joysefke

    veterán

    válasz S_x96x_S #39 üzenetére

    Nekem nem a CCX- koncepcióval magával van gondom, nem is azzal, hogy a skálázódást kisebb egységek összedrótozásával illetve külön IO-chippel oldják meg, hanem azzal, hogy ezek _mellett_ a 4mag/CCX dologhoz nem nyúltak és nem bővítették. (6 vagy 8 mag per CCX)

    Az, hogy ez jelenleg a ZEN/ZEN+ esetén bizonyos alkalmazásokban visszafogja a teljesítményt az nem kérdés. A ZEN2 IF-je ezen biztosan javítani fog, majd meglátjuk mennyit, illetve az is, hogy ezek után mekkora lesz a ZEN2- erősen IO-/mem- intenzív threadekben mutatott produkciójának az elmaradása attól amit a magok nyers ereje és órajele alapján várnánk. Remélem ez százalékban kifejezve lényegesen kisebb teljesítményveszteséget fog jelenteni a kérdéses applikációkban, mint most a ZEN+ esetén.

    De szerintem ezt a témát az AMD mérnökei eléggé kielemezték. és nem véletlen, hogy ezt az arhitektúrát alakították ki. Nem hiszem, hogy azért választották ezt az architektúrát, hogy lassabb legyen a ZEN2.

    Ez nem érv semmire. Az intel mérnökei és marketingesei is sokmindent kielemeztek mostanában ugyanúgy ahogyan mégelőtte az AMD emberei a Bulldózert...

  • joysefke

    veterán

    válasz S_x96x_S #37 üzenetére

    Szerver és HPC fronton a szűk keresztmetszet az Infinity Fabric volt.
    Valamint valószínüleg 8 magos ccx-et tervezni most nem fért bele az időbe.
    ...
    az Infinity Fabrik(v1) -nek a skálázhatóság volt a fő baja, a ccx-ek keresztbe-kasul kommunikáltak.
    Hiába cseréled led a 4 magos ccx-et -> 8magos ccx-re , a skálázhatósági probléma ugyanúgy fenmarad.

    Ezzel tisztában vagyok. És minél több mag van egy CCX-ben, annál kevesebb CCX kell ahhoz, hogy ugyanannyi magos CPU-t összehozz, legyen az 8-16-32-64, tökmind1, tehát kevesebb CCX<->IF kapcsolatod is lesz. Azzal, hogy most gyorsabbá teszik az IF-et, nyilván nagyot csökkentenek az IF által jelentett szűk keresztmetszeten, de az attól még ott lesz, mert egy közös L3 még mindig gyorsabb mint az IF.

    Manapság nem nehét olyan alkalmazásba belefutni, ami igényli az alacsony mag<->mag késleltetést és tud 4 fölötti maggal mit kezdeni.

    Nem azt mondom, hogy monolitikusan kéne 64 magot legyártani, de szerintem 7nm-en úgy hogy még az IO sincsen benne a chipletben illett volna legalább azt a nyolc magot közös alacsony késleltetésű L3-mal megcsinálni.

    egy 4 magos CCX-nek megvan az az előnye, hogy
    - ZEN2-es(7nm) Athlon procikat (max 4 mag )
    - olcsó notebook APU-kat
    - olcsó konzol chipeket ( semi custom )
    lehet belőle összelegózni.

    Ez nagyon szép, de ezekből nincsen pénz:
    -(1) ZEN-alapú konzol majd egyszer valamikor lesz, oda ráadásul jó lehet a félig selejt is (ami csak alacsony órajelen megy). Konzol chipen nincs sok nyereség.
    -(2) ZEN2 Athlon még jó darabig biztosan nem lesz. A ZEN2 kapacitást szerintem nagyon sokáig teljes mértékben fel fogja szívni a szerver és a mainstream desktop teteje-közepe.
    -(3) notebook APU: utolsó dolog ami miatt az AMD fejének főnie kell. Jelenleg itt még nem rúg labdába az AMD.

    Ezzel szemben szerverben és főleg deszktopon most is van pénz és kell a minél versenyképesebb termék.

    Ha igazán jól (skálázhatóak ) az Infinity Fabrik(v2) -
    akkor oly mindegy , hogy 4core-os ccx -ből vagy 8core-os ccx-ből van összelegózva.

    Az L3$ így is-úgy is sokkal gyorsabb lesz, ez pedig pld játékokban meg fog látszani. Gondolom Web és adatbázis szervereken is...

  • joysefke

    veterán

    válasz S_x96x_S #33 üzenetére

    Nem azt mondtam, hogy ne legyen moduláris, hanem hogy ahol masszív szűk keresztmetszet van, ott iktassák ki a szűk keresztmetszetet.

    Az, hogy 4x mag / CCX az szerintem egy masszív szűk keresztmetszetet teremt ami érezhető mind asztali mind szerver fronton. Én azt vártam, hogy a 14+ =>7nm váltással sikerül 8CPU magot egyetlen, közös L3-mal összekötött egységgé fogni.

  • DanD88

    tag

    válasz S_x96x_S #33 üzenetére

    Hmm... Igen, már az eredeti Zen sem maradt el sokkal inteltől, és igazából ez a modularitás az ami igazi aduász az amd kezében, logikus hogy erre fekszenek rá.

  • paprobert

    őstag

    válasz S_x96x_S #23 üzenetére

    Szarkazmus volt, nagyon jól hangzik. ;)

    Ez egyébként azt is jelenti hogy az L3 cache-ek közötti adatátkérések száma, ha nem is feleződni fog, de jelentősen csökkenni fog, mert már több olyan adat fér el benne, amire szükség lesz.

    (#22) szintén /s ;)

Új hozzászólás Aktív témák

Hirdetés