Hirdetés

Új hozzászólás Aktív témák

  • sb

    veterán

    válasz HSM #613 üzenetére

    Először is:3/6 magnál 33%-al lehet gyorsabb csak a full CCX-es 4/8 mag/CCX. Tehát, ennél nagyobb hátránya elméletileg sem lehet a hatmagosnak.

    Ez igaz. De egy 33%-kal gyorsabban futó program 4 vs 6 magnál már önmagában elég gázul néz ki. Szerinted ha egálban lenne akkor nem fújjolna a közönség? ;)

    Ezzel szemben, ha a program jól skálázódik, akkor a +2 mag az +50% teljesítmény. Tehát, ha 10-20% el is bukik a CCX közötti kommunikáción, még mindig masszívan előnyben van.

    Ez is igaz, ha tökéletesen skálázódik. De ilyen csak 1-2 kivételes programban (a kb. tökéletesen párhuzamosítható feladatokban*) van és azon belül is 1-2 kivételes esetben. És akkor a következő pontban van a tévedésed alapja…

    Ezt az állítást ugyan mire alapozod?

    Ez alapvetés, hogy nem párhuzamosítható minden, feladatfüggő erősen. Nem nagyon van mit magyarázni rajta. De azt hittem ez világos számodra mivel a CCX lassulásnál is írtad, hogy a szálak egymásra(adat, eredmény) várhatnak és ilyenkor eleve lassul a párhuzamos futás. Csak nagyrészt független szálak tudnak jó skálázódást elérni.
    Egy játék (vagy bármilyen általános program) nagyrészt lineáris kódot kíván, attól mozgat több szálat, hogy bizonyos feladatonként párhuzamosíthatóak, amiknél nincs ilyen (nagyrészt lineáris) adatfüggőség. De ez fordítva van, nem a csík tolja a repülőt. Ha van ilyen alfeladat azt teszik külön szálra, annyit amennyi szétválasztható.

    Program szinten a render és ki-bekódolás azok amik jól párhuzamosíthatóak mert nincs ilyen adatfüggőség – de itt is a tyúk volt előbb – azért, mert olyan a feladat ill. a hozzá használt algoritmus. Minden másban ez nem igaz. Ha egy játékba beteszel mondjuk fizikát amin belül olyan algoritmus van ami párhuzamosítható akkor lehet (de akkor sem végetlen) skálázódással számolni. De ez csak egy részfeladat egy részfeladata. Ettől még fut más szál amivel interakció van, pl. a scene szállal a fizikai szál. Különben sok értelme nincs, hogy a háttérben fut a fizikai szimuláció jelenettől függetlenül. Szóval itt sem tudod a végtelenségig skálázni és gyorsítani a futást.

    Ha nem hiszed, még egyszer a számok, a fenti tesztet azóta kiegészítették egy i5-tel (ami ráadásul kisebb órajelen megy mint a 7700K) ami további támpontot ad.

    Tehát:
    1. G4560 vs 6950X 230%!
    2. FHD gaming átlag
    a. i5-7600 vs 7700K: +16%
    b. i5-7600 vs sokmagosok: +22%
    3. 720p gaming átlag, i5-7600 vs 7700K vs sokmagosok:
    a. i5-7600 vs 7700K: +18%
    b. i5-7600 vs sokmagosok: +30%.

    Tehát 4 fizikai magon maradva csak a HT-vel 16-18% jön össze.
    A 4 fizikai mag mellé hozzácsapva még 2-4-6db fizikai magot és 6-8-10db HT „szálat” pedig elértünk +22-30%-ot.
    A te fenti számításod szerint ugye van mondjuk 10%, nagyon jóindulattal max 15-20% körüli órajel deficit, fizikai magokból +50-250% és mondjuk HT-ból magonként +10-20%? (ráadásul több magra, tehát ez is jóval nagyobb növekmény ennél).

    És ezek a legújabb játékok, direkt egy skálázódási tesztre kihegyezve. Óriásit skálázódtak 4 fizikai mag felett.
    Pár hónappal visszalépve meg már jó kiindulópont az 1. pontban írt 2/4 vs 10/20 230%.

    Ja és akkor ennyit a 2 mag mire jó elméletről...
    Én sem adom 4 mag alá, de azért ekkora tévedésben nem élek. Valahogy helyén tudom kezelni, hogy 4 magig már azért gyorsulgatnak programok és ami fontosabb: van érdemi haszna is, amikor már a 2 mag kevés és nem csak a 100fps-ből lesz 180 4 maggal. De ettől még, hogy a 2 magos procik használhatatlanok lennének... főleg a fenti feltételrendszer miatt, mert egy annyira jól párhuzamosított programokkal teli világban élünk. Ez enyhén szólva is mosolyogtató. 4 normális fizikai mag felett meg ott a fenti táblázat. A számok nem hazudnak.

    [ Szerkesztve ]

Új hozzászólás Aktív témák