Keresés

Aktív témák

  • MoonFace

    csendes tag

    válasz Chrys_ #1 üzenetére

    Attól azért óva intenék bárkit is, hogy két architektúrálisan ilyen szinten különbözö proci közül az L2-cache mérete alapján válasszon.

    A cache hit-rate szempontjából ugyanis nem a nyers kapacitás, hanem az a lényeg, hogy mennyi hasznos adat van benne.

    Akkor egy kis elméleti fejtegetés:

    - A P4 esetén 8kB+12kOps L1 és 512kB L2-cache van inclusive módon, vagyis az eredö méret a nagyobbik -> 512kB.
    - A K7 esetén 128kB L1 és 256kB L2-cache van, de itt exclusive, tehát az eredö méret a kettö összege -> 384kB (már nem 2x a különbség).

    - A P4 esetén a L2 cacheline 128 bájtos (ez a legkisebb adatblokk, amit a cache-be be lehet tölteni), vagyis ha a procinak a memóriából szüksége van egyetlen bájtocskára, akkor betölti az azt befoglaló 128 bájtos blokkot, és reménykedhetünk, hogy a maradék 127-et nem fölöslegesen olvasta be.
    - A K7 esetén a cacheline 64 bájtos, tehát maximum 63 bájtot pazarol el.

    - A P4-es 512kB-os cache-sében 4096 cacheline fér el.
    - A K7 384kB-jában 6144 cacheline fér el.

    Az eredmény:
    A P4-es +/-33% cache-miss-szel rendelkezhet a K7-hez képest, ami azt jelenti, hogy az 512kB-os L2 lehet hogy kevesebb, mint a 256kB, de az biztos, hogy sehol nem dupla olyan jó.

    (A számításba nem vettük bele a K7 számára kedvezöbb asszociativitási-szintbeli különbségeket, az esetleges algoritmikus, és az általában a P4 javára írható sebességbeli paramétereket).

    Szóval azért nem olyan egyszerü az élet...

Aktív témák