Hirdetés

Új hozzászólás Aktív témák

  • Male

    nagyúr

    válasz DudeHUN #103 üzenetére

    Pl két proci támogat egy AVX utasítást, de az egyik mondjuk 10 órajel alatt végez vele, a másiknak elég hozzá 6. Ugyan ezt az eredményt meg lehet kapni másik utasításokkal is, csak többel... ez legyen valami totál általános, és mindkettőnek 8 órajelre van szüksége, hogy ez végigfusson. Ha az elsőre optimalizálsz, akkor nem használod erre a műveletre az AVX-et, mert lassabb, ha az utóbbira, akkor meg igen, mert gyorsabb.
    ...de a többszálúsításnál is hozhatsz meg ilyen döntéseket, mert mondjuk az egyik dizájn esetén nem sokat számít, ha sokszor van adatmozgás a magok között (pl monolitikus chip, közös az L2 cache, így villámgyors ez a dolog), a másik meg chiplet dizájn, és ott azért számít, hogy melyik magok között kel mozgatni az adatot, nincs közös L2....
    ...vagy mondjuk az eltérő cache méretek... az egyik kriptóbányász kód ami befért az AMD esetén az L3 cachebe, Intel esetén meg nem... Abu ezt emlegette is akkoriban, hogy mekkora előny.... ez is optimalizációs kérdés (meg persze lehetőség is, hogy bele fér-e valamelyikbe).

Új hozzászólás Aktív témák