Keresés

Hirdetés

Új hozzászólás Aktív témák

  • dezz

    nagyúr

    válasz #95904256 #1308 üzenetére

    ''A mostani x86-os processzorok több száz különböző utasítást ismernek, ezek közül egy pár utasítás végrehajtási ideje ( késleltetése ) valóban csökkent. A baj az hogy leginkább nem azoké amelyek a leggyakrabban fordulnak elő, ugyanis azokat már eddig is elég jól megcsinálták.''
    Kifelejted a 2 lépéses 64 bites -> 1 lépéses 128 bites végrehajtás általi gyorsulást, ami elég sok utasítást érint. Persze csak vektorkódnál, de ma már sok programot így írnak.

    ''Például nagyon gyakori hogy két számot össze kell adnia a processzornak, azonban a fent említett regiszter-cserélés nagyon ritka a mostani programokban. Bár ez utóbbit is lehetne gyakrabban használni, de ahhoz még okosabb fordító programokra lenne szükség.''
    Ha jól tudom, a regiszter-rename által erre ma már nincs akkora szükség.

    ''Igazából a legfájóbb pont hogy a K10-es továbbra is csak 4 órajel alatt fog tudni összeadni két lebegőpontos számot, míg a Core2-eseknek 3 órajel kell. Ezt csak kis részben kompenzálja hogy a dupla-pontos szorzásban viszont épp fordított ( 4:5 ) az arány.''
    Mint direkt ADD utasítás igen, de ha ''embedded'' a dolog, mint pl. FCMP, FMAX, FMIN, stb., akkor sokszor megvan 2 órajel alatt. Meg ugye nem csak ez számít, hanem a throughput is.

Új hozzászólás Aktív témák