Hirdetés

Aktív témák

  • DcsabaS

    senior tag

    válasz Fiery #256 üzenetére

    ''milyen? x86 optimalizalt vagy mi a gyik?? ''
    Olyan, hogy pl. a P4-nel azonos orajelen hatekonyabb az integer resze, kisebb a latenciaja, kevesbe hatranyos szamara, ha surun keverednek az FPU es ALU utasitasok, mikozben sokkal gyorsabb az FPU-ja is (register renaming, out of order tripple issue FPU stb.). Ilyen es hasonlo okok miatt:
    Az Athlon gyors:
    - ha integer szamitasokat kell vegeznie
    - ha FPU szamitasokat kell vegeznie
    - ha surun keveredik is a ketto
    - ha olyan kodot kell futtatnia, amelyik nincs optimalizalva hosszu pipeline-okra

    ''(Az Intel P4 vonulatra ez nem jellemzo *** mi nem jellemzo rajuk??''
    Az Intel P4:
    - lassubb azonos orajelen integer szamitasokban
    - az FPU-ja katasztrofalisan lassu
    - ha az integer es az FPU muveletek surun keverednek, meg lassubb
    - akkor is lassu, ha a kod nincs optimalizalva a hosszu pipeline-okra
    - egyedul akkor gyors (viszonylag), ha SSE2-t kell vegrehajtania

    Ezert az olyan kodok, amelyek nincsenek SSE2-re optimalizalva, es ''esz nelkul'' keverednek bennuk az FPU es az integer muveletek, egeszen kiabranditoan futhatnak. (Akar egy nagysagrendnyi(!) lemaradas is osszejohet az Athlonhoz kepest.)


    ''meglehetosen egyenetlen teljesitmenyeket mutat fel *** ugyanigy a K7/K8 is, attol fuggoen, mit futtatsz rajta ***.)''
    Ez NEM igaz. A K7/K8 ugyan lassubb SSE/SSE2 kod futtatasanal, de akkor sem sokkal. A P4 ezt is ugy eri el, hogy magasabb frekin, nagyobb fogyasztassal megy. Azonos felvezeto technologian gyartott es azonos fogyasztasu Athlon es P4 eseten SSE-ben sincs kulonbseg, csak SSE2-ben.


    ''Ha olyasmire akarjuk hasznalni a CPU-t, ami valojaban nem igenyelne x86-ot *** x86-os procinal fura lenne, ha nem igenyelne x86-ot ***, ''
    Csakhogy itt nem az x86-os procikrol volt am szo, hanem az x86-os es a nem x86-os G5, avagy mas procik osszehasonlitasarol!
    Az allitasom pedig az volt, hogy bar a 3D-hez, vagy a szerver funkciokhoz abszolute nem kell x86-osnak lennie a procinak, a dual Opteron megis jobb, mint a G5, noha az is 64 bites, es az Opteron meg x86-os. Szoval az Opteron annak dacara gyorsabb, hogy x86-os!


    ''*** szerverek nem igenyelnek x86-ot?? ***, tortenetesen az x86-ttal egyutt is nagyon jo az Athlon(64). *** fura lenne, ha x86 nelkul is jo lenne ***''
    A szerverekhez nem kell x86. Sot, meg CISC sem. Egyebkent lasd az elobbi szakaszt!


    ''Marad tehat a dompingszeru multimedia *** mar ahol, ugye... meg marad a jatek, ami legalabb ilyen nagy huzoagazat ***, ott tenyleg nem eleg az x86 *** ''
    A jatek NEM marad meg, mert abban nem a G5 a gyorsabb. Csak a SIMD multimedia kodolasban. Amelynek viszont semmi koze ahhoz, hogy x86-os-e a proci, vagy sem.


    ''kezdem erteni, szted az x86-nak nem reszei az x86 kiegeszitesek, pl. SSE??? ''
    NEM. Az csupan egy kiegeszites. Az x86-os procikat is ki lehetne egesziteni mondjuk egy olyan SIMD vegrehajto egyseggel, mint a PowerPC 970-ben van, vagy akar meg jobbal. A lenyeg az, hogy az x86 kompatibilitas ezt nem akadalyozza meg, vagyis ha hatalmas SIMD teljesitmenyt akarunk is, attol meg nem kell lemondani az x86 kompatibilitasrol. Egyszeruen nincs miert.


    ''***, ugyanakkor nincs akadalya a megfelelo SIMD kiterjesztesnek *** miert lenne akadalya barmilyen kiterjeszetesnek? de attol me'g x86 marad, nem lesz RISC vagy mittomen ***''''
    Pontosan arrol van szo, hogy az x86 kompatibilitas mellet igenis meg lehet rendkivul hatekony SIMD-re kepesre csinalni a proci, sot, ha mar a RISC-et emlitetted, az a korabbi nota sem bizonyult igaznak, hogy le kell mondanunk a CISC procikrol, ha a RISC procik hatekonysagara vagyunk, ugyanis pl. az Athlon remekul otvozi a kettot. (Belul RISC, kifele CISC.)


    ''Ez a szoveg LOL!''
    Csak az biztos, hogy a Prohardveres fiukhoz hasonloan Te sem tudsz eleg figyelmesen OLVASNI.


    ''Lehet, hogy sakkban nagy vagy (bar az a P90-es benyogesed ezt is kisse megingatja),''
    Akkor olvass egy keveset. (Ez ugyan egy masik verseny, da nagyjabol abbol az idobol.)
    [L]http://www.cs.unimaas.nl/icga/news/events/pastevents/WCCC8/latest.html[/L]


    ''de hogy szakszeruen nem tudsz egy szintnel bonyolultabb CPU architekturalis problemat elmagyarazni, az is biztos...''
    Gondolom nem az a cel, hogy az ember ''magas szinten magyarazzon'', hanem hogy ertheto legyen. E teren nyilvan kudarcot vellottam, ha ennyire nem voltal kepes megerteni, amit irtam. De szerintem ehhez nagyban hozzajarul az is, hogy nem olvasol eleg figyelmesen.

Aktív témák