Hirdetés

Új hozzászólás Aktív témák

  • S_x96x_S

    őstag

    válasz HSM #5952 üzenetére

    >> "A korai Inteles AVX-512 implementációknál - annyira átmelegedett a chip;
    > Ennek nincs köze a csip "átmelegedéséhez"

    Elnézést, hogyha nem pontosan fogalmaztam volna;
    A throttling - nálam a melegedés szinonímája.
    Vagy legalábbis a kettő erősen összefügg;

    Lemire megfogalmazása remélem elég pontos:
    https://lemire.me/blog/2018/09/07/avx-512-when-and-how-to-use-these-new-instructions/
    "Intel’s new processors have AVX-512 instructions. These instructions are capable of operating on large 512-bit registers. They have the potential of speeding up some applications because they can “crunch” more data per instruction.

    However, some of these instructions use a lot of power and generate a lot of heat. To keep power usage within bounds, Intel reduces the frequency of the cores dynamically. This frequency reduction (throttling) happens in any case when the processor uses too much power or becomes too hot. However, there are also deterministic frequency reductions based specifically on which instructions you use and on how many cores are active (downclocking). Indeed, when any 512-bit instruction is used, there is a moderate reduction in speed, and if a core uses the heaviest of these instructions in a sustained way, the core may run much slower. Furthermore, the slowdown is usually worse when more cores use these new instructions. In the worst case, you might be running at half the advertised frequency and thus your whole application could run slower. On this basis, some engineers have recommended that we disable AVX-512 instructions default on our servers.
    ...
    "

    Lemire elég sokat publikál az AVX-512 optimalizációról.
    https://lemire.me/blog/?s=avx-512
    A régebbi hardvereken - 15%-20%-os teljesítmény csökkenést is kimért - legroszabb esetben. Az újaknál már csak 3%-körül.
    A Golden Cove esetében meg még jobb lehet a helyzet.

    Úgy általában - manapság tényleg kevés praktikus haszna van az AVX-512 -nek; De ha a ZEN4 -ben és a mobile procikban is általános lesz az AVX-512 ; akkor egyre több alkalmazás fogja kihasználni.
    -- AMX ..

    Mivel az új M1-ben is van ( nem dokumentált ) AMX processzor
    Elég nagy lesz a nyomás az X86 -alapú processzorok felé is.
    Vagyis X86 alapon azzal főzünk ami van; AVX-512 és AMX .. még
    ha nem is tökéletes ..

    # AMX: Apple Matrix coprocessor
    #
    # This is an undocumented arm64 ISA extension present on the Apple M1. These
    # instructions have been reversed from Accelerate (vImage, libBLAS, libBNNS,
    # libvDSP and libLAPACK all use them), and by experimenting with their
    # behaviour on the M1. Apple has not published a compiler, assembler, or
    # disassembler, but by callling into the public Accelerate framework
    # APIs you can get the performance benefits (fast multiplication of big
    # matrices). This is separate from the Apple Neural Engine.
    #
    # Warning: This is a work in progress, some of this is going to be incorrect.
    #
    # This may actually be very similar to Intel Advanced Matrix Extension (AMX),
    # making the name collision even more confusing, but it's not a bad place to
    # look for some idea of what's probably going on.
    https://gist.github.com/dougallj/7a75a3be1ec69ca550e7c36dc75e0d6f

    engem inkább fejlesztői oldalról érdekelnek az adatfeldolgozási trendek - és nem felhasználói oldalról. Szóval más lehet a nézőpontom.
    :R

    Mottó: "A verseny jó!"

Új hozzászólás Aktív témák