Keresés

Új hozzászólás Aktív témák

  • con_di_B

    tag

    válasz petXYZW #32 üzenetére

    A "Tree search" egy teljesen szintetikus teszt (értsd, nem az a lényeg, hogy mit old meg, hanem az, hogy mit terhel) ami kifejezetten arra készült, hogy extrém divergens kódvégrehajtást eredményezzen. Elméletben ez persze nem fair a masszívan SIMD hardverekkel szemben, de a gyakorlat azt mutatja, hogy ezek között is lényegi különbség van a divergencia kezelése terén, amit érdemes mérni.

    A "bemegyünk a gráfba és jól eltévedünk" jellegű problémáknál ezen kívül az is szempont, hogy ennél a fajta divergenciánál nem csupán a vezérlés nehéz, hanem a memória-elérés mintája is a lehető legrosszabb.

    Éppen ezért ebben a tesztben azok a hardverek tudnak jó eredményt elérni, amelyek 1) nem annyira érzékenyek a divergens vezérlésre 2) jól kezelik (gyorsítótárazzák) a legordasabb memória-eléréseket is.

    Ezeket a problémákat hagyományosan nem szeretik GPU-ra átültetni, de az OpenCL messze nem csak a GPU-król szól.

    Folyamatpárhuzamosságról ebben az esetben nincs szó.

Új hozzászólás Aktív témák