Hirdetés

Új hozzászólás Aktív témák

  • Abu85

    HÁZIGAZDA

    válasz Klikodesh #323 üzenetére

    Erre nem tudok reagálni, mert nem én teszteltem, Oli pedig majd csak Tajvanban lesz legközelebb gépközelben.

    (#327) fordfairlane: Már ebben a generációban kellett volna alternatíva. Amikor konkrétan a teljes felépítést kell megduplázni, az azt jelenti, hogy elérte az architektúra a határait. Nyilván nem csak nekem tűnik fel, hogy az 1,2 milliárd tranyóból nem tudják hozni az AMD előző generációs architektúrájának a teljesítményét, ami ráadásul fele annyi tranyóból áll. Az eDRAM az egyetlen dolog, ami előnybe rakja az Intelt (kivéve MSAA-val, mert az nagyon gyenge hatásfokkal működik még mindig, pedig csak a Z mintavételezőket kellene négyszerezni), anélkül nem elég jó a hardverkonfiguráció, szóval az IGP-t tervező csapat rendkívül vérszegény munkát végez. Ha ennek a teljesítményét a következő körben 50%-kal növelik, akkor az 1,8 milliárd tranzisztor, hozzávéve a setup motornál szükséges modernizálást gyakorlatilag 2 milliárd tranyót kell költeni az IGP-re. Csak összehasonlításképpen ennyi tranyóból építette az AMD a Bonaire-t (HD 7790), vagy az NV GF114-et (GTX 560 Ti) annó. A GT3 IGP+50%-ot mindkét cég kihozná 700-800 millió tranzisztorból. Minden esetben feltételezve az azonos memsávszélt az IGP-knek.
    Ami az érdekes, hogy mi lesz helyette. A Gen7.5 működik, de nem skálázható jól. A Larrabee jobban skálázható, viszont nem működik. A harmadik opció a ZiiLabs, amit éppen felvásárolt az Intel, de ezt meg nem grafikai számításokra tervezte a Creative. Nincs is az architektúrában textúrázó, hanem emulálja azt, sőt, mindent emulál.
    Feltételezve azt, hogy a Gen7.5-ön kívül nincs semmi az Intelnél az aktuális architektúrát kellene gatyába rázni. Én helyből kezdeném a shader tömbökkel. Az EU-kban a két 128 bites vektormotorból az egyiket el kell dobni. Felesleges az a 4+4 co-issue. Nem véletlen nem épít senki ilyen rendszert. A tömbökben 256 kB-os URB van. Elég 64 kB is. A programokat eleve 32 kB-os LDS-re optimalizálják, így nyolcszoros méretű tárat annyira értelmetlen fenntartani, a kétszeres még elmegy, annak még van értelme. Mivel kevesebb az ALU, így egy textúrázót el kellene dobni a tömbökből. A render blokkokból az L3-at ki kell vágni és egy LLC után helyezett közös tárra lenne szükség. Abból is elég 128 kB, így nem kellene minden render blokkal 256 kB-os büntit elviselni a tranyóhasználatnál. Ezek lennének az alapvető változások, amelyeket én logikusnak látnék. Rengeteg tárat ki lehetne dobálni a hardverből, és alapvetően a teljesítményt ez nem befolyásolná.

    [ Szerkesztve ]

    Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

Új hozzászólás Aktív témák