Keresés

Új hozzászólás Aktív témák

  • lenox

    veterán

    válasz Rive #94 üzenetére

    De így itt csak annyi jön le, hogy én lemértem azt, amiről kérdeztem, te meg állítólag programozol ezt-azt.

    Sajna ebbol egy szot sem ertek. Sertodes helyett elmagyaraznad inkabb?

  • lenox

    veterán

    válasz Rive #92 üzenetére

    Figyi, az egyet nem ertes az nem szivozas. Folyamatosan azt nyomatod, hogy p4-en, meg 1 thread-del stb. nem tudod kihasznalni a max savszelesseget. En meg folyamatosan mondom neked, hogy egy 8 core-os gep nem arra van kitalalva, hogy 1 thread menjen rajta. Aruld mar el, hogy ha az adott progy a 8 core-bol mondjuk csak 2-3-t tud kihasznalni, akkor minek neki 8? Pont eleg neki a 4 vagy 2. Vagyis nem a megfelelo platformon fut. A 8 core-os gepre olyan proggy kell, ami ki is hasznalja. Ezeknel meg a regi chipsettel 1 giga/sec koruli savszelesseg jut, ami igencsak lehet keves. Es ha figyeled, meg sem emlitettem a latencyt, szal ne is keverjuk ide.

    Masik dolog a latency meres. Szerintem is vicc, amit irtal:

    Amit említetél, az már megvolt régóta a végzett mérésekkor is. Ezekkel együtt adódtak a késleltetés által okozott várakozásra amár említett értékek.

    Szal egyreszt mondtal egy szamot a memory latencyre, amire en emlitettem, hogy lehet szoftvert optimalizalni ugy, hogy probalja csokkenteni a latency hatasat, erre jo pl. a prefetch, mire te azt mondod, hogy ennek hatasa mar benne volt a meres eredmenyeben. Ha ez igaz lenne, akkor rosszul merted volna a memory latencyt, ugye... Persze a 92-es hozzaszolasodban mar erdekes modon tudod, hogy kulon meg lehet merni a latencyt meg a prefetch hatasat is.

    Felejts el.
    Nem gyerekes egy kicsit?

  • lenox

    veterán

    válasz Rive #85 üzenetére

    Szerintem meg sokan fejlesztenek ilyen spec porgramot, pl. en is. De jo, akkor sokakat nem erdekel a memoria savszelesseg, meg amugy is csak egy szaluk van. De azoknek nem is kell dual proc plane quad core-ral... Nekem spec kell, mag masoknak is, meg az intel is ezt gondolta, hogy kell, kar hogy nem kerdezett meg teged, tok sok penzt megsporolhattak volna, ugye?


    Intel® Smart Memory Access uj feature, nem tudom, megvolt-e. Kulonosen egy p4 vs athlon meresben (leven Bensley feature, szal Dempsey, Woodcrest vagy Clovertown kell hozza, nem p4). De kulonben nem is ertem. Ha egy teszt megmeri, hogy mekkora a memoria latency egy rendszerben, mondjuk 250 orejel ahogy irtad, akkor miert is azt meri, hogy mi van akkor, ha elotte 250 orajellel kiadom a prefetch utasitast? Mert ha azt merne, akkor ugye a cache latencyjet merne meg, es nem a memoriajet. Na mind1...

  • lenox

    veterán

    válasz Rive #66 üzenetére

    Semmi efféléről se beszéltem.

    Akkor ha jol ertem, nem is vitatkozunk. 1 procis rendszerben termeszetesen igazad van, de amirol en irtam, clovertown az eleve 2 procis, osszesen 8 core-os workstation-be valo proci. Amugy abbol is latszik, hogy te az egy procis rendszerben gondolkozol, hogy azt irod, hogy a p4 nyer a nagyobb savszelesseggel a mediafeldolgozas teren, a K8-cal szemben, mikor en meg eleve xeonokrol es opteronokrol beszeltem, ahol pontosan forditott a helyzet, pl. 4 procis kornyezetben az opteronok egyuttes memoriasavszelessege kb. 2-szerese a 4 procis xeonokenak. Szal az intel eppenhogy hatranyban van.

    Ez egy igen jó kérdés, komolyabb vizsgálódás nélkül erre nem tudok válaszolni. Érdemes lenne felmérni a szokásos tesztprogramok adott rendszereken mutatott tulajdonságait, de erre se időm, se kedvem. Se pénzem, ami azt illeti. Reméltem, hogy valaki talán többet tud a dologról, ezért írtam #53-at.
    En kulonben tudom, azert, mert igenis szamit a meoria savszelesseg, es tudtak, hogy ebben nagy hatranyban vannak, ezert lepni kellett. Most elvileg ok fognak kijonni hamarabb 2x4 core-os workstationnel, amivel lepeselonybe kerulnek, de ehhez muszaj volt nagyobb savszelesseget biztositani, mert kulonben nem skalazodna megfeleloen a teljesitmeny. Megjegyzem a Bensley egy uj feature-e az Intel® Smart Memory Access, ami a latency elfedesere szolgal, illetve masik mar regota letezo sse feature a prefetch, amivel elore be lehet hozni a memoriabol a cache-be adatot, szal a latencyt azert lehet a hardver illetve a szoftver oldalarol is kezelni.

  • lenox

    veterán

    válasz Rive #61 üzenetére

    Eleve vitatkoznek azzal, hogy mi az atlagos progi. De mondjuk, hogy van olyan, de az atlagos proggi eleve egy magon fut, rendelkezesere all az egesz savszelesseg, persze, hogy nem lesz memory bandwidth limites. Aztan ha 4 core-on fut ugyanaz, akkor elnegyedelodik a savszelesseg, rogton erzekenyebb lesz a rendszer a memory bandwidthre.
    Hadd kerdezzek valamit. Ha mindez igy van ahogy mondod, akkor az intel az uj bensley platformhoz miert fejlesztett uj memoriavezerlot, ami 3-szorosara emeli a memoria bandwidth-t, de noveli a latencyt?
    Na mind1, szerintem azert, mert a mezei user 1 procis rendszereben az 1 threaden futo programjanak nem nagyon szamit mar a memory bandwidth, mert mar eleve tul nagy, ezert meg nem kene azt a kovetkeztetest levonni, hogy serverekben, workstation-okben sem szamit.

  • orbano

    félisten

    válasz Rive #61 üzenetére

    gondolom azért 4 procinál, vagy majd nyolcnál elő fog jönni megint a sávszélesség limit, ha a memóriák ilyen lassú ütemben gyorsulnak. ráadásul ha azt is belevesszük, hogy a nagyobb sávszél a késleltetés rovására megy...

  • lenox

    veterán

    válasz Rive #53 üzenetére

    Biztos, hogy egyrol beszelunk? Szal az inteles architecturaban a procik osztoznak a savszelessegen, az AMD-snel mindenkinek dedikalt memoriaja van. Logikusan az intelnel fontosabb a savszelesseg.

Új hozzászólás Aktív témák

Hirdetés