- Fotók, videók mobillal
- Samsung Galaxy S25 - végre van kicsi!
- iPhone topik
- 200 megapixeles zoomkamerát sem kap az S26 Ultra?
- Android alkalmazások - szoftver kibeszélő topik
- Xiaomi 13T és 13T Pro - nincs tétlenkedés
- Telekom mobilszolgáltatások
- Milyen okostelefont vegyek?
- Samsung Galaxy S24 - nos, Exynos
- Xiaomi 14T Pro - teljes a család?
Új hozzászólás Aktív témák
-
Fiery
veterán
Kicsit tulzas a par ezer mag. A legdurvabb Xeon Phi SKU-ban is csupan 61 db MIC mag van, max. 1.33 GHz-es orajelen, a Xeon Phi kartya igy 300W TDP-t ad ki. Ha ezt leosztjuk 100W-ra (Intel mainstream desktop/mobil CPU-nal a TDP ennel tobb nem nagyon lesz mar), es atrakjuk fejben 14 nanora, akkor sem igen kepzelheto el 20-25 MIC magnal tobb (kezdetben), hacsak nem nyomjak le az orajelet 1 GHz alá. Mas kerdes, hogy ennyi mag mire lesz eleg. 800-1000 GFLOPS kellene minimum, hogy kompetitiv legyen a cucc a Carrizo GCN iGPU-ja elleneben.
-
Fiery
veterán
A GT3/GT3e pepitaban: ha nem tudsz rendes, hatekony termeket gyartani, akkor pakolj be egy halom magot alacsony orajelen, amit le tudsz gyartani, mert processzben elonyod van; es valahol feluton elvagy a cuccal vegul. Ertsd: nem lesz olyan gyors, mint amire elvben szamitani lehetne, de eleg jo mar a megcelzott piacnak.
-
Fiery
veterán
válasz
#65675776 #63 üzenetére
Hogyne, egy "APU" annyit fogyaszt, mint egy Tahiti dGPU, hat persze
100 W-nal tobb nem lehet a teljes CPU package, de inkabb 80 W kornyekere varhato, az Intel-fele trendeket figyelembe veve. Az a baj, hogy azt feltetelezed, hogy szuksegszeruen kalyhanak kell lennie egy iGPU-nak, ha tul sok mag van benne. Nem, nem feltetlenul. Egy megfeleloen modern processzen, egy megfeleloen alacsony orajelen egy boszme nagy iGPU is tud baromi keveset fogyasztani, lasd pl. Haswell-ULT GT3. Tudom, annak a teljesitmenye nem oriasi, de a teljesitmeny/fogyasztas mutatoja nem rossz. Az Intel prociknal a fogyasztas akkor szalad el, amikor nagyon felnyomjak az orajelet (2.5+ GHz), ezert sem mennek az iGPU-k tul magas orajelen. A MIC-nel is meg lehet -- velhetoen -- ugyanezt oldani, plusz ott mar 14 nanon fog ketyegni az iGPU is. Majd meglatjuk.
-
Fiery
veterán
-
Fiery
veterán
"csak a kritikus részekben vannak ASM utasítások"
Ez teljesen normalis. Mint ahogy az OpenCL-t hasznosito szoftverekben is csak a kritikus reszeken van OpenCL kod.
"Azért nincs ASM AMD kártyákra, mert minden 3. évben kijön egy gyökeresen új ISA, és dobhatnád ki az egész kódodat a francba"
Ettol me'g lehetne. Mindenki dontse el, hogy ilyen feltetelek mellett is megeri-e neki a fejlesztes assemblyben. Egyebkent a "minden 3. évben" es a "gyökeresen" egyutt eleg nagy tulzas. A VLIW5 architektura a Radeon HD 2900 XT-vel jelent meg 2007-ben. Azt facelifteltek, ugy szuletett a VLIW4 -- ami nem gyokeresen eltero architektura -- a Radeon HD 6970-nel 2010-ben. Az igazi uj generacio a GCN, ami 2012-ben jelent meg, tehat mondjuk 5 evente van gyokeresen uj architektura. A GCN2 (vagy mas neven GCN 1.1) sem gyokeresen uj architektura, csak faceliftelt, es velhetoen az is ki fog tartani cca. 2017-ig, kisebb-nagyobb patchelgetesekkel. Az nVIDIA-nal ugyanez a helyzet, a G80 (2006) ota, azzal egyutt is eddig 3 generacio volt, a Tesla, a Fermi meg a Kepler, de ez utobbi 2 vita targya lehetne, hogy mennyire gyokeresen ternek el.
-
Fiery
veterán
"A MIC magok nem kompatibilisek a mai fő magokkal. Hiába az x86 akkor sincs bináris kompatibilitás a normál és a MIC magok között. Ennek az az oka, hogy az x86 memóriamodelljét módosítani kellett hogy a rendszer skálázódjon."
Igen, ezt tudom, de akkor hogyan fog a Knights Landing bebootolni egy oprendszert? Ha pedig az be fog tudni, akkor a Skylake MIC magjai is kepesek lehetnek ra -- elvileg. Es onnantol vagy az a szitu, hogy a MIC magokat "okositjak" fel mondjuk egy Quark szintjere, vagy az oprendszer kernelet modositjak, hogy a MIC magokat is be tudja sorolni a normal x86 magok koze vagy mellé. Ez utobbi erdekelne engem, azaz hogyan lehet megoldani azt, hogy a MIC magokat is lehessen barmilyen celra hasznositani Windows alatt, direkt threadinggel, direkt x86 (akár assembly) programozassal.
-
Fiery
veterán
Koszonom az elismero szavakat
"Ha direkten szálakat futtatok, akkor nincs szinkronizáció? Annak nincs overheadje, akár kézzel történik (-> extra meló), akár az oprendszer csinálja (túl általános célú -> gyenge perf)? Nem véletlenül van context meg command queue - pontosan erre."
Miert kellene az oprendszer szalkezelesenek lassunak lennie? A Knights Landing be tud majd bootolni egy oprendszert, tehat valamilyen szinten az oprendszer fogja kezelni es utemezni a MIC magokat. Ha a Knights Landingnel ezt megoldjak, akkor miert ne oldhatnak meg a Skylake-nel vagy a Goldmont-nal is?
Az assembly hogyan mukodik x86-on? Yasm peldaul? No rocket science. GCN-re, Keplerre, az Intel GenAkarmennyijeire nincs assembly, pontosabban nem nyilt a rendszer. MIC-re -- ha az Intel egy kicsit is okosan csinalja -- lesz x86 assembler, jo esellyel a Yasm is tud majd forditani ra.
"Ilyen alacsony szinten ma már senki nem dolgozik komolyan"
Mi ennel alacsonyabb szinten is dolgozunk komolyan. Pl. kodgenerator, direkt gepi kodu programozas, stb. De persze tudom, hogy a fejlesztok 99%-a nem mereszkedik idaig, tudom hogy kisebbsegben vagyunk. Az extrem optimalizaciohoz azonban a legjobb megoldas mindig az, ha nem kell OpenCL, D3D, OpenGL es hasonlo overheadekkel vacakolni. A Mantle sem veletlenul szuletett, ott is az overheadet probaljak lekuzdeni.
-
Fiery
veterán
A programozo oldalarol me'g egyszerubb lenne, ha nem kene contextekkel, device-okkal, command queue-kkal es hasonlokkal vacakolni, hanem direktben lehetne programozni a GPU-t. Nem mondom, hogy AVX-512 assemblyvel feltetlenul, de egy egyszeru libraryval meg lehetne oldani az egeszet, nem kene az OpenCL overheadje oda. Aki meg feketeoves, az programozhatja direktben a MIC-et.
Szamomra 2 alapveto kerdes maradt a MIC kapcsan, talan Te tudod a valaszt ezekre:
1) Hanyszoros multithreadinget kapnak a Skylake MIC magok?
2) Vajon az operacios rendszer (foleg Windows) szamara elerhetoek, lathatoak lesznek-e kozvetlenul a MIC magok? Vajon a kernel tud-e utemezni szalakat a MIC magokra? Az alapjan, hogy a Knights Landing-en elvileg fel fog tudni bootolni egy oprendszer, siman elkepzelhetonek tartom, hogy a Skylake magjai is teljes(ebb) x86 magok lesznek, mint a Knights Corner eseteben. Mas kerdes, hogy az oprendszer utemezojet adott esetben modositani lenne celszeru, hogy ne pakoljon oda csipcsup szalakat, hanem csak bizonyos feladatokat utemezzen a MIC magokra. Sci-fi ez az egesz, vagy van benne racio?
-
Fiery
veterán
En nem mondtam, hogy egyszeruen fog menni az Intelnek a 7 es 10 nano, csak hogy dolgoznak rajta. Hol volt abban optimizmus, amit irtam? A 14 nano pedig kesz kell hogy legyen, maskepp nem lesz belole Broadwell az igert (kicsit arrebb csusztatott) idopontra. Mas kerdes, ha kicsit me'g faragni kell a Broadwellen, hogy jobb legyen a kihozatal, de maga a processz kesz.
-
Fiery
veterán
"A gyártástechnológiai előnyük lassan el fog olvadni, hiszen 10nm alá nem lehet menni."
Ezt honnan veszed? Az Intel mar most is fejleszti a 10 es 7 nm-es processzeit, leven hogy a 14 nm-rel mar kesz vannak.
Megjegyzem, ez a MIC-es megoldas a computing vonalon is erdekes tavlatokat nyit. Pl. nem kell OpenCL-lel vacakolni, hanem direktben lehet AVX-512-vel programozni, kihasznalva _egyszerre_ a hagyomanyos x86 CPU magok es a MIC magok teljesitmenyet, aggregaltan.
Új hozzászólás Aktív témák
Hirdetés
- ÖRÖK GARANCIÁVAL - OLCSÓ, LEGÁLIS SZOFTVEREK 0-24 KÉZBESÍTÉSSEL - Windows - Office - LicencAruhaz.hu
- ÁRGARANCIA!Épített KomPhone Ryzen 7 7700X 32/64GB RAM RTX 5070 GAMER PC termékbeszámítással
- Windows, Office licencek kedvező áron, egyenesen a Microsoft-tól - Automata kézbesítés utalással is!
- Beszámítás! Sony PlayStation 5 825GB SSD digital konzol garanciával, hibátlan működéssel
- ÁRGARANCIA!Épített KomPhone Ryzen 7 7700X 32/64GB RAM RTX 5070Ti 16GB GAMER PC termékbeszámítással
Állásajánlatok
Cég: Promenade Publishing House Kft.
Város: Budapest
Cég: CAMERA-PRO Hungary Kft
Város: Budapest