- Yettel topik
- Google Pixel topik
- Samsung Galaxy S25 Ultra - titán keret, acélos teljesítmény
- Vivo X200 Pro - a kétszázát!
- Magisk
- Honor Magic7 Pro - kifinomult, költséges képalkotás
- Samsung Galaxy A56 - megbízható középszerűség
- Telekom mobilszolgáltatások
- Samsung Galaxy S25 - végre van kicsi!
- Okosóra és okoskiegészítő topik
Hirdetés
Új hozzászólás Aktív témák
-
Maverick14
tag
Hagyományos mikroprocesszoron is azoknak a neurális hálóknak a szimulációi fognak jól menni aminek az adatai beférnek az L2 cache-be. Az igazi kihívás az, hogy nagyobb adathalmaz esetén úgy alakítsd ki az algoritmusod adatfolyamát, hogy ne veszíts a sebességből a szűkebb memória sávszélesség miatt.
Én Celluláris Neurális Hálózatot (CNN) szimuláltam Cell-en, ez egy lokálisan összekötött hálózat, ott meg lehetett oldani úgy a dolgot hogy mindig csak a cellatömb néhány sorát tároltam az SPE memóriájában. A sorok betöltését és az eredmény kimentését ügyesen át lehet lapolni a cellák állapotának kiszámolásával.
A neurális hálóknak hatalmas irodalma van én csak a CNN-es részt ismerem valamennyire abból is a különféle platformokon történő megvalósítással foglalkozom. Szóval azt tudom javasolni hogy keress egy neurális háló modellt ami jól illeszkedik az adott feladathoz és ha használhatónak de lassú akkor foglalkozz a gyorsításával akár Cell-en, GPU-n vagy FPGA-n. -
Maverick14
tag
Az általad linkelt cikkben szó sincs arról hogy ez a megoldás gyorsabb lehet mint pl. a Matlab FFT függvénye. Kapunk egy neurális hálót amivel hasonló problémáink lesznek mint pl. a radix-2 FFT-vel, nevezetesen hogy mindenki mindenkivel össze van kötve. Tehát egy bizonyos méret felett ugyanúgy memóriasávszélesség korlátos lesz a feladat mint a radix-2 FFT esetén.
Ha már Cell és FFT akkor ezt érdemes megnézni: [link]
(Talán olvastad te is ezt, ha már olyan régen foglalkozol Cell programozással... Amúgy az egész itteni párbeszédről a következő klasszikus szösszenet jutott eszembe [link])
-
Maverick14
tag
Már van új TOP500 lista? Le vagyok maradva. Köszi, az infót a Fermi teljesítményéről, kb. ekkora kihasználtságra tippeltem volna.
Visszatéve a hírhez.
Összehasonlítva a MIC-et a tavaly bejelentett SCC-vel érdekes, hogy ebben az újabb architektúrában már koherens a cache. Pedig az SCC-vel kapcsoltban még a szoftveres koherenciát és a "transactional memory" előnyeit ecsetelgették. Mondjuk a magok is vektorosak lettek, úgy tűnik mintha az Intel két tervezőcsapattal is dolgozna. Az egyik a Tera-Scale Research Processor, SCC a másik a Larrabee vonalat viszi. -
Maverick14
tag
Tévedés, a 65nm-es PowerXCell 8i-ben már javítottak a DP műveletvégzés sebességén, ugyanannyi órajel alatt végzi el mint az SP-t. Így 102.4GFLOPs az elméleti számtási teljesítménye egy Cell processzornak.
LINPACK alatt 100GFLOPs-os átlagot mértek: [link].
A Fermi-re úgy tudom még nincs hasonló független LINPACK mérés. Szóval az elméleti számítási teljesítménye szép nagy, kérdés hogy a gyakorlatban mennyit lehet kihozni belőle.A sok kocaprogramozó pedig aki nem tud megbirkózni a Cell programozásával valószínűleg a közeljövőben megjelenő sokprocesszoros architektúrákat sem fogja tudni hatékonyan programozni.
Új hozzászólás Aktív témák
Hirdetés
- Intel Core i9-13900 24-Core 3.0GHz LGA1700 (36M Cache, up to 5.60 GHz) Processzor!
- Intel Core i7-12700 12-Core 3.6GHz LGA1700 (25M Cache, up to 4.90 GHz) Processzor!
- AMD Ryzen 7 7700X 2025.10.28 ig Alza GARANCIÁLIS
- Intel Core i5-14500 14-Core 2.6GHz LGA1700 (24M Cache, up to 5.00 GHz) Processzor!
- Be quiet! Pure Rock procihűtő
- BESZÁMÍTÁS! MSI B450M R5 5500 16GB DDR4 512GB SSD RTX 2060 Super 8GB Rampage SHIVA ADATA XPG 600W
- Gamer PC-Számítógép! Csere-Beszámítás! I5 10500T / RTX 3050 / 32GB DDR4 / 512 SSD!
- HIBÁTLAN iPhone 13 Pro 128GB Graphite -1 ÉV GARANCIA - Kártyafüggetlen, MS3015
- GYÖNYÖRŰ iPhone 12 64GB Green -1 ÉV GARANCIA - Kártyafüggetlen, MS3052, 96% Akkumulátor
- LG 55G4 - 55" OLED evo - 4K 144Hz & 0.1ms - MLA Plus - 3000 Nits - NVIDIA G-Sync - FreeSync Premium
Állásajánlatok
Cég: FOTC
Város: Budapest