- Motorola Edge 50 Neo - az egyensúly gyengesége
- Samsung Galaxy S25 Ultra - titán keret, acélos teljesítmény
- Okosóra és okoskiegészítő topik
- Xiaomi Watch 2 Pro - oké, Google, itt vagyunk mi is
- Xiaomi Mi 11 Ultra - Circus Maximus
- iPhone topik
- Android szakmai topik
- Minden a BlackBerry telefonokról és rendszerről
- Üzemidőre gyúr a Poco M7 Plus is
- Huawei P30 - kell ennél több?
Hirdetés
Új hozzászólás Aktív témák
-
dezz
nagyúr
Akkor tulajdonképpen mi is a problémád a Cellel?
Lehet vele gépet kapni, csak nem olcsó... PCIe kártyán is elérhető a PowerXCell8i, bár ez sem valami olcsó. Nem mintha egy Tesla az lenne.
Még mindig labdába rúghat az előbbi az utóbbival szemben, ami a telj./fogy. arányt illeti. Ahol ez kevésbé számít, ott az utóbbi a nyerő. Nem csoda persze, van egy pár év közöttük. (Viszont pl. hatékony kódot úgyanúgy nem gyerekjáték rájuk csinálni. Igaz, több is a nyers erő.)
Igen, a 32 SPU-s PowerXCell jégre let téve (legalábbis átmenetileg, mivel úgy fogalmaztak, hogy halted, nem cancelled, vagy akármi, de mindegy). Viszont lehet hallani egy olyan verzió fejlesztéséről, ahol a PPE-t egy rendes Power mag helyettesíti. Azt nem tudom, hány SPU lesz benne, de nyilván nem kevés és nyilván az LS mérete is nagyon lesz. Szóval, ez még messze nem dőlt el.
-
Maverick14
tag
Hagyományos mikroprocesszoron is azoknak a neurális hálóknak a szimulációi fognak jól menni aminek az adatai beférnek az L2 cache-be. Az igazi kihívás az, hogy nagyobb adathalmaz esetén úgy alakítsd ki az algoritmusod adatfolyamát, hogy ne veszíts a sebességből a szűkebb memória sávszélesség miatt.
Én Celluláris Neurális Hálózatot (CNN) szimuláltam Cell-en, ez egy lokálisan összekötött hálózat, ott meg lehetett oldani úgy a dolgot hogy mindig csak a cellatömb néhány sorát tároltam az SPE memóriájában. A sorok betöltését és az eredmény kimentését ügyesen át lehet lapolni a cellák állapotának kiszámolásával.
A neurális hálóknak hatalmas irodalma van én csak a CNN-es részt ismerem valamennyire abból is a különféle platformokon történő megvalósítással foglalkozom. Szóval azt tudom javasolni hogy keress egy neurális háló modellt ami jól illeszkedik az adott feladathoz és ha használhatónak de lassú akkor foglalkozz a gyorsításával akár Cell-en, GPU-n vagy FPGA-n. -
dezz
nagyúr
"a cell jatekprogramozas szintjen erdekelt, a tudomanyos munkak vele nem nagyon , meg amugyis lejart lemez a cell mar regota"
Csak nem Versiont köszönthetjük itt körünkben, aki először az egekbe magasztalta a Cellt, a sci-fi határait súroló game development tervekkel, majd amikor le kellett volna ülni mindezt megvalósítani (némi kézikonzolos gyakorlattal, ami 1db játékot jelent), beletört a bicskája, minek utána éppen az ellenkezőjére fordult a Cellről vallott véleményének előjele? (Valamit kihagytam?)
-
dezz
nagyúr
Te, haver, állítsd már le az agyad helyén lévő mókuskereket egy pillanatra és nézzél ki egy kicsit a fejedből, mielőtt ennél is nagyobb hülyét csinálsz magadból...
Aki itt megbukott valamiben, az valószínűleg te magad vagy, Cell programozásban...
Kár volt beléd az adófizetők befektetett pénze és a tanáraid ideje... Erre nem lennék büszke.
A PowerXCell8i, amit Raymond éppen abban a hozzászólásban említett, amire válaszolva te folytattad a bla-blát, na szóval ez a Cell változat fullos double-precision támogatással rendelkezik. Számos szuperszámítogépben alkalmazzák (mint fő számolóegység, a gépekben lévő Opteronok a memóriaalrendszert vezényelve igyekeznek adattal ellátni), melyek közül több benne van a Supercomputer Top10-ben, a (valós) teljesítmény/fogyasztás arányt is figyelembe vevő Green500 listának pedig első helyeit foglalják el.
A Fermiről annyit, hogy hiába a nagy elméleti teljesítmény, az állítólagos több TFLOPS, csak a legegyszerűbb számításokban jön ki a valóságban, összetettebb dolgokban a Cell 10x hatékonyabb...
Az se zavarjon, hogy az AMD APU megoldása közelebb áll a Cellhez, mint a Larrabee. (Persze nem minden részletében.)
-
Na igen, kb. errol van szo -- nincs olyan architektura jelenleg, ami valoban parhuzamosan tudna neuralis halot futtatni. A 'gyors' algoritmusok arrol szolnak, hogy az aktivitasok propagacioja nagyon gyors (e.g. a matrixmuveletek), de ahogy a matrix kilog, baj van -- es alapesetben ugye ez azt jelenti, hogy olyan 1000 neuron nagysagrendben kezdodnek a problemak.
Ha valakinek van kedve ezen gondolkozni, akkor szoljon, rendes penzeket lehetne erre szerezni.
Robotok mozgasvezerleset onmagaban nem igazan praktikus haloval megoldani szerintem, de jatszani jopofa dolog. (Konkretan a kontroll erdekel, azaz a mozgastervezes, vagy az intelligencia resze?)
-
Köszi az értékelést... gondolom az fel sem merült benned, hogy van, akit más terület érdekel, nem csupán a neurális hálók.
Én videókódolással foglalkozok hobbiból és amit a Cell nyújtott, számomra elég volt. Nyilván a Fermi többszörösen lekörözi, bár még nem próbáltam, de ettől talán nem lettem "elmeroggyant"... vagy igen?
(egyébiránt a fórum nem chat, megtanulhatna mindenki magyarul, ékezetekkel írni, ettől nem lesz valaki nagyobb szaki szerintem)
-
Raymond
titán
Csak az a helyzet hogy az utobbi par evben nem a Linpack volt az egyetlen ahol elertek normalis eredmenyeket 1-2 IBM-es "profi asmos" emberrel hanem egy rakat project volt publikaciokkal egyutt. Meg egyszer - az hogy te nem tudtal vagy tudsz valamit megcsinalni nem jelenti azt hogy mas sem tud. Ha annyti foglalkoztal volna vele akkor tudnal ezekrol a publikaciokrol. Mondjuk minimum egyrol tudnod kene meg ha nem is bujod az akademia alltal publikalt munkakat vagy epp kulonbozo cegek alltal publikalt white paper-eket.
-
Maverick14
tag
Az általad linkelt cikkben szó sincs arról hogy ez a megoldás gyorsabb lehet mint pl. a Matlab FFT függvénye. Kapunk egy neurális hálót amivel hasonló problémáink lesznek mint pl. a radix-2 FFT-vel, nevezetesen hogy mindenki mindenkivel össze van kötve. Tehát egy bizonyos méret felett ugyanúgy memóriasávszélesség korlátos lesz a feladat mint a radix-2 FFT esetén.
Ha már Cell és FFT akkor ezt érdemes megnézni: [link]
(Talán olvastad te is ezt, ha már olyan régen foglalkozol Cell programozással... Amúgy az egész itteni párbeszédről a következő klasszikus szösszenet jutott eszembe [link])
-
Gratulalok a szovegerteshez (ha mar helyesirni nem tudsz)
(Legalabb olvastad volna el, amit linkelsz, es latnad, hogy milyen celra ajanljak -- nezz utana, hogy melyik sort mire jo, nem veletlenul van tobbfajta...)(Meg esetleg valaszolj a neuralis halos kerdesemre, tenyleg erdekel, hogy tudsz-e altanos celu, elosztott rekurrens NN-szimulatort..)
-
Raymond
titán
Akkor inkabb valami massal kellett volna az idodet tolteni mert meg alap dolgokat se vagy kepes a jelek szerint megerteni meg az itteni hozzaszolasokbol sem:
1) DP alatt csak az elso (pl. a PS3-ban is talalhato) verzio teljesitmenye esik jelentosen, a Roadrunner-ben a PowerXCell8i van aminel az SPU-k alltal adott DP teljesitmenye az SP fele (102.4 GFlops)
2) Ezt ugy hasznalod ki amilyen jo programozo vagy es amennyire az adott problema megengedi
3) A linkelt Top500 eredmeny a standard Linpack DP eredmenye, ugyhogy van aki kihozta belole amit kelett -
Altalaban az ilyen arrogans stilus heveny kisebbsegi erzest takar
talan az egyetemen meg ma is a quicksort a meno, ami a legrosszabb algoritmus a foldon
Termeszetesen ez nyilvanvalo butasag, a radix ugyebar O(kn)-es, es k jellemzoen nem kisebb, mint log(n). Az, hogy a Cellhez pont a radix stimmel, az egy dolog, attol a qsort nem lesz rossz rendezesi algoritmus, mas kerdes, hogy nem mozogsz olyan feladatok kornyeken, ahol ezt kellene hasznalni (vagy mozogsz, csak nem jossz ra).
A neuronhalozattal a Cell akkor boldogul jol, ha alacsony az interkonnektivitas, a DFT-zo neuralis halo meg (legutobbi informacioim szerint) a spektralkomponensekkel aranyos szamu neuront igenyel, 100%-os interkonnektivitassal. Ha tudnal hatekonyan mukodo GPGPU-s vagy Cell-es rekurrens neuralis halo-implementaciora peldat mutatni, megkoszonnem, meg sosem talalkoztam ilyennel.
-
Sajnos nem arra valaszoltal, amit irtam.
egy processzor sikere a kodereken mulik
1: ez nem igaz, ezer mas dolgon is mulik, a kodereken talan a legkevesbe, ugyanis a koderek nagy resze azt csinalja, amiert fizetik, a legtobb 'komoly' cegnel vannak olyan koderek, akik megfelelo mennyisegu penzert megcsinaljak azt, amit elvileg ki lehet hozni a cuccbol
2: a kodereken nem mulik, hogy egy feladat elmeleti szinten hatekonyan paralellizalhato-e az adott architekturan -- ha nem, akkor az John Carmack se fogja jol megoldaniNem mondtam egy szoval sem, h a Cell nincs lemaradva a Fermihez kepest.
-
Nem a profi koder kerdese elsosorban, hanem a megoldando problemae. Ugyanez all a Fermire is.
Peldaul egy darab FFT-t egy buzi nagy adatszeten akkor sem tudsz jol megirni Cell-re vagy barmilyen GPGPU-ra, ha te vagy az orszag legnagyobb assembly magusa, viszont kepfeldolgozast meg barmelyik masodeves egyetemista kitol Cell-re vagy barmi hasonlora.
-
-
Raymond
titán
"de az biztos hogy cell vagy larrabee alatt rosszabb az arany , 10-20% max"
A Roadrunner-en a Cell (PoweXCell8i) vegzi a Linpack szamitasainak gyakorlatilag az egesz erdemi reszet es az efektivitas 75% : [link]
A #45-ben irtakra pedig nincs mit mondani, teljes zagyvasag az egesz.
-
wad
tag
"sajnos ahogy az nvidia is csinalta , egyseges thread kezelo egyseg kell ilyen kornyezetbe , tobb ezer threaddel"
Ja, úgy kell, ha SIMD videokártyát szeretnél csinálni. És még a cache nagyrészét is ki lehet dobálni. A helyzet viszont az, hogy nem minden algoritmust lehet videokártyára párhuzamosítani. Ha minden igaz, akkor a Knights Corneren viszont többszálú x86-ként lehet programozni. Más kategória.
-
Maverick14
tag
Tévedés, a 65nm-es PowerXCell 8i-ben már javítottak a DP műveletvégzés sebességén, ugyanannyi órajel alatt végzi el mint az SP-t. Így 102.4GFLOPs az elméleti számtási teljesítménye egy Cell processzornak.
LINPACK alatt 100GFLOPs-os átlagot mértek: [link].
A Fermi-re úgy tudom még nincs hasonló független LINPACK mérés. Szóval az elméleti számítási teljesítménye szép nagy, kérdés hogy a gyakorlatban mennyit lehet kihozni belőle.A sok kocaprogramozó pedig aki nem tud megbirkózni a Cell programozásával valószínűleg a közeljövőben megjelenő sokprocesszoros architektúrákat sem fogja tudni hatékonyan programozni.
-
Nem szeretnék olvasni 100 oldalt. Mint mondtam, nem szükséges meggyőzni engem, láttam működni, elég volt arra, amire kellett és jónak tartom továbbra is, szóval nem bánom, ha a Fermi, ami évekkel később készült, többre képes. Még jó, hogy így van... de azért kösz a linket, másrészt egy 2004-es hsz ma már nem sokat nyom a latban.
-
Akkor azt is tisztázzuk, hogy itt csupán a HPC mainstream kategóriáról beszélünk és az ebben a kategóriában fellelhető szerver(ek)ről. Egyébként nem csoda, ha leváltanak egy közel 10 éves rendszert, mint ahogy az sem, hogy egy 2010-es Fermi leveri ezt, de ettől még a Cell-ről nem jelenthető ki, hogy rossz vagy hogy kukába való... ez elég korlátolt nézet. Akkor az is kijelenthető, hogy az Audi 100 rossz volt csak azért, mert az új jobb?
(#20) cwn:
Aha... -
Surfym@n
senior tag
Idézet a linkelt cikkből:
"In an interview with Heise.de, IBM's VP of Deep Computing, David Turek, confirmed that the Cell processor has reached the end of the line. Turek then put a more positive spin on the news by stating the obvious truth that heterogeneous multiprocessors, of which Cell was the first mass-market example of, are here to stay, so insofar as IBM continues to produce such chips, Cell's basic concepts and ideas will live on in the company's product line."
Ez nagyjából a lényeg is (a többi csak bővebb kifejtése a cikknek), miszerint a Cell proci csak egy állomás volt, de az alapkoncepciót továbbviszik. Nyilván itt is valami általános feladatokra kihegyezett "dinnyét" akarnak kifejleszteni
Cikket is kéne olvasni, nemcsak főcímeket...
cwn meg monnyon le!
(ezzel a stílussal, meg okoskodással még Kiszel Tünde is lealázná, miután leereszkedett a szintjére)
-
Abu85
HÁZIGAZDA
A Cell-t továbbra is használja az IBM, csak egy fejlesztést állítottak le. A PS3 nem a Cell miatt volt gondban. Hülye volt a Sony politikája. Jöttek a pokoli teljesítmény dumával miközben a júzer látta, hogy a multiplatform játékok jobban néznek ki xBox 360-on. Amióta az exkluzív címekre alapozzák a marketinget, azóta jól megy a PS3 szekere.
-
Gondolom az nem foglalkoztat, hogy egy Blade és a Fermi nem pont ugyanarra való... és gondolom az sem zavar, hogy egy PS teljesítményét hoztad össze egy Fermiével... Én nem akarlak meggyőzni, mivel nem is egy kategória, de engem se kell téríteni, hidd el. Eleve alapvetően más a két architektúra. És gondolom egy bukott cuccból nem adnak el 30 milliót.
-
Azért én láttam Blade szerverben is működni és nem mondhatnám, hogy egy bukott architektúra teljesítményét láttam (nem beszélve a Roadrunner teljesítményéről, ami ugyan hibrid, de van benne Cell is). Mivel nem új, nyilván nem mérhető a Fermihez, de azért koránt sincs vége a Cellnek, csak épp nem a te szegmensedben kell csupán körülnézni...
Új hozzászólás Aktív témák
Hirdetés
- GYÖNYÖRŰ iPhone 13 128GB Starlight -1 ÉV GARANCIA - Kártyafüggetlen, MS3111
- Gamer PC- Számítógép! Csere-Beszámítás! I3 10100F / RTX 2060 / 32GB DDR4 / 500GB SSD
- Seagate Exos X18 16TB SAS merevlemez
- Telefon felvásárlás!! iPhone 12 Mini/iPhone 12/iPhone 12 Pro/iPhone 12 Pro Max
- Samsung Galaxy A34 5G 128GB Kártyafüggetlen 1 év Garanciával
Állásajánlatok
Cég: FOTC
Város: Budapest