- Xiaomi 15 - kicsi telefon nagy energiával
- iPhone topik
- Milyen okostelefont vegyek?
- Melyik napszakban merül majd le az iPhone 17 Air?
- Samsung Galaxy A54 - türelemjáték
- Apple Watch
- Magisk
- Szakít a OnePlus és a Hasselblad?
- Nubia Red Magic 10S Pro - újratöltve
- Samsung Galaxy S24 Ultra - ha működik, ne változtass!
Hirdetés
Köszönjük a sok biztatást, támogatást! Utolsó pillanat a féláras hirdetésfeladásra, előfizetésre!
-
Mobilarena
Új hozzászólás Aktív témák
-
pmonitor
aktív tag
válasz
Mechorganic #15287 üzenetére
Esetleg még azt lehet csinálni, hogy az egészet megírod C-ben/C++-ban. A sebességkritikus rész(ek) kódját megnézed, és ha találsz benne olyan részt, ahol szted lehet gyorsítani, akkor azokat megírhatod C-be/C++-ba ágyazott assemblyben. Macerás, de ha a gyorsaság számít, akkor talán ez a legegyszerűbb.
-
bambano
titán
válasz
Mechorganic #15287 üzenetére
szerintem a nem sebességkritikus részeket meg lehet írni c-ben, a sebességkritikusokat meg c-be ágyazott assembly-ben. pl. a kép beolvasását úgyis a diszk limitálja, felesleges asm-et erőltetni rá.
-
Livius
őstag
válasz
Mechorganic #15290 üzenetére
Az IO művelet nem gazdaságos, szerintem még asm-ben sem, ezért ez a koncepció hogy sokszor kell hozzányúlnod a fájlokhoz rossz stratégia. Lehet hogy tudsz vele tárhelyet vagy adatküldést spórolni, de CPU időt meg pont hogy pocsékolni fogod nagyon sokat.
-
kovisoft
őstag
válasz
Mechorganic #15287 üzenetére
Ha a sebesség számít, akkor lehet, hogy jobban jársz, ha C-ben írod meg a kódot, és rábízod az optimalizálást a fordítóra. A modern CPU-k bonyolult architektúrával rendelkeznek, kézzel nehéz olyan assembly kódot írni, ami gyorsabb kódot eredményezne annál, mint amit egy jó C compiler előállít sebességre optimalizált módban, mert ismerni kell, hogy mely utasítások milyen körülmények között tudnak párhuzamosan végrehajtódni, mikor mi mire vár, stb. Ha érdekel a téma, akkor ezen az oldalon találsz rengeteg infót az optimalizálással és a CPU architektúrákkal kapcsolatban.
-
Livius
őstag
válasz
Mechorganic #15287 üzenetére
Bármilyen .exe amit fordítasz egy mingw gcc-vel vagy akár a Visual studio-val console app-ként .bat fájlban használható, ehhez nem kell asm-ben írni. Én azt javaslom a standard C++-t válaszd erre, mondjuk Win XP-én a (Win 10-re is felmegy) Codeblocks ingyenes IDE-t felrakod a mingw-vel együtt és már fordíthatsz is bármilyen console-ban futó .exe-t. Ha még be is állítod a -Ofast optimalizációt, szerintem ugyan ott leszel sebességben mintha hozzáértően asm-ben csináltad volna.
Ezt a "képsorozat esetén a nem változó kép négyzeteket nem kell újra eltárolni" nem igazán értem, hogy ebben mi a lényeg. -
Livius
őstag
válasz
Mechorganic #15284 üzenetére
Ez most csak hobbi vagy valami konkrét cél is van ezzel?
2020-ban DOS-ba vagy Win XP-re ezt felejtsd már el. Millió másik sokkal modernebb program vagy script nyelv létezik erre, amiben 50-100 sorból minden kész van egyszerűen és még működik is a mai modern összes oprendszeren. Google-vel azért nem találsz semmit, mert ezt ma már senki sem használja, mert van fejlettebb szoftvertechnológia ilyenekre.
Ha csak simán standard C vagy C++-ban írnád Win XP-én mingw gcc-vel ugyan olyan gyors lenne 99%-ra mint amit most próbálsz egyáltalán nem hatékonyan megcsinálni asm-ben.
-
válasz
Mechorganic #15280 üzenetére
A több szál tök felesleges, ez 32 bites pixelekkel számolva is csak 128 MB, az a pár memcpy nagyjából előbb lefut, minthogy elindulna egy szál. Ami tart valameddig, az az IO, azon meg nem segít a többszálúság.
-
Livius
őstag
válasz
Mechorganic #15280 üzenetére
Miben kell ezt csinálnod? Mi az oprendszer mi a programozási nyelv? Az egészet ASM-ben írod?
Ha van elég RAM-od és mondjuk 1-nél több CPU-d akkor a legegyszerűbb az, amit a végén is írtál, hogy az egészet egyszerre betöltöd egy mátrixba, aztán minden egyes sorra amit akarsz egymástól függetlenül elvégezni, azokat egyszerre elindított (egy for ciklusban egymás után, igazából nem pont egyszerre fognak indulni) külön szálakban, azt vársz azok végére és mondjuk az eredmény mátrixot meg már nem párhuzamosítva, hanem szépen sorban felépíted ezek külön eredményeiből (ekkor már csak copyzol sorról sorra).
Ez amit szeretnél C, C++, C#-ban egyaránt Linuxon vagy Windowson egy szép megoldás és még egyszerű is. Tonna számmal vannak a neten az ilyenekre a megfelelő példa kódok.
-
válasz
Mechorganic #15256 üzenetére
Próbáltad több szálon megoldani? Ez a feladat elég jól párhuzamosíthatónak tűnik, illetve ha van elég ram, akkor az első beolvasást és az utolsó, teljes file lemezre írásán kívül elhagynám a lemezműveleteket. Beolvas, feldolgoz, összerak, kiír. Ebből a darabolás, meg utána a végső "fileba" (adatszerkezetbe) írás mehet párhuzamosan simán.
-
bambano
titán
válasz
Mechorganic #15256 üzenetére
ramdisken próbáltad?
Új hozzászólás Aktív témák
● olvasd el a téma összefoglalót!
- Acer TravelMate P214 i3-1115G4 12GB 512GB 14" FHD 1év garancia
- BESZÁMÍTÁS! Asrock B365M i5 9600KF 16GB DDR4 250GB SSD 1TB HDD RX 5700XT 8GB Zalman N5 FSP 700W
- BESZÁMÍTÁS! MSI B150M i5 7400 16GB DDR4 250GB SSD 500GB HDD GTX 1060 3GB BitFenix NOVA MESH 400W
- Telefon felvásárlás!! Xiaomi Redmi 9, Xiaomi Redmi 9AT, Xiaomi Redmi 10, Xiaomi Redmi 10 2022
- HIBÁTLAN iPhone 15 Pro Max 256GB White Titanium -1 ÉV GARANCIA - Kártyafüggetlen, MS3006, 90% Akksi
Állásajánlatok
Cég: FOTC
Város: Budapest