- Milyen okostelefont vegyek?
- Samsung Galaxy S24 Ultra - ha működik, ne változtass!
- iPhone topik
- Mobil flották
- Melyik napszakban merül majd le az iPhone 17 Air?
- Apple Watch
- Xiaomi 15 - kicsi telefon nagy energiával
- Motorola Edge 50 Neo - az egyensúly gyengesége
- Samsung Galaxy Z Fold7 - ezt vártuk, de…
- Bemutatkozott a Poco X7 és X7 Pro
Hirdetés
Talpon vagyunk, köszönjük a sok biztatást! Ha segíteni szeretnél, boldogan ajánljuk Előfizetéseinket!
-
Mobilarena
Új hozzászólás Aktív témák
-
#05216000
törölt tag
válasz
ngabor2 #12353 üzenetére
Ha még kell segítség és itt nem kapsz, akkor küldj e-mailt a victorsugo@protonmail.com címre. Innen most kiszálltam.
(kinek volt az az idióta ötlete, hogy egy témához több hozzászólást nem lehet írni, míg valaki más nem ír? Ez valami hihetetlenül retardált megoldás, bármi is legyen az oka) -
#05216000
törölt tag
válasz
ngabor2 #12351 üzenetére
Azt hiszem, félreértesz. Az a baj, hogy a szinonima hivatkozása az eredetire nem konzisztens.
Bocs, csak példa, de nem tudom másképp:
Ha lenne egy "Dendrobium Orchidea" nevű növényed, aminek van ezer szinonimája, de a szinonimák hivatkozásaiban hol "Dendrobium Orchidea" van, hol "Dend. Orcihd.", máskor meg "Dendrobium O." akkor automatikusan, a mi eszközeinkkel, ezt nem lehet összepárosítani.
És eredetiként csak az egyik verzió szerepel.Normál körülmények közt csak annyi lenne a feladvány, hogy kiválogatod a neveket, amikre később szinonimák is vannak, majd a szinonima - eredeti párosokat kettéválasztani, field separator "-", kiírod fordított sorrendben, sorba rendezed és talán erre kell egy kis program, ami json-ra konvertálja az egészet.
cat *.htm | gawk 'BEGIN { FS="-" } /<P>~/{ a=$1; b=$2; sub("<P>~[ ]*","",a); sub("^[ ]*See[ ]*","",b); print b,"\t",a}'| sort
Ez kilistázza a szinonima - eredeti párokat úgy, hogy előre veszi az eredetit, mögé TAB karakterrel elválasztva a szinonimát. A /<P>~/ helyére kellene egy pontos minta a szinonimákat tartalmazó sorokhoz, amit nem sikerült megtalálnom, mert valami mindig kimaradt vagy épp olyan sorokat is felszedett, amik nem feleltek meg a követelményeknek.
Ennek a sort előtti kimenetét kellene összefésülni az eredetiket tartalmazó listákkal és összefűzni az azonos növényhez tartozó sorokat, majd az egészből json-t készíteni.
De nálam ez teli van szeméttel. -
#05216000
törölt tag
válasz
ngabor2 #12348 üzenetére
Keress rá erre: "Ascocentrum ampullaceum"
Nekem úgy tűnik, kénytelen leszel minden frissítésnél újra és újra átbogarászni a letöltött adatok tartalmát, mert csak ennél minimum kétféle elnevezést találtam, látszólag ugyanahhoz a növényhez. Kétféle alatt azt értem, hogy az egyik verzióban teljesen ki van írva a Lindley, a másikban Lindl. szerepel. És ilyenekből van bőven. Ahogy olyanból is, hogy <P>~ karakterekkel indul a sor, de mögötte nem elnevezés van, hanem egy <a href...> tag és csak az.Vagy az ilyen eltérések, hiányosságok még beleférnek?
Meg az is eszembe jutott, hogy ez legális egyáltalán? Úgy értem: szerzői jogokat nem sért ez a feldolgozás?
-
#05216000
törölt tag
válasz
ngabor2 #12346 üzenetére
Néhányszor nekifutottam, de olyan gányolmány az egész oldal, hogy ennek a feldolgozásához jó érzésű ember nem ír programot.
Mást ne mondjak: címlap lejön valami win-12xx kódolással, az aloldalak meg iso-8859-1-nek mondják magukat. (a címlapról úgy látom, lemaradt az encoding a fejlécből)Szóval erre programot írni szerintem nem sok értelme van. Amit én tennék, megpróbálnám manuálisan, szövegfeldolgozó programok segítségével kibányászni a szükséges infókat és abból előállítani a szükséges json formátumot. Túl sok programozással nem jár, a regex használat elég lehet a többséghez.
Az elindulásban tudok segíteni, ha gondolod.
-
Új hozzászólás Aktív témák
● olvasd el a téma összefoglalót!
- HP EliteBook 830 G5 i5-8350U 16GB 512GB 13.3" FHD IPS
- Bomba ár! Dell Latitude E5570 Touch - i5-6300U I 8GB I 256SSD I 15,6" FHD I HDMI I CAM I W10 I Gari
- Bomba ár! Lenovo ThinkPad T440P - i5-4GEN I 8GB I 128GB SSD I 14" HD+ I Cam I W10 I Gari!
- Bomba ár! HP 255 G7 - AMD A4 I 4GB I 128SSD I HDMI I 15,6" FHD I Radeon I HDMI I W11 I Cam I Gari!
- Telefon felvásárlás!! Samsung Galaxy S25, Samsung Galaxy S25 Plus, Samsung Galaxy S25 Ultra
Állásajánlatok
Cég: FOTC
Város: Budapest