Hirdetés
- Olyan menő, hogy Google nélkül is elfogadnád
- Xiaomi 17 Ultra - jó az optikája
- Xiaomi 15T - reakció nélkül nincs egyensúly
- Hivatalos a Poco X8 Pro Max gigantikus akkukapacitása
- Samsung Galaxy S25 Ultra - titán keret, acélos teljesítmény
- Bemutatkozott a Poco X7 és X7 Pro
- Poco X8 Pro Max - nem kell ide sem bank, sem akkubank
- Apple iPhone 17 Pro Max – fennsík
- Vivo X300 Ultra - tárcsázz, ha van rá keret!
- Poco F6 5G - Turbó Rudi
-
Mobilarena

Új hozzászólás Aktív témák
-
Drizzt
nagyúr
válasz
bmatthun
#16364
üzenetére
Én anno csináltam ilyen scrapert, de a google eléggé gyorsan le is tiltotta az IP címet, ahonnan futtattam. Nem tudtam előre, de a google felhasználói feltételei között ott van, hogy ilyen célokra tilos a használata, s az elkövető tiltásával jár. Mondjuk ez vagy 15 éve volt, nem tudom megengedőbb lett-e a szabályzat. Nem hinném.
Én a html-ből próbáltam 1-2 heurisztika alapján parseolni, néha egész sikeresen, de hasonló mértékben egészen sikertelenül. Az eredményeket valamilyen db-be írtam, aztán kézzel átnéztem őket. -
Hege1234
addikt
válasz
bmatthun
#16364
üzenetére
én nem biztos, hogy jól értem mit szeretnél
de ha arra gondolsz, hogy pl azokat összeszedni amik a linken
bal oldlaon vannak
[link]
sztem megoldható pl. python-al és a beautifulsoup modullal
(de lehet van rá jobb megoldás is)
csak hát ugye kérdéses, hogy az éttermek mennyi adatot töltenek ki...
az összes telefonszám pl. ebben van <a class="fl"
az étterem nevei pedig itt <div class="dbg0pd" aria-level="3" role="heading">
erre szűrve role="heading" így gondolom az étterem nevei is kinyerhetőek
többire nem kerestem rá, és mivel egy csomó helyen random generált div nevek vannak
nem tudom, hogy így megoldható lenne ezzel a módszerrel
többiek akik itt jobban értenek hozzá biztos tudják, hogy érdemes e ezzel így megoldaniha elmélyednél a témában akkor a web scraping-re keress rá
-
coco2
őstag
válasz
bmatthun
#16364
üzenetére
Egyik webrobot sem tud gondolkodni, pláne nem gondolatolvasók. Google összes találata a legközelebbi, amit kaphatsz. Pld mit nevezel étteremnek? Utcai morning-only kávés büfétől a sok csillagos szállodai éttermekig a szivárvány 16 millió színével mind festhetnél egy átmenetet közöttük.
Egyenlőre nem elterjedt szokvány az open graph a weben. Név, cím, olyasmi, nem gyűjthető le előreszámítható és egyforma módszerrel mindenhonnét. Ahogy a haladási sebességet elnézem, majd 10 év múlva kérdezz rá újra - még akkor sem leszel lekésve semmiről.
Ha vannak Arany Oldalak, Cégkódex, vagy mittudomén miféle kiadványok, azok szerkesztve adnak adatokat. Sajnos, tekintettel a covid-ra, ami 1 évnél régebbi adat (a web 10 éves szeméttel van tele, de azok a kiadványok is lehetnek 1 évnél régebbi adatból szerkesztve), arról csak akkor fogod tudni, még tényleg létezik-e az étterem, ha személyesen odamész arra a címre.
Szóval döntsd el, mennyi pénzt szeretnél rá elkölteni. Törődj bele, hogy azt előre fogod valakinek odaadni. Különben a normálisabbja szóba sem áll veled. Aztán kapni fogsz valamit, amit a problémához mérten annyi pénzből az a kóder digitális formában adott. És majd utólag meglátod, mennyi az eltérés a virtuális valóság, és a kézzel fogható gyakorlat között.
Cheers

Új hozzászólás Aktív témák
Hirdetés
● olvasd el a téma összefoglalót!
- Latitude 5440 14" FHD IPS i7-1365U 16GB 512GB NVMe ujjlolv IR kam gar
- GAMER PC! i5-13500 / RTX 3070 Ti / 16GB DDR / 512GB NVMe / 650w!
- Eladó Precision 7540 FHD IPS i7-9850h Radeon Pro WX 3200 32 512 magyarított bill + külső hangkártya
- Kingston HyperX FURY RGB 2x16GB DDR4 3200MHz CL16 Eladó!
- iPad Air 10.9" M1 2022 - full doboz, garancia (118)
- nVidia Quadro RTX 3000 Max Q SFF - Garanciával
- Lenovo ThinkPad L16 Gen 1 - 16" WUXGA IPS - Ultra 5 135U - 16GB - 512GB - Win11 - 2 év gari
- Macbook Air M2 15" 8GB 256GB 100%
- Bomba ár! Dell Latitude E5520 - i5-2GEN I 4GB I 500GB I 15,6" FHD I HDMI I W10 I Garancia!
- TOP Pure White PC /Ryzen 7 9800X3D, 32GB DDR5 RAM, 1TB M.2 PCIe SSD/ akciós áron eladó! BeszámítOK!
Állásajánlatok
Cég: Laptopműhely Bt.
Város: Budapest



