Keresés

Aktív témák

  • -mikey-

    csendes tag

    válasz emvy #1 üzenetére

    Hi!

    Nem leszek túl pontos. mert a jegyzeteim otthon vannak, de megpróbálom leírni, amire emlékszem. Hallgattam egy tárgyat a BME-n, tananyag volt a Google keresőmotorja (na nem a jelenlegi, mert az ugye titkos).

    A vektoros indexelésnek a lényege: Csinálnak egy szótárat, ahol benne van az összes dokumentum minden szava, sorban. Namost, az egyes dokumentumokat egy szótár-hosszú vektorral jellemzik, amiben egy szónak megfelelő elem értéke az a szám, amennyiszer a szó előfordul a dokumentumban (vagy 1, ha egyáltalán előfordul). A keresőkérdést is egy ilyen vektorral jellemzik, és aszerint választanak be egy dokumentumot, hogy a kérdés vektora mennyire ''hasonlít'' a dok. vektorához. Ez a ''hasonlít'' nem túl specifikált, létezik rá több megoldás is.
    Az meg már egy másik kérdés, hogy a találati halmazt hogyan rakja sorba...

    Bocs, ha nem voltam túl érthető, ha nagyon zavaros megpróbálom jobban leírni, de azt csak holnap, mert ma nagyon fáradt vagyok...

    Üdv,
    Mikey.

Aktív témák