Hirdetés

Új hozzászólás Aktív témák

  • -NoVa-

    őstag

    válasz Sipi- #17081 üzenetére

    Már ott hibás, hogy emberi hallgatásra használt tömörítésben számol, miközben jóval kevesebb dologra van szükség a szövegfelismeréshez. Vegyél fel egy monológot egy csöndes stúdióban, aztán ugyanazt az utcán háttérbeszélgetésekkel, kutyaugatással, autóelhúzással, szélzajjal, meg lépéshangokkal. Agyonszűrve, agyonsimítva, normalizálva a végén kb olyasmi hanghullám lesz belőle, ami szinte fonetikusan írott nyelvnek néz ki, annyira kevés információt tartalmaz, de azért egy körzeti orvos kézírásával írt valami, aminél komoly háttértudás kell, hogy megtippeld, mit írhatott le.
    Kb ha kbps-re akarnám konvertálni, akkor 0.77kbps körül még csak 2% a feldolgozott szövegben az információveszteség a tömörítetlenhez képest. Az meg napi 4MB adat lenne, ha mindet online akarná feldolgozni. Csak épp az online feldolgozás fölösleges kulcsszókinyerésre, arra egy OS szinten tárolt párnyelvű adatbázis kell, a támogatott nyelveken párezres szókészlettel, aztán helyben adatforgalom nélkül osztályoz.
    Ez nyelvenként párszáz KByteos adatbázis, és telefongyártófüggően mellékelhető. Az informatika 172 nyelvet különböztet meg régiókodokkal, és ha a mikrorégiók ritka nyelveit kivesszük, egy 50 nyelves adatbázist már nem fáj az OS-hez mellékelni a mai telefonokon.
    Az Amerikai Egybesült Álmokban is pontosan napi 0 kbyte adatforgalom lenne az eredménye, ami pont végtelenszer kevesebb, mint a FaceBooké. Ha már nagy számokat kell mondani.
    A Siri féle cuccok sem az egyes szavak felismerése miatt küldik online a szöveget, a mondanivaló kielemzéséhez kell a komolyabb adatbázis.

    Röviden.

Új hozzászólás Aktív témák