Bevezetés
„A Bábel-hal […] kicsi, sárga és piócaalkatú, s valószínűleg a legfurcsább lény a világegyetemben. Agyhullám-energián él, mégpedig nem a hordozójáén, hanem azokon, amelyek kívülről érik a hordozóját. A beérkező agyhullám-energiák összes tudat alatti mentális frekvenciáját abszorbeálja, és testébe építi. Majd exkrementumként a hordozója agyába üríti azt a telepatikus mátrixot, amely a tudatos mentális frekvenciák és a hordozó elme beszédközpontja idegi jelzéseinek kombinálásából adódik. Mindez gyakorlatilag azt jelenti, hogy aki Bábel-halat dug a fülébe, az azonnal megért bárkit bármilyen nyelven. A ténylegesen hallott beszédelemek dekódolják azt az agyhullámmátrixot, amelyet a Bábel-hal táplál a hordozója agyába.”
Na, itt még nem tartunk, de a Timekettle-ről nem lehet nem Douglas Adams Galaxis útikalauzára asszociálni. Mellesleg azóta sem jöttem rá, mire utal a termék megnevezése, az IdőKatlan még Adams gondolatvilágában is elvontabb megoldás lenne, a fordító meg van annyira okos, hogy a saját nevét felismerje. Mindenesetre az eszköz egy mesterséges intelligencia alapú fordítógép, hasonló a Travishez, csak itt vezetékmentes fülhallgatókhoz kapcsolódik a társalkalmazás. A Timekettle M2 nem a fejlesztők első terméke, viszont még nem került forgalomba, így kicsit még bétás az élmény.
Az elődmodell WT2 Plus is nálunk van, de a működési elv és a koncepció nem tér el túlzottan, úgyhogy nem is foglalkozunk vele különösebben. Mindössze egy funkció nem elérhető még az új modell esetében (Speaker mode), azt néztük meg a WT2 Plusszal. A teszt előtt volt lehetőségünk megosztani az észrevételeinket a Timekettle-lel, ami így viszonylag szerényen hangzik, mert igazából valamiért nagyon várták. Az új modell nem csak új formatervet és funkciókat kapott, de egy komplett új alkalmazást is, amivel még nyilván vannak gondok.
A támogatott nyelvek és dialektusok listája ABC sorrendben.
A csapat egyébként nagyon együttműködő és nyitott, nekem pedig elég jól esett, hogy a felhasználói felületre és a szoftver architektúrájára vonatkozó javaslataimat nagyon szakszerűnek és hatékonynak (sic!) ítélték meg, ráadásul implementálják is őket. A Timekettle M2-t tehát egyelőre a jelenlegi formájában teszteljük és a problémákra is kitérünk, de a legtöbb apróság és kevésbé apróság javítása, illetve a javasolt fejlesztések már folyamatban vannak, plusz érdekes háttér-információkat is kaptunk a rendszer működésére vonatkozóan, ezeket természetesen idézni is fogjuk.
Kialakítás, általános funkciók
A Timekettle ránézésre egy egyszerű vezetékmentes fülhallgató, az M2 pedig már ilyen minőségében is funkcionál. A WT2 Plus még kizárólag fordításra volt alkalmas az egyszerű (főleg távirányítók hangvezérléséhez használt) Bluetooth chip miatt, az M2 viszont már a Qualcomm TWS fülesekhez fejlesztett, BT 5.0-s szettjét használja aptX protokollal. Szóval az M2 füleseket már használhatjuk simán csak zenehallgatásra és telefonálásra is. Mellesleg teljesen jól szól.
Az M2 tokja lényegesen kompaktabb lett, Type-C csatlakozó került rá, vezetékmentes töltés viszont nincs és az IPx4-es cseppálósság is csak a fülesekre vonatkozik, a tokra nem. A töltés tényét és a töltöttség hozzávetőleges mértékét a két-két LED jelzi (mindkét fülesnek saját LED-párja van). Ha mindkettő ég, akkor a füles töltöttsége magasabb, mint 90%; ha csak az egyik világít, a másik villog, akkor 50 és 90% között áll valahol; ha csak egy LED világít, akkor 0 és 50% között vagyunk, ha pedig egyik sem, akkor a töltőtok kikapcsolt. A fülesekben hat órányi fordítás vagy zenehallgatás van, ami reálisnak is tűnik, a tokkal pedig összesen 30 órás üzemidőt hozhatunk össze.
A párosítás roppant egyszerű, a tokból kivéve a fülesek azonnal aktívak, automatikusan kapcsolódnak a telefonhoz, ha már ismerik egymást. Ilyenkor egyszerű fülhallgatóként csatlakoznak és funkcionálnak. A jobb és a bal füles is rendelkezik egy szövegbuborék alakú RGB jelzőfénnyel, amelyek nagyjából ki is jelölik az érintésérzékeny felületet, ami maga a LED, plusz a közvetlenül alatta lévő terület. A zöld villogás jelenti a párosítható állapotot, folyamatosan világít, ha kapcsolódott és pirosan villog, ha tölteni kell. A tokban mindaddig pirosan világít, amíg el nem éri a teljes töltöttséget.
Ha a fülesek kikapcsolnak, két másodperces érintéssel lehet őket észhez téríteni, a kikapcsoláshoz pedig nyolc másodperc szükséges. A bejövő hívást gyors dupla érintéssel vehetjük fel, elutasításhoz pedig két másodpercig kell tartani. Zenénél szintén ezek a mozdulatok működnek. A jobb füles a következő számot dobja be dupla érintésre, a bal értelemszerűen az előzőt, a lejátszást szüneteltetni pedig bármelyik füles egyszeri, gyors megérintésével lehet. Az intelligens asszisztensek (Siri, Alexa, Google asszisztens, Bixby) három gyors érintésre kerülnek elő.
A WT2 Plus kialakítása még kicsit más. [+]
Az érintésvezérlés pontos és reszponzív, a fülest pedig én kifejezetten kényelmesnek éreztem, hosszútávon sem okoz problémát a használata. Sokkal jobb az ergonómia, mint az elődmodellnél, noha a WT2 Plushoz jár többféle méretű, támasztékkal ellátott gumiharang és még fülhorog is, de valahogy mind nagynak és instabilnak tűnt. Persze a rendeltetésszerű használatot nem akadályozta, de kényelmesnek nem nevezném. A teljesen kettévehető, mágnesesen záródó tok viszont továbbra is kitűnő megoldás. És nem csak azért, mert a funkciókból kifolyólag előfordulhat, hogy a fülesünk párját oda kell adjuk valakinek.
Funkciók, fordítás
Egyelőre két különböző alkalmazás kezeli a két modellt, mert a WT2 Plus valamiért nem kapcsolódik az új apphoz. Viszonylag újkeletű probléma lehet, mert a Timekettle is tőlünk értesült róla, de rajta vannak az ügyön. A Speaker mód amúgy sem elérhető még az 1.3.3-as bétában, úgyhogy a képernyőfelvételek még az elődmodell saját appjában készültek. A Speaker lényege, hogy nem szükséges mindkét félnek fülest viselnie, elég, ha csak mi használjuk, az app pedig telefon hangszóróját és mikrofonját használja. Ha a másik félnek is van mondanivalója, csak ki kell választani az appban a telefont, mint beviteli eszközt és mondhatja, ha befejezte, leállítja a rögzítést és megkapjuk a fordítást.
A Touch mód ugyanolyan, mint a Speaker, csak mindketten fülesbe beszélünk. Ez zajos, forgalmas környezetben lehet hasznos, mivel a fülhallgató ilyenkor szűri a háttérzajokat és csak addig rögzít, amíg le nem állítjuk. Ez szintén kicsit ilyen walkie-talki stílusú megoldás, de mind közül ez tűnt a legprecízebbnek beszédfelismerés szempontjából és a várakozási idő alatt lehetőségünk is van ellenőrizni a fordítás írásos verzióját, viszont ugye azzal jár, hogy oda kell adnunk a másik félnek az egyik fülest. Ezt nem biztos, hogy mindenki szívesen megteszi.
A korábbi Simul, mondjuk Szinkrontolmács mód szintén hiányzik az új appból, de a tervek szerint nem is kerül bele. Ez csendes környezetben, maximum két fő részvételével zajló párbeszédhez ideális. Nem kell nyomkodni a füleseket (vagy a telefont), hogy melyik fél beszél és meddig, a társalgás kvázi folyamatos, mivel a rendszer valós időben, folyamatosan fordít. A fordítás maga általában a többi módban is nagyon gyors, de nem olyan könnyű tökéletes artikuláció és precíz kiejtés mellett tempósan magyarázni. Plusz korrigálni is kell, ha valamit félreértett a rendszer, aminek a magyarban elég nagy esélye van, úgyhogy érdemes nézni az átiratot.
A Lesson mód még abszolút béta, lényegében egy prototípus. Nem is működik jól, de folyamatosan dolgoznak rajta. A lényeg, hogy egy valaki (nem szükséges fizikailag jelen lenni, videókkal is működik) beszél folyamatosan, azt a telefon rögzíti, a fordítás pedig megjelenik a rögzített szöveg alatt és a fülesbe is érkezik, ha kérjük. Az AI egyelőre nem következetes, szükségtelenül keveri a szinonímákát és egyáltalán nem ismeri fel a kontextust.
A Text mód új, egyszerű írott szöveg fordítása, viszont lényegesen hatékonyabb magyarról és magyarra is, mint az általában használt megoldások. A fejlesztők egyébként csak mintegy mellékesen rakták össze az opciót, de a visszajelzések alapján a felhasználók hasznosnak találják és kedvelik is, így marad, bár nem sok köze van az eredeti projekthez. A fordítás optimalizáláshoz a rendszer összehasonlítja a különböző fordítómotorok megoldásait (Google, iFlytek, Microsoft és Timekettle), ami messze jobb teljesítménnyel dolgozik, mint mondjuk a Google fordító.
Felhasználói élmény, hatékonyság, összegzés
Az alkalmazás még elég félkész, de összességében jól működik. Néha nem kellően reszponzívak a felületek, viszont a struktúra, a dizájn és a funkciók is változni fognak. Hozzáadják a Speaker módot, átrendezik a menüt és javítanak a navigáción. Jelenleg nincs kezdőképernyő és visszalépés funkció az appban, ami igen zavaró, néhány apróságot ki kell fésülni, illetve a megjelenítés sem igazodik hibátlanul a különböző képarányokhoz; egyelőre az osztott képernyős használat is kissé suta.
A visszalépés hiánya amúgy meglepő volt, valamiért nem így tervezték az appot, de Zhang, a termékmenedzser ígérete alapján a következő frissítéssel már integrálják egy kezdőképernyővel együtt. A lehetőség hiánya a kilépésnél is gond volt, a vissza navigációs gomb (és a gesztusvezérlés is) inaktív, úgyhogy vagy kiugrunk a kezdőképernyőre és hagyjuk tovább futni az appot vagy eleve az alkalmazáskezelőbe lépünk és kilőjük manuálisan. Az egyes módoknál az átiratokat sem tudjuk törölni (se vissza gomb, se külön opció), ha ugyanabban az üzemmódban szeretnénk új beszélgetést indítani. Ehhez meg kellett nyitni a menüt, kiválasztani akármelyik opciót, majd visszalépni abba, amit tényleg használni szeretnénk.
A fordítás viszonylag pontos, alapvetően nem hagyományos társalgási szint és tempó a beszédfelismerés esetleges pontatlansága miatt, nem mindig érzékeli, hogy a mondat végét, a tárgyalási színvonaltól pedig nagyon messze van. Néha kevéssé szofisztikált (kell/akarok/kérek/szeretnék), de esszenciális információkat vagy segítséget viszonylag nagy hatékonysággal szerezhetünk, ha végképp nem beszéljük az adott nyelvet vagy nagyon nem értjük, mit akarnak tőlünk. 30 nyelvet és 94 nyelvjárást ismer a szoftver és egyáltalán nem biztos, hogy egy akár stabil, de alap angollal tudunk mit kezdeni egy ír csapossal. De magyarban néhány dologra külön figyelni kell.
Egyrészt a magyar beszédfelismeréskor gyakran előforduló probléma, hogy a rendszer félreértette a ragozást. Úgy tűnik a legnagyobb problémát az egyes szám első személyű ragozás okozza. Egyszerűen nem dolgozza fel az -em, illetve -nem végződést, pedig a tőszót felismeri. (Nem túl jó a kiejtésem; meg kell etetnem a macskát etc.) Ilyenkor érdemes kicsit bután fogalmazni és kikerülni ezeket a szavakat, például Nekem kell megetetni a macskát. Németben ugyanezek a végződések viszont abszolút nem jelentettek problémát, ráadásul mintha az algoritmus bele is javítana. Nyelvtanilag direkt rosszul ragoztam, de helyesen értelmezte a névelőket (den/dem, einen/einem stb.). És meglepő módon még a dánt is megértette, pedig ritka pocsék a kiejtésem.
Másrészt erősen nehézkes a kérdések fordítása. A magyar nyelvben ugye nem mindig van konkrét kérdő szó, csak a hangsúly jelzi, hogy az igazából egy kérdés (Nyitva van a múzeum?). A mesterséges intelligencia nyilvánvalóan nem tudja értelmezni a hangsúlyokat, tehát ezeket állításokként fordítja. Az ilyen típusú kérdéseket összetettebb nyelvtani struktúrában kell megfogalmazni, hogy valóban kérdést tegyünk fel és ne csak simán kijelentsünk dolgokat. (Azt szeretném megkérdezni/az a kérdés, hogy nyitva van-e a múzeum?).
De ha valaki, aki nem ismeri a célnyelvet, nem fogja felismerni, hogy a rendszer rosszul fordította, plusz a magyar hangfordításnál is hiányoznak a hangsúlyok, tehát az sem lesz egyértelmű, hogy valaki kérdezett vagy mondott valamit (Do you want a coffee?). A kérdőjel hiánya vagy megléte jelezheti, hogy valami nincs rendben, viszont ehhez folyamatosan követni kell az átiratot, ami azért sokat ront az elérni kívánt felhasználói élményen. Echo Zhang, a Timekettle termékmenedzsere korábban gondolkodott rajta, hogy visszafordíttatják a fordítást az eredeti nyelvre, hogy a felhasználó nagyjából tudja, mit hallott a másik. Ezt az opciót most valószínűleg integrálni fogják a szoftverbe.
A technikai jellegű problémák kezelésére és az algoritmus finomhangolására viszont nem csak hajlandóságuk, de még idejük is van. A tervek szerint az első készülékeket a végleges szoftverrel szeptemberben szállítják. Az M2 jelenleg 69 dollárba (20 ezer forint) kerül IndieGoGon, de úgy tűnik, a piacra kerülés után is csak 119 dollárt (36 ezer forint) kérnek majd érte, ami a hangminőséget és a funkcionalitást tekintve sima TWS fülesként is korrekt összeg lenne az eszközért teljes körű Android is iOS kompatibilitással. A Timekettle M2 minden apróbb hibájával együtt tetszett még úgy is, hogy az offline fordítás egyelőre csak angol-kínai viszonylatban lesz opció, ha a kampány eléri a 300 ezer dolláros kiterjesztett célt. A támogatók számára viszont örökre ingyenesen elérhető lesz majd, az esetleges további offline nyelvekkel együtt (másfél milliónál már ráállnak a koreaira, az oroszra, a japánra és a spanyolra is). A beszédfelismerés nem hibátlan, a fordítás néha kevésbé szofisztikált, de ha éppen megdöglünk egy kávéért, bizonyára kevésbé fog zavarni, hogy a pincér nem azt kérdezi, hogy tejjel vagy anélkül óhajtja, hanem, hogy tejjel kell-e?
![]() |
TImekettle M2 |
AliceWake