Google Research prikazao je novi način korišćenja vještačke inteligencije – za čitanje rukopisa, što bi moglo radikalno promijeniti način na koji mašine pretvaraju ono što pišemo na papiru u digitalni tekst.
Ovo bi mogao biti ključni alat za dešifrovanje i prebacivanje rukopisa iz proteklih vijekova u digitalnu formu, prenosi PC Press pozivajući se na Techradar.
Sistem pod nazivom InkSight transformiše fotografije rukom pisanih riječi u digitalni tekst koristeći vještačku inteligenciju, bez potrebe za dodatnim uređajima.
Ideja je da se zamijeni ponekad nepouzdano optičko prepoznavanje karaktera (OCR) AI-jem koji može da oponaša način na koji ljudi zapravo uče da čitaju, konkretno tako što prepisuje postojeći tekst da bi naučio kako izgledaju i šta znače cijele riječi. Zbog toga su istraživači obučili AI da prepoznaje i oponaša ljudski rukopis.
– Digitalno vođenje bilježaka postaje sve popularnije, jer pruža trajni, lako uređiv i indeksabilan način čuvanja bilježaka u vektorskom formatu, poznatom kao digitalni ink. Ipak, postoji značajan jaz između ovog načina bilježenja i tradicionalnog pisanja na papiru, prakse koja je još uvijek omiljena kod većine ljudi. Njihov pristup kombinuje vještine čitanja i pisanja, omogućavajući obuku modela bez velikih količina uparenih primjera, koje je teško pribaviti. Koliko je nama poznato, ovo je prvi rad koji efikasno derenderuje rukopisni tekst sa proizvoljnih fotografija sa različitim vizuelnim karakteristikama i pozadinama – objašnjavaju istraživači u svom radu.
InkSight je više od alternative OCR-u. Obezbjeđuje preciznije rezultate u nepovoljnim uslovima, kao što su fotografije u lošim svjetlosnim uslovima, djelimično pokriven tekst ili zbunjujuća pozadina, gdje OCR često nije pouzdan. Istraživači su otkrili da su ljudi mogli da pročitaju 87% tekstova koje je generisao InkSight. Dvije trećine tih tekstova bile su toliko precizne da ljudi nisu mogli da ih razlikuju od stvarnog rukopisa.
Ako volite da pišete rukom, InkSight ima brojne potencijalne prednosti. Zamislite da pišete rukom u papirnoj bilježnici, a zatim pokazujete bilješke kameri kako bi se odmah pretražile i organizovale u kontekstu sa prethodnim bilješkama na fizičkim stranicama. Ako vam je rukopis naročito neuredan, InkSight bi mogao da pomogne da se vaši zapisi pretvore u kucani tekst koji i dalje tačno prikazuje ono što ste napisali.
Na širem planu, ovo bi mogao biti ključni alat za dešifrovanje i prebacivanje rukopisa iz proteklih vijekova u digitalnu formu. Čak i kada je tekst na jeziku koji nema veliki digitalni korpus, InkSight bi mogao pomoći u očuvanju rukopisa i obezbjeđivanju izvora za obuku na tim jezicima.
Google nije jedini koji razvija AI alate za prepoznavanje rukopisa. Na primjer, Amazonov novi Kindle Scribe unapređuje mogućnost e-čitača da pretvara rukom pisane bilješke u čitljiv tekst. Takođe, Goodnotes, aplikacija za digitalne bilješke, koristi tehnologiju Goodnotes Smart Ink kako bi rukopis pretvorio u kucani tekst i omogućio uređivanje bilješki kao da su kucane, uključujući poravnavanje, kopiranje, lijepljenje i logičko rijeđanje teksta.