Glasovna komunikacija s tehnologijom ponovo se vraća u modu
U posljednje vrijeme sve je jasnije da tehnologija aktivirana glasom doživljava neku vrstu renesanse
Ne radi se o nečem novom i revolucionarnom. Zamisao da ljudi komuniciraju s računalima i tehnološkim napravama glasovno izlazi iz mode i vraća se još od 70-ih godina prošloga stoljeća. No, takva praksa nikada nije postala mainstream. Barem ne do danas.
Ipak, u posljednje vrijeme sve je jasnije to da tehnologija aktivirana glasom doživljava neku vrstu renesanse. Istina, danas vladaju napredni mobiteli s nepraktičnim zaslonima osjetljivim na dodir koji nekim ljudima idu iznimno na živce, što zbog kompliciranosti što zbog njihovih velikih prstiju. Upravo zato će glasovno upravljanje postati dominantan način komunikacije u odnosu čovjek-tehnologija. Slanje sms poruka koje se pišu dok diktirate; instant preslušavanje glasovnih poruka; glasovno naređivanje telefonu da pretraži Internet za to i to; objavljivanje poruka na Twitteru dok se vozi automobil (preko glasovne naredbe, naravno)... Sve navedeno je jednim dijelom u upotrebi a drugim tek treba biti.
Vlad Senjoha, jedan od vodećih govornih znanstvenika pri tvrtki Nuance Communications specijaliziranoj za softver koji pretvara glas u tekst, kaže da je već sad moguće jednostavno pritisnuti jedno dugme na mobitelu i glasom mu narediti da pretraži, na primjer, „recenziju s Yelp.com-a o Capital Grilleu (restoran op. a) u Burlingtonu u Massachusettsu". Mobiteli bi trebali znati što traže, a korisnici bi trebali dobivati rezultate bez tipkanja. Neke od aplikacija koje su na neki način pionirske u tom kontekstu s ShoutOut, Dragon i Vlingo koje pretvaraju glas u tekstualne poruke ili email. Bin i Google također imaju aplikacije za mobitele koje korisnicima omogućavaju pretraživanje interneta jednostavno pričajući.
Osim toga, softver postaje sve boljim. Po nekoj logici, što je računalo više sposobno duže 'slušati' naš govor to će mu biti lakše pronaći tražene rezultate. David Nahamoo, glavni i odgovorni pri IBM-ovom odjelu za glasovna isttraživanja kaže da ova tehnologija funkcionira na sljedeći način: računalo sluša glas, pretvara ga u digitalnu informaciju i zatim predviđa koja vrsta glasova ili riječi će se izreći. To je velika razlika u usporedbi sa prvim vrstama ovakvog softvera koji je pokušavao razumjeti svaki glas i svaku riječ što je zahtijevalo mnogo računalne moći. Svaki softver za prepoznavanje glasa sadrži određeni broj jednadžbi preko kojih analizira govor i koristi statističke informacije kako bi povezao specificirani zvuk s određenim slovom ili kombinacijom slova. To je ustvari jedna velika igra pogađanja.
Ipak, postoji jedan veliki problem za kojeg se još nije pronašlo odgovarajuće rješenje - buka u pozadini. Zamislite da ste kraj vrlo prometne ulice ili na stanici metroa dok prolazi vlak. Ta buka može s lakoćom zbuniti softver. Usto, ne postoje dva čovjeka koja jednako govore, a softver je prije svega univerzalan u smislu da bi trebao odgovarati svakome - no to nije slučaj. Nadalje, čak i kad jedna te ista osoba izgovara jednu te istu riječ gotovo nikad je ne izgovara jednako. Korak po korak računala i tehnologija sve su bolji i sve precizniji u filtriranju ovakvih instanci, ali još je to daleko od onoga što viđamo, na primjer, u seriji Star Trek: Voyager.
Još jedan od problema je i taj što ne podržavaju svi mobiteli sve aplikacije. Ali u svijetu tehnologije to će se lako zaobići jer su hardver i softver a neki način međusobno uvjetovani. Zasad je najveći nedostatak moć procesuiranja - mobiteli, računala i ostale naprave jako su sofisticirani, ali ljudi pričaju isti jezik uz različite izgovore što gadgeti zasad ne mogu s lakoćom svladavati. No nema sumnje da hoće jer činjenica je da već sad do određene razine itekako komuniciramo s tehnologijom.
Novi komentar