Google vještačka inteligencija čita sa usana bolje od ljudi

google čitač
DeepMindov sistem "Watch, Listen, Attend and Spell" uspješno je prepoznao izgovorene riječi s preciznošću od 46,8 posto.

Poređenja radi, profesionalci koji čitaju s usana imaju točnost od 12,4 posto. U oba slučaja čini se da je postotak točnosti izuzetno mali, pošto je Oxfordov LipNet uspio da uspješno prepozna 90 posto izgovorenih riječi.

Međutim, treba imati na umu da je on koristio predefinirati materijal i ograničene fraze (51 jedinstvena riječ), dok DeepMind polaže test učenjem u stvarnom svijetu.

Istraživači odeljenja DeepMind vjeruju da će ovakvi sistemi biti od velike koristi osobama koje imaju oštećenje sluha.

Nije teško zamisliti budućnost u kojoj je, umjesto izgovaranja riječi virtuelnom asistentu na pametnom telefonu, biti dovoljno otvarati usta kao da se izgovaraju naredbe.