Alexa, Siri og Google forstår ikke et ord du sier

Amazon

Voice assistents som Alexa, Google Assistant og Siri har kommet langt i de siste årene. Men for alle deres forbedringer holder en ting dem tilbake: De forstår deg ikke. De stole for mye på bestemte talekommandoer.

Taleegenkjenning er bare et magisk triks

Amazon

Tale assistenter forstår deg ikke. Ikke egentlig, uansett. Når du snakker med et Google Home eller Amazon Echo, konverterer det i hovedsak dine ord til en tekststreng og sammenligner det med forventede kommandoer. Hvis den finner en eksakt kamp, følger den et sett med instruksjoner. Hvis det ikke gjør det, ser det ut til et alternativ på hva du skal gjøre ut fra hvilken informasjon den har, og hvis det ikke fungerer, får du en feilmelding som "Beklager, men jeg vet ikke det . "Det er lite mer enn å se på hånd magi for å lure deg til å tenke det forstår.

Det kan ikke bruke kontekstuelle spor for å gjøre det beste gjettet, eller til og med bruke en forståelse av lignende emner for å informere sine beslutninger. Det er heller ikke vanskelig å reise opp talassistentene heller. Mens du kan spørre Alexa "Fungerer du for NSA?" Og får svar, hvis du spør "Er du hemmelig del av NSA?" Får du et "Jeg vet ikke det ene" svaret (i hvert fall ved tidspunkt for denne skrivingen).

Mennesker, som virkelig forstår tale, virker ikke slik. Anta at du spør et menneske, "Hva er det klart i himmelen? Den som er buet, og full av stripede farger som rød, oransje, gul og blå. "Til tross for at klarvain er et ferdig ord, kan personen du spurte sannsynligvis finne ut av den konteksten du beskriver en regnbue.

Mens du kan argumentere for at et menneske konverterer tale til ideer, kan et menneske deretter bruke kunnskap og forståelse for å konkludere med et svar. Hvis du spør et menneske hvis de hemmelig jobber for NSA, gir de deg et ja eller nei svar, selv om det svaret er en løgn. Et menneske ville ikke si "Jeg kjenner ikke den ene" til et spørsmål som det. At mennesker kan lyve er noe som kommer med reell forståelse.

Taleassistenter kan ikke gå utover deres programmering

Stemmeassistenter er i siste instans begrenset til programmerte forventede parametere, og vandrende utenfor dem vil bryte prosessen. Det faktum viser når tredjeparts enheter kommer inn for å spille. Vanligvis er kommandoen for å samhandle med dem svært ubrukelig, noe som betyr at «fortelle enhetsprodusenten å kommandere valgfritt argument.» Et eksakt eksempel ville være: "Fortell Whirlpool å stoppe tørketrommelen." For en enda vanskeligere å huske et eksempel, har Geneva Alexa ferdighet styrer noen GE ovner. En bruker av ferdighetene må huske å "fortelle Genève" ikke "fortell GE" og resten av kommandoen. Og mens du kan be om å forvarme ovnen til 350 grader, kan du ikke følge opp med en forespørsel om å øke temperaturen med ytterligere 50 grader. Et menneske kunne imidlertid følge disse forespørslene.

Amazon og Google har jobbet veldig hardt for å overvinne disse hindringene, og det viser. Hvor en gang du måtte følge ovennevnte rekkefølge for å kontrollere en smart lås, kan du nå si "låse inngangsdøren" i stedet. Alexa pleide å bli forvirret av "fortell meg en hundespøk," men spør etter en i dag, og det vil fungere. De har lagt til variasjoner i kommandoene du bruker, men til slutt må du fortsatt vite riktig kommando å si. Du må bruke riktig syntaks i riktig rekkefølge.

Og hvis du tror det høres mye ut som en kommandolinje, er du ikke feil.

Taleassistenter er en fancy kommandolinje

En kommandolinje er smalt definert for å utføre enkle oppgaver, men bare hvis du kjenner riktig syntaks. Hvis du slipper ut den riktige syntaksen og skriver dyr i stedet for dir, vil kommandoprompten gi deg en feilmelding. Du kan bruke aliaser for lettere å huske kommandoer, men du må en ide om hva de opprinnelige kommandoene var, hvordan de fungerer, og hvordan man bruker alias effektivt. Hvis du ikke tar deg tid til å lære innsatsen og ut av kommandolinjen, vil du aldri få mye ut av det.

Stemmeassistenter er ikke forskjellige. Du må vite riktig måte å si en kommando eller stille et spørsmål. Og du trenger å vite hvordan du konfigurerer grupper for Google og Alexa, hvorfor gruppering av enhetene er viktig, og hvordan du navngi de smarte enhetene dine. Hvis du ikke følger disse nødvendige trinnene, vil du føle frustrasjonen ved å be stemmenassistenten for å slå av studien bare for å bli spurt, "hvilken studie" skal slås av.

Selv når du bruker riktig syntaks i riktig rekkefølge, kan prosessen mislykkes. Enten med feil svar utstedt eller et overraskende resultat. To Google Homes i samme hus kan gi vær for litt forskjellige steder, selv om de har tilgang til samme brukerkontoinformasjon og internettforbindelse.

I eksemplet ovenfor er kommandoen "Angi en timer for en halv time" gitt. Google Home-huben opprettet en tidtaker kalt "Hour" og deretter spurt om hvor lenge timeren skal være. Og likevel å gjenta samme kommando tre andre ganger fungerte riktig og opprettet en 30-minutters timer. Ved å bruke kommandoen "Still inn en timer i 30 minutter" fungerer det på en mer konsekvent måte.

Mens du snakker med et Google-hjem eller ekko, kan det være mer flytende, under hodet fungerer lydassistenter og kommandolinjer på samme måte. Du må kanskje ikke lære et nytt språk, men du må lære en ny dialekt.

Den smale forståelsen av talassistenter vil begrense veksten

Ingen av dette forhindrer at stemmeassistenter som Google Assistant og Alexa fungerer godt nok (selv om Cortana er en annen historie). Google Assistant og Alexa, og søk online på spørsmål, anstendig, men ikke overraskende, Google er bedre på søk, og kan svare på grunnleggende spørsmål som målingskonverteringer og enkel matte. Med et riktig opprettet smart hjemme og velutdannet bruker, vil de fleste smarte hjemmekommandoer fungere som ønsket. Men dette kom gjennom arbeid og krefter, ikke intellektuell forståelse.

Timere og alarmer pleide å være forenklet. Over tid ble navngi lagt til, da evnen til å legge til tid til en timer. De flyttet fra forenklet til mer komplisert. Stemmeassistenter kan svare på flere spørsmål, og hver dag gir nye ferdigheter og funksjoner. Men det er ikke et produkt av selvvekst som kommer fra læring og forståelse.

Og ingen av det gir den iboende evnen til å bruke det som er kjent for å nå det ukjente. For hver kommando og spørsmål som virker, vil det alltid være tre som ikke gjør det. Uten et gjennombrudd i A.I. som gir en menneskelig evne til å forstå, Voice assistants er ikke assistenter i det hele tatt. De er bare talekommandolinjer - nyttige i riktig scenario, men begrenset til de scenariene de har blitt programmert til å forstå.

Med andre ord: maskiner lærer ting, men kan ikke forstå dem.