Säkerhetsrisk

Röstassistenter kan hackas med ultraljud

Forskare på universitetet i Zheijiang har hittat sätt att skicka dolda röstkommandon till digitala röstassistenter som Siri, Cortana och Alexa.

Publicerad Senast uppdaterad

Det forskarna gjort är att spela in mänskliga röstkommandon, för att sedan föra över dem till frekvenser över 20 kilohertz, det vill säga över hörbart mänskligt ljud. Det visade sig att röstassistenterna inte hade några problem att uppfatta röstkommandona och agera på dem, trots att de inte går att uppfatta med mänskliga örat.

Forskarna testade vad de kallade delfinattacker med ett antal olika röstkommandon på 16 olika prylar och sju olika röststyrningstjänster, och det fungerade överlag utmärkt att utföra röstkommandon utan att det hördes att instruktionerna givits. Bland de kommandon som utfördes fanns att öppna en specifik webbsajt, att ringa ett nummer, att öppna dörren till ett smart lås, och att ändra navigationsmålet i en bilnavigator. Alla skulle potentiellt kunna utnyttjas för att stjäla information eller egendom.

Delfinattacker är förstås svåra att utföra i praktiken. Den som utför den måste vara inom två meter från apparaten, och röstassistenten ger oftast ljudfeedback på att den utför instruktionen. Dessutom måste den vara aktiv till att börja med. Men i bullriga offentliga miljöer känns det inte som ett orealistiskt scenario att gå hem med det, och just säkerheten är ett verkligt problem när du förväntas kunna göra allt möjligt bara genom att ropa på en pryl utan att ens behöva röra vid den, som det känns som tjänsteutvecklarna inte alltid lagt någon större vikt vid.

Man kan fråga sig varför röstassistenterna svarar på icke-mänskliga röster till att börja med. Enligt en intervjuad industridesigner hjälper de högre frekvenserna till att göra röstförståelsen bättre. Vissa tjänster, som Chromecast, använder också ibland ultraljud för hopparning.

Forskarnas rekommendation till tjänsteutvecklarna är att antingn göra så att mikrofonerna inte registrerar ljud över 20 kHz, eller åtminstone inte agerar på röstkommandon över dessa frekvenser.

Källa