Ihmisen puheääni paljastaa arkaluontoisia tietoja – professori varoittaa riskeistä
Ihmisen äänensävystä voi usein päätellä, onko hän esimerkiksi iloinen, väsynyt tai stressaantunut. Myös tietokoneet pystyvät jo nyt samaan. Tulevaisuudessa ne pystyvät tunnistamaan puheesta vielä huomattavasti enemmän.
Puheteknologiat yleistyvät vauhdilla, ja samalla kasvaa riski siitä, että ääni paljastaa arkaluonteista tietoa terveydestä, taustoista tai mielipiteistä.
Aalto-yliopiston tutkijat kehittävät nyt keinoja mitata ja rajoittaa sitä, mitä kaikkea puheesta voidaan päätellä.
Puhe- ja kieliteknologian professori Tom Bäckström varoittaa, että ääneen koodautunut tieto voi helposti paljastaa paljon enemmän kuin puhuja itse aikookaan.
– Puheeseen sisältyy tietoa esimerkiksi terveydestä, kulttuuritaustasta ja koulutustasosta. Se välittyy puheen mukana, vaikka ihminen itse ei sitä tiedostaisi, Bäckström sanoo tiedotteessa.
Hienovaraiset erot intonaatiossa, puhenopeudessa tai sanavalinnoissa voivat kertoa vaikkapa poliittisesta suuntauksesta, tunnetiloista tai sosiaalisesta taustasta.
Hengitykseen, äänenlaatuun tai puheen rytmiin liittyvät piirteet voivat paljastaa tietoa esimerkiksi sairauksista tai muutoksista terveydentilassa.
Yksi merkittävä riski onkin, että äänitallenteista päätelty terveystieto vaikuttaa jatkossa esimerkiksi vakuutusten saantiin ja hinnoitteluun tai ohjaa lääkkeiden ja hoitojen markkinointia ilman, että ihminen itse on tietoinen tällaisista puheeseen perustuvista päätöksistä.
Työnantajat taas saattavat esimerkiksi poimia äänitallenteista henkilökohtaista tietoa, jota käytetään rekrytoinneissa, työntekijöiden arvioinnissa – jopa heitä vastaan.
Myös entiset kumppanit tai muut ulkopuoliset voisivat hyödyntää puheeseen liittyviä analyysityökaluja vainoamiseen tai häirintään.
Bäckström korostaa näiden lisäksi kuitenkin myös epäsuoran haitan mahdollisuutta.
– Jo se, että ihminen kokee olevansa koko ajan kuunneltavana – tai pelko jatkuvasta tarkkailusta – on itsessään psykologisesti vahingollista, hän sanoo.
Bäckströmin mukaan teknologia, jolla kaikkea tätä puheeseen ja ääneen koodautunutta tietoa voitaisiin kattavasti ja luotettavasti hyödyntää, ei ole ”ihan vielä valmista”.
Tutkijat pyrkivät kuitenkin kehittämään suojakeinoja jo nyt, ennen kuin ongelma kasvaa liian suureksi ja käytännöt ehtivät vakiintua. Yksi keskeinen haaste on ollut, ettei puheen sisältämän informaation määrää ole aiemmin osattu mitata kunnolla.
– On vaikea suojella jotain, jos ei tiedä, mitä on suojelemassa. Mittaaminen onkin ensimmäinen askel kohti toimivaa yksityisyyden suojaa, Bäckström sanoo.
Tähän tarpeeseen hänen tutkimusryhmänsä on nyt kehittänyt mittarin, joka arvioi, kuinka tarkasti puhujan identiteetti voidaan rajata äänitallenteen perusteella. Uusi lähestymistapa kuvaa puhetallenteen sisältämän informaation kokonaismäärää.
Mittareiden avulla voidaan myös kehittää konkreettisia suojakeinoja. Väärinkäytösten ehkäiseminen edellyttää, että välitetään vain palvelun kannalta välttämätön tieto, ja että se toimitetaan turvallisesti oikealle vastaanottajalle.