Hva er forskjellig personvern, og hvordan holder det dataene mine anonym?
Apple stikker sitt rykte på å sikre at dataene det samler inn, forblir private. Hvordan? Ved å bruke noe som heter "Differential Privacy."
Hva er forskjellig personvern?
Apple forklarer det som sådan:
Apple bruker Differensiell personvernsteknologi for å oppdage bruksmønstrene til et stort antall brukere uten at det går ut over personvern. For å skjule en persons identitet legger Differensiell personvern matematisk støy til en liten prøve av individets bruksmønster. Som flere mennesker deler det samme mønsteret, begynner generelle mønstre som kan informere og forbedre brukeropplevelsen.
Filosofien bak Differensiell personvern er dette: En bruker hvis enhet, enten det er iPhone, iPad eller Mac, legger til en beregning til et større basseng av aggregatdata (et stort bilde dannet av varierende mindre bilder), bør ikke avsløres som kilden, enn si hvilke data de bidro med.
Apple er ikke det eneste selskapet som gjør dette, enten - både Google og Microsoft brukte det enda tidligere. Men Apple populariserte det ved å snakke om det i detalj ved sin 2016 WWDC keynote.
Så hvordan er dette forskjellig fra andre anonymiserte data, spør du? Vel, anonymiserte data kan fortsatt brukes til å utlede personlig informasjon hvis du vet nok om en person.
La oss si at hacker kan få tilgang til en anonymisert database som avslører selskapets lønnsliste. La oss si at de også vet at Medarbeider X flytter til et annet område. Hackeren kunne da bare spørre databasen før og etter at Medarbeider X beveger seg og enkelt utlede inntektene.
For å beskytte Employee Xs sensitive informasjon, endrer differensiell personvern dataene med matematisk "støy" og andre teknikker slik at hvis du spørre databasen, vil du bare motta en tilnærming av hvor mye (eller noen andre) Ansatte X ble betalt.
Derfor er hans personvern bevaret på grunn av "forskjellen" mellom dataene og støyen som er lagt til det, så det er så uklart at det er nesten umulig å vite om dataene du ser på, egentlig er et bestemt individ.
Hvordan virker Apples forskjellig personvern?
Differensiell personvern er et relativt nytt konsept, men ideen er at den kan gi et selskap skarp innsikt basert på data fra brukerne, uten å vite hva nøyaktig disse dataene sier eller fra hvem den kommer fra.
Apple, for eksempel, er avhengig av tre komponenter for at den skal ta på seg forskjellig personvern på Mac eller iOS-enheten: hashing, subsampling og støyinjeksjon.
Hashing tar en streng tekst og gjør den til en kortere verdi med en fast lengde og blander disse nøklene opp i irreversibelt tilfeldige strenger med unike tegn eller "hash". Dette skjuler dataene dine, slik at enheten ikke lagrer noe av det i sin opprinnelige form.
Subsampling betyr at i stedet for å samle hvert ord en persontyper, bruker Apple bare en mindre prøve av dem. For eksempel, la oss si at du har en lang tekstsamtale med en venn som liberalt bruker emoji. I stedet for å samle hele samtalen, kan subsampling i stedet bare bruke de delene Apple er interessert i, for eksempel emoji.
Endelig injiserer enheten støy, legger tilfeldige data inn i det opprinnelige datasettet for å gjøre det mer uklart. Dette betyr at Apple får et resultat som har blitt maskert aldri så lett og derfor ikke helt nøyaktig.
Alt dette skjer på enheten din, så det har allerede blitt forkortet, blandet opp, samplet og uskarpt før det til og med sendes til skyen for at Apple skal analysere.
Hvor er Apples forskjellig personvern brukt?
Det er en rekke tilfeller hvor Apple kanskje Ønsker å samle inn data for å forbedre sine programmer og tjenester. Akkurat nå skjønner Apple imidlertid bare forskjellig personvern på fire spesifikke områder.
- Når nok folk erstatter et ord med en bestemt emoji, blir det et forslag for alle.
- Når nye ord legges til nok lokale ordbøker for å bli ansett som vanlig, vil Apple legge den til alle andres ordbøker også.
- Du kan bruke et søkeord i Spotlight, og det vil da gi appforslag og åpne den linken i appen eller la deg installere den fra App Store. For eksempel, si du søker etter "Star Trek", som foreslår IMDB-appen. Jo flere folk åpner eller installerer IMDB-appen, desto mer kommer det til å vises i alles søkeresultater.
- Det vil gi mer nøyaktige resultater for Lookup Hints i Notes. For eksempel, si at du har et notat med ordet "eple" i den. Du gjør et oppslagssøk, og det gir deg resultater ikke bare for ordboksdefinisjonen, men også Apples nettsted, steder i Apple Stores, og så videre. Formentlig, jo flere folk klikker på bestemte resultater, jo høyere og oftere vil de vises i Lookup for alle andre.
La oss bruke emojis som et eksempel. I iOS 10 introduserte Apple en ny emoji-utskiftingsfunksjon på iMessage. Skriv ordet "kjærlighet", og du kan erstatte det med et hjerte-emoji. skriv ordet "hund" og du gjettet det - du kan erstatte det med en hundemoji.
På samme måte er det mulig for iPhone å forutsi hvilken emoji du vil ha slik at hvis du skriver en melding "Jeg skal gå hunden", vil iPhone hjelpe deg med å foreslå hunden emoji.
Så, Apple tar alle de små bitene iMessage-dataene som samles inn, undersøker dem som en helhet, og kan utlede mønstre fra hva folk skriver og i hvilken sammenheng. Dette betyr at iPhone kan gi deg smartere valg fordi det drar nytte av alle disse tekstsamtalene andre skaper og tenker, "dette er trolig den emoji du vil ha."
Det tar en landsby (av Emoji)
Ulempen med forskjellig personvern er at den ikke gir nøyaktige resultater i små prøver. Det er kraft i å lage bestemte data vage, slik at den ikke kan tilskrives noen bruker. For at det skal fungere og fungere godt, må mange brukere delta.
Det er som å se på en bitmapped foto opp ekstremt nært. Du kommer ikke til å kunne se hva det er hvis du ser på bare noen få biter, men når du går tilbake og ser på det hele, blir bildet klarere og mer definert, selv om det ikke er super høyt Vedtak.
For å forbedre emoji-utskifting og forutsigelse må Apple derfor samle iPhone- og Mac-data fra hele verden for å gi det et stadig tydeligere bilde av hva folk gjør og dermed forbedre sine programmer og tjenester. Det blir til alle disse randomiserte, støyende, crowdsourced dataene, og mines det for mønstre, for eksempel hvor mange brukere bruker ferskenemoji i stedet for "rumpa".
Så kraften i Differential Privacy bygger på at Apple er i stand til å undersøke store mengder aggregerte data, samtidig som det sikres at det ikke er noe klokere om hvem som sender dem de dataene.
Hvordan velge bort forskjellig personvern i iOS og macOS
Hvis du fortsatt ikke er overbevist om at Differensiell personvern er riktig for deg, har du lykke til. Du kan velge bort fra enhetens innstillinger.
På din iOS-enhet klikker du Åpne "Innstillinger" og deretter "Personvern".
På skjermbildet Personvern trykker du på "Diagnostikk og bruk".
Til slutt, på skjermbildet Diagnostikk og bruk, trykker du på "Ikke send".
På MacOS åpner du Systemvalg og klikker på "Sikkerhet og personvern".
I sikkerhets- og personvernsinnstillingene klikker du på "Personvern" -fanen og kontrollerer at "Send diagnostisk og brukerdata til Apple" ikke er merket. Merk at du må klikke på låseikonet nederst til venstre og angi systempassordet ditt før du kan gjøre denne endringen.
Tydeligvis er det mye mer å Differensiell privatliv, både i teori og applikasjon, enn denne forenklede forklaringen. Kjøttet og potetene av det stole tungt på noen alvorlig matematikk, og som sådan kan det bli ganske tungt og komplisert.
Forhåpentligvis gir dette deg en ide om hvordan det virker, og at du føler deg tryggere om selskaper som samler inn bestemte data uten frykt for å bli identifisert.