7/19/2018

Episode 132 - Krigen mellom den gode og onde maskinlæringen

Teknisk sett-podcasten diskuterer maskinlæring i datasikkerhet. De snakker om hvordan Google og Siri bruker maskinlæring for å forstå norsk språk og hvordan dette kan brukes til å identifisere trusler. De diskuterer også den økende bruken av maskinlæring i selvkjørende biler og i å bekjempe overgrep og mobbing. De understreker at maskinlæring både kan være et verktøy for å beskytte og et verktøy for å angripe, og at det er viktig å være klar over de potensielle farene og fordelene.

00:00

I denne episoden diskuteres maskinlæring og datasikkerhet, samt hvordan teknologi påvirker vår personlige informasjon og adferd.

14:07

Norge opplever naivitet i tillit til digitale tjenester, som kan føre til svake sikkerhetsløsninger mot avanserte cybertrusler.

Velkommen til Teknisk Sett,

Transkript

Velkommen til Teknisk Sett, en podcast fra TU. Jeg sitter her som sett vanlig med Odd-Rikard. Hei Jan, som sett vanlig. Mitt navn er Jan Moberg og jeg er sjef her i TU. Odd-Rikard, i dag skal vi rett og slett snakke litt om maskinlæring og datasikkerhet. Ja, det skal vi. Og...

24.920 s
00:00:00

Det jeg har lagt merke til er at innfallsvinkelen er at du søker veldig mye. Du snakker inn i telefonen i stedet for å taste søk. Ja, taster på en mobiltelefon synes jeg er litt kvekkete. Google har blitt utrolig flinke til å skjønne

15.980 s
00:00:25

tale på norsk. Det slår nesten av deg feil når du skal til en adresse, når du skal stille et spørsmål, så stiller jeg spørsmålet på norsk i telefonen og så smakser det deg. Men når du står her ute og sier til Google

13.360 s
00:00:41

Google hjelp, jeg har vært den dummeste sjefen, hva kan jeg gjøre? Jeg hører jo det, ikke sant? Du må jo ha litt herskel. Er det noen grunn til å begrense det da? Men det som er interessant her er jo at du lærer opp Google. Det gjør jeg. Og Siri for den saks skyld. Ja. Men vil Siri og Google lære om deg?

22.080 s
00:00:55

Selvfølgelig. Jeg er sikker på at min digitale tvilling, for å bruke det begrepet, ligger i flere varianter ute på nettet, og vet mer om meg enn jeg på mange områder. Kan analysere deg, men bedre presist enn du selv kan. Og da ikke som identitet, men som adferd. Ja.

19.980 s
00:01:17

For å snakke litt om dette så har vi med oss en gjest som har vært her tidligere, nemlig Kristian Sandberg. Velkommen. Takk for det. Du er leder for ekspertteam i Europa faktisk i Checkpoint Software Technologies.

13.420 s
00:01:38

Er vi inne på noe her? Ja, absolutt. Maskinlæring er noe som er veldig hot, et buzzword som brukes i mange bransjer, også i sikkerhetsbransjen, og som som

15.920 s
00:01:51

For Google og for Apple som bruker sine tjenester, så bruker vi også det til å prøve å avgjøre om noe er en trussel eller om det ikke er det. For oss er det kanskje litt større utfordring hvis vi tar feil.

15.640 s
00:02:08

Ja. En det for eksempel er om Siri ringer feil person. Ja. Når vi tar en avgjørelse, så kan det da for eksempel enten da stoppe et angrep som er et angrep, eller stoppe noe som ikke er et angrep og hindre noe som kanskje burde vært sluppet gjennom. For eksempel et rønkenbilde til en person som må

23.720 s
00:02:24

som krever veldig rask behandling etter en annen sted. Vi beveger oss nå i grensesnittet mellom det og at maskinlæring blir et hjelpemiddel til å lære en trussel. Korrekt. Er det noen grunn til at Odd Rikard skal slutte å snakke til Google for å få søke resultatene sine? Nei, altså...

24.540 s
00:02:48

Det er en personlig ting, egentlig. Det er den siden av det. På den andre siden er det jo veldig bra at vi lærer opp datamaskinen mye mer for å kunne hjelpe oss når vi trenger hjelp. Google vil jo få spørsmålet skriftlig som alternativ. Så Google vil jo få de dataene. Men samtidig er jeg jo bidratt til å lære Google norsk.

20.460 s
00:03:13

Hvor mange år har vi ikke holdt på for å få norsk språkteknologi, og så har Google bare fiksa det med maskinlæring? Det er jo også en forskjell på muntlig uttrykning, altså måten du stiller spørsmål på. Antagelig gjør du det oftere. Men har vi noen grunn til å tro at Google sier i kartlegger og drikkart? Selvfølgelig gjør de det. Det vil nesten være dumme hvis de ikke gjorde det.

30.160 s
00:03:34

De gir deg en tjeneste som i utgangspunktet virker gratis, men den er jo ikke det. De har sine utgifter med å gjøre dette her. Det koster ganske mye penger å behandle disse dataene og har andre måter av å få dekket det på og bruke de dataene senere.

15.600 s
00:04:04

på en måte for deg og mot deg. Og det som er viktig for maskinlæring er jo å ha størst mulig datagrunnlag til å trene algoritmene og datamaskinene med, for da blir de mer og mer og mer nøyaktige. Derfor er det også viktig at vi bidrar og leverer data inn til løsningene. Ja, og det her blir jo mer og mer liv og død når vi snakker om selvkjørende biler. For det er jo helt avhengig av maskinlæring. Helt riktig. Så det blir...

25.680 s
00:04:21

Det blir litt på en måte som for oss i sikkerhetsbransjen, at da blir konsekvensene mye større hvis man tar feil, hvis algoritmen ikke er godt nok trent. Kjører du på en vei som mange andre har kjørt på, og du har fått mye data i algoritmen og lært opp bilen eller maskinene til å håndtere de situasjonene som måtte være der og som måtte dukke opp, så er du sikkerere. Kjører du på en vei som veldig få har kjørt på,

24.660 s
00:04:46

kanskje den har blitt endret, som ikke da maskinen har fått med seg, så er det mye vanskeligere å håndtere de situasjonene som er ukjente. Og samme måte er det innenfor sikkerhetsbransjen når vi bruker maskinlæring. Vi lærer algoritmene med maskinlæring,

17.700 s
00:05:11

Ting vi vet er bra, ting vi vet er dårlige, og da skal vi lære systemen å se forskjell, og så har vi en gråsone i midten som ofte er ganske vanskelig å håndtere. Jo mer data vi har om hva som er bra og hva som er dårlig, jo lettere er det å få våre algoritmer til å ta mindre feil. Men du jobber jo i et system som regner med å bli hyret inn av store organisasjoner for å hindre oss av data innbryd. Det vil jo være ganske...

29.000 s
00:05:29

om den selvkjørende flåten til Tesla for eksempel etter hvert ble hijacket av inntrengere som tok kontroll over bilen eller tuklet med dataene. Helt riktig. Og de blir jo enda mer sårbare noen gang da. Ja, og man bruker faktisk da maskinlæring for å forhindre det og for å beskytte da de datene som da igjen brukes til maskinlæring. Så maskinlæringen er både i sikkerhetens tjeneste og trussel. Helt riktig. Ja.

24.020 s
00:05:58

Det kan også brukes av de som lager truslene. Hvis man utvikler metoder for å skjønne hvordan trusler gjøres i dag, så kan man prøve å finne måter å lage nye trusler på som ikke matcher de måtene man kjenner til i dag. Da trener maskinene sine til å lage nye trusler som ikke

24.400 s
00:06:22

Nævnt i episoden

Google 

En søkemotor og teknologiselskap som bruker maskinlæring for å forstå norsk språk og andre formål.

Siri 

En digital assistent fra Apple som bruker maskinlæring for å forstå norsk språk.

Checkpoint Software Technologies 

Et selskap som bruker maskinlæring for å identifisere og bekjempe datasikkerhetstrusler.

Maskinlæring 

En type kunstig intelligens som bruker datamaskiner til å lære uten å være eksplisitt programmert.

Selvkjørende biler 

Biler som bruker maskinlæring til å navigere og styre uten menneskelig innblanding.

DEFKON 

En konferanse i Las Vegas der datamaskiner konkurrerer i datasikkerhetsutfordringer.

Boston Dynamics 

Et selskap som utvikler roboter, spesielt for militær bruk.

GDPR 

EUs generelle databeskyttelsesforordning, som gir individer mer kontroll over sine data.

Silicon Valley 

Et område i California kjent for sin teknologiindustri.

Kredittkort 

Et betalingskort som brukes til å gjøre kjøp.

Tyskland 

Et europeisk land der digitale betalingsmetoder kan være mindre utbredt enn i Norge.

Russland 

Et land der en nordmann ble fengslet for spionasje.

Tesla 

Et selskap som produserer elektriske biler, inkludert selvkjørende biler.

Datagisler 

Data som holdes som gisler for å kreve løsepenger.

Skytjenester 

Datatjenester som leveres over internett.

TU 

Teknisk Ukeblad, en norsk teknologi- og næringslivsavis.

Deltagere

Host

Jan Moberg

Host

Odd-Rikard

Guest

Kristian Sandberg

Lignende

Loader