Fredrik, Sindre og Petter dro på AI Summit 2022 i London, en konferanse for å vise fram hva fremtiden innen kunstig intelligens har å by på og stille de viktige spørsmålene for hvordan dette vil påvirke vår hverdag i årene fremover. I to dager med stekende varme stod vi tre (nesten) nybakte Bouvetere og tok innover oss synet av utallige IT-folk, stands og presentasjonsscener alle med en ting på hjernen; AI.
Sindre Aalhus
Fredrik Fidjestøl Mathisen
Konferansen er delt i forskjellige løp med forskjellige fokusområder. Her er det flere presentasjonsløp, bl.a. Helse, Detaljhandel, Etikk, Kvantedatamaskiner. Det er mulig å velge fritt mellom løpene etter hva man ønsket å få med seg.
Kort fortalt:
AI Summit London 2022 var en lærerik opplevelse. Vi fikk se hva framtiden har i vente, og fikk oppleve en av Londons varmeste dager i det som best kan beskrives som et drivhus. Det viktigste vi kan ta med oss er likevel ikke de mange ambisiøse talene som ble holdt, men heller diskusjonene vi hadde med utviklerne som stod på stands i pausene. Her fikk vi snakke mer i dybden om teknologiene og valgene de har tatt under utviklingen av sine produkter. Vi har uten tvil mye å lære fra de mange prosjektene vi fikk høre om, og mange verktøy og tjenester vi ønsker å utforske i fremover. Selv om dette ikke var en konferanse rettet kun mot utviklere, føler vi oss litt klokere enn vi var før vi dro.
Cambridge Consultants - Opening
Tim Ensor fra Cambridge Consultants sparker i gang showet med lovende rapporter og statistikk som varmer ethvert AI frelst data scientists hjerte.
I generelle linjer: dette er et lovende marked i vekst. AIs globalt kommersielle påvirkning er allerede i gang. Per i dag er det etablert 15 internasjonale avtaler verdt over 500 millioner dollar, mengden patenter har overtatt mengden akademiske papirer og vokser med 77% hvert år.
AI har blitt en så stor del av hverdagen og framtidens produkter at moralen og etikken ved disse er blitt et stort fokus med hele 18 nye lover og regelverk i 2021. Tim drar frem 3 områder som har sett betraktelig forbedring de siste årene: Vision models, Generative AI, og Efficient AI. Altså AI modeller som enten kan gi mer verdi eller beskrivelse til ellers kontekstfrie bilder. Generative modeller som skaper sine egne verk og framtidsprediksjoner basert på kjente data, stiler og trender. Og til slutt efficient AI hvor målet er å trene effektive modeller på mindre mer kvalitative data enn tradisjonelle metoder. Derav litt bort fra “Big Data” tankegangen, og mer mot “Great Data”.
Videre er vi vitne til gøyale eksemplarer av generative resultater. Eksempelvis Googles ImageGen evne til å skape et realistisk bilde på grunnlag av en beskrivende tekst. En begrenset versjon av dette kan lekes med her: Imagen: Text-to-Image Diffusion Models (research.google).
Hvor blant annet man kan generere dette aldri før observerte bildet basert på teksten "shibu med solbriller i en rød skjorte på et skateboard ved en strand." Dette er altså en hund som aldri har fantes, men som har blitt mant fram av en AIs “kreativitet”.
McDonalds – Are you inspiring action?
Dette var et av introduksjonsforedragene, holdt av Tarv Nijjar fra McDonalds.
Foredraget handlet lite om teknologien, men mer om hvordan en leder kan og burde både demokratisere og avmystifisere teknologi for å tidlig ta nytte av potensialet teknologien innehar. For å gjøre dette presenterte han et tankesett som en leder burde ha, bestående av fire punkter:
Empati
Kunnskap
Forbedre kunnskapen du samler i alt du gjør. Tradisjonelle kilder til data er gode, men det er viktig å forstå hvor man kan hente data om kunder for å skjønne hva de trenger. Det er mange faktorer som bestemmer hva en kunde velger å kjøpe, men med data kan du forstå og bruke noen av disse faktorene til din fordel. «You must improve your understanding of the past to better understand your future.”
Smidighet
Verdi
Alle punktene over har ingenting å si om du ikke klarer å skape verdi. Det er ikke nok for et merke å lage det beste eller billigste produktet lenger. Man må nå lage en god opplevelse for kunder, for eksempel gjennom restaurantbestilling via apper.
AMD-Xilinx – Shining a light on dark silicon
For AI trenger man komputeringskraft, derfor er selvfølgelig en av verdens største produsenter av mikrochipper AMD til stede. Denne gangen ikke for å snakke om gaming eller monstrøse arbeidsmaskiner, men heller trening av AI modeller og selvfølgelig skryte litt av deres helt egne Supercomputer Frontier. Det vil si verdens raskeste datamaskin.
Utenom det skryter AMD enda litt med at de er den største tilbyderen til Microsoft Azure for CPUer og GPUer. Formaliteter til side, så er de her for å snakke om én ting. Effektiv trening av AI modeller. Ikke med vanlige chipper, men en ny innovasjon med det spenstige navnet Dark Silicon. AI verdenens komplekse nevrale nett går stadig igjennom små forbedringer, og blir mer og mer skreddersydd per domene og problemstilling. Jo flere lag nettet består av, jo mer komplekse konklusjoner kan den gjøre, men vil også kreve betydelig mye mer av hardwaren vi bruker.
Når teknologien er i så store forandringer, hvordan holder AMD tritt? Jo Dark Silicon AI / Adaptable Hardware gir deg nemlig muligheten til å ikke bare skreddersy dine modeller og nevrale nett, men også hvordan din datamaskin regner dette ut. For de ekstra nerdete av oss høres jo dette veldig spennende ut, men kortene ligger fortsatt tett til brystet for AMD. I den forutsigelige framtid er det altså bare å holde seg fast, for dette skal visstnok gå usaklig fort.
NATO – Expediting NATO’s data-driven transformation with responsible use of AI
I dagens krigstid ga NATO oss en påminnelse om hvor mye data verden faktisk består av i dag. Det blir brukt hele tiden i det daglige, fra sosiale media til skattemeldinger og å bestille mat på restauranter.
AI går i dag med stormskritt mot å forbedre disse opplevelsene, men av og til må vi stoppe og tenke oss om før vi tar i bruk slike data. NATO har jobbet i lag med 30 suverene stater for å legge til rette etiske retningslinjer for hvordan utviklingen av AI-, og Data-produkter skal gjøres.
De grunnleggende prinsippene er disse:
NATO mener retningslinjene er på plass på internasjonal basis. Nå gjelder det bare å adoptere det i praksis. Dette kan undersøkes mer på NATOs hjemmesider.
BIOS & Mila – Neural decoding of heart signals with machine learning
Blant løpene på konferansen handlet et av de utelukkende om innovasjon innen helse og omsorg. Her fortalte BIOS & Mila om deres funn ved å lytte til hjernens signaler. Her var det blitt samlet inn data om pasienters hjerte og hjerterytme over flere år, og det ble kartlagt i henhold til eventuelle hjertelidelser eller plager pasienten meldte inn.
Ambisjonen var å se om det er mulig å bruke maskinlæring til å finne mønstre i dataen som kunne hinte til potensielle hjertelidelser nå eller i framtiden hos pasienten. I dag har vi teknologien til å lytte til og skille mellom de forskjellige signalene hjernen sender ut og mottar fra kroppen, og disse kan linkes til andre biometriske målinger for å danne en større forståelse av pasientens helse. En slik test vil ikke være invasiv på noe måte og særdeles enkel å utføre.
Talerne påstår at det eksisterer mønstre som kan si noe om fremtidig sykdomsløp, og at de kan ved hjelp av sin teknologi fortelle om en pasient lider av en hjertesykdom med relativt høy presisjon. Dette bare ved å lytte til hjerte og hjerne. Selvsagt ikke uten feil da det påpekes at slike løsninger er ikke her for å erstatte leger eller spesialister, men å gi dem verktøy til å behandle flere pasienter mer effektivt.
YouView TV Limited – Machine learning for human learning in media tech
Om du har en Sony smart-tv, så har du mest sannsynlig youview. Et brukergrensesnitt som leverer alt av underholdning tilgjengelig for deg på en skjerm. Det vil også forsøke å vise deg mer av det du ønsker å se, og foreslå serier og filmer som likesinnede også liker. Hvordan? Jo, maskinlæring så klart. En personlig anbefaler som stadig vekk forbedres bare du bruker det.
Konseptet er gjerne ikke nytt. Slike løsninger finnes jo i omtrentlig alle underholdningsplattformer vi bruker fritiden vår i; Youtube, Google, Facebook, Twitter, Netflix, etc. Dette er muligens domenet hvor maskinlæringsmodeller har fått sitt tryggeste fotfeste, og YouView tar oss igjennom deres løsninger.
Basert på faktorer som alder, område, kjønn, sivilstatus, bruksmønster og flere andre parametere produserer slike løsninger anbefalinger på hva du skal bli underholdt av i neste omgang. Dette er mindre innovasjon enn det er et fast bruksområde for AI, så om du ønsker å høre mer om dette anbefaler vi å søke opp "AI-Based Recomendation Systems"
Easyjet – The secret to putting AI into production
Easyjet hadde et foredrag hvor de viste til metodikk for å få et prosjekt ut i produksjon. Det var en gjenganger i hele konferansen at moden og god data er et solid grunnlag å bygge et produkt rundt. EasyJet sin melding var «bygg produkter, ikke prototyper».
Når en skal utvikle et produkt må man begynne med problemer innad i bedriften. Etter tider med stagnerende utvikling ga de utviklerne 6 uker på å løse et problem for en annen avdeling, så utviklerne måtte snakke med avdelinger og identifisere reelle problemer brukerne hadde.
Det er kritisk å forstå ditt eget selskap sine behov og bygge et produkt som løser et spesifikt problem. EasyJet bruker en «fail fast» metodikk for å holde en balanse mellom en robust løsning og en rask en.
Panel: 1 in 8 AI succeeds, what does this statistic mean?
Dette var et panel som tok for seg hvorfor så mange AI løsninger blir vraket. Det er ikke en felles faktor på hvorfor noen produkter gjør det bedre enn andre siden hvert produkt er forskjellig, så det er ikke en løsning som virker for alle. AI er et godt verktøy for å løse problemer, men det er manglende infrastruktur i industrien.
Når infrastrukturen rundt AI-baserte løsninger er på plass kommer det til å eksplodere og bli utbredt med en enorm hastighet. AI i dag er et fly, men industrien har enda ikke bygget ferdig flyplassen eller rullebanen.
Det ble her lagt mye trykk på at data dreper modellen. God, og ikke minst korrekt data er en stor faktor i hvor vidt modellen har ben å gå på. Data er bunnen av pyramiden der resten kan bygges oppå. Et siste poeng som ble nevnt er at Proof Of Concept (POC) utvikling bør være så enkelt som mulig, ekstra problemer som skal løses kan bli gjort i sin egen POC. Verdi, fort!
Panel: The landscape of AI in Medical Imaging
Dette var et panel som handlet om bruk og implementasjon av bildegjenkjenning i helsesektoren, spesifikt som et verktøy for radiologer. AI kan brukes som et støttesystem til å ta bedre valg, ved å bruke AI til å se mønstre som mennesker ikke oppdager kan arbeidsflyten til leger forbedres. Mye tid brukes av radiologer til å vurdere røntgenbilder og prioritere pasienter med mer akutte skader.
Bildegjenkjenning kan gjøre den initiale vurderingen og produsere et resultatsett som radiologen må gjøre en grundigere vurdering på. Ett problem med å inkorporere denne teknologien er datasett; det er vanskelig å samle nok data til å trene modeller. Beste datakvalitet finnes i kliniske studier, men antall personer i studiene er lavt. Så en utfordring er å effektivisere modeller til å benytte seg av mindre datasett.
Ett annet interessant poeng fra dette panelet var hvor vidt en pasient ville stolt på teknologien. Vil pasienter finne seg i at de blir prioritert basert på en «robot»? En kunstig intelligens de gjerne ikke har noe forståelse for hvordan fungerer. Det generelle holdningen hos panelet var at pasienten ikke vil bry seg i stor grad. Vi har telefoner vi bruker hver dag som vi ikke nødvendigvis vet hvordan fungerer, men de aksepteres og brukes hver dag. Om en doktor gir deg en pille svelger du den uten å tenke på virkestoffet. Men dette baseres på tillit til legen og systemet de jobber i. AI brukes også som et verktøy av leger, så pasienten vil interagere med legen og ikke teknologien direkte.
Translating AI research and innovation into impact
Colin Murdoch, Chief Business Officer i DeepMind, forteller hvordan de går fra konsept i labben til produkter som har innvirkning på milliarder av mennesker. Murdoch viser frem tre eksempler på prosjekter som nå brukes kommersielt. WaveNet, AlphaFold og MuZero. MuZero er et prosjekt som først ble laget for å lære et nevralt nettverk å spille sjakk og go. DeepMind tenkte at det fantes andre applikasjoner for nettverket og lot det prøve seg på videokompresjon av YouTube videoer der de oppnådde 4.1% bedre kompresjon enn det som blir brukt i dag. WaveNet er en tekst til lyd applikasjon. Applikasjonen tar brukerens input i tekst og genererer output i form av lyd som etterligner menneskelig tale.
Det siste eksempelet som blir presentert er AlphaFold. Her viser Murdoch hvordan programmet kan spå 3D modeller av proteiner på en brøkdel av tiden det har tatt tidligere. Han sier også at dette programmet har bidratt til å akselerere forskning innenfor biologi. For å drive fremgangen innenfor AI på best mulig måte, må den drives ansvarlig. WaveNet trekkes frem som et eksempel her da en slik applikasjon vil hjelpe veldig mange mennesker, men kan også brukes av personer med ondsinnede intensjoner. Det er viktig å se saken fra flere sider og nøye veie opp om fordelen veier opp for ulempene en applikasjon kan ha. Avslutningsvis sier han at AI, i likhet med James Webb teleskopet, vil la oss se lengre inn i fremtiden enn vi har hatt evne til før.
Scaling AI: Harnessing your data for a competitive advantage
Priya Krishnan fra IBM starter med å fortelle om 2020 årene har vært fylt med utfordringer for bedrifter. Enter det er endringer i arbeidsvaner (Covid), governance regler som hele tiden endres eller inflasjon som påvirker utgiftene til bedrifter er dette noe alle har følt på. Med andre ord, det er vanskelig å forvente hva som skal skje videre.
Ved å bruke AI mener hun at vi bedre kan forutse hva fremtiden vil bringe. Det blir poengtert at en AI-modell er bare så god som dataen du mater den med er. For at AI skal fungere i stor skala er det viktig at alle har tilgang til god kvalitetssikret data til enhver tid. Dette er ofte ikke tilfellet til de fleste bedrifter.
I mange bedrifter er data ofte duplisert. Det kan være flere grunner til dette. Enten det er begrensninger på tilgang til data eller lokale regler for lagring av data vil dette føre til at man hele tiden må endre på dataen for å overholde reglene. Dette vil føre til at dataen vil bli ubrukelig etter hvert. For å forhindre dette er det viktig at selskaper oppretter strategier som tar tak i disse problemene tidlig. Man trenger data strategier for å koble de riktige menneskene med riktig type data, MLOps strategier for å sikre robusthet, rettferdighet og evnen til å forklare en modell. Sist, men ikke minst trenger man strategier for prosesser for å vedlikeholde og automatisere AI i stor skala.
Image Recognition using deep neural networks
DeepMind presenterte den nye Visual Language Modellen (VLM) sin, Flamingo. Dette er en maskinlæringsmodell som setter en ny standard for few-shot læring innenfor multimodale oppgaver. Modellens oppgave er å gjenkjenne hva som er på et bilde, og så generere tekst som forklarer hva bildet inneholder.
Denne modellen kommer ferdig trent fra DeepMind, men kan også trenes ekstra med egen data. DeepMind testet Flamingo på 16 forskjellige oppgaver og denne modellen presterte bedre enn modeller som er optimalisert på spesifikke multimodale oppgaver (f. eks event captioning og bildebeskriving for blind). Ved å bruke en oversiktlig interface kan denne modellen enkelt trenes videre av vanlige brukere med egne eksempler også. Hensikten med denne modellen er å kunne hjelpe personer med nedsatt syn å identifisere objekter eller å kunne identifisere støtende innhold på nettet.
Federated Learning: Redefining AI at scale
Walter Riviera fra Intel starter med en kjapp introduksjon av Intel og hvordan selskapet har blitt et selskap sentrert rundt data. Han forteller at med governance reglene som finnes i dag, som GDPR og HIPPA, kan gi problemer når det kommer til deling av data mellom landegrenser. Dette kan fort bety problemer for utvikling av maskinlæringsmodeller innenfor helsevesenet.
Klassisk maskinlæring kan utføres ved at hver samarbeidspartner har sin egen modell, mens data sendes imellom disse partene og modellen trenes individuelt hos hver part. Som tidligere nevnt kan dette by på problemer når data kan inneholde sensitiv informasjon. Federated Learning er et konsept som snur opp ned på klassisk maskinlæring. Der man tidligere har delt data mellom alle involverte interessenter og alle har hver sin modell, vil man nå heller holde data innenfor landegrenser eller selskap og heller sende modellen rundt for å trenes opp på forskjellig type data. Dette vil sikre at partene involvert ikke vil bryte personvernlover ol. Dette vil også kunne hjelpe å bygge en mer robust modell som kan generalisere bedre.
Tar man eksempelet med medisinske bilder så er det ikke en garanti at alle har brukt samme parametere når et bilde er tatt. Ved å mate inn bilder til en modell der f. eks kontraster og frekvenser er forskjellige vil man bruke mer diversifisert data, som igjen vil bygge en mer generell modell. Dette konseptet kommer ikke uten ulemper. Ved å sende en modell rundt er man avhengig av at kanalen modellen sendes gjennom er sikker. Hvis dette ikke er tilfellet kan man ende opp med et “poison attack”, der angriper snapper opp modellen og trener den på “giftig” data som vil ødelegge modellen. Federated Learning løser mange problemer med aksess til data, men det er også viktig å ha sikkerhetsrisikoene dette også introduserer i bakhodet. Enn så lenge er dette et veldig interessant konsept som vi garantert kommer til å høre mer om i fremtiden.