LLM for loggdata

Store språkmodeller (Large Language Models - LLMs), som ChatGPT er basert på, har vist til imponerende resultater over det siste året.

Det er også tilfelle innenfor cybersikkerhet, hvor både Microsoft (Security co-pilot) og Google (Sec-Palm) nå jobber med løsninger som bruker slike teknologi. Disse modellene er (ofte) trent på "vanlige" språk som engelsk og norsk. For å kunne detektere cyberangrep bruker man ofte logger fra monitorering av systemer og nettverk. En utfordring er å hente ut de riktige egenskapene fra slike logger når man utvikler nye deteksjonskapabiliteter. Målet med denne oppgaven er å utforske og trene LLM-modell(er) på loggdata (istedenfor språk) for bruk til slik deteksjon.

Oppgaven kan gjøres i samarbeid med Forsvarets forkningsinstitutt som i så fall betyr at studenten må kunne sikkerhetsklareres (Nivå konfidensielt; merk at det ikke er noe krav på at studenten allerede har klarering, men må kunne bli klarert)

Emneord: AI, ML, LLM, sikkerhet, trusseldeteksjon

Publisert 8. okt. 2023 13:08 - Sist endret 8. okt. 2023 13:08

Veileder(e)

Gudmund Grov Universitetet i Oslo

LLM for loggdata

Veileder(e)

Omfang (studiepoeng)