Store språkmodeller (Large Language Models - LLMs), som ChatGPT er basert på, har vist til imponerende resultater over det siste året.
Det er også tilfelle innenfor cybersikkerhet, hvor både Microsoft (Security co-pilot) og Google (Sec-Palm) nå jobber med løsninger som bruker slike teknologi. Disse modellene er (ofte) trent på "vanlige" språk som engelsk og norsk. For å kunne detektere cyberangrep bruker man ofte logger fra monitorering av systemer og nettverk. En utfordring er å hente ut de riktige egenskapene fra slike logger når man utvikler nye deteksjonskapabiliteter. Målet med denne oppgaven er å utforske og trene LLM-modell(er) på loggdata (istedenfor språk) for bruk til slik deteksjon.
Oppgaven kan gjøres i samarbeid med Forsvarets forkningsinstitutt som i så fall betyr at studenten må kunne sikkerhetsklareres (Nivå konfidensielt; merk at det ikke er noe krav på at studenten allerede har klarering, men må kunne bli klarert)