Kursplan
Kursplan hösten 2026
Benämning
Engelsk benämning
Kurskod
Omfattning
Betygsskala
Undervisningsspråk
Beslutande instans
Gäller från
Inrättandedatum
Fastställandedatum
Utbildningsnivå
Avancerad nivå
Behörighetskrav
- Kandidat- eller ingenjörsexamen (minst 180hp, inom datavetenskap eller närliggande ämnen såsom matematik, informatik, telekommunikation, elektroteknik, fysik.
- Minst 15 högskolepoäng i programmering.
- Minst 7.5 högskolepoäng i matematik.
- Kunskaper motsvarande engelska 6 på svensk gymnasienivå.
- Godkänd kurs Artificiell intelligens för data science (DA631E)
Huvudområde
CTDVA / Datavetenskap
Fördjupningsnivå
A1F / Avancerad nivå, har kurs/er på avancerad nivå som förkunskapskrav
Fördjupningsnivå i förhållande till examensfordringarna
Kursen ingår i programmet Datavetenskap: Tillämpad data science, masterprogram, och kan ingå i Masterexamen i datavetenskap (120 hp).
Innehåll
Kursen innehåller följande moment:
- Ekosystem för storskalig databehandling
- Storskalig datalagring (inklusive molnbaserade filesystem, molnbaserad objektlagring och arkivlagring)
- Dataanalys med Apache Spark
- Sparks programmeringsmodell med RDD
- Sparkapplikationer med Hadoop/AWS
- Spark SQL
- Alternativ till SQL-baserade databaser för storskaliga data
- Strömning med Spark
- Maskininlärning med Spark MLlib
- Avancerade Sparkapplikationer hämtade från verkliga fall
Lärandemål
Kunskap och förståelse
För godkänd kurs ska studenten kunna:
- Visa fördjupad förståelse för dataflödesprogrammeringsmodellen för distribuerade beräkningar i storskaliga tillämpningar.
- Skilja mellan traditionella och storskaliga databashanteringssystem
- Utifrån analys av storskaliga datahanteringsproblem och konstruera datadrivna modeller, baserade på fria ramverk
- Redogöra för komponenter och programmeringsmodeller som används i uppbyggnad av storskaliga dataanalyssystem
Färdighet och förmåga
För godkänd kurs ska studenten kunna:
- Använda molnbaserade plattformar och implementera tekniker för storskalig datahantering
- Analysera storskaliga datahanteringsproblem och konstruera datadrivna modeller, baserade på fria ramverk
- Integrera tränade modeller med molnbaserade tjänster
- Muntligt och skriftligt presentera arbeten inom storskalig dataanalys mned molnbaserad datorinfrastruktur
Värderingsförmåga och förhållningssätt
För godkänd kurs ska studenten kunna:
- Bedöma storskaliga dataramverks utmärkande egenskaper och avgöra när sådana ramverk är tillämpliga eller ej
Arbetsformer
Föreläsningar, datorlaborationer, seminarier, projektarbete
Bedömningsformer
Krav för godkänd, kursen bedöms genom:
- Rapport och muntlig presentation i grupprojekt (7 hp, UG),
- Laborationsuppgifter (3 hp, UG) och
- Skriftlig tentamen (5 hp, UA).
För godkänd A-E krävs att alla moment genomförts och blivit godkända.
Slutbetyg baseras på skriftlig tentamen.
Kurslitteratur
-
- Teller, M. Pumperla, M. Malohlava (2015). Advanced Analytics with Spark: Patterns For Learning From Data at Scale. O’Reilly
-
- Amirgodshi, M. Rajendran, B. Hall, S. Mei (2017), Mastering Machine Learning with Apache Spark 2.x. Packt Publishing
- Utöver ovanstående litteratur tillkommer en samling vetenskapliga artiklar.
Kursvärdering
Högskolan ger studenter som deltar i eller har avslutat en kurs en möjlighet att framföra sina erfarenheter av och synpunkter på kursen genom en kursvärdering som anordnas av högskolan. Högskolan sammanställer kursvärderingarna samt informerar om resultaten och eventuella beslut om åtgärder som föranleds av kursvärderingarna. Resultaten ska hållas tillgängliga för studenterna. (HF 1:14).
Övergångsbestämmelser
Om en kurs inte längre ges eller har genomgått större förändringar ska studenterna, under ett år efter det att förändringen skett, erbjudas två tillfällen för omprov baserade på den kursplan som gällde vid registreringen.
Övrigt
Om en student har beslut om riktat pedagogiskt stöd, har examinator rätt att ge ett anpassat prov eller låta studenten genomföra prov på ett alternativt sätt.