Avancerad nivå
- CD122A Databaser (7,5 hp)
- CD631E Artificiell intelligens för data science (15 hp)
- CM661ESonderande dataanalys, visualisering och berättande (7,5 hp)
CTDVA Datavetenskap
A1F / Avancerad nivå, har kurs/er på avancerad nivå som förkunskapskrav
Kursen ingår i examensfordringarna för Civilingenjörsexamen Datateknik (specialisering Tillämpad data science).
Denna kurs syftar till att studenten utvecklar en fördjupad förståelse för storskalig dataanalys med molnbaserade datorinfrastrukturer, och hur programvara tillgängliggörs i molntjänster. Vidare utvecklar studenten i grupprojekt sin förmåga att hantera storskalig databehandling med hjälp av verktyg som t.ex. Apache Spark.
Kursen innehåller följande moment:
- Ekosystem för storskalig databehandling
- Storskalig datalagring (inklusive molnbaserade filsystem, molnbaserad objektlagring och arkivlagring)
- Dataanalys med Apache Spark
- Sparks programmeringsmodell med RDD
- Sparkapplikationer med Hadoop/AWS
- Spark SQL
- Alternativ till SQL-baserade databaser för storskaliga data
- Strömning med Spark
- Maskininlärning med Spark MLlib
- Avancerade Sparkapplikationer hämtade från verkliga fall
Kunskap och förståelse
Efter avslutad kurs skall studenten kunna:
1. skriftligen visa fördjupad förståelse för dataflödesprogrammeringsmodellen för distribuerade beräkningar i storskaliga tillämpningar,
2. förklara skillnaderna mellan traditionella och storskaliga datahanteringssystem, och
3. redogöra för komponenter och programmeringsmodeller som används i uppbyggnad av storskaliga dataanalyssystem.
Färdighet och förmåga
Efter avslutad kurs skall studenten kunna:
4. använda molnbaserade plattformar och implementera tekniker för storskalig datahantering,
5. analysera storskaliga datahanteringsproblem och konstruera datadrivna modeller,
6. integrera tränade modeller med molnbaserade tjänster,
7. utveckla tillämpning av storskalig dataanalys genom att arbeta i grupp, och
8. muntligt och skriftligt presentera arbeten inom storskalig dataanalys med molnbaserad datorinfrastruktur.
Värderingsförmåga och förhållningssätt
Efter avslutad kurs skall studenten kunna:
9. bedöma storskaliga dataramverks utmärkande egenskaper och avgöra när sådana ramverk är tillämpliga eller ej.
Föreläsningar, datorlaborationer, seminarier, projektarbete och självstudier.
För godkänt betyg krävs:
- godkänd rapport och muntlig presentation i grupprojekt (7 hp, UG) (Lärandemål 4-9)
- godkända laborationsuppgifter (3 hp, UG) (Lärandemål 4, 6)
- godkänd skriftlig tentamen (5 hp, UA) (Lärandemål 1-3, 9)
För samtliga bedömningar ska underlaget vara sådant att individuella prestationer kan särskiljas.
Slutbetyget motsvaras av betyget på den skriftliga tentamen.
- Amirgodshi, S., Rajendran, M., Hall, B. & Mei, S. (2017). Mastering Machine Learning with Apache Spark 2.x. Packt Publishing.
- Teller, A., Pumperla, M. & Malohlava, M. (2015). Advanced Analytics with Spark: Patterns for Learning from Data at Scale. O’Reilly
- Utöver ovanstående litteratur tillkommer en samling vetenskapliga artiklar.
Malmö universitet ger studenter som deltar i eller har avslutat en kurs en möjlighet att framföra sina erfarenheter av och synpunkter på kursen genom en kursvärdering som anordnas av lärosätet. Universitetet sammanställer kursvärderingarna samt informerar om resultaten och eventuella beslut om åtgärder som föranleds av kursvärderingarna. Resultaten ska hållas tillgängliga för studenterna. (HF 1:14).
Om en kurs har upphört att ges eller har genomgått större förändringar ska studenterna, under ett år efter det att förändringen har skett, erbjudas två tillfällen för omprov baserade på den kursplan som gällde vid registreringen.
Om en student har beslut om riktat pedagogiskt stöd, har examinator rätt att ge ett anpassat prov eller låta studenten genomföra prov på ett alternativt sätt.