Datateknik AV, Datamining och maskininlärning, 6 hp
Observera att litteraturen i kursplanen kan ändras/revideras fram till:
• 1 juni för en kurs som startar på höstterminen
• 15 november för en kurs som startar på vårterminen
• 1 april för en kurs som startar på sommaren
Skriv ut eller spara kursplanen som PDF
Du kan enkelt skriva ut en kursplan direkt från webbsidan. Använd kortkommandot ctrl+p (Windows) eller command+p (Mac). I nästa steg väljer du om du vill skriva ut eller spara kursplanen som PDF.
För en nedlagd kurs kan eventuell information om avvecklingsperiod hittas under rubriken "Övergångsregel" i senaste versionen av kursplanen.
Kursplan för:
Datateknik AV, Datamining och maskininlärning, 6 hp
Computer Engineering MA, Datamining and Machine Learning, 6 credits
Allmänna data om kursen
- Kurskod: DT085A
- Ämne huvudområde: Datateknik
- Nivå: Avancerad nivå
- Högskolepoäng: 6
- Fördjupning vs. Examen: A1N - Avancerad nivå, har endast kurs/er på grundnivå som förkunskapskrav
- Utbildningsområde: Tekniska området 100%
- Ansvarig institution: Data- och elektroteknik
- Fastställd: 2024-10-15
- Giltig fr.o.m: 2025-01-20
Syfte
Studenten ska utveckla en grundläggande förståelse för aktuella maskininlärningsmetoder för informationsutvinning (datamining) ur stora mängder data. Studenten ska utveckla färdigheter i att hitta intressanta mönster och bygga prediktionsmodeller genom explorativ dataanalys med hjälp av dataanalysverktyg baserade på R eller Python och kunna förbereda data, tolka resultat och kritiskt utvärdera resultat. Studenten ska visa förmåga att tillämpa kunskaperna i ett verkligt projekt inom områden såsom big data-visualisering, affärsdata för omvärldsanalys, beslutsstödssystem, dataanalys av text, webbsidor, sensor-/positionsdata, kontextmedvetna applikationer, intelligenta agenter eller kognitiv radio.
Lärandemål
Efter avslutad kurs ska studenten kunna:
• Diskutera vilka verkliga tillämpningar av datamining som är realistiska och etiska
• Utvinna information med hjälp av ett verktyg som till exempel skriptspråket R, Python-biblioteken Orange eller SciKit Learn eller egna implementationer av algoritmer
• Förbereda data, tolka data och utvärdera resultat
• Identifiera variabler av betydelse i en multivariat datauppsättning
• Utvinna associationsregler och utvärdera deras reliabilitet
• Utveckla och validera prediktionsmodeller
• Följa en standardiserad arbetsprocess för tillförlitlig problemanalys, modellering och utvärdering
• Tillämpa datamining-tekniker på ett litet problem från verkliga livet
Innehåll
• Användningsområden för data mining
• Data och kunskapsrepresentation (relationer, attribut, glesa matriser, tabeller, beslutsträd, regler)
• Bayesiansk statistik
• Associativa och sekventiella mönster
• Grundläggande algoritmer
• Dataklustring
• Datakategorisering
• Datarengöring
• Datavisualisering
• Associationsregler
• Dataprediktering
• Laborationer på verktyget R och/eller Python
• Projekt
Behörighet
120 hp avslutade kurser, inkluderande följande:
Datateknik GR (AB), innefattande Databaser, modellering och implementering, 6 hp och en programmeringskurs, 6 hp.
Matematik GR (A), 30 hp, innefattande Matematisk statistik, 6 hp.
Urvalsregler
Urval sker i enlighet med Högskoleförordningen och den lokala antagningsordningen.
Undervisning
Kursen kan komma att erbjudas som campuskurs eller som webbaserad distanskurs. Studieinsatsen uppskattas till cirka 160 timmar.
Examination
L101: Laboratorieövning, 1 hp
Betygsskala: Tvågradig skala
P101: Projektpresentation, 2 hp
Betygsskala: Tvågradig skala
T101: Examen, 3 hp
Betygsskala: Sju-gradig skala, A-F o Fx
Slutbetyget baseras på en sammanvägning av tentamens- och projektresultat.
Länk till betygskriterier: https://www.miun.se/betygskriterier.
Om en student har ett besked från samordnaren vid Mittuniversitetet om pedagogiskt stöd vid funktionsnedsättning, har examinator rätt att ge anpassad examination för studenten.
Om tentamen på campus inte får genomföras enligt besked från rektor, eller den denne delegerat rätten till, gäller följande: Tentamen T101, kommer att ersättas med två delar, webbexamination och uppföljning. Inom tre veckor efter webbexaminationen kommer ett urval av studenterna att kontaktas och få svara på frågor angående genomfört prov. Uppföljningen består av frågor om genomförandet av webbexaminationen och de svar som studenten skickat in.
Begränsning av examination
Studenter registrerade på denna version av kursplan har rätt att examineras 3 gånger inom loppet av 1 år enligt angivna examinationsformer. Därefter gäller examinationsform enligt senast gällande version av kursplan.
Betygsskala
Sju-gradig skala, A-F o Fx
Litteratur
Obligatorisk litteratur
**Författare/red:**Witten, Frank, Hall
**Titel:**Datamining - Pratical Machine Learning Tolls and Techinques
**Upplaga:**Third edition 2011 or later
**Förlag:**Elsivier
Referenslitteratur
**Författare/red:**Ganguly et al
**Titel:**Knowledge discovery from sensor data
**Upplaga:**2009 or later