Emne - Multivariat dataanalyse og maskinlæring - TTK4260
TTK4260 - Multivariat dataanalyse og maskinlæring
Om emnet
Vurderingsordning
Vurderingsordning: Skriftlig skoleeksamen
Karakter: Bokstavkarakterer
Vurdering | Vekting | Varighet | Delkarakter | Hjelpemidler |
---|---|---|---|---|
Skriftlig skoleeksamen | 100/100 | 4 timer | D |
Faglig innhold
Detaljerte beskrivelser av dataanalytiske metoder som er viktige for kybernetikere (se læringsutbytte nedenfor). Oversikt og hands-on demonstrasjon av metoder for maskinlæring/AI. Diskusjoner om hvordan man strukturerer data, hvordan man tolker dataene og resultatene, og hvordan man velger metoder gitt de underliggende problemstillingene.
Kurset vil ha to distinkte "arbeidsmoduser": En der algoritmene vil bli beskrevet i detaljer, og en der algoritmene blir demonstrert. Den første delen omhandler generelle metoder som kybernetikere bør ha kjennskap til. Det andre omhandler også et utvidet utvalg av metoder, og gir en oversikt over mulighetene som tilbys, f.eks. hvordan de kan benyttes i Python Notebooks.
Læringsutbytte
Tiltenkt læringsutbytte
Repetisjon av statistisk terminologi og estimeringsteori:
- motivasjon og filosofi i multivariat modellering - oversikt over metoder for dataanalyse
- validering av modeller - minste kvadraters metode - maximum likelihood
- statistiske kriterier for evaluering av modellresultater - over- og undertilpasning i modellering (bias vs. Variance)
* Detaljert analyse av følgende algoritmer / problemer: - PCA, ICA, PCR, PLS, multiblock og PARAFAC - metoder for detektering av outliers - tidsserie modellering og prediksjon - system identifikasjon - valg av modellers kompleksitet
- planlegging av eksperimenter (Design of Experiments) * Oversikt og demonstrasjon av strategier for: - modellering av tidsavhengige prosesser - subspace identification - nevrale nettverk - random forests - support vector machines - t-SNE - andre metoder for clustering (KNN m.m.) - andre klassifiseringsmetoder
Ikke-kognitive læringsresultater: - forstå filosofiene, styrken og begrensningene ved de forskjellige metodene - forstå betydningen av dataenes kvalitet og struktur for tolkningen av dataene - ble kjent med strategier for dataanalyse; fra forsøksplanlegging til konklusjon - bli uavhengig, selvsikker og kritisk når det gjelder dataanalyse
[1] K. Poynton, Cognitive and non-cognitive learning factors, http://cim.acs-schools.com/wp-content/uploads/2015/08/Cognitive-and-non-cognitive-learning-factors.pdf
Læringsformer og aktiviteter
- forelesninger (tradisjonelt og "flipped classroom") - peer instruction sessions - interaktiv hands-on dataanalyse - prosjektarbeid på utvalgte datasett
Obligatoriske aktiviteter
- Obligatorisk øving
Mer om vurdering
Vurdering blir gjort på basis av skriftlig digital eksamen. Ved utsatt eksamen (kontinuasjonseksamen) kan digital eksamen bli endret til muntlig eksamen. Dersom studenten også etter utsatt eksamen har sluttkarakteren F/ikke bestått, må studenten gjenta hele emnet neste studieår.
Anbefalte forkunnskaper
Grunnleggende kunnskap om sannsynlighetsteori, lineære systemer og ordinære differensialligninger.
Forkunnskapskrav
God forståelse av grunnleggende lineær algebra.
Kursmateriell
Kursmateriell vil bli avklart i begynnelsen av semesteret
Versjon: 1
Studiepoeng:
7.5 SP
Studienivå: Høyere grads nivå
Termin nr.: 1
Undervises: VÅR 2025
Undervisningsspråk: Engelsk
Sted: Trondheim
- Kjemometri
- Signalbehandling
- Statistisk forsøksplanlegging
- Teknisk kybernetikk
Eksamensinfo
Vurderingsordning: Skriftlig skoleeksamen
- Termin Statuskode Vurdering Vekting Hjelpemidler Dato Tid Eksamens- system Rom *
- Vår ORD Skriftlig skoleeksamen 100/100 D INSPERA
-
Rom Bygning Antall kandidater - Sommer UTS Skriftlig skoleeksamen 100/100 D INSPERA
-
Rom Bygning Antall kandidater
- * Skriftlig eksamen plasseres på rom 3 dager før eksamensdato. Hvis mer enn ett rom er oppgitt, finner du ditt rom på Studentweb.
For mer info om oppmelding til og gjennomføring av eksamen, se "Innsida - Eksamen"