course-details-portlet

TTK4260

Multivariat dataanalyse og maskinlæring

Velg studieår
Studiepoeng 7,5
Nivå Høyere grads nivå
Undervisningsstart Vår 2025
Varighet 1 semester
Undervisningsspråk Engelsk
Sted Trondheim
Vurderingsordning Skriftlig skoleeksamen

Om

Om emnet

Faglig innhold

Detaljerte beskrivelser av dataanalytiske metoder som er viktige for kybernetikere (se læringsutbytte nedenfor). Oversikt og hands-on demonstrasjon av metoder for maskinlæring/AI. Diskusjoner om hvordan man strukturerer data, hvordan man tolker dataene og resultatene, og hvordan man velger metoder gitt de underliggende problemstillingene.

Kurset vil ha to distinkte "arbeidsmoduser": En der algoritmene vil bli beskrevet i detaljer, og en der algoritmene blir demonstrert. Den første delen omhandler generelle metoder som kybernetikere bør ha kjennskap til. Det andre omhandler også et utvidet utvalg av metoder, og gir en oversikt over mulighetene som tilbys, f.eks. hvordan de kan benyttes i Python Notebooks.

Læringsutbytte

Tiltenkt læringsutbytte

Repetisjon av statistisk terminologi og estimeringsteori:

- motivasjon og filosofi i multivariat modellering - oversikt over metoder for dataanalyse

- validering av modeller - minste kvadraters metode - maximum likelihood

- statistiske kriterier for evaluering av modellresultater - over- og undertilpasning i modellering (bias vs. Variance)

* Detaljert analyse av følgende algoritmer / problemer: - PCA, ICA, PCR, PLS, multiblock og PARAFAC - metoder for detektering av outliers - tidsserie modellering og prediksjon - system identifikasjon - valg av modellers kompleksitet

- planlegging av eksperimenter (Design of Experiments) * Oversikt og demonstrasjon av strategier for: - modellering av tidsavhengige prosesser - subspace identification - nevrale nettverk - random forests - support vector machines - t-SNE - andre metoder for clustering (KNN m.m.) - andre klassifiseringsmetoder

Ikke-kognitive læringsresultater: - forstå filosofiene, styrken og begrensningene ved de forskjellige metodene - forstå betydningen av dataenes kvalitet og struktur for tolkningen av dataene - ble kjent med strategier for dataanalyse; fra forsøksplanlegging til konklusjon - bli uavhengig, selvsikker og kritisk når det gjelder dataanalyse

[1] K. Poynton, Cognitive and non-cognitive learning factors, http://cim.acs-schools.com/wp-content/uploads/2015/08/Cognitive-and-non-cognitive-learning-factors.pdf

Læringsformer og aktiviteter

- forelesninger (tradisjonelt og "flipped classroom") - peer instruction sessions - interaktiv hands-on dataanalyse - prosjektarbeid på utvalgte datasett

Obligatoriske aktiviteter

  • Obligatorisk øving

Mer om vurdering

Vurdering blir gjort på basis av skriftlig digital eksamen. Ved utsatt eksamen (kontinuasjonseksamen) kan digital eksamen bli endret til muntlig eksamen. Dersom studenten også etter utsatt eksamen har sluttkarakteren F/ikke bestått, må studenten gjenta hele emnet neste studieår.

Forkunnskapskrav

God forståelse av grunnleggende lineær algebra.

Kursmateriell

Kursmateriell vil bli avklart i begynnelsen av semesteret

Fagområder

  • Kjemometri
  • Signalbehandling
  • Statistisk forsøksplanlegging
  • Teknisk kybernetikk

Kontaktinformasjon