Møte 2018.03.01
- Sikter på 14. april.
- Background, State-of-the-Art
- Hva er suksessraten til nåværende (regelbaserte, hardkodete) versjon?
- Hvilken algoritme bruker den?
- SVM, LR (LogRes) er mye brukt i naturlig samtale.
- SotA: Hvilke algoritmer og suksessrater eksisterer allerede.
- Hva er suksessraten til nåværende (regelbaserte, hardkodete) versjon?
Metode
Oppsett for sammenligning,
TF-IDF, P, R, F-score, P@3
- Kan systemet oppgi sin egen konfidens?
Statistikk/Konfidensintervall.
- Hvilken algoritme bruker du?
- Baseline: Hvor god er bot'en ift treff-rate på spørsmål
- Q er relevant, A er treff/bom.
- Q er relevant eller ikke, A er korrekt svar eller ikke.
- Hvor mange Q/A-kategorier finnes?
- 1500 linjer med potensielle spørsmål.
- Hvor mange grupper? Hvilken gruppe er størst? Hvor stor prosent utgjør den av totalen.
- Most frequent - baseline, nåværende system - baseline.
- 100.000 linjer med spørsmål/svar (bot 60%, bruker 40%), 10-15% gir "kan ikke svare".
- Skille mellom metodebeskrivelse nå, og resultatmåling i masteroppgaven.
Tentativ plan fremover:
Uke 1:
...