Page History

Sikter på 14. april.
Background, State-of-the-Art
- Hva er suksessraten til nåværende (regelbaserte, hardkodete) versjon?
  - Hvilken algoritme bruker den?
- SVM, LR (LogRes) er mye brukt i naturlig samtale.
- SotA: Hvilke algoritmer og suksessrater eksisterer allerede.
Metode
- Oppsett for sammenligning,
  - TF-IDF, P, R, F-score, P@3
  - Kan systemet oppgi sin egen konfidens?
  - Statistikk/Konfidensintervall.
- Hvilken algoritme bruker du?
- Baseline: Hvor god er bot'en ift treff-rate på spørsmål
  - Q er relevant, A er treff/bom.
  - Q er relevant eller ikke, A er korrekt svar eller ikke.
  - Hvor mange Q/A-kategorier finnes?
    - 1500 linjer med potensielle spørsmål.
    - Hvor mange grupper? Hvilken gruppe er størst? Hvor stor prosent utgjør den av totalen.
  - Most frequent - baseline, nåværende system - baseline.
100.000 linjer med spørsmål/svar (bot 60%, bruker 40%), 10-15% gir "kan ikke svare".
Skille mellom metodebeskrivelse nå, og resultatmåling i masteroppgaven.

Uke 1:

...

Space shortcuts