Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.

Møte 2018.03.01

  • Sikter på 14. april.
  • Background, State-of-the-Art
    • Hva er suksessraten til nåværende (regelbaserte, hardkodete) versjon?
      • Hvilken algoritme bruker den?
    • SVM, LR (LogRes) er mye brukt i naturlig samtale.
    • SotA: Hvilke algoritmer og suksessrater eksisterer allerede.
  • Metode

    • Oppsett for sammenligning,

      • TF-IDF, P, R, F-score, P@3

      • Kan systemet oppgi sin egen konfidens?
      • Statistikk/Konfidensintervall.

    • Hvilken algoritme bruker du?
    • Baseline: Hvor god er bot'en ift treff-rate på spørsmål
      • Q er relevant, A er treff/bom.
      • Q er relevant eller ikke, A er korrekt svar eller ikke.
      • Hvor mange Q/A-kategorier finnes?
        • 1500 linjer med potensielle spørsmål.
        • Hvor mange grupper? Hvilken gruppe er størst? Hvor stor prosent utgjør den av totalen.
      • Most frequent - baseline, nåværende system - baseline.
  • 100.000 linjer med spørsmål/svar (bot 60%, bruker 40%), 10-15% gir "kan ikke svare".
  • Skille mellom metodebeskrivelse nå, og resultatmåling i masteroppgaven.

Tentativ plan fremover:

Uke 1:

...