• Kapittel 5 + 6 kan slås sammen.
  • Bakgrunnskapittel og related works er litt blandet, med ulike ting som dukker opp. 
  • Kapittel 2, 3 og 4 blander en del ting. 
  • Se nøye på kapittel 4. Se på hva som faktisk er background og hva som jeg selv har gjort.
  • F-score 
  • HVORFOR Wikipedia, se på hvilke alternativer som fins, skriv en redegjøring for hvorfor Wikipedia ble brukt istedetfor andre inputkilder.
  • F. eks. fins Geonames? Area-informasjon. Kan være datakilde. (geonames.jp)
  • Sjekk jp.dbpedia.org <- de har gjort arbeid med wikipedia. Om publisert om det blir det RELATED WORK, om ikke publisert blir det BAKGRUNN.
  • Wordnet kan være relevant. Men japansk wordnet fins kanskje ikke? Blir laget i Tokyo?
  • Arbeidet som JAIST sponser, Nara og U. Tokyo og flere... Uvisst hva det heter? (NAIST)
  • 1.3 Objective 3: Skru ned forventningene om å lage searchable web system. 
  • Utvide Vocabulary: Part of Speech, Bag of Words, JAIST, etc etc. Se an hva som trengs forklaring. Shortlist of terms. POS-tag etc. Forkortelser etc. Utenlandske ord og fortkortelser generelt må være med! Anta at folk kan engelsk, ikke mer. NLP (Google refererer jo til Neurolinguistic Programming). RQ kan forklares. Etc.
  • Angående Captions: Begin Table istedetfor Begin Center. Så Caption inn dit. Last ned template og se hvordan de gjør det. Fiks alt sånne småting.
  • Gå gjennom UNDERFULL HBOX helt til slutt og fiks de små errorene. Da blir teksten mye finere.
  • Future Work: Skal under Discussion.
  • Kapittel 2: Kan bli Background & Related Works
  • Figure 2.1: Gi mer credit. Bytte ut tekst med noe mer meningsfult, evt. slenge på en citation.
  • Side 18: Kuromoji-beskrivelsen må ha en tabell for hvert 
  • Skrive om Wikipedia data types der hver kort nevnes, og så skrive beskrivelse for hver type.
  • Kapittel 6: Lag figur slik at alt gir mening (med tanke på alle enkeltalgoritmene etc) Dette er riktig tidspunkt for å skrive dette så det går fint. 
  • Kap 7: Mye punktlister. Ser veldig uferdig ut, ikke så veldig proft. Skift hvordan algoritmene som ble brukt skrives opp.
  • Setningen om baseline må forenkles. Nå er det gresk.
  • Enten Prosent for både PRECISION OG RECALL OG F-SCORE. Trenger ikke to desimal. Om ikke prosent, bruk desimaler. Vær konsistent.
  • Fjern bullet points fra kapittel 7.
  • Bag of Words - kan se på. Men si noe om det med. Stemming etc. Se på related works om Bag of Words.
  • Samle resultatene i en tabell slik at alt er sammen.
  • Established has been established <- Få inn navn på forfatter? Citations burde få med årstall og forfatternavn for å øke lesbarhet.
  • CItations: \citet{...} i natbib ELLER hvis man ikke bruker natbib noe som \newcommand\citet[1]{\citeauthor{#1}~\shortcite{#1}}

  • No labels