• Putte URL'er i fotnoter: Ser ikke bra ut i tekst
  • Legge Kanji i parantes bak Kanji
  • Forklare litt bedre hvordan tokenizer fungerer?
  • Ignorere sære navn ("Daigaku"), men legge med argumentasjon for hvorfor det droppes
  • Lage appendix for keyword-listen og suffix-listen, om de ikke er for lange kan det være bra å ha rett i dokumentet istedetfor linked ved github
  • 3.3: Legge til info om tokenizer-analyser før bag of token-analysern (kort tekst før subsections)

 

  • Ha klart i contents: METODE RESULTAT DISKUSJON
  • Nevne Atilika tidlig i oppgaven; var gjennom de oppgaven ble definert etc.
  • Kuromoji - fotnote til link på atilika's sider

 

  • tex-mal fra Björn, standard for masterstudenter, ta i bruk det som er bra
  • Referere til prototyping som en forskningsmetode (???)
  • Greit mål! Bra med fokus på fri informasjon.

 

  • Hva er andre navnebøker basert på???
  • Definere i mer detalj hvordan databasen vil fungere, hvilke søk kan man gjøre, går det an å søke på uttale og få kanji etc? Sannsynligheter for at visse lesninger gjelder etc? Hvordan løse? Hvor mange navn må man hente ut for å få dekning .... hvor relevant er prosjektet i forhold til hele Japans navnebase. Fordeling av navn og uttale. Greit å ha noe tall på størrelser, hvor mange navn man trenger etc, i forhold til Wikipedias størrelse per i dag. Beregninger.

Status på artikkelen

  • No labels