- Putte URL'er i fotnoter: Ser ikke bra ut i tekst
- Legge Kanji i parantes bak Kanji
- Forklare litt bedre hvordan tokenizer fungerer?
- Ignorere sære navn ("Daigaku"), men legge med argumentasjon for hvorfor det droppes
- Lage appendix for keyword-listen og suffix-listen, om de ikke er for lange kan det være bra å ha rett i dokumentet istedetfor linked ved github
- 3.3: Legge til info om tokenizer-analyser før bag of token-analysern (kort tekst før subsections)
- Ha klart i contents: METODE RESULTAT DISKUSJON
- Nevne Atilika tidlig i oppgaven; var gjennom de oppgaven ble definert etc.
- Kuromoji - fotnote til link på atilika's sider
- tex-mal fra Björn, standard for masterstudenter, ta i bruk det som er bra
- Referere til prototyping som en forskningsmetode (???)
- Greit mål! Bra med fokus på fri informasjon.
- Hva er andre navnebøker basert på???
- Definere i mer detalj hvordan databasen vil fungere, hvilke søk kan man gjøre, går det an å søke på uttale og få kanji etc? Sannsynligheter for at visse lesninger gjelder etc? Hvordan løse? Hvor mange navn må man hente ut for å få dekning .... hvor relevant er prosjektet i forhold til hele Japans navnebase. Fordeling av navn og uttale. Greit å ha noe tall på størrelser, hvor mange navn man trenger etc, i forhold til Wikipedias størrelse per i dag. Beregninger.