Møtereferat 28. sept

Putte URL'er i fotnoter: Ser ikke bra ut i tekst
Legge Kanji i parantes bak Kanji
Forklare litt bedre hvordan tokenizer fungerer?
Ignorere sære navn ("Daigaku"), men legge med argumentasjon for hvorfor det droppes
Lage appendix for keyword-listen og suffix-listen, om de ikke er for lange kan det være bra å ha rett i dokumentet istedetfor linked ved github
3.3: Legge til info om tokenizer-analyser før bag of token-analysern (kort tekst før subsections)

Hva er andre navnebøker basert på???
Definere i mer detalj hvordan databasen vil fungere, hvilke søk kan man gjøre, går det an å søke på uttale og få kanji etc? Sannsynligheter for at visse lesninger gjelder etc? Hvordan løse? Hvor mange navn må man hente ut for å få dekning .... hvor relevant er prosjektet i forhold til hele Japans navnebase. Fordeling av navn og uttale. Greit å ha noe tall på størrelser, hvor mange navn man trenger etc, i forhold til Wikipedias størrelse per i dag. Beregninger.

Status på artikkelen

Space shortcuts