• Related work mangler komplett - det begynner nå å haste <- prioriter!!!!
  • Conclusions og Future Work mangler også, men dette må jo komme helt på slutten. Future Work er viktig da jeg bygger en prototype! Hva kan forbedres/jobbes videre med?
  • Hvordan metoden beskrives, noe rart. Kapittel 4 har pipeline processing med figur, men dette kan jo være i kapittel 2. Lettere å forstå om man begynner med pipeline processing først så man vet hvordan alt henger sammen før detaljene legges ut.
  • Avsnitt 2.2 om tokenisering: Blir litt rar i sammenheng, kanskje ikke ta den i kapittel 2. Kan jo evt. beskrive det i metode eller ha et eget kapittel med teknisk bakgrunn.
  • Vanlig med et kapittel om et kapittel om bakgrunn, og et om data methods. Som handler om data man tar inn, i dette tilfelle wikipedia etc.
  • Methods mer generell om hvilke metoder man bruker, og et annet kapittel som beskriver selve eksperimentet i detalj. La method beskrive mer generelt metodene som brukes, deretter "Foreground" for det man selv bidrar med.
  • Figuren i kapittel 4 passer mye bedre tidligere. Ta den tilbake til kapittelet om thesis structure, evt. Research Approach (question)
  • Kap 3 er mer om egen metode enn metoder man selv har gjort.
  • Det mangler et kapittel om metode generelt, kan flytte det kapitlet som allerede fins. Ikke utviklingsspesifikt, men forskningsfokusert. HVILKE FORSKNINGSMETODER? "Bag of Words" kan også beskrives generelt, mens egen implementering kan beskrives selv.
  • I BACKGROUND - related works, hva er allerede gjort passer inn i dette kapitlet.
  • Kapittel 4 kan kalles System Architecture eller Experimental Setup eller liknende. Pipeline Architecture? Noe slikt. Om kapitlet skal holde systemarkitektur.
  • Gamle kap 3 -> kap 5. Nytt kap 3 og kap 4 imellom.
  • Bildet som utgangspunkt for kap 4?
  • Noe av det som står i kapittel 3 kan nå flyttes inn i kapittel 4, etter bildet.
  • Metode-kapittel: Er prototyping nok? Vil prototyping kunne bevise forskningsspørsmålet? Vil svare på godt om språkprosesseringsteknikker er nok, men er det nok korrelasjon? TRENGER EN ANNEN METODE! Skriv noe om det i metode-kapittelet, hvordan man evaluerer om man har svart på forskningsspørsmål eller ikke? etc.
  • Skrive om TRAINING SET og gi informasjon om disse (blir ikke så mange, så hvert kan beskrives i relativt god detalj)
  • 1.4.1: Få frem flere forskningsmetode. DETTE er det som hører hjemme i Kapittel 3. 1.4.1, 2.2 og 3.3.1 hører hjemme hjemme i nye kapittel-3.
  • I kap 3.3.2 er det kort beskrevet noen artikelltyper som har bydd på utfordringer. Det er nå funnet flere typer og dette kapittelet kan utvides. Ha det som egen del om datasett kanskje?
  • Skriv om hvordan oppsettet med testsettet ble og å ta en avgjørelse av HVA SLAGS PERSONER LETER VI ETTER? (alle, ikke NJ, J/K/C). Her er det viktig for også å få fram hva programmet FAKTISK gjør og ikke hva man ideelt sett skulle ønske det gjorde.
  • Tabeller må ha caption! (
  • 3.3.2: Skift til ABOUT PERSONS, NOT ABOUT PERSONS.
  • Også med i metode-artikkelen: Om f-score og forklar prinsippet. Hvordan man måler resultater etc. 
  • F-score er en egen skår basert på PRECISION og RECALL: Harmonisk gjennomsnitt: Kun én score. Finn ut av dette og få med. Beskrivelsen må inn i metode-kapittelet. Det er lett å justere enten Precision eller Recall. 
  • Smart å beskrive TRENINGSSETTET på samme detaljnivå som TESTSETTET slik at alt er med (3.4).
  • Vurder å ha med tenfold cross validation: Man tar ut en tidels separat og tester separat før man legger til inn i selve testet. Kan bli noe vanskelig mtp ordlisten for suffix/title, vurder om dette skal gjøres? Skal gjøres på noe som er representativt for data. Dette vil da være i tillegg til tester på Test-settet.
  • Ten fold cross validation: Undersøk.
  • Baseline: Hvis alltid gjetter at en artikkel ikke er om en person, hvor mye treffsikkerhet har man? Interessant å sammenlikne med. Få til dette. MOST FREQUENT BASELINE er riktig ord. 
  • Vurder tabell under 3.4 på side 12, vurder om tabellen skal heller se på ØST ASIATER ELLER IKKE? heller enn JAPANER ELLER IKKE? Vanskelig å snappe opp kinesere og koreanere, så kan la de gå. <- Lekse, se på hvordan artiklene om koreanere og kinesere er bygd opp, og i hvilken grad det er lett å snappe opp den infoen.
  • Figurer OG tabeller må ha captions. Se på hvordan andre har gjort det. Noe av det som står i teksten passer som caption. Sleng med en tabelloversikt på slutten, latex fikser det. Caption-funksjon.
  • No labels