Alexander:
Jobber med tagging.
Roar:
De-identifisering av pasientjournaler
Sammen med
Jaspreet:
Enkle reg-exp i starten.
Har eksisterende navnelister, stedsnavn, ...
Øystein:
Hans har preprosessor som håndterer blant annet setningsdeling, og forkortelser.
Thomas har også egne versjoner av dette. PoS-tagger etc.
Har håndkodede løsninger for Tlf-nr, postnr, org.nr, osv
Vi har også oppslagsverk for hele helseforetakets datasett: Se links her:
TelefonMøte 2013.01.15 Gro, Per, Arezoo, Øystein, Rune, Ingrid
Haldor:
Annoteringer rundt CVK. Annoteres av en kvinnelig medarbeider.
Rune: Setningssplitter må virke på hele teksten... Alle andre annoteringer lagres i Brat pr. setning.
Ingrid:
Undersøker hvilke klassifikatorer som er best egnet til å finne NER:
SVM, CFR, co-sine similarity.
Decision Trees, hybrid models
Laura
CTPO Ontology. Annotate with it.
Semantator.
Barry Smith's formal ontologies.
Laura calls another meeting with Trond and Haldor on Thursday (Annotation, text formats, and ranking results).
Soudabeh Khodambashi (soudabek@idi.ntnu.no) should also be included in Laura's meeting.