Alexander:
Jobber med tagging.
Har allerede en python-scraper som henter retningslinjer og lagrer det som XML. (Javascript, HTML).
Kan bruke info fra Roar og Jaspreet istedenfor fra Hans.
Roar:
De-identifisering av pasientjournaler.
Alle ordbøker fra Thomas lastet opp på SVN nå.
Sammen med Jaspreet
Jaspreet:
Enkle reg-exp i starten.
Har eksisterende navnelister, stedsnavn, ...
WordNet for Norge 2013, er nesten klar nå.
Øystein:
Hans har preprosessor som håndterer blant annet setningsdeling, og forkortelser.
Thomas har også egne versjoner av dette. PoS-tagger etc.
Har håndkodede løsninger for Tlf-nr, postnr, org.nr, osv
Vi har også oppslagsverk for hele helseforetakets datasett: Se links her:
TelefonMøte 2013.01.15 Gro, Per, Arezoo, Øystein, Rune, Ingrid
Laura bør spørre kunnskapsenteret om å få tilgang til hele norske MESH, og andre DB (retningslinjer osv.), fra Ann Hilde Røsvik,
- Sigrun angående norsk MeSH.
Haldor:
Annoteringer rundt CVK. Annoteres av en kvinnelig medarbeider.
Rune:
Setnings-splitter må virke på hele teksten... Alle annoteringer lagres i Brat pr. total-offset, og Brat kan gjøre egen setningssplitting: http://brat.nlplab.org/standoff.html
Ingrid:
Undersøker hvilke klassifikatorer som er best egnet til å finne NER:
SVM, CFR, co-sine similarity.
Decision Trees, hybrid models
Laura:
CTPO Ontology. Annotate with it.
Semantator.
Barry Smith's formal ontologies.
Laura calls another meeting with Trond and Haldor on Thursday (Annotation, text formats, and ranking results).
Soudabeh Khodambashi (soudabek@idi.ntnu.no) should also be included in Laura's meeting.