You are viewing an old version of this page. View the current version.

Compare with Current View Page History

« Previous Version 6 Next »

Alexander:

Jobber med tagging.

Har allerede en python-scraper som henter retningslinjer og lagrer det som XML. (Javascript, HTML).

Kan bruke info fra Roar og Jaspreet istedenfor fra Hans.

Roar:

De-identifisering av pasientjournaler

Sammen med

Jaspreet:

Enkle reg-exp i starten.

Har eksisterende navnelister, stedsnavn, ...

Øystein:

Hans har preprosessor som håndterer blant annet setningsdeling, og forkortelser.

Thomas har også egne versjoner av dette. PoS-tagger etc.

Har håndkodede løsninger for Tlf-nr, postnr, org.nr, osv

Vi har også oppslagsverk for hele helseforetakets datasett: Se links her:

TelefonMøte 2013.01.15 Gro, Per, Arezoo, Øystein, Rune, Ingrid

Haldor:

Annoteringer rundt CVK. Annoteres av en kvinnelig medarbeider.

Rune:

Setnings-splitter må virke på hele teksten... Alle annoteringer lagres i Brat pr. total-offset, og Brat kan gjøre egen setningssplitting: http://brat.nlplab.org/standoff.html

Ingrid:

Undersøker hvilke klassifikatorer som er best egnet til å finne NER:

SVM, CFR, co-sine similarity.

Decision Trees, hybrid models

Laura

CTPO Ontology. Annotate with it.

Semantator.

Barry Smith's formal ontologies.

Laura calls another meeting with Trond and Haldor on Thursday (Annotation, text formats, and ranking results).

Soudabeh Khodambashi (soudabek@idi.ntnu.no) should also be included in Laura's meeting.

  • No labels