You are viewing an old version of this page. View the current version.

Compare with Current View Page History

« Previous Version 9 Next »

Alexander:

Jobber med tagging.

Har allerede en python-scraper som henter retningslinjer og lagrer det som XML. (Javascript, HTML).

Kan bruke info fra Roar og Jaspreet istedenfor fra Hans.

Roar:

De-identifisering av pasientjournaler

Sammen med Jaspreet

Jaspreet:

Enkle reg-exp i starten.

Har eksisterende navnelister, stedsnavn, ...

Øystein:

Hans har preprosessor som håndterer blant annet setningsdeling, og forkortelser.

Thomas har også egne versjoner av dette. PoS-tagger etc.

Har håndkodede løsninger for Tlf-nr, postnr, org.nr, osv

Vi har også oppslagsverk for hele helseforetakets datasett: Se links her:

TelefonMøte 2013.01.15 Gro, Per, Arezoo, Øystein, Rune, Ingrid

Laura bør spørre kunnskapsenteret om å få tilgang til hele norske MESH, og andre DB (retningslinjer osv.), fra Ann Hilde Røsvik,

(Og Sigrun angående norsk MeSH.)

Haldor:

Annoteringer rundt CVK. Annoteres av en kvinnelig medarbeider.

Rune:

Setnings-splitter må virke på hele teksten... Alle annoteringer lagres i Brat pr. total-offset, og Brat kan gjøre egen setningssplitting: http://brat.nlplab.org/standoff.html

Ingrid:

Undersøker hvilke klassifikatorer som er best egnet til å finne NER:

SVM, CFR, co-sine similarity.

Decision Trees, hybrid models

Laura:

CTPO Ontology. Annotate with it.

Semantator.

Barry Smith's formal ontologies.

Laura calls another meeting with Trond and Haldor on Thursday (Annotation, text formats, and ranking results).

Soudabeh Khodambashi (soudabek@idi.ntnu.no) should also be included in Laura's meeting.

  • No labels