Jaspreet, Roar, Ingrid, Øystein, Hans, Thomas, Rune
Jaspreet
Introduserer prosjektet. Driver med de-identifisering av elektroniske pasientjournaler.
...
- Lovdata, studere begrensninger og utfordringer i Norge mtp helseforskning.
-Komme opp med egen modell, baser på state of the art.
state-of-the-art i USA, "alle" i USA bruker UMLS, Interessert i WordNet (Finnes nå på norsk),
...
Hva hvis flere vil begynne å jobbe med dette? Kommer det en gull-standard snart?
Hans
forteller Forteller at han jobber med Vektor-space-models for NER etchvor bl.a NER er relevant.
Viser papirutskrift av fjerning av navn etc. i kliniske rapporter (Discharge?)
Hvilket språk implementerer dere i? Primært Python, sekundært Java.
Øystein
Har dere nye navnelister fra SSB?
...
Ø: Stemmere for forskjellige språk ligger på hjemmesiden til Apache Lucene.
Roar
Har testet POS-taggeren på en (norsk) setning. Den virket (På ikke-klinisk test)
...
Sender nye rapporter med oppdateringer underveis.
Thomas
Ola huset har laget en basic python versjon av en Brill tagger (For norsk klinisk text).
...
Stikker til California tre uker nå... (Utilgjengelig fra 9-5 norsk tid, fra tirsdag) Tilbake 22. November.
Rune
Vi trenger en samling av OWL-repositorier (som ikke er egnet for SVN).
...