Jaspreet, Kåre?Roar, Ingrid, Øystein, Hans, Thomas, Rune
Jaspreet
...
Introduserer prosjektet. Driver med de-identifisering av elektroniske pasientjournaler.
Forteller om prosjektets mål:
- State of the art, studere relevant arbeid.
- Lovdata, studere begrensninger og utfordringer i Norge mtp helseforskning.
-Komme opp med egen modell, baser på state of the art.
stateforteller om Lovdata, state-of-the-art i USA, "alle" i USA bruker UMLS, Interessert i WordNet (Finnes nå på norsk),
Hans
diverse ordlister som kan komme til nytte. Har andre noen tips?
Hva hvis flere vil begynne å jobbe med dette? Kommer det en gull-standard snart?
Hans
Forteller forteller at han jobber med Vektor-space-models for NER etchvor bl.a NER er relevant.
Viser papirutskrift av fjerning av navn etc. i kliniske rapporter (Discharge?)
Hvilket språk implementerer dere i? Primært Python, sekundært Java.
Øystein
Har dere nye navnelister fra SSB?
Kjør igjennom alle listene fra ICD-10 (finnes lagret i OWL-strukturen). Sjekk hvordan taggeren reagerer på dem.
Hvordan kan vi følge lovverkets intensjon.
Vi må håndtere forkortelser! Roar: Dr. etc. finnes.
-Lemmatisering er et problem. H: Bruker Lucene (Snowball) til dette. Bruker stop-word-list for medisinske forkortelser som IKKE skal stemmes.
Ø: Stemmere for forskjellige språk ligger på hjemmesiden til Apache Lucene.
Roar
Har testet POS-taggeren på en (norsk) setning. Den virket (På ikke-klinisk test)
Se på lovdata.
Hva slags data kan vi teste på? Ø: Vi har to mulige veier til data, i verste fall som interne på AHus, Høk.
Sender nye rapporter med oppdateringer underveis.
Thomas
Ola huset har laget en basic python versjon av en Brill tagger (For norsk klinisk text).
-Noen resultater er mye bedre enn ingen.
-Trent på norsk avis-corpus
Har noen kliniske tekster fra Roar Pine, noen fra ATC, etc. (Generelle kliniske begreper etc).
-Hvordan er denne i forhold til Linn (Evicare PhD) sin elektriske ordliste... Den er laget helt etter hennes hode og behov, dvs. basert på norsk MeSH, og utvidet.
-Hvor langt har hun kommet? Hans sjekker status med Linn, og Øystein med Sigrun (helsesenteret) mtp. Status. på Norsk MeSH
Stikker til California tre uker nå... (Utilgjengelig fra 9-5 norsk tid, fra tirsdag) Tilbake 22. November.
Rune
Vi trenger en samling av OWL-repositorier (som ikke er egnet for SVN).
Vi bør bruke SVN til det som finnes av kode allerede.
Lag en evicare-repos på basar.idi.ntnu.no