You are viewing an old version of this page. View the current version.

Compare with Current View Page History

« Previous Version 6 Next »

Jaspreet, Roar, Ingrid, Øystein, Hans, Thomas, Rune

Jaspreet

Introduserer prosjektet. Driver med de-identifisering av elektroniske pasientjournaler.

Forteller om prosjektets mål:

- State of the art, studere relevant arbeid.

- Lovdata, studere begrensninger og utfordringer i Norge mtp helseforskning.

-Komme opp med egen modell, baser på state of the art.

state-of-the-art i USA, "alle" i USA bruker UMLS, Interessert i WordNet (Finnes nå på norsk),

diverse ordlister som kan komme til nytte. Har andre noen tips?

Hva hvis flere vil begynne å jobbe med dette? Kommer det en gull-standard snart?

Hans

Forteller at han jobber med Vektor-space-models hvor bl.a NER er relevant.

Viser papirutskrift av fjerning av navn etc. i kliniske rapporter (Discharge?)

Hvilket språk implementerer dere i? Primært Python, sekundært Java.

Øystein

Har dere nye navnelister fra SSB?

Kjør igjennom alle listene fra ICD-10 (finnes lagret i OWL-strukturen). Sjekk hvordan taggeren reagerer på dem.

Hvordan kan vi følge lovverkets intensjon.

Vi må håndtere forkortelser! Roar: Dr. etc. finnes.

-Lemmatisering er et problem. H: Bruker Lucene (Snowball) til dette. Bruker stop-word-list for medisinske forkortelser som IKKE skal stemmes.

Ø: Stemmere for forskjellige språk ligger på hjemmesiden til Apache Lucene.

Roar

Har testet POS-taggeren på en (norsk) setning. Den virket (På ikke-klinisk test)

Se på lovdata.

Hva slags data kan vi teste på? Ø: Vi har to mulige veier til data, i verste fall som interne på AHus, Høk.

Sender nye rapporter med oppdateringer underveis.

Thomas

Ola huset har laget en basic python versjon av en Brill tagger (For norsk klinisk text).

-Noen resultater er mye bedre enn ingen.

-Trent på norsk avis-corpus

Har noen kliniske tekster fra Roar Pine, noen fra ATC, etc. (Generelle kliniske begreper etc).

-Hvordan er  denne i forhold til Linn (Evicare PhD) sin elektriske ordliste... Den er laget helt etter hennes hode og behov, dvs. basert på norsk MeSH, og utvidet.

-Hvor langt har hun kommet? Hans sjekker status med Linn, og Øystein med Sigrun (helsesenteret) mtp. Status. på Norsk MeSH

Stikker til California tre uker nå... (Utilgjengelig fra 9-5 norsk tid, fra tirsdag) Tilbake 22. November.

Rune

Vi trenger en samling av OWL-repositorier (som ikke er egnet for SVN).

Vi bør bruke SVN til det som finnes av kode allerede.

Lag en evicare-repos på basar.idi.ntnu.no

  • No labels