Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.
Comment: Migrated to Confluence 4.0

Jaspreet, Kåre?Roar, Ingrid, Øystein, Hans, Thomas, Rune

Jaspreet

Introduserer prosjektet. Driver med de-identifisering av elektroniske pasientjournaler.

Forteller om prosjektets mål:

- State of the art, studere relevant arbeid.

- Lovdata, studere begrensninger og utfordringer i Norge mtp helseforskning.

-Komme opp med egen modell, baser på state of the art.

stateforteller om Lovdata, state-of-the-art i USA, "alle" i USA bruker UMLS, Interessert i WordNet (Finnes nå på norsk),

diverse ordlister som kan komme til nytte. Har andre noen tips?

Hva hvis flere vil begynne å jobbe med dette? Kommer det en gull-standard snart?

Hans

forteller Forteller at han jobber med Vektor-space-models for NER etchvor bl.a NER er relevant.

Viser papirutskrift av fjerning av navn etc. i kliniske rapporter (Discharge?)

Hvilket språk implementerer dere i? Primært Python, sekundært Java.

Øystein

Har dere nye navnelister fra SSB?

...

Kjør igjennom alle listene fra ICD-10 (finnes lagret i OWL-strukturen). Sjekk hvordan taggeren reagerer på dem.

Hvordan kan vi følge lovverkets intensjon.

Vi må håndtere forkortelser! Roar: Dr. etc. finnes.

-Lemmatisering er et problem. H: Bruker Lucene (Snowball) til dette. Bruker stop-word-list for medisinske forkortelser som IKKE skal stemmes.

Ø: Stemmere for forskjellige språk ligger på hjemmesiden til Apache Lucene.

Roar

Har testet POS-taggeren på en (norsk) setning. Den virket (På ikke-klinisk test)

Se på lovdata.

Hva slags data kan vi teste på? Ø: Vi har to mulige veier til data, i verste fall som interne på AHus, Høk.

Sender nye rapporter med oppdateringer underveis.

Thomas

Ola huset har laget en basic python versjon av en Brill tagger (For norsk klinisk text).

...

-Trent på norsk avis-corpus

Har noen kliniske tekster fra Roar Pine, noen fra ATC, etc. (Generelle kliniske begreper etc).

-Hvordan er  denne i forhold til Linn (Evicare PhD) sin elektriske ordliste... Den er laget helt etter hennes hode og behov, dvs. basert på norsk MeSH, og utvidet.

-Hvor langt har hun kommet? Hans sjekker status med Linn, og Øystein med Sigrun (helsesenteret) mtp. Status. på Norsk MeSH

Stikker til California tre uker nå... (Utilgjengelig fra 9-5 norsk tid, fra tirsdag) Tilbake 22. November.

Rune

Vi trenger en samling av OWL-repositorier (som ikke er egnet for SVN).

Vi bør bruke SVN til det som finnes av kode allerede.

Lag en evicare-repos på basar.idi.ntnu.no