Projektbeschreibung

Sprache ist elementarer Bestandteil der Medizin. Der medizinische Alltag ist durch eine Vielzahl kommunikativer Praktiken geprägt: Tagtäglich werden zahlreiche Informationen ausgetauscht, Anamnesegespräche geführt, Protokolle und Arztbriefe verfasst. Das Projekt MedCorpInn interessiert sich besonders für radiologische Befunde. Diese sind ein wichtiger Bestandteil der ärztlichen Kommunikation und beschreiben unterschiedliche bildgebende Verfahren: Sie reichen beispielsweise über Röntgenaufnahmen von Knochenbrüchen bis hin zum Nachweis innerer Blutungen oder Tumore. Ein typischer, anonymisierter Befundtext aus unserem Korpus sieht folgendermaßen aus: 

Für die Aufbereitung des Korpus wird eine Pipeline erstellt, mit deren Hilfe die Daten verarbeitet und prozessiert werden können. Wichtige Schritte sind hier u.a. die Anonymsierung und Pseudonymisierung der Daten, die Strukturierung der Metadaten, mit denen die Befunde ausgestattet sind (z.B. Alter, Geschlecht, Untersuchungsmodus usw), Satztrennung, Tokenisierung und die Annotieriung nach Wortarten (POS-tagging).

Die aufbereiteten Daten können mit verschiedenen Methoden und Tools der Korpuslinguistik sowie der Diskursanalyse abgefragt werden. Dadurch soll u.a. herausgefunden werden, ob es in den Befunden sprachliche Unterschiede gibt, die in Abhängigkeit zu sozialen Faktoren stehen. Die Texte werden dazu nach Kategorien aufgeteilt (z.B. weiblich/männlich; Privatkasse/gesetzliche Kasse usw.) und im Hinblick auf statistisch signifikante sprachliche Muster und Unterschiede untersucht.

Auch gendermedizinische Fragestellungen können mit Hilfe des Korpus bearbeitet werden. Zum Beispiel kann überprüft werden, ob medizinische Behandlungen mit sozialen Faktoren zusammenhängen, oder ob es genderspezifische Unterschiede in Hinblick auf die Genauigkeit der Befunde gibt (z.B. bei Abmessungen von Verletzungen, Tumoren usw.).