Daten & Metadaten

Das MedCorpInn Korpus besteht aus 5.002.933 schriftlichen, deutschsprachigen Befunden der Klinik für Radiologie und Neuroradiologie der Medizinischen Universität Innsbruck (2.540.022 Patientinnen, 2.440.474 Patienten). Solche Befunde spielen eine wesentliche Rolle in der Kommunikation zwischen Ärztinnen und Ärzten und dokumentieren bzw. interpretieren verschiedene bildgebende Verfahren wie Ultraschall, Computertomographie, Magnetresonanztomographie, Positronen-Emissions-Tomographie, Angiographie, Röntgen usw. Häufig werden darin weitere therapeutische Schritte vorgeschlagen und Patient*innen weiterbehandelnden Ärztinnen und Ärzten zugewiesen. 

Für jeden Tag der Jahre 2007-2020 wurden also radiologische Befunde gesammelt und als Textfiles aus dem KIS (Klinisches Informationssystem) exportiert. Der Befundtext selbst war meistens unstrukturiert, während die Metadaten einheitlich strukturiert waren. Die Metadaten umfassen 39 verschiedene Kategorien, die demographische und persönliche Informationen (z.B. Alter, Geschlecht, beruflicher Status, Art der Versicherung, Herkunft; Geschlecht des Arztes) sowie Informationen zu verschiedenen medizinischen Verfahren (z.B. Art der Aufnahme, medizinische Indikation, Zeitrahmen usw.) wiedergeben. Einige dieser Metadatenkategorien sind so eingerichtet, dass es möglich ist, korpuslinguistische Abfragen nach diesen Kriterien zu filtern. Solche Auswahlkriterien sind z.B. Geschlecht, Altersgruppe, sozioökonomischer Status, Art der Versicherung und Art der Untersuchung.