Vorstellung
Die Nachwuchsgruppe 'Terminologie- und Ontologie-basierte Phänotypisierung (TOP)' ist Teil des SMITH-Konsortiums und wird durch das Bundesministerium für Bildung und Forschung im Rahmen der Medizininformatik-Initiative (MII) gefördert.
Unser Fokus liegt auf der algorithmischen Phänotypisierung, d.h. softwaregestützten Identifikation von Individuen oder Kohorten mit bestimmten Merkmalen (Phänotypen). Nach einer ontologischen Analyse des Phänotyp-Begriffs haben wir eine Methode zur Modellierung des phänotypischen Wissens entwickelt. Die auf diese Weise entwickelten Phänotyp-Modelle sind strukturiert, erklärbar und ausführbar. Das bedeutet, dass auf ihrer Grundlage Abfragen definiert und auf verschiedenen Datenquellen ausgeführt werden können. Etablierte medizinische Terminologien wie LOINC oder SNOMED spielen dabei eine wichtige Rolle für die Identifikation relevanter Daten in der Datenquelle. Phänotypische Modelle können beispielsweise zur Erkennung bestimmter Krankheiten, zur Risikoabschätzung, zur Vermeidung unerwünschter Ereignisse oder zur Identifizierung von Studienteilnehmern eingesetzt werden.
Ein weiterer Aspekt unserer Forschung ist die semantische Suche in Textdokumenten (z.B. klinischen Berichten). Hier entwickeln wir NLP-Verfahren (u.a. für Dokumenten-Clustering oder Terminologie-Extraktion), die eine Ontologie-basierte Suche unterstützen.
Wir implementieren beide Komponenten, d.h. die Phänotypisierung auf strukturierten Daten und die semantische Suche in Textdokumenten, in unserem sogenannten TOP Framework. Mit diesem Framework können Phänotyp-Modelle und Search Ontologies (Klassifikationen von Konzepten einer Textsuchanfrage) von Experten ohne IT-Kenntnisse entwickelt und auf den gewünschten Datenquellen ausgeführt werden. Das Ergebnis sind Datensätze, die alle Kriterien der Suchanfrage erfüllen - im ersten Fall Personen, die die definierten Phänotypen aufweisen, und im zweiten Fall Textdokumente, die die Konzepte enthalten oder durch sie repräsentiert sind.
Arbeitsgebiete
- Algorithmische Phänotypisierung
- Ontologische Grundlagen der Phänotypisierung
- Semantische Suche, Dokumenten-Klassifikation/-Clustering
- Verwaltung medizinischer Terminologien
- Ontologie-basierte Softwareentwicklung
- Entwicklung von Domänen-Ontologien
Projekte
Neben dem Hauptprojekt 'Entwicklung eines Terminologie- und Ontologie-basierten Phänotypisierungs-Frameworks' ist die Nachwuchsgruppe an den folgenden MII-Projekten beteiligt:
INTERPOLAR
Im INTERPOLAR entwickeln Domänenexperten mit dem TOP Framework Modelle zur Erkennung von unerwünschten Ereignissen (z.B. medikamentenbedingten Gesundheitsrisiken oder unerwünschten Arzneimittelwechselwirkungen).
GeMTeX
Das GeMTeX Projekt wird ein umfangreiches anonymisiertes deutschsprachiges Textkorpus mit klinischen Texten zur Verfügung stellen. Unsere Aufgabe im Projekt ist es, einen halbautomatischen Workflow zur Klassifikation der Dokumente zu entwickeln. Auch hier soll das TOP Framework eingesetzt werden, in diesem Fall zur Modellierung von Search Ontologies, die eine semantische Suche unterstützen.
Lehre
- Es finden regelmäßig Schulungen/Workshops zu den Forschungsthemen der Nachwuchsgruppe statt. Falls Sie Interesse an einer Schulung haben, nehmen Sie bitte Kontakt mit uns auf.
- Die Nachwuchsgruppe führt eine Vorlesung und eine Übung zum Thema 'Ontologie-basierte Phänotypisierung' im Rahmen der Vorlesungsreihe 'Data Warehouses und Data Repositories für medizinische Versorgung und Forschung' durch.
Team
Arbeitsgruppenleiter
Universität Leipzig
Institut für Medizinische Informatik, Statistik und Epidemiologie
Härtelstraße 16-18
04107 Leipzig