Semantische Technologien in der translationalen Forschung

Seit der Entschlüsselung des genetischen Codes beginnend mit der Strukturaufklärung der Erbsubstanz im Jahr 1953 durch Watson, Crick, Wilkins und Franklin sind wir in der Molekularbiologie mit einer explosionsartigen Erweiterung unseres Wissens konfrontiert. Die Datenbank Pubmed liefert unter dem Suchbegriff „gene“ mehr als 75.000 Seiten mit Titeln (!) wissenschaftlicher Veröffentlichungen. Idealerweise sollten sich die im Labor gewonnen Erkenntnisse direkt am Krankenbett umsetzen lassen, also „from bench to bed“ erfolgen. Tatsächlich verläuft dieser Prozess quälend langsam. Selbst innerhalb der existierenden praktischen Anwendungen macht sich ein ähnliches Problem bemerkbar. Hier klafft eine gewaltige Lücke zwischen Diagnostik und erfolgversprechenden Therapiemöglichkeiten. So lassen sich unzählige Erbkrankheiten im Kindesalter oder sogar bei Ungeborenen nachweisen, selbst wenn die eigentliche Krankheit, z.B. die Chorea Huntington, sich erst im Alter von 30 oder 40 Jahren manifestiert und dann fast sicher zum Tode führt. Ziel ist es daher, die Lücken zwischen biowissenschaftlichen Erkenntnissen und medizinischer Anwendung sowie die Lücken zwischen Diagnostik und Therapie zu verringern. In diesem Zusammenhang spricht man von translationaler Forschung.

Zu diesem Zweck müssen Experten der unterschiedlichsten Richtungen eng zusammenarbeiten. 
Das bedeutet Austausch von Informationen, Wissen und Ideen über alle Grenzen hinweg. 
Ein unverzichtbares Medium der interdisziplinären Zusammenarbeit ist das Internet. Das Internet erlaubt den Zugang zu

  • wissenschaftlichen Veröffentlichungen (Volltexte oder wenigstens Zusammenfassungen der Arbeiten)
  • experimentellen Daten
  • Datenbanken zu Genen, Erkrankungen, Krankheitserregern
  • informellen wissenschaftlichen Diskurs
  • zahlreichen Fachforen

Wie wir alle aus eigener Erfahrung wissen, ist eine Internetrecherche wie ein Angelausflug: Um einen "dicken Brocken" zu erwischen, braucht man Glück und Geduld. Die Struktur des Netzes ist äußerst heterogen, die Datenformate sind nicht nach logischen Gesichtspunkten miteinander verküpft. Das "intelligente Mitdenken", was der User der Suchmaschine gemeint haben könnte, ist bislang nicht die Stärke von Google & Co . Bei einer Recherche zum Thema Haiunfälle landet man schnell auf einer Seite, die über das letzte Spiel der Kölner Haie berichtet. Vor allem den interdisziplinären Forschungsrichtungen, und damit der Speerspitze der Wissenschaft fehlt eine logisch konsistente Repräsentation im Internet und Zugriffsmöglichkeit auf die Daten verwandter Forschungsgebiete. 

Moderne Verfahren der Biologie und Medizin wie z.B.

generieren Unmengen von Daten, und die Datenmenge in den Biowissenschaften wächst weiterhin exponentiell. Mittlerweile spricht man nicht mehr von Datenbanken, sondern von Datensilos. Bioinformatiker wären froh, wenn sie nur nach der Nadel im Heuhaufen suchen bräuchten; die Herausforderung heute ist viel größer, es muss erst einmal unter unzähligen Heuhaufen derjenige mit der Nadel identifiziert werden. Die anschließende Suche nach der Nadel im richtigen Haufen ist dann das geringere Problem.

Mit anderen Worten: das konventionelle Internet ermöglicht keine reibungslose Wissenstranslation von Labortisch zu Klinikbett.

Integration von Subspezialitäten in der Hirnforschung
Ein Bereich in dem es nicht mehr ohne ein integriertes Verständnis der einzelnen beteiligten Teildisziplinen geht, ist die Erforschung neurodegenerativer Erkrankungen wie

Oft liegt das Ziel darin, zu ermitteln, welche Genveränderungen bei diesen Erkrankungen statistisch gehäuft vorkommen. Hier genügen die Basismethoden der Molekularbiologie und Statistik. Sollen diese komplexen Erkrankungen jedoch vermieden oder erfolgreich behandelt werden, so müssen eine Vielzahl von Experten unterschiedlicher Fachrichtungen zusammenarbeiten. Es geht u.a. nicht ohne

  • Neurobiologen
  • Neurologen
  • Psychiater
  • Histologen (mikroskopische Anatomen)
  • Neurophysiologen
  • Biochemiker
  • Molekularbiologen
  • Genetiker
  • Bioinformatiker
  • Gesundheitswissenschaftler

Die einzelnen Spezialisten arbeitet in ihrer eigenen „Community“. Jede „Community“ spricht ihre eigene Sprache. Wenn der Psychiater gemeinsam mit dem Biochemiker auf ein Problem angesetzt wird, ist zu erwarten, dass sie sich nicht leicht mit der Verständigung tun. Wenn der Biochemiker auf sich allein gestellt, psychiatrische Aspekte der Alzheimer-Krankheit beurteilen soll, steht er ganz auf verlorenem Posten. Hier ist ein „Dolmetscher“ und Moderator hilfreich, der die beiden darin unterstützt, eine gemeinsame Kommunikationsbasis zu schaffen.

Die Alzheimer-Krankheit ist kein exotisches Randthema, sondern von immenser Bedeutung für unsere Gesellschaft und das Gesundheitswesen. Etwa 60% der weltweit 24 Millionen Demenzerkrankungen gehen auf das Konto von Alzheimer. Trotzdem existieren noch keine klaren Vorstellungen darüber, wie diese Erkrankung entsteht, wie man sie am besten behandelt oder wie sie vermieden werden kann. Die Forschung basiert auf der Untersuchung von alzheimerähnlichen Gehirnveränderungen in Labormäusen. Allein zur Ursache der Alzheimer-Krankheit existieren mindestens 27 verschiedene fundierte Hypothesen. Um eine solche Hypothese formulieren zu können muss u.a. auf Datenbanken zu den folgenden Gebieten zugegriffen werden

  • Mäusegenetik
  • Zellbiologie
  • Tierneuropsychologie
  • Proteinbiochemie
  • Neuropathologie

Nun stehen wir vor folgendem Dilemma: Im Gehirn von Alzheimerpatienten findet sich Amyloid, eine eiweißartige Ablagerung. Die Neuropathologen können sehr genau sagen, wann, wie und wo Amyloidablagerungen auftreten, Biochemiker können sehr genaue Auskünfte über Zusammensetzung und Struktur von Amyloidverbindungen geben. Niemand weiß jedoch, in welchem Zusammenhang Amyloid mit den Symptomen einer Alzheimer-Krankheit steht. Wenn wir uns die Erforschung komplexer Krankheitsbilder als Landkarte vorstellen, so finden sich darauf zahlreiche weiße Flecken, also Fragestellungen, für die sich keine der beteiligten Fachdisziplinen so recht zuständig fühlt. Nicht nur die einzelnen Subdisziplinen arbeiten weitgehend getrennt voneinander, sondern auch die Spezialisten für einzelne Krankheiten. So kann es passieren, dass sich der Neurobiologie, der auf Alzheimer spezialisiert ist und der Neurobiologe, der Morbus Parkinson erforscht, nicht viel zu sagen haben. Die verschiedenen Formen von „Niemandsland“ müssen zunächst erkannt werden, dann können die Vertreter der einzelnen Fachdisziplinen überlegen, wie sie die weißen Flecken auf der Landkarte untereinander aufteilen, bzw. wie sie die sich überschneidenden Felder gemeinsam verwalten. Oder – und dies ist realistischer - man überlässt die Entdeckung des Niemandlandes und die Bearbeitung des „Gemeingutes“ einfach dem Zufall. Das kann allerdings zur Konsequenz haben, dass trotz jahrzehntelanger Erforschung eines Leidens und Einsatz vieler Milliarden Dollar/ Euro die Krankheitsbelastung der Bevölkerung unverändert bleibt oder sogar noch zunimmt.

Das Semantische Web
Das Semantische Netz ist eine Erweiterung des existierenden Internets. Unter Nutzung semantischer Technologien lassen sich z.B. Homepages im wissenschaftlichen Bereich in einen Sinnzusammenhang zueinander bringen. (Siehe: Einführung in das Web 3.0). Einzelne Begriffe werden in der grammatikalischen Struktur „Subjekt-Prädikat-Objekt miteinander („Tripples“). Die einzelnen Objekte stehen daher nicht mehr isoliert und unabhängig voneinander da, sondern sind über Beziehungen (semantisch, „sinnhaft“) miteinander verbunden. Ein weiteres wichtiges Hilfsmittel der semantischen Vernetzung sind die „Uniform Resource Identifiers“ (URIs) die eine eindeutige Zuordnung von Begriffen erlauben, und damit helfen, eine „babylonische Sprachverwirrung“ zu vermeiden. Ein URI besteht aus fünf Teilen: scheme (Schema), authority (Anbieter), path (Pfad), query (Abfrage) und fragment (Teil), dabei müssen lediglich scheme und path in jedem URI enthalten sein. Beispiele für scheme sind http oder doi (digital object identifier, erlaubt u.a. eine Identifizierung von Online-Artikeln). Alle Informationen im www können damit prinzipiell auch in einem semantischen Netzwerk erfasst werden. Konsequent umgesetzt erlauben bereits diese relativ einfachen Methoden eine bessere Organisation von Wissen.

Weitere wesentlichen Instrumente im „semantischen Werkzeugkasten“ sind:

Das Semantisches Web in der biomedizinischen Forschung
Welche Vorteile könnte die Nutzung des Semantischen Web in der translationalen Forschung bringen. Das Internet ist das dominierende Medium zur Verbreitung und zum Austausch von Informationen. In Verbindung mit einer intelligenten Aufbereitung und Organisation von Wissen bietet das Internet eine Chance auf deutliche Beschleunigung des translationalen Prozesses. Hierzu ein Beispiel, das veranschaulicht, wie die wissenschaftliche Detektivarbeit unter Nutzung Semantischer Technologien aussehen kann (s. Quelle Ruttenberg 2007):

  • Eine Wissenschaftlerin arbeitet in einer klinischen Forschungseinrichtung mit Schwerpunkt Alzheimer-Krankheit. Dort wurde ein experimenteller Impfstoff, der die Ablagerung von Amyloid verhindern sollte, getestet. Der Impfstoff führte bei 15 Studienteilnehmern tragischerweise zu einer Gehirnentzündung. Trotzdem blieb die Community der Alzheimer Forscher weiterhin optimistisch hinsichtlich des Einsatzes von Anti-Amyloid-Impfstoffen. Die vermeintlich schädliche Amyloidvorstufe, die es zu beseitigen gilt, heißt Abeta52. Die Forscherin tippte in ihre Semantische Webdatenbank die Begriffe „Abeta52“ und „Hypothese“ ein. Ihr Computer wirft eine Liste mit medizinischen Hypothesen aus, in denen Abeta52 eine Rolle spielt. Besonders interessant erscheint ihr die Hypothese, dass Abeta52 zu Gedächnisstörungen führen könnte. Hinweise hierzu lieferten jedoch lediglich Experimente mit transgenen Mäusen. Die Forscherin fragt sich, ob Abeta56 auch beim Menschen im frühen Stadium einer Alzheimer-Erkrankung gefunden werden kann. Daher ergänzt sie den Suchbegriff „human“. Ein direkter Zusammenhang unter Nutzung professioneller medizinischer Datenbanken wie Pubmed lässt sich nicht finden. Die Nutzung der semantischen Programme liefert jedoch einen Hinweis. Bestimmte Moleküle (ADDL), die an Amyloid binden, sind in der Rückenmarkflüssigkeit von Alzheimerpatienten durchschnittlich um den Faktor 8 erhöht. Nun werden die Begriffe ADDL („Amyloid-beta Derived Diffusable Ligands“) und „Hypothese“ eingegeben. Während sich ein Zusammenhang von Abeta52 und menschlichem Alzheimer nicht finden ließ, zeigt die semantische Datenbank eine Verknüpfung zwischen ADDL und der Hemmung der Ausschüttung von Botenstoffen (Neurotransmittern) im Bereich des Hippocampus, einer Region des Gehirns, die eine wichtige Rolle bei der Gedächtnisfunktion spielt. Die Wissenschaftlerin verfolgt nun eine zweite Spur. Das Amyoid führt zu einer Hemmung einer ganz speziellen Sorte von Kalium-Kanälen. Kalium-Kanäle dienen der Weitergabe elektrischer Impulse zwischen Nervenzellen. Sie sucht nun nach der Sorte von Nervenzellen, die beim frühen Alzheimer betroffen sind und parallel nach den Nervenzellen, die den besonderen Kalium-Kanal an ihrer Oberfläche tragen. Das Ergebnis ist interessant: Nervenzellen, die den Kalium-Kanal aufweisen und in der Frühphase des Alzheimers betroffen sind, finden sich im Nucleus basalis Meinert, der Fasern zur Großhirnrinde führt und im Hippocampus. Die Nutzung einer in die Semantische Database integrierte Pharmakologische Datenbank liefert den Hinweis, dass Amyloid in den beschriebenen Nervenzelltypen, den Calciumstoffwechsel durcheinander bringt, was wiederum zu Funktionsstörungen und schließlich einem Verkümmern der Zellen führt. Damit hat die Forscherin einige brauchbare Belege dafür gefunden, dass sowohl Amyloid als auch ADDL alzheimerrelevante Nervenzellen schädigen können. Damit könnte eine Ausschaltung oder Verminderung dieser Moleküle Patienten mit früher Alzheimer Erkrankung tatsächlich einen Vorteil bringen. Da der Versuch einer aktiven Immunisierung durch direkte Zufuhr dieser Moleküle als Impfantigen mit einer zu hohen Nebenwirkungsrate (Gehirnentzündung) einher ging, wäre eine passive Immunisierung mit bereits „vorgefertigten“ Antikörpern ein weiterer Ansatz um den gleichen positiven Effekt („Wegfangen“ von Amyloidvorstufen und ADDL) mit vielleicht weniger Nebenwirkungen zu erreichen. Die Herstellung solch spezieller Präparate würde die Möglichkeiten der Forschungsklinik jedoch übersteigen, darum wird auch hier wieder die Semantische Database mit integrierter Antikörperdatenbank konsultiert. Die Suche ergibt sehr schnell eine Reihe von Biotechfirmen, die diesen hochspezifischen monoklonalen Antikörper anbieten. Die Forscherin sucht sich ein Angebot zu einem möglichst günstigen Preis heraus und bestellt das Präparat zur Durchführung weiterer Experimente per E-Mail.

Fazit
Im Labor gewonnenes Wissen effizient zum Nutzen der Patienten anzuwenden, ist eine der großen Herausforderungen der Gesundheitssysteme im 21. Jahrhundert. Mit Etablierung Semantischer Netzwerke könnte ein Medium geschaffen werden, dass die Wissenstranslation von „bench to bed“ deutlich erleichert. 

Quelle

  • Ruttenberg A, Clark T, Bug W, et al. Advancing translational research with the Semantic Web. BMC Bioinformatics 2007; 8: S2
  • The role of frame-based representation in reasoning. Computer Science and Electrical Engineering. Ifikes R., Kehler T.

MD Medicus Imagevideo

 
  1. MD Medicus
  2. Gesundheitsberatung & Pflegeassistance
  3. Haus-Service & Telemedizin
  4. Versorgungs- & Reha-Management
  5. International Beraten / Reisebüro / Dolmetscher Service
  6. Reise- & Tropenmedizin
  7. Medical Service Balear
  8. Auslands- & Firmenassistance