Krebs Genome in einer gemeinsamen Datenbank und die Berechnung von Krankheit Treiber

UCSC Krebs Genomics-Hub verwalten und analysieren von „big data“ gesammelt, die von Krebs-Forscher

Die aufstrebenden Gebiet der „personalisierten“ oder „Präzision“ Medizin hält große Versprechen im Kampf gegen Krebs. Wenn Wissenschaftler identifizieren genetische Veränderungen, die fahren jeden Patienten die Krebs Zellen, Sie können diese Informationen nutzen, um die Entwicklung von gezielten Therapien. Aber die Erreichung dieses Ziels erfordert massive Mengen von genomischen und klinischen Daten, und eine komplexe Infrastruktur zu verwalten und die Daten analysieren.

Die University of California, Santa Cruz, hat sich nun erledigt ein Erster Schritt in den Aufbau dieser Infrastruktur, sagte der UC Santa Cruz Bioinformatik-Experte David Haussler. Haussler hat das team etabliert, die Krebs Genomics-Hub (CGHub), eine large-scale-Daten-repository und das user-portal für das National Cancer Institute ist Krebs-Genom-Forschungs-Programme. CGHub die erste „beta“ Version ist die Bereitstellung von Krebs-Forscher mit effizienten Zugang zu einer großen und schnell wachsenden speichern von wertvollen biomedizinischen Daten. Das Projekt wird finanziert durch das National Cancer Institute (NCI) über einen 10,3 Millionen US-Dollar Vertrag mit SAIC-Frederick Inc., der Hauptauftragnehmer für den Frederick-Nationalen Laboratorium für Krebsforschung.

„Indem Forscher mit umfassenden Katalogen der wichtigsten genomische Veränderungen in vielen großen Typen und Subtypen von Krebs, die diese Bemühungen unterstützt die Entwicklung von mehr wirksame Möglichkeiten zur diagnose und Behandlung von Krebs,“ sagte Haussler, distinguished professor of biomolecular engineering in der Baskin School of Engineering an der UCSC und ein Howard Hughes Medical Institute investigator.

In der personalisierten Pflege, ärzte design Behandlungen, um bestimmte genetische Veränderungen gefunden, bei einem Patienten die Krebs-Zellen. Forscher versuchen zu katalogisieren, die alle genetischen Anomalien gefunden in verschiedenen Arten von Krebs und finden Zusammenhänge zwischen bestimmten genetischen Veränderungen und wie Patienten reagieren auf verschiedene Behandlungen. Der Umfang und die Komplexität der Informationen, die gesammelt wird, schafft eine kritische Herausforderung im Bereich der Daten-management.

Obwohl neuere Studien mit genetisch gezielte Behandlungen haben gezeigt, viel versprechende Ergebnisse, viel mehr Forschung ist notwendig, um Ihre weit verbreiteten Einsatz, sagte Haussler. „Es gibt nicht eine Magische Kugel, denn Krebs ist nicht eine Krankheit, oder sogar 100 Krankheiten. Jeder Fall von Krebs ist anders. Wir verbessern unser Verständnis der molekularen Biologie von Krebs und entwickeln computer-algorithmen, so dass wir analysieren die genetischen Veränderungen in einzelnen Patienten. Es wird einige Zeit dauern. Aber mit Krebs Genomik, wir werden schließlich wissen, unser Feind vollkommen.“

Haussler team montiert den ersten Entwurf des menschlichen Genoms im Jahr 2000 erstellt und pflegt die UCSC-Genom-Browser, einen web-basierten tool, das verwendet wird ausführlich in der biomedizinischen Forschung und dient als Plattform für mehrere große Projekte Genomik. Seine Gruppe Beiträge zu Krebs genomics-Forschung sind die Schaffung eines Krebs Genomics-Browser für die Analyse von Daten aus large-scale-Krebs-Studien.

Haussler s-Gruppe errichtet CGHub zur Unterstützung aller drei großen NCI Krebs-Genom-Sequenzierung Programme: Der Krebs-Genom-Atlas (TCGA), Therapeutisch Anwendbare Forschung zu Generieren Wirksame Therapien (TARGET), und die Krebs-Genom-Charakterisierung Initiative (CGCI). TCGA ist eine gemeinsame Anstrengung führte durch NGI und das Nationale Menschliches Genom-Forschungsinstitut Karte der genomischen Veränderungen, die in mindestens 20 Arten und Unterarten von Erwachsenen Krebs. Das ZIEL des Programms ist eine Verwandte Mühe, die Konzentration auf die fünf häufigsten Krebserkrankungen im Kindesalter, und die CGCI zur Verfügung stellt, genomische Daten von HIV-assoziierten Krebserkrankungen und bestimmte Lymphome und Krebserkrankungen im Kindesalter.

Diese Programme sind die Grundlage für die personalisierte Krebsbehandlung durch die Schaffung einer Datenbank, die Wissenschaftler auf der ganzen Welt anschließen können spezifische genomische Veränderungen mit klinischen Ergebnissen. Haussler hat die Gruppe war maßgeblich beteiligt bei der Analyse der Daten für die TCGA.

„TCGA ist, so dass uns für die erste Zeit, zu schauen, Krebs in der vollen molekularen detail,“ sagte Haussler. „Krebs ist eine Krankheit, verursacht durch Störung der DNA-Moleküle innerhalb der Zelle. Wann das Leben beginnt, jede Zelle hat im Körper die gleiche DNA. Im Laufe der Lebenszeit eines Menschen, jedoch sind einige Zellen können sich Veränderungen in Ihrer DNA, die Sie verursachen, zu gehen Schurken und vermehren sich ohne Kontrolle, erstellen der Krankheit, die wir Krebs nennen. Zum ersten mal nun sind wir in der Lage, um zu sehen, in einem einzelnen Patienten Krebszellen und schauen Sie sich alle genetischen Störungen, unter denen die molekularen Treiber von dieser person den Krebs.“

Derzeit gibt es nur wenige Situationen, in denen ärzte verschreiben einen Behandlungsplan auf der Grundlage der spezifischen genetischen Mutationen bei einem Patienten die Krebs-Zellen. Erwartet wird, zu ändern, wie Projekte wie TCGA -, ZIEL -, und CGCI ergeben einen umfassenden Katalog, den die Forscher verwenden können, um neue Angriffspunkte für Medikamente entdecken und Hinweise zur Verbesserung der Patienten-Ergebnisse. Aber es ist eine dringende Notwendigkeit für eine effiziente und benutzerfreundliche portal von Forschern Zugriff auf die Daten. Die NCI-Genom-Projekte produzieren unglaubliche Mengen von Daten.

„Die Größenordnung dieser ist weit über alles, was, denen in der medizinischen Forschung vor,“ sagte Haussler. „Jedes Genom Datei, die DNA-Datensatz aus einer tumor-oder normalgewebe, ist 300 Milliarde bytes. Und für jeden Fall gibt es zwei dieser Dateien, die Krebs-Genom und dem normalen Genom. Hinzu RNA-Sequenz-Daten und die Aussicht auf eine tiefer Sequenzierung in die Zukunft, und wir müssen planen, für bis zu einem terabyte (1.000 Milliarden Byte) für jeden Fall.“

TCGA erwirtschaftet gegenwärtig rund 10 Terabyte an Daten pro Monat. Zum Vergleich: das Hubble-Space-Teleskop angehäuft über 45 Terabyte Daten in seiner ersten 20 Jahre des Betriebs. TCGA Ausgang wird um das Zehnfache oder mehr in den nächsten zwei Jahren. In den nächsten vier Jahren, wenn das Projekt produziert ein terabyte an DNA-und RNA-Daten von jeweils mehr als 10.000 Patienten, es wird produziert haben 10 Petabyte an Daten (ein petabyte sind 1.000 Terabyte). Und TCGA ist nur der Anfang der Datenflut, sagte Haussler, der Feststellung, dass von 10.000 Fällen ist ein kleiner Bruchteil der 1,5 Millionen neue Krebsfälle diagnostiziert jedes Jahr in den Vereinigten Staaten allein.

Neue Daten-Kompressionsverfahren werden voraussichtlich reduzieren die Gesamt-Speicherplatz benötigt, damit der CGHub repository ist zunächst konzipiert zu 5 Petabyte-Bereich und ermöglichen weiteres Wachstum, wie gebraucht. Das ist immer noch eine riesige Menge von Daten, und CGHub wird, müssen die Anforderungen der Transfer von sehr großen Dateien.

Verwaltet von der UCSC team, die CGHub computer-system befindet sich am San Diego Supercomputer Center. Es ist verbunden durch high-performance-nationale Forschungs-Netzwerke zu den wichtigsten Zentren Bundesweit, die an diesen Projekten beteiligten, einschließlich der UCSC. Haussler team entwickelt und überwacht die Speicher-und computing-Infrastruktur für das repository, die eine automatisierte Abfrage und download-Schnittstelle für large-scale, high-speed verwenden. Es wird schließlich auch eine interaktive web-basierte Schnittstelle zu ermöglichen, Forscher zu durchsuchen und Abfragen von system-und herunterladen von benutzerdefinierten Datensätzen.

Es kann Jahre dauern für Krebs genomics-Forschung zu bringen, über wichtige Veränderungen in der Krebsbehandlung. Der erste Schritt, und der Fokus von der NCI cancer genomics-Programme, um zu ermitteln, welche genomische Veränderungen beteiligt sind, die in jede Art von Krebs und zu verstehen, die molekulare und klinische Effekte dieser änderungen. Dann biomedizinischen Forscher identifizieren müssen oder Behandlungsmethoden entwickelt zu blockieren, die Auswirkungen.

„Gerade jetzt, Krebsforschung braucht etwas, auf einem sehr großen Maßstab, wie der Large Hadron Collider physics“, sagte Haussler. „Stattdessen bringen subatomaren Teilchen zusammen, die in Hochenergie-Kollisionen und die Berechnung des Verhalten, wir bringen cancer Genome zusammen in eine gemeinsame Datenbank-und computing-die Krankheit-Fahrer.“

Schreibe einen Kommentar