Logo techoscience.com

Google Genomics Ist Ein Cloud-Dienst Nur Für DNA-Daten

Google Genomics Ist Ein Cloud-Dienst Nur Für DNA-Daten
Google Genomics Ist Ein Cloud-Dienst Nur Für DNA-Daten

Video: Google Genomics Ist Ein Cloud-Dienst Nur Für DNA-Daten

Video: Google Genomics Ist Ein Cloud-Dienst Nur Für DNA-Daten
Video: Cloud Datenschutz Deutschland – Google G Suite, Microsoft Azure, AWS DSGVO und GDPR konform nutzen 2023, April
Anonim

Google nähert sich Krankenhäusern und Universitäten mit einem neuen Pitch: Haben Sie Genome? Bewahren Sie sie bei uns auf.

Das erste Produkt des Suchgiganten für das DNA-Zeitalter ist Google Genomics, ein Cloud-Computing-Dienst, den er im März letzten Jahres gestartet hat, der jedoch größtenteils unbemerkt blieb, inmitten einer Flut hochkarätiger F & E-Ankündigungen von Google, wie etwa Ende letzten Monats über einen weit hergeholten Plan Kampf gegen Krebs mit Nanopartikeln.

SIEHE AUCH: Kann Google Nanopartikel verwenden, um nach Krebs zu suchen?

Google Genomics könnte sich als bedeutender erweisen als jeder dieser Mondschüsse. Das Verbinden und Vergleichen von Genomen zu Tausenden und bald zu Millionen wird die medizinischen Entdeckungen für das nächste Jahrzehnt vorantreiben. Die Frage, wer die Daten speichern wird, ist bereits ein Punkt des wachsenden Wettbewerbs zwischen Amazon, Google, IBM und Microsoft.

Google hat vor 18 Monaten mit der Arbeit an Google Genomics begonnen, sich mit Wissenschaftlern getroffen und eine Schnittstelle oder API erstellt, mit der sie DNA-Daten in ihre Serverfarmen verschieben und dort Experimente mit derselben Datenbanktechnologie durchführen können, die sie erstellt haben, um das Web zu indizieren und zu verfolgen Milliarden von Internetnutzern.

"Wir haben gesehen, wie Biologen von der Untersuchung eines Genoms nach dem anderen zur Untersuchung von Millionen übergegangen sind", sagt David Glazer, der Softwareentwickler, der die Bemühungen leitete und zuvor Leiter der Plattformentwicklung bei Google+, dem sozialen Netzwerk, war. "Die Möglichkeit besteht darin, Durchbrüche in der Datentechnologie anzuwenden, um diesen Übergang zu unterstützen."

Siehe auch: Mehr als 90% der menschlichen DNA ist nutzloser Junk

Einige Wissenschaftler verspotten, dass Genomdaten für Google zu komplex bleiben, um sie zu unterstützen. Aber andere sehen eine große Veränderung. Als Atul Butte, ein Bioinformatik-Experte in Stanford, hörte, wie Google seine Pläne in diesem Jahr vorstellte, bemerkte er, dass er jetzt verstehe, "wie sich Reisebüros fühlten, als sie Expedia sahen".

Die Explosion von Daten geschieht, wenn Labore neue, noch schnellere Geräte zur Dekodierung von DNA einsetzen. Zum Beispiel sagte das Broad Institute in Cambridge, Massachusetts, dass es im Oktober alle 32 Minuten das Äquivalent eines menschlichen Genoms entschlüsselte. Das entsprach ungefähr 200 Terabyte Rohdaten.

Das ist weniger als das, was große Internetunternehmen routinemäßig erledigen (über zwei Monate wird Broad das Äquivalent dessen produzieren, was an einem Tag auf YouTube hochgeladen wird), aber es übertrifft alles, was Biologen behandelt haben. Dies erfordert jetzt große Anstrengungen, Daten an zentralen, häufig kommerziellen Standorten zu speichern und darauf zuzugreifen. Das National Cancer Institute gab im vergangenen Monat bekannt, dass es 19 Millionen US-Dollar zahlen würde, um Kopien des 2,6-Petabyte-Krebsgenomatlas in die Cloud zu verschieben. Kopien der Daten von mehreren tausend Krebspatienten werden sowohl bei Google Genomics als auch in den Rechenzentren von Amazon gespeichert.

Die Idee ist, "Krebsgenomwolken" zu schaffen, in denen Wissenschaftler Informationen austauschen und schnell virtuelle Experimente durchführen können, so einfach wie eine Websuche, sagt Sheila Reynolds, eine Wissenschaftlerin am Institut für Systembiologie in Seattle. "Nicht jeder hat die Möglichkeit, ein Petabyte an Daten herunterzuladen, oder die Rechenleistung, um daran zu arbeiten", sagt sie.

Ein jahrelanger Preiskampf zwischen Google und Amazon hat auch die Verlagerung von DNA-Daten in die Cloud beschleunigt. Google sagt, dass es jetzt ungefähr 25 US-Dollar pro Jahr kostet, um ein Genom zu speichern, und mehr, um Berechnungen daran durchzuführen. Wissenschaftliche Rohdaten, die das Genom einer einzelnen Person darstellen, sind etwa 100 Gigabyte groß, obwohl eine polierte Version des genetischen Codes einer Person weitaus kleiner ist als ein Gigabyte. Das würde nur 0,25 Cent pro Jahr kosten.

Cloud-Speicher geben Startups wie Tute Genomics, Seven Bridges und NextCode Health einen Schub. Diese Unternehmen bauen "Browser", mit denen Krankenhäuser und Wissenschaftler genetische Daten untersuchen können. "Google oder Amazon ist ein Back-End. Sie sagen:" Hey, Sie können ein Genomik-Unternehmen in unserer Cloud aufbauen ", sagt Deniz Kural, CEO von Seven Bridges, das Genomdaten für 1.600 Forscher in der Amazon-Cloud speichert.

Der größere Punkt, sagt er, ist, dass die Medizin bald auf einer Art globalem Internet der DNA beruhen wird, nach dem Ärzte suchen können. "Unsere Vogelperspektive ist, dass Ärzte, wenn ich in Zukunft an Lungenkrebs erkranken sollte, mein Genom und das Genom meines Tumors sequenzieren und sie dann anhand einer Datenbank mit 50 Millionen anderen Genomen abfragen werden", sagt er. "Das Ergebnis wird sein 'Hey, hier ist das Medikament, das am besten für dich wirkt.'"

Bei Google sagte Glazer, er habe mit der Arbeit an Google Genomics begonnen, als klar wurde, dass die Biologie von der "handwerklichen zur Produktion von Daten im Fabrikmaßstab" übergehen würde. Zunächst unterrichtete er sich selbst in Genetik und nahm an einem Online-Kurs zur Einführung in die Biologie teil, der von Broads Chef Eric Lander unterrichtet wurde. Er ließ auch sein Genom sequenzieren und legte es in Googles Cloud.

Siehe auch: Wissenschaftler fordern eine sorgfältige Regulierung der Genombearbeitung

Glazer würde nicht sagen, wie groß Google Genomics ist oder wie viele Kunden es jetzt hat, aber mindestens 3.500 Genome aus öffentlichen Projekten sind bereits auf den Servern von Google gespeichert. Er sagt auch, dass es noch keinen Zusammenhang zwischen der Cloud von Google und den spekulativeren Bemühungen im Gesundheitswesen gibt, wie das in diesem Jahr von Google gegründete Unternehmen Calico, um zu untersuchen, wie die Lebensdauer des Menschen verlängert werden kann. "Was sie verbindet, ist nur eine wachsende Erkenntnis, dass Technologie den Stand der Biowissenschaften vorantreiben kann", sagt Glazer.

Somalee Datta, eine Physikerin, die den größten Computercluster der Stanford University für Genetikdaten verwaltet, sagt, dass die Speicherung von Genomen bei Google oder Amazon aufgrund der jüngsten Preissenkungen jetzt ungefähr genauso viel kostet wie in ihrem eigenen Rechenzentrum. "Die Preise werden endlich vernünftig und wir glauben, dass sie weiter fallen werden", sagt sie.

Laut Datta haben einige Stanford-Wissenschaftler damit begonnen, ein Google-Datenbanksystem, BigQuery, zu verwenden, das das Team von Glazer mit Genomdaten kompatibel gemacht hat. Es wurde entwickelt, um die Aktivitäten von Web-Surfern im Internet zu verfolgen, kann aber auch schnell sehr umfangreiche Experimente durchführen, bei denen Tausende oder Zehntausende von Genomen von Menschen verglichen werden, die Forscher ausprobieren möchten. "Manchmal wollen sie verrückte Dinge tun, und dafür braucht man Skalierung", sagt Datta. "Es kann mit der Größenordnung umgehen, die die Genetik mit sich bringen kann. Es ist also die richtige Technologie für ein neues Problem."

  • Dieser alarmierend einfache Hack könnte jeden am Klima basteln lassen
  • Eine Strategie zur Abtötung von Zellen zur Verlangsamung des Alterns hat in diesem Jahr ihren ersten Test bestanden
  • Wann werden wir fliegende Autos haben? Vielleicht früher als du denkst.
  • Preisalgorithmen können lernen, miteinander zu kollidieren, um die Preise zu erhöhen

Dieser Artikel wurde ursprünglich bei MIT Technology Review hier veröffentlicht

Beliebt nach Thema