Previous Entry Share Next Entry
Гугл хочет хранить ваш геном
фукоша
dzekh
Гугл делает шаг навстречу больницам и университетам. У вас есть геномы? Мы идем к вам!
Перевод статьи Google Wants to Store Your Genome By Antonio Regalado on November 6, 2014


Гугл Геномикс — первый продукт поискового гиганта Гугл для ДНК, облачный сервис, который был запущен в марте прошлого года, но остался по большей части незамеченным на фоне шквала громких научно-исследовательских заявлений Гугла, на подобии заявления в прошлом месяце о невероятном плане борьбы с раком с помощью наночастиц. (читайте “Can Google Use Nanoparticles to Search for Cancer?”).

Гугл Геномикс может оказаться более значительным чем все эти «полеты на луну». Сбор и сравнение геномов тысячами, а в скором времени и миллионами стимулирует медицинские исследования в следующем десятилетии. Вопрос в том кто будет хранить эти данные, при том, что уже существует конкуренция между Амазоном, Гуглом, Ай-Би-Эм и Майкрософтом.

Гугл начал работу над Гугл Геномикс 18 месяцев назад встречей с учеными и созданием интерфейса, или АПИ, который поможет им помещать данные ДНК на сервер и проводить исследования используя ту же технологию обработки данных, которая индексирует сайты и следит за миллионами пользователей.


«Биологи переходят с исследований одного генома на исследования миллионов», говорит Дэвид Глейзер, ведущий разработчик и бывший глава разработки социальной сети Гугл+. «Мы видим благоприятную возможность в том как применить прорывы в технологиях обработки данных и помочь биологам с этим переходом.

Некоторые исследователи с насмешкой говорят о том, что данные генома остаются слишком сложны для Гугла. Но другие видят в этом большую перспективу. Когда Атул Батт, эксперт по биоинформатике в Стэнфорде услышал представленные Гуглом планы на этот год, он заметил что теперь он понимает «как почувствовали себя турагенты когда они увидели «Экспедию».

Взрыв данных произойдет когда лаборатории освоят новое, более быстрое оборудование для декодирования ДНК. Например институт Броад в Кембридже, штат Массачусетс, сообщил что в течении октября он декодировал эквивалент одного человеческого генома каждые 32 минуты. Это около 200 терабайт данных.

Этот поток данных меньше того, что обычно обрабатывается большими интернет компаниями (больше двух месяцев, Броад будет обрабатывать эквивалент того что загружается на Ютьюб в течении одного дня) хотя и больше того с чем какие-либо биологи имели дело. Это то, что порождает сейчас большие, часто коммерческие, усилия для централизованного хранения и доступа к данным. Национальный институт рака сообщил что в последнем месяце он заплатит 19 миллионов долларов за перемещение 2,6 петабайт копий геномов в облако. Копии геномов нескольких тысяч раковых пациентов будут находиться на Гугл Геномикс и в дата-центрах компании Амазон.

Идея состоит в создании «облака раковых геномов» в котором ученые могут делиться информацией и быстро запускать виртуальные эксперименты, так же легко как искать в интернете, говорит Шейла Рейнольдс, исследователь института системной биологии в Сиэтле. «Не каждый имеет возможность загрузить петабайты данных или вычислительные мощности для работы с ними».

Так же ускорение перемещения данных ДНК в облако запустило войну цен между Гугл и Амазон. Гугл говорит — сейчас расходы на хранение обработку данных генома составляют около 25 долларов в год. Исходные научные данные представляющие геном одного человека составляют около 100 гигабайт, в то время как обработанная версия данных персонального генетического кода занимает меньше одного гигабайта. Хранение такой версии будет стоить всего 25 центов в год.

Облачное хранилище дает толчок сатрапам таким как Тют Геномикс, ДиЭнЭйНексус, Севен Бриджес и НекстКод Хелс. Эти компании создают «браузер», который смогут использовать больницы и исследователи для изучения генетических данных. «Гугл или Амазон это поддержка. Они говорят, «Эй, ты можешь построить геномную компанию в нашем облаке», говорит Дениз Кюрал, исполнительный директор Севен Бриджес, которые хранят геномы от имени 1600 исследователей в облаке Амазона.

Основная мысль, говорит он, состоит в том, что медицина скоро будет полагаться на глобальный ДНК-интернет, в котором доктора смогут искать необходимую информацию. «Говоря другими словами, если бы я в будущем заболел раком легких, врачи смогли бы обработать мой геном и геном моей опухоли, затем сделать запрос в базу данных 50 миллионов других геномов, результатом чего могло бы быть: «Хэй! Вот лекарство которое подходит тебе наилучшим образом!»

Глейзер из Гугл говорит, что он начал работать на Гугл Геномикс сразу, как стало ясно, что биология собирается перейти от «кустарного производства к фабричным масштабам обработки данных». Он начал изучать генетику, брал онлайн уроки, изучал основы биологии, учился у шефа Эрика Ландера. Он так же отправил свой геном в облачное хранилище Гугл.

Глейзер не сообщает насколько велика Гугл Геномикс или как много клиентов у них сейчас, но по крайней мере 3500 геномов из публичных проектов уже хранятся на серверах Гугл. Так же он говорит, что пока еще нет связи между между облачным хранилищем Гугл и его более спекулятивными усилиями в области здравоохранения, такими как, возникшая в этом году компания Калико созданная для исследований продления человеческой жизни. «Все что связывает их — это растущее осознание того, что технологии могут обогатить и расширить исследования человеческой жизни», говорит Глейзер.

Сомали Датта, физик, которая управляет крупнейшим компьютерным кластером Стэнфордского Университета предназначенным для хранения генетических данных, говорит, что из-за недавнего снижения цен, хранить данные в Амазон или Гугл стоит сейчас примерно столько же, сколько и в их собственном дата-центре. «Цены наконец становятся разумными, и мы думаем что они будут продолжать снижаться» — говорит она.

Датта говорит что некоторые ученые в Стэнфорде начали использовать базу данных Гугл, БигКвери, которую команда Глейзера сделала удобной для хранения генетических данных. Она была разработана для анализа больших баз данных спама, документов и информации о пользовательских покупках. Но она также может быстро выполнять очень большие расчеты, сравнивая тысячи или десятки тысяч, человеческих геномов — то, что хотят попробовать исследователи. «Иногда они хотят делать сумасшедшие вещи, и вы должны масштабироваться, чтобы сделать это», говорит Датта. «Она может обрабатывать те масштабы которые может давать генетика, так что это подходящая технология для таких задач».

?

Log in

No account? Create an account