Ученые часто привлекают добровольцев для участия в генетических исследованиях, направленных на поиск генов, связанных с развитием врожденных болезней или предрасположенностью к некоторым заболеваниям. Зачастую участники таких экспериментов передают биологам свой генетический материал на условиях полной анонимности, которую им гарантируют организаторы опытов.
Группа биологов под руководством Янива Эрлиха (Yaniv Erlich) из Института биомедицинских исследований Уайтхэд в Кэмбридже (США) убедительно продемонстрировала, что личность анонимных добровольцев можно легко вычислить при помощи публично доступных данных в Интернете.
Авторы статьи оценили безопасность открытой базы геномов, подготовленной в рамках международного проекта HapMap, направленного на составление генетической «карты» мира. В этом проекте приняло участие несколько тысяч мужчин-добровольцев из всех стран мира, пожертвовавших образцы своей ДНК на условиях анонимности.
Эрлих и его коллеги заметили, что виртуальные геномы, а точнее сопроводительная информация к ним, содержала в себе несколько «проколов». Во-первых, она содержала в себе возраст донора, а во-вторых — страну и регион его проживания.
Исследователи выбрали из банка данных 32 добровольца, которые проживали в североамериканском штате Юта, и нашли в интернете перечень жителей этого штата. Это сократило число возможных «подозреваемых» в среднем до 10 тысяч мужчин в случае с каждым анонимным добровольцем.
Затем ученые посетили еще один сайт — одну из популярных генеалогических «социальных сетей», зарегистрировались в ней и извлекли фрагменты виртуальных геномов, которые в ней публиковали пользователи для поиска дальних и ближних родственников. Биологов интересовали так называемые однонуклеотидные полиморфизмы — изменения в одну «букву»-нуклеотид — в структуре мужской Y-хромосомы.
Ученым сразу удалось найти восемь пользователей этой «социальной сети», структура Y-хромосомы которых совпадала с фрагментами виртуальных геномов от анонимных доноров проекта HapMap. Эрлих и его коллеги отобрали пять самых достоверных совпадений и определили фамилии обладателей геномов, ориентируясь на возраст и другие доступные данные в традиционных социальных сетях и других открытых источниках информации.
Убедившись в действенности «шпионской» методики, ученые проверили ее в деле, используя другие банки геномов. По их словам, им не только удалось подтвердить личности других мужчин из проекта HapMap, но и «вычислить» имена и другие личные сведения для нескольких женщин, участвовавших в разных генетических исследованиях.
«Наша цель — лучше понять то, насколько легко мы можем определить принадлежность генома к тому или иному человеку. Мы надеемся, что наше исследование поможет выработать более совершенные алгоритмы защиты тайны, как во время хранения данных, при их подготовке или же на правовом уровне», — заключает Эрлих.