Ще ви намерим: ДНК търсенето, използвано за набиране на Golden State Killer, може да се настани в около 60% от белите американци

Джоузеф Деанджело, заподозреният убиец на Голдън Стейт

Ранди Пенч / TNS / Newscom

Ще ви намерим: ДНК търсенето, използвано за набиране на Golden State Killer, може да се настани в около 60% от белите американци

От Джоселин КайзерОкт. 11, 2018 г., 14:00 ч

Ако ти бял, бял, живееш в Съединените щати и далечен роднина е качил ДНК в публична база данни за потекла, има голям шанс интернет султа да може да те идентифицира от ДНК проба, която си оставил някъде. Това е заключението на ново проучване, което установява, че комбинирайки анонимна ДНК проба с някаква основна информация, като например груба възраст на някого, изследователите биха могли да ограничат самоличността на този човек до по-малко от 20 души като започнете с ДНК база данни от 1, 3 милиона индивида.

Подобно търсене би могло да позволи идентифицирането на около 60% от белите американци от ДНК проба, дори ако те никога не са предоставили собствената си ДНК в база данни за потекло. "След няколко години това наистина ще бъде всеки", казва ръководителят на проучването Янив Ерлих, изчислителен генетик в Колумбийския университет.

Проучването е предизвикано от априлския арест на предполагаемия G Golden State Killer мъж на Калифорния, обвинен в серия от десетилетия изнасилвания и убийства. За да го намерят и повече от дузина други заподозрени за престъпления оттогава правоприлагащите органи първо тестват ДНК проба на местопрестъплението, която може да бъде стара кръв, коса или сперма, за стотици хиляди ДНК маркери signposts по протежение на генома, които варират при хората, но чиято идентичност в много случаи е споделена с кръвни роднини. След това те качват данните за ДНК в GEDmatch, безплатна онлайн база данни, където всеки може да сподели своите данни от компании за тестване на ДНК за потребители като 23andMe и Ancestry.com, за да търси роднини, подали своето ДНК. Претърсването на GEDMatch s близо 1 милион профила разкри няколко роднини, които са еквивалентни на трети братовчеди на ДНК на местопрестъплението, свързани с убиеца на Голдън Стейт. Друга информация, като генеалогични записи, приблизителна възраст и местопрестъпления, позволи на слеутите да се настанят на един човек.

Генетиците бързо спекулират, че този подход може да идентифицира много хора от неизвестна последователност на ДНК. Но за да определят колко точно, Ерлих и колегите погледнаха по-отблизо базата данни на MyHeritage, която съдържа 1, 28 милиона ДНК профила на хора, преглеждащи семейната им история. (Ерлих е главен научен ръководител на компанията за тестване на ДНК по произход.) Ако живеете в Съединените щати и сте от европейско потекло, има 60% шанс да имате трети братовчед или по-близък роднина в тази база данни, екипът прогнозира, Коефициентът им на успех беше подобен, когато те търсеха 30 произволни профила в GEDmatch. (Коефициентът пада до 40% за някой от субсахарските африкански произход в базата данни на MyHeritage.)

Ако приемем, че имате роднина в някоя от тези бази данни, какви са шансовете полицията да ви открие от неидентифицирана ДНК проба, по начина, по който те набиха предполагаемия убиец на Голдън Стейт? За да разберат, Ерлих и колегите му комбинираха информацията от базата данни на MyHeritage с родословни дървета и демографски данни като груба възраст и вероятно географско местоположение. Средно това им позволи да използват хипотетична ДНК последователност, за да се настанят на 17 „заподозрени“ от група от около 850 души, съобщава днес екипът в Science.

GEDmatch вероятно обхваща само около 0, 5% от възрастното население на САЩ, но милиони американци използват услугите за тестване на ДНК потомство. След като цифрата на GEDmatch нарасне до 2%, повече от 90% от хората от европейски произход ще имат трети братовчед или по-близък роднина и могат да бъдат открити по този начин. „Учудващо е колко малка трябва да бъде базата данни“, казва популационният генетик Ноа Розенберг от Станфордския университет в Пало Алто, Калифорния, който не е участвал в работата.

Розенберг и колегите му показаха миналата година, че профилът в потребителска ДНК база данни може да бъде съпоставен с профила на същия човек в криминалистични бази данни за правоприлагащи органи, въпреки че те използват различен, по-малък набор от ДНК маркери. Днес в Cell съобщават, че повече от 30% от лицата в базата данни на криминалистиката също могат да бъдат свързани с близък, родител или дете в потребителска база данни. Двата типа бази данни комбинирани могат да улеснят още по-лесното намиране на заподозрян от ДНК проба. Свързаният ДНК профил на потребител може също да разкрие физически вид или медицинска информация за престъпник или техните близки, като гени за цвят на очите или заболяване, въпреки че не се предполага, че криминалистичните бази данни съдържат такъв вид информация. „С тях може да се направи повече, отколкото е заявено“, казва Розенберг.

Въпреки че тези проучвания са обнадеждаващи новини за разрешаване на престъпления, те предизвикват загриженост за поверителността на гражданите, които спазват закона, казва Ерлих. Едно от възможното решение, предложено от неговия екип е, че компаниите за тестване на ДНК на потребителите дигитално криптират данните на клиента и GEDMatch позволяват да се качват само тези криптирани файлове. По този начин органите на реда не могат да качват данни от ДНК последователността от собствената си лаборатория без сътрудничество на потекло на компанията. (Полицията не може просто да се преструва на клиент и да изпраща ДНК проби от местопрестъплението на компании като 23andMe, тъй като машините за секвениране обикновено не могат да обработват оскъдни, влошени ДНК проби.)

Ерлих също така смята, че американските служители трябва да преразгледат федералните правила, защитаващи хората, които доброволно участват в проучвания. Наскоро преработена насока за биомедицински изследователи, наречена Общо правило, предполага, че участник в изследването не може лесно да бъде идентифициран от анонимния им ДНК профил. Но в своята статия екипът на Ерлих използва GEDMatch, за да идентифицира жена, която е част от изследване, използвайки нейния анонимиран ДНК профил и дата на раждане, която често е публично достъпна за изследователите.

Експертите по генетична политика са съгласни, че са необходими промени в начина, по който функционират или са регулирани генеалогичните бази данни и фирмите за секвениране на ДНК. Цифровият подпис може да бъде „частично решение“, казва професорът по право Натали Рам от университета в Балтимор в Мериленд. Но всички участници в индустрията за секвенциране на ДНК директно до потребители трябва да се съгласят на тази схема, отбелязва тя. "Ако не, отново се връщаме към квадрат."

Вместо това тя и други наскоро спориха в Science, че щатите и Конгресът трябва да приемат закони, ограничаващи ситуациите, при които органите на реда могат да използват генеалогични бази данни, за да намерят заподозрени. Може да е разумно за дело за убийство, но не и за дребно престъпление, казва Рам. „Намирането на правилния баланс е важно.“