극단적 암호해독기를 이용한 개인맞춤형의학

  • 등록 2015.03.27 12:18:17
크게보기

KISTI 미리안 『글로벌동향브리핑』 2015-03-26


 미래 의학의 꿈은 DNA와 질병 사이의 연관성을 이해하는 것으로 이를 이용해서 개인맞춤형 의학을 만드는 것이다. 하지만 ‘개인맞춤형’ 또는 ‘정밀’의학을 연구하는 과학자들은 한 가지 문제를 마주하고 있다: 엄청나게 많은 클라우드-기반 분석을 통해 의미 있는 연결을 알아보는 과정에서 유전자 데이터와 의료기록을 어떻게 유지할 수 있는가에 대한 문제이다. 현재 데이터 암호화의 새로운 형식에 대한 테스트를 통해서 이러한 딜레마를 풀 수 있게 되었다.


캘리포니아 주립대학 샌디에고(UCSD)가 주최하는 워크숍에서 암호해독가들은 유전자 데이터의 테스트를 분석했다. 소규모 데이터세트를 가지고 동형암호화 (homomorphic encryption)라는 기법을 이용하여 이들은 질병과 연관되는 유전자 변이를 약 10분 동안 찾아냈다. 컴퓨터는 아직도 좀 더 실질적인 과제에 의해서 느려졌지만 (전체 유전체 크기의 수천 분의 1에 불과한 DNA단편에서 질병과 연관되는 변이와 같은 것이다) 암호해독 전문가들은 긍정적이었다. 이 워크숍을 조직하는데 도움을 준 UCSD의 컴퓨터 과학자인 샤오치안 쟝 (Xiaoqian Jiang)은 “이것은 긍정적인 결과이다. 하지만 아직 대규모로 검증해야 할 일이 많다”고 말했다. 

의사들이나 연구자들은 어떻게 유전자가 질병에 영향을 주는가에 대한 이해는 수백만 명의 사람들로부터 수집된 유전적이고 건강한 데이터가 필요하다고 생각한다. 이들은 이미 오바마 미국대통령이 발표한 정밀의학이니셔티브(Precision Medicine Initiative)와 영국의 100,000명 유전체 프로젝트 (100,000 Genomes Project)와 같은 프로젝트를 계획하기 시작했다. 이렇게 엄청난 과제는 아마도 네트워크 클라우드 컴퓨터와의 연결과 같은 엄청난 데이터를 처리하는 능력이 필요하지만 과거에 있었던 온라인 안전성 문제는 대규모의 민감한 데이터 세트를 클라우드로 처리하는 것의 위험성을 보여주고 있다. 국립보건연구원의 유전형 및 표현형 데이터베이스(database of Genotypes and Phenotypes, dbGaP)의 담당자들은 인터넷과 직접 연결된 컴퓨터에 저장된 데이터의 사용의 안전성에 대한 위험에 대해 우려하고 있다. 

동형암호화는 클라우드 상에서 수학적으로 암호화된 정보를 저장하도록 하여 이러한 문제를 해결할 수 있다. 한 지역의 컴퓨터에서 암호화된 데이터를 가지고 처리하여 클라우드에 암호화하여 업로드한다. 암호화된 데이터를 컴퓨터로 클라우드에서 처리하는 결과는 다시 지역 컴퓨터로 보내지게 된다. 만일 도둑이 이 암호화된 데이터를 가로챈다면 그 이면의 데이터는 안전하게 남게 될 것이다. 이 워크숍의 조직자이며 UCSD의 컴퓨터 과학자인 루실라 오노-마차도 (Lucila Ohno-Machado)는 “만일 이러한 기술이 작동한다면 엄청나게 많은 데이터를 컴퓨터로 처리하고 저장하면서 개인의 정보를 안전하게 처리할 수 있을 것”이라고 말했다. 

동형데이터 암호화는 1978년에 처음 제안되었으며 데이터를 암호를 조작하는데 클라우드가 사용하는 다른 형태의 암호화와는 다르다. 핵심적으로 이 클라우드는 실제로 그 숫자를 볼 수 없게 된다. 그리고 다른 암호화 방식과 달리 암호화가 되지 않은 데이터에 대한 계산과 같은 결과가 나온다. 하지만 이것은 2009년까지 이론적인 개념으로 암호해독가인 IBM 토마스 왓슨 연구센터(IBM Thomas J Watson Research Center)의 크레이그 젠트리(Craig Gentry)는 거의 모든 형태의 컴퓨터 처리과정에서 동형으로 암호화된 데이터를 처리할 수 있다는 가능성을 보여주었다. 이것은 각 데이터 포인트를 부호화된 정보 또는 부호화된 텍스트(cyphertext), 즉 원래 데이터 바이트보다 좀 더 크고 복잡하게 만들어진 것으로 전환되어 가능하다. 암호화되지 않은 데이터의 단일 바이트는 몇 메가바이트의 사이퍼텍스트로 부호화된다. 젠트리는 이러한 가능성을 보여주었지만 실질적으로 사용하기에는 아직 문제가 있었다. 

그 이후 암호해독전문가들은 이러한 문제를 해결하기 위한 시스템을 개발했으며 예를 들어 많은 부분의 데이터를 암호화하여 평행상태로 처리할 수 있거나 실제 숫자를 직접 단일 사이퍼텍스트로 전환시킬 수 있었다. 이러한 혁신은 각 데이터를 분리하여 컴퓨터로 암호화하는 것보다 시간이나 메모리가 적게 들어간다. 그 결과 동형암호화는 2009년보다 150,000배 빠르게 처리할 수 있다고 IBM 연구소의 햐이 할레비(Shai Halevi)는 말했다. 그는 “동일한 계산은 2012년에 하루 반이 걸렸다. 하지만 지금은 5분 밖에 걸리지 않는다. 지금은 사용하기에 충분히 빠른 속도를 갖고 있다”고 말했다. 

지난 3월 16일에 있었던 <iDASH 프라이버시 앤 시큐리티 워크숍(iDASH Privacy & Security Workshop 2015)>에서 다섯 개의 팀은 동형암호화방식을 선보였으며 이를 통해서 400명에게서 얻어진 데이터를 조사하는데 10분이 걸렸다. 이들은 유전체가 변이를 보이는 321개 지점에서 질병과 연관되는 변이를 찾아낼 수 있었다. 그 시간은 30분이 걸렸으며 전형적인 유전자 한 개의 크기보다 조금 큰 크기였다. 좀 더 큰 염기서열 데이터 (100,000 염기쌍 또는 전체 유전체의 0.003%)에 대해서 분석은 항상 가능한 것이 아니었다. 이 처리과정은 한 시간이 걸렸으며 컴퓨터의 비암호화된 데이터보다 100배 정도 많은 메모리를 써버렸다. 그렇다고 하더라도 암호해독 전문가들은 이 결과는 상당한 진보라고 평가했다. 쟝은 “우리의 도전은 3년전과 비교해서 완전히 불가능한 것은 아니라는 것을 보여주었다”고 말했다. 

하지만 일부 데이터 관리자들은 이러한 암호화에 대해 회의적이다. 국립생명공학 정보센터 (US National Center for Biotechnology Information)의 참고자료 콜렉션을 관리하는 스티븐 셰리 (Steven Sherry)는 dbGaP를 관리하고 있다. 그는 이것이 작동하더라고 암호화는 반드시 연구자의 컴퓨터의 데이터를 보호하거나 분석적인 유연성을 주지 않을 것이라고 말했다. 대신 소수의 과학자들이 자료에 접근하도록 최소화하고 데이터 사용에 대한 엄격한 규정과 규칙을 따르도록 하는 것이 최선이라고 그는 말했다. 셰리는 “우리는 암호화 방법을 보지 못했다. 그 이유는 이 방법이 안전하고 유용한지를 우리에게 보여주지 않았기 때문”이라고 말했다. 

하지만 일부 암호화 전문가들은 이미 생의학부분에서 제한된 동형암호화 시스템을 개발하고 있다. HIV 연구와 스위스의 바이오뱅크를 관리하는 담당자들은 이러한 방식을 사용하고 있다: 이들은 상대적으로 간단한 방식으로 데이터를 처리할 필요가 있다. 그래서 시스템이 복잡하게 작동될 필요가 없다. 이들은 잠재적으로 유전데이터의 유출을 우려하고 있다고 스위스 연방연구소 (Swiss Federal Institute of Technology)의 쟝 피에르 위보 (Jean Pierre Hubaux)는 말했다. 그는 이 시스템의 개발자이다. 그는 “사람들은 가까운 미래에 동일한 문제가 일어날 것이며 적절한 사전예방책이 없었다고 비판받을 것”이라고 말했다. 

출처: <네이처> 2015년 3월 24일 (Nature 519, 400–401 (26 March 2015) doi:10.1038/519400a)

http://www.nature.com/news/extreme-cryptography-paves-way-to-personalized-medicine-1.17174 

기자 news@mdon.co.kr
Copyright @이엠디(메디컴) All rights reserved.

PC버전으로 보기

(주)메디컴 ​서울특별시 금천구 벚꽃로 254 월드메르디앙1차 1405호 등록번호 : 서울 아03115 ㅣ등록연월일 : 2014.4.21ㅣ발행인 : 박경미 | 편집인 : 설명희ㅣ 청소년보호책임자 : 안경희 전화번호 : 02-6958-5434 ㅣ 팩스번호 : 02-6385-2347ㅣ 이메일 : news@mdon.co.kr Copyright @이엠디(주식회사 메디컴) All rights reserved