2020.11.30 (월)

  • 맑음동두천 -1.8℃
  • 맑음강릉 3.4℃
  • 맑음서울 0.6℃
  • 맑음대전 0.6℃
  • 맑음대구 3.3℃
  • 맑음울산 4.0℃
  • 맑음광주 3.1℃
  • 맑음부산 5.0℃
  • 흐림고창 2.7℃
  • 구름조금제주 8.5℃
  • 맑음강화 -2.3℃
  • 맑음보은 -2.1℃
  • 맑음금산 -1.1℃
  • 구름조금강진군 3.8℃
  • 맑음경주시 3.8℃
  • 맑음거제 ℃
기상청 제공

학술

웨어러블 분야에서 유실된 ‘활동량 데이터’ 복원하는 인공지능 대체법 개발

'JMIR mHealth and uHealth'에 7월 게재

URL복사
아주대 윤덕용 교수팀
14,000 여 명의 활동량 데이터 활용 / 
기존 대체법 기술들보다 약 15% 향상된 성능 보여




웨어러블 분야에서 주로 사용하는 활동량 데이터 즉, 신체에 착용한 기기를 통해 사람의 활동 강도를 측정한 데이터를 유실했을 때, 이를 복원하는 인공지능(AI) 기술이 개발됐다. 활동량 데이터를 대상으로 한 인공지능 기반 대체법은 이번 연구가 첫 시도다.

4차 산업혁명시대에 이어 코로나19로 인한 언택트(Untact·비대면)에 대한 요구가 급증하고 있다. 특히 스마트폰에 이어 스마트 워치, 피트니스 밴드 등을 통해 건강 상태와 활동·운동량을 측정하는 웨어러블(착용형 기기) 분야에 대한 관심이 높아지고 있어 이번 연구결과에 관심이 주목된다. 

아주대의료원 의료정보학과 윤덕용 교수팀은 미국 국민건강영향조사(NHANES) 12,475명, 한국 국민건강영향조사(KNHANES) 1,768명 그리고 아주대 바이오뱅크 177명 등 약 14,000명의 활동량 빅데이터와 딥러닝 인공지능 기술을 활용하여 유실된 활동량 데이터를 맥락에 맞게 복원시키는 기술을 개발했다고 밝혔다. 





연구팀은 이번에 개발한 인공지능 기반 대체법은 딥러닝 기술 중 오토인코더라는 기술을 활용하여 개발됐으며, 평균 20분 길이의 유실 데이터를 복원할 수 있다고 밝혔다. 오토인코더란 데이터로부터 스스로 학습하는 딥러닝 기술 중 하나로, 원본 데이터를 더 작게 압축하여 특징을 추출하고 이를 다시 복원할 수 있도록 설계된 딥러닝 모델이다.   

일반적으로 활동량 데이터 분석은 최소 24시간 관찰한 데이터를 이용하는데, 관찰과정에서 기기문제 혹은 사용자의 실수 등으로 데이터가 유실돼 연구에 활용하지 못하는 상황이 빈번하게 발생했다.

특히 연구팀의 인공지능을 기반으로 한 활동량 대체법은 그동안 이러한 문제를 해결하기 위해 개발된 기존의 대체법들에 비해 복원 성능이 더 높았다.

기존 활동량 데이터 대체법들과 비교할 때, 가장 최근에 개발된 Zero-inflated poisson regression 대체법에 비해 약 25% 향상된 복원 성능을 보였고, Bayesian regression 대체법과 비교하여 약 10% 향상된 복원 성능을 확인했다고 연구팀은 밝혔다.

이번 연구는 인공지능 스스로 활동량 데이터의 특징을 학습하여 유실된 활동량 데이터 복원을 학습하고 그 성능을 향상 시켰다는 점과 최초로 활동량 대체법에 딥러닝 기술을 적용한 연구란 점에서 의의가 있다. 

이번 연구진은 아주대병원의 생체신호 데이터베이스를 통해 환자 약 2만 5천명의 심전도 및 산소포화도 등과 같은 생체신호 데이터를 수집 및 분석을 수행해 왔다. 또한 연구진은 활동량 데이터도 생체신호와 유사하게 신체에 부착된 센서를 통해 수집된 데이터 중 하나며, 다양한 생체신호 분석 경험이 이번 활동량 데이터 대체법 연구결과에도 좋은 기반이 되었다고 전했다. 




윤덕용 교수는 “대량의 활동량 데이터 수집이 어려운 개인 연구자들에게 유실된 활동량 데이터는 치명적이다. 이번에 개발된 활동량 대체법이 개인 연구자들에게 도움이 되기를 바란다.”고 밝혔다.

한편 이번 연구결과는 2020년 7월 SCI급 학술지로 의료정보학 분야에서 가장 영향력 있는 국제 학술지 중 하나인 'JMIR mHealth and uHealth'에 ‘활동량 데이터에서 딥러닝 기반 유실 데이터 대체법 개발 (Deep Learning Approach for Imputaion of Missing Values in Actigraphy Data)’란 제목으로 게재됐다.


배너
배너