국민건강영양조사 가속도계 자료에서 미착용 시간 대체와 수면 알고리즘에 따른 수면시간 추정
Abstract
Objectives
This study aimed to improve the accuracy of sleep duration estimation from accelerometer data by addressing missing values caused by daytime non-wear periods. It also explored how different imputation methods and sleep algorithms affect sleep duration estimates.
Methods
We used accelerometer data from the Korea National Health and Nutrition Examination Survey (KNHANES). The study population included adults aged 19–64 years who wore accelerometers for at least 10 hours per day between 9 a.m. and 9 p.m. on at least three days. Non-wearing periods were defined as intervals of 60 or more consecutive minutes with zero activity counts. For missing value imputation, we applied zero-inflated Poisson log-normal (ZIPLN) mixed model imputation, multivariate imputation by chained equations (MICE), and a method combining predictive mean matching (PMM) with each method (ZIPLN+PMM, MICE+PMM). After imputation, sleep duration was estimated using six combinations of the Sadeh and Cole–Kripke algorithms with and without the Tudor–Locke approach.
Results
Cole–Kripke consistently produced longer sleep durations than the Sadeh algorithm. The raw data overestimated sleep duration relative to the imputed datasets, likely due to the misclassification of daytime non-wearing periods as sleep. Applying the Tudor–Locke 60-minute criterion resulted in shorter and more conservative sleep estimates. These trends were consistent in the complete wear group analyses.
Conclusions
Imputation methods can reduce overestimation of sleep caused by daytime non-wear. ZIPLN approaches better preserve the distributional structure of accelerometer data. Cole-Kripke estimated longer sleep than Sadeh, and Tudor-Locke yielded shorter durations with longer time windows.
Key words: Missing data, Imputation, Accelerometer data, Sleep duration, Non-wear time
서 론
수면은 회복과 에너지 보존, 항상성 유지, 신경계 기능 조절 등 다양한 생리학적 목적을 수행하며, 인간의 건강에 필수적인 역할을 한다. 충분하지 못한 수면은 면역력 저하, 심혈관 질환, 당뇨병, 우울증과 같은 다양한 건강 문제와 밀접한 관련이 있으며[ 1], 반대로 과도한 수면 또한 사망률 증가와 연관성이 보고되고 있다[ 2]. 따라서 정확한 수면시간의 측정과 평가는 공중보건학적 관점에서 중요한 의미를 가진다.
전통적으로 수면시간 측정은 주로 자가보고식 설문조사와 수면다원검사에 의존해왔다. 자가보고 방식은 비용 효율적이고 대규모 조사에 적용하기 쉽다는 장점이 있으나, 주관적 인식의 편향과 기억 오류로 인한 부정확성이 지속적으로 문제가 되어왔다[ 3]. 수면다원검사는 가장 정확한 수면 측정 방법으로 인정받고 있지만, 높은 비용과 복잡한 절차, 실험실 환경의 제약으로 인해 일상생활에서의 수면 패턴을 반영하기 어려운 한계가 있다[ 4].
최근 들어 ActiGraph GT3X와 같은 웨어러블(wearable) 기기를 활용한 수면시간 측정 연구가 증가하고 있다. 이러한 객관적 측정 도구는 자가보고의 주관성을 보완하면서도 수면다원검사보다 경제적이고 일상 환경에서의 장기간 모니터링이 가능하다는 장점으로 인해 보건 연구 분야에서 점차 활용도가 높아지고 있다[ 5, 6]. 웨어러블 기기는 주로 신체활동량을 연속적으로 측정하는데, 활동량이 일정 수준 이하로 유지되는 시간대를 분석하면 수면 상태를 추정할 수 있다.
그러나 가속도계를 이용한 수면시간 추정 과정에서는 두 가지 주요 과제에 직면하게 된다. 첫째는 결측치 문제이다. 가속도계에서 미착용(non-wear)이나 기기 오작동 등으로 인해 데이터 손실이 발생하면 신체활동량은 0으로 기록되는데, 이는 수면 상태의 낮은 신체활동량과 구별하기 어렵다[ 7, 8]. 따라서 실제로는 깨어있는 시간임에도 불구하고 수면시간으로 잘못 분류될 가능성이 높다[ 9]. 이러한 오분류는 수면시간의 과대 추정으로 이어져 수면과 건강 결과 간의 연관성 분석에서 편향을 초래할 수 있다. 이를 해결하기 위해서는 미착용 구간을 식별하고 적절한 결측치 대체 방법을 적용하는 과정이 필요하다.
둘째는 수집된 활동량 데이터로부터 수면시간을 산출하는 알고리즘 선택의 문제이다. 현재 다양한 수면 판별 알고리즘이 개발되어 있으나, 각 알고리즘은 서로 다른 수학적 모델과 판정 수식을 사용하여 동일한 데이터에서도 서로 다른 수면시간을 산출할 수 있다. 또한 이러한 알고리즘들은 특정 인구집단이나 연령대에서 개발되었기 때문에, 연구대상자의 특성에 맞는 적절한 알고리즘 선택이 중요하다[ 10]. 이러한 두 가지 문제는 수면시간 추정 과정에서 함께 고려하여야 한다. 결측치 대체 방법과 수면 알고리즘의 선택에 따라 최종 수면 시간 추정값이 달라질 수 있기 때문이다.
본 연구는 2016년 국민건강영양조사(Korea National Health and Nutrition Examination Survey, KNHANES) 가속도계 자료에서 미착용 구간을 정의하고, 적절한 결측치 대체 방법을 적용한 후 여러 수면시간 산출 알고리즘에 따라 추정된 수면시간을 비교하고자 한다. 이를 통해 결측치 대체 방법과 수면 알고리즘의 조합이 수면시간 추정에 미치는 영향을 기술통계적 관점에서 실증적으로 검토하고자 한다.
본 논문의 구성은 다음과 같다. 연구방법에서는 연구에 사용된 국민건강영양조사 가속도계 자료의 특성을 소개하고, 미착용 구간 정의, 결측치 대체 방법, 수면시간 산출 알고리즘을 설명한다. 결과에서는 각 대체 방법과 알고리즘별 수면시간 추정값의 차이를 분석한다. 고찰에서는 연구 결과를 토의하고 본 연구의 한계점 및 향후 연구 방향을 하고, 결론을 제시한다.
연구 방법
국민건강영양조사 가속도계 데이터 개요
본 연구는 2016년 국민건강영양조사 가속도계 데이터를 활용하였다. 국민건강영양조사는 면접조사로 수집된 신체활동 자료의 주관성 문제를 보완하기 위해 가속도계를 도입하여 객관적인 신체활동 측정을 실시하였다. 2016년 가속도계 조사는 건강설문조사 참여자 중 착용에 동의한 만 19-64세 성인을 대상으로 하였다. 가속도계 원시자료 이용지침서에 따르면, 연구 대상자들은 ActiGraph GT3X+ (ActiGraph, Pen-sacola, FL, USA)의 가속도계를 7일 연속 착용하였다. 착용 위치는 배꼽 기준 왼쪽 또는 오른쪽 허리이며, 기상 직후부터 취침 직전까지 착용하되 수영이나 샤워 등 물속 활동 시에는 제외하도록 안내되었다[ 11].
가속도계로 측정된 연구 대상자의 신체활동 원시자료는 1분의 주기(epoch)로 누적되어 강도수(count per minute, CPM)로 산출되었다[ 12]. 본 연구에서 활용한 국민건강영양조사 가속도계 자료는 1축(상하) 방향만을 측정하므로, 신체활동 강도를 비교적 정확하게 파악할 수 있으나 자전거 타기와 같은 수평 방향의 일정한 속도 활동은 충분히 감지하지 못할 수 있다는 제한점이 있다.
본 연구에서는 데이터의 신뢰성을 확보하기 위하여 선행연구에서 검증된 최소 착용 기준을 적용하였다. 수면시간에는 야간 시간대에 가속도계를 착용하지 않는 조건에 최적화된 Troiano et al. [ 7, 13]의 기준에 따라 하루 10시간 이상 착용한 것을 유효한 하루로 정의하였다. 본 연구에서는 이러한 선행연구 바탕으로 오전 9시부터 오후 9시까지의 주간 활동 시간대 중 10시간 이상 착용한 경우를 유효한 하루로 정의하였으며, 유효일이 3일 이상인 성인 440명을 분석 대상으로 하였다.
미착용 구간의 정의
가속도계 자료는 시간 단위로 연속적인 데이터를 생성하기 때문에 전통적인 설문조사에서의 결측 개념(예: 무응답, 조사거절 등)을 그대로 적용하기 어렵다. 이에 따라 본 연구에서는 일정 조건을 충족하는 미착용 구간을 결측으로 정의하고자 한다. 가속도계 미착용 구간의 판정 기준은 연구마다 상이하다. 연속된 0값의 지속시간을 기준으로 할 때, 10분[ 14- 16], 15분[ 17], 20분[ 18- 22], 30분 또는 60분[ 7, 23] 등 다양한 기준이 적용되어왔다. 국내에서 Lee et al. [ 13]은 Troiano et al. [ 7] 알고리즘을 적용하여 60분 이상 연속된 0값을 미착용으로 간주하되, 활동량이 작은 값(100 미만)이 2분 이하로 간헐적으로 나타나는 경우도 미착용으로 간주하였다.
본 연구에서는 주간 시간대(오전 9시-오후 9시)에 활동량(CPM)이 60분 이상 연속으로 0인 구간을 미착용으로 정의하고 결측치로 처리하였다. 이는 국민건강영양조사에서 수면 중 기기 착용을 제한하였기 때문이며, Lee and Gill [ 21] 또한 이와 유사한 기준을 적용하였다.
결측치 대체방법
결측치 대체 방법으로 영과잉 포아송 로그정규 혼합 모형(zero-inflated Poisson lognormal mixture model, ZIPLN)과 연쇄방정식을 이용한 다변량 대체(multivariate imputation by chained equation, MICE)를 사용하였으며, 각 방법에 준모수적 기법인 예측평균매칭(predictive mean matching, PMM)을 결합한 ZIPLN+PMM 및 MICE+PMM 방법을 추가로 적용하였다. 대체로 인한 불확실성을 반영하기 위해 각 방법에 대해 5회의 다중대체(multiple imputation)를 수행하였으며, Rubin 의 규칙에 따라 결과를 통합하였다[ 24].
영과잉 포아송 로그정규 혼합 모형(ZIPLN)
Lee and Gill [ 21]이 제안한 ZIPLN은 자기상관과 영과잉을 반영한 것으로 d = 2 K+1 차원의 다변량 포아송 회귀와 로그 정규분포의 혼합모형으로 다음과 같다.
여기서 ei∼Nd(0,Σ)이며, Σ는 d × d 차원의 분산 공분산 행렬이다. yt에 대해 현재 시점을 중심으로 전후 K 시차(lag)에 해당하는 시점들의 값을 Zt=log(Yt)−xiTβt 와 Z=(Zt−K,…,Zt−1,Zt+1,…,Zt+K)T 라고 두면, 시차 및 선행 변수 K가 주어졌을 때 대체 모형은 다음과 같다.
ZIPLN 방법은 Lee and Gill [ 21]의 연구에서 가속도계 데이터에 대한 적용 가능성과 성능이 모의실험을 통해 검증되었다.
연쇄방정식을 이용한 다변량 대체(MICE)
MICE는 각 변수를 다른 변수들의 조건부 분포로 순환적으로 대체하는 방법이며, 임의결측(Missing at random, MAR) 메커니즘 가정하에서 유효한 추론을 제공한다. MICE는 깁스 샘플링(Gibbs sampling) 기반의 반복 절차를 이용하여 다음과 같이 수행된다[ 25].
Y가 비조건부 다변량 분포 P(Y)를 따른다고 할 때, Y를 k개의 확률 변수 집합 (y1,y2,…,yk)으로 이루어졌으며. 변수 Yj=(Yjobs,Yjmis)는 j=1,…,k에 대해 부분적으로 관찰되었다고 가정한다. 이 방법은 p개의 불완전 변수에 대한 다른 변수들을 조건으로 조건부 분포 P(Yj|Y-j,θj) 추정하여 반복적으로 샘플링하는 방식이다. 여기서 Y-j는 Yj를 제외한 나머지 변수들의 집합을 의미한다.
예측평균매칭(PMM)
PMM은 결측치와 유사한 예측값을 갖는 관측된 값으로 대체하는 준모수적 방법이다. 이는 비정규 분포에서도 안정적인 성능을 보이며, 실제 관측된 값만을 사용하므로 비현실적인 값이 대체되지 않는다는 장점이 있다[ 25]. 본 연구에서 예측평균은 선형회귀모형 Yobs^=xiβ^+ϵi,ϵi∼N(0,σ2^) 을 사용하였으며, 여기서 β^는 완전한 관측치에 대해 최소 제곱법(ordinary least squares, OLS)으로 추정하였다. 추정된 예측평균이 가장 가까운 값 5개를 대체하는 방법으로 다중대체를 수행하였다.
수면시간 산출 알고리즘
수면시간을 추정하기 위해 먼저 각 시점에서 수면 상태와 각성 상태를 분류한다. 이를 위해 본 연구에서는 Sadeh [ 26]와 Cole-Kripke [ 27] 알고리즘을 적용하였다.
• Sadeh [26] 알고리즘은 10-25세를 대상으로 개발되었으며, 현재 시점을 기준으로 전후 5분을 포함한 11분간 활동량의 통계치를 활용한 수면지수(Sleep Index, SI)를 사용하여 수면 상태를 판정한다.
• Cole-Kripke [27] 알고리즘은 35-65세 성인을 대상으로 개발되었으며, 현재 시점을 전후 시점 7분간의 활동량에 시간별 가중치를 부여한 SI를 사용하여 수면 상태를 판정한다.
각 시점의 수면/각성 상태를 분류한 후 수면시간을 계산한다. 본 연구에서는 연구 대상자별 일 평균 수면시간을 다음의 방법으로 산출하였다.
① 단순 합산: 7일간 모든 수면상태 시간을 합산하여 일평균 수면시간을 계산한다.
② Tudor-Locke [28,29] 알고리즘- 5분 기준: 연속 5분 이상의 수면 상태가 지속되면 수면 시작으로, 연속 10분 이상의 각성 상태가 지속되면 기상으로 정의한다. 일일 총 수면시간이 160분 미만 또는 1,440분 초과 시 수면시간에서 제외한다.
③ Tudor-Locke [28,29] 알고리즘- 60분 기준: 연속 60분 이상의 수면 상태가 지속되면 수면 시작으로, 연속 10분 이상의 각성 상태가 지속되면 기상으로 정의한다. 일일 총 수면시간이 160분 미만 또는 1,440분 초과 시 수면시간에서 제외한다.
이러한 세 가지 방법은 각각 다른 수면 패턴을 반영한다. 단순 합산은 모든 수면을 포함하고, Tudor-Locke 알고리즘 기반 방법들은 수면 구간의 연속성을 고려한다. 본 연구에서는 이들 방법이 결측치 대체 후 수면시간 추정에 미치는 영향을 종합적으로 비교 분석하였다.
통계분석
본 연구의 원자료는 최소 착용 기준(오전 9시-오후 9시 중 10시간 이상 3일 이상)을 충족한 440명의 데이터로 구성하였다. 이는 대부분의 선행연구에서 결측치 고려 없이 분석 대상자를 정의하는 방법으로, 미착용 시간을 활동량 0으로 처리한 상태이다. 본 연구에서는 이러한 방법의 한계를 보완하기 위해 미착용 구간을 결측치로 정의하고 대체 방법을 적용한 후 수면시간 산출 결과를 비교하였다.
결측치 발생과 신체활동 수준에 영향을 미치는 주요 요인인 나이, 성별, 체질량지수(body mass index, BMI), 우울증 지수, 주말 여부를 대체 모형에서 공변량으로 설정하였다. MICE 모형에서는 연속형 변수인 활동량에 대해 베이지안 선형 회귀를 적용하였으며, 최대 반복횟수는 6회로 설정하였다. 또한 음수로 대체되는 값에 대해 0으로 변경하였다. ZIPLN 모형에서는 현재 시점 t를 중심으로 전후 3개 시점(K=3)의 활동량을 활용하였으며, 대체 값의 상한값은 10,000 CPM으로 제한하였다. 모든 대체 방법에서는 5회의 다중 대체를 수행한 후 Rubin의 규칙에 따라 결과를 통합하였다.
원자료 및 각 대체 방법(ZIPLN, MICE, ZIPLN+PMM, MICE+PMM)과 수면 알고리즘 조합별로 6가지(Sadeh+단순 합산, Sadeh+Tudor-Locke 5분, Sadeh+Tudor-Locke 60분, Cole-Kripke+단순 합산, Cole-Kripke+ Tudor-Locke 5분, Cole-Kripke+Tudor-Locke 60분) 수면시간 산출 방법을 적용하여 수면시간에 대한 분포를 비교하였다.
본 연구에서 수행한 모든 통계분석은 통계 소프트웨어 R (version 4.4.1)을 사용하였으며, 분석 과정에서 PhysicalActivity, mice, accelmissing, actigraph.sleepr 패키지를 활용하였다.
연구 결과
Figure 1은 로그 변환된 활동량 데이터에 대해 특정 연속 시점(14:59, 15:00)의 활동량 분포를 시각화한 산점도이다. 녹색점은 관측값, 빨간점은 대체값을 나타낸다. 일반적으로 직전 시점의 활동량은 다음 시점의 활동량과 양의 상관관계를 가지며 일부 시점에서는 활동량이 0으로 움직임이 없는 상태가 관찰된다. ZIPLN 모형은 가속도계 데이터의 영과잉 특성을 반영하여 결측값을 주로 0 또는 활동량 값으로 대체하였다. ZIPLN+PMM은 ZIPLN의 특성을 유지하면서도 실제 관측값과 유사한 수준의 활동량 값을 반영함으로써 대체값의 분포가 보다 자연스럽고 관측값과 유사한 형태를 나타냈다. 반면 MICE는 전체 자료의 평균 분포를 기준으로 대체값을 생성하므로 낮은 활동량 구간에서도 값이 특정 범위에 집중되는 경향을 보였다. MICE+PMM은 관측값의 분포를 근사하면서도 일부 극단값을 포함하는 양상을 보였다. 전반적으로 ZIPLN 방법은 낮은 활동량 구간의 분포 특성을 보다 잘 보존하는 것으로 나타났다.
Figure 1.
Comparison of observed and imputed data at time points (14:59 vs. 15:00). The scatter plot illustrates cpm at 14:59 and 15:00, using log-transformed counts (log(count+1)). The green dots are the observed data points, and the red dots are the imputed data points. ZIPLN, zero-inflated Poisson log-normal; ZIPLN+PMM, ZIPLN with predictive mean matching; MICE, multiple imputation by chained equation; MICE+PMM, MICE with predictive mean matching.
특정 대상자(ID=A653230602)의 하루 동안의 활동량을 시간에 따라 시각화한 결과( Figure 2), 대체 방법 간 뚜렷한 차이를 볼 수 있었다. ZIPLN 및 ZIPLN+PMM 방식은 웨어러블 기기를 통해 측정된 움직임 강도 지표의 분포 및 특성을 비교적 잘 보존한 반면, MICE 및 MICE+ PMM 방식은 이러한 특성을 충분히 반영하지 못하였다.
Figure 2.
The time series plot of observed and imputed physical activity for a single participant (ID = A653230602). ZIPLN, zero-inflated Poisson log-normal; ZIPLN+PMM, ZIPLN with predictive mean matching; MICE, multiple imputation by chained equation; MICE+PMM, MICE with predictive mean matching.
원자료 및 네 가지 결측치 대체 방법(ZIPLN, ZIPLN+PMM, MICE, MICE+PMM)에서 각 수면시간 산출 알고리즘 조합별로 추정된 수면시간의 분포를 Table 1와 Figure 3에 제시하였다. 원자료의 수면시간은 모든 대체 방법보다 길게 나타났는데, 이는 주간 미착용 구간이 수면으로 오분류되어 과대 추정된 결과로 해석된다. 반면 결측치 대체를 수행한 경우 이러한 과대 추정이 보정되어 보다 더 타당한 수면시간을 산출하였다. 주간 착용이 유효하지 않은 날이 없는 Complete wear (7일 이상 유효 착용자, n=122) 집단에서 산출된 수면시간은 대부분의 대체 방법과 유사한 수준을 보였다. 이는 미착용이 거의 없는 자료가 결측치 대체를 통해 얻은 결과와 일관됨을 시사한다.
Figure 3.
Comparison of estimated sleep duration from the Sadeh and Cole-Kripke algorithms. The boxplots illustrate the distribution of estimated sleep duration (h) (y-axis) resulting from raw data and four different imputation method (x-axis). (A) Total number of minutes scored as sleep; (B) Tudor 5; and (C) Tudor 60. ZIPLN, zero-inflated Poisson log-normal; ZIPLN+PMM, ZIPLN with predictive mean matching; MICE, multiple imputation by chained equation; MICE+PMM, MICE with predictive mean matching.
Table 1.
Sleep duration estimates (hours) by imputation method and algorithm
|
Sleep/Wake scoring algorithm |
Sleep duration algorithm |
Raw (n=440) |
ZIPLN (n=440) |
MICE (n=440) |
ZIPLN+PMM (n=440) |
MICE+PMM (n=440) |
Complete wear (n=122) |
|
Sadeh |
Simple summation |
16.16 (2.33) |
15.63 (2.18) |
14.51 (1.96) |
15.08 (2.02) |
14.98 (2.29) |
14.66 (2.07) |
|
Tudor-5 min |
12.60 (2.58) |
11.94 (2.00) |
11.40 (3.38) |
11.56 (1.82) |
11.68 (2.13) |
11.29 (1.93) |
|
Tudor-60 min |
12.26 (2.50) |
11.53 (1.96) |
11.17 (1.75) |
11.25 (1.78) |
11.36 (2.00) |
11.00 (1.78) |
|
Cole-Kripke |
Simple summation |
18.17 (2.11) |
17.84 (2.02) |
16.61 (1.92) |
17.43 (1.94) |
17.27 (2.5) |
16.99 (2.08) |
|
Tudor-5 min |
13.76 (2.56) |
13.64 (2.38) |
12.56 (8.67) |
13.03 (2.20) |
13.11 (2.29) |
12.79 (2.29) |
|
Tudor-60 min |
12.99 (2.59) |
12.60 (2.25) |
11.91 (1.93) |
12.08 (2.01) |
12.23 (2.31) |
11.79 (2.05) |
수면 알고리즘별 비교 결과( Figure 4)에서는, Cole-Kripke 알고리즘이 Sadeh 알고리즘보다 일관되게 긴 수면시간을 산출하였다. 이러한 경향은 기존 선행연구의 결과와도 일치한다. Cole-Kripke은 수면상태에 대해 높은 민감도(90-95%)와 낮은 특이도(30-50%)를 보여 미착용 구간을 수면으로 오분류할 가능성이 높기 때문이다[ 10, 30].
Figure 4.
Comparison of estimated sleep duration from the Sadeh and Cole-Kripke algorithms using the ZIPLN method. The boxplots illustrate the distribution of estimated sleep duration (h) (y-axis) after applying the ZIPLN imputation method. The x-axis compares the result from the two sleep duration algorithms across the four distinct methods: (A) Total number of minutes scored as sleep; (B) Tudor 5; and (C) Tudor 60. ZIPLN, zero-inflated Poisson log-normal.
한편 Tudor-Locke 알고리즘 적용한 결과, 60분 기준이 5분 기준보다 짧은 수면시간을 산출하였다. 이는 수면 시간 동안 가속도계 미착용을 권고하는 자료수집 설계를 고려하였을 때, 60분 이상 연속된 미착용을 수면으로 정의하는 것이 보다 적절한 기준임을 시사한다.
고 찰
본 연구의 결과는 미착용 구간이 적절히 보정되지 않을 경우 수면시간이 체계적으로 과대 추정될 수 있음을 보여준다. 모든 대체 방법에서 원자료보다 평균 수면시간이 낮게 나타났으며, 이는 미착용을 그대로 유지할 경우 수면시간이 실제보다 길게 산출될 가능성이 높음을 의미한다. 특히 ZIPLN 기반 접근법은 가속도계 데이터의 분포적 특성을 효과적으로 반영하여 보다 현실적인 추정 결과를 제공하였다.
본 연구의 방법론적 접근은 가속도계 데이터의 고유한 특성을 고려한 것이었다. MICE 기반 대체에서는 일부 음수값이 발생하여 데이터의 분포적 특성을 충분히 반영하지 못하는 문제가 관찰되었는데, 이러한 한계를 보완하기 위해 본 연구에서는 ZIPLN을 함께 적용하여 비교하였다. 이를 통해 가속도계 데이터의 과산포와 영과잉 현상을 보다 효과적으로 설명할 수 있었다.
수면시간 산출 시 결측치 대체 방법뿐만 아니라 적용하는 수면 알고리즘에 따라서도 결과가 달라지는 것을 확인하였다. 특히 Cole-Kripke 알고리즘은 수면시간을 과대 평가하는 경향이 있는 반면 Sadeh 알고리즘은 보다 보수적인 값을 산출하였다. Tudor-Locke 알고리즘 중에서도 60분 기준과 같이 시간 창(Window)을 넓게 설정할수록 수면시간은 더 짧게 추정되었다. 따라서 가속도계 자료를 활용한 수면시간 추정 연구에서는 알고리즘의 민감도, 특이도, 시간 창 기준 등 알고리즘의 특성과 자료수집 설계를 충분히 고려하여 적절한 방법을 선택할 필요가 있다.
그러나 본 연구에는 몇 가지 한계가 존재한다. 현재 국민건강영양조사 가속도계 자료는 수직 방향의 단축 자료만 제공하고 있어, 신체 움직임의 방향성과 패턴을 충분히 반영하기에는 한계가 있다. 기존 선행연구에서는 손목 착용 시 팔 각도 변화[ 31, 32]나 허벅지 착용 시 신체활동과 자세 측정[ 33] 등 다양한 착용 부위와 센서 활용 방법이 보고되었으며, 이를 통해 보다 정밀한 수면 상태 분류가 가능함이 제시되었다. 또한 가속도계 기반의 수면시간 추정은 주간 미착용 구간과 수면 구간의 명확한 구분이 어려워 과대 추정의 가능성이 존재하며, 이는 다수의 선행연구에서도 지적된 바 있다[ 10, 29, 30]. 향후 연구에서는 이러한 한계를 보완하기 위해 국민건강영양조사 설문조사의 수면시간 정보를 활용하여 수면시간 추정의 정밀도를 높이는 방안을 모색할 예정이다.
결 론
본 연구는 국민건강영양조사의 가속도계 자료에서 낮 시간 미착용으로 인한 결측을 대체하고, 다양한 수면 알고리즘의 조합에 따른 수면시간 추정값을 비교함으로써 결측 처리 및 수면시간 추정 방법을 실증적으로 평가하였다. ZIPLN 및 ZIPLN+PMM 방법은 영과잉이 발생하는 가속도계 데이터의 특성을 효과적으로 반영하여 보다 현실적인 활동량 값을 대체할 수 있었다. 수면시간 산출 결과는 Sadeh 및 Cole-Kripke 알고리즘의 민감도 및 특이도 차이에 따라 상이한 경향을 보였으며, Tudor-Locke 알고리즘은 시간 창의 5분 기준보다 60분 기준이 더 타당한 것으로 나타났다. 다만 본 연구의 결과 비교는 기술통계 기반의 평균 및 분포 비교를 통해 대체 방법과 알고리즘 조합에 따른 특성을 구조적으로 탐색한 것으로, 통계적 유의성 검정이 이루어지지 않았다는 점에서 해석에 한계가 있다. 그럼에도 본 결과는 수면 측정 및 처리 방식의 특성을 이해하는데 기초자료로 활용될 수 있다. 향후에는 가속도계 데이터를 수집 단계에서 착용 부위의 다양화나 다축 가속도계의 활용을 고려함으로써 수면 측정의 정밀도와 신뢰도를 높일 수 있을 것으로 기대된다.
REFERENCES
3. Lauderdale DS, Knutson KL, Yan LL, Liu K, Rathouz PJ. Self-reported and measured sleep duration: How similar are they? Epidemiology 2008;19(6):838-845. DOI: 10.1097/EDE.0b013e318187a7b0.
4. Ancoli-Israel S, Cole R, Alessi C, Chambers M, Moorcroft W, Pollak CP. The role of actigraphy in the study of sleep and circadian rhythms. Sleep 2003;26(3):342-392. DOI: 10.1093/sleep/26.3.342.
5. Ancoli-Israel S, Martin JL, Blackwell T, Buenaver L, Liu L, Meltzer LJ, et al. The SBSM guide to actigraphy monitoring: Clinical and research applications. Behav Sleep Med 2015;13(Suppl 1):S4-S38. DOI: 10.1080/15402002.2015.1046356.
11. Korea Disease Control and Prevention Agency. The Sixth Korea National Health and Nutrition Examination Survey (KNHANES VII-1). Cheongju: Korea Disease Control and Prevention Agency; 2016. (Korean).
13. Lee H, Lee M, Choi J, Oh K, Kim Y, Kim S. Processing and utilization of physical activity data measured by accelerometer in the Korea National Health and Nutrition Examination Survey. J Korean Soc Meas Eval Phys Educ Sport Sci 2018;20(2):83-94. (Korean). DOI: 10.21797/ksme.2018.20.2.008.
14. Brage S, Wedderkopp N, Ekelund U, Franks PW, Wareham NJ, Andersen LB, et al. Features of the metabolic syndrome are associated with objectively measured physical activity and fitness in Danish children: The European Youth Heart Study (EYHS). Diabetes Care 2004;27(9):2141-2148. DOI: 10.2337/diacare.27.9.2141.
15. Ekelund U, Yngve A, Brage S, Westerterp K, Sjöström M. Body movement and physical activity energy expenditure in children and adolescents: How to adjust for differences in body size and age. Am J Clin Nutr 2004;79(5):851-856. DOI: 10.1093/ajcn/79.5.851.
16. Riddoch CJ, Bo Andersen L, Wedderkopp N, Harro M, Klasson-Heggebø L, Sardinha LB, et al. Physical activity levels and patterns of 9- and 15-yr-old European children. Med Sci Sports Exerc 2004;36(1):86-92. DOI: 10.1249/01.MSS.0000106174.43932.92.
18. Jilcott SB, Evenson KR, Laraia BA, Ammerman AS. Association between physical activity and proximity to physical activity resources among low-income, midlife women. Prev Chronic Dis 2007;4(1):A04.
19. Savitz DA, Herring AH, Mezei G, Evenson KR, Terry JW Jr, Kavet R. Physical activity and magnetic field exposure in pregnancy. Epidemiology 2006;17(2):222-225. DOI: 10.1097/01.ede.0000197294.05564.08.
20. Treuth MS, Sherwood NE, Baranowski T, Butte NF, Jacobs DR Jr, Mc-Clanahan B, et al. Phisycal activity self-report and acceleromerty measures from the Girls Health Enrichmnet Multi-site Studies. Prev Med 2004;38(Suppl):S43-S49. DOI: 10.1016/j.ypmed.2003.01.001.
23. Matthews CE, Ainsworth BE, Thompson RW, Bassett DR Jr. Sources of variance in daily physical activity levels as measured by an accelerometer. Med Sci Sports Exerc 2002;34(8):1376-1381. DOI: 10.1097/00005768-200208000-00021.
24. Little RJ, Rubin DB. Statistical analysis with missing data. New York: John Wiley & Sons; 2019.
25. van Buuren S. Flexible imputation of missing data. Boca Raton: CRC press; 2012.
26. Sadeh A. The role and validity of actigraphy in sleep medicine: An update. Sleep Med Rev 2011;15(4):259-267. DOI: 10.1016/j.smrv.2010.10.001.
27. Cole RJ, Kripke DF, Gruen W, Mullaney DJ, Gillin JC. Automatic sleep/wake identification from wrist activity. Sleep 1992;15(5):461-469. DOI: 10.1093/sleep/15.5.461.
|
|