머신러닝 기법을 활용한 지역사회 노인의 재낙상 예측
Abstract
Objectives
This study aimed to develop a machine learning-based model to predict recurrent falls in community-dwelling older adults aged 65 and over who have a history of falling and to identify key predictors to inform early detection and preventive strategies.
Methods
Data from 612 older adults with prior falls, drawn from the 2023 Korean National Survey of Older Persons, were analyzed. Recurrent falls were defined as experiencing two or more falls in the past year. Independent variables included sociodemographic, health status, health behavior, functional status, fall-related, and environmental factors. Four models—Logistic regression, Random forest, XGBoost, and CatBoost—were used. Model performance was assessed using accuracy, precision, recall, F1-score, and area under the curve (AUC). Feature importance was analyzed based on the best-performing model.
Results
Random forest demonstrated the overall best performance and showed a significant difference compared with logistic regression, indicating that it was the most suitable model for predicting recurrent falls in this study. The major predictors of recurrent falls were identified as age, depression, fall treatment, cognitive function, and fall reason.
Conclusions
This study is the first to apply machine learning for recurrent fall prediction among older adults in Korea, presenting models that demonstrated superior performance compared to traditional regression analysis. The findings provide an academic foundation for recurrent fall prediction research in Korea and confirm the feasibility of early identification of high-risk groups. Future work should focus on advancing the model to develop a decision-support tool applicable in both community and clinical settings.
Key words: Recurrent falls, Older adults, Machine learning, Random forest, Prediction model
서 론
국내의 65세 이상 노인 인구 비율은 2025년 기준 20.3%로 이미 초고령사회에 진입하였으며, 2036년에는 30%, 2050년에는 40%를 넘어설 것으로 전망되고 있다[ 1]. 이러한 인구 구조의 변화는 의료비 지출에도 직접적인 영향을 미치고 있다. 2023년 기준 65세 이상 노인의 진료비는 48조 5,172억 원으로 전체 진료비의 약 43%를 차지하고 있으며, 매년 지속적인 증가세를 보이고 있다[ 2]. 노인 의료비는 앞으로도 계속 증가할 것으로 예상되며, 이에 따른 사회적 부담 또한 심화될 것으로 전망된다[ 3].
그중에서도 낙상은 노인 의료비 증가의 주요 요인 중 하나로, 낙상으로 인한 연간 의료비는 약 1조 6천억 원에 달하는 것으로 보고되고 있다[ 4]. 낙상은 고령층에서 흔히 발생하는 외상 사건으로, 심각한 신체적 손상 및 기능 저하를 초래할 수 있으며[ 5], 전 세계적으로도 의도하지 않은 손상에 의한 사망 원인 중 두 번째로 높은 비율을 차지하고 있다[ 6]. 65세 이상 노인의 약 30%가 매년 낙상을 경험하고 있으며, 이 중 절반 이상이 2회 이상의 낙상, 즉 재낙상을 겪는 것으로 나타났다[ 7]. 재낙상은 전체 노인의 약 25%에서 발생할 정도로 유병률이 높으며, 이환율 및 사망률의 증가와도 밀접하게 연관되어 있다[ 8]. 특히, 재낙상은 초기 낙상보다 더 심각한 결과를 초래할 수 있어[ 9], 고위험군을 조기에 선별하고 예방하는 것이 무엇보다 중요하다. 이에 따라 재낙상 가능성을 사전에 예측하고 주요 위험요인을 규명하는 연구는 낙상 예방을 위한 전략 수립뿐만 아니라 의료 자원의 효율적 배분 측면에서도 중요한 기반이 될 수 있다.
낙상은 주로 연령, 성별, 음주, 약물복용, 기저 질환, 신체기능 저하, 정신건강, 거주환경 등 다양한 요인과 밀접하게 연관되어 있으며[ 5, 6], 이러한 위험요인들은 복합적으로 작용하는 경우가 많아 기존의 통계기법만으로는 예측에 한계가 따를 수 있다. 이에 따라 최근 보건의료 분야에서는 변수 간 복잡한 관계를 효과적으로 반영할 수 있는 머신러닝(machine learning) 기법을 낙상 예측에 적용하려는 시도가 증가하고 있다.
머신러닝은 대규모 데이터를 기반으로 변수 간의 비선형적 관계와 잠재적 상호작용을 효과적으로 반영할 수 있어, 복합적인 건강 문제의 예측에 유리한 방법론으로 주목받고 있다[ 10– 13]. 특히 노인 낙상 예측에 관한 선행연구에서는 로지스틱 회귀를 비롯하여 의사결정나무, 랜덤포레스트(random forest), XGBoost (eXtreme Gradient Boosting) 등 다양한 알고리즘을 활용하여 예측 모델을 구축하고 주요 위험 요인을 분석한 바 있다[ 14– 18]. 하지만 기존의 선행연구는 주로 낙상 예측에 집중되어 있으며, 재낙상 예측에 초점을 맞춘 연구는 국외에서도 일부 사례에 그치는 수준이다[ 19, 20]. 국내의 경우, 주로 로지스틱 회귀(logistic regression)와 같은 전통적인 통계기법에 의존하고 있으며[ 21– 25], 재낙상 예측에 머신러닝 기법을 적용한 연구는 아직 학계에 보고된 바는 없는 것으로 확인된다.
따라서 본 연구는 낙상 경험이 있는 65세 이상 노인을 대상으로 머신러닝 기반 재낙상 예측 모델을 구축하고, 이를 통해 주요 위험 요인을 탐색함으로써, 향후 고위험군 선별 및 낙상 예방 전략 수립에 기초 자료를 제공하는 데 목적이 있다.
연구 방법
연구자료 및 연구대상
본 연구는 2023년 노인실태조사 자료를 이용하였으며, 지역사회에 거주하는 만 65세 이상의 노인을 대상으로 하였다. 전체 대상자 10,078명 중 지난 1년간 낙상 경험이 있는 639명을 선정하여, 이 중 유효하지 않은 응답 27명을 제외하고 최종적으로 612명을 분석에 이용하였다.
연구변수
종속변수는 재낙상 여부로, 지난 1년간 낙상 경험이 2회 이상인 경우를 재낙상으로 정의하여 분류하였다[ 21– 25]. 독립변수는 선행연구에서 제시된 재낙상의 위험요인들을 바탕으로, 인구사회학적 요인, 건강상태 요인, 건강행태 요인, 기능상태 요인, 낙상 관련 요인, 환경적 요인으로 구분하였다.
인구사회학적 요인
인구사회학적 요인은 연령, 성별, 교육수준, 독거여부, 의료급여 수급자 여부를 포함하였다. 교육수준은 초졸 이하(무학 포함), 중졸, 고졸, 대졸 이상의 4가지 범주로 구분하였으며, 독거여부는 가구원 수가 1명인 경우 독거, 2명 이상인 경우를 비독거로 구분하였다.
건강상태 요인
건강상태 요인은 평소 건강상태, 만성질환 유무(고혈압, 고지혈증, 당뇨병, 골관절염, 골다공증, 좌골신경통), 만성질환 수, 체질량지수(body mass index, BMI), 우울, 인지기능을 포함하였다. 평소 건강상태는 매우 건강하다, 건강한 편이다, 보통이다, 건강하지 않은 편이다, 전혀 건강하지 않다의 5가지 범주를 그대로 사용하였으며, 만성질환 유무는 의사진단을 받은 만성질환 중 응답 분포의 불균형으로 분석에 적합하지 않은 변수를 제외하고 각 범주에서 100건 이상인 고혈압, 고지혈증, 당뇨병, 골관절염, 골다공증, 좌골신경통의 6개 변수만 사용하였다. 만성질환 수는 의사진단을 받은 만성질환의 총 개수를 의미하며, BMI는 몸무게를 키의 제곱으로 나누어 계산한 후 18.5 kg/m2 미만, 18.5 kg/m2 이상에서 24.9 kg/m2 이하, 25.0 kg/m2 이상 3가지 범주로 구분하였다. 우울은 단축형 노인우울척도(Korean version of the short form of Geri-atric Depression Scale, SGDS-K)를 사용하여 15개 문항 중 긍정 문항 5개는 역코딩하였으며, 총점이 높을수록 우울 수준이 높은 것을 의미한다. 인지기능은 한국판 간이정신상태검사 2판(Korean-Mini Mental State Examination 2nd Edition, K-MMSE-2)을 사용하였으며, 총 27문항 30점 만점으로 총점이 높을수록 인지기능이 양호한 것을 의미한다.
건강행태 요인
건강행태 요인은 처방약 수, 음주빈도, 운동여부, 영양관리를 포함하였다. 처방약 수는 3개월 이상 복용하고 있는 의사 처방약의 총 개수를 의미하며, 음주빈도는 전혀 마시지 않음, 월 1-3회 이하, 주 1회 이상의 3가지 범주로 구분하였다. 운동여부는 주 1회 이상 운동한 경우로 정의하였으며, 영양관리는 Nutrition Screening Initiative (NSI)가 개발한 ‘ Determine Your Nutrition Health’ 체크리스트를 활용하여, 총점이 0-2점일 경우 양호, 3-5점은 주의, 6점 이상은 불량으로 구분하였다.
기능상태 요인
기능상태 요인은 시력/청력/이동의 불편함, 10개 계단 오를 때의 힘듦 여부, 300 m 이동 시 힘듦 여부, 일상생활 활동(activities of daily living, ADL), 도구적 일상생활 수행능력(Instrumental Activities of Daily Living, IADL)을 포함하였다. 시력, 청력, 이동의 불편함은 불편하지 않다, 불편한 편이다, 매우 불편하다의 3가지 범주를 그대로 사용하였으며, 계단 오르기와 300 m 이동은 타인의 도움 없이 혼자 수행할 때의 어려움 여부를 평가하여 구분하였다. ADL은 일상생활 수행능력을 평가하기 위한 지표로, 총 7개 항목(옷 입기, 세수 ·양치질·머리감기, 목욕 또는 샤워하기, 차려놓은 음식 먹기(식사능력), 누웠다 일어나 방밖으로 나가기(보행능력), 화장실 출입과 대소변 후 닦고 옷 입기, 대소변 조절하기)으로 구성되어 있다. 각 항목은 수행 여부에 따라 점수가 부여되며, 총점이 7점인 경우 완전 자립, 그 외에는 도움 필요로 구분하였다. IADL은 도구적 일상생활 수행능력을 평가하기 위한 지표로, 총 10개 항목(몸단장하기, 집안일하기, 식사 준비하기, 빨래하기, 제시간에 정해진 양의 약 챙겨 먹기, 금전 관리, 근거리 외출하기, 물건 구매 결정· 돈 지불·거스름돈 받기, 전화 걸고 받기, 교통수단 이용하기)으로 구성되어 있으며, 총점이 10점인 경우 완전 자립, 그 외에는 도움 필요로 구분하였다.
낙상 관련 요인
낙상 관련 요인은 낙상 후 치료 여부와 낙상 원인을 포함하였다. 낙상 원인은 환경적 요인(바닥이 미끄러워서, 사람이나 사물에 부딪혀서, 도로나 문턱에 걸려, 도로의 경사가 급해서, 조명이 어두워서)과 신체적 요인(다리를 접질려서, 갑자기 어지러워서, 다리에 힘이 풀려서)으로 구분하였다.
환경적 요인
환경적 요인은 주택 종류와 주택의 편리함 정도를 포함하였다. 주택 종류는 단독주택, 아파트, 연립·다세대 주택, 기타의 4가지 범주로 구분하였으며, 주택의 편리함 정도는 생활하기 불편함, 생활하기 불편하진 않지만, 노인을 배려한 설비는 없음, 노인을 배려한 설비를 갖추고 있음의 3가지 범주로 구분하였다.
데이터 전처리
분석에 사용된 612명의 자료에는 유효하지 않은 응답 27명을 제외한 것으로, 추가적인 결측값이나 이상값은 존재하지 않았다. 이를 바탕으로 범주형 변수는 인코딩을 통해 변환하였고, 연속형 변수는 스케일(scale) 차이를 보정하기 위해 평균 0, 표준편차 1로 변환하는 Standard-Scaler 기반의 표준화를 적용하였다.
분석방법
본 연구는 대상자의 일반적 특성 및 재낙상 여부에 따른 집단 간 차이를 분석하기 위해 기술통계, 독립표본 t-검정, 카이제곱 검정을 시행하였으며, 통계적 유의수준은 p <0.05로 설정하였다. 재낙상 예측을 위해, 보건의료 분야의 선행연구를 바탕으로 예측 성능이 입증된 네 가지 알고리즘인 로지스틱 회귀, 랜덤포레스트, XGBoost, CatBoost (Cat-egorical Boosting)를 적용하였다. 로지스틱 회귀는 이진 분류에 적합한 선형 모델로, 해석이 직관적이며 변수 간 관계를 명확히 파악할 수 있어 예측 결과에 대한 설명력이 높은 모델로 평가된다[ 26]. 랜덤포레스트, XGBoost, CatBoost는 비선형 관계를 학습할 수 있는 트리 기반의 앙상블 알고리즘으로, 예측력과 과적합 방지 측면에서 우수한 성능을 보이는 것으로 알려져 있다[ 10, 13]. 랜덤포레스트는 다수의 결정트리를 생성하고 그 결과를 평균 또는 다수결 방식으로 통합하는 배깅(bag-ging) 기반의 앙상블 학습 기법으로, 모델의 안정성과 과적합 완화에 강점을 가진다[ 27, 28]. XGBoost는 약한 학습기를 순차적으로 결합해 성능을 향상시키는 부스팅(boosting) 기반의 앙상블 학습 기법으로, 모델 복잡도 제어와 병렬 처리 구조를 통해 대규모 데이터에서 높은 예측 성능과 빠른 처리 속도를 구현할 수 있다[ 29]. CatBoost는 범주형 변수 처리에 최적화된 부스팅 알고리즘으로, 복잡한 전처리 없이 안정적인 학습과 우수한 예측 성능을 나타낸다[ 30].
전체 데이터는 훈련용(70%)과 검정용(30%)으로 분할하였으며, 이후 데이터 불균형 문제를 해결하기 위해 실제 데이터 분포의 왜곡을 최소화하는 방식인 class_weight 옵션을 적용하여 가중치를 조정하였다. 각 모델은 훈련 데이터에서 5-fold 교차검증을 기반으로 하이퍼파라미터 튜닝을 통해 최적의 파라미터 조합을 탐색하였다. 최종 모델의 성능 평가는 정확도, 정밀도, 재현율, F1-score, AUC (area under the curve)-ROC (receiver operating characteristic) 곡선을 기준으로 비교하였으며, 최적의 모델을 활용하여 변수 중요도를 도출하였다. 모든 분석은 Python 3.12.4 및 관련 라이브러리를 활용하여 수행하였으며( Table 1), 머신러닝 기법의 적용에 대한 전체 흐름도는 다음과 같다( Figure 1).
Figure 1.
Workflow of machine learning analysis. XGBoost, eXtreme recurrent boosting; CatBoost, categorical boosting; AUC, area under the curve.
Table 1.
Summary of machine learning analysis methods
|
Category |
Description |
|
Models used |
Logistic regression, Random forest, XGBoost, CatBoost |
|
Data split |
Train: 70%, Test: 30% |
|
Class imbalance handling |
class_weight = ‘balanced’ |
|
Cross-validation |
5-fold CV |
|
Hyperparameter tuning |
GridSearchCV, HyperOpt |
|
Tuning evaluation metric |
AUC |
|
Evaluation metrics |
Accuracy, Precision, Recall, F1-score, AUC |
|
Model interpretation |
Feature importance |
|
Programming environment |
Pandas, SciPy, Scikit-learn, Matplotlib) Python 3.12.4 and related libraries (e.g., NumPy, |
연구 결과
재낙상 여부에 따른 대상자의 일반적 특성 비교
전체 612명의 대상자 중 재낙상군은 241명, 1회 낙상군은 371명으로, 평균 연령은 재낙상군이 78.06세(±7.01), 1회 낙상군이 75.31세(±6.57) 로 재낙상군이 유의하게 높았다( p <0.001). 교육수준은 재낙상군에서 중졸 이하 비율이 높았고, 1회 낙상군에서는 고졸 이상 비율이 높았다( p <0.01). 평소 건강상태에 대해 ‘건강하지 않은 편이다’ 또는 ‘매우 건강하지 않다’고 응답한 비율은 재낙상군에서 더 높았고( p <0.001), 당뇨병과 좌골신경통이 있는 경우 또한 재낙상군에서 더 높았다( p <0.05). 만성질환 수는 재낙상군(3.68±1.99)이 1회 낙상군(3.02±1.71)보다 많았고( p <0.001), 우울 점수 또한 재낙상군(6.54±4.41)이 1회 낙상군(4.48±3.67)보다 높게 나타났다( p <0.001). 반면, 인지기능은 재낙상군(22.16±5.54)이 1회 낙상군(23.17±5.29)보다 낮게 나타났다( p <0.05). 처방약 수는 재낙상군(3.45±2.13)이 1회 낙상군(2.81±1.79)보다 많았고( p <0.001), 음주 빈도는 월 1-3회 음주는 1회 낙상군에서, 주 1회 이상 음주는 재낙상군에서 높았다( p <0.05). 영양관리는 ‘양호’하다고 응답한 비율이 1회 낙상군에서 더 높았고, 재낙상군에서는 ‘보통’ 또는 ‘불량’으로 응답한 비율이 높았다( p <0.05). 시력/청력/이동의 불편함, 계단 오르기, 300 m 이동은 재낙상군이 전반적으로 불편함을 더 많이 호소했으며( p <0.001), ADL과 IADL 역시 재낙상군에서 ‘도움 필요’ 응답 비율이 1회 낙상군보다 높았다( p <0.001). 낙상 이후 치료를 받지 않은 비율은 재낙상군에서 높았으며( p <0.001), 낙상의 원인으로 ‘신체적 요인’을 응답 비율 역시 재낙상군에서 더 높게 나타났다( p <0.001) ( Table 2).
Table 2.
Comparison of general characteristics according to recurrent falls (n=612)
|
Variables |
Categories |
Total (Mean±SD or %) |
Recurrent falls |
t/χ2
|
p
|
|
Yes (n=241) |
No (n=371) |
|
Sociodemographic factors |
|
|
|
|
|
|
|
Age (y) |
|
76.39±6.87 |
78.06±7.01 |
75.31±6.57 |
4.86 |
0.000***
|
|
Sex |
Men |
142 (23.2) |
53 (22.0) |
89 (24.0) |
0.23 |
0.636 |
|
Women |
470 (76.8) |
188 (78.0) |
282 (76.0) |
|
|
|
Education |
≤Elementary |
361 (59.0) |
145 (60.2) |
216 (58.2) |
11.39 |
0.010**
|
|
Middle school |
114 (18.6) |
56 (23.2) |
58 (15.6) |
|
|
|
High school |
119 (19.4) |
33 (13.7) |
86 (23.2) |
|
|
|
≥College |
18 (2.9) |
7 (2.9) |
11 (3.0) |
|
|
|
Living alone |
Yes |
263 (43.0) |
101 (41.9) |
162 (43.7) |
0.12 |
0.730 |
|
No |
349 (57.0) |
140 (58.1) |
209 (56.3) |
|
|
|
Medical aid |
Yes |
78 (12.7) |
28 (11.6) |
50 (13.5) |
0.30 |
0.583 |
|
No |
534 (87.3) |
213 (88.4) |
321 (86.5) |
|
|
|
Health status factors |
|
|
|
|
|
|
|
Self-rated health |
Very healthy |
9 (1.5) |
1 (0.4) |
8 (2.2) |
34.85 |
0.000***
|
|
Healthy |
110 (18.0) |
36 (14.9) |
74 (19.9) |
|
|
|
Average |
179 (29.2) |
47 (19.5) |
132 (35.6) |
|
|
|
Unhealthy |
265 (43.3) |
128 (53.1) |
137 (36.9) |
|
|
|
Very unhealthy |
49 (8.0) |
29 (12.0) |
20 (5.4) |
|
|
|
Hypertension |
Yes |
402 (65.7) |
163 (67.6) |
239 (64.4) |
0.54 |
0.465 |
|
No |
210 (34.3) |
78 (32.4) |
132 (35.6) |
|
|
|
Hyperlipidemia |
Yes |
228 (37.3) |
93 (38.6) |
135 (36.4) |
0.22 |
0.642 |
|
No |
384 (62.7) |
148 (61.4) |
236 (63.6) |
|
|
|
Diabetes mellitus |
Yes |
204 (33.3) |
93 (38.6) |
111 (29.9) |
4.56 |
0.033*
|
|
No |
408 (66.7) |
148 (61.4) |
260 (70.1) |
|
|
|
Osteoarthritis |
Yes |
219 (35.8) |
94 (39.0) |
125 (33.7) |
1.57 |
0.210 |
|
No |
393 (64.2) |
147 (61.0) |
246 (66.3) |
|
|
|
Osteoporosis |
Yes |
116 (19.0) |
51 (21.2) |
65 (17.5) |
1.04 |
0.309 |
|
No |
496 (81.0) |
190 (78.8) |
306 (82.5) |
|
|
|
Sciatica |
Yes |
121 (19.8) |
58 (24.1) |
63 (17.0) |
4.19 |
0.041*
|
|
No |
491 (80.2) |
183 (75.9) |
308 (83.0) |
|
|
|
Number of chronic diseases |
|
3.28±1.85 |
3.68±1.99 |
3.02±1.71 |
4.23 |
0.000***
|
|
BMI (kg/m2) |
<18.5 |
30 (4.9) |
15 (6.2) |
15 (4.0) |
1.73 |
0.422 |
|
18.5-24.9 |
411 (67.2) |
157 (65.1) |
254 (68.5) |
|
|
|
≥25.0 |
171 (27.9) |
69 (28.6) |
102 (27.5) |
|
|
|
Depression |
|
5.29±4.10 |
6.54±4.41 |
4.48±3.67 |
6.02 |
0.000***
|
|
Cognitive function |
|
22.77±5.41 |
22.16±5.54 |
23.17±5.29 |
−2.23 |
0.026*
|
|
Health behavior factors |
|
|
|
|
|
|
|
Number of medications |
|
3.07±1.96 |
3.45±2.13 |
2.81±1.79 |
3.85 |
0.000***
|
|
Drinking frequency |
None |
467 (76.3) |
187 (77.6) |
280 (75.5) |
6.14 |
0.046*
|
|
1-3/mon |
78 (12.7) |
22 (9.1) |
56 (15.1) |
|
|
|
≥1/wk |
67 (10.9) |
32 (13.3) |
35 (9.4) |
|
|
|
Exercise |
Yes |
315 (51.5) |
112 (46.5) |
203 (54.7) |
3.65 |
0.056 |
|
No |
297 (48.5) |
129 (53.5) |
168 (45.3) |
|
|
|
Nutrition management |
Good |
258 (42.2) |
88 (36.5) |
170 (45.8) |
6.62 |
0.037*
|
|
Normal |
216 (35.3) |
88 (36.5) |
128 (34.5) |
|
|
|
Poor |
138 (22.5) |
65 (27.0) |
73 (19.7) |
|
|
|
Functional status factors |
|
|
|
|
|
|
|
Visual impairment |
No |
267 (43.6) |
92 (38.2) |
175 (47.2) |
6.01 |
0.049*
|
|
Some |
306 (50.0) |
129 (53.5) |
177 (47.7) |
|
|
|
Severe |
39 (6.4) |
20 (8.3) |
19 (5.1) |
|
|
|
Hearing impairment |
No |
416 (68.0) |
142 (58.9) |
274 (73.9) |
16.05 |
0.000***
|
|
Some |
163 (26.6) |
85 (35.3) |
78 (21.0) |
|
|
|
Severe |
33 (5.4) |
14 (5.8) |
19 (5.1) |
|
|
|
Mobility impairment |
No |
371 (60.6) |
117 (48.5) |
254 (68.5) |
34.20 |
0.000***
|
|
Some |
190 (31.0) |
88 (36.5) |
102 (27.5) |
|
|
|
Severe |
51 (8.3) |
36 (14.9) |
15 (4.0) |
|
|
|
Difficulty climbing 10 stairs |
Yes |
342 (55.9) |
164 (68.0) |
178 (48.0) |
23.07 |
0.000***
|
|
No |
270 (44.1) |
77 (32.0) |
193 (52.0) |
|
|
|
Difficulty walking 300 m |
Yes |
269 (44.0) |
136 (56.4) |
133 (35.8) |
24.30 |
0.000***
|
|
No |
343 (56.0) |
105 (43.6) |
238 (64.2) |
|
|
|
ADL |
Independent |
481 (78.6) |
166 (68.9) |
315 (84.9) |
21.36 |
0.000***
|
|
Needs assistance |
131 (21.4) |
75 (31.1) |
56 (15.1) |
|
|
|
IADL |
Independent |
378 (61.8) |
121 (50.2) |
257 (69.3) |
21.69 |
0.000***
|
|
Needs assistance |
234 (38.2) |
120 (49.8) |
114 (30.7) |
|
|
|
Fall-related factors |
|
|
|
|
|
|
|
Fall treatment |
Yes |
363 (59.3) |
108 (44.8) |
255 (68.7) |
33.65 |
0.000***
|
|
No |
249 (40.7) |
133 (55.2) |
116 (31.3) |
|
|
|
Fall reason |
Environmental |
329 (53.8) |
100 (41.5) |
229 (61.7) |
23.25 |
0.000***
|
|
Physical |
283 (46.2) |
141 (58.5) |
142 (38.3) |
|
|
|
Environmental factors |
|
|
|
|
|
|
|
Housing type |
Detached house |
273 (44.6) |
110 (45.6) |
163 (43.9) |
2.08 |
0.555 |
|
Apartment |
258 (42.2) |
105 (43.6) |
153 (41.2) |
|
|
|
Townhouse |
78 (12.7) |
25 (10.4) |
53 (14.3) |
|
|
|
Other |
3 (0.5) |
1 (0.4) |
2 (0.5) |
|
|
|
Housing convenience |
Inconvenient |
97 (15.8) |
44 (18.3) |
53 (14.3) |
2.97 |
0.226 |
|
Not inconvenient, but without elder-friendly features |
365 (59.6) |
134 (55.6) |
231 (62.3) |
|
|
|
Equipped with elder-friendly features |
150 (24.5) |
63 (26.1) |
87 (23.5) |
|
|
재낙상 예측 모델 간 성능 비교
재낙상 예측을 위한 네 가지 모델의 성능을 비교한 결과, 전반적으로 트리 기반 모델이 로지스틱 회귀 모델에 비해 우수한 성능을 보였다( Table 3). 이 중 랜덤포레스트 모델은 정확도(0.71), 정밀도(0.75), F1-score (0.77), AUC (0.75) 등 대부분의 지표에서 높은 값을 보여, 가장 우수한 예측 성능을 나타냈다. XGBoost는 재현율(0.88) 측면에서는 가장 우수한 성능을 보였으나, 정확도(0.67), 정밀도(0.68), AUC (0.71)는 랜덤포레스트보다 낮아, 양성 클래스(재낙상)의 탐지에는 효과적이지만 전체적인 예측 성능의 균형은 상대적으로 미흡한 것으로 나타났다. CatBoost 역시 재현율(0.83)은 높았지만, 정확도(0.65), 정밀도(0.68), F1-score (0.75), AUC (0.72)에서는 XGBoost보다 다소 낮은 성능을 보였다. 반면, 로지스틱 회귀 모델은 정밀도(0.71)를 제외한 대부분의 지표에서 가장 낮은 성능을 보였으며, 특히 F1-score (0.65)와 AUC (0.66)가 다른 모델에 비해 현저히 낮아, 예측력 측면에서 제한적인 성능을 나타냈다. 모델 성능의 안정성 확인을 위해 5-fold 교차검증을 실시한 결과, 평균 정확도는 랜덤포레스트 0.68 (±0.05), XGBoost 0.64 (±0.03), CatBoost 0.65 (±0.07), 로지스틱 회귀 0.68 (±0.04)로 나타났으며, 이는 검정 데이터에서 관찰된 성능과 유사한 경향을 보였다.
Table 3.
Performance comparison of recurrent fall prediction models
|
Accuracy |
Precision |
Recall |
F1-score |
AUC |
|
Logistic regression |
0.61 |
0.71 |
0.61 |
0.65 |
0.66 |
|
Random forest |
0.71
|
0.75
|
0.79 |
0.77
|
0.75
|
|
XGBoost |
0.67 |
0.68 |
0.88
|
0.77
|
0.71 |
|
CatBoost |
0.65 |
0.68 |
0.83 |
0.75 |
0.72 |
각 모델의 AUC와 ROC 곡선은 Figure 2에 제시되어 있으며, 특히 FPR (false positive rate)이 약 0.2 내외인 구간을 제외한 전 구간에서 랜덤포레스트가 가장 높은 TPR (true positive rate)을 보였다. 추가적으로, DeLong 검정을 통해 랜덤포레스트를 기준으로 다른 모델들과의 AUC 차이를 비교한 결과, XGBoost와 CatBoost는 통계적으로 유의하지 않았으나, 로지스틱 회귀 모델과는 유의한 차이를 보였다( p <0.001). 즉, 랜덤포레스트가 수치적으로 가장 우수한 AUC를 보였으나, 다른 트리 기반 모델들과의 성능 차이는 뚜렷하지 않았다.
Figure 2.
Comparison of receiver operating characteristic (ROC) curves for each model. XGBoost, eXtreme gradient boosting; CatBoost, categorical boosting; AUC, area under the curve.
변수 중요도 분석
Figure 3은 랜덤포레스트를 기준으로 산출한 변수 중요도를 시각화한 것이다. 분석 결과, 연령이 가장 높은 중요도를 보였으며, 우울, 낙상 후 치료 여부, 인지기능, 낙상 원인, 만성질환 수, 처방약 수, 평소 건강상태 순으로 높은 기여도를 나타냈다.
Figure 3.
Feature importances identified by the random forest model.
고찰 및 결론
본 연구는 낙상 경험이 있는 65세 이상 노인을 대상으로 네 가지 머신러닝 알고리즘을 활용하여 재낙상 예측 모델을 구축하고 성능을 비교함으로써, 예측에 기여한 주요 변수를 확인하고자 하였다. 분석 결과, 랜덤포레스트가 전반적으로 가장 우수한 성능을 나타냈으며, 로지스틱 회귀와는 유의한 차이를 보여 본 연구에서 재낙상 예측에 가장 적합한 모델로 확인되었다. 이러한 결과는 낙상 예측을 다룬 기존의 선행연구에서도 유사하게 나타난 바 있다. Millet et al. [ 17]은 대규모 전자건강기록(electronic health record, EHR) 데이터를 활용하여 6가지 알고리즘을 비교한 결과, 랜덤포레스트가 정확도 0.76, AUC 0.75로 가장 우수한 성능을 보였으며, Suh et al. [ 18] 또한 노인실태조사 기반 연구에서 랜덤포레스트가 정확도 0.94, AUC 0.91로 가장 높은 성능을 나타냈다. 이들 연구는 낙상을 대상으로 하였으나, 랜덤포레스트가 다른 알고리즘보다 상대적으로 우수한 성능을 보였다는 점에서 본 연구의 결과와 일관성을 갖는다. 본 연구에서는 데이터 구조가 랜덤포레스트의 배깅 기반 학습 특성과 부합하여, 과적합을 최소화하고 변수 간 상호작용을 효과적으로 반영함으로써[ 27, 28], 안정적인 성능을 유지하는 데 기인한 것으로 해석된다. 반면, XGBoost와 CatBoost는 부스팅 기반 알고리즘 특성상 재현율은 높았으나 정밀도가 낮아지는 경향을 보여[ 31], 전반적인 성능 균형 측면에서는 상대적으로 제한적이었다.
재낙상의 위험 요인으로는 성별, 연령, 가구형태, 교육정도, 우울, 낙상 경험, 기저질환(심혈관질환, 당뇨, 녹내장 등), 일상생활수행 및 보행의 어려움, 주거환경 등이 보고된 바 있다[ 21– 25]. 본 연구는 이러한 요인을 포함하여 머신러닝 알고리즘을 적용하였으며, 가장 높은 성능을 보인 랜덤포레스트를 활용해 변수 중요도를 분석하였다. 그 결과 연령, 우울, 낙상 후 치료 여부, 인지기능, 낙상 원인, 만성질환 수, 처방약 수, 평소 건강상태 등의 순으로 높은 중요도를 보였다. 선행연구에 따르면 고령일수록 근력 저하, 균형 감각 감소, 반응 속도 둔화 등 전반적인 신체기능 약화로 인해 낙상 발생률이 증가하는 것으로 알려져 있다[ 32– 34]. 본 연구에서는 연령이 재낙상 예측에 가장 중요한 변수로 나타나, 이러한 경향이 재낙상 위험에도 적용될 수 있음을 시사한다. 이외에도 우울, 낙상 후 치료 여부, 인지기능, 낙상 원인 등의 변수가 상대적으로 높은 중요도를 보였다. 우울과 인지기능 저하는 신체 활동 감소, 주의력 및 판단력 저하 등을 유발하여 낙상 위험을 증가시키며[ 9, 21, 35], 이는 결과적으로 재낙상 위험으로 이어질 수 있음을 시사한다. 낙상 후 치료 여부는 단기간 내 재낙상 위험 증가와 관련된 변수로[ 36], 초기 낙상에 대한 대응 수준이나 건강 위협에 대한 인식이 이후 낙상 예방 행동에 영향을 미칠 수 있음을 시사한다. 낙상 원인의 경우, 선행연구에서 반복 낙상자의 주요 원인으로 신체적 요인이 확인된 바 있으며[ 21], 이는 기저 신체 기능 저하가 재낙상 위험에 영향을 미치는 주요 요인임을 시사한다. 이러한 결과는 재낙상 예방을 위해 연령별 기능 수준을 고려한 맞춤형 전략뿐만 아니라 정신건강, 신체 기능 강화, 낙상 후 회복 관리 등 다양한 건강 요인을 통합적으로 반영한 다학제적 접근이 필요함을 시사한다.
본 연구는 다음과 같은 한계점을 가진다. 첫째, 본 연구는 횡단면 자료에 기반한 분석으로 변수 간 인과관계를 명확히 규명하는 데 한계가 있다. 따라서 특정 변수가 재낙상에 영향을 미쳤다고 단정하기보다는, 이들 간의 통계적 관련성과 예측 가능성을 중심으로 해석해야 할 필요가 있다. 둘째, 일부 변수는 응답자의 자기보고에 기반하고 있어 회상 편향이나 응답 오류가 개입되었을 가능성이 있다. 이는 변수 간의 실제 관계를 왜곡시켜 예측 모델의 정확도 저하로 이어졌을 수 있다. 셋째, 본 연구에서 사용된 데이터는 1개년도 자료에 한정되어 있어 전체 표본 수가 제한적이며, 이는 머신러닝 알고리즘의 학습 및 일반화 성능에 일정 부분 제약으로 작용할 수 있다. 다년도의 데이터를 통합하여 분석하고자 하였으나, 조사 시기별 활용가능한 공통 변수가 제한적이었고, 이로 인해 모델의 예측 성능 향상에 한계가 있었다. 또한 본 연구에서는 랜덤포레스트, XGBoost, CatBoost 등 주로 트리 기반 알고리즘에 국한되어, 다양한 알고리즘을 적용한 비교 및 검증에는 한계가 존재할 수 있다. 넷째, 본 연구는 특정 시점의 단일 표본을 기반으로 하였기 때문에 연구 대상의 특성이 제한적이며, 결과의 외적 타당도에 일정한 한계가 존재한다. 즉, 본 예측 모델의 적용 가능성은 표본의 특성과 유사한 집단에 국한될 수 있으며, 다른 지역이나 다양한 특성을 지닌 고령자 집단에 일반화하기 위해서는 신중한 해석이 요구된다.
그럼에도 불구하고, 본 연구는 제한된 표본 수를 바탕으로 전통적인 회귀분석보다 예측 성능이 우수한 머신러닝 모델을 제시했다는 점에서 실질적인 의의를 지닌다. 특히, 기존 연구들이 단순 낙상 예측에 집중한 것과 달리 본 연구는 낙상 경험이 있는 노인을 대상으로 재낙상 예측을 위한 머신러닝 기법을 최초로 적용하였다는 점에서 학술적 차별성을 가진다. 나아가 본 연구는 국내에서 재낙상 예측 연구를 체계적으로 확장해 나갈 수 있는 학문적 기반을 마련했다는 점에서도 의미가 있다. 본 연구에서 제시한 모델은 재낙상 고위험군의 조기 선별 가능성을 보여주었으며, 장기적이고 구조화된 데이터를 다년간 통합하여 신경망과 같은 딥러닝 기법을 적용한다면, 예측 정확도와 모델 성능을 더욱 향상시킬 수 있을 것이다. 이러한 고도화 과정을 통해 본 연구의 결과는 실무에서 활용 가능한 의사결정 지원 도구로 발전할 수 있으며, 더 나아가 노인의 개별 특성에 맞춘 맞춤형 위험 예측 및 중재 설계가 가능한 인공지능 기반 시스템으로 확장될 수 있다는 점에서 실질적인 함의를 갖는다.
REFERENCES
1. Korea National Statistical Office. 2024 Statistics on the aged. Daejeon: Korea National Statistical Office; 2024. (Korean).
3. Kallestrup-Lamb M, Marin AOK, Menon S, Søgaard J. Aging populations and expenditures on health. J Econ Ageing 2024;29:100518. DOI: 10.1016/j.jeoa.2024.100518.
5. Kim JM, Lee MS. Risk factors for falls in the elderly population in Korea: An analysis of the Third Korea National Health and Nutrition Examination Survey data. J Korean Soc Health Edu Promot 2007;24(4):23-39. (Korean).
7. AdS Passos, Sanudo A, Ishigaki EY, Magalhaes MAZ, Pena SB, do Carmo ACF, et al. Mediation analysis of antidepressant use, depressive symptoms, and recurrent falls in community-dwelling older fallers: An exploratory study. Arch Gerontol Geriatr Plus 2024;1(4):100051. DOI: 10.1016/j.aggp.2024.100051.
8. Pérez-Ros P, Martínez-Arnau FM, Orti-Lucas RM, Tarazona-Santabalbina FJ. A predictive model of isolated and recurrent falls in function-ally independent community-dwelling older adults. Braz J Phys Ther 2019;23(1):19-26. DOI: 10.1016/j.bjpt.2018.05.005.
10. Malde A, Prabhu VG, Banga D, Hsieh M, Renduchintala C, Pirrallo R. A machine learning approach for predicting maternal health risks in lower-middle-income countries using sparse data and vital signs. Future Internet 2025;17(5):190. DOI: 10.3390/fi17050190.
12. Araujo-Moura K, Souza L, de Oliveira TA, Rocha MS, de Moraes ACF, Chiavegatto Filho A. Prediction of hypertension in the pediatric pupulation using machine learning and transfer learning: A multicentric analysis of the SAYCARE study. Int J Public Health 2025;70:1607944. DOI: 10.3389/ijph.2025.1607944.
14. Young AJ, Hare A, Subramanian M, Weaver JL, Kaufman E, Sims C. Using machine learning to make predictions in patients who fall. J Surg Res 2021;257:118-127. DOI: 10.1016/j.jss.2020.07.047.
16. Chen YH, Xu JL. Applying artificial intelligence to predict falls for in-patient. Front Med 2023;10:1285192. DOI: 10.3389/fmed.2023.1285192.
17. Millet A, Madrid A, Alonso-Weber JM, Rodríguez-Mañas L, Pérez-Rodrá-Guez R. Machine learning techniques applied to the development of a fall risk index for older adults. IEEE Access 2023;11:84795-84809. DOI: 10.1109/ACCESS.2023.3299489.
18. Suh MH, Jung HS, Kim JL. Development of a fall prediction model for community-dwelling older adults in South Korea using machine learning: A secondary data analysis. J Korean Biol Nurs Sci 2024;26(4):288-299. (Korean).DOI: 10.7586/jkbns.24.024.
19. Onel S, Zeid A, Kamarthi S, Harris MH. Analysis of risk factors and predictive model for recurrent falls in community dwelling older adults. Int J Collab Enterp 2010;1(3-4):234-247. DOI: 10.1504/IJCENT.2010. 038358.
20. Stel VS, Pluijm SMF, Deeg DJH, Smit JH, Bouter LM, Lips P. A classification tree for predicting recurrent falling in community-dwelling older persons. J Am Geriatr Soc 2003;51(10):1356-1364. DOI: 10.1046/j.1532-5415.2003.51452.x.
21. Sim MS, Woo CH. Risk factors of recurrent falls among community-dwelling older adults with fall experience. J Learn Cent Curric Instr 2024;24(8):201-210. (Korean).DOI: 10.22251/jlcci.2024.24.8.201.
23. Park HS, Chang R, Park KY. Comparative study on fall-related characteristics between single and recurrent falls in community-dwelling older women. Korean J Adult Nurs 2008;20(6):905-916. (Korean).
24. Jeong RN, Ho JH, Chung YY, Park KH, Kim JA, Kim MY, et al. Incidence and risk factors of recurrent falls in the elderly visiting the emergency department after a fall. Korean J Fam Pract 2019;9(6):554-559. DOI: 10.21215/kjfp.2019.9.6.554.
25. Yoo IY. Analysis of multi-variate recurrent fall risk factors in elderly people using residential assessment instrument-home care: Comparisons between single and recurrent fallers. J Korean Acad Nurs 2011;41(1):119-128. (Korean).DOI: 10.4040/jkan.2011.41.1.119.
26. Hosmer DW Jr, Lemeshow S, Sturdivant RX. Applied logistic regression. Hoboken: John Wiley & Sons, Inc.; 2013.
27. Breiman L. Random forests. Mach Learn 2001;45:5-32. DOI: 10.1023/A: 1010933404324.
28. Cutler DR, Edwards TC Jr, Beard KH, Cutler A, Hess KT, Gibson J, et al. Random forests for classification in ecology. Ecology 2007;88(11):2783-2792. DOI: 10.1890/07-0539.1.
29. Friedman J. Greedy function approximation: A gradient boosting machine. Ann Stat 2001;29(5):1189-1232. DOI: 10.1214/aos/1013203451.
31. Chen T, Guestrin C. XGBoost: A scalable tree boosting system. In: Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining 2016:785-794. DOI: 10.1145/2939672.2939785.
32. Chu LW, Chi I, Chiu AY. Incidence and predictors of falls in the Chinese elderly. Ann Acad Med Singap 2005;34(1):60-72.
33. Runge JW. The cost of injury. Emerg Med Clin North Am 1993;11:241-253.
35. Lim SK. Assessment of fall risk factors. Geriatr Rehabil 2024;14(1):1-9. (Korean).
|
|