폐렴 환자 분류를 위한 연합학습과 공정한 연합학습 비교
Abstract
Objectives
This study aims to compare the performance of federated learning (FL) and fair federated learning (FFL) in classifying pneumonia patients based on chest X-ray data. The primary focus is on assessing the accuracy and fairness of these models in handling imbalanced and distributed data in real-world healthcare settings.
Methods
We used a large chest X-ray dataset to evaluate the performance of FL and FFL models. The models were built using the ResNet50 architecture, and experiments were conducted under both independent and identically distributed (IID) and non-IID data conditions. The FFL approach applied optimized loss functions to address data imbalance and ensure fair contribution from each client, regardless of the local data distribution.
Results
Our findings indicate that FFL consistently outperforms traditional FL models, particularly in non-IID environments. The FFL model demonstrated higher accuracy in pneumonia classification, achieving a significant improvement in model fairness and performance across different client datasets. The use of the ResNet50 architecture further enhanced the model's ability to handle complex X-ray image patterns.
Conclusions
FFL offers a superior solution for handling imbalanced medical data compared to conventional FL models. Its ability to maintain fairness while improving classification accuracy makes it an ideal approach for decentralized healthcare systems, ensuring better patient outcomes while preserving data privacy.
Key words: Pneumonia, Classification, Federated learning, Fari federated learning, Chest X-ray
서 론
2024년 현재, Coronavirus disease 2019 (COVID-19)는 대부분의 국가에서 풍토병으로 간주되며 일상 회복이 됐지만 아직 전 세계에서 산발적으로 발생하고 있다. 세계보건기구(World Health Organization, WHO) COVID-19 대시보드에 따르면, 모든 나라에서 여전히 COVID-19 확진 사례가 보고되고 있으며, 주로 감염이 고르게 분포되어 있다[ 1]. 특히 인구 밀집 지역이나 의료 접근성이 낮은 지역에 감염 사례가 지속적으로 발생하고 있다. 백신 접종과 치료법이 보편화되어 중증 환자의 수는 감소했으나, 여전히 감염과 후유증에 대한 주의가 필요하다. 이런 COVID-19는 호흡기 바이러스로 인한 감기, 독감, 폐렴과 유사한 증상을 보이고 발열, 기침, 인후통 등과 함께 바이러스가 폐로 침투하면 폐렴을 유발할 수 있다. COVID-19에 의해 발생하는 폐렴은 급성 염증을 일으키며 심할 경우 폐섬유화와 같은 장기적인 손상을 초래할 수 있다.
폐렴은 주로 폐에 영향을 미치고 점차적으로 폐 기능을 약화시키는 급성 하기도 감염의 한 형태이다[ 2]. 일반적으로 발열, 오한, 가래를 동반한 기침, 가슴통증과 호흡곤란 등의 증상을 특징으로 한다. 통계청에 따르면, 폐렴은 우리나라 사망원인 4위로 사망률이 인구 10만 명당 52.1명에 달한다[ 3]. 전 세계적으로 폐렴은 영유아들의 사망 주요 원인으로 꼽히며, 가장 주요한 사망 원인 중 하나이다[ 4]. 따라서 COVID-19와 폐렴을 판단하고 치료하는 핵심은 감염된 환자를 효과적으로 선별하는 것이다. 주요 선별 방법은 흉부 엑스레이(X-ray) 및 컴퓨터 단층 촬영(computed tomography, CT) 스캔 등 영상 기술과 임상 테스트이다. 그중, 흉부 X-ray는 폐 염증이나 경화 부위를 식별하는 빠르고 비용 효율적인 방법으로 수십 년 동안 폐렴 진단에 사용되었다[ 5]. 그러나 방사선 전문의가 진단 정확도를 위해 각 흉부 X-ray를 분석해야 하므로 이러한 이미지를 수동으로 해석하려면 상당한 시간과 비용이 발생하게 된다. 따라서 본 연구에서는 흉부 X-ray 이미지를 통해 폐렴 여부를 예측하는 딥 러닝(deep learning) 모델을 개발하고자 한다.
기계 학습(machine learning, ML)과 딥 러닝 기술은 진단 정확도 향상, 환자 결과 예측, 치료 계획 최적화에 상당한 잠재력을 보였다[ 6]. 대규모 의료 이미지 데이터세트를 학습한 AI 모델은 분류 프로세스를 자동화함으로써 전문의가 의료 이미지 패턴 식별을 지원하여 진단 속도 및 수동 해석에 드는 시간과 비용을 감소시킨다[ 7].
하지만 의료분야, 특히 의료 이미지 분류와 같은 작업에서 AI의 사용이 더욱 보편화되면서 데이터 프라이버시에 대한 우려가 높아졌다. ML 모델을 훈련하는 데 필요한 대규모 의료 이미지 데이터 세트에는 민감한 개인 건강 정보가 포함되어 있는 경우가 많으며, 이는 연구기관이나 네트워크 전반에서 공유될 때 심각한 개인정보보호 문제를 야기한다[ 8]. 이러한 개인정보보호 문제를 해결하기 위해 최근 연구에서는 연합학습(federated learning, FL)을 이용한 연구가 진행되고 있다[ 9].
FL은 의료 데이터의 안전한 활용 및 개인정보보호를 위해 언급되는 기술이다. FL은 장치나 서버와 같은 분산된 클라이언트가 로컬 데이터를 사용하여 모델을 독립적으로 학습하는 머신러닝 방법이다[ 10]. 이 방식은 원본 데이터를 중앙 서버로 전송하는 대신 데이터가 각 클라이언트에 남아 모델 업데이트로 파라미터만을 중앙 서버로 전송하고, 중앙 서버는 업데이트를 집계하여 글로벌 모델을 형성하는 학습 방식이다. FL은 클라이언트-클라이언트, 클라이언트-서버 간 원본 데이터가 공유되지 않기에 데이터 프라이버시 향상에 탁월하다. 이러한 방식은 개인정보보호 규정 준수와 데이터 소유자의 프라이버시를 보호하는 데 유리하며, 네트워크 대역폭을 절약하고 중앙 데이터가 분산된 환경에서도 효율적이고 안전한 머신러닝 학습 수행이 가능하다. 그러나 FL 은 통신 과정에서 문제점이 존재한다. 클라이언트-서버 사이의 모델 업데이트 정보만 유출되어도, 적대적 공격자에 의해 클라이언트의 정보를 유추당할 위험이 존재한다[ 11]. 또 중앙 서버 집중식 학습에 대한 심층 신경망 훈련에 대한 성능은 충분히 연구되지 않았다[ 12]. 산업에서 FL을 보다 안전하게 사용하려면 통신 비효율성, 데이터 이질성, 개인정보보호 위험과 같은 FL의 문제 해결이 필수적이다. 이런 접근 방식 중 하나로 클라이언트 간의 데이터 이질성 및 컴퓨팅 리소스 불균형을 해결하여 FL의 문제를 개선하기 위한 솔루션이 공정한 연합학습(fair federated learning, FFL)이다. Figure 1은 FFL Framework이다.
Figure 1.
Fair federated learning (FFL) framework.
FFL은 빠르게 발전하는 분야로, 특히 의료 시스템에서 중요한 역할을 한다. FFL은 주로 클라이언트 간 데이터가 비균일하게 분포되는 non-independent and identically distributed (IID) 환경에서 연구된다. 기존의 IID 설정에서는 FL이 견고한 성능을 보이지만, non-IID 시나리오에서는 모델 성능과 통신 효율성 간의 trade-off가 문제로 지적된다. FFL의 핵심은 각 클라이언트의 데이터가 다를 때도 모델의 성능을 유지하고, 데이터의 질과 양에 따라 모델에 기여한 만큼 성과를 공정하게 반영하여야 한다.
본 연구에서는 세 가지 손실 함수와 최적화된 매개변수를 이용하여 폐렴 환자 분류에서 높은 성능을 보여준다. FFL을 이용하여 데이터를 공유하지 않으면서 모든 데이터 세트를 학습한 글로벌 모델 fair federated learning optimization loss ResNet50 (FFLOLR)를 제안한다. 기존 폐렴 연구에서 사용된 FL 방법들과 FFL 방법들의 성능을 비교하고 FFLOLR 모델을 추가로 비교하였다.
관련 연구
폐렴
폐렴과 같은 폐 질환을 감지하기 위하여 흉부 X-ray를 이용한 AI 연구가 다양하게 이루어졌다. Kumar et al. [ 13]은 약 3만 명의 정면 흉부 X-ray 이미지 112,120개를 포함한 흉부 X-ray 14 데이터 세트로 계단식 합성 신경망을 사용하여 흉부 X-ray의 다중 레이블 분류를 수행하였다. Nithya et al. [ 14]은 빠르고 정확한 폐렴 분류를 위해 5,866개의 흉부 X-ray 이미지를 Perona-Malik (PM)-멀티샘플링 기법을 적용한 Multi-plied DCGAN 모델로 약 96%의 정확도를 달성하였다.
Khan and Alam [ 15]은 FL 접근방식의 DL 모델을 적용하여 폐렴을 약 90%의 정확도로 감지하는 모델을 구축하였다. 이는 원내 데이터로 다른 병원의 로컬 모델을 훈련시켜 중앙 모델을 구축하고 모든 환자 데이터 개인정보가 안전하게 유지가능함을 제시하였다. Mabrouk et al. [ 16]은 ensemble learning (EL)과 FL을 결합한 ensemble federated learning (EFL) 접근 방식으로 개인정보를 유지하면서 폐렴을 95% 이상 정확히 진단하였다. Pan et al. [ 17]은 FedAvg 알고리즘하여 최신 모델에 비해 2% 향상된 98%의 정확도를 보였다. Kareem et al. [ 18]은 GDPR 규정에 따른 FL 환경을 구축하여 사전훈련된 ResNet-50에서 93%의 area under curve (AUC) 정확도를 보였다. Feki et al. [ 19]의 연구는 여러 기관의 흉부 X-ray에서 COVID-19를 선별할 수 있는 FL 연구를 진행하였다. 이는 불균형 데이터 세트 환경에서 약 92%의 정확도를 보였으며, 흉부 X-ray뿐만 아니라 대규모의 분산되어 있는 다른 의료영상 데이터에도 사용 가능함을 보였다.
Federated learning
지난 몇 년 동안 서버에서 로컬 가중치를 평균화하기 위한 다양한 접근 방식이 도입되었다. FedAvg [ 20]는 로컬 훈련 크기에 따라 로컬 가중치에 대해 가중 평균화를 수행하였다. FedProx [ 21]는 클라이언트가 글로벌 가중치에 대해 근위 정규화를 수행하는 동안 로컬 업데이트를 균일하게 평균화하였다. 반면 FedMA [ 22]는 로컬 가중치를 평균화할 때 레이어 방식으로 유사한 특징 추출 서명이 있는 숨겨진 요소를 일치시켰다. 최근 FL에서 레이블이 지정된 데이터의 부족 문제를 해결하려는 관심이 대두되고 있다[ 23].
하지만 FL에서는 대규모 이종 네트워크에서 통계 모델을 훈련하는 것이 포함된다. 이러한 네트워크에서 총 손실 함수를 순진하게 최소화하면 일부 장치에 불균형적으로 유리하거나 불리할 수 있다. 따라서 공정한 정확도 배포를 장려하는 무선 네트워크의 공정한 리소스 할당을 하여 공정성, 유연성 및 효율성을 향상시켰다[ 24].
Fair federated learning
SemiVRed는 클라이언트 간 기여의 균형을 맞추고 데이터 불균형을 해결하며, 결과적으로 공정한 모델 학습을 지원한다[ 25]. FFL은 데이터가 병원이나 연구기관의 로컬 서버에 남아있는 상태에서 협력적으로 모델을 학습하므로, 환자 데이터가 직접적으로 중앙 서버에 전송되지 않으므로 의료 데이터의 민감한 개인정보를 보호하는 데 중요한 역할을 한다[ 26]. 의료기관 간 데이터의 양과 질이 차이가 날 때, FFL은 데이터 불균형을 완화하는 방향으로 모델을 학습할 수 있다. 이를 통해, 작은 병원이나 진료소에서도 동일한 수준의 모델 성능을 확보할 수 있다[ 27]. 각 의료기관의 데이터 기여도를 반영하여 보다 공정한 학습 결과를 도출한다. 병원의 크기나 데이터 양에 상관없이 학습의 결과가 특정 기관에 치우치지 않도록 하여, 전반적인 의료 서비스 품질 향상에 기여할 수 있다[ 28]. 또한 FFL은 기존 FL의 편향, 공정성, 개인정보보호의 원인을 개선하기 위해 많이 연구되고 있다[ 29].
연구 방법
연구 개요
본 연구에서는 흉부 X-ray 데이터 세트를 사용하여 실제 데이터 분포로 시뮬레이션하는 환경에서 FL과 FFL을 검증하였다. 흉부 X-ray에 특화된 FL 방법과 FFL 방법을 비교 분석하고 본 연구에서 제안한 FFLOLR을 추가 비교하였다.
데이터세트 구축 및 전처리
본 연구에 사용한 데이터 세트는 흉부 X-ray [ 30]로 1992-2015년까지 수집된 32,717명의 고유한 환자의 텍스트 방사선 보고서에서 natural language processing (NLP) 기술을 통해 추출한 텍스트 마이닝된 8가지 일반적인 질병 레이블이 있는 108,948개의 정면 X-ray 이미지로 구성되어 있다. Department of Radiology and Imaging Sciences의 picture ar-chiving and communication systems (PACS) 시스템에서 마이닝한 흉부 X-ray 이미지이다. 칼럼은 무기폐, 심비대증, 유출, 침투, 대량의, 결절, 폐렴, 기흉으로 이루어졌고, 각 이미지는 하나 이상의 병리 키워드 또는 “정상”으로 레이블이 지정되어 있다. 흉부 X-ray에서 X-ray 이미지는 DICOM 파일에서 직접 추출되며 OpenI 데이터 세트의 512×512 이미지 크기와 비교하여 세부 내용을 크게 잃지 않고 1,024×1,024 비트맵 이미지로 크기가 조정된다. 강도 범위는 DICOM 헤더 파일에 저장된 기본 창 설정을 사용하여 재조정되었다. 108,948개의 정면 X-ray 이미지 중 24,636개의 이미지에는 하나 이상의 병리가 포함되어 있고, 나머지 84,312개의 이미지는 정상이다. 병리학 분류 및 지역화 작업을 위해 전체 데이터 세트를 stochastic gradient descent (SGD)를 통한 convolutional neural network (CNN) 미세 조정을 위해 세 개의 하위 그룹, 즉 train, val, test를 7:1:2로 무작위로 섞었다. 또한 이미지를 네트워크에 입력하기 전에 이미지를 224×224로 축소하고 ImageNet [ 29] 훈련 세트에 있는 이미지의 평균 및 표준 편차를 기반으로 정규화하고, 무작위 수평 뒤집기로 훈련 세트를 증강하였다.
FFL 방법
Fair Federated Learning Optimization Loss ResNet50 (FFLOLR)
본 연구에서 제안하는 FFLOLR 모델은 CheXNet 모델[ 31]에서 영감을 받은 FFLFCN 모델[ 32]에서 손실 함수를 보완하고, ResNet50을 이용하여 모델 구조를 단순화하고 성능을 향상시켰다. 기존 FFLFCN에서는 세 가지 손실 함수(Adversarial Loss, Contextual Loss, Encoder Loss)를 사용하여 손실 함수의 단점을 보완하였다. Adversarial Loss는 데이터세트의 폐렴 사례의 다양한 분포에 걸쳐 일반화에 실패할 때, 모델에 패널티를 주어 데이터 불균형을 줄이는 데 중요하고, 모든 클라이언트의 데이터에서 모델이 균일하게 잘 수행되도록 하는 데 중요한 역할을 한다. Contextual Loss는 X-ray 이미지에 폐 조직의 자세한 질감 정보를 보존하는 데 중점을 두어 정상 영역과 폐렴에 걸린 영역 간의 미묘한 구별을 효과적으로 포착한다. Encoder Loss는 입력 기능의 인코딩 프로세스를 견고한 기능 공간으로 안정화하여 특정 폐렴 패턴에 대한 과적합 위험을 줄이고 다양한 환자 그룹으로 일반화하는 것을 촉진한다. 하지만 이 세 가지 손실 함수의 합은 몇 가지 잠재적인 문제가 있다. Adversarial Loss와 Contextual Loss의 합을 했을 때, Adversarial Loss가 특정한 데이터 불균형을 줄이려 할 때, Contextual Loss가 세부적인 특징 보존에 집중하여 서로 간섭하므로 손실 최소화 과정에서 충돌이 생길 수 있다. Encoder Loss와 Contextual Loss의 합을 통해 최적화 과정이 불안정해져 학습이 수렴하지 않을 위험이 있다. 따라서 각 손실의 역할을 명확하게 설정하기 위해 가중치 최적화 기법을 이용하였다. 세 가지 손실 함수의 가중치를 하이퍼파라미터(hyperparameter)로 설정하고, 이를 교차 검증을 통해 최적화하였다. 교차 검증을 통해 세 가지 함수의 상호작용을 고려하면서 가장 성능이 좋은 가중치 조합을 하였다.
따라서 FFLOLR 모델에서 세 가지 손실 함수에 대한 가중치 최적화는 교차 검증 방법을 사용하여 체계적으로 수행되었다. 다양한 가중치 조합을 실험하여 어떤 구성이 전체 손실을 효과적으로 최소화하는지 포함하고, 각 손실 함수에 대한 가중치 집합이 사전 정의된 범위에 걸쳐 체계적으로 달라지는 그리드 검색 기술을 구현하였다. 각 조합의 성능은 세 가지 손실 함수 간의 균형을 맞추는 능력에 따라 평가되었으며, 데이터 불균형을 최소화하고 학습에서 불안정성을 유발하지 않으면서 자세한 기능을 유지하는 데 중점을 두었다. Adversarial, Contextual, Encoder 손실 함수에 대한 최적화된 가중치는 각각 0.5, 0.3, 0.2로 구성하였다. 선택된 가중치는 손실 함수 간의 적대적 충돌을 완화하는 데 도움이 되며, 이 경우 하나가 다른 하나를 압도하여 보이지 않는 데이터에 대한 모델 성능이 저하될 수 있다.
ResNet50은 잔차 연결(residual connection)을 사용하여 딥러닝 모델의 학습 효율을 높인다. 네트워크가 깊어짐에 따라 발생하는 기울기 소실 문제를 완화하여, 더 깊은 네트워크에서도 안정적인 학습을 가능하게 한다. 또한 50개의 계층을 통해 이미지에서 저수준부터 고수준까지 계층적인 특징을 추출하는데 효과적이고, X-ray 이미지와 같은 특정 의료 데이터에서 작은 병변이나 미세한 차이를 잘 포착할 수 있게 하여 분류 정확도를 높였다. DenseNet은 각 계층이 이전의 모든 계층에 직접 연결되는 복잡한 구조를 가지고 있어 높은 계산 비용이 요구된다. 반면 ResNet50의 단순한 구조는 계산 자원이 제한된 FFL에서 더 적합하다.
최적화된 FFLOLR 모델과 X-ray Report의 관계 및 공동 학습시키고 Figure 2를 통해 FFLOLR model construction을 보여준다. 본 모델을 평가하기 위해 데이터 세트를 train, val, test를 7:1:2로 무작위로 분할하였다. 또한 흉부 X-ray를 분류하기 위해 특화된 FL 모델과 FFL 모델을 종합적으로 비교하였다.
Figure 2.
Fair Federated Learning Optimization Loss ResNet50 (FFLOLR) model construction.
본 연구에서 폐렴 이미지는 농도 매개변수 0.5인 비대칭 디리클레 (Dirichlet) 분포를 사용하여 10명의 클라이언트에게 분배되었고, 클라이언트 간에 데이터 표현에 상당한 차이가 발생하였다. 클라이언트 1부터 10은 {80, 75, 70, 65, 60, 50, 40, 30, 20, 10}로 폐렴 사례를 나누었고, 이는 현실적인 non-IID 시나리오를 효과적으로 시뮬레이션하였다. 각 클라이언트에서 모델 성능을 분석한 결과, 데이터 이질성이 높은 클라이언트는 수렴 속도가 느리고 모델 정확도가 낮아 non-IID 설정에서 연합학습 문제를 강조하였다. 추가로 non-IID 데이터에서 도입된 특정 문제와 행동을 확인하기 위해 IID, non-IID 조건에서 모델 성능을 비교하였다.
연구 결과
본 연구에서는 폐렴 환자 분류에서의 FL 방법과 FFL 방법을 비교하였다. Tables 1, 2에서 체계적으로 분석하였다.
FL을 활용한 흉부 X-ray 연구는 Table 1에 비교 정리하였다. DCGAN 은 GAN을 사용하여 의료 이미지의 기본 데이터 아키텍처를 발견하여 고품질의 현실적인 예를 만들었다[ 33]. Transfer learning을 사용하여 필요 이상으로 적은 양의 입력으로 신경망을 학습하고, 신경망의 인식된 영역을 강조하여 진단 프로세스의 투명성과 이해도를 개선하였다[ 34]. Customized VGG16은 CNN 기반 접근방식을 사용하여 흉부 X-ray 이미지를 정상, 박테리아, 바이러스로 분류하였다. 전체 이미지를 사용하는 대신 추출된 ROI 폐 영역만 사용하여 수정된 VGG16 모델을 학습하였다[ 35]. VGG16은 CNN과 Xception을 사용하여 전이학습과 미세조정을 사용하여 훈련하였다[ 36]. DensNet121 개념을 기반으로 CNN 기반 자동 전이학습 기술을 제안하였다[ 37]. EL은 CNN, Mo-bileNetV2, Vision Transformer를 사용하여 흉부 X-ray에서 폐렴을 진단하기 쉽게 하였다[ 38]. 의료 전문가를 지원하기 위해 흉부 X-ray 이미지를 정상, 폐렴 두 가지 범주로 구분하는 DL 기반 모델이다[ 39]. En-semble은 콘텐츠 차이를 채우고 학습 시간을 줄이기 위해 전이 학습 전략을 사용하고, 다중 클래스 분류를 달성하기 위해 향상된 VGG16 심층 전이 학습 설계를 사용하였다[ 40].
Table 1.
Federated learning method comparison
Model |
Accuracy (%) |
Year |
DCGAN |
84.19 |
2018 |
Transfer learning |
92.80 |
2018 |
Customized VGG16 |
96.20 |
2018 |
VGG16 |
87.00 |
2019 |
DenseNet121 |
86.80 |
2021 |
EL |
93.91 |
2022 |
NN+VGG16 |
95.40 |
2023 |
Ensemble |
96.20 |
2023 |
ResNet50 |
94.23 |
2023 |
DenseNet121 |
95.03 |
2023 |
EFL |
96.63 |
2023 |
이와 같이 폐렴 분류 연구를 위한 최신 FL 모델들은 CNN 모델보다 더 나은 성능을 보였다. FL은 로컬 개인 데이터를 중앙 집중화할 필요 없이 중앙 집중화된 ML 방법을 능가하였다.
Table 2는 최신 4가지 FFL 방법들과 FFLOLR 방법의 정확도 비교하여 나타냈다. 최신 FFL 방법들과 비교하였을 때 FFLOLR 방법은 높은 성능을 보였다.
Table 2.
Fair federated learning method comparison
Model [reference] |
Accuracy (%) |
Year |
ResNet50 |
82.53 |
2023 |
GhostNet [41] |
82.92 |
2023 |
FFLFCN [32] |
91.40 |
2023 |
HFAD [42] |
93.27 |
2024 |
FFLOLR (Ours) |
94.67 |
Present |
본 연구에서는 흉부 X-ray 데이터 세트에 대해 20 epoch 동안 모델을 훈련하여 평가하였다. FFLOLR 모델이 흉부 X-ray 데이터 세트에서 높은 Accuracy, AUC를 달성한 것을 보여준다. Table 3은 CNN 모델을 사용하여 얻은 결과이다. Table 4는 FFL 모델인 FFLFCN와 FFLOLR이 FL 환경에서 기존 성능보다 AUC가 향상된 것을 보여준다. FL의 문제점인 각 로컬 디바이스에서 데이터 세트의 특정 클래스 데이터를 갖고 있는 상황에서도 Universial한 데이터 세트를 만들 수 있는지 평가하였다. Table 5는 CNN, multi-layer perceptron (MLP) 기반의 FL을 적용한 결과를 보여준다. 성능 평가는 IID, Non-IID를 사용하였다. 결과적으로 FL 환경에서 기존 성능보다 향상됨을 확인할 수 있었다.
Table 3.
Full chest X-ray image data model results
Model |
Precision |
Recall |
F1-score |
Accuracy |
DenseNet121 |
0.9502 |
0.9503 |
0.9502 |
0.9503 |
EL-ALL |
0.9294 |
0.9295 |
0.9291 |
0.9295 |
FFLFCN |
0.9126 |
0.9135 |
0.9133 |
0.9135 |
FFLOLR |
0.9422 |
0.9467 |
0.9470 |
0.9467 |
Table 4.
Area under the curve (AUC) score
Dataset |
Type |
Model |
AUC |
Chest X-ray |
Pneumonia |
FFLFCN |
0.9153 |
FFLOLR |
0.9316 |
Table 5.
Comparison prediction results
Dataset |
Model |
IID |
Non-IID |
Chest X-ray |
MLP |
95.63 |
91.61 |
CNN |
97.42 |
93.19 |
고 찰
본 연구에서는 폐렴 환자 분류를 위해 FL과 FFL을 비교하였다. 의료 데이터의 민감성과 데이터 분포의 불균형성 문제를 해결하기 위한 중요한 연구를 제공한다. FL은 데이터가 병원이나 의료기관의 서버에 머물러 있는 상태에서 공동으로 모델을 학습할 수 있게 한다. 이를 통해 각 기관의 데이터가 중앙으로 이동하지 않고도 높은 수준의 모델을 학습할 수 있다. 이는 의료 데이터의 프라이버시 보호와 규제 준수를 위해 중요하다.
FFL은 각 병원 또는 기관이 학습에 기여하는 데이터의 양이나 질이 다를 때, 학습 과정에서 각 클라이언트의 기여도를 공정하게 반영하는 데 초점을 맞춘다. 이는 각 클라이언트가 가진 데이터 분포의 차이로 인해 발생할 수 있는 성능 편차를 줄이기 위해 중요하다. FFL을 통해 병원이 소유한 데이터의 특성에 따라 과도한 성능 차이가 발생하지 않도록 조정할 수 있다.
이러한 비교 연구들은 폐렴 진단과 같은 구체적인 의료 응용에서 FL과 FFL의 성능 차이와 효율성, 공정성 균형을 연구하며, FL의 데이터 프라이버시 보호와 FFL의 데이터 불균형 문제 해결의 장점을 함께 고려한다.
결 론
본 연구에서는 FL 프레임워크를 기반으로 CXR 이미지를 활용하여 폐렴 식별에 대한 실험을 진행하였다. 또한, 민감한 의료데이터를 다루는 데 중요한 성능 및 데이터 보호 측면에서 FFL의 잠재력을 보여줬다. 특히 FL에서는 가중치만 전송되며 참가자는 서로의 로컬 데이터 세트를 인식하지 못하고 개인정보 유출을 방지할 수 있다. 제안된 접근방식은 기존 접근 방식을 보완하고 비식별화 과정에서 발생할 수 있는 문제를 방지하기 위해 사용될 수 있다.
그러나, FL 모델의 성공 여부는 데이터 및 매개변수의 품질을 포함한 많은 요인에 달려있다. 현재 환자의 건강정보 데이터를 조사하거나, 수집할 수 없는 의료 FL은 설명 가능성을 입증하기가 어렵다. 하지만 향후 연구에서는 입력 데이터 중 어느 부분이 심층 신경망 출력값에 영향을 미치는지 파악해 기존 black-box 특성을 벗겨내고 있는 설명가능한 AI (eXplainable artificial intelligence, XAI)를 사용하여 문제점을 해결할 것이다.
REFERENCES
2. Kim SS. Factors affecting mortality and distribution of co-morbidities in chronic obstructive pulmonary disease. J Health Info Stat 2024;49(1):35-45. (Korean).DOI: 10.21032/jhis.2024.49.1.35.
3. Statistics Korea. 2022 Death cause statistics results final. Sejong: Statistics Korea; 2023. (Korean).
4. Gabruseva T, Poplavskiy D, Kalinin AA. Deep learning for automatic pneumonia detection. Proceedings of the 2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshops (CVPRW). Seattle, WA, USA,.2020;1436-1443. DOI: 10.1109/CVPRW50498.2020.00183.
5. Wong HYF, Lam HYS, Fong AHT, Leung ST, Chin TWY, Lo CSY, et al. Frequency and distribution of chest radiographic findings in patients positive for COVID-19. Radiology 2020;296(2):E72-E78. DOI: 10.1148/radiol.2020201160.
7. Li J, Zhu G, Hua C, Feng M, Bennamoun B, Li P, et al. A systematic collection of medical image datasets for deep learning. ACM Computing Surveys 2021;56(5):1-51. DOI: 10.1145/3615862.
8. Koutsoubis N, Yilmaz Y, Ramachandran RP, Schabath M, Rasool G. Privacy preserving federated learning in medical imaging with uncertainty estimation. arXiv: 2406.12815. 2024;DOI: 10.48550/arXiv.2406.12815.
9. Kim D, LEE K, Woo H, Lee Y. ACMFed: Fair semi-supervised federated learning with additional compromise model. IEEE Access. 2025;DOI: 10.1109/ACCESS.2025.3536639.
10. Na K, Kim D, Lee Y. VROFed: Optimized fair federated learning using partial variance reduction. J Korea Inst Inf Commun Eng 2025;29(1):34-44. (Korean).DOI: 10.6109/jkiice.2025.29.1.34.
11. Nair AK, Raj ED, Sahoo J. A robust analysis of adversarial attacks on federated learning environments. Computer Standards Interfaces 2023;86:103723. DOI: 10.1016/j.csi.2023.103723.
12. He K, Zhang X, Ren S, Sun J. Deep residual learning for image recog-nition. arXiv: 1512.03385. 2015;DOI: 10.48550/arXiv.1512.03385.
13. Kumar P, Grewal M, Srivastava MM. Boosted cascaded convnets for multilabel classification of thoracic diseases in chest radiographs. arXiv: 1711.08760. 2017;DOI: 10.48550/arXiv.1711.08760.
14. Nithya TM, Kanna PR, Vanithamani S, Santhi P. An efficient PM-mul-tisampling image filtering with enhanced CNN architecture for pneumonia classfication. Biomed Signal Process Control 2023;86:105296. DOI: 10.1016/j.bspc.2023.105296.
15. Khan SH, Alam MGR. A federated learning approach to pneumonia detection. ICEET2021. 2021;1-6. DOI: 10.1109/ICEET53442.2021.9659591.
16. Mabrouk A, Redondo RPD, Abd Elaziz M, Kayed M. Ensemble federated learning: An approach for collaborative pneumonia diagnosis. Appl Soft Comput 2023;144:110500. DOI: 10.1016/j.asoc.2023.110500.
18. Kareem A, Liu H, Velisavljevic V. A federated learning framework for pneumonia image detection using distributed data. Healthcare Ana-lytics 2023;4:100204. DOI: 10.1016/j.health.2023.100204.
20. McMahan HB, Moore E, Ramage D, Hampson S, y Arcas BA. Communication-efficient learning of deep networks from decentralized data. arXiv: 1602.05629. 2016;DOI: 10.48550/arXiv.1602.05629.
21. Li T, Sahu AK, Zaheer M, Sanjabi M, Talwalkar A, Smith V. Federated optimization in heterogeneous networks. arXiv: 1812.06127. 2018;DOI: 10.48550/arXiv.1812.06127.
22. Wang H, Yurochkin M, Sun Y, Papailiopoulos D, Khazaeni Y. Federated learning with matched averaging. arXiv: 2002.06440. 2020;DOI: 10.48550/arXiv.2002.064400.
23. Jin Y, Liu Y, Chen K, Yang Q. Federated learning without full labels: A survey. arXiv: 2303.14453. 2023;DOI: 10.48550/arXiv.2303.14453.
24. Li T, Sanjabi M, Beirami A, Smith V. Fair resource allocation in federated learning. arXiv: 1905.10497. 2019;DOI: 10.48550/arXiv.1905.10497.
25. Malekmohammadi S. Semi-variance reduction for fair federated learning. arXiv: 2406.16193. 2024;DOI: 10.48550/arXiv.2406.16193.
29. Kim D, Woo H, Lee Y. Addressing bias and fairness using fair federated learning: A synthetic review. Electronics 2024;13(23):4664. DOI: 10.3390/electronics13234664.
30. Wang X, Peng Y, Lu L, Lu Z, Bagheri M, Summers RM. ChestX-ray8: Hospital-scale chest X-ray database and benchmarks on weakly-su-pervised classification and localization of common thorax diseases. arXiv: 1705.02315. 2017;DOI: 10.1109/CVPR.2017.369.
31. Rajpurkar P, Irvin J, Zhu K, Yang B, Mehta H, Duan T, et al. CheXNet: Radiologist-level pneumonia detection on chest X-rays with deep learning. arXiv: 1711.05225. 2017;DOI: 10.48550/arXiv.1711.05225.
32. Kim DH, Oh K, Kang SH, Lee Y. Development of pneumonia patient classification model using fair federated learning. Proceedings of the Intelligent Human Computer Interaction. 2023;Daegu, South Korea.153-164. DOI: 10.1007/978-3-031-53827-8_15.
33. Madani A, Moradi M, Karargyris A, Syeda-Mahmood T. Chest X-ray generation and data augmentation for cardiovascular abnormality classification. Proceedings of the SPIE Medical Imaging. 2018;Houston, Texas, United States.415-420. DOI: 10.1117/12.2293971.
34. Kermany DS, Goldbaum M, Cai W, Valentim CC, Liang H, Baxter SL, et al. Identifying medical diagnoses and treatable diseases by image-based deep learning. Cell 2018;172(5):1122-1131.e9. DOI: 10.1016/j.cell.2018.02.010.
35. Rajaraman S, Candemir S, Kim I, Thoma G, Antani S. Visualization and interpretation of convolutional neural network predictions in de-tecting pneumonia in pediatric chest radiographs. Appl Sci 2018;8(10):1715. DOI: 10.3390/app8101715.
36. Ayan E, Ünver HM. Diagnosis of pneumonia from chest X-ray images using deep learning. Proceedings of the Scientific Meeting on Electrical-Electronics & Biomedical Engineering and Computer Science (EBBT). 2019;Istanbul, Turkey.1-5. DOI: 10.1109/EBBT.2019.8741582.
38. Mabrouk A, Diaz Redondo RP, Dahou A, Abd Elaziz M, Kayed M. Pneumonia detection on chest X-ray images using ensemble of deep convolutional neural networks. Appl Sci 2022;12(13):6448. DOI: 10.3390/app12136448.
39. Sharma S, Guleria K. A deep learning based model for the detection of pneumonia from chest X-ray images using VGG-16 and neural networks. Procedia Comput Sci 2023;218:357-366. DOI: 10.1016/j.procs.2023.01.018.
41. Han K, Wang Y, Tian Q, Guo J, Xu C, Xu C. Ghostnet: More features from cheap operations. arXiv: 1911.11907. 2019;DOI: 10.48550/arXiv.1911.11907.
42. Kim DH, Oh K, Lee Y. HFAD: Fair federated learning and hybrid fusion multimodal industrial anomaly detection. J Korea Inst Inf Commun Eng 2024;28(7):805-814. (Korean).DOI: 10.6109/jkiice.2024.28.7.805.
|
|