경상남도 지역사회 건강조사 자료 추정치의 변동성 검정(2008-2018)
Variability Test of Estimates of Korea Community Health Survey Data in Gyeongsangnam-do (2008-2018)
Article information
Trans Abstract
Objectives
In this study, we aimed to determine the regional and yearly variability of estimates from the Gyeongsangnam-do Korea Community Health Survey conducted from 2008 to 2018.
Methods
Line graphs, box plots and dendrograms were analysed to determine the distribution of data by indicator in the Korea Community Health Survey data. The intraclass correlation coefficient (ICC) was used to check the consistency of the data by indicator, GLM to check for differences by time of measurement, and Run-test to check whether the variation was random.
Results
The data distribution of the indicators varied within the 30% range suggested by the KDCA (line graphs). Outliers were found in certain regions, suggesting that the results are not consistent (box plots). Using dendrograms, we can see the similarities and differences in the results at once, and identify 2008 and 2009 as the first group, 2010-2014 as the second group, and 2015-2018 as the third group. The results of ICC and GLM for inter-annual variability and consistency show that most indicators were not consistent across years. Finally, the results of the Run-test to determine the randomness of the fluctuations also show that most of the indicators have random fluctuations.
Conclusions
The Korea Community Health Survey has been conducted in the same way every year from the conception of the statistics to the time of the survey to ensure the comparability and consistency of the survey results from year to year, but there has been no quality assessment of the period when stable performance appears after policy and system changes. Therefore, this study suggests that follow-up research on the causality of the variability with the historical background, environment, events and accidents is needed.
서 론
지역사회 건강조사는 지역보건법에 근거하여 질병관리청장, 특별자치시장, 특별자치도지사, 시장, 군수, 구청장이 지역주민의 건강상태 및 건강문제의 원인 등을 파악하기 위하여 매년 실시하는 조사이다[1]. 질병관리청 지역사회건강조사 홈페이지[2] 내용에 의하면 이 조사의 비젼은 ‘과학적 근거에 기초한 지역보건사업 수행 기반 마련’인데 이때 근거의 과학성은 이 조사를 통하여 수집된 자료의 질에 달려 있다고 판단된다. 특히 이 조사에서 수집된 자료는 지방정부 중장기 보건의료계획인 지역보건의료계획의 수립에 활용될 뿐만 아니라 지역보건사업의 성과평가 및 지역 간 건강수준의 비교 근거가 된다는 점에서 자료 질의 중요성은 매우 크다[3]. 이런 맥락에서 지역사회 건강조사 추진체계는 다양한 분과위원회를 구성하고 있는 바 이 중 질 관리 분과에서는 질 관리 방안을 수립하고 질 관리 평가결과서를 작성하는 등 자료의 질을 관리하기 위한 체계적인 노력을 하고 있다.
2008년 지역사회 건강조사의 질 관리를 평가한 연구[4]에서는 객관적 지표와 주관적 지표를 개발하여 질 관리 정도를 평가하였다. 이때 객관적 지표는 표본지점 대체율, 표본가구 대체율, 가구 완료율, 가구원 완료율, 무응답률, 이상치 응답률, 논리적 오류 응답률, 평균소요시간, 평균소요일, 인구구조율 차이, 평균 방문횟수 등 14개 지표였고, 주요 주관적 지표는 조사원의 조사지침 준수도, 응답자의 응답일치도였다. 또한 15문항의 자체평가표를 활용한 조사현장평가, 9개 문항의 자체평가표를 활용한 수행기관 자체평가도 추가적으로 실시하였다. 가장 최근의 질 관리 방안은 질병관리청 공고 제2023-86호인 ‘2023년도 지역사회건강조사 조사수행 질 관리 및 평가 사업 수행기관 공모’의 공고문[5]에서 제시하는 주요 수행과제에서 그 단면을 엿볼 수 있다. 해당 공고문에서는 주요 수행과제를 표본지점 확인조사 질관리, 조사수행과정 질 관리, 조사수행기관 사후평가, 질 관리 고도화 및 강화 계획 수립의 네 가지로 제시하고 있는데 이 중 주요 질 관리 방안은 지역사회 건강조사 책임대학교 연구원 대상 표본지점 확인조사 교육, 표본지점 확인조사 시행 모니터링, 표본지점확인조사 시행 결과 검토 및 평가, 전화점검자료 및 모바일 만족도 조사 질관리, 조사수행기관 모니터링, 조사수행정도 평가였다. 이와 같이 2023년도 지역사회 건강조사 조사수행 질 관리 및 평가 방안은 첫 번째 지역사회 건강조사인 2008년 조사 시의 질 관리 및 평가 방안과 본질적인 내용에서는 큰 차이가 없는 것으로 판단된다.
지역사회 건강조사 자료의 질 관리와 관련해서 다양한 방안들이 시행되고 있지만 이런 노력들이 궁극적으로 기대하는 바는 지역사회 건강조사 자료의 타당도와 신뢰도 제고일 것이다. 이와 관련해서 2020년 통계청에서 발표한 지역사회 건강조사 2020년 정기통계품질진단 결과보고서는 지역사회 건강조사가 통계작성절차별 진단결과와 품질차원별 진단결과의 모든 차원에서 만점을 받아 매우 우수한 통계품질을 보유한 것으로 진단하였다. 그러나 지역사회 건강조사 후 매년 조사대상지역별로 발간되는 지역사회 건강통계에서는 지역사회 건강조사 자료의 타당도와 신뢰도에 대한 전반적인 평가 결과는 제공하지 않는다. 다만 통계표에서 추정치의 신뢰도와 관련하여 상대표준오차를 제시하고 있다. 상대표준오차는 표준오차를 평균으로 나눈 값으로서 상대표준오차가 크면 자료의 변동성이 크기 때문에 통계치의 신뢰도는 떨어지게 된다. 통계청에서는 상대표준오차를 공표되는 통계 자료의 신뢰도 지표로 활용하고 있으며 상대표준오차가 30% 미만일 때 자료는 신뢰할 수 있다 판단되어 자료를 활용하는데 문제가 없으나 30% 이상인 경우 자료의 신뢰도가 낮으므로 자료 활용에 주의를 요하고 있다[6]. 이는 지역사회 건강조사에서도 동일하게 적용되어 변수의 상대표준오차가 30% 이상인 경우 결과해석 시 주의를 요한다고 경고하고 있다[7].
지역사회 건강조사는 매년 수행되는 단면조사로서 지역사회 건강통계에서 제시하는 상대표준오차는 당해 조사자료에 기반하여 산출되는 지표이다. 하지만, 지역사회 건강조사 자료가 조사 수행 연도의 지역별 건강상태 및 건강결정요인, 지역 간 격차에 대한 단면적 정보를 제공할 뿐만 아니라 정보의 시계열적 변화 양상도 파악할 수 있게 해 준다는 측면에서 지역사회 건강조사의 시계열적 변동성 검정 역시 중요한 의미를 가진다고 볼 수 있다. 특히 노동시장 및 금융산업에서는 불확실성과 손실을 줄이기 위해 자료의 정확한 추계 및 변동성의 변화를 예측하기 위해 다양한 통계적 기법을 이용한 연구가 활발하게 진행되고 있다[8-10]. 반면 보건 및 건강의 영역에서는 시계열적 자료의 변동에 대한 연구가 상대적으로 부족한 실정이며, 지역사회 건강조사 또한 시계열적 변동성에 대한 연구는 거의 없는 실정이다. 일부 연구에서 국민건강영양조사 등 보건 데이터 간 공통지표 선정을 통해 변동성 및 정확성 정도를 비교한 연구가 있으나[11-13] 시·도 단위의 일부 지표에 한정한 연구결과로 전체 지표 및 시·군·구 단위 자료에 대한 시계열적 변동성 여부를 파악하기에는 제한적이다.
지역사회건강조사는 시·도뿐만 아니라 시·군·구 지역의 보건정책 및 보건사업에 대한 기획 및 평가를 위한 근거자료로 적극적으로 활용되고 있다. 실제 전국 시·군·구의 34.5%, 경상남도 내 시·군·구의 47.3%가 제7기 지역보건의료계획의 성과지표로 지역사회 건강조사 자료를 활용하고 있다는 점에서 이 자료의 시·군·구 단위의 신뢰성 확보는 매우 중요한 사안이라 할 수 있다[14].
이런 맥락에서 경상남도는 지역사회 건강조사 자료의 질 평가의 중요성에 대한 인식에 기반하여 경상남도 공공보건의료지원단에 관련 연구를 의뢰하였고 그 결과 일차적으로 ‘지역사회건강조사 변동성 검정’[15]이란 연구보고서가 발간되었다. 본 연구는 ‘지역사회건강조사 변동성 검정’ 연구 결과를 기반으로 심층적인 분석을 수행한 연구로서 주요 목적은 경상남도 내 20개 시·군·구 지역이 2008년부터 2018년까지 수행한 지역사회 건강조사 주요 추정치의 지역별·연도별 변동성을 파악하는 것이다.
연구 방법
연구자료 및 대상
지역사회건강조사자료는 통계청 승인 지정통계로(승인번호 제117075호) 만 19세 이상의 모든 성인을 대상을 모집단으로 하여 보건소 별 평균 900명 가량의 인구를 일대일 면접 조사하여 수집한 자료이다. 조사시점에 대한민국 영토 내에 거주하는 만 19세 이상의 모든 성인을 목표 모집단으로 하여 통·반·리 각 표본지점의 주거용 주택에 거주하는 만 19세 이상 모든 성인을 조사 모집단으로 한다. 전체 모집단의 목록으로 행정안전부의 주민등록인구자료와 국토교통부의 주택자료를 연계하여 표본추출틀을 작성하며, 1차 추출(표본지점)은 통·반·리 내 주택유형별 가구 수를 기준으로 가구 수 크기를 고려하여 추출확률이 비례하도록 추출하며, 2차 추출(표본가구)은 표본지점으로 선정된 통·반·리 가구 수를 파악하여 계통추출법으로 선정한다. 본 연구에 사용한 자료는 지역사회건강조사 원시자료 이용지침서의 주요지표 변수 생성 기준을 이용하여 이분형으로 정리한 뒤 국가통계포털(KOSIS, Korean Statistical Information Service)에 공개하고 있는 지표들(건강행태, 이환 및 의료이용, 예방접종 및 보건기관 이용, 안전의식(손상) 및 심폐소생술 내 총 38개 지표)을 수집하였고 걷기실천율과 월간음주율 중심으로 결과를 기술하였다.
본 연구의 목적에 맞게 전국 데이터가 아닌 경남지역에 조사된 20개 시·군·구 지역(거제시, 거창군, 고성군, 김해시, 남해군, 밀양시, 사천시, 산청군, 양산시, 의령군, 진주시, 창녕군, 창원시 마산, 창원시 진해, 창원시 창원, 통영시, 하동군, 함안군, 함양군, 합천군)의 11개년도(2008-2018년)의 데이터를 활용하였다.
자료분석
연간 조사되는 지역사회건강조사자료의 각 지표별 일차적인 자료분포를 확인하는 꺾은선 그래프, 상자수염그림, 덴드로그램(Dendrogram)을 분석하였다. 매년 조사되는 자료의 독립성을 가정하고 서로 다른 시점에 측정된 자료들이 얼마나 일관성 있는 자료인지를 알아보기 위해 급내상관계수(intraclass correlation coefficient, ICC) [16]를, 측정시점을 반복변수로 하여 측정시점에 따른 차이성을 알아보기 위해 일반선형모형(generalized linear model, GLM)을 분석하였고, 자료분포 확인에 활용한 덴드로그램도 건강결과 군집이 어떻게 형성되는지 확인이 가능하므로 건강결과의 연도별 유사성을 파악할 수 있다.
매년 측정되는 자료의 연간 변화가 통계적인 유의성을 가지면서 나타나는지 확인하기 위해 자료의 변환 과정과 변동 확인 검정을 수행하였다. 본 검정 방법은 2020년에 수행된 ‘지역사회건강조사 변동성 검정’ 연구에서 활용된 것으로 분석 방법은 다음과 같다. 첫째, 자료의 변환 과정에서는 경상남도의 전체평균과 시·군·구별 평균의 차이를 이용하여 표준화를 실시하였고, z-값이 2보다 크면 ‘2’, 2 미만 − 1 이상이면 ‘1’, 1 미만 - −1 이상이면 ‘0’, −1 이하 - −2 초과이면 ‘−1’, −2 이하이면 ‘−2’, 그 이외는 0으로 설정하여 5개의 수준을 갖는 범주형 변수로 변환하였다. 둘째, 자료의 변동 확인 검정에서는 일련의 연속적인 측정결과가 무작위적으로 나타난 것인지 전년도 측정된 결과가 다음 연도에 측정된 결과에 어떤 영향을 미치는지를 확인하기 위해 해당 연도를 다음 연도와 비교하여 ±2-±4 차이를 보이는 경우 변동이 발생한 것으로 판단하여 ‘1’ 값으로 변환, 그 외에 경우는 ‘0’으로 변환하였다. 연도별로 변동성을 부호화한 0, 1은 연속적으로 이어진 것으로 간주되며 동일한 관측치 군집을 런(run)이라 하고(a sequence of like observation) 이러한 런의 개수와 전체 자료의 개수 정보를 활용하여 런의 배열이 임의적으로 나타난 것인지를 검정하기 위해 런 검정(Run-test)을 수행하여 조사문항별 변동성에 대한 패턴을 통계적 검정하였다. 런 검정은 n1 (변동 있음)의 개수, n2 (변동 없음)의 개수와 표본 내 연속의 수 R을 활용하여 런의 기댓값 식(1)과 분산 식(2)을 산출하고, z-값 식(3)으로 무작위성을 판단한다.
모든 분석은 R Software 4.3.0과 Python 3.9.12 프로그램을 사용하였고 통계적 유의수준은 0.05로 하였고 양측검정을 실시하였다.
연구 결과
자료분포 확인을 위한 분석
데이터시각화를 통해 2008년부터 2018년까지 측정된 걷기실천율과 월간음주율 자료의 분포를 확인하였다. 가장 기초적인 분포를 확인할 수 있는 꺾은선 그래프는 지역별로 x축에 2008년부터 2018년까지 측정된 기간 값을 y축에 표준화비율 값으로 하여 변화값을 확인하였다. 걷기실천율 지표를 알아본 결과 2008년, 2009년 초기에 높은 결과를 보이다가 점차 하향한 뒤 그 후 지역별로 특징이 다른 형태로 나타났다(Figure 1A). 2008년과 2009년을 제외한 나머지 기간에서 최대와 최소의 간격 차이는 30%를 넘지 않는 것으로 보인다. 월간음주율 지표를 알아본 결과 지역별 편차는 있으나 초기에 낮은 결과를 보이다가 점차 우상향하는 특징이 나타났다(Figure 1B). 편차의 폭이 커 보이지만 통계청 표본설계 및 관리지침에서 제안한 30% 이내의 범위에서 변동이 있었다.
해당 지역 내 2008년부터 2018년까지 걷기실천율의 결과를 상자-그림으로 그려본 결과 김해시, 밀양시, 사천시, 의령군, 진주시, 창녕군, 함안군, 함양군에서 이상치가 발견되었고 이를 통해 측정 결과들이 일관성 있게 나타나고 있지 않은 것을 유추할 수 있다(Figure 2A). 월간음주율 결과를 상자-그림으로 그려본 결과 김해시, 양산시, 진주시, 마산시, 진해시, 통영시에서 이상치가 발견되었고 산청군의 경우 편차가 가장 큰 지역으로 분석되었다. 이를 통해 측정 결과들이 일관성 있게 나타나고 있지 않은 것을 유추할 수 있다(Figure 2B).
지역별 걷기실천율의 측정된 결과들에서 유사성과 차별성을 한꺼번에 알아보기 위해 지역과 연도를 기준으로 히트맵과 유사한 측정 연도를 묶어주는 덴드로그램을 그려보았다(Figure 3). 크게 두 개의 그룹으로 구분했을 시 2008, 2009년을 하나의 그룹으로 구분하고 나머지 2010-2018년의 결과를 다른 하나의 그룹으로 구분하여 묶을 수 있다. 다시 세 개의 그룹으로 구분한다면 첫 번째 그룹은 2008, 2009년, 두 번째 그룹은 2010-2014년, 세 번째 그룹은 2015-2018년으로 구분할 수 있다. 월간음주율의 경우도 유사한 결과를 보이고 있으며, 크게 두 개의 그룹으로 구분했을 시 2008, 2009년을 하나의 그룹으로 구분하고 나머지 2010-2018년의 결과를 다른 하나의 그룹으로 구분하여 묶을 수 있다. 다시 세 개의 그룹으로 구분한다면 첫 번째 그룹은 2008, 2009년, 두 번째 그룹은 2010-2012년, 세 번째 그룹은 2013-2018년으로 구분할 수 있다. 덴드로그램에서 확인할 수 있는 그룹과 비슷하게 지역사회건강조사는 2010년부터 4년을 하나의 주기로 설정하고 순환체계를 도입하였으며 2014년부터는 전국 공통문항 이외에 지역별 필요에 따라 20-80개 문항을 추가하여 조사하고 있다.
일치성 확인을 위한 분석
측정된 결과들의 연간 변동성과 일치성을 알아보기 위해 급내상관계수를 분석해 보았다. 급내상관계수는 0에서 1의 값을 가지고 있으며 1에 가까울수록 유사성이 높다고 볼 수 있고 일반적으로 0.75 이하면 유사성이 낮다고 볼 수 있다. 2008년부터 2018년까지 경상남도 전체 지역(20개 시·군·구)에 대한 월간음주율의 급내상관계수는 0.36, 걷기실천율의 급내상관계수는 0.07로 나타났다. 걷기실천율과 월간음주율 모두 측정된 자료들의 일치성이 낮다고 볼 수 있다(Table 1).
급내상관계수 이외에도 일반선형모형을 통해 반복하여 측정된 결과들에서 반복에 의한 효과와 이를 배제한 뒤 연간 측정되는 결과들이 얼마나 차이가 있는지를 분석해 보았다. 그 결과 걷기실천율(p <0.001)과 월간음주율(p <0.001) 모두 연도별 측정된 결과들이 유의한 차이를 보이는 것으로 나타났다(Table 1). 수집된 지역사회건강조사 38개 변수에 대한 ICC, GLM 분석 결과는 부록 1에 제시하였다.
걷기실천율 변동성에 대한 런 검정 결과 고성군을 제외한 19개 시·군·구는 변동의 패턴이 무작위로 발생하고 있는 것으로 확인되었다(붉은색 표시). 밀양시, 산청군은 최대 7회의 변동을 보이고 있으며, 최소 변동은 진주시 1회로 확인되었다(Table 2). 월간음주율의 런 검정 결과는 김해시, 산청군, 창녕군, 함안군을 제외한 16개 시·군·구에서 변동의 패턴이 무작위로 발생하고 있는 것으로 확인되었다. 창원시 진해가 최대 4회의 변동을 보이고 있으며, 최소 변동은 김해시, 창녕군, 함안군 0회로 확인되었다(Table 2). 걷기실천율에서 고성군의 변동은 5회, 월간음주율에서 산청군이 3회로 많은 변동을 보이고 있지만 2014년과(걷기실천율) 2016년(월간음주율) 이후 매년 변동이 발생하고 있고 전체 런의 개수는 2개이므로 예측 가능한 변동으로 분류되었다(Figure 4). 수집된 지역사회건강조사 38개 변수의 변동 결과는 부록 2에 제시하였다.
고 찰
본 연구는 지역사회건강조사 자료의 시·군·구 수준에서의 시계열적 변동성 검정을 위해 활용 가능한 다양한 통계적 분석을 시도하였다. 연구 분석을 위해 활용된 지표는 총 38개며 그중 걷기실천율과 월간음주율 지표를 중심으로 각각의 통계 분석결과를 제시하였다. 걷기실천율과 월간음주율의 2008년부터 2018년까지 연간 측정된 결과 간 신뢰도를 급내상관계수와 일반선형모형을 통해 확인한 결과, 두 지표 모두 급내상관계수가 0.4 이하로 나타났으며, 일반선형모형에서는 p-value 가 모두 <0.001로 나타났다. 이 같은 결과는 연도별 측정 결과들의 연도별 유사성이 낮다는 것을 의미한다. 런 검정 또한 유사한 결과를 보였는데 걷기실천율의 경우 2008년부터 2018년까지 경상남도 시·군·구의 변동은 최대 7회에서 최소 1회의 변동을 보였으며, 월간음주율은 최대 4회에서 최소 0회의 변동을 보이는 것으로 파악되었다. 이처럼 변동이 무작위로 발생하면 다음연도 건강결과 예측이 어려우므로 보건사업의 성과지표로 활용하는 것은 주의할 필요가 있다. HP2020 평가지표 생산 및 모니터링 지원 방안 연구[17]에서도 지역사회 건강조사는 연도별 결괏값의 변이가 크게 나타나 시·군·구 단위에서 시계열적 분석 시 제한점으로 작용할 수 있다고 보고하였다. 지역사회건강조사는 보건정책을 수립하고 시행하는 데 있어 다수 활용되고 있으므로 조사의 신뢰성을 제고할 수 있도록 근본적인 질 관리 체계 개선이 필요할 것으로 판단된다.
일반적으로 조사자료에서 변동성이 발생할 경우를 생각해 보면 크게 표본오차와 비표본오차를 고려해 볼 수 있다. 표본오차는 조사 대상의 선택에 따라 발생하는 오차로 표본의 크기가 커질수록 줄어드는 특징이 있으므로 시·군·구별 인구에 비례하여 표본의 크기를 재설정할 필요가 있다. 하지만 지역사회건강조사는 시·군·구 보건소당 평균 900명을 표본크기로 설정하여 전국 조사 결과의 신뢰성을 확보하고 있으므로 시·군·구별 표본크기를 조정한 오차와 기존 900명을 유지한 오차의 차이를 통계적으로 검정하는 추가 연구가 필요할 것으로 판단된다. 비표본오차는 조사의 설계 단계부터 최종보고서에 이르기까지 전 과정에서 발생하는데 면접방법이나 조사표 구성방식의 원인으로는 설문지 문안작성 모호성, 조사방식 차이, 질문제시 순서, 응답 항목 제시형태, 설문지 편집상태 등이 있으며, 조사자(면접자) 자질의 원인으로는 면접기술, 감정적 단어사용, 면접 시 제3자 동석 여부, 길이, 면접 시간 등이며, 응답자의 불성실한 자세의 원인으로는 응답자의 이해력, 의사소통문제 등의 지방과 계층에 따른 언어수용의 문화적 차이를 들 수 있다. 현재 지역사회건강조사는 매년 철저한 질관리를 통해 조사원과 조사환경에 영향을 받지 않고 안정적으로 조사가 진행되는지를 모니터링하고 있다. 하지만 2020년 정기통계품질진단 결과, 실질적으로 비표본오차가 발생하고 있는 것으로 보고된 바 있다[18]. 정기통계품질진단 결과에 따르면 지역사회건강조사 내 비표본오차가 발생 가능한 원인으로 조사방식에 따른 비표본오차 발생 가능성을 제기하고 있다. 현재는 면접원을 통해 조사가 이루어지고 있으므로 비대면 조사를 통해 면접원으로부터 발생 가능성이 있는 비표본오차를 피할 수 있다[19]. 그러나 비대면조사는 응답자가 모름 또는 응답거절을 택할 가능성이 높고, 척도문항에서도 극단적인 응답을 선택하는 경향을 보이므로 무응답오차, 측정오차 문제를 최소화해야 하는 문제가 발생가능하므로 이는 신중히 접근할 필요성이 있다. 또한 설문조사 내 역코딩 문항에 기인한 비표본오차 발생 가능성을 추측해 볼 수 있다. 설문과정에서 인지적 오류를 최소화하기 위해 혼합문항을 사용하지만 이는 오히려 응답자에 혼란을 초래하여 비표본오차를 유발할 가능성이 크므로 이를 제거하는 것을 적극적으로 검토할 필요가 있다[20]. 이외 통계조사 시점으로 인해 발생 가능한 계절에 따른 변동성을 고려할 필요가 있다[21]. 통상 지역사회건강조사는 8-10월 사이 조사가 이루어져 여름과 가을, 두 계절의 영향을 받으며 기간 내 추석 등 명절로 인한 불규칙 변동이 발생 가능한 특징을 가진다. 생활습관 중 걷기실천율에 한해 여름철 고온에 따른 격차비가 경상남도는 4배 정도 차이가 난다는 연구결과[22] 등을 감안하였을 때 날씨나 계절의 영향 또한 신체활동에 큰 영향을 미쳤을 것으로 판단된다. 매년 조사시점이 여름 또는 가을 등 무작위로 이루어질 경우 자료의 변동성을 초래할 수 있다. 따라서 산청군과 같이 걷기실천율이 변동성이 많이 발생하는 것을 확인하기 위해서 조사시점에 대한 모니터링이 필요할 것으로 생각된다.
본 연구는 조사 시작 시점인 2008년부터 2018년까지 약 11개년 자료를 하나의 시점으로 설정하였지만, 덴드로그램을 통해 유사한 측정 연도 그룹을 구분한 것과 비슷하게 지역사회건강조사는 크게 4개의 시점으로 구분하여 분석해 볼 필요가 있다. 종이 조사표와 전자 조사표가 혼용되어 조사된 2008-2009년, 제1기 순환조사인 2010-2013년, 제2기 순환조사인 2014-2017년, 마지막으로 제3기 순환조사인 2018-2021년으로 구분되는 특성을 보이고 있어 이에 대한 후속연구가 필요할 것으로 보인다.
본 연구는 지역사회건강조사 자료의 시계열적 변동성을 다양한 각도로 분석하였지만, 변동이 발생한 지표에 대한 안정적인 결과를 도출하는 방법을 제시하지 못하였으므로 시계열 자료의 안정적인 결과 도출을 위한 후속 연구가 필요하다.
본 연구는 경상남도 20개 시·군·구를 모두 독립적이고 동일한 조건을 가진 개체로 설정하여 연구를 진행하였다. 하지만 대도시 및 중소도시에 따라 지역사회를 구성하고 있는 개인의 건강결과는 다르게 나타나고[23-25] 건강결과는 지역에 따라 공간적 상호의존성이 나타나므로[26,27] 이러한 특성들이 존재할 때 일반적인 통계모형으로 분석하면 추정치의 효율성이 떨이지게 되는 것으로 알려져 있다[28]. 후속연구에서는 이러한 특성들을 반영하여 지역별 변동성을 분석해야 할 것으로 보인다. 또한 지역별로 순환지표 활용에 있어 차이를 보이고 있으며 책임대학교에 따라 지표 선정에 영향을 받을 것이라 생각된다. 이러한 고려사항을 반영한 연구 설계가 필요할 것이다.
결 론
변동성은 위험 관리에 있어서 매우 중요한 변수이므로, 변동성의 정확한 예측은 근거기반 보건정책 수립과 정확한 평가에 필수적 요소라 할 수 있다.
본 연구의 목적은 지방자치단체의「지역보건의료계획」수립과 효과 평가에 활용 가능한 지역단위 조사사업인 지역사회건강조사 결과의 지역별·연도별 변동성을 확인하기 위함으로 급내상관계수와 선형모형을 통해 연도별 일치성을 확인하고 지역별 변동성을 파악하기 위해 런 검정을 실시하였다. 무작위성을 판단하기 위한 표준방법이 없기에 변동성 검정에서 런 검정을 활용하였고, 자료의 변환 과정은 ‘데이터 변동성 진단 장치 및 방법’[29] 특허를 취득함으로써 방법에 대한 타당성을 확보하였다. 또한 통상적으로 활용되는 급내상관계수와 일반선형 모형을 활용하여 결과의 유사성을 확인하였다. 연구 결과 걷기실천율과 월간음주율 모두 연도별 일치성이 낮게 나타나는 것을 파악하였고, 런 검정의 결과에서는 지역별 변동이 있음을 확인하였다.
본 연구는 지역사회건강조사의 변동성을 시·군·구 단위의 검정을 시도하였다는 측면에서 연구의 의의를 부여할 수 있지만, 몇 가지 한계점이 존재한다. 첫째, 정보의 손실이다. 비모수 검정방법인 런 검정 활용을 위해 연속형 자료를 5개의 수준을 갖는 범주형 변수로 변환하여 정보의 손실이 발생한 만큼 수준의 수를 확대할 필요가 있다고 판단된다. 둘째, 관측치의 부족이다. 결과의 신뢰성을 확보하기 위해서는 관측치를 20개 이상[12] 보유해야 하지만, 23년 7월에 공개된 2022년 자료를 다 합쳐도 15개라는 한계가 존재한다. 셋째, 지역 선택의 한계이다. 본 연구는 경상남도 단일 지역에 대한 변동성을 연구하여 변동의 심각성을 비교할 지역이 없는 한계가 존재하므로 추후 연구에서는 경상남도와 유사한 지역을 선정하여 변동성을 비교할 필요가 있다. 넷째, 변동성 해결방안 부재다. 본 연구는 지역사회건강조사의 안정적인 결과를 도출할 수 있는 방법을 제시하고 있지 못하므로, 추후 연구에서는 지역사회건강조사를 비롯하여 다양한 보건의료 시계열 자료의 안정성을 확보할 수 있는 방법을 제시할 필요가 있다.
지역사회건강조사는 통계의 개념부터 조사 실시 시기까지 매년 동일하게 진행하여 연도별 조사 결과의 비교성과 일관성을 확보하였지만 정책과 제도변화 이후 안정적인 성과가 나타나는 시기에 대한 품질평가는 이뤄지지 않고 있다[18]. 이에 본 연구를 통하여 변동성에 대한 시대적 배경, 환경, 사건 사고 등과의 인과성에 대한 후속 연구가 필요할 것으로 생각된다.