보건의료 연구를 위한 패널데이터: 리뷰 및 제언
Abstract
Objectives
Several panel surveys have recently been accumulated for various purposes in Korea, and vast amounts of data have been built over a long period of time. However, there are still no networks or platforms that can provide integrated information about existing panel data. In this paper, panel data, which is widely used on healthcare research, was reviewed and future suggestions were proposed in establishing panel data.
Methods
This study classified and analyzed 9 types of panel data commonly used in healthcare research according to their status, sample composition, sample retention rate, survey items, and other characteristics.
Results
The use of panel data is particularly useful for longitudinal analyses, such as examining health trajectories or identifying causal relationships with influencing factors. To utilize panel data effectively for healthcare research, efforts are needed to establish links between panel data and administrative data, provide post-survey management support, and ensure continuous quality improvement.
Conclusions
It is very important to establish the integration platform for various panel data and administration data. If we develop strategies for quality management for it, the value of panel data and utilization of researchers will be enhanced.
Key words: Panel data, Healthcare, Quality management
서 론
패널조사는 같은 조사 대상으로부터 자료를 반복적으로 수집하는 조사를 말하며, 같은 대상을 주기적으로 장기간 조사하여 개인 간 차이 및 시간에 따른 변화를 고려한 동태적 분석이 가능한 자료이다. 패널데이터는 횡단면 자료와 시계열 자료의 장점을 모두 가지고 있으며[ 1], 시간 경과에 따른 사회현상이나 정책 같은 변인 간 인과관계에 대한 설명이 가능하여 정책 입안자나 연구자가 정책을 마련하거나 효과를 평가할 때 활용도가 높은 자료원이다.
국내외 많은 국가에서 다양한 목적을 위해 패널조사를 수행하여 데이터를 구축하고 있다[ 2]. 미국에서 가장 유명한 패널로는 표본에 따른 노동 시장 활동에 대한 정보를 수집하기 위한 National Longitudinal Survey (NLS, 1966∼)와 소득 및 빈곤의 역학에서 건강, 부, 지출, 아동 발달 등에 대한 연구로 확장된 Panel Study of Income Dynamics (PSID, 1968∼) 등이 있다[ 3, 4]. 영국은 대표적으로 개인 및 가정 수준의 사회 경제적 변화를 파악하기 위한 British Household Panel Survey (BHPS, 1991∼)가 있으며 독일에는 가구 구성, 고용, 직업, 소득, 건강 및 만족도를 조사하는 German Socio-Economic Panel (GSOEP, 1984∼)가 있다[ 5, 6]. 국내에서는 1993년에 시작된 “한국가구패널조사(Korea Household Panel Study, KHPS)” 이래로 지난 30년 동안 여러 기관에서 다양한 종류의 패널조사가 수행되어 왔다. 패널 구축의 필요성이 대두된 이후 정부 연구기관을 중심으로 2000년부터는 패널조사가 더욱 다양하게 구축되어 연구에 활용되고 있다[ 7].
현재 국가 승인통계에서 패널조사는 중지된 것까지 포함하여 총 29건에 해당하며 사회일반·노동 ·보건· 복지 등의 분야에 대해 조사하고 있다[ 8]. 패널조사는 특히 표본을 장기간에 걸쳐 추적하기 때문에 연속선상에서의 변화를 통한 건강 영향 요인을 파악할 수 있어 동태적인 분석을 요구하는 종단적 연구에 적합하다[ 9, 10]. 2023년 현재까지 일부 패널조사의 데이터 활용 리스트를 통해 파악된 패널데이터를 활용한 연구는 9,000건 이상으로 앞으로도 다양하게 활용될 가능성이 높으며 이는 보건의료나 건강보험 관련 정책 수립에 기초자료로 활용되고 있다[ 11, 12].
패널데이터는 한국보건사회연구원, 한국고용정보원, 질병관리청 등의 다양한 기관을 통해 생산되고 있는데 조사 방식이나 데이터 특성이 통일되지 않고 구축된 데이터 간 연계 시스템이 미비하여 중복 현상이 발생하기도 한다. 또한 일부 데이터의 경우, 데이터의 변수에 대한 정의, 조사항목 등이 동일하지 않아 데이터 간의 비교 및 분석이 비효율적인 경우도 있다. 방대한 데이터를 효과적으로 분석하기 위해서는 일관성 있는 체계 아래 패널데이터의 특성을 반영하여 종합적으로 관리되는 데이터베이스가 필요하다[ 13]. 국외에서 유럽의 경우, 각국의 가구 단위 패널데이터를 비교할 수 있는 데이터베이스인 Consortium of Household Panels for European Socio-Economic Research (CHER)을 개발하였다. 국외 패널데이터들은 자료의 국제화 작업을 통해 정보를 공유하고 이를 통한 시너지를 목적으로 다양한 형태로 국가 간의 네트워크를 구축하고 있다[ 14].
본 연구에서는 우리나라에서 구축된 패널조사 중 보건의료 분야에서 많이 활용되고 있는 총 9종의 패널데이터를 리뷰해서 데이터별 특성에 대해 분석하였다. 9종의 자료원은 보건의료정책 수립의 기초 자료를 목적으로 보건의료 관련 기관에서 생산하거나 한국보건의료연구원에서 발행한 “국내 보건의료 이차자료원 활용”에서 비교 및 분류한 보건의료 연구에 활용할 수 있는 변수에 대해 조사하는 패널조사로 선정하였다[ 15]. 패널데이터별로 표본 구성, 표본추출, 패널유지율, 조사항목 등의 내용과 특징을 정리하였으며, 관련 문헌 고찰을 통하여 보건의료 연구를 위한 패널데이터의 활용과 향후 과제를 제시해 보고자 하였다.
본 연구는 패널데이터의 현황과 특성을 토대로 연구자들의 패널데이터들에 대한 이해도와 접근성을 높이는 것을 목표를 두고 있다. 패널데이터를 활용하려는 보건의료 연구자들에게 변수 설정이나 분석 방향 등에 대한 정보를 제공하여 보다 용이한 패널데이터 활용을 기대할 수 있다. 본 논문을 통해 패널데이터를 생산하고 관리하는 기관에서도 품질관리 및 패널데이터의 활용도 증진을 위한 연구의 기초 자료로 활용 가능하다. 통합적인 가이드라인 제공의 필요성 및 향후 패널데이터의 구축과 체계적인 관리 방안에 대한 방향성을 제시하고 국가 차원의 정책적인 제언과 해결해야 하는 과제를 논의하고자 한다.
본 론
국내 보건의료 관련 패널데이터 자료원 현황
보건의료 관련 주요 패널조사는 1998년 한국노동패널조사를 시작으로 2019년 청소년건강패널조사까지 총 9종에 대해 분석하였다. 담당기관은 한국노동연구원, 한국여성정책연구원, 한국청소년정책연구원, 육아정책연구소, 질병관리청 및 2개 이상의 자료를 구축하고 있는 한국고용정보원, 한국보건사회연구원으로 7개 기관을 통해 구축, 생산, 공개되고 있다. 패널데이터는 Table 1에서 제공하고 있는 자료 담당기관의 홈페이지에 로그인해서 바로 다운로드 받거나 자료 활용 동의서를 제출하여 승인받고 이메일로 자료를 획득할 수 있다.
Table 1.
Production institutions and website of each panel data
Data source |
Production institution |
Website |
Korean Labor & Income Panel Study; KLIPS [16] |
Korea Labor Institute |
https://www.kli.re.kr/klips |
Youth Panel; YP [17,18] |
Korea Employment Information Service |
https://survey.keis.or.kr/yp/yp01/yp0101.jsp |
Korean Welfare Panel Study; KOWEPS [19] |
Korea Institute for Health and Social Affairs |
https://www.koweps.re.kr:442 |
Korean Longitudinal Study of Aging; KLoSA [20] |
Korea Employment Information Service |
https://survey.keis.or.kr/klosa/klosa04.jsp |
Korean Longitudinal Study of Women & Families; KLoWF [21] |
Korean Women's Development Institute |
https://klowf.kwdi.re.kr |
Korea Health Panel; KHP [22,23] |
Korea Institute for Health and Social Affairs |
https://www.khp.re.kr |
Korean Children and Youth Panel Survey; KCYPS [24, 25] |
National Youth Policy Institute |
https://www.nypi.re.kr/archive/mps |
Panel Study on Korean Children; PSKC [26] |
Korean Institute of Child Care and Education |
https://panel.kicce.re.kr/pskc/index.do |
Korean Youth Health Behavior Panel Survey [27] |
Korea Disease Control and Prevention Agency |
https://www.kdca.go.kr/contents.es?mid=a20303010800 |
국내에서 시행 중인 보건의료 관련 패널조사의 현황을 파악하기 위하여 패널데이터의 자료원명 및 담당기관, 수집 목적, 원자료 제공 연도, 수집주기, 표본단위, 원표본 수, 표본추출 방법에 대하여 Table 2에 분류하였다. 패널데이터 중 일부는 장기간의 추적으로 인한 표본 에이징과 유효 표본 수 부족으로 연구자료 활용에 한계를 개선하기 위해 1기, 2기 등으로 웨이브를 나누기도 한다. 패널데이터를 활용할 때는 차수에 따라 조사항목의 변화가 있을 수 있어 이에 유의해야 한다. 데이터 수집주기는 일반적으로 1년이지만 고령화연구패널조사와 여성가족패널조사의 경우 2년 주기로 조사를 진행하고 있다. 고령화연구패널은 기본조사를 실시하지 않을 때는 표본 탈락을 방지하기 위한 표본유지 차원에서 특별조사를 실시하고 있다.
Table 2.
Current status of panel data construction related to healthcare in Korea
Data source |
Purpose of data collection |
Year of provision |
Cycle |
Sample Unit |
Number of original samples |
Sampling Method |
Characteristics |
KLIPS |
경제활동 및 노동시장이동, 소득 및 소비, 교육 및 직업훈련 파악하여 노동시장 연구, 분석, 고용정책의 수립과 실행의 기초자료 생산 |
1998-2021 (24th) |
1 year |
Households & Individuals |
5,000 households Additional sample in 2009 (1,415) in 2018 (5,044) |
Two-stage stratified cluster systematic sampling |
•국내 유일의 노동관련 가구패널조사 •가구의 자산, 부채, 소득 조사하는 항목 및 개인의 경제활동상태 등으로 구성 •2009년부터 외국 패널데이터와 국제 간 비교 가능하게 CNEF와 연계해 사용가능 |
YP |
청년층 학교생활, 사회경제활동, 가계배경 등을 반영하는 자료를 통해 청년층의 노동력 수급 불균형과 실업 해소를 위한 고용정책 수립의 기초자료 생산 |
YP2001-2006 (6th) YP2007-2020 (14th) YP2021∼ (1st∼) |
1 year |
Individuals |
YP2001: 5,956 people YP2007: 10,206 people Additional sample in 2015 (3,516) |
Stratified systematic sampling by double sampling |
•우리나라 최초의 개인단위 패널조사 •개인용 설문이 유형별로 구성되어 운영 (중·고등학생, 대학(원)생, (미)취업자용) •메신저 및 인터넷 사용 많은 연령층 위한 정보의 장 마련하여 조사에 대한 신뢰도 높임 |
KOWEPS |
인구집단별 삶의 질 현황, 변화를 지역·연령·계층별로 파악하여 생활 실태와 복지 욕구 관련 정책 형성 및 효과성 평가를 통한 정책 환류에 기여 |
2006-2021 (16th) |
1 year |
Households & Individuals |
7,072 households Additional sample in 2012 (1,800) |
Two stage stratified cluster sampling |
•국내 가구 단위 패널조사 중 한국의료패널 다음으로 규모가 큼 •저소득층 대상 연구에 적합하도록 설계 •표본추출 시 중위소득 60% 미만 저소득층에 전체 표본의 약 50% 할당 |
KLoSA |
고령자의 사회, 경제, 심리, 인구학적 형성 및 건강상태 등 측정·파악하여 효과적인 사회경제정책 수립에 활용될 기초자료 생산 |
2006-2020 (8th) |
2 year |
Households & Individuals |
10,254 people Additional sample in 2014 (920) |
Two stage stratified cluster sampling |
•미국의 HRS 기반 설계되어 국제비교 가능 •세 가지 형태의 자료 제공 (원자료, 구조변환, 라이트버전) •기본조사를 실시하지 않는 홀수해에는 패널유지차원에서 특별조사 실시 |
KLoWF |
여성의 경제활동, 일과 가정 관련 경험과 저출산, 보육, 일-가정 양립, 가족친화 등에 대한 정보를 파악하여 여성 및 가족정책 수립을 위한 기초자료 생산 |
2007-2020 (8th) |
2 year |
Households & Individuals |
9,068 households 9,997 people Additional sample in 2017 2,049 households 2,486 people |
Two stage stratified systematic sampling |
•데이터 항목 표준화 통해 사용자가 원하는대로 데이터 가공하여 다운받는 항목별 다운로드 방식 도입 •전문가 대상 데이터 품질 강화 위해 1차 공개, 데이터 진단 및 추가 검증 통해 일반인에게 2차 공개하는 방식 |
KHP |
국가보건의료서비스 체계의 대응성·접근성 향상과 효율화를 위한 정책 수행의 기초 정보로 개인 및 가구 단위의 대표성 있는 통계자료 생산 |
2008-2018 (Wave1-14th) 2019∼ (Wave2∼) |
1 year |
Households & Individuals |
7,866 households Additional sample in 2012 (2,520) |
Two stage stratified cluster sampling |
•국내 유일 수요자 중심 의료이용 데이터 •미국 의료비 패널조사(MEPS)와 비교 가능 (영역: 의료서비스/의료기기/의약품 이용, 임신·출산, 민간의료보험) •의료이용에 영향 주는 요인 중 개인 의료보험과 관련된 부분 상세 조사 시행 |
KCYPS |
아동·청소년의 성장과 발달의 다양한 변화 양상을 종합적으로 파악하여 아동·청소년 관련 정책 수립 및 학술 연구를 위한 기초자료 생산 |
KCYPS2010-2016 (7th) KCYPS2018-2021 (4th) |
1 year |
Individuals |
KCYPS20101 E1: 2,342 people E4: 2,378 people M1: 2,351 people KCYPS2018 E4: 2,607 people M1: 2,590 people |
Stratified multi-stage cluster sampling |
•조사대상을 아동·청소년 및 보호자로 확대 •아동·청소년의 조사영역을 개인발달, 발달환경 영역으로 구분 •KCYPS 2010과 결과 비교 위한 조사항목 유지와 신규 조사항목 도입 및 기존 척도 개정·보완을 원칙으로 구성함 |
PSKC |
아동의 성장 발달 특성, 양육 실태와 요구, 육아지원 기관의 기능과 효과 및 지역사회와 육아정책의 영향에 관한 자료를 수집하여 통계자료 생산 |
2008-2020 (13th) |
1 year |
Households & Individual |
2,150 households |
Stratified multi-stage sampling |
• Bronfenbrenner의 생태학이론과 G. Elder의 생애이론을 이론적 틀로 삼음 •아동을 둘러싼 모든 수준의 환경체계 측정 •조사대상 아동의 약 10% 이상에 해당하는 아동들에게 심층조사가 이루어질 계획 |
Korean Youth Health Behavior Panel Survey |
아동·청소년들의 흡연, 음주, 비만, 식생활, 신체활동 등 건강행태의 변화 양상과 선행요인을 종합적으로 파악하여 관련 정책 수립 및 학 술연구 위한 기초자료 생산 |
2019-2021 (3rd) |
1 year |
Individuals |
5,072 people (Regular panel2: 5,051 people) |
Two stage stratified cluster sampling |
•아동·청소년 대상 국내 패널조사 중 상세한건강행태 관련 문항 포함 •초등학교-중학교-고등학교-청년층으로의 이행시기를 모두 포함하여 수행할 예정 |
표본 및 조사대상
패널조사를 위한 표본설계에 있어서 표본 단위는 가구 및 개인이다. 표본추출은 모집단을 중복되지 않는 다수의 층으로 나누고 각 층에서 표본을 추출하는 층화표집 방법을 기반으로 하는데 패널조사마다 세부적인 차이가 존재한다. 먼저, 표본추출틀로 인구주택총조사의 사용 여부에 따라 케이스를 분류해 볼 수 있다. 한국복지패널조사, 한국의료패널조사, 고령화연구패널조사, 한국노동패널조사, 여성가족패널조사는 전국적인 대표성을 확보하기 위하여 인구주택총조사를 표본추출 틀로 활용하였다. 언급한 패널조사들은 2단계에 거친 층화추출 방식으로 조사를 진행하고 있다. 먼저 표본추출틀에 따라 조사구를 1차 표본추출단위로 하고, 1단계에서 선정된 조사구 내 가구를 2차로 추출하는 과정을 통해 표본을 선정한다. 조사구는 각 패널조사의 목적과 내용을 고려한 층화변수를 기준으로 층화한 후 계통추출을 통해 추출한다.
이외에 청년패널조사는 2006년도 산업·직업별 고용구조조사(Oc-cupational Employment Statistics, OES)의 표본가구 중 청년층을 조사하는 이중표본추출법을 사용하고 있다. 1단계로 OES 표본 추출된 가구 대상 스크린 서베이를, 2단계로 스크린 서베이를 통해 확보된 청년층 가구원을 표본으로 구축하였다. 청소년건강패널조사와 한국아동청소년패널조사는 1차 추출 단위는 학교, 2차 추출 단위는 학급으로 설정하여 2단계 층화집락추출을 통해 표본을 구축하였다. 다만, 표본추출틀은 청소년건강패널은 2018년 4월 기준의 초등학교 5학년 명부를, 한국아동청소년패널조사는 전국 학교 일람표를 활용하였다. 한국아동패널의 경우 제주도 제외한 분만 건수 500건 이상의 의료기관 명부를 표본추출틀로 사용하여 층화다단계추출을 통해 표본을 구축하였다. 1차 추출 단위인 의료기관을 추출하고, 2차 추출단위에 해당하는 신생아 가구를 예비 표본으로 작성하고 세 번째 단계에서 실제 본조사에 응한 신생아 가구를 표본으로 구축하였다.
패널조사의 표본 대상은 Figure 1과 같다. 한국노동패널, 한국복지패널, 한국의료패널은 조사 대상 가구에 속한 만 15세 이상의 개인을 대상자로 패널조사를 시행하였다. 한국복지패널은 2006년 당시 초등학교 4, 5, 6학년에 재학하고 있는 아동을 대상으로 3년마다 부가 조사를 실행하고 있다. 청년패널은 만 15세부터 29세까지를, 고령화연구패널은 45세 이상 중 ·고령자를, 여성가족패널은 만 19세부터 64세까지를 대상으로 조사를 수행하고 있다. 한국아동청소년패널(KCYPS)의 경우, KCYPS2010에서는 초등학교 1, 4학년 및 중학교 1학년을 대상으로 2010년부터 2016년까지 데이터를 구축하였다. KCYPS2018에서는 초등학교 4학년과 중학교 1학년을 대상으로 KCYPS와 동일하게 7년 동안 조사를 시행할 예정이다. 한국아동패널은 조사 시작 연도인 2008년에 0세를 표본으로 설정하여 성인기에 진입하게 되는 2027년까지 매해 실시될 예정이다. 청소년건강패널은 2019년에 초등학교 6학년을 대상으로 정하여 표본이 만 21세가 되는 2028년까지 조사를 진행할 예정이다.
Figure 1.
Panel data survey target. KLIPS, Korean Labor & Income Panel Study; YP, Youth Panel; KOWEPS, Korean Welfare Panel Study; KLoSA, Korean Longitudinal Study of Aging; KLoWF, Korean Longitudinal Study of Women & Families; KHP, Korea Health Panel; KCYPS, Korean Children and Youth Panel Survey; PSKC, Panel Study on Korean Children.
표본 유지율 현황
패널의 추적 기간이 길어지면 조사대상자의 사망, 이사, 가구 구조 변화 등으로 인한 모집단의 변화로 표본 이탈이 발생한다. 일반적으로 표본 이탈은 2-3차 이후에 가장 많이 발생하고 점차 안정화되는 특징을 가진다. 표본 유지율은 시간이 경과하며 발생하는 표본 이탈 및 탈락을 얼마나 최소화하였는지 표시하는 지표 중 하나로 패널조사 데이터의 품질을 판단하는 중요 요소이다. 우리나라 보건의료 관련 패널조사의 표본 유지율은 Table 3과 같다. 전반적으로 초기 2-3차 조사에서 크게 떨어졌다가 다음부터는 점차 안정적으로 나타나는 경향을 보인다. 제10차 조사를 지나고부터는 60-70%에 이르는 형태로 나타나고 있다[ 28]. 표본 유지율의 전반적인 현황은 해외의 장기 패널조사와 비교했을 때 상대적으로 양호하다고 볼 수 있다[ 29]. KLIPS의 11차년도 표본 유지율은 74.2%로 미국의 PSID (67%)나 영국의 BHPS (68.4%)보다 높다는 것을 예시로 들 수 있다[ 30].
Table 3.
Current status of panel data sample retention rate
Data Source |
Year |
1998 |
1999 |
2000 |
2001 |
2002 |
2003 |
2004 |
2005 |
2006 |
2007 |
2008 |
2009 |
2010 |
2011 |
2012 |
2013 |
2014 |
2015 |
2016 |
2017 |
2018 |
2019 |
2020 |
2021 |
KLIPS |
100 |
87.6 |
80.9 |
77.3 |
76 |
77.2 |
77.2 |
76.4 |
76.4 |
75.5 |
74.2 |
73.2 |
72.1 |
70.6 |
70.3 |
69.4 |
69.0 |
68.4 |
67.9 |
67.1 |
66.2 |
65.3 |
64.2 |
63.2 |
YP |
|
|
|
|
100 |
85.8 |
84 |
80.1 |
75.8 |
100 |
91.2 |
86.5 |
81.7 |
78.9 |
76.8 |
74.0 |
73.0 |
72.0 |
71.2 |
70.6 |
69.8 |
68.6 |
67.7 |
|
KOWEPS |
|
|
|
|
|
|
|
|
100 |
92.1 |
86.7 |
83.9 |
80.3 |
75.5 |
74.5 |
72.2 |
69.2 |
67.3 |
64.5 |
62.2 |
60.3 |
58.3 |
54.7 |
54.0 |
KLoSA |
|
|
|
|
|
|
|
|
100 |
|
86.6 |
|
81.7 |
|
80.1 |
|
80.4 |
|
79.6 |
|
78.8 |
|
78.1 |
|
KLoWF |
|
|
|
|
|
|
|
|
|
100 |
|
85.3 |
|
80.1 |
|
75.2 |
|
72.6 |
|
70.1 |
|
71.9 |
|
68.3 |
KHP |
|
|
|
|
|
|
|
|
|
|
100 |
91.6 |
86.4 |
81.8 |
79.9 |
76.8 |
74.4 |
70.2 |
67.2 |
64.8 |
63.9 |
62.2 |
61.1 |
60.9 |
KCYPS |
|
|
|
|
|
|
|
|
|
|
|
|
100 |
96.3 |
94.4 |
89.4 |
88.7 |
87.5 |
|
|
100 |
93.8 |
92.3 |
|
PSKC |
|
|
|
|
|
|
|
|
|
|
100 |
91.6 |
86.7 |
84.4 |
82.0 |
80.0 |
78.0 |
76.9 |
73.4 |
71.4 |
69.0 |
67.9 |
67.2 |
64.9 |
Korean Youth Health Behavior Panel Survey |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
100 |
93.1 |
87.9 |
장기적으로 시행하고 있는 패널조사는 반복적인 추적 조사로 인하여 표본 대상의 무응답이나 추적 실패 등이 누적되어 불가피하게 패널 마모가 발생한다. 이는 표본의 대표성을 훼손하여 데이터의 신뢰성이 떨어지게 된다[ 31]. 조사담당기관은 패널조사를 실시하면서 표본 유지율을 일정 규모로 유지하기 위해 신규 표본을 추가하거나 가구의 조사 참여를 유도하는 등 지속적인 관리 방안을 수행하고 있다. KLIPS에서는 이탈한 대상을 추적하여 다시 조사하려는 노력을 바탕으로 보았을 때, 이탈했다가 들어온 가구의 비율이 약 20%로 PSID (약 1%)와 비교했을 때 매우 높다[ 32]. 표본의 대표성을 파악하기 위해서 표본과 가중치에 대한 심층 분석, 신규 표본의 투입에 따른 변화 분석을 수행하는 건 품질관리 측면에서 중요하다. 패널조사에서 이탈하는 표본의 일반적 특성 및 패턴과 요인을 분석하는 연구도 활발히 진행되고 있다[ 33].
조사 항목
보건의료 분야의 연구에서 활용할 수 있는 변수들에 대한 조사 항목을 크게 6가지 영역으로 나누어 Table 4에 제시하였다. 패널데이터의 공통된 조사 항목으로는 인구사회학적 특성에서 성별, 연령, 교육 수준, 경제 상태/소득 등이며, 아동 ·청소년을 대상으로 한 패널을 제외하고는 혼인 상태, 직업 등도 포함되었다. 의료 이용 항목은 주로 표본 단위가 가구 및 개인에 해당하는 패널에서 조사하였으며, 질병 이환 및 건강 관련 항목은 한국의료패널조사 및 고령화연구패널조사 데이터에서 더욱 세부적인 항목까지 활용할 수 있다. 생활 습관 및 건강행태 항목에서는 일부를 제외하고 흡연, 금주, 운동 및 신체활동 항목을 공통으로 조사하고 있다. 삶의 질은 본인의 삶에 대한 만족도, 안정감 등의 복합적인 요인으로 평가한다. 한국노동패널과 청년패널은 조사 목적에 부합하게 직업 만족도 관련 항목을 조사하고 있다.
Table 4.
Comparison of survey categories of each panel data
Survey variables |
Data source |
KLIPS (2020) |
YP |
KOWEPS (2021) |
KLoSA (2020) |
KLoWF (2020) |
KHP Wave |
KCYPS (2022) |
PSKC (2020) |
Korean Youth Health Behavior Panel Survey (2020) |
2007 (2020) |
2021 (2021) |
1 (2019) |
2 (2020) |
E |
M |
Child |
Others |
Sociodemographic |
|
|
|
|
|
|
|
|
|
|
|
|
|
Gender |
√ |
√ |
√ |
√ |
√ |
|
√ |
√ |
√ |
√ |
√ |
|
√ |
Age |
√ |
√ |
√ |
√ |
√ |
√ |
√ |
√ |
√ |
√ |
√ |
√ |
|
Education level |
√ |
√ |
√ |
√ |
√ |
√ |
√ |
√ |
√ |
√ |
|
√ |
|
Income |
√ |
√ |
√ |
√ |
√ |
√ |
√ |
√ |
|
|
|
√ |
√ |
Medical security |
|
|
|
√ |
√ |
|
√ |
√ |
|
|
|
|
|
Economic activity |
√ |
√ |
√ |
√ |
√ |
√ |
√ |
√ |
|
|
|
|
|
Household information |
√ |
√ |
√ |
√ |
√ |
√ |
√ |
√ |
√ |
√ |
|
√ |
√ |
Marital status |
√ |
√ |
√ |
√ |
√ |
√ |
√ |
√ |
|
|
|
√ |
|
Religion |
√ |
|
|
√ |
√ |
√ |
|
|
|
|
|
|
|
Job |
√ |
√ |
√ |
√ |
√ |
√ |
√ |
√ |
|
|
|
√ |
|
Foreign |
|
|
|
√ |
|
√ |
√ |
√ |
|
|
|
|
|
Residential area |
√ |
√ |
√ |
√ |
√ |
√ |
√ |
√ |
|
|
|
|
|
Medical use |
|
|
|
|
|
|
|
|
|
|
|
|
|
Use of medical institutions |
|
|
√ |
√ |
√ |
√ |
√ |
|
|
√ |
|
|
|
Medical expense |
√ |
√ |
|
√ |
√ |
√ |
√ |
√ |
|
|
|
|
|
Health condition |
|
|
|
|
|
|
|
|
|
|
|
|
|
Examination results |
|
|
|
|
|
|
√ |
√ |
|
|
|
|
|
Body measure |
|
|
|
|
√ |
√ |
√ |
√ |
√ |
√ |
√ |
|
√ |
Mental health |
√ |
√ |
√ |
√ |
√ |
√ |
√ |
√ |
√ |
√ |
|
|
√ |
Oral health |
|
|
|
|
√ |
|
√ |
√ |
|
|
|
|
|
Accident/addiction |
|
|
|
|
√ |
|
√ |
√ |
|
|
√ |
|
|
Chronic disease |
|
|
|
√ |
√ |
|
√ |
√ |
|
|
√ |
|
|
Disability |
|
|
|
√ |
√ |
√ |
√ |
√ |
|
|
√ |
√ |
|
Other disease |
|
|
|
|
|
|
|
|
|
|
√ |
|
|
Disease code |
|
|
|
√ |
|
|
√ |
|
|
|
|
|
|
Death |
√ |
|
|
|
√ |
√ |
√ |
√ |
|
|
|
|
|
Lifestyle |
|
|
|
|
|
|
|
|
|
|
|
|
|
Smoking |
√ |
|
|
√ |
√ |
√ |
√ |
√ |
|
√ |
|
√ |
√ |
Drinking |
√ |
√ |
|
√ |
√ |
√ |
√ |
√ |
|
√ |
|
√ |
√ |
Physical activity |
√ |
|
|
|
√ |
√ |
√ |
√ |
√ |
√ |
√ |
|
√ |
Nutrition state |
|
|
|
√ |
√ |
|
|
|
√ |
√ |
√ |
|
√ |
A sense of safety |
|
|
|
|
|
|
|
|
|
|
|
|
|
sexual behavior |
|
|
|
|
|
√ |
|
|
|
√ |
|
|
|
Smartphone addiction |
|
|
|
|
|
|
|
|
√ |
√ |
√ |
|
|
Leisure & society activity |
√ |
|
|
√ |
√ |
√ |
|
|
|
√ |
√ |
|
|
Living environment |
√ |
|
|
√ |
√ |
|
|
|
√ |
√ |
|
√ |
√ |
Quality of life |
|
|
|
|
|
|
|
|
|
|
|
|
|
Quality of life |
√ |
|
|
√ |
√ |
√ |
√ |
√ |
√ |
√ |
√ |
√ |
|
Activity limitation |
√ |
|
|
|
√ |
√ |
√ |
√ |
|
|
|
|
|
Subjective health |
√ |
√ |
√ |
√ |
√ |
√ |
√ |
√ |
√ |
√ |
√ |
√ |
|
Welfare |
|
|
|
|
|
|
|
|
|
|
|
|
|
Disabled person |
|
|
|
√ |
|
|
|
|
|
|
|
|
|
Child |
|
|
|
√ |
|
|
|
|
|
|
|
√ |
|
Older Adults |
|
|
|
√ |
√ |
|
√ |
√ |
|
|
|
|
|
Other |
√ |
√ |
√ |
√ |
√ |
√ |
√ |
√ |
|
|
|
√ |
|
Additional survey variables |
4th: Health & Retirement (Individuals aged 45 or older) 7th: Work hours and leisure 17th: the use of time and quality of life |
2nd: Disorder (Activity limitation), Use of time (leisure activities) 3rd, 6, 9, 12th: Health & Stress (Smoking, physical activity) |
Child Welfare recognition Disabled person |
6th: A sense of community safety 8th: Changes in Family and Women's Lives due to COVID-19 |
|
|
3rd: A sense of disaster safety/Safety Sensitivity and Perception |
1st: Bailey's developmental test for a 1 year old infant, temperament test 2nd: Intelligence and receptive vocabulary 3th: Allergy, Asthma 4th: Personality |
|
패널조사 중에는 일반 조사 이외에도 부가 조사를 시행하여 기타 항목들에 대한 조사를 수행하는 경우가 있다. Table 4에서 보건의료 분야에서 활용 가능한 부가 조사 항목에 대해 따로 기술하였다. 한국노동패널은 매회 다른 주제로 부가 조사를 시행 중인데 보건의료와 관련해서는 4차에 건강과 은퇴, 7차에 근로 시간과 여가, 17차에 시간 사용과 삶의 질에 관한 부가 조사를 실시하였다. 한국복지패널에서는 아동, 복지 인식, 장애인 관련 문항에 대해 영역마다 순서대로 3년 주기로 부가 조사를 시행하고 있으며, 고령화연구패널은 44-56세의 제2차 베이비부머 개인을 대상으로 중· 장년층 고용정책 수립과 평가에 활용될 기초자료를 생산하기 위해 부가적인 조사를 시행 중이다. 청년패널의 경우, 기타 항목으로 3년 주기로 3차, 6차, 9차, 12차 때 건강과 스트레스 항목을 조사했으며, 2차 조사엔 장애 및 시간 활용에 대한 조사를 시행하였다. 여성가족패널에서는 6차에 지역 안전의식 분야와 8차에 코로나19로 인한 변화에 대해 조사하였다. 한국아동청소년패널에서는 3차에 안전 체감도 및 인식도 등을 조사하여 재난 안전 의식을 파악하였다. 아동패널의 경우 일부 패널을 대상으로 2-4년 주기로 심층 조사를 수행 중이다. 1차에는 1세 영아의 베일리 발달검사, 기질 검사를, 2차에서는 지능 · 수용 어휘력 검사를, 3차에선 알레르기, 천식 관련 검사를, 4차에선 인성·성격 관련 심리검사를 실시하였다. 일부 항목은 일시 삭제되었다가 다시 복구되기도 하고, 조사 중간에 추가로 생성된 항목도 존재하는 등 조사 연도에 따라 조사 항목이 변경될 수 있음을 고려해야 한다. 예시로 한국노동패널에서는 장애 또는 장해 관련 문항이 4차년도에 실시된 부가 조사 외에도 9차년도에만 조사되어 비교 연구에 활용할 수 있다.
특징 및 장점
보건의료 분야에서 연구를 진행할 때 연구 주제로 택할 수 있는 범위는 방대하다. 연구자는 주제에 부합하는 데이터를 수집하여 분석을 실행해야 한다. 패널데이터를 활용하기 전에 어떤 패널데이터가 연구를 수행하기에 부합하는지 파악하는 것은 연구를 진행하는 측면에서 효율적이다. 패널데이터 중에는 특정 주제를 연구하기 적합하도록 설계된 패널이 있다. 대표적으로 한국복지패널은 중위소득 60% 미만의 저소득층을 과대표집하여 빈곤층, 기초보장 수급자 등을 대상으로 하는 연구에 특성화되어 있다[ 34]. 한국의료패널은 의료 이용 ·의료비·민간의료보험 등 보건의료 서비스 이용에 영향을 주는 요인 중에서도 재원을 분석하는 데 용이하다[ 35]. 한국노동패널과 청년패널은 노동시장 및 고용 정책 분석을 목적으로 하고 있어서 주로 취업자·미취업자의 건강행태 및 정신건강에 관련된 연구에 활용되고 있다. 한국아동청소년패널과 한국아동패널은 성인이 되기 전부터 조사를 시작하여 추적조사를 시행했기에 장기적인 관점에서 아동 ·청소년의 건강 영향 요인을 분석하는 종단적인 연구에 유리하다[ 25, 26]. 여성가족패널조사에서는 여성의 삶, 가족구조·생활· 관계, 일자리, 가치관 등의 영역에서 조사를 실시하고 있다. 이런 다양한 영역의 변수를 이용하여 변화와 특성을 결정하는 요인을 상호연계적으로 분석하는 연구를 시행할 수 있다[ 36].
패널조사는 일반적 특성 및 패널별 조사 목적에 따라 세분화된 조사 문항을 구성하여 조사를 수행하고 있다. 다양한 조사항목을 통해 단일 영역에서가 아닌 건강, 생활 습관, 삶의 질 등의 영역과 관련된 변수에 대한 데이터를 제공한다. 이를 활용하면 개인 및 가구의 삶의 변화에 영향을 미치는 복합적인 요인에 대하여 인구학적, 사회경제적, 환경적 측면에서 다각도로 연구할 수 있다. 패널데이터의 전반적인 특성을 고려하면 보건의료 분야 중 건강 관련 연구에서 패널데이터를 활용하기 적합하다고 할 수 있다. 개인의 인구사회학적 및 환경적 요인 등 건강에 관련된 요인들은 인간의 생애주기에 따라 변하는 특성이 있다. 따라서 동일한 영향 요인도 연령대별로 상이하게 나타날 수 있다[ 37]. 패널조사는 동일한 표본을 추적 및 관찰하면서 생애주기별 연속적인 데이터를 구축하고 있어 횡단적 연구의 단절성에 대한 한계를 보완할 수 있고 건강 영향 요인의 인과관계에 대한 파악이 가능하다. 특히 패널데이터를 통해 시간의 흐름에 따른 개인별 건강 궤적을 살펴보고 영향을 미치는 특성 요인을 종단적으로 검증할 수 있다[ 38]. 선행연구에서는 한국의료패널 자료를 이용하여 노인의 의료 이용 및 건강성의 발달궤적에 대하여 연령별로 분석하거나 의료급여 수급자의 건강 상태와 의료 이용의 종단적 변화양상 및 영향 요인을 파악하였다[ 39, 40].
일부 패널조사는 외국에서 수행된 패널조사를 통해 구축된 데이터를 이용하여 국제 비교가 가능하다. 고령화패널조사는 미국의 Health and Retirement Study (HRS)를 참고하여 설계되어 국가 간 비교연구가 가능하고 미국 HRS, 영국의 English Longitudinal Study of Ageing (ELSA) 등의 데이터와 함께 고령화 연구자료의 통합 DB 구축사업을 추진 중이다[ 41]. 한국의료패널조사도 미국 의료비 패널조사인 Medical Expenditure Panel Survey (MEPS)와 의료 이용 영역에서 비교가 가능하다. 한국노동패널의 경우 2009년부터 Cross-National Equivalent File (CNEF)와 연계하여 원데이터 및 통합된 데이터를 활용하여 국제 비교를 가능하게 한다[ 42].
데이터 한계점 및 활용 제한점
패널데이터에서 발생할 수 있는 대표적인 한계점으로는 장기적인 추적 조사로 인한 표본 이탈 및 무응답 편향이 존재한다. 표본 마모는 패널데이터에서 표본의 대표성을 떨어뜨릴 수 있으며, 무응답 편향은 누적되어 모집단에 대한 부정확한 추론을 도출할 위험을 증가시키고 선택 편향의 문제를 일으킨다. 대부분의 조사기관에서는 원표본 중 웨이브가 진행되며 이탈한 표본을 고려하여 횡단 및 종단 가중치를 제공하고 있다[ 43]. 가중치를 측정하기 이전에 각 패널데이터의 고유 특성을 반영하고 변수들의 무응답 비율을 탐색하는 과정이 우선되어야 한다[ 44]. 패널데이터의 질을 높이고 정확하고 신뢰성 있는 통계분석을 위해서는 무응답을 대체하고 편향을 줄이기 위한 효과적인 방안을 모색하는 것이 필요하다.
현재 구축되고 있는 패널데이터는 조사 목적이나 대상에 따라 다양하지만, 생성 기간이 상이하고 통합적인 데이터 연계 시스템이 존재하지 않아 중복 현상이 발생하고 있다. 패널데이터를 효율적으로 활용하기 위해서는 다양한 보건의료 관련 패널조사의 통합된 마이크로 데이터 제공이 필수적이다. 미국에서는 수년의 건강 데이터를 조화하여 The Integrated Health Interview Series (IHIS)에서 건강을 설명하는 14,000개 이상의 변수에 대한 통합 마이크로 데이터를 제공하고 있다. 이에 그치지 않고 의료서비스 이용 및 의료비 지출에 대한 정보를 수집하기 위해 The Medical Expenditure Panel Survey–Household Com-ponent (MEPS-HC)를 포함하려 노력 중이다[ 45].
패널데이터를 활용하기 위해서는 분석하기 전에 데이터의 전 처리 과정이 먼저 시행되어야 한다. 패널조사의 특성상 다양한 문항과 변수에 대한 조사를 수행하여 발생하는 다수의 항목 무응답, 결측치를 보완하는 과정이 필요하다. 이외에도 변수 재정의, 척도의 변환, 가중치 조정 등을 통해 연구 목적에 부합하게 조정해야 한다[ 46]. 특히 가구 데이터를 개인 데이터로 변환시키는 과정이 복잡하고 시간이 걸려 연구자들의 접근성을 떨어뜨릴 수 있다.
고 찰
보건의료 연구를 위한 패널데이터의 활용과 향후 과제
보건의료 분야에서 패널데이터의 접근성과 적극적인 활용을 증진하기 위해서 다음과 같은 제언을 하고자 한다. 첫째, 패널데이터 간의 연계를 바탕으로 보건의료정보 통합 플랫폼 구축이 필요하다. 플랫폼을 통해 데이터가 제공되면 기존 및 신규 패널조사 데이터에 편리하게 접근할 수 있고 연구자들의 수요를 충족시킬 수 있는 분석이 가능하다[ 47]. 호주의 경우 우리나라와 비슷하게 분산된 데이터의 수집· 관리 체계를 이루고 있었으나 현재는 주별로 자료 연계 부서를 마련하여 호주 보건복지연구소(Australian Institute of Health and Welfare)와 협업을 통해 인구 건강 연구 네트워크(Population Health Research Network)를 구축하고 있다[ 48]. 캐나다 통계청에서도 캐나다 암 등록 자료, 온타리오 정신건강 보고시스템, 전국 인구 건강 조사 등의 보건의료 자료를 활용하여 데이터를 연계할 수 있는 사회적 데이터 연계 환경(Social Data Linkage Environment, SDLE)을 개발하였다[ 49]. 패널데이터들에 대해 간명하게 분류된 통합적 플랫폼이 제공되면 연구자들은 자료 수집에서 통계 분석 방법까지 더욱 효율적으로 선택할 수 있다. 또한, 품질 높은 데이터 관리와 활발한 공유를 통해 시너지를 창출하고 정책 발전에 기여할 수 있다[ 50].
둘째, 패널데이터와 행정·조사 데이터와의 연계 방안을 공공데이터 구축기관에서 적극적으로 검토할 필요가 있다. 다양한 데이터들이 포함된 공유 네트워크가 구축되면 보건의료 및 인구 ·사회복지 분야의 여러 변수를 활용하여 인구의 건강 수준을 예측할 수 있을 것이다. 국외 대규모 패널조사에서는 건강 및 퇴직 연구를 위해 사회 보장이나 메디케어 데이터 등의 일반 행정 데이터를 연결하고 있다[ 51]. 유럽의 경우 Meaningful Integration of Data Analytics and Services (MIDAS) 프로젝트를 통해 다양한 건강 관련 데이터를 개방형 및 사회 데이터와 연결하여 보건의료 정책 결정에 도움이 되는 건강 데이터 플랫폼을 개발하고 시범 도입하고 있다[ 52]. 2004년부터 2011년에 유럽에서 시행한 다국적 조사인 The Survey of Health, Ageing and Retirement in Europe (SHARE)에서도 행정 데이터와 연결하는 프로젝트를 진행하고 있다[ 53]. 국외의 사례를 바탕으로 우리나라에서도 분산된 데이터를 한 번에 비교할 수 있도록 연계하는 시스템을 마련한다면 건강을 분석하기 위한 더욱 포괄적인 변수들에 대한 분석이 가능할 것이다. 특히 다른 데이터 중에서도 사망 관련 데이터와 연계될 필요가 있다. 현재 국민건강영양조사에서는 만성질환과 관련된 위험 요인에 대해 파악하기 위하여 2007-2015년 자료를 기반으로 2007-2018년 통계청 사망원인통계와 연계하여 자료를 제공하고 있다[ 54]. 패널데이터를 활용하면 만성질환만이 아니라 다양한 방면의 건강 영향 요인의 명확한 인과관계 규명이 가능할 것이다.
셋째, 패널데이터의 사용자들을 위한 데이터 설명회, 패널데이터 분석방법론 등 교육이나 학술대회, 정기연구물 발간, 패널데이터 활용논문 리스트 공개 등 연구 지원 방법을 모색할 필요가 있다. 일례로 청소년건강행태 횡단면 조사의 한계점을 보완하기 위해 구축한 청소년건강패널조사의 연구 가치와 활용성을 높이기 위해서는 기존의 패널데이터가 가지고 있는 한계점을 충분히 분석하고 최신 연구 동향을 반영한 시도가 필요하다. 그러나, 조사항목이 기존의 연구와 상이한 특징이 없어 기관별로 중복으로 생산하는 현상으로 비추어질 수 있다. 패널 생산 기관에서 패널데이터 통계분석에 대한 수요자 중심의 방법론적 교육을 지원하면 연구자의 접근성을 높이는 효과를 기대할 수 있다. 한국노동패널의 경우 홈페이지에서 데이터 활용 관련하여 개인용 ·가구용 연도별 Merge 방법, 원하는 변수 구성 등의 방법에 대한 Stata, SAS 통계 패키지 코드를 제공한다. 한국복지패널에서는 매년 정기적인 데이터 설명회 개최와 함께 패널 분석 방법에 대한 특강을 학술대회에서 진행하고 있다. 이외에도 활용도 제고 방안에는 구축된 데이터를 활용한 최근 연구 동향을 지속적으로 모니터링하고 개선 사항을 확인하는 과정도 포함된다. 현재 조사한 9개의 패널데이터 중 한국노동패널, 한국의료패널 등 절반 정도만이 데이터 활용 리스트를 공개하고 있으며 이에 대한 지속적인 업데이트가 필요한 패널도 존재한다. 데이터를 생산하는 기관에서는 사후관리에서 부족한 사항의 개선 및 이용자에게 편의를 제공하기 위해 노력해야 한다.
마지막으로, 보건의료 분야 연구에서의 활용 가치를 높이기 위한 노력과 더불어 패널데이터에 대한 품질 측면에서의 관리도 필요하다. 패널데이터의 품질을 개선하기 위해서는 체계적인 시스템을 통한 데이터 품질관리를 시행해야 한다[ 55]. 구축되어 있는 패널데이터는 통계청 정기·자체품질진단을 수행하는 경우도 있지만 모든 데이터에 적용할 수 있는 품질관리 가이드라인은 존재하지 않는다. 보다 다양한 품질관리 방법론을 개발하고 여러 데이터를 통합하여 사용할 수 있도록 관리하는 것이 무엇보다 중요하다[ 56]. 향후 통합 플랫폼을 통한 데이터 연계 단계에서는 계획하는 시점부터 품질 관리가 시행되어야 한다. 우선 패널데이터의 특성을 고려하여 데이터 수집 단계에서부터 표준화된 형식에 대한 정립이 필요하다[ 57]. 일관성 있게 구조화된 패널데이터의 품질 평가를 위한 새로운 지침을 개발하여 연계된 데이터를 활용 가능하게 제공할 수 있는 종합적인 관리 프레임워크를 수립해야 한다[ 58].
결 론
본 연구는 패널데이터의 관리 및 활용성 제고에 대한 개선사항을 제시하고 향후 효율적인 발전을 위한 대책을 논의하려는 목적으로 보건의료 분야의 패널데이터 9종에 대한 분석을 실시하였다. 패널데이터별 일반특성 및 보건의료 관련 조사항목을 비교하였으며, 표본 구성·추출이나 패널 유지율 등 패널데이터만의 특성을 분석하여 현황을 살펴보았다. 패널조사마다 시작된 시기가 다르고, 20-30년간 계속 수행되고 있거나 최근 새롭게 시작되는 조사도 있어 보건의료 관련 패널데이터는 확장 추세이며 그에 따른 데이터도 방대하게 구축되어 있다. 다각적인 관점에서 보건의료 연구를 위한 기초자료 생산 및 양질의 통계 자료 제공을 위한 패널데이터의 효율적인 관리 및 품질 개선 방안은 더욱 요구될 것이다. 통합적인 가이드라인에 따른 패널데이터의 관리가 미흡한 우리나라 패널데이터에 대해 앞서 논의된 향후 과제 내용을 토대로 통합 플랫폼 구축 및 높은 수준의 품질관리가 이루어진다면 건강 및 보건의료 연구에 있어서 패널데이터의 가치를 증진할 수 있을 것이다.
REFERENCES
1. Lee H, Lee E, Park S, Kwon S, Shim K. Measures to improve the accuracy and efficiency of statistical surveys: Focusing on field surveys and sampling. Daejeon: Statistics Research Institute; 2008. (Korean).
2. Hsiao C. Analysis of panel data.. 4th ed.. New York: Cambridge University Press; 2022.
7. Son CK. Current status and tasks of panel research. Health Welf Policy Forum 2009;157:1-11. (Korean).
9. Lee Y. Current status of Korea Health Panel and Korean Welfare Panel Study. Suwon: The Korean Association for Policy Analysis and Evaluation; 2011. (Korean).
10. Kim H, Byun J. Some consideration for the official statistics quality control of panel survey. J Korean Official Stat 2022;27(2):1-21. (Korean). DOI: 10.22886/jkos.2022.27.2.1.
13. Lee S. Current status and challenges of health and welfare statistics. Health Welf Policy Forum 2002;9(11):2-5. (Korean).
14. Lee S. Changes in research strategies and implications of major western panel. Labor Rev 2006;63-78. (Korean).
15. Hwang JS, Shin SJ, Kim JH, Oh SH, Kang HK, et al. Domestic secondary data resources utilization in healthcare research. Seoul: National Evidence-based Healthcare Collaborating Agency; 2013. (Korean).
16. Korea Labor Institute. Korean Labor and Income Panel study years 1 to 24 user's guide. Sejong: Korea Labor Institute; 2022. (Korean).
17. Korea Employment Information Service. Youth Panel 2007 years 1 to 14 user's guide. Eumseong: Korea Employment Information Service; 2021. (Korean).
18. Korea Employment Information Service. Youth Panel 2021 wave 1 user's guide. Eumseong: Korea Employment Information Service; 2022. (Korean).
19. Korea Institute for Health and Social Affairs. Korean Welfare Panel Study year 16 survey data user's guide. Sejong: Korea Institute for Health and Social Affairs; 2022. (Korean).
20. Korea Employment Information Service. Korean Longitudinal Study of aging 8th user's guide. Eumseong: Korea Employment Information Service; 2022. (Korean).
21. Korean Women's Development Institute. Korean Longitudinal Study of women & families 1-8 waves user's guide. Seoul: Korean Women's Development Institute; 2022. (Korean).
22. Korea Institute for Health and Social Affairs. 2008-2018 Korea Health Panel annual data user's guide. Sejong: Korea Institute for Health and Social Affairs; 2022. (Korean).
23. Korea Institute for Health and Social Affairs. 2nd Korea Health Panel 2019 annual data user's guide. Sejong: Korea Institute for Health and Social Affairs; 2022. (Korean).
24. National Youth Policy Institute. Korean Children and Youth Panel Survey 2010 user guide. Sejong: National Youth Policy Institute; 2017. (Korean).
25. National Youth Policy Institute. Korean Children and Youth Panel Survey 2018 user guide. Sejong: National Youth Policy Institute; 2023. (Korean).
26. Korean Institute of Child Care and Education. Panel Study on Korean children 8th to 13th wave survey data user guide. Seoul: Korean Institute of Child Care and Education; 2023. (Korean).
27. Korea Disease Control and Prevention Agency. The 3rd year (2021) Korean Youth Health Behavior Panel Survey statistics. Cheongju: Korea Disease Control and Prevention Agency; 2022. (Korean).
28. Kim K. A graphical method to investigate attrition bias using attrition patterns as post-strata in panel survey. Survey Res 2018;19(1):1-25. (Korean). DOI: 10.20997/SR.19.1.1.
29. Lee B. Results and development direction of the Korea Welfare Panel Study in 15 years. Health Welf Policy Forum 2020;2020(3):2-5. (Korean).
30. Lee SH, Park CY, Chung SS, Choi HM. Panel attrition factors in Korean Labor and Income Panel Study. J Korean Data Infom Sci Soc 2011;22(1):1-8. (Korean).
31. Choi G. Estimation of panel retention rate function using growth curve model in panel surveys [dissertation] University of Seoul Graduate School; Korea: 2021.
32. Hong M, Choi H. The attrition of KLIPS and inequality index. Survey Res 2014;15(4):95-122. (Korean).
33. Lee S. Analysis of sample deviation of Korean Labor & Income Panel Study (KLIPS). Labor Rev 2005;11:66-80. (Korean).
34. Yeo Y. Characteristics and use cases of income data of Korean Welfare Panel Study. Health Welf Policy Forum 2020;281:7-17. (Korean).
35. Jung Y, Son C, Ko S, Lee J, Lee Y, Seo N, et al. A report on the pocedure of Korea Health Panel Survey. Sejong: Korea Institute for Health and Social Affairs; 2008. (Korean).
36. Cho SM, Joo JS, Kim YR, Lee DS, Kim EJ, Lee JS, et al. 2022 Korean Longitudinal Study of Women & Families. Seoul: Korean Women's Development Institute; 2022. (Korean).
37. Kahng SK, Jeon HS. An exploratory study on age differences in health trajectory and its predictors: Using Korean Welfare Panel Study from W1 to W7. J Soc Sci 2013;24(3):61-84. (Korean).
38. Heo WG. Life satisfaction development trajectory and health characteristics factor of the elderly. Soc Welf Policy 2017;44(2):297-318. (Korean). DOI: 10.15855/swp.2017.44.2.297.
39. Lee H, Yom YH. Age difference in the trajectory of medical service utilization, medical expenses and health outcome among the elderly: A Latent growth model analysis. Health Soc Welf Rev 2017;37(2):287-324. (Korean). DOI: 10.15709/hswr.2017.37.2.287.
40. Jeong S, Kim C. A longitudinal study of the trajectories of change in health and medical uses of medical aids recipients using latent growth Mmodel. Health Soc Sci 2021;(57):63-88. (Korean).
41. Boo G. Establishment international comparable data: Korean Longitudinal Study of Aging (KLoSA). Labor Rev 2006;94-107. (Korean).
42. Lillard D. The Cross-National Equivalent File (CNEF): Harmonized Panel Survey Data in Eight Countries. Ask 2015;24(1):55.
43. Choi H, Kim Y. Composite estimation type weighting adjustment for bias reduction of non-continuous response group in panel survey. Korean J Appl Stat 2019;32(3):375-389. (Korean).
44. Lee H, Ji H, Lee J. A study of quality improvement in Health and Welfare Panel Data-Focusing on imputation of item nonresponse. Sejong: Korea Institute for Health and Social Affairs; 2019. (Korean).
46. Choi Y, Park H, Yoon Y. Medical panel data analysis through data pre-processing: Focusing on activities for health management. J Inf Technol Archit 2019;16(2):179-187. (Korean). DOI: 10.22865/jita.2019.16.2.179.
47. Oh M, Choi H, Kim Y, Lee Y, Jin J. A study on the micro data linkages to promote the production and utilization of health and welfare statistics. Sejong: Korea Institute for Health and Social Affairs; 2014. (Korean).
48. Lee H. A study on how to link, integrate, utilize multi-source data to vitalize the data economy in the health and welfare. Sejong: Korea Institute for Health and Social Affairs; 2022. (Korean).
49. Oh M. Canadian administrative data and public data linkage in health, welfare and social security. Int Soc Secur Rev 2020;2020(Fall):53-64. (Korean). DOI: 10.23063/2020.09.5.
50. Kim J. A study on university researchers’ data management practices. J Korean Libr Inf Sci Soc 2012;43(3):433-455. (Korean). DOI: 10.16981/kliss.43.3.201209.433.
51. Sakshaug JW. Reducing nonresponse and data linkage consent bias in large-scale panel surveys. Forum Health Econ Policy 2022;25(1-2):41-55. DOI: 10.1515/fhep-2021-0060.
52. Shi X, Nikolic G, Fischaber S, Black M, Rankin D, Epelde G, et al. System architecture of a European platform for health policy decision making: MIDAS. Front Public Health 2022;10:838438. DOI: 10.3389/fpubh.2022.838438.
54. Yun S, Oh K. The linkage of Korea National Health and Nutrition Examination Survey data to the cause-of death statistics. Public Health Weekly Rep 2020;13(28):2071-2080. (Korean).
55. Choi M, Lee S. Current status and issues of data management plan in Korea. J Korea Contents Assoc 2020;20(6):220-229. (Korean). DOI: 10.5392/JKCA.2020.20.06.220.
57. Shin J. Trends in policy implementation to revitalize data use-focusing on health and welfare. Health Welf Policy Forum 2021;301:2-6. (Korean).
58. Kim H. Quality evaluation of the open standard data. J Korea Contents Assoc 2020;20(9):439-447. (Korean). DOI: 10.5392/JKCA.2020.20.09.439.
|
|