Growth Modulation Index의 추정에 대한 연구: 잠재적 변수와 가속실패시간 모형의 적용
Estimation of Growth Modulation Index Using Latent Variable and Accelerated Failure Time Model
Article information
Trans Abstract
Objectives
For cytostatic cancer trials, Growth Modulation Index (GMI) defined by an intrapatient progression-free survival (PFS) ratio, has been proposed to evaluate the efficacy of new target agent. The purpose of this study was to suggest new methods for the estimation of GMI with censored data in the first PFS (PFS1) interval, and subsequent second PFS (PFS2) interval.
Methods
The proposed methods include latent variable approach based on Rank Preserving Structural Failure Time (RPSFT) model and Accelerated Failure Time (AFT) model. Simulations were conducted to compare the performance of proposed GMI estimates and estimates based on the Kaplan-Meier method in terms of bias and mean squared error (MSE) by varying dependency of two PFS and censoring rates.
Results
Simulation results show that new GMI estimates using latent variable approach and AFT model exhibited smaller bias and MSE than the previous estimates based on the Kaplan-Meier survival function. As censoring rates increased in PFS1, bias and MSE increased in the previous GMI estimates. When the AFT model was applied in the case of high censoring rates, bias was relatively higher than those of latent variable approach.
Conclusions
When using GMI as primary endpoint in cancer clinical trials, cautious statistical application and interpretation is needed, particularly for the presence of censored data in the first PFS interval.
서 론
초기 항암제 임상시험은 새로운 항암제나 기존 약제의 조합에 대한 효능(efficacy)과 독성(toxicity)에 대한 평가가 주목적이며, 새로운 치료제의 향후 연구를 결정하는 중요한 역할을 한다. 세포독성(cytotoxic) 항암제는 몸속에 존재하는 암세포를 죽이는 작용을 하며, 항암제의 효과는 종양의 크기가 줄어드는 정도로 결정된다. 세포독성 항암제 임상시험에서 주 유효성 평가변수는 종양이 50% 이상 줄어드는 환자들의 분율로 정의되는 종양 반응률(response rate)이 많이 사용된다. 그러나 최근 세포성장억제(cytostatic) 항암제가 많이 개발되면서, 질병 진행의 지체가 임상연구의 기대되는 성과이기 때문에 종양 반응률보다는 overall survival (OS)나 progression free survival (PFS)와 같은 생존시간을 유효성 평가변수로 선호한다[1].
OS의 경우 임상시험 간(between-trial) 변동성은 대상자의 성별, 수행 능력, 기저질환의 여부 등과 같은 예후인자들로 많은 부분이 설명 가능하지만, PFS의 경우 임상시험 간 존재하는 변동성은 위와 같은 예후인자들에 대한 보정에도 불구하고 여전히 크게 존재한다. 따라서 단일군 시험이나 제3상 임상시험에서 PFS를 주요 유효성 평가변수로 사용하는 것은 제한적일 수 있다[2].
Von Hoff [3]는 첫 번째 항암치료를 받은 후 재발이 일어날 때까지의 시간인 PFS1 (새로운 세포성장억제 임상시험에 참여하기 직전의 가장 최근 PFS)과 두 번째 항암치료를 받은 후 재발이 일어날 때까지의 시간인 PFS2 (새로운 세포성장억제 항암제를 투여한 후 재발할 때까지의 PFS) 비율로 정의되는 growth modulation index (GMI)를 제안하였다. 항암치료의 효과가 좋을 경우 PFS는 길어지는 경향이 있다. 따라서 GMI가 1.0인 경우 두 항암제의 효과는 다르지 않다고 할 수 있고, 1보다 큰 경우 두 번째 항암제가 첫 번째 항암제에 비해 치료에 더 효과적이라고 볼 수 있으며 조금 더 보수적인 연구에서는 1.33을 기준으로 한다[3]. GMI는 동일 개인 내의 PFS 값을 비교한다는 점에서 위약군과 관련된 윤리적인 문제에서 벗어날 수 있고 환자 간 변동성(between-patient variability)을 제거할 수 있다는 특징이 있다. 또한 난치성 암 관련 세포성장 억제 항암 임상시험에서 유효성 평가변수로 사용할 수 있다[2].
하지만 현재까지 연구된 GMI 추정 방법은 PFS1이 중도절단(right censoring) 없이 실제 생존시간이 모두 관측되었다는 전제하에 PFS2의 중도절단 여부만 고려하는 방법이다. 그러나 연구 진행에 따른 행정적인 시간적 제약으로 중도절단될 가능성은 충분히 존재한다. 따라서 PFS1에서 중도절단이 발생하면 기존의 방법[3]으로 추정한 GMI의 생존함수는 편의가 발생할 수 있다. 본 연구는 PFS1과 PFS2 모두 중도절단이 있는 경우 기존의 GMI 추정치의 편의 크기를 알아보고 편의를 제거할 수 있는 새로운 GMI를 추정하는 방법을 제안한다.
연구 방법
GMI의 정의 및 특성
Von Hoff [3]가 제안한 GMI는 짝지어진 생존 자료를 기반으로 하는 개인 내 PFS를 비교하는 지수로서, 연이은 재발을 관측할 수 있는 난치성 암 임상시험에서 유효성 평가변수로 사용할 수 있다. 또한 GMI는 단일 치료군 디자인에서 환자 자신의 PFS를 대조군으로 이용하기 때문에 난치성 암 임상시험 시 제기될 수 있는 윤리적 문제로부터 자유롭다. GMI는 첫 번째 항암치료를 받은 후 재발이 일어날 때까지의 시간인 PFS1과 두 번째 항암치료를 받은 후 재발이 일어날 때까지의 시간인 PFS2의 비율로 정의되며. i번째 관측대상의 GMI는 다음과 같이 정의한다 (i=1,2,…,n).
각 관측대상의 대조군 값으로 사용하는 PFS1i의 경우 항상 관측되어야 하며, PFS2i의 경우 중도절단 시간 Ci에서 우중도절단(right-censored) 될 수 있다. 즉, PFS1i+PFS2i>Ci인 경우 중도절단되며 연구의 편의상 Ci는 행정적인 이유로 발생하는 중도절단만 가정한다. 이러한 가정하에서 GMI의 추정은 일반적인 생존분석에서 사용하는 방법을 이용할 수 있고, 대표적으로 Kaplan-Meier 생존함수를 통해 추정할 수 있다.
Kovalchik [2]는 기존 GMI 추정치가 가지고 있는 특성을 연구하였다. 각 대상이 가지고 있는 두 개의 PFS를 모형화하기 위해 프레일티(frailty)를 이용하였다. 프레일티 γi는 서로 독립이며 평균이 1이고 분산이 α인 감마분포(Gamma distribution)를 따른다고 가정한다. 즉,
여기서 α는 동일한 관측대상으로부터 얻어진 PFS 간의 상관관계를 나타내는 켄달의 타우(Kendall’s τ)로 다음과 같이 표현할 수 있다.
각 대상자의 감마 프레일티 γi가 주어졌을 때, PFS1과 PFS2는 형태모수(shape parameter)가 θ인 주변 조건부(marginal conditional) 와이불분포(Weibull distribution)를 가정한다. 즉,
위의 가정하에서 주변(marginal) GMI 분포는 로그-로지스틱(log-logistic) 분포를 따르며 중앙값(median)은 λ1/λ2로 위험비(hazard ratio)와 동일하다[2,4].
1차 항암치료에서 재발한 이후 2차 항암치료의 효과가 1차 항암치료의 효과보다 좋을수록 GMI 값은 1보다 커지게 된다. 임상적으로는 GMI가 1.33보다 큰 환자들의 분율이 일정기준 이상이면 2차 항암치료제의 효과가 1차 항암치료제의 효과에 비해 더 우수하다고 판단할 수도 있다. GMI를 이용한 연구 설계에서는 PFS1과 PFS2의 상관성이 높은 경우에 더욱 효율적이다[1]. 그러나 잠재적인 유용성에도 불구하고 현재까지 2상 임상시험에서 주 유효성 평가변수로는 많이 사용하지 않으나 그 유용성은 계속 연구되고 있다[2].
제안 방법
잠재적 변수(latent variable)를 이용한 방법
Robins [5]는 임상시험에서 여러 가지 이유로, 예를 들면 대조군과 처리군의 비교성이 깨어지는 경우 인과관계를 밝힐 수 있는 Rank Preserving Structural Failure Time (RPSFT) 모델을 제안하였다. 만약 대조군에 배정된 환자가 악화 또는 재발(progression)된 시점에서 실험군 약으로 치료를 변경한 경우(single crossover), 최종 관측된 대조군의 OS는 실험약으로 인한 효과가 포함되어 있다. 따라서 만약 이 환자가 실험약으로 치료받지 않았다는 가정(counterfactual)에서의 잠재적 OS를 생각할 수 있다. 먼저 관측된 OS는 다음과 같이 표현할 수 있다.
여기서 Ti는 i번째 대상의 관측된 OS로서 대조약을 치료받으면서 악화되어 치료가 변경되기까지의 기간(
여기서 ψ는 가속화 요인(acceleration factor)이다. 따라서 가속화 요인 ψ가 0보다 작다는 것은 새로운 치료약 즉, 새로운 항암제의 효과가 더 우수하다는 것을 의미한다. 가속화 요인 ψ의 추정은, 만약 두 군의 배정이 무작위하게 이루어졌다면 grid searching을 통해 할 수 있다. 일정 범위에서 선택한 ψ값을 ψ*라고 하면, 잠재적 변수(latent variable) Ui의 값을 얻을 수 있고, 두 군의 로그-순위(log-rank) 검정을 이용할 수 있다. 이 때 얻어진 p-value가 최대가 될 수 있는 ψ*를 가속화 요인으로 추정한다. 여기서 ψ*가 음수일 경우 exp(ψ*)는 1보다 작아져 Ui의 시간은 줄어들게 된다. 따라서 기존 중도절단 시간 Ci를 재설정하는 재 중도절단(re-censoring) 과정이 필요하다. 재 중도절단 시간 Ci(ψ*)는 다음과 같이 정의할 수 있다.
Jonsson [6]에 따르면 연구 중인 치료제는 사망할 때까지의 시간을 지속적으로 감소시키고 재발 전과 후 시점에서 모든 환자들에게 동일하다는 것이 RPSFT 모델의 중요 가정이며, 사망이나 악화 또는 재발같은 사건이 발생할 때까지의 시간이 비례적으로 감소하는 경우인 연구에 해당 모델을 적용하는 것이 타당하다고 설명하였다.
본 연구에서는 RPSFT 모델을 바탕으로 한 잠재적 변수로 GMI를 새롭게 추정하는 방법을 제안하였다. 먼저 다음과 같은 두 가지 형태로 잠재적 변수를 생각할 수 있다. 편의상 1차로 투여받는 항암제를 A, 2차로 투여받는 항암제를 B라고 지정하자. 첫 번째 형태는 연구시작 시점에서 1차 항암제로 A를 투여받고 첫 번째 재발하기까지 관찰된 생존시간 PFS1에 해당하는 잠재적 변수로 만약 연구시작 시점에서 항암제 B를 투여 받았다고 가정하였을 때 첫 번째 재발하기까지의 생존시간은 PFS1 × eβ 로 생각할 수 있다. 또 다른 형태의 잠재적 변수는 1차 항암치료 후 첫 번째 재발시점에서 2차 항암제 B를 투여받고 두 번째 재발하기까지의 생존시간 PFS2에 해당하는 잠재적 변수로 만약 첫 번째 재발시점에서 항암제 B 대신 항암제 A를 지속적으로 투여 받았다고 가정하였을 때 두 번째 재발하기까지의 생존시간은 PFS2 ×eβ 로 생각할 수 있다. 이렇게 잠재적 변수를 정의하게 되면 각 대상자로부터 동일 시점에서 서로 다른 항암제를 투여 받았을 때 생존시간을 짝으로 정의할 수 있고 앞에서 설명한 RPSFT 모형을 활용하여 추론할 수 있다. 본 연구에서는 2차 항암제의 유효성 평가에 초점을 둔 유효성 평가변수로 GMI를 고려하므로 두 번째 방법으로 잠재적 변수를 정의하였다. 생존시간 T를 PFS1과 PFS2를 더한 전체 관측된 시간으로 정의할 때, U는 PFS1과 PFS1*을 더한 잠재적 생존시간으로 정의하며 i번째 관측대상의 관측시간 T와 U는 다음과 같이 표현할 수 있다.
RPSFT 모델을 바탕으로 하는 방법을 적용하여 추정한 i번째 관측대상의 새로운 GMI를 GMI1*라고 정의하며 다음과 같이 정의한다.
여기서 β를 추정하기 위해, 먼저 PFS1i와 PFS1i* 간에는 감마 프레일티(γi) 공유로 인한 연관관계가 있다고 가정한다. PFS1i와 PFS1i*를 구분하는 그룹변수를 만들고, Cox 회귀분석 시 그룹변수와 감마 프레일티를 모형에 포함하여 분석한다. 두 그룹 간의 차이를 나타내는 그룹변수의 p-value가 가장 큰 값을 가질 때의 특정 범위 내 가속화 요인 β값을 grid searching하여 GMI1*를 추정한다. 추정한 β는 모든 관측대상에서 동일한 값을 가지므로, 추정된 GMI1* 역시 모든 관측대상에서 동일한 상수의 값을 가지게 된다. β가 양수인 경우 eβ 는 1보다 큰 값을 가지므로 기존 중도절단 시간 Ci를 그대로 사용한다. 하지만 β가 음수인 경우 eβ 는 1보다 작은 값을 가지므로 PFS1i*는 중도절단 시간 Ci- PFS1i보다 작아질 수 있어, 재 중도절단에 대한 고려가 필요하다. 본 연구에서 재 중도절단 조정 방법은 다음과 같다. 먼저 PFS1i*의 중도절단 여부는 PFS2i의 중도절단 여부를 그대로 사용하며 PFS1i이 중도절단된 경우 PFS1i*는 결측치(NA)로 처리한다. 하지만 PFS1i이 중도절단 되지 않고 PFS2i가 중도 절단되었다면 PFS1i*의 재 중도절단 된 시간은 다음과 같이 표현한다.
가속실패 시간모형을 이용한 방법
콕스 비례위험(Cox proportional hazards, Cox PH) 모형은 생존 시간에 영향을 미치는 공변량(covariate)을 찾아내는 분석 방법으로서, 반응변수인 생존 시간과 공변량의 관계가 위험함수(hazard function)를 통해 표현된다는 특징을 가지고 있다. Cox PH 모형은 생존 시간에 대한 기저분포(baseline distribution) 가정을 필요로 하지 않는 준모수(semi-parametric) 방법이다. 하지만 위험률의 비는 시간에 의존하지 않고 항상 일정하다는 비례위험에 대한 가정이 만족하지 않으면 문제가 발생할 수 있으며, 추정된 값에 대한 해석이 어렵다는 단점이 존재한다. 이와 같은 경우, 생존시간을 직접 모형화하는 가속실패 시간모형(accelerated failure time, AFT)을 고려할 수 있다[7]. AFT 모델은 Cox PH 모형에 비해 직관적인 해석이 가능하다는 이유로 임상에서 유용하게 사용할 수 있으나 모수적 분포 가정을 해야 하는 한계점이 존재한다[8].
본 연구에서 두 번째 방법으로 GMI를 추정하는 방법으로 먼저 다음과 같은 모형을 구축한다[9].
여기서 wi1은 i번째 관측대상의 첫 번째 관측된 사건 발생까지의 생존 시간을, wi2는 i번째 관측대상의 첫 번째 사건 발생부터 두 번째 사건 발생까지의 관측된 갭타임(gap time)으로 정의한다. 즉 wij는 i번째 관측대상의 j번째 갭타임을 의미한다. I는 indicator 함수로써 I(j =2)는 i번째 관측대상의 두 번째 관측시간이 관측되었을 경우 1의 값을 가지며, 관측되지 않았을 경우 0의 값을 가지게 된다. σj는 척도모수이고 εij는 오차항에 해당한다.
본 연구에서는 로그노말 분포를 따르는 AFT 모델을 이용하여 GMI2*라는 새로운 GMI를 추정한다. i번째 관측대상의 PFS1i와 PFS2i는 wi1, wi2와 동일하다. 위의 AFT 모델은 다음과 같이 표현할 수 있다.
따라서 log(wi1)와 log(wi2)의 기댓값은 다음과 같다.
따라서 기하평균(geometric mean) 방법으로 구한 새로운 GMI2*는 다음과 같이 정의할 수 있다.
위의 AFT 모델을 이용한 방법으로 구한 GMI2*는 잠재적 변수를 이용한 GMI1*와는 달리 모든 관측대상이 서로 다른 값을 가지고 있다.
모의실험 방법
본 논문의 모의실험에서는 다음과 같은 단계로 PFS1i와 PFS2i 그리고 중도절단 자료를 생성하였다.
① i번째 대상의 프레일티를 평균이 1이고 분산이 α인 감마분포로부터 발생하였다.
② PFS1i과 PFS2i는 다음과 같이 발생하였다. 즉,
여기서 U1i, U2i,는 각각 균등분포(uniform distribution)를 따르는 0과 1 사이의 임의의 실수이며, λ1/λ2는 hazard ratio로 참 GMI이며 본 연구에서는 1.0과 1.33으로 설정하였다. 두 PFS 간의 상관관계를 나타내는 Kendall's τ는 0.1과 0.4를 가정하였다.
③ PFS1의 중도절단 시간 C1은 모의실험 시 고려하는 모든 모수에 대하여 10만 개의 생존 시간을 생성한 후 중도절단 비율이 5%, 10%, 20%가 되도록 설정하였다. PFS2의 중도절단을 결정하는 C2는 생성된 PFS1과 PFS2를 더한 기간이 C1의 k배가 되도록 하였으며 k는 무한대(∞)와 1.5로 하였다. 정의한 PFS1의 중도절단 비율에 따른 경험적으로 추정된 중도절단 시간은 다음과 같다(Table 1).
④ 기존 GMI 추정[2]은 PFS1의 값이 중도절단된 경우는 제외하였다. 잠재적 변수를 이용한 방법, 그리고 AFT 모형을 이용한 방법은 PFS1의 값이 중도절단 되어도 모두 분석에 포함하였다. 세 가지 방법으로 추정된 추정치의 편의와 평균제곱오차(mean square error, MSE)를 1,000번 반복 수행을 통해 그 특성을 비교하였다. 잠재적 변수를 이용한 방법의 경우 모든 관측대상에서 동일한 값을 가지므로, 1,000번 추정된 GMI1*의 평균값을 구하였다. 기존의 GMI와 AFT 모델을 이용한 GMI2*는 각각 Kaplan-Meier 방법을 통해 추정된 생존함수의 중앙값(median)을 구하고, 1,000번 반복하여 추정한 중앙값의 평균값으로 구하였다. 실제 암 2상 임상시험에서는 많은 환자 자료가 얻어지는 경우가 적기 때문에 표본의 크기는 100으로 제한하였다. 또한 모의실험에서 사용한 모든 분석은 R 프로그램 3.2.3 버전을 사용하여 분석하였고, survival과 reshape 패키지를 사용하였다.
연구 결과
Table 2는 참 GMI 값이 1.0인 경우의 모의실험 결과이다. 켄달 τ가 0.1일 때의 결과를 확인해 보면, 기존 방법으로 추정한 추정치의 편의와 MSE는 매우 컸고, PFS1의 중도절단 비율이 커짐에 따라 편의와 MSE는 크게 증가하였다. 반면에 본 연구에서 새롭게 제안한 잠재적 변수를 이용한 방법 그리고 AFT 모델을 이용한 방법 모두 기존 방법에 비해 편의와 MSE가 매우 작았다. 두 가지 제안한 방법 중에는 잠재적 변수를 이용한 방법이 AFT 모델을 이용한 방법보다 편의와 MSE가 작았고, 특히 PFS1의 중도절단 비율에 크게 영향을 받지 않았다. 이러한 경향은 τ가 0.4인 경우에도 전반적으로 비슷하였으나, PFS1의 중도절단 비율이 커질 때 AFT 모델을 이용한 방법에서 편의가 약간 높아지는 경향이 있었다.
Table 3은 참 GMI 값이 1.33인 경우의 결과이다. 참 GMI 값이 1.0일 때와 마찬가지로 기존 방법에 비해 잠재적 변수를 이용한 방법과 AFT 모델을 이용한 방법이 추정을 더 잘하는 것으로 나타났다. 기존의 방법으로 추정한 경우는 참 GMI가 1.0인 경우의 결과보다 편의와 MSE가 더욱 증가하였으나, 본 연구에서 제안한 두 가지 방법은 편의는 크게 차이가 없었고 MSE는 약간 증가하는 경향을 보였다.
고찰 및 결론
조기 암 임상시험에서 주 유효성 평가변수로 많이 사용하는 PFS는 그 변동성으로 인해 임상시험을 설계하는 데 어려움을 준다. 최근 난치성 암에서 새롭게 제안된 GMI는 두 연속적인 PFS의 비로서 정의되고, 개인 내에서의 항암제 차이에 따른 PFS를 비교한다는 측면에서 그 의의를 두고 있으며 통계학적 특성에 대해 최근 연구되고 있다[1,2,4]. 그러나 첫 번째 PFS의 값이 중도절단되는 경우 그 대상자를 제외하여 분석하여야 한다. 따라서 첫 번째 PFS의 생존기간이 긴 대상자가 선택적으로 분석에서 제외됨으로써 GMI 추정치가 과대 추정되는 문제가 발생한다. 따라서, 본 연구는 이러한 문제점을 보완하고자 잠재적 변수를 이용한 방법과 AFT 모델을 이용하여 GMI를 추정하는 새로운 방법을 제안하였다. 두 방법 모두 중도절단된 PFS1을 모형에 포함하여 분석하고 PFS1이 중도절단되어 PFS2가 관측되지 않아 결측되어도, 우도(likelihood)를 이용하여 분석하기 때문에 추정치의 편의를 줄일 수 있을 것으로 기대하였다.
모의실험을 통해, PFS1과 PFS2의 중도절단 비율과 두 연속적인 PFS 간의 상관성을 Kendall의 τ로 하여 여러 가지 시나리오 상에서 Kaplan-Meier를 이용한 기존의 GMI 추정치, 그리고 본 연구에서 제안한 두 가지 GMI 추정치의 특성을 편의와 MSE 측면에서 비교하였다. 모의실험 결과, Kaplan-Meier를 이용한 기존의 GMI 추정치는 PFS1의 중도절단 비율이 커질수록 심각한 수준의 편의를 보였고 또한 상대적으로 큰 MSE를 보였다. 반면 본 연구에서 제안한 잠재적 변수를 이용한 방법과 AFT 모델을 이용한 방법은 상대적으로 편의가 적었고 또한 적은 수준의 MSE를 보였다. 제안한 두 가지 방법을 비교하면 전반적으로 잠재적 변수를 이용한 방법이 AFT 모델을 이용한 방법보다 편의와 MSE가 낮았고, 중도절단 비율에 상대적으로 영향을 적게 받았다. 하지만 잠재적 변수를 이용한 방법의 경우 개개인의 GMI값을 추정할 수 없다는 한계점이 있다. 반면 AFT 모델을 이용한 방법은 각 개인에서 추정한 GMI의 Kaplan-Meier 생존함수를 추정할 수 있으므로 두 번째 항암제에 더욱 효과를 보이는 대상자를 선별할 수 있거나 관련요인을 추후 분석할 수 있다는 장점이 있다.
결론적으로 위의 내용들을 종합하여 볼 때, 중도절단 된 PFS1이 있는 경우 이를 제거하고 Kaplan-Meier 방법으로 GMI를 추정하는 것은 심각한 편의가 발생하므로 실제 임상연구에서 사용하는 경우 매우 조심스러운 해석이 필요하다. 추후 PFS1의 중도절단 여부를 포함하여 분석하는 방법에 대해 좀 더 심도 있는 연구가 필요할 것으로 생각된다.
Notes
No potential conflict of interest relevant to this article was reported.