小芳老師碎碎念: 2020

揭開ICER神秘的面紗

認識ICER（incremental cost-effectiveness ratio）已經數十寒暑，在學校教這個也十幾年，ICER這個東西在台灣仍舊神秘，最近好像還紅了起來。我在不同場合被詢問了幾次之後，覺得應該找個機會跟大家聊一聊，我自己對ICER在學術及應用的一些想法。

得先交代一下理論基礎

醫療衛生的決策，不論是在臨床決策或是政策制訂，因為各種不確定性（診斷、治療效果、病人偏好、接受程度、其他層面的影響），一向是複雜與困難的。以醫藥衛生領域來說，因為專業分工複雜，政策形成須要有系統、有框架，才能周全與細膩。同時也因為社會、政治、文化的發展，民眾要求政策制訂及實行的過程需要有可參與、可監督的民主過程。

醫療介入或衛生政策的主要目標，當然是病人或民眾的健康福祉。在一九七零年代之後，科技發展一飛沖天，各種創新科技產品紛紛問世，民眾的期待越來越多，造成政府財政壓力陡升，醫療體系的永續（sustainability）也成為重點。也因此，經濟評估學門興起，主張政府在考量各種衛生政策、或新科技引進時，應該仔細評估健康效果是否有證據支持，同時也要評量資源投入是否物有所值（value for money）。

課本（Drummond et al的blue book）[1]說，經濟評估是「the comparative analysis of alternative courses of action in terms of both their costs and consequences」，也因此（如果你是很喜歡老師幫你畫重點的那種，要小心了，重點在此），它有兩個特點：

1. 是它處理各比較方案的成本（投入）及結果（產出）；

2. 經濟評估很在意評估標的與其他選項間的比較。

而符合這兩個特點的分析方法，包括有Cost-effectiveness analysis （健康產出指標為自然單位，例如人年、反應率、血壓值下降多少等）、Cost-utility analysis （健康產出指標為healthy years，例如QALYs）、及Cost-benefit analysis （健康產出指標為錢）。

假設我們面臨到某個新科技要不要給付的問題 - 第一步不是去算預算衝擊。第一步是讓我們好好的認識它。它有甚麼臨床效益，證據力夠不夠，這好處是短期已經見到的，但是否能有足夠的證據及生物臨床上的邏輯連結，推斷出長期也能有好處？如果它真（可能）有相當的健康效果，值得我們去評估它的經濟價值，接下來就要認真的思考，它的alternative是甚麼，以我們比較熟悉的名詞來說，就是「參考品」、「在同樣的疾病狀況下現在給付甚麼」。

找出合適的參考品之後，我們應該要估算出本品與參考品（下圖原點的Ｃ）比較過後的incremental cost（ΔC）及incremental effectiveness（ΔE），如下面的cost-effectiveness plane 圖示。通常在第一象限的狀況，我們會想要計算出成本效果指標ICER （incremental cost-effectiveness ratio） - 因為會讓我們頭痛不知道該如何決定的，通常是所評估的新藥新科技，療效比較好但比較貴。

圖一、成本效益平面圖之圖示

健康經濟學者發揮本能，想要利用指標和標竿值，來幫助決策者去除頭痛的症狀。如圖示，如果ICER小於maximum acceptable ICER（或稱閾值threshold ICER），就可以說是具有成本效益。這樣一來，我們對這個新藥新科技的經濟價值就有個譜了。

鑒於有許多計算ICER的論文或報告，只急著報告一個ICER數字就下「具成本效益」的結論，會誤導讀者不去在意過程及其他資訊（如健康效果及預期總成本等），學界提出了經濟評估報告基準CHEERS[2]，希望大家均按照內容所提說明相關細節。所有從事評估研究、報告撰寫、品質評價的專業從事人員對CHEERS都應該很熟稔，這裡僅特別指出，CHEERS建議經濟評估的Results部分，均要報告以下四項，才能讓讀者充分確認結果：

1. Study parameters研究所用參數

2. Incremental costs and outcomes －說明每個方案之各大項成本平均數、預期健康效果、及比較之差異；有可能的話，報告ICER。 (“For each intervention, report mean values for the main categories of estimated costs and outcomes of interest, as well as mean differences between the comparator groups. If applicable, report incremental cost-effectiveness ratios.”)

下表是一個最基本的ICER table。這裡的相關資料對有經驗的人來說可以有很多的啟發(insight)，節省不得。（例如：之前的學習經驗讓我知道，一個新藥新技術要能達到折現30年後0.18 QALYs的健康效果，已經是很難得的。）

3. Characterizing uncertainty　－（以數字）描述各種不確定性。

4. Characterizing heterogeneity　－描述各種（不同病人間效果、成本及ICER的）異質性。

應用的時候

接下來，就跟大家隨意聊一聊我最近接收到的問題，及我的初步想法。歡迎大家給我您的意見。

1. 通常HTA機構都會要求評估報告內的健康結果incremental effectiveness要以QALY為單位。身為這領域耕耘多年的老鳥，我很同意這個方向。但目前在台灣要做能像NICE或韓國NECA、日本C2H的要求做到，還有蠻多「山丘」要跨過的。原因至少有下列兩項：

l 短期臨床指標要連結到QALY，通常要利用決策模式來推估。例如C肝口服新藥DAA的臨床試驗指標是SVR12。從SVR12要推算到QALY，有兩大關：存活情形的推估（survival），及疾病至死亡過程間的健康生活品質轉換（valuing）。首先從短期效果到長期存活情形，評估者必須對臨床過程的知識及數據能掌握，建立出合宜的決策分析模式；在健康生活品質轉換部分，我們健保的所有參與者，對每個疾病階段的健康生活品質權數（utility）要有共識，才能計算出我們健保下C肝新藥的預期臨床結果（QALY₁），並進而與參考品的預期臨床效果相比（QALY₀），計算出incremental effectiveness （QALY₁- QALY_{0 =}ΔE）。

l 上面所謂有共識的健康生活品質權數，就是要有台灣社會的Health-related quality of life weights（utility） - 因為我們要做的決策是以台灣灣的全民健保觀點出發的。像NICE就建議所有分析者用EQ5D英國的tariff算出的utility放進模式去計算QALY。Tariff是指預先對EQ5D建立好的權重組合（也稱為value sets），可用來將病人的健康狀態轉換為介於0~1之間的utility。權重組合代表人們對結果測量問卷所分類的各種健康狀態之偏好程度，又由於人們對各種健康狀態的偏好程度易受社會政經文化之影響，因此權重組合的地區或國家可轉換性（transferability）較低，故應盡量選用該決策情境的本國權重組合。台灣現在雖已有EQ5D的tariff，但還未見到如何在評估實務上連結。（以後如果有機會，我想再把這部份的困難另外碎念。）

2. 如果我們建立模式沒問題、資料沒問題，也有自己可以應用的EQ5D tariff可以放進模式。那是不是所有要評估的都來算個ICER好呢？概念上很吸引人，因為有「數字」可以直接比較。但是．．．

先請大家看看cost-effectiveness plane，如果我們評估的東西不在第一象限，計算出的ICER代表什麼意思？我上課時常常提醒學生，絕對不可以閉著眼睛直接跑模式就抄下ICER，每個數值的可信度及意義都應該仔細深究。例如，

l 負的ICER代表甚麼？如果模式跑出來一個負值，例如說 -300,000，這代表什麼？可能代表兩種完全不同的東西，一種是不用膝蓋想都應該納進保險（右下第四象限），一種是不用膝蓋想都不該納進保險（左上第二象限）。所以如果跑出來一個-300,000 /QALY，那是要排在哪裡？（一般來說，右下的所有地方我會報告成cost-saving；左上我都會報告成dominated；也就是說我認為這種時候數字沒有意義。）

l 那正的ICER呢？對，也有那種比較差但比較便宜的（左下第三象限）。但我們覺得該怎樣看待這種新科技呢？理論上我們可以同樣用那條線幫助我們，但對更多人來說，這個「正」跟我們原來討論的「正」，是完全兩種不同的「正」法。

l 順帶一提，也因為有這層考量，在發展cost-effectiveness結果不確定性（uncertainty）的呈現方法時，除了跑資料繪製100（或1000）個可能結果的成本及效果放在C-E plane上（如圖二），另一種可同時呈現與不同閾值的關係圖cost effectiveness acceptability curves （CEACs）（如圖三），是會把這些（怎樣的正、怎樣的負）都分開來考量的。

圖二、三種藥品（A, B, C）之ICER scatter plot 平面圖

圖三、三種藥品（A, B, C）之Cost-effectiveness acceptability curves (CEACs)

（圖二圖三感謝吳慧敏老師提供。）

此處再強調，現在分析成本效果，已經不能停留在只有一個ICER估計值（point estimate）了。因為在評估的時候，有證據的不確定性、政策採行或新科技採用的不確定性、有未來大環境的不確定性等等，呈現評估結果，都會要說明不確定性可能的大小。通常以C-E scatter plot或 CEACs來呈現。概念上我們已經走向，圖上這麼多的點，每個點都是未來一旦採行之後，可能出現的ICER；如果以某個ICER threshold來切，會有多少機率（一百個點裡面有幾個點）具成本效益。這樣一來，以上面的例子，我們要說A藥的ICER是多少才合理？

3. 最近有人問我，是不是可以把所有給付項目ICER拿出來排序。因為我不確定究竟是要來做甚麼，就隨意把我的想法拿出來聊一聊。首先要討論下去之前，我認為要先分成未給付項目及已給付項目的再評估。

未給付項目（新藥新科技）納入與否之決策

還沒有給付的項目，其比較品是現在正在給付使用的項目，我們看的是這項新科技進來比起原來的選項是否值得，所以想進行經濟評估。如前面所述，經濟評估有很多種，也有其特別的時機點，就是它在療效評估階段被認為是很有可能為民眾帶來長期健康效果的，我們可以來算ICER（這裡先不談健保是「核價」而非「接不接受建議價」，這點更複雜）。ICER該怎麼用呢？打個比方說，ICER像是一個大學考生的數學成績。一次考試成績像是ICER的base case estimate，也就是前面說的點估計值。現在大家都說要看平常成績了，還有很多其他輔助的資料可以說明這位考生的數學程度（uncertainty）。很多人說我們也要設threshold，就像是及格成績要求，這也可以。但是數學不及格就完全不可以收這位學生，還是我們得看看他其他學科的表現怎樣（value framework）？

已給付項目重新評估

就前面所提的經濟評估的理論，如果現在我們目的在於確認某項目是否仍值得健保給付，那麼其比較品理論上也應該是目前其他正在給付中的項目，而資料證據都應該是現在最新能掌握的。我認為不能把三十年前、二十年前的數學成績拿出來比，時空環境(context)完全不一樣。

另外怎樣找出有必要再重新評估的項目，必須有其依據，否則易被外界議論有針對特定項目或科別做檢討之嫌。有人提出可以依「成本效益」「ICER」作為篩選的依據，對此我是覺得實務上無法做到。如前提，要全面篩選找出成本效益比較糟者來進行評估，所以應該是要在一個短時間內（也許一到三年間？對有些領域三年都有可能太長吧？）把大部分項目一起重新進行經濟評估。我只能說非常有野心。

好，假設我們真能這樣做到一兩萬個項目。怎麼排序呢？用ICER點估計值嗎？還是一片ICER雲呢？

排了序就照名次來給付嗎？美國1990年代奧瑞岡州的大膽嘗試已經證明過這是一項非常「有趣」的試驗（當時大家發現，填補牙冠的排序在盲腸切除術之前，群情譁然，造成很多政治爭議[3]）。這部分有很多相關的文獻，我就不在此多說。而且還是再問一遍，就直接放棄value framework了嗎？不要考慮deliberative MCDA了？我們不願意像NICE一樣同時Scientific judgment + social value judgement的考量？

4. 所以我拒絕ICER嗎？

當然沒有，我跟它混了大半輩子，希望它被好好對待，給它適當的角色，給它對的評價。「經濟評估」在我的世界觀裡，它可以是一種正向積極的方法學，以新藥或新政策的給付決定來說：

l 在決策問題適當的訂定之後，對此新藥新科技做系統性文獻回顧、尋找合適的比較品，這樣做可以幫助決策者了解該疾病目前的照護現況為何。

l 確認新藥新科技是否具有短期的比較療效，及有證據可以合理預見的長期健康價值。

l 先以基本方案對建議價進行第一輪經濟評估，看看究竟現在面臨怎樣特性的產品－incremental QALY是大還小？ Incremental cost是多還少？ ICER數值看起來如何？ ICER過高是因為比較療效不大還是因為成本過高？不確定性如何？這種疾病狀況可以等嗎？

l 如果值得，就各種可能性再進行經濟評估。看看是否可以找到一些次族群、或是怎樣的成本、或流程，可以讓有療效價值的新科技，其成本效益落在合理可接受的ICER範圍內。

至於已給付項目的重新評估，所牽涉的層面較多，不是一兩段可以講完的，希望日後有機會整理我的想法給大家。在這裡僅就跟經濟評估有關之處稍作提醒：

l 不要利用文獻回顧古往今來的CEA文章來找出ICER，就學理上來說，並不符合經濟評估的基本要求，如同文章開頭之闡述。

l 就算是收集過去廠商送件資料的ICER也不符合學理。因為那是以前的情境 -「瑞凡，我已經回不去了。」就是這意思。

l 目前提到的都是一項科技的相關決策。健保已給付項目的檢討，可能要先從源頭，也就是從目前給付的狀況先瞭解起。哪些疾病類別有缺口？那些已經很久沒有重新檢視，政策目標、或是要增加平均餘命從哪些地方可以先開始等等。

l 若考量健保支出要更有效率，檢討原有項目，究竟應該從哪些項目檢討起，可以考慮一類藥的整體評估，而非一項一項藥品各以ICER評高下。

l 可以想見，這裡的評估也許很多不會在第一象限。這樣一來ICER的可用性有限。

l 但是經濟評估本身一定會有幫忙，不論如何，從頭檢視某項或某類科技目前的臨床定位及價值，這樣的過程及其成果，自然能夠協助相關決策的進行。此處強調的是，我們在此處應該會用到更廣的方法學及考量，只採用一個或兩個特定的指標，如ICER，可以想見實際操作及下決策時會碰到很多難題。

當然我並不確定原來的問題點在哪裡，只是就字面上我聽到的，以ICER的學理及目前在國際上的應用，跟大家進行交流。歡迎大家給我回饋。謝謝!

最後我想講這句話。

Let’s support ICER-informed decisions, rather not ICER-driven, nor ICER-dominated ones.

Reference:

1. Drummond, M.F.; Sculpher, M.J.; Claxton, K.; Stoddart, G.L.; Torrance, G.W. Methods for the Economic Evaluation of Health Care Programmes. 4th ed. Oxford : Oxford: Oxford University Press, 2015.

2. Husereau D, Drummond M, Petrou S, et al. Consolidated health economic evaluation reporting standards (CHEERS)—explanation and elaboration: a report of the ISPOR Health Economic Evaluations Publication Guidelines Good Reporting Practices Task Force. Value Health. 2013;16(2):231-250.

3. Neumann PJ, Sanders GD, Russell LB, et al. Cost-Effectiveness in Health and Medicine, 2nd ed, Oxford University Press, New York 2017.

小芳老師碎碎念

指引《Use of Real-World Data and Real-World Evidence to Support Drug Reimbursement Decision-Making in Asia》徵求意見

揭開ICER神秘的面紗【刊載於ISPOR 會訊】

著作人

Blog Archive

指引《Use of Real-World Data and Real-World Evidence to Support Drug Reimbursement Decision-Making in Asia》徵求意見

揭開ICER神秘的面紗 【刊載於ISPOR 會訊】

揭開ICER神秘的面紗【刊載於ISPOR 會訊】