建構模型其實不容易

【小芳老師碎碎念之二】

今天我大爆發了。

因為我又聽到有人問這種問題:「你以前跟我們合作的這個成本效果評估研究,我們想自己來更新寫篇paper,想說自己來學一下」,或是類似「我的老師之前跟你合作的那個研究,我們現在想自己來做,老師叫我來跟你要模型」
從我去年滿25歲的生日那天起,就發誓再也不會接受這種問題與要求。

拜託,決策模型的建構是一項專業。
真的,你真的學不會,如果你是準備來問個兩次的話。
而且,要更新一個模型,不是一個星期可以做到的。
還有,國內現在會自己建一個具發表水準的Markov model的人手指數得出來。

為什麼?

國內在做decision analytic modeling的報告,公領域私領域,大概有以下這幾種型態。

1. Global model, local adaptation (parameters only)
意思是,在地球上某個地方,有一個團隊做好了一個公版,然後給各個需要當地成本效果分析或其他數量預測的分析者來用。當然我們在台灣,正常狀況下不會想要以英國NHS的成本效果比值(ICER)來做我們的決策,所以在做成本推估及健康效果推估的時候,會想「要用台灣的參數」。

第一類,也是我所知道絕大多數現在台灣的狀況就是採用國外的structure,但參數值盡量用台灣的。最基本的就是成本,像是藥費、副作用處理費等等。通常進行的方式就是模型本人還在地球上那個角落,然後台灣這裡請專業人士找到(通常會用健保資料庫計算)合適的參數,再送回那個角落,由那裡的模型建構國寶人士來放進去他的模型裡,再做出我們常見的一些CEA結果(ICER table、敏感度分析)送回這裡。

我稱modeler為國寶不是沒有道理的,因為模型只有這個人有,要請他adaptation的全球排很長。然後台灣可能是或可能不是這個廠商重點市場…(其他請讀者自己去推演)

(還有一次我去找到了國內專家才能拿到的,最能反映國內病毒盛行狀況的數值上繳,結果這隊國寶沒有用。因為他們說要自己在網路上找到的他們才能相信)
所以我之前曾看過短短幾頁、表格簡單幾個聊表心意的這類報告。我其實懂,就是國寶難求。真的不能太過勉強。

2. Global model, local adaptation (structure also)

我之前在顧問公司時代,曾經與廠商合作拿到一個英國知名大學發展的模型。我的工作是要local adaptation。但是我看到它的模型裡,相關醫藥費用是分的很清楚的,從GPspecialist兩個level,如果我不看它的架構,只根據要求把台灣各個level的費用交給他們,其實根本就不能反映台灣的現實。所以我當時把我的觀察與此大學的模型發展者討論,(自己)將他原有的模型架構做了調整。

(講到這裡,不禁想碎念在同一時期,跟另一個知名大學合作的模型裡,幫它們找到了一個很難找到的錯誤。當時是因為跑出來的結果我看起來很離譜,反應到國外又苦等不到下文,於是上窮碧落下黃泉的一個一個excel cell好好檢查,終於被我找到了那個bug)

所以,我想讀者能理解,要做到第二類的人,必須要知道模型建構的原理及語言、要能理解原作者的邏輯,並能夠進而給建議,或除錯。

這種人多不多? 我猜數量有限。

3. 完全自建的模型(Modeling),簡單版
國內當然有自己可以建立模型的人。但我在這裡還是把自建模型者分成做簡單的模型和複雜模型的兩種。

Decision analytic modeling其實不一定要多複雜。話說回來,只要能抓老鼠就是好貓,decision tree也是模型、做出來像清明上河圖那麼長的也是模型。但是就「手藝」方面來說,只有幾個statesbranches的簡單版自然好入手。

我也聽過,其實是自己手藝不足,牽拖「modeling就是這樣的」。請讀者看到modeling的文章,還是去檢查一下模型的structure是否與生物知識與臨床情境相符,計算費用的方式是不是合宜。

之前我跟榮總團隊合作的失智症藥品的模型,自認是又精簡又對味的簡單版模型研究之一。 (Cost-effectiveness analysis of donepezil for mild to moderate Alzheimer's disease in Taiwan. http://onlinelibrary.wiley.com/doi/10.1002/gps.1842/full )

4. 完全自建的模型,臨床過程再現版

聽過我上課的學生應該都看過我在形容好的模型「是有靈魂的」。對我來說,模型研究只有這種才需要做(沒錯,我很偏激)。什麼是有靈魂的? 就像是作家對著自己的文字推敲再三,雕塑家對著自己的想法該用什麼素材苦思不已。這樣還是太抽象? 啊可惜這樣的美只有很少人看過 :)

我常用學生杏悠做的這個研究(Chow IH, Tang CH, You SL, Liao CH, Chu TY, Chen CJ, Chen CA, Pwu RF. Cost-effectiveness analysis of human papillomavirus DNA testing and Pap smear for cervical cancer screening in a publicly financed health-care system. Br J Cancer 2010;103:1773-82.) 來說明 。一開始杏悠對HPV及子宮頸癌的流行病學下了很多苦工去學習。我們不想用國外研究的同樣架構,因為國內有registry,理論上我們可以用台灣的資料建構這樣(Normal – HPV - LSIL – HSIL - cervical cancer)的疾病自然史,但是可惜我們上山下海並多方嘗試後還是只能跟國外用一樣的疾病架構 (Normal – HPV – CIN 1 – CIN 2/3 – persistent CIN 2/3 - cervical cancer)。接下來我們開始去跟臨床醫師討論不同的子宮頸癌篩檢結果將會用怎樣的臨床流程,費用在哪個階段產生、疾病進程、癌症死亡機率是怎樣等等。花心血了解真正的過程,把它轉換成模型的過程,很享受、很過癮。

這個模型是我們的驕傲,除了前面所講的,我們的模型裡把我們對子宮頸癌流行病學的理解、臨床處置的常規合適的放了進去。還因為裡面的programming有相當的難度。怎樣考量篩檢頻率的改變、怎麼控制年齡的限制等等,這真的不是一朝一夕可以做到的。

所以,我希望已經充分說明,以為模型很簡單,找一找參數放進Excel而已、或是跟我們拿模型去就可以自己玩出一篇paper的說法,請不要在我面前出現。讓稀有動物,或是國寶暴走,真的是對大家都不好。

如果真對某團隊的模型有興趣,請你誠心地找人家談合作。這不是科學研究的基本態度嗎?



沒有留言:

張貼留言