2015年8月7日 星期五

The 9-item Shared Decision Making Questionnaire (SDM-Q-9). Development and psychometric properties in a primary care sample (閱讀)

閱讀材料:The 9-item Shared Decision Making Questionnaire (SDM-Q-9). Development and psychometric properties in a primary care sample
論文作者: Levente Kristion, Isabelle Scoll, Lars Holzel, Daniela Simon, Andreas Loh, Martin Harter (2010)


前言 introduction (I)
A. 為何需要從事此研究
在2006年Simon等學者發展出11題的Shared Decision Making Questionnaire (SDM-Q)來評量醫病的共同決策過程,然而此工具仍有不足之處:
1.以item response theory建構,但結果不符合Rasch model。
2.只能測量到共同決策九步驟中的5個步驟。
3.具有天花板效應。
4.在不同類別診斷之間,某些題目會顯示明顯的反應差異。

   共同決策九步驟如下:
   步驟1:展示做決策的需求
   步驟2:形成對等的同伴關係
   步驟3:呈現治療觀點
   步驟4:告知有利及有風險的訊息
   步驟5:確認個案的了解程度與期待
   步驟6:確認彼此的偏好
   步驟7:協商彼此的想法
   步驟8:達成共同決策
   步驟9:安排後續追蹤

B. 研究目的  
改良Shared Decision Making Questionnaire (SDM-Q),再驗證其工具的心理計量特性(包含:face validity, acceptance, discrimination, difficulties, internal consistency)。

方法 method (M)
A.工具修訂
1.改變測驗理論:測驗不符合Rasch model,因而改用classical test theory。
2.改善測驗建構:原測驗無法測得所有共同決策步驟,因此重新建構26題包含所有決策步驟的題庫。
3.改善天花板效應:由原先的四分量尺再添加兩個極端選項,如:完全同意及完全不同意。
4.變更次團體分析方式:原以Rasch analysis中的differential item functioning偵測到不同類別診斷在某些題目會有明顯的反應差異,今改以人口學及疾病種類為變項分析各次團體間的心理計量特性。

(作者並沒有特別說明此部份的變更原因,而我自行補腦的結果是--原測驗是以Rasch model建構,因此採用Rasch analysis進行分析,但是本研究改用classical test theory,因此不用Rasch analysis中的differential item functioning進行次團體分析。
而為什麼一定要進行次團體分析呢?這個部份作者也沒有特別說明,而我自行補腦的結果是--原測驗某些題目在不同類別診斷間有明顯的反應差異。而如果作者期望發展出的工具是可以適用於廣泛的醫病大眾,則作者會希望不同診斷間不會再有明顯的反應差異,因此需要持續監測此結果!)

B. 取樣

在德國某鄉村的醫療保險資料庫中取得6542筆個案資料,並將8頁的研究問卷依據資料寄送到府,請有意願者填妥資料後寄回。並將回收的資料隨機分成發展樣本與驗證樣本。

C. 程序與統計分析
前置作業程序
1.由3位從事多年共同決策議題的學者,依照共同決策9個步驟擴充問卷題庫,共26題。
2.由2位沒有參與題庫發展的學者,依照題目是否有測到預測量特質給予評分,如:optimal, fair, poor。
3.將建構好的研究問卷寄出,並等待問卷回收。

測驗發展程序
1.在發展樣本中計算SDM-Q(26題)每題項的face validity, acceptance, discrimination (corrected item-total correlation), difficulty (mean for each item)。
2.依據face validity, acceptance, discrimination, difficulty的結果做為題目篩選的標準,選出最具代表性的9個共同決策步驟之題目。
3.確認The 9-item Shared Decision Making Questionnaire (SDM-Q-9)的題目組成。

測驗驗證程序
1.在驗證樣本中計算SDM-Q-9組成題目的項目acceptance、discrimination、difficulty,以及internal consistency。

結果 results (R)
A.    樣本描述
總共寄出6542份問卷,回收2450份,2351份進入資料分析。其中將樣本隨機分成發展樣
本與工具驗證樣本,有1188份屬發展樣本,1163份屬驗證樣本。且兩組樣本之間的人口學特性並未有明顯差異。

B.     各研究目的所得之數據 
測驗發展結果
1.Face validity:有10題的表面效度為optimal,9題為fair,7題為poor。
2.Acceptance:接受度在78%-93%之間。
3.Discrimination:每題的corrected item-total correlation數據皆在0.70-0.89之間。
4.Difficulty:每題得分平均皆在2.6-4.1之間。

測驗驗證結果
1.Acceptance:每題作答率皆在8成以上。
2.Discrimination:每題的corrected item-total correlation數據皆在0.68-0.82之間。
3.Difficulty:每題得分平均在3.1-3.7之間。
4.Internal consistency: Cronbach’s α 值為 0.938

次團體分析
疾病類別共分成6類:肌肉骨骼疾患、心血管疾病、內分泌疾病、腸胃疾病、感染相關疾病、神經疾病。
1.Discrimination:各組數據皆在0.519-0.855之間。其中內分泌組涵蓋最低的數據(0.519-0.825),而神經組涵蓋最高的數據(0.621-0.855)
2.Difficulty:各組數據皆在2.32-4.11之間。其中神經組涵蓋最低的數據(2.32-3.47),而內分泌組涵蓋最高的數據(3.48-4.11),且各組數值差異不大。
3.Internal consistency:各組的數據皆在0.91以上。其中感染組為0.91屬最低,腸胃組為0.94屬最高。

(作者針對次團體分析的結果並沒有詳細的說明,而是以Table方式呈現結果。而我原先的假設是--作者希望不同診斷間不會有不同的答題反應,因此進行次團體分析。但是此部分的結果無法呈現不同疾病在不同題項間的答題反應!
而且我覺得已經執行次團體分析,那應該要呈現各組數據間是否有顯著差異,但此部分作者也沒有呈現!
最後,我覺得如果作者能以Picture方式呈現不同疾病在不同題項上的Difficulty數據,應該會比較理想!)

C.  本研究所發展之評估工具 
SDM-Q-9的核心組成為9題的描述句,並搭配六分量尺的選項,如:完全不同意(0分)到完全同意(5分)。原始總分為0-45分。當漏答3題以上,則不建議計算總分;而漏答2題以下,則遺漏值可用項目平均替代。原始分數可經由線性轉換成0-100的分數,且作者建議在解釋共同決策程度時可使用此轉換分數!!此問卷以兩題開放式問題開始,如:討論的問題是什麼?最後達成的決策是什麼?此兩題主要用來收集決策相關的背景訊息。


討論 discussion (D)
A. 彙整主要研究發現
本研究改良第一版SDM-Q,且發展出9題的SDM-Q-9。SDM-Q-9具良好表現效度、良好題目接受度(作答率超過8成)、良好項目區辨度(corrected item-total correlation數據皆在0.68-0.82之間)、良好內部一致性(Cronbach’s α of 0.938)。

B. 研究結果之重要性
藉由多步驟的研究程序可以解決第一版SDM-Q所遺留的問題。
1.SDM-Q以item response theory 建構,但不符合Rasch model → 改用classical test theory → SDM-Q-9符合此模式。
2.SDM-Q只能測量到共同決策的其中5個步驟 → 重新發展施測題庫 →SDM-Q-9的題目涵蓋所有共同決策九步驟。
3.四分量尺的SDM-Q具天花板性應 → 增加2個極端選項 → SDM-Q-9無天花板效應。

(起初作者以改善4個第一版SDM-Q所遺留下的問題為己任,但是最後只處理了3個問題!而SDM-Q-9的某些題目在不同類別診斷間是否會有明顯的反應差異?此問題目前仍然無解!!)


C. 研究限制及原因
1.本研究結果概化至其他群體能力有限:
 a.大多數樣本年齡均在60歲以上。
 b.樣本都是鄉村居民。

     2.決策內容多元:
      a.受試者的醫療診斷較多元,且需決策的內容具異質性。 (作者本身沒有清楚闡述。)


自問自答:
a. How to describe the item response theory and classical test theory?
 Classical Test Theory: Analyse the test as a whole rather than on the item. Test only apply to those students taking that test.
    古典理論著重在分析測驗的本身而非項目,且受試者有針對性,無法適用於其他族群。
Latent Trait Model: Latent trait models aim to look beyond that at the underlying traits which are producing the test performance. They are measured at item level and provide sample-free measurement.
    現代測驗理論著重於分析測驗的項目,且致力於發展不受群體限制的評估工具。

b. What is the principal components analysis?
 主成分分析(principal components analysisPCA)又稱:主分量分析,主成分回歸分析法。旨在利用降維的思想,把多指標轉化為少數幾個綜合指標
 在實證問題研究中,為了全面、系統地分析問題,我們必須考慮眾多影響因素。這些涉及的因素一般稱為指標,在多元統計分析中也稱為變數。因為每個變數都在不同程度上反映了所研究問題的某些信息,並且指標之間彼此有一定的相關性,因而所得的統計數據反映的信息在一定程度上有重疊。在用統計方法研究多變數問題時,變數太多會增加計算量和增加分析問題的複雜性,人們希望在進行定量分析的過程中,涉及的變數較少,得到的信息量較多。主成分分析正是適應這一要求產生的,是解決這類題的理想工具


閱讀心得:
本篇論文的論點明確,文章架構完整,且研究程序與邏輯交代清晰,因此閱讀起來不會很吃力,唯一的不足之處是我個人對於item response theoryclassical test theory還不熟悉,因此無法自行判斷:將原版測驗的理論架構由IRT換成CTT有什麼好處?而且我也還不熟悉principal components analysis,因此會好奇如何運用主成分分析。而閱讀完本篇論文,我又多認識三個概念了!!

參考文獻
1. Andrew Ainsworth. Introduction to Item Response Theory. PPT from the internet
2.主成分分析。
http://wiki.mbalib.com/zh-tw/%E4%B8%BB%E6%88%90%E5%88%86%E5%88%86%E6%9E%90%E6%B3%95


6 則留言:

  1. 應改用中文(母語表達)
    以確保你瞭解
    我之前漏了提醒

    回覆刪除
  2. 好之~我之後再補上中文說明!!

    回覆刪除
  3. 盡量避免翻譯,而是用自己的話講出來,
    也就是了解概念/重點之後,就不要看原文

    回覆刪除
  4. 無需中英文並列
    中文即可
    但目前中文的【可讀性】不高,如【市面上沒有完整以理論為驅動的評估工具來評估病人觀點的共同決策過程】,
    若改成【目前的SDM評估工具,並未以明確理論為依據且以病人之觀點評估SDM過程】可讀性是否較高,且符合原意!?

    回覆刪除
  5. 此文最重要的結果是最後發展出來的工具,但我沒有看到明確工具名稱與內容介紹。
    這應是最重要的重點,宜補充之。

    你可能被資料分析方法給迷惑了,那非首要重點 !!

    回覆刪除