GRADE システム

grade-symbol
Last update: 2008. Nov
GRADE: Grading of Recommendations Assessment, Development and Evaluation

■ エビデンスの質の評価 (quality assessment): 

”エビデンスの質”の定義は、”ある推定効果や関連性などについてどの程度確信をおけるか”を示すもので、最終的に4段階評価とする。下表は、GRADEシステムの一部であるが、単純なスコアリングにこだわらないよう留意すべきであり、オリジナルの論文をよく参照していただきたい。また、GRADEガイドライン作成手順を参照。

■ 研究デザインの評価

ランダム比較試験(RCT)
観察研究
その他(症例シリーズ研究や症例報告) 非常に低

研究デザインによる評価は、RCT= "High", 観察研究="low", その他の研究="very low"の3種類で、この時点では当然ながら、”moderate"はない。

・"診断"に関する研究のエビデンスの質評価にも本分類は適用でき、それは当該診断法の介入が患者アウトカム評価につながる場合であり、GRADE Working Groupから近々論文(5シリーズ)が発表される予定である。

・"非常に低"のものは原則としてグレードを上げない。なんらかの限界がある観察研究も同じくグレードを上げることはない。

■ グレードを下げる5要因(ランダム化比較試験、良質な観察研究)

(1)研究の限界(limitation):研究の深刻な(-1)、あるいは非常に深刻な(-2)限界: ランダム化比較試験、観察研究において、計画の計画や実行の質としての限界で、コクランレビューでのrisk of biasとほぼ同様である。割付の隠蔽、ブラインド化、フォローアップの脱落、ITTを遵守しない(RCT)、試験の早期終了(利益を理由とした)など。複数の限界の存在は、”非常に深刻”と考えられる。

(2)結果の非一貫性(inconsistency):効果の方向の違いや効果推定値が類似していないということである。結果の方向(利益・害)、差の程度、統計学的有意差(メタアナリシスの異質性検定)を考慮する。矛盾がなければサブ解析での効果の大きさを推定すべきである。(-1)

(3)エビデンスが非直接的(indirectness): 若干の(-1)あるいは重大な(-2)不確実性がある場合とは、研究の試験参加者、介入、アウトカム指標が、診療ガイドラインや他の医療の推奨などを適用する状況にどれだけ類似しているかである。例えば、対象患者の年齢や重症度が参加者よりも高いとか、他の合併症がある場合、あるいは代理アウトカム使用など、では直接性は低くなる。

(4)不精確(imprecise)なデータ:不精確とは、例えば標本サイズが小さい研究では、信頼区間が広く、害と利益の双方に可能性が及んでいる場合で、研究が1件しかないときも質の低下になる。

(5)出版バイアスが存在する可能性が高い: (-1)報告バイアスには、出版バイアスなどの多くの種類がある。

■ グレードを上げる3要因

(1)関連性(association)の強さ

(2)全てのありそうな交絡因子が効果を減少させる方向に働いたと思われる。 (+1)

(3)用量反応勾配のエビデンス :例、ワーファリン治療例でINR値が高くなるほど、出血が多くなることが観察研究により、高い確信となっている。 (+1)


■ 最終判定: 各アウトカムに対しての全体的エビデンスの質 (overall quality of evidence for each outcome)

アウトカムは、1〜9ポイントスケールで、3カテゴリーに分類し(critical, important but not critical, not important)。、重要以上のアウトカム数の選出として、7個までを推奨している。
・上記のグレードを下げる/上げる要因の評価は累積的で、評価にはGRADEprofiler使用が効率的である:
例)ランダム化比較試験で、深刻な限界(-2)、かつ直接性に問題がある場合(-1)、エビデンスの質の等級は、”高”から、”低”にまで低下することになる。
・あるグループ(UpToDate, ACCPなど)は、「low」と、「very low」を一緒にして、最終判定としての”質”のカテゴリー分類は、「高」、「中」、「低」の3分類として表示している。これは、GRADEシステムのオリジナルとは異なる。

・注)システマテイックレビューと違って、ガイドラインパネルは、意思決定にとって本質的な、あらゆる重大な(critical)アウトカムにわたっての、”全体的なエビデンスの質”を決定する必要がある。
“全てのアウトカム”にわたる、“全体的なエビデンスの質”を決定する際の原則は、
(1)”重大なアウトカム”についてのみ検討する。
(2)もし、複数の”重大なアウトカム”にわたってエビデンスの質が異なる場合;
  ・アウトカムが異なった方向なら(利益と害の両方向)、”最低のエビデンスの質”を採用する。
  ・全てのアウトカムが同じ方向ならば(利益、あるいは害)、”最高のエビデンスの質”を採用する。

ランダム比較試験(RCTs) A *
グレードダウンの"ランダム化比較試験"or "グレードアップの観察研究" B *
観察研究("対照のあるよくデザインされたコホート研究など) C *
その他(症例シリーズ研究や症例報告) 非常に低 D *

*GRADEでは、特に上記のいずれを使用することを規制しているものではないが、文字や番号にこだわるならば、エビデンスの質の判定表示には文字を、推奨度には番号を使用するよう薦めている。(例: 「高」のエビデンスに基づく「強い推奨」は、grade 1A、「低」のエビデンスに基づく「弱い推奨」は、grade 2C)

GRADEの日本語論文(Aihara M, Guyatt G,Falck-Ytter Y, et al.)  The Informed Prescriber 2007 GRADE System: Going from evidence to recommendations). or  Therapeutic Res 2007GRADE System and SoF: Going from evidence to recommendations-II.

*GRADEシステムでは、エビデンス・プロファイルとしてまとめるが、Quality of assessment、およびSummary of fidings(SoF)によって構成されており、コクランのRevMan5とのデータのやりとりが可能となっている。RevMan5の使用例。|

■ 推奨度  

推奨の強さ(推奨度)とは、”ある推奨下で、利益がdownsidesと比べて上回る(あるいは逆)ことに、どの程度確信できるか”を示すものである。

・推奨度には、エビデンスの質の他に、利益とdownsidesバランス、コスト、価値観の4要素を考慮。  

・医師、患者、他の利害関係者など;推奨を ”命令”のようにとられてはいけない。

・推奨の決定としては、推奨度は2種類(強弱)で、方向性も2種(positive、negative)、すなわち、2x2で4種類である。

・ガイドラインでは推奨度の策定は、全メンバーの合意が必要であり、この際に、明示的、効率的な手法で合意を得るようにしている(コンセンサス: GRADE Grid)。


"recommend for" OR "recommend against" 1 **
"suggest" OR "suggest not doing" 2 **

**GRADEでは、特に上記のいずれを使用することを規制しているものではないが、文字や番号にこだわるならば、エビデンスの質の判定表示には文字を、推奨度には番号を使用するよう薦めている。

 Ref.

注 GRADEシステムについては、常に最新の情報を参考とするようにしてほしい。

Valid HTML 4.01 Transitional