รีวิวการศึกษา LEADER
ไม่รู้ไม่ได้ ไม่อ่านคือเอ้าท์ ... ถ้าอจ. 1412 อยู่คงเกรินนำแบบนี้ชัวร์ๆ
อจ. 1412 กับ อจ. Rapp ฝากฝังให้พี่ช่วยรีวิวการศึกษา LEADER ที่เพิ่งตีพิมพ์ใน NEJM เมื่อคืนนี้ยังไม่ถึง 24 ชั่วโมงเลย ช่วงนี้อจ. 1412 ขอลาพัก ส่วนน้อง Chaisiri ก็อยู่ในช่วงบำเพ็ญเพียรฝึกวิชาอยู่ในถ้ำ ดังนั้นน้องๆก็จะเห็นพี่กับอาจารย์ Jarvis บ่อยหน่อย เอาให้เบื่อขี้หน้ากันไปข้างนึงเลย
แทนที่จะรีวิว พี่ว่าเรามาอ่านเปเปอร์นี้ไปด้วยกันเลยดีมั๊ยครับ ด้วยเทคนิคที่พี่เคยแนะนำน้องๆแพทย์ประจำบ้านชั้นปีที่ 1 ในโพส์ก่อนหน้านี้ อยากลองดูมั๊ยครับ ลองมาอ่านวารสารแบบเดียวกับที่พี่ๆแอดมินเพจนี้อ่านกัน ว่าจะเป็นยังไง ตื่นเต้นและสนุกสนานขนาดไหนhttps://www.facebook.com/371793389694429/photos/pb.371793389694429.-2207520000.1465229381./525677197639380/?type=3
ถ้าฝึกฝนจนชำนาญใช้เวลาไม่ถึง 10 นาที ยืนรอรถไฟฟ้าก็อ่านจบแล้ว แต่โพสท์นี้จำเป็นต้องยาวเพราะพี่จะเขียนขยายความขั้นตอนการอ่านแต่ละขั้นให้น้องๆดูอย่างละเอียด พี่ 1412 กำชับมาว่า เอาให้อนุบาลที่สุด น้องๆจะได้ตามทัน
โอเคมาเริ่มกันเลยครับ ก่อนอื่นน้องๆโหลด full paper กันก่อนนะครับ
จากนั้นเปิดการศึกษา LEADER ไว้บน iPad หรือ คอมพิวเตอร์ ก็ได้ แล้วเอามือถือเปิดเพจนั่งอ่านไปด้วยกันกับพี่
... จบ แค่ 2 นาที น้องก็จะได้ข้อมูลหลักๆเกือบทั้งหมดของ LEADER คำถามต่อมาที่ต้องใช้อีก 8 นาที คือ เชื่อมั๊ย? นั่นก็คือการประเมินความน่าเชื่อถือทั้งภายนอกและภายในของการศึกษา หรือ critical appraisal นั่นเอง
ขั้นต่อไป ให้น้องๆอ่านส่วนของ Method อย่างละเอียด ต่อด้วยการดึงตารางหลักของ manuscript ออกมากาง และใช้ตารางนี้เชื่อมโยงไปยังข้อมูลที่เหลือทั้งหมดของเปเปอร์ เรามาเริ่มกันเลย
... น้องๆจะเห็นว่าส่วนของ method เป็นส่วนสำคัญที่สุดของการศึกษาเลยก็ว่าได้ หลังจากใช้เวลาอ่านไป 3 นาที เราก็จะเห็นภาพโครงร่างของการศึกษาชิ้นนี้ทั้งหมด ก่อนจะทะลวงเข้าไป appraise การศึกษานี้ในอีก 5 นาทีที่เหลือ
1. Internal validity
→ blind สองข้าง concealed และสุ่ม 1:1 แบบแบ่งชั้นตาม eGFR ที่สำคัญใช้ intention-to-treat analysis ในการวิเคราะห์หลัก ตรงนี้น่าจะลด allocation bias ไปได้มากพอสมควร สำหรับ ascertainment bias ก็น่าจะไม่มากนักนะครับ เนื่องจากรูปแบบการฉีดยาเหมือนกันทั้งสองกลุ่ม และ ข้อมูลถูกส่งเข้ามาวิเคราะห์โดยคณะกรรมการแยกอีกกลุ่มนึง
→ เนื่องจากเป็น intention-to-treat สิ่งที่เราต้องรู้คือ drop out และ adherence ให้น้องมองหาข้อมูลนี้ในส่วนของต้นของ result จะเห็นว่า adherence rate เฉลี่ยตลอดการศึกษาพอๆกันทั้งสองกลุ่มอยู่ที่ 83 - 84% ซึ่งถือว่าน้อยนะครับ ดังนั้นผลการศึกษาในตาราง ความน่าเชื่อถือจะลดลงไป แต่เหมือนทีมผู้วิจัยจะคาดการณ์ตรงนี้เอาไว้แล้ว จึงเตรียมทำ per-protocol analysis เอาไว้ด้วย ซึ่งผลก็ออกมาด้วย magniude ที่ใกล้เคียงและไปในทิศทางเดียวกันกับ intention-to-treat รวมถึงได้นัยสำคัญทางสถิติ ทำให้เพิ่มความน่าเชื่อถือขึ้นมาได้อีกระดับนึง น้องๆต้องระวังการแปลผล NI trial ในเปเปอร์ที่มีแต่ intention-to-treat ดีๆนะครับ
→ การศึกษานี้ยังทำการวิเคราะห์ในรูปแบบที่แตกต่างออกไปหลายๆวิธี เพื่อแสดงให้เห็น robustness และ generalizibility ของผลการศึกษาที่ได้จาก primary analysis หรือที่เรียกว่า "sensitivity analysis" ที่พี่เคยอธิบายไปอาทิตย์ก่อนนั่นเอง ให้น้องๆเปิดดูในรูปสุดท้ายของโพสท์นี้ จะเห็นว่าทีมผู้วิจัยทำ การวิเคราะห์อีก 7 รูปแบบ
Δ per-protocol นับ event เฉพาะตอนที่ได้รับยาจริงๆเท่านั้นอนุโลมให้ได้ 120 วันหลังหยุดยาด้วยเหตุผลอะไรก็แล้วแต่ ถ้ามี event เกิดก็ให้นับได้
Δ on treatment นับ event เฉพาะตอนที่ได้รับยาจริงๆเท่านั้น คล้ายๆ per-protocol แต่จะเข้มงวดกว่า คือถ้าเกิด event ตอนที่ไม่ได้กินยา ไม่นับเลย ไม่มีอนุโลม
Δ on treatment + 30 days อันนี้เข้มงวดน้อยลงมาหน่อย อนุโลมให้นับ event ได้ถ้าเกิดหลังหยุดยาไม่เกิน 30 วัน
Δ excluding events after visit 15 สำหรับข้อนี้ จะไม่นับ event หลังหยุดให้ยาจนถึง follow-up หลังจากนั้นอีกหนึ่งครั้ง
Δ adjusted for additional covariates ใช้วิธีทางสถิติเพื่อปรับ confounder ก่อนทำการวิเคราะห์
Δ adjusted for random country effect ปรับตามประเทศที่ร่วมวิจัย
Δ stratified for severe renal impairment วิเคราะห์ผลแบบ primary analysis แต่แยกตามชั้นที่แบ่ง eGFR เอาไว้แต่แรก อันนี้จะเป็นคนละอย่างกับ subgroup analysis นะครับ ผลออกมาเป็นดังนี้
eGFR ≥ 60 ... HR 0.83 - 1.07
eGFR 30 -59 ... HR 0.54 - 0.83 (sig)
eGFR <30 ... HR 0.51 - 0.54 (sig)
eGFR 30 -59 ... HR 0.54 - 0.83 (sig)
eGFR <30 ... HR 0.51 - 0.54 (sig)
จะเห็นว่า eGFR < 60 มีนัยสำคัญทางสถิต บอกได้เลย ไม่ต้องใช้คำว่ามีแนวโน้มเหมือนเวลาเราอธิบาย subgroup analysis
ทั้ง 7 sensitivity analysis ให้ผลออกมาทางเดียวกันกับ primary analysis คือ primary outcome ลดลง บอกถึงความคงที่ของผลการศึกษา ยืนยันความเป็น noninferiority ไม่ว่าจะปรับแต่งปัจจัยอย่างไรก็ตาม (on treatment, censoring data และ confounder)
→ ลำดับต่อมา น้องๆอย่าเพิ่งอ่านตัวเลข Hazard ratio นะครับ ใจเย็นๆก่อน ให้น้องๆดูที่รายชื่อ outcome ทั้งหมดของ ทั้ง 1°, 2°, 3° และ safety outcome เป็น pre-specified ทั้งหมด? จะเห็นว่าการศึกษานี้เป็น pre-specified ทั้งหมดนะครับ จากนั้นดูว่าเป็น reflective outcome? reflective outcome หมายความว่าเป็น outcome ที่ proven benefit ใน control มาก่อน และเป็น outcome ที่บ่งชี้ถึง clinical benefit จริงๆในผู้ป่วย ในการศึกษานี้กลุ่มควบคุมเป็น standard regimen ซึ่งไม่มากก็น้อยยาเหล่านี้เคยมีการพิสูจน์ benefit ใน outcome ของ LEADER มาก่อนจริง ดังนั้นน้ำหนักความน่าเชื่อถือในส่วนของ outcome ถือว่าผ่าน
→ ดู minimal และ mean/median follow up time ว่าสั้นเกินกว่าที่จะเห็นความแตกต่างของ outcome ทุกตัวที่เราประเมินไว้ข้างต้นหรือไม่? การศึกษานี้ เซต minimum ไว้ที่ 42 เดือน สูงสุด 60 เดือน เฉลี่ยจริงๆออกมาที่ 3.8 ปี หรือ 45 เดือน ซึ่งถือว่าน่าพอใจมาก และเพียงพอที่จะเห็น primary และ secondary outcome event เมื่อเทียบกับ ความเสี่ยงของประชากรใน LEADER ที่ค่อนข้างสูง
→ หลังจากนั้นให้มองไปที่ event rate ของ primary outcome ในกลุ่มควบคุมก่อนเลยครับ ว่าน้อยกว่าค่าที่ใช้ในการคำนวณ sample size หรือไม่? น้องจะเห็นว่าในตารางไม่ได้บอกมาตรงๆ บอกเป็น event rate รวม และ no. of event per 100 patient-year ซึ่งไม่เหมือนกับ annual rate ทีเดียว ที่ใช้ตัวเลข 1.8% ในการคำนวณ N ตรงนี้อาจจะมีนัยยะซ่อนเร้น ถ้าให้ประเมินคร่าวๆ (แต่จริงๆไม่ใช่ตัวเดียวกันนะครับ) ในกลุ่มควบคุมมี primary outcome event อยู่ที่ 3.9 per 100 patient-year ซึ่งเกิน 1.8% มาพอสมควร ดังนั้นการศึกษานี้ ไม่น่าที่จะ underpower และ ไม่มีผลกระทบต่อ NI margin ที่ตั้งไว้มากนัก แต่เค้าเลือก RR margin กันไว้ชั้นนึงอยู่แล้ว
... น้องๆจะเห็นว่า กว่าพี่จะไปอ่านตัวเลข Hazard ratio ที่น้องๆส่วนใหญ่มักจะอ่านเป็นอย่างแรก เราต้องคิดกันก่อนหลายชั้นมากเพราะทั้งหมดนี้คือกุญแจที่ซ่อนความน่าเชื่อถือของตัวเลขเหล่านั้นเอาไว้ทั้งหมด
→ มาถึงตัวเลขกันแล้ว อย่าเพิ่งดู Hazard Ratio ให้ดูที่ crude event rate ก่อน 1° outcome ออกมาที่ 13 กับ 14.9% ต่างกัน 1.9 % ตลอด follow up time เฉลี่ย 3.8 ปี นี่คือ composite ของสาม outcome นะครับ ส่วนกลับของ AR คือ NNT ออกมาเป็น 66 สำหรับการลดหนึ่ง event ใน 3 ปี แต่ถ้าแยกเฉพาะอัตราตายที่เป็น 2° outcome NNT จะออกมามากถึง 98 คนในการป้องกันการตาย 1 ครั้ง และนี่คือส่วนที่เราใช้ในการประเมิน clinical significance ส่วนนี้สำคัญมากนะครับ เพราะมันคือค่าดิบที่ออกมาจริงๆ บางการศึกษาไม่มีนัยสำคัญทางสถิติ แต่อาจเกิดจากข้อผิดพลาดทางด้านเทคนิคภายในก็ได้ แต่ crude event rate เป็นสิ่งที่เกิดขึ้นจริง
→ ลำดับต่อไปคือ statistical significance ในการจะบอกว่า outcome ที่ลดลงนี้มีนัยสำคัญทางสถิติหรือไม่ น้องต้องไปดูวิธีทางสถิติที่ใช้ในการประเมิน survival curve ของการศึกษานี้ นั่นก็คือ HR จาก Cox proportional Hazards model ค่าที่ได้ออกมา p < 0.001 for NI และ p = 0.01 for superiority ซึ่งไปในทิศทางเดียวกับ sensitivity analysis ทั้ง 7 ข้อข้างต้น 2° outcome ที่ลดลงอย่างมีนัยสำคัญ คือ all-cause และ CV death รวมถึง microvascular event (renal + retinal) ซึ่งแยกดูรายตัวพบว่าเป็นผลมาจากการลด nephropathy เป็นหลัก outcome ตัวอื่นๆไม่มีนัยสำคัญทางสถิติ ซึ่งรวมถึง hospitalization for heart failure ด้วย แต่ event rate น้อยกว่าในกลุ่มที่ได้ liraglutide เพียงแต่ไม่มีนัยสำคัญทางสถิติ ประเด็นเรื่อง heart failure ได้รับความสนใจมากขึ้น หรือ มีความกังวลมากขึ้นในระยะหลังๆกับยาเบาหวานกลุ่มใหม่ๆ
→ หันมาดูกราฟหลักของ manuscript น้องๆจะเห็น survival curve ที่เป็น cumulative incidence กับแกนเวลาวางตัวอยู่ด้านนอก ซึ่งใช้ Kaplan-Meier method ในการ plot กับอีกอันที่ซ้อนอยู่ด้านในคือ cumulative Hazard ratio ที่หาค่าเฉลี่ย HR จากแต่ละ interval ของ survival curve ด้วยวิธีง่ายๆแบบ non-parametric ที่เราได้ยินชื่อกันบ่อยๆก็คือ Cox Proportion Hazard เพื่อบอกความแตกต่างทางสถิติ นอกจากนั้นกราฟจะทำให้น้องเห็นภาพรวมมากขึ้นเช่น outcome diverge ที่เวลาเท่าไหร่ อาจจะช่วย postulate กลไกของยาในการลด outcome นั้นๆ อย่าง LEADER จะเห็นว่า diverge ออกช้ากว่า EMPA-REG พอสมควร ลด CV outcome ได้เหมือนกันแต่กลไกอาจจะต่างกัน เทคนิคอีกอย่างเวลาที่ survival curve มันเกยกันหรือไม่ไปในทางเดียวกันตลอด ให้น้องมองหา minimal follow up time ในแกนเวลา ลากเส้นขึ้นไปในแนวดิ่ง survival curve ส่วนที่อยู่ด้านซ้ายมือจะเชื่อถือได้มากกว่าด้านขวามือ
→ มาถึง subgroup analysis อย่างแรกน้องต้องดูว่าเป็น subgroup analysis ของอะไร ใน LEADER ทำครั้งเดียวใน primary outcome เท่านั้นนะครับ เวลาอ่าน subgroup น้องอยากรู้ว่าถ้าแยกกลุ่มย่อย แต่ละกลุ่มจะไปในทางเดียวกับ overall result หรือไม่ วิธีดู ให้น้องกวาดตามอง interaction p value ในคอลัมน์ด้านขวามือ ถ้าตัวเลขออกมาไม่ sig แปลว่ใน subgroup นั้นๆมีทิศทางเดียวกันกับ overall result แต่ถ้า sig อย่างใน LEADER จะ sig ที่สองกลุ่มคือ eGFR ที่เกิน 60 กับ กลุ่มที่ไม่มี CV diseae at baseline ซึ่งมีแนวโน้มว่าจะไม่ได้ประโยชน์
→ อ่านข้อมูลของ safety profile ส่วนของ safety outcome หลักๆไม่ต่างกัน ที่น่าสนใจคือ sever hypoglycemia เกิดน้อยกว่าในกลุ่มที่ใช้ liraglutide อาจเป็นเพราะกลุ่มนี้ใช้ hypoglycemic agents และ insulin น้อยกว่ากลุ่มควบคุม ในระหว่างการศึกษา แต่กลุ่มที่ใช้ liraglutide ออกจากการศึกษามากกว่ากลุ่มควบคุม ด้วยสาเหตุของ GI symptom ที่ไม่ใช่ pancreatic disease
2. External validity
ส่วนนี้ตรงไปตรงมาสำหรับ LEADER การอิงข้อมูลทั้งหมดภายในการศึกษานี้ออกสู่โลกภายนอก ไม่ใช่ปัญหาสำหรับการศึกษานี้ เพียงแต่กลุ่มประชากรใน LEADER เป็น high risk diabetic ทั้งหมด การปรับใช้กับคนไข้เราซึ่งไม่ได้เป็น high risk ทุกรายต้องระวัง อีกประเด็นสำหรับ external validity คือ adherence แม้ในการศึกษาที่ควบคุมอย่างดีอย่าง LEADER ยัง drop out ไปเกือบ 20% ด้วย GI symptom ผลข้างเคียงที่กังวลกันสำหรับ liraglutide อย่าง pancreatitis จากผลการศึกษาค่อนข้างมั่นใจ แต่ pancreatic cancer และ long-term complication อื่นๆจากการใช้ยา ยังตอบไม่ได้ ยังตามสั้นไป
√ อย่างแรก น้องต้องหัดสรุป เป็นแพทย์ประจำบ้านปี 1 ไม่ใช่นักเรียนแพทย์แล้วต้องสามารถสรุปผลการศึกษาให้ได้ใน 1 ประโยค ส่วนนี้พี่ไม่เฉลย เว้นไว้ให้น้องๆตอบในคอมเม้นท์กันนะครับ ..... (เอาประโยคเดียวจบนะ)
√ นี่เป็นยาเบาหวานตัวที่สองต่อจาก empagliflozin และเป็นตัวแรกของ class ที่มี proven CV benefit และที่สำคัญลดอัตราตาย หรือพูดอีกอย่างคือ คนไข้เบาหวานชนิดที่สองใช้ยานี้เพิ่มเข้าไปแล้วอายุจะยืนขึ้น
√ glycemic control แทบไม่ต่าง ค่า A1c ต่างกันเฉลี่ยแค่ 0.4% ตลอด 3.8 ปี แต่ outcome ออกมาต่างกัน คล้ายๆ EMPA-REG ประเด็นนี้น่าสนใจมากและเอาไปคิดต่อว่าเกิดจากอะไรกันแน่
√ ทำไม cumulative Hazard ratio ถึง diverge ออกช้ากว่า empagligozin ใน EMPA-REG บริบทในการศึกษาต่างกัน? หรือ กลไกในการลด CV event ต่างกัน?
Thai Heart
1412 Cardiology
1412 Cardiology
Wipat
ไม่มีความคิดเห็น:
แสดงความคิดเห็น