Theo đuổi kết cục tử vong là một việc làm vô ích
Theo đuổi kết cục tử vong là một việc làm vô ích

Theo đuổi kết cục tử vong là một việc làm vô ích

icon
Source: PulmCrit
icon
Translator: Phan Văn Minh Quân

“Không có bằng chứng cho thấy can thiệp đó làm giảm tử vong.” Câu nói này hẳn đã được nhắc đi nhắc lại rất nhiều lần. Hàm ý thường là: can thiệp ấy vô ích, và một nhà lâm sàng thực hành dựa trên bằng chứng sẽ không cần quan tâm đến nó. Tuy nhiên, trên thực tế, việc không chứng minh được lợi ích về tử vong thực sự nói lên điều gì?

Lợi ích về mặt tử vong khó xảy ra vì nhiều lý do

Nhiều yếu tố đồng thời khiến việc chứng minh lợi ích về tử vong tại ICU là điều không thể.

#1. Tỷ lệ tử vong đang giảm dần

Tỷ lệ tử vong ban đầu đang giảm dần theo thời gian. Điều này khiến việc chứng minh hiệu quả của bất kỳ can thiệp nào ngày càng trở nên khó khăn hơn. Ví dụ, hãy tưởng tượng một loại thuốc giúp giảm nguy cơ tử vong tương đối 25%.

  • Nếu tỷ lệ tử vong ban đầu là 60%, thuốc có thể làm giảm tỷ lệ tử vong từ 60% xuống còn 45%. Việc thiết kế một nghiên cứu đủ mạnh để phát hiện mức giảm tuyệt đối 15% như vậy không quá khó.
  • Ngược lại, nếu tỷ lệ tử vong ban đầu chỉ còn 20%, thì thuốc chỉ được kỳ vọng làm giảm tử vong từ 20% xuống 15%. Khi đó, để phát hiện mức giảm tuyệt đối 5%, nghiên cứu sẽ cần cỡ mẫu lớn hơn rất nhiều.

Khi thiết kế một thử nghiệm lâm sàng, các nhà thống kê sẽ thực hiện tính toán cỡ mẫu để ước tính số lượng bệnh nhân cần tuyển. Những phép tính này dựa trên các tỷ lệ tử vong đã được báo cáo trước đó. Tuy nhiên, do tỷ lệ tử vong giảm dần theo thời gian, tỷ lệ tử vong thực tế trong nghiên cứu thường thấp hơn dự kiến. Hệ quả là nhiều nghiên cứu rơi vào tình trạng không đủ công suất thống kê.

#2. Phần lớn bệnh nhân khó có khả năng ghi nhận sự thay đổi về tử vong

Chúng ta bước vào ICU với mục tiêu cứu sống bệnh nhân. Tuy nhiên, trên thực tế, việc thực sự làm thay đổi sống còn lại không phải là điều thường gặp. Những bệnh nhân nhập ICU có thể được chia đại khái thành ba nhóm:

  • Nhóm có khả năng tử vong cao (likely-to-die): Một số bệnh nhân có nhiều bệnh đồng mắc và mức độ nặng rất cao. Tỷ lệ tử vong của họ rất lớn, gần như không phụ thuộc vào các can thiệp mà chúng ta thực hiện.
  • Nhóm ít có khả năng tử vong (unlikely-to-die): Nhiều bệnh nhân tương đối khỏe mạnh, mức độ bệnh nhẹ hơn. Chỉ cần được chăm sóc ở mức chấp nhận được, họ vẫn sẽ sống sót. Chăm sóc xuất sắc có thể giúp họ hồi phục nhanh hơn và ít biến chứng hơn, nhưng không làm cải thiện tỷ lệ tử vong.
  • Nhóm ranh giới (borderline): Những bệnh nhân có nguy cơ tử vong trung gian. Sự khác biệt trong chăm sóc có thể ảnh hưởng đến khả năng sống còn của họ.

Trong bất kỳ nghiên cứu nào, sẽ có rất nhiều bệnh nhân thuộc nhóm có khả năng tử vong cao hoặc ít có khả năng tử vong. Những bệnh nhân này sẽ gây “nhiễu”, bởi vì can thiệp nhiều khả năng sẽ không làm thay đổi kết cục của họ. Chỉ những bệnh nhân thuộc nhóm ranh giới mới có thể cung cấp thông tin thực sự có ý nghĩa.

#3. Bệnh nhân tử vong vì nhiều nguyên nhân khác nhau

Xét dưới góc độ sinh lý bệnh, tử vong là một kết cục gộp không đồng nhất (composite outcome). Ví dụ, bệnh nhân có thể tử vong sau nhồi máu cơ tim vì nhiều cơ chế khác nhau:

  • Rối loạn nhịp ác tính.
  • Sốc tim (suy chức năng bơm).
  • Biến chứng nhiễm trùng.
  • Biến chứng xuất huyết.

Hãy tưởng tượng chúng ta đang thử nghiệm một loại thuốc có tác dụng làm giảm rối loạn nhịp ác tính. Ngay cả khi thuốc này hiệu quả 100% trong việc ngăn ngừa rối loạn nhịp, nó cũng chỉ có thể phòng tránh được một phần các trường hợp tử vong. Việc không tác động được lên phần lớn các nguyên nhân gây tử vong khác khiến cho thuốc này khó có thể tạo ra một ảnh hưởng đo lường được đối với kết cục tử vong do mọi nguyên nhân (all-cause mortality).

#4. Chúng ta đang bằng mọi giá cố gắng giữ cho bệnh nhân sống sót

Thực hiện một nghiên cứu trên động vật với kết cục tử vong là điều đơn giản. Gây tổn thương cho động vật theo một cách nào đó, chẳng hạn như gây nhiễm trùng. Thực hiện một can thiệp trên một nửa số động vật. Sau đó đứng quan sát và xem có bao nhiêu con tử vong ở mỗi nhóm.

Một thử nghiệm lâm sàng thì phức tạp hơn gấp bội. Ngoài can thiệp đang được nghiên cứu, các bác sĩ còn đang nỗ lực tối đa để giữ cho bệnh nhân sống sót. Việc xử trí lâm sàng này có thể làm triệt tiêu tác động của can thiệp nghiên cứu.

Ví dụ, hãy tưởng tượng một nghiên cứu so sánh Plasmalyte với NaCl 0.9%. Nếu các bác sĩ rất tích cực trong việc điều trị nhiễm toan tăng clo, điều này có thể làm mất đi những khác biệt vốn có giữa NaCl 0.9% và Plasmalyte (Vincent 2016).

#5. Can thiệp được thực hiện quá muộn để có thể ảnh hưởng đến kết cục

Can thiệp sớm là yếu tố then chốt đối với bệnh nhân nặng. Tuy nhiên, việc can thiệp sớm lại rất khó thực hiện trong khuôn khổ một thử nghiệm ngẫu nhiên có đối chứng (RCT). Đến thời điểm bệnh nhân được tuyển chọn, hoàn tất thủ tục đồng thuận và được ngẫu nhiên hoá, thì thường bệnh đã bước sang giai đoạn muộn (nhiều khi >24 giờ sau nhập viện). Ngay cả một can thiệp tốt, nếu được áp dụng quá muộn, thì cũng sẽ không còn phát huy hiệu quả.

#6. Nhiều bệnh cảnh quá hiếm để có thể nghiên cứu

Để chứng minh được lợi ích về tử vong, việc tuyển đủ số lượng bệnh nhân đòi hỏi một nghiên cứu quy mô rất lớn. Với nhiều bệnh lý hiếm gặp, điều này đơn giản là không khả thi (ví dụ: hội chứng sốc nhiễm độc). Toàn bộ lĩnh vực hồi sức – độc chất học lâm sàng bao gồm rất nhiều bệnh cảnh hiếm gặp và không đồng nhất, khiến cho việc nghiên cứu bằng một thử nghiệm ngẫu nhiên có đối chứng quy mô lớn gần như là không thể thực hiện.

Những can thiệp nào thực sự có bằng chứng cải thiện tử vong?

Các yếu tố nêu trên cho thấy việc chứng minh lợi ích về tử vong tại ICU gần như là bất khả thi. Vậy y văn cho thấy điều gì? Phần lớn các thử nghiệm ngẫu nhiên có đối chứng (RCT) với kết cục chính là tử vong đều cho kết quả âm tính. Ospina-Tascon (2008), Ridgeon (2016)Landoni (2015) đã rà soát nhiều y văn hồi sức trong hàng thập kỷ qua để tìm các RCT đa trung tâm chứng minh được lợi ích về tử vong. Dựa trên các nghiên cứu này, dưới đây là danh sách các thuốc có lợi ích về tử vong (1):

Năm
Tạp chí
Tên nghiên cứu
Tử vong là kết cục
Tử vong (nhóm điều trị)
Tử vong (nhóm chứng)
Giá trị p
Fragility index (chỉ số mong manh)
1999
NEJM
Ảnh hưởng của albumin tĩnh mạch lên suy thận và tử vong ở bệnh nhân xơ gan kèm viêm phúc mạc nhiễm khuẩn tự phát
Chính
6/63
18/63
0.01
3
2001
Lancet
Ofloxacin uống mỗi ngày một lần trong đợt cấp COPD cần thở máy: thử nghiệm ngẫu nhiên, đối chứng giả dược
Chính
2/47
10/46
0.01
2
2004
Anaesth Analg
Lợi ích của bổ sung chất chống oxy hoá trong nuôi ăn qua đường tiêu hoá ở bệnh nhân nặng (vitamin C & E): nghiên cứu tiến cứu, ngẫu nhiên, mù đôi, đối chứng giả dược
Phụ
49/112
76/112
0.0004
12
2005
Lancet
Bổ sung clopidogrel vào aspirin ở 45.852 bệnh nhân nhồi máu cơ tim cấp: thử nghiệm ngẫu nhiên, đối chứng giả dược
Chính
1726/22961
1845/22891
0.03
12
2005
AJRCCM
Truyền hydrocortisone trong viêm phổi cộng đồng nặng: nghiên cứu ngẫu nhiên sơ bộ
Phụ
0/23
4/23
0.009
2
2010
Lancet
Ảnh hưởng của acid tranexamic lên tử vong, biến cố tắc mạch và nhu cầu truyền máu ở bệnh nhân chấn thương có xuất huyết nặng (CRASH-2)
Chính
1463/10060
1613/10067
0.004
48
2018
NEJM
Hydrocortisone phối hợp fludrocortisone ở người lớn bị sốc nhiễm khuẩn
Chính
264/614
308/627
0.03
3

Translator’s Note:

Fragility index là số lượng biến cố (ở đây là ca tử vong) cần thay đổi tối thiểu để làm mất ý nghĩa thống kê của kết quả. Chỉ số này càng thấp thì kết quả càng “mong manh”, dễ đảo chiều nếu chỉ cần thay đổi rất ít biến cố. Do đó, dù có đạt ý nghĩa thống kê, những nghiên cứu với fragility index thấp cần được diễn giải thận trọng.

Các nghiên cứu này thường rơi vào một trong hai nhóm sau:

  • Những nghiên cứu nhỏ, với fragility index <5 và giá trị p khoảng 0.01–0.05. Một số nghiên cứu trong nhóm này có thể cho kết quả dương tính đơn thuần do ngẫu nhiên. Mặc dù p<0.05 về mặt kỹ thuật được xem là “có ý nghĩa thống kê”, nhưng những nghiên cứu chỉ đạt ý nghĩa ở ngưỡng ranh giới thường khó tái lập. Xét đến tổng số rất lớn các nghiên cứu đã được thực hiện, việc một số nghiên cứu cho kết quả “dương tính” chỉ vì ngẫu nhiên là điều không thể tránh khỏi.
  • Những nghiên cứu quy mô rất lớn, với fragility index >5 và giá trị p <0.01. Các nghiên cứu này thuyết phục hơn và ít có khả năng là dương tính giả.

Đây chỉ là một danh sách ngắn. Phần lớn các can thiệp y khoa tại ICU chưa từng được chứng minh là cải thiện tử vong. Điều này bao gồm cả những can thiệp nền tảng mà chúng ta vẫn sử dụng hằng ngày (ví dụ: thuốc vận mạch, truyền máu, bù dịch trong giảm thể tích tuần hoàn, kháng sinh). Vì vậy, nếu cho rằng chúng ta không nên sử dụng một can thiệp chỉ vì nó chưa được chứng minh là cải thiện tử vong sẽ là một suy nghĩ thật ngây thơ.

Trong gần như tất cả các nghiên cứu, tử vong là một kết cục chính thiếu hợp lý

Nhiều thử nghiệm tại ICU được thiết kế nhằm tìm kiếm lợi ích về tử vong với mục tiêu p<0.05. Đây thực chất là một công thức dẫn đến sự nhầm lẫn:

  • Nếu thử nghiệm cho kết quả dương tính, thì thường chỉ đạt được một giá trị p dương tính mức độ vừa (ví dụ 0.02–0.05) kèm theo fragility index thấp (Ridgeon 2016). Mặc dù về mặt kỹ thuật đây là một thử nghiệm “dương tính”, nhưng các kết quả này không vững chắc và có thể chỉ phản ánh yếu tố ngẫu nhiên. Việc nhắm tới ngưỡng p<0.05 là một nguyên nhân lớn dẫn đến khả năng tái lập kém. Một số tác giả đã đề xuất sử dụng ngưỡng p thấp hơn (ví dụ p<0.005) hoặc yêu cầu fragility index cao hơn nhằm cải thiện tính tái lập (Johnson 2013, Ridgeon 2016).
  • Nếu thử nghiệm cho kết quả âm tính, điều đó không loại trừ khả năng tồn tại một lợi ích tử vong có ý nghĩa. Tử vong là một kết cục cực kỳ quan trọng, vì vậy ngay cả những khác biệt nhỏ về tử vong (ví dụ giảm 1–5%) cũng có ý nghĩa lâm sàng. Tuy nhiên, phần lớn các thử nghiệm không có đủ công suất thống kê để loại trừ một cách chắc chắn lợi ích tử vong ở mức 10% (Harhay 2014). Các nhà nghiên cứu thường dự đoán rằng can thiệp của họ sẽ mang lại mức cải thiện tử vong không thực tế, dẫn đến việc thiết kế nghiên cứu với cỡ mẫu nhỏ và thiếu công suất (một sai lầm được gọi là “delta inflation” - thổi phồng mức hiệu quả kỳ vọng) (Ridgeon 2017).

Tóm lại, gần như tất cả các nghiên cứu đều thiếu công suất thống kê để đánh giá một cách dứt khoát kết cục tử vong. Ngay từ khi khởi đầu, chúng đã được định sẵn là cho kết quả dương tính yếu hoặc âm tính yếu, và do đó không trả lời được câu hỏi đặt ra. Hệ quả là sự ra đời của hàng loạt phân tích gộp (meta-analysis), nhằm kết hợp các nghiên cứu thiếu công suất thống kê - nhưng bản thân các phân tích này cũng thường cho kết quả mâu thuẫn và không dứt khoát.

Nhiều liệu pháp điều trị nhiễm trùng huyết đã bị loại bỏ chỉ vì không chứng minh được lợi ích về tử vong. Rất có thể một trong số các liệu pháp này thực sự có lợi ích, nhưng không thể chứng minh được vì những lý do đã phân tích ở trên. Ví dụ, một thuốc đối kháng thụ thể IL-1 đã được chứng minh làm giảm tử vong tuyệt đối 3%, nhưng can thiệp này vẫn bị bác bỏ vì sự khác biệt không đạt ý nghĩa thống kê (Opal 1997). Mức giảm tử vong tuyệt đối 3% rõ ràng có ý nghĩa lâm sàng, nhưng nghiên cứu này không đủ công suất để xác định liệu sự khác biệt đó có ý nghĩa thống kê hay không (2).

Những thử nghiệm hiếm hoi mà tiêu chí tử vong có thể hợp lý là các siêu thử nghiệm tim mạch hoặc các thử nghiệm thực hành quy mô rất lớn với hàng nghìn bệnh nhân (ví dụ CRASH-2). Các nghiên cứu này có đủ công suất thống kê để đánh giá một cách vững chắc kết cục tử vong. Đáng tiếc là kiểu thử nghiệm như vậy rất hiếm khi thực hiện được tại ICU.

Các kết cục gần can thiệp hơn có thể mang lại nhiều ý nghĩa hơn

Giải pháp cho vấn đề của kết cục tử vong là lựa chọn một kết cục liên quan gần hơn về mặt cơ chế với can thiệp đang được nghiên cứu (3). Ví dụ, trong một nghiên cứu về cai máy thở, số ngày không thở máy (ventilator-free days) liên quan trực tiếp hơn đến can thiệp. So với tử vong, ventilator-free days có nhiều khả năng cho ra kết quả rõ ràng hơn vì các lý do sau:

  • Rút nội khí quản xảy ra thường xuyên hơn nhiều so với tử vong (ví dụ: khoảng 75% bệnh nhân có thể được rút nội khí quản, trong khi chỉ khoảng 15% bệnh nhân tử vong). Điều này cho phép nhà nghiên cứu phân tích một tín hiệu lớn hơn với cùng số lượng bệnh nhân.
  • Số ngày không thở máy là một biến liên tục, thay vì biến nhị phân (sống/chết). Điều này cung cấp thông tin chi tiết hơn về diễn tiến kết cục theo thời gian, và thường giúp tăng công suất thống kê.
  • Số ngày không thở máy liên quan gần hơn với can thiệp, nên có ít nguồn “nhiễu” chen vào giữa can thiệp và kết cục hơn.

Một chút góc nhìn có thể giúp làm rõ vấn đề này. Các kết cục không phải tử vong được chấp nhận rộng rãi bên ngoài ICU (nơi mà tiêu chí tử vong thường là không khả thi). Tuy nhiên, ở bệnh nhân hồi sức, các kết cục không phải tử vong lại thường bị xem nhẹ. Điều này là không hợp lý. Chỉ vì bệnh nhân nằm ICU không có nghĩa là mọi thứ khác ngoài việc sống sót bỗng nhiên trở nên không còn quan trọng.

Nghịch lý: Kết cục tử vong và kết cục gần can thiệp

image

Các nhà nghiên cứu khi thiết kế một RCT phải đối mặt với một nghịch lý:

  • Kết cục gần can thiệp (ví dụ: số ngày không thở máy) thì dễ được đánh giá một cách dứt khoát hơn, nhưng lại ít quan trọng hơn đối với bệnh nhân.
  • Kết cục tử vong thì quan trọng hơn đối với bệnh nhân, nhưng lại thường không thể kiểm định một cách dứt khoát.

Không có lời giải đơn giản cho nghịch lý này. Nếu một nghiên cứu thiếu công suất thống kê, nó có thể bị xem là “vô dụng về mặt khoa học” và thậm chí không phù hợp về mặt đạo đức (Halpern 2002)(4). Vì vậy, có lẽ tốt hơn là thiết kế một nghiên cứu đủ công suất thống kê để làm rõ một cách chắc chắn tác động của can thiệp lên một kết cục gần, bởi ít nhất nghiên cứu đó còn trả lời được một câu hỏi cụ thể (thay vì thiết kế một nghiên cứu đánh giá tử vong nhưng thiếu công suất, và rốt cuộc không trả lời được câu hỏi nào).

Tương lai của ICU: Tập trung nhiều hơn vào các kết cục “mềm”?

Khi ICU phát triển, mục tiêu của chúng ta cũng trưởng thành hơn, vượt xa việc đơn thuần việc giữ cho bệnh nhân sống sót.

Ví dụ, nếu một bệnh nhân sốc nhiễm trùng sống sót nhưng lại tiến triển suy thận giai đoạn cuối, thì đó không phải là một kết cục tốt. Gia đình có thể rất vui vì bệnh nhân còn sống, nhưng với tôi thì không - mục tiêu của tôi là phục hồi đầy đủ chức năng các cơ quan. Khi y học tiếp tục tiến bộ, trọng tâm sẽ ngày càng chuyển nhiều hơn sang các kết cục “mềm”, chẳng hạn như:

  • Tránh suy thận mạn, suy tim hoặc hạn chế chức năng hô hấp lâu dài.
  • Tránh mê sảng, trầm cảm, PTSD hoặc rối loạn nhận thức kéo dài.
  • Cải thiện sức cơ, tăng tỷ lệ xuất viện về nhà, tăng khả năng quay trở lại làm việc.
  • Tăng số ngày không thở máy và số ngày không nằm ICU (các chỉ dấu thay thế cho bệnh suất liên quan đến ICU).

Những kết cục này cực kỳ quan trọng đối với bệnh nhân, dù không kết cục nào liên quan trực tiếp đến tử vong. Việc chỉ chăm chăm tập trung vào tử vong là một cách nhìn phiến diện, và nó bỏ qua những lợi ích rất thực tế mà chúng ta có thể mang lại cho bệnh nhân thông qua việc cải thiện các kết cục “mềm” này.

Tổng kết

  • Việc chứng minh lợi ích về tử vong trong các thử nghiệm ngẫu nhiên có đối chứng (RCT) tại ICU là vô cùng khó khăn vì nhiều lý do (ví dụ: tỷ lệ tử vong ban đầu giảm dần theo thời gian, tính không đồng nhất của bệnh nhân, nguyên nhân tử vong đa dạng, can thiệp nghiên cứu được triển khai muộn, và nhiều bệnh cảnh quá hiếm gặp).
  • Lợi ích về tử vong được chứng minh trong các RCT mù đôi chỉ tồn tại ở một số rất ít can thiệp tại ICU. Phần lớn các can thiệp mà chúng ta sử dụng hằng ngày không có bằng chứng cải thiện tử vong.
  • Đa số các nghiên cứu không đủ công suất thống kê để có thể khẳng định hoặc bác bỏ một cách dứt khoát lợi ích về tử vong (ví dụ: không đạt được fragility index >5). Cách tiếp cận truyền thống là thiết kế nghiên cứu nhằm tìm kiếm lợi ích về tử vong với ngưỡng p<0.05 thực chất là một công thức tạo ra những nghiên cứu yếu, khó tái lập.
  • Các kết cục gần can thiệp (ví dụ: số ngày không thở máy) dễ được đánh giá một cách dứt khoát hơn, dù chúng có thể ít mang ý nghĩa hơn so với tử vong.

Chú thích:

(1) Danh sách này được tạo ra bằng cách bắt đầu từ các can thiệp được mô tả trong những bài báo nói trên, sau đó loại bỏ các nghiên cứu sau: các nghiên cứu liên quan đến thiết bị (ví dụ BiPAP), các nghiên cứu sử dụng phác đồ điều trị phức tạp mà bác sĩ không thể được làm mù (ví dụ: insulin tích cực, thông khí thể tích khí lưu thông cao so với thấp), các nghiên cứu đã bị bác bỏ bởi bằng chứng về sau, các nghiên cứu dựa trên phân tích dưới nhóm (subgroup analysis), hoặc các nghiên cứu không còn liên quan đến ICU hiện nay. Annane 2018 được bổ sung thêm, dù tôi chưa rà soát thật sự toàn diện các nghiên cứu trong vài năm gần đây. Tôi không cho rằng danh sách này hiện tại là đầy đủ tuyệt đối, nhưng có lẽ nó bao quát phần lớn các can thiệp y khoa đã được ủng hộ bằng lợi ích tử vong trong các RCT đa trung tâm.

(2) Thiên kiến cá nhân của tôi là: đối kháng thụ thể IL-1 có thể cải thiện kết cục ở một phân nhóm bệnh nhân nhiễm trùng huyết có chồng lấp với hội chứng nhiễm trùng huyết – thực bào máu.

(3) Một lưu ý quan trọng là: các kết cục không phải tử vong vẫn phải có ý nghĩa lâm sàng. Ngành dược có một lịch sử không mấy vẻ vang trong việc tiếp thị thuốc dựa trên các tiêu chí thay thế không lấy bệnh nhân làm trung tâm (ví dụ HbA1c).

(4) Giá trị của các thử nghiệm như vậy phụ thuộc vào cách chúng ta diễn giải các kết cục phụ (secondary endpoints). Tóm lại: nếu chúng ta khăng khăng rằng tiêu chí duy nhất có giá trị là kết cục chính (primary endpoint), thì một nghiên cứu thiếu công suất thống kê sẽ trở nên vô giá trị và không phù hợp về mặt đạo đức. Tuy nhiên, nếu chúng ta cho phép sử dụng các kết cục phụ một cách thận trọng, thì nghiên cứu đó có thể khá hữu ích (tức là các kết cục phụ có thể giúp một nghiên cứu thiếu công suất thống kê vẫn cung cấp được thông tin có giá trị).