Nhận định Hazard Ratio Là Gì – Lâm Sàng Thống Kê: Bài 22 là chủ đề trong bài viết hôm nay của Lễ Hội Phượng Hoàng. Theo dõi nội dung để biết chi tiết nhé.
Ý nghĩa của odds ratio và relative risk
Nguyễn Văn TuấnGiáo sư y khoaViện Nghiên cứu Y khoa GarvanTrường lâm sàng St Vincent’sĐại học New South Wales, Sydney, Australia
Trong nhiều bài báo nghiên cứu y học lúc thì báo cáo odds ratio, lúc thì relative risk. Câu hỏi đăt ra là hai chỉ số này khác nhau như thế nào và chỉ số nào đúng. Bài này sẽ giải thích sơ qua hai khái niệm odds và risk. Đây là một thắc mắc không chỉ ở nước ta mà … toàn thế giới. Rất nhiều nhà nghiên cứu, dù đã công bố báo cáo khoa học trên các tập san danh tiếng như New England Journal of Medicine, vẫn hiểu sai – có khi cực kì sai lầm – về hai chỉ số này. Tôi muốn mượn câu hỏi này để giải thích những khác biệt quan trọng của hai chỉ số odds ratio (OR) và relative risk (RR). Tạm thời tôi sẽ không dịch hai thuật ngữ này ở đây. Tôi hi vọng rằng qua bài viết ngắn này, bạn đọc sẽ nắm vững vấn đề hơn và phân biệt những khác biệt căn bản của hai chỉ số để không vấp phải những sai lầm như các nhà nghiên cứu y học Tây phương từng phạm phải. OR và RR: cơ chế tính toán OR và RR là hai chỉ số thống kê rất phổ biến và có ích trong dịch tễ học, vì cả hai chỉ số kiểm định mối liên hệ giữa một yếu tố nguy cơ và bệnh tật – một mục tiêu gần như căn bản của nghiên cứu y học hiện đại. Cơ chế tính toán của hai chỉ số này cực kì đơn giản. RR: Nếu trong một nhóm n1 bệnh nhân bị phơi nhiễm một yếu tố nguy cơ (chẳng hạn như hút thuốc lá), và sau khi theo dõi trong một thời gian, có k1 bệnh nhân mắc bệnh, thì tỉ lệ mắc bệnh đơn giản là:
(hãy gọi tỉ lệ này là p1) Nếu một nhóm n2bệnh nhân khác không bị phơi nhiễm yếu tố nguy cơ đó và trong cùng thời gian theo dõi có k1 bệnh nhân mắc bệnh, thì tỉ lệ mắc bệnh là:
Do đó, RR đơn giản là tỉ số của hai tỉ lệ:
Nếu RR > 1 (hay p1>p2), chúng ta có thể phát biểu rằng yếu tố nguy cơ làm tăng khả năng mắc bệnh; nếu RR = 1 (tức là p1=p2), chúng ta có thể nói rằng không có mối liên hệ nào giữa yếu tố nguy cơ và khả năng mắc bệnh; và nếu RR 1
2), chúng ta có bằng chứng để thể phát biểu rằng yếu tố nguy cơ có thể làm giảm khả năng mắc bệnh. OR: Thay vì sử dụng tỉ lệ phát sinh p để đo lường khả năng mắc bệnh, thống kê cung cấp cho chúng ta một chỉ số khác: đó là odd. Odd được định nghĩa là tỉ số của hai xác suất. Nếu p là xác suất mắc bệnh, thì 1-p là xác suất sự kiện không mắc bệnh. Theo đó, odd được định nghĩa bằng:
Như vậy, nếu odd > 1, khả năng mắc bệnh cao hơn khả năng không mắc bệnh; nếu odd = 1 thì điều này cũng có nghĩa là khả năng bằng với khả năng không mắc bệnh; và nếu odd Với định nghĩa này, chúng ta quay lại với ví dụ vừa trình bày trong mục RR. Odd mắc bệnh trong nhóm bị phơi nhiễm yếu tố nguy cơ là:
và odd mắc bệnh trong nhóm không bị phơi nhiễm yếu tố nguy cơ là:
Từ đó, OR được định nghĩa là tỉ số của hai odds:
Mối liên hệ giữa RR và OR. Qua công thức , và , chúng ta có thể thấy OR và RR có một mối liên hệ số học. Nếu ai thích đại số, có thể viết lại công thức RR như là một hàm số của OR (hay ngược lại), nhưng ở đây, tôi chỉ muốn lưu ý một điểm quan trọng có liên quan đến việc diễn dịch RR và OR.
Bạn đang xem: Hazard ratio là gì
Nhìn vào công thức của odd, chúng ta dễ dàng thấy nếu tỉ lệ mắc bệnh p thấp (chẳng hạn như 0.001 hay 0.01 – tức 0.1% hay 1%), thì odd = p. Chẳng hạn như nếu p = 0.01, thì 1 – p = 0.99, và do đó odd = 0.01 / 0.99 = 0.010101. Quay lại với công thức , nếu p1 hay p2 thấp, thì OR có thể viết như sau:
Nói cách khác, nếu tỉ lệ mắc bệnh thấp, thì OR gần bằng với RR. Nhưng nếu tỉ lệ mắc bệnh cao (chẳng hạn như trên 10%) thì chỉ số OR cũng cao hơn chỉ số RR. Có thể làm một vài tính toán để thấy sự khác biệt giữa RR và OR qua bảng số liệu sau đây (Bảng 1). Với những trường hợp tỉ lệ mắc bệnh dưới 5%, OR và RR không khác nhau đáng kể. Nhưng nếu tỉ lệ mắc bệnh cao hơn 10%, thì OR thường ước tính RR cao hơn thực tế. Bảng 1. So sánh RR và OR với nhiều tỉ lệ khác nhau (số liệu mô phỏng) Chú ý: Bảng trên đây được mô phỏng sao cho RR = 3 để chứng minh rằng OR ước tính độ ảnh hưởng cao hơn so với thực tế.
Xem thêm: Sửa Lỗi Disk 100
RR và OR: ứng dụng Ví dụ 1: truy tìm ung thư vú. Chương trình truy tìm ung thư vú được khuyến khích như là một phương cách y tế công cộng nhằm giảm tỉ lệ tử vong từ bệnh này ở phụ nữ. Một nhóm nghiên cứu ở Thuỵ Điển tiến hành một nghiên cứu lâm sàng đối chứng ngẫu nhiên, mà trong đó họ tuyển các phụ nữ tuổi 50 trở lên, và chia thành 2 nhóm: nhóm A gồm 66103 phụ nữ được chụp X quang (tức mammography) thường xuyên (cứ mỗi năm một lần), và nhóm B gồm 66105 phụ nữ không chụp X quang mà chỉ theo dõi bình thường (tức nhóm đối chứng). Sau 5 năm, nhóm A có 183 người chết vì ung thư vú và nhóm B có 177 người chết. Số liệu được trình bày trong Bảng 2 sau đây: Bảng 2: Truy tìm ung thư vú và tử vong
Với số liệu này, chúng ta có thể thấy tỉ lệ tử vong trong nhóm A là pA=183/66103=0.002768 và nhóm B là pB=177/66105=0.002678 . Từ đó, RR có thể ước tính bằng công thức như sau:
Nhưng thay vì áp dụng RR, chúng ta cũng có thể áp dụng OR. Odd tử vong trong nhóm chụp mammography là:
và nhóm đối chứng: Do đó, OR là:
Các nhà nghiên cứu kết luận rằng tỉ lệ bệnh nhân da đen được thông tim thấp hơn tỉ lệ ở bệnh nhân da trắng đến 40%. Sau khi nghiên cứu này công bố, giới truyền thông rầm rộ bàn về kết quả và ý nghĩa của nghiên cứu. Không cần nói ra, cũng có thể đoán được trong dư âm và tình trạng kì thị chủng tộc ở Mĩ còn kéo dài, những nhóm đấu tranh chống kì thị chủng tộc lấy kết quả này để làm bằng chứng tố cáo rằng các bác sĩ da trắng kì thị bệnh nhân da đen. Ý nghĩa còn sâu xa hơn: sự kì thị này có thể dẫn đến tử vong. Nói cách khác, có người diễn dịch rằng đây là một sự giết người có ý đồ! Nhưng rất tiếc là con số 40% đó đã được diễn dịch cực kì sai. Không những diễn dịch sai mà cách tính toán cũng sai. Để hiểu tại sao cách diễn dịch đó sai, chúng ta hãy bắt đầu bằng cách tính OR của các tác giả. Odd thông tim trong nhóm bệnh nhân da trắng là: oddw=652/68=9.59. Tính tương tự, odd thông tim trong nhóm bệnh nhân da đen là: oddb=610/110=5.545. Do đó, OR giữa nhóm da đen và da trắng là: OR=oddb/oddw=5.545/9.59=0.578 (Chú ý, các nhà nghiên cứu tính số chẵn, nên OR là khoảng 0.60). Nhưng nếu thay vì tính bằng odd, chúng ta có thể tính bằng tỉ lệ đề nghị thông tim cho hai nhóm. Tỉ lệ này cho nhóm bệnh nhân da trắng là: pw=652/720=0.906 , và nhóm bệnh nhân da đen: pb=610/720=0.847. Và RR có thể tính từ hai tỉ lệ này:
Đến đây, chúng ta thấy rõ rằng, tỉ lệ đề nghị thông tim trong nhóm bệnh nhân da đen thấp hơn tỉ lệ trong nhóm bệnh nhân da trắng là 6.5% (lấy 1 trừ cho 0.935 và nhân kết quả cho 100), chứ không phải 40% như các tác giả và giới truyền thông tuyên bố. Tại sao có sự khác biệt? Tại vì các tác giả và giới truyền thông nhầm lẫn rằng OR là RR. Trong trường hợp này, OR không phải là một chỉ số thích hợp để phân tích số liệu, bởi vì con số tỉ lệ quá cao (84.7% và 90.6%), và vì tỉ lệ quá cao, cho nên OR ước tính RR quá cao hơn thực tế. Thật ra, ở đây cách gọi “RR” cũng không chính xác. RR chỉ sử dụng cho tỉ lệ phát sinh (incidence), nhưng trong trường hợp này không có tỉ lệ phát sinh, mà là tỉ lệ lưu hành (prevalence). Do đó, thuật ngữ chính xác để mô tả 0.935 là prevalence ratio (PR). (Đây là một đề tài khác mà tôi hi vọng sẽ có dịp quay lại để bàn thêm).
Xem thêm: Feed Là Gì
Điều ngạc nhiên là sai sót này lại hiện diện ngay trên giấy trắng mực đen của một tập san y học vào hàng số 1 trên thế giới! Vấn đề diễn dịch OR RR là tỉ số của hai tỉ lệ, và tỉ lệ thì chúng ta có thể hiểu được khá dễ dàng. Nếu nói tỉ lệ mắc bệnh 3%, chúng ta nghĩ ngay đến 3 trong 100 người mắc bệnh. Vì thế, vấn đề diễn dịch RR khá dễ dàng. Nếu RR = 2, chúng ta có thể nói rằng tỉ lệ tăng gấp 2 lần. Ai cũng hiểu được mà không chất vấn gì thêm. OR là tỉ số của hai odds. Odd phản ảnh “khả năng” mắc bệnh. Odd = 2 có nghĩa là khả năng mắc bệnh cao hơn khả năng không mắc bệnh 2 lần. Khó hiểu. Odd đã khó hiểu thì tỉ số của hai odds (hay hai khả năng) lại càng là một đo lường khó hiểu hơn vì nó quá chung chung, khó cảm nhận được. Thật ra, một người bình thường (kể cả giới bác sĩ) khó có thể hiểu chính xác nghĩa của OR. Chúng ta biết OR = 2 không hẳn có cùng nghĩa với RR = 2. Chính vì thế mà gần đây có “phong trào xét lại” OR trên các tập san y học quốc tế. Nhiều nhà nghiên cứu, dịch tễ học và thống kê học kêu gọi bỏ OR! Nhưng bất cứ đo lường nào cũng lợi thế và khiếm khuyết. RR, dù dễ diễn dịch cũng có khiếm khuyết của nó. Lấy ví dụ đơn giản: nếu tỉ lệ mắc bệnh ung thư trong nhóm A là 1% và nhóm B là 3%, chúng ta dễ dàng thấy RR = 3. Nhưng thay vì nói mắc bệnh, chúng ta lật ngược lại vấn đề “không mắc bệnh”: chúng ta có tỉ lệ cho nhóm A là 99% so với nhóm B là 97%, và như thế RR = 0.97 / 0.99 = 0.98, tức là tỉ lệ không mắc bệnh trong nhóm B thấp hơn nhóm A khoảng 2%. (Nhưng nếu dùng “mắc bệnh”, nhóm A mắc bệnh nhiều hơn nhóm B đến 3 lần!) Nói cách khác, RR có thể thiếu tính nhất quán (consistency). Nhưng OR thì không có vấn đề thiếu nhất quán. Trong ví dụ trên, nếu lấy chỉ số là “mắc bệnh” làm so sánh, OR là 3.06. Nhưng nếu lấy “không mắc bệnh” làm chỉ số son sánh, thì OR vẫn là 3.06 (bạn đọc có thể kiểm tra con số này). Trong toán thống kê, người ta gọi đặc tính của OR là symmetric (đối xứng), còn đặc tính của RR là asymmetric (bất đối xứng). OR, RR và thể loại nghiên cứu Một khác biệt cở bản nữa giữa RR và OR là sự tùy thuộc vào thể loại nghiên cứu. Nói một cách ngắn gọn, RR chỉ có thể ước tính từ nghiên cứu xuôi thời gian (cohort prospective study), nhưng OR thì có thể ước tính từ tất cả thể loại nghiên cứu, nhưng củ yếu là nghiên cứu bệnh – chứng. Giả sử chúng ta muốn tìm hiểu mối liên hệ giữa phơi nhiễm chất độc màu da cam (Agent Orange – AO) và bệnh ung thư. Một cách nghiên cứu qui mô là tuyển chọn
Chuyên mục: Hỏi Đáp