BitcoinWorld Độ chính xác chẩn đoán của AI vượt qua các bác sĩ phòng cấp cứu trong nghiên cứu đột phá của Harvard Một nghiên cứu đột phá của Harvard tiết lộ rằng AI cung cấp nhiều hơnBitcoinWorld Độ chính xác chẩn đoán của AI vượt qua các bác sĩ phòng cấp cứu trong nghiên cứu đột phá của Harvard Một nghiên cứu đột phá của Harvard tiết lộ rằng AI cung cấp nhiều hơn

Độ chính xác chẩn đoán của AI vượt qua bác sĩ phòng cấp cứu trong nghiên cứu đột phá của Harvard

2026/05/04 02:25
Đọc trong 11 phút
Đối với phản hồi hoặc thắc mắc liên quan đến nội dung này, vui lòng liên hệ với chúng tôi qua [email protected]

BitcoinWorld

Độ chính xác chẩn đoán của AI vượt qua bác sĩ phòng cấp cứu trong nghiên cứu đột phá của Harvard

Một nghiên cứu đột phá của Harvard tiết lộ rằng AI đưa ra chẩn đoán chính xác hơn các bác sĩ phòng cấp cứu trong một số tình huống lâm sàng nhất định, đánh dấu một cột mốc quan trọng trong lĩnh vực trí tuệ nhân tạo y tế. Được công bố trên tạp chí Science, nghiên cứu chứng minh rằng các mô hình ngôn ngữ lớn của OpenAI có thể vượt trội hơn các bác sĩ trong việc chẩn đoán bệnh nhân trong các ca cấp cứu thực tế.

Nghiên cứu AI của Harvard: Một tiêu chuẩn mới trong chẩn đoán y tế

Các nhà nghiên cứu từ Trường Y Harvard và Trung tâm Y tế Beth Israel Deaconess đã tiến hành một loạt thí nghiệm để đánh giá mức độ so sánh giữa các mô hình của OpenAI và các bác sĩ. Nghiên cứu tập trung vào 76 bệnh nhân đến phòng cấp cứu Beth Israel. Hai bác sĩ phụ trách đưa ra chẩn đoán, trong khi các mô hình o1 và 4o của OpenAI tự tạo ra chẩn đoán của riêng mình. Hai bác sĩ phụ trách khác sau đó đánh giá tất cả các chẩn đoán mà không biết chẩn đoán nào đến từ con người và chẩn đoán nào đến từ AI.

Kết quả rất ấn tượng. Ở mọi điểm chẩn đoán, mô hình o1 thực hiện tốt hơn hoặc ngang bằng với hai bác sĩ phụ trách. Mô hình 4o cũng cho thấy hiệu suất mạnh. Sự khác biệt rõ rệt nhất trong giai đoạn phân loại cấp cứu ban đầu, nơi thông tin còn hạn chế và mức độ khẩn cấp cao.

Trong các ca phân loại, mô hình o1 đưa ra chẩn đoán chính xác hoặc rất gần đúng 67% số lần. Một bác sĩ đạt được điều này 55% số lần, trong khi bác sĩ kia đạt 50% số lần. Điều này thể hiện mức cải thiện độ chính xác chẩn đoán từ 12 đến 17 điểm phần trăm.

Nghiên cứu được thực hiện như thế nào

Nhóm nghiên cứu nhấn mạnh rằng họ không xử lý trước dữ liệu. Các mô hình AI nhận được cùng thông tin có trong hồ sơ y tế điện tử tại thời điểm mỗi chẩn đoán. Cách tiếp cận này đảm bảo sự so sánh công bằng giữa lý luận của con người và máy móc.

Arjun Manrai, người đứng đầu phòng thí nghiệm AI tại Trường Y Harvard và là một trong những tác giả chính của nghiên cứu, tuyên bố trong một thông cáo báo chí: "Chúng tôi đã kiểm tra mô hình AI với hầu như mọi tiêu chuẩn, và nó vượt qua cả các mô hình trước đó lẫn các bác sĩ của chúng tôi."

Các mô hình ngôn ngữ lớn trong chăm sóc sức khỏe: Tiềm năng và hạn chế

Các mô hình ngôn ngữ lớn như o1 và 4o của OpenAI đã cho thấy khả năng đáng kể trong việc xử lý thông tin y tế dựa trên văn bản. Tuy nhiên, nghiên cứu không khẳng định rằng AI đã sẵn sàng đưa ra các quyết định sinh tử trong phòng cấp cứu. Thay vào đó, nghiên cứu nhấn mạnh nhu cầu cấp thiết về các thử nghiệm tiền cứu để đánh giá các công nghệ này trong môi trường chăm sóc bệnh nhân thực tế.

Các nhà nghiên cứu cũng lưu ý những hạn chế. Họ chỉ nghiên cứu cách các mô hình hoạt động với thông tin dựa trên văn bản. Các nghiên cứu hiện có cho thấy các mô hình nền tảng hiện tại còn hạn chế hơn trong việc lý luận với các đầu vào không phải văn bản, chẳng hạn như hình ảnh y tế hoặc các chỉ số sinh hiệu của bệnh nhân.

Adam Rodman, bác sĩ tại Beth Israel và đồng tác giả chính, đã nói với tờ Guardian rằng không có khung trách nhiệm chính thức nào xung quanh các chẩn đoán của AI. Ông nhấn mạnh rằng bệnh nhân vẫn muốn con người hướng dẫn họ qua các quyết định sinh tử và những lựa chọn điều trị khó khăn.

Ý nghĩa đối với y học cấp cứu

Y học cấp cứu đòi hỏi các quyết định nhanh chóng, chính xác với thông tin hạn chế. Nghiên cứu cho thấy AI có thể đóng vai trò là công cụ hỗ trợ quyết định mạnh mẽ cho các bác sĩ phòng cấp cứu. Bằng cách cung cấp các đề xuất chẩn đoán chính xác, AI có thể giúp giảm thiểu sai sót chẩn đoán và cải thiện kết quả cho bệnh nhân.

Tuy nhiên, việc tích hợp AI vào quy trình làm việc lâm sàng đặt ra nhiều thách thức. Các bác sĩ phải tin tưởng vào công nghệ, hiểu các hạn chế của nó và duy trì trách nhiệm cuối cùng đối với việc chăm sóc bệnh nhân. Nghiên cứu kêu gọi đánh giá cẩn thận trước khi áp dụng rộng rãi.

So sánh các mô hình AI: o1 và 4o

Nghiên cứu so sánh hai mô hình OpenAI: o1 và 4o. Mô hình o1 liên tục vượt trội hơn 4o ở tất cả các điểm chẩn đoán. Điều này cho thấy các mô hình mới hơn, tiên tiến hơn có thể mang lại độ chính xác cao hơn trong các ứng dụng y tế.

Bảng: Độ chính xác chẩn đoán tại phân loại ban đầu

Nguồn chẩn đoán Tỷ lệ chính xác
Mô hình OpenAI o1 67%
Bác sĩ 1 55%
Bác sĩ 2 50%
Mô hình OpenAI 4o Tương đương với bác sĩ

Những kết quả này làm nổi bật sự tiến bộ nhanh chóng của AI trong chăm sóc sức khỏe. Tuy nhiên, các tác giả của nghiên cứu cảnh báo không nên diễn giải quá mức các phát hiện. Quy mô mẫu còn nhỏ và bối cảnh lâm sàng còn hạn chế.

Quan điểm của chuyên gia về AI trong chẩn đoán

Các chuyên gia y tế đã phản ứng với cả sự nhiệt tình lẫn thận trọng. Một số người coi AI là công cụ mang tính biến đổi có thể dân chủ hóa khả năng tiếp cận chẩn đoán ở cấp độ chuyên gia. Những người khác lo ngại về sự phụ thuộc quá mức vào công nghệ và sự suy giảm của phán đoán lâm sàng.

Nghiên cứu của Harvard bổ sung vào khối bằng chứng ngày càng tăng ủng hộ tiềm năng của AI trong chăm sóc sức khỏe. Các nghiên cứu trước đây đã cho thấy AI hoạt động tốt trong lĩnh vực X-quang, giải phẫu bệnh và da liễu. Nghiên cứu này mở rộng bằng chứng sang y học cấp cứu, một môi trường có rủi ro cao.

Tiến sĩ Manrai nhấn mạnh rằng mô hình AI đã được kiểm tra với hầu như mọi tiêu chuẩn và vượt trội hơn các mô hình trước. Điều này cho thấy AI không chỉ đạt ngang bằng hiệu suất của con người mà còn vượt qua trong các bối cảnh cụ thể.

Các cân nhắc về đạo đức và quy định

Nghiên cứu đặt ra những câu hỏi đạo đức quan trọng. Ai chịu trách nhiệm khi chẩn đoán của AI sai? AI nên được tích hợp vào quá trình ra quyết định lâm sàng như thế nào mà không làm suy giảm niềm tin của bệnh nhân? Những câu hỏi này đòi hỏi sự xem xét cẩn thận từ các cơ quan quản lý, nhà cung cấp dịch vụ chăm sóc sức khỏe và các nhà phát triển công nghệ.

Hiện tại, không có khung chính thức nào về trách nhiệm xung quanh các chẩn đoán của AI. Rodman lưu ý rằng bệnh nhân vẫn muốn có sự hướng dẫn của con người trong các quyết định sinh tử. Điều này cho thấy AI nên bổ sung, chứ không thay thế, chuyên môn của con người.

Hướng đi tương lai: Các thử nghiệm tiền cứu và kiểm tra thực tế

Các tác giả của nghiên cứu kêu gọi các thử nghiệm tiền cứu để đánh giá AI trong môi trường chăm sóc bệnh nhân thực tế. Các thử nghiệm như vậy sẽ cung cấp bằng chứng mạnh mẽ hơn về hiệu quả, độ an toàn và tác động của AI đến kết quả điều trị bệnh nhân.

Các thử nghiệm tiền cứu cũng sẽ giúp xác định những cạm bẫy tiềm ẩn, chẳng hạn như thiên kiến thuật toán hoặc sự phụ thuộc quá mức vào AI. Chúng sẽ cung cấp dữ liệu về cách AI hoạt động trên các nhóm bệnh nhân đa dạng và các tình huống lâm sàng khác nhau.

Các nhà nghiên cứu có kế hoạch tiếp tục công việc của họ, mở rộng nghiên cứu để bao gồm nhiều bệnh nhân và cơ sở lâm sàng hơn. Họ cũng nhằm mục đích kiểm tra các mô hình AI trên các đầu vào không phải văn bản, chẳng hạn như hình ảnh y tế và kết quả xét nghiệm.

Điều này có ý nghĩa gì đối với bệnh nhân và bác sĩ

Đối với bệnh nhân, nghiên cứu này mang lại hy vọng về chẩn đoán chính xác và kịp thời hơn. Đối với bác sĩ, nó mang lại cơ hội tận dụng AI như một công cụ hỗ trợ quyết định. Tuy nhiên, cả hai nhóm đều phải tiếp cận AI với kỳ vọng thực tế.

AI không phải là sự thay thế cho phán đoán của con người. Đó là công cụ có thể nâng cao độ chính xác chẩn đoán, đặc biệt trong các tình huống áp lực cao như phòng cấp cứu. Điều quan trọng là tích hợp AI một cách có trách nhiệm, đảm bảo rằng nó bổ sung chứ không làm suy giảm chuyên môn lâm sàng.

Kết luận

Nghiên cứu của Harvard cung cấp bằng chứng thuyết phục rằng AI đưa ra chẩn đoán chính xác hơn các bác sĩ phòng cấp cứu trong một số bối cảnh nhất định. Mô hình o1 của OpenAI vượt trội hơn các bác sĩ về độ chính xác phân loại, chứng minh tiềm năng của các mô hình ngôn ngữ lớn trong chăm sóc sức khỏe. Tuy nhiên, nghiên cứu cũng làm nổi bật nhu cầu đánh giá cẩn thận, các khung đạo đức và các thử nghiệm tiền cứu trước khi AI có thể được áp dụng rộng rãi trong môi trường lâm sàng. Khi AI tiếp tục phát triển, vai trò của nó trong y học có thể sẽ mở rộng, nhưng sự giám sát của con người vẫn là điều cần thiết để đảm bảo an toàn và niềm tin của bệnh nhân.

Câu hỏi thường gặp

Q1: Nghiên cứu của Harvard so sánh AI và bác sĩ như thế nào?
A1: Các nhà nghiên cứu so sánh chẩn đoán từ các mô hình o1 và 4o của OpenAI với chẩn đoán từ hai bác sĩ phụ trách trong 76 ca cấp cứu. Hai bác sĩ phụ trách khác đánh giá các chẩn đoán mà không biết nguồn gốc.

Q2: Tỷ lệ chính xác của mô hình AI trong nghiên cứu là bao nhiêu?
A2: Mô hình o1 đưa ra chẩn đoán chính xác hoặc rất gần đúng 67% số lần trong các ca phân loại, so với 55% và 50% của hai bác sĩ.

Q3: AI đã sẵn sàng thay thế bác sĩ phòng cấp cứu chưa?
A3: Chưa. Nghiên cứu không khẳng định AI đã sẵn sàng cho các quyết định lâm sàng thực tế. Nghiên cứu kêu gọi các thử nghiệm tiền cứu và nhấn mạnh nhu cầu giám sát và trách nhiệm của con người.

Q4: Những hạn chế của AI trong chẩn đoán y tế là gì?
A4: Các mô hình AI hiện tại bị giới hạn ở thông tin dựa trên văn bản và có thể không hoạt động tốt với các đầu vào không phải văn bản như hình ảnh y tế hoặc các chỉ số sinh hiệu của bệnh nhân. Nghiên cứu cũng lưu ý sự thiếu vắng của các khung trách nhiệm chính thức.

Q5: Điều này có ý nghĩa gì đối với tương lai của chăm sóc sức khỏe?
A5: AI có tiềm năng cải thiện độ chính xác chẩn đoán và hỗ trợ ra quyết định lâm sàng. Tuy nhiên, cần có sự tích hợp cẩn thận, các hướng dẫn đạo đức và nghiên cứu thêm trước khi áp dụng rộng rãi.

This post AI Diagnosis Accuracy Surpasses Emergency Room Doctors in Groundbreaking Harvard Study first appeared on BitcoinWorld.

Cơ hội thị trường
Logo Gensyn
Giá Gensyn(AI)
$0.03962
$0.03962$0.03962
+7.25%
USD
Biểu đồ giá Gensyn (AI) theo thời gian thực
Tuyên bố miễn trừ trách nhiệm: Các bài viết được đăng lại trên trang này được lấy từ các nền tảng công khai và chỉ nhằm mục đích tham khảo. Các bài viết này không nhất thiết phản ánh quan điểm của MEXC. Mọi quyền sở hữu thuộc về tác giả gốc. Nếu bạn cho rằng bất kỳ nội dung nào vi phạm quyền của bên thứ ba, vui lòng liên hệ [email protected] để được gỡ bỏ. MEXC không đảm bảo về tính chính xác, đầy đủ hoặc kịp thời của các nội dung và không chịu trách nhiệm cho các hành động được thực hiện dựa trên thông tin cung cấp. Nội dung này không cấu thành lời khuyên tài chính, pháp lý hoặc chuyên môn khác, và cũng không được xem là khuyến nghị hoặc xác nhận từ MEXC.

Starter Gold Rush: Win $2,500!

Starter Gold Rush: Win $2,500!Starter Gold Rush: Win $2,500!

Start your first trade & capture every Alpha move