根據最新發表於 BMJ Open 的研究,五大 AI 聊天機器人在回答醫療問題時,約有 50% 的答案存在問題 […] 〈研究發現:AI 給的醫療建議近半數有問題,Grok 最糟、OpenAI 仍在擴張醫療野心〉這篇文章最早發佈於動區BlockTempo《動區動趨-最具影響力的區塊鏈新聞媒體》。根據最新發表於 BMJ Open 的研究,五大 AI 聊天機器人在回答醫療問題時,約有 50% 的答案存在問題 […] 〈研究發現:AI 給的醫療建議近半數有問題,Grok 最糟、OpenAI 仍在擴張醫療野心〉這篇文章最早發佈於動區BlockTempo《動區動趨-最具影響力的區塊鏈新聞媒體》。

研究發現:AI 給的醫療建議近半數有問題,Grok 最糟、OpenAI 仍在擴張醫療野心

2026/04/15 09:30
閱讀時長 8 分鐘
如需對本內容提供反饋或相關疑問,請通過郵箱 [email protected] 聯絡我們。
根據最新發表於 BMJ Open 的研究,五大 AI 聊天機器人在回答醫療問題時,約有 50% 的答案存在問題,其中近 20% 被評為「高度有問題」。彭博指出,這份研究揭露了 AI 醫療應用的系統性風險,尤其在 OpenAI 與 Anthropic 同步擴大醫療布局之際,顯得格外諷刺。 (前情提要:不要把你的病歷交給聊天機器人?ChatGPT Health 醫療野心下的隱私賭局) (背景補充:加州大學研究「AI 腦霧」現象:14% 上班族被Agent、自動化搞瘋,離職意願高四成)   每週有超過 2.3 億人向 ChatGPT 詢問健康與醫療問題,但你問到的答案,有將近一半可能是有問題的。根據本週發表於醫學期刊《BMJ Open》的研究,來自美國、加拿大與英國的研究人員對 ChatGPT、Gemini、Meta AI、Grok 與 DeepSeek 五大平台進行系統性評估,每個平台各提出橫跨五個醫療類別、共 10 道問題。 結果沒那麼樂觀:約 50% 的回應被認定有問題,其中將近 20% 被評為「高度有問題」。   Grok 表現最差,ChatGPT 也不遑多讓 彭博報導點出,各平台表現差異頗大,但沒有一個透過考驗。從各平台問題回應率來看,Grok 以 58% 高居榜首,成為表現最差的平台;ChatGPT 緊隨其後,問題率達 52%;Meta AI 則為 50%。 研究人員觀察到,在封閉式提問以及疫苗、癌症相關議題上,聊天機器人的表現相對較好;但在開放式提問與幹細胞、營養等領域,表現則明顯下滑。此外,研究中只有兩次拒絕回答的情況,全部來自 Meta AI(某種程度上,知道自己不該回答反而成了一種罕見的優點。) 更值得警惕的是,這些 AI 給出的答案往往充滿自信,語氣肯定,毫無保留。研究人員特別強調:沒有任何一個聊天機器人,在任何一道提示下,能提供完整且準確的參考文獻清單。這代表即便 AI 看似「言之有據」,背後引用的來源往往無從查驗,甚至根本不存在。   AI 說得越有把握,風險越高 研究人員在論文中寫道,這些系統能生成「聽起來像權威、但實際上可能有瑕疵的回應」,凸顯了 AI 聊天機器人在面向公眾的健康與醫療溝通中,「行為上的重大限制」,以及「重新評估部署方式的必要性」。 彭博也引述研究團隊的警告:在缺乏公眾教育與監管機制的情況下,大規模部署聊天機器人的最大風險,就是助長錯誤醫療資訊的傳播與擴散。 值得對照的是,JAMA 另有研究指出,AI 在初步診斷案例中的失敗率超過 80%;牛津大學也在 2026 年 2 月發出警告,提醒各界正視 AI 聊天機器人在提供醫療建議方面的系統性風險。   OpenAI 與 Anthropic:研究踩煞車,商業卻踩油門 這項研究發布的時間點,頗具戲劇性。就在幾個月前,OpenAI 才在 2026 年 1 月高調推出 ChatGPT Health,這項功能允許使用者連線電子病歷、穿戴裝置與健康應用程式,同時也針對臨床醫師推出專業版工具。OpenAI 公開表示,每日已有 4,000 萬人透過 ChatGPT 查詢健康資訊。 幾乎同一時間,Anthropic 也宣布推出 Claude for Healthcare,透過 HIPAA 合規認證,正式進軍醫療市場。 這些平台既沒有醫療執照、也缺乏臨床判斷能力,卻正以驚人速度向醫療領域擴張。研究結果與商業擴張方向之間的張力,揭示了一個監管真空地帶:在 AI 醫療工具的市場宣傳與實際醫療安全之間,目前並沒有一道清晰的防護線。   信任 AI,但要有條件 這不是 AI 醫療應用第一次被點名,但每次研究的結論都在提醒同樣的事:AI 聊天機器人本質上是語言模型,它們擅長的是「聽起來正確」,而非「確保正確」。問題在於,當使用者帶著真實的健康焦慮求助時,聽起來正確往往已經足以影響決策。 隨著 OpenAI、Anthropic 等公司持續深入醫療場景,監管與公眾教育的速度,顯然還追不上技術擴張的腳步。在清晰的護欄建立之前,這份研究或許能提醒我們:AI 可以是健康資訊的入口,但不應該是終點。 相關報導 不要把你的病歷交給聊天機器人?ChatGPT Health 醫療野心下的隱私賭局 AI「篩檢癌症」準確率達98%!劍橋研究只要DNA,就能加速早期診斷與治療 V神首評LLM:Grok本質上拯救了 X 平台「有助真相傳播」,但仍有很多幻覺 馬斯克「地表最強 AI」Grok 3 免費向使用者開放:直到伺服器崩潰為止!(含教學) 馬斯克最強AI「Grok登陸Telegram」訂閱使用者免費用,會帶來什麼影響?〈研究發現:AI 給的醫療建議近半數有問題,Grok 最糟、OpenAI 仍在擴張醫療野心〉這篇文章最早發佈於動區BlockTempo《動區動趨-最具影響力的區塊鏈新聞媒體》。
市場機遇
GROK 圖標
GROK實時價格 (GROK)
$0.0004507
$0.0004507$0.0004507
-3.01%
USD
GROK (GROK) 實時價格圖表
免責聲明: 本網站轉載的文章均來源於公開平台,僅供參考。這些文章不代表 MEXC 的觀點或意見。所有版權歸原作者所有。如果您認為任何轉載文章侵犯了第三方權利,請聯絡 [email protected] 以便將其刪除。MEXC 不對轉載文章的及時性、準確性或完整性作出任何陳述或保證,並且不對基於此類內容所採取的任何行動或決定承擔責任。轉載材料僅供參考,不構成任何商業、金融、法律和/或稅務決策的建議、認可或依據。

USD1 Genesis:0 費率 + 12% APR

USD1 Genesis:0 費率 + 12% APRUSD1 Genesis:0 費率 + 12% APR

新用戶:質押最高享 600% APR。限時福利!