根據最新發表於 BMJ Open 的研究，五大 AI 聊天機器人在回答醫療問題時，約有 50% 的答案存在問題 […] 〈研究發現：AI 給的醫療建議近半數有問題，Grok 最糟、OpenAI 仍在擴張醫療野心〉這篇文章最早發佈於動區BlockTempo《動區動趨-最具影響力的區塊鏈新聞媒體》。根據最新發表於 BMJ Open 的研究，五大 AI 聊天機器人在回答醫療問題時，約有 50% 的答案存在問題 […] 〈研究發現：AI 給的醫療建議近半數有問題，Grok 最糟、OpenAI 仍在擴張醫療野心〉這篇文章最早發佈於動區BlockTempo《動區動趨-最具影響力的區塊鏈新聞媒體》。

研究發現：AI 給的醫療建議近半數有問題，Grok 最糟、OpenAI 仍在擴張醫療野心

來源：Blocktempo ZH

2026/04/15 09:30

閱讀時長 8 分鐘

GROK$0.0004507-2.08%

如需對本內容提供反饋或相關疑問，請通過郵箱 [email protected] 聯絡我們。

根據最新發表於 BMJ Open 的研究，五大 AI 聊天機器人在回答醫療問題時，約有 50% 的答案存在問題，其中近 20% 被評為「高度有問題」。彭博指出，這份研究揭露了 AI 醫療應用的系統性風險，尤其在 OpenAI 與 Anthropic 同步擴大醫療布局之際，顯得格外諷刺。（前情提要：不要把你的病歷交給聊天機器人？ChatGPT Health 醫療野心下的隱私賭局）（背景補充：加州大學研究「AI 腦霧」現象：14% 上班族被Agent、自動化搞瘋，離職意願高四成）每週有超過 2.3 億人向 ChatGPT 詢問健康與醫療問題，但你問到的答案，有將近一半可能是有問題的。根據本週發表於醫學期刊《BMJ Open》的研究，來自美國、加拿大與英國的研究人員對 ChatGPT、Gemini、Meta AI、Grok 與 DeepSeek 五大平台進行系統性評估，每個平台各提出橫跨五個醫療類別、共 10 道問題。結果沒那麼樂觀：約 50% 的回應被認定有問題，其中將近 20% 被評為「高度有問題」。 Grok 表現最差，ChatGPT 也不遑多讓彭博報導點出，各平台表現差異頗大，但沒有一個透過考驗。從各平台問題回應率來看，Grok 以 58% 高居榜首，成為表現最差的平台；ChatGPT 緊隨其後，問題率達 52%；Meta AI 則為 50%。研究人員觀察到，在封閉式提問以及疫苗、癌症相關議題上，聊天機器人的表現相對較好；但在開放式提問與幹細胞、營養等領域，表現則明顯下滑。此外，研究中只有兩次拒絕回答的情況，全部來自 Meta AI（某種程度上，知道自己不該回答反而成了一種罕見的優點。）更值得警惕的是，這些 AI 給出的答案往往充滿自信，語氣肯定，毫無保留。研究人員特別強調：沒有任何一個聊天機器人，在任何一道提示下，能提供完整且準確的參考文獻清單。這代表即便 AI 看似「言之有據」，背後引用的來源往往無從查驗，甚至根本不存在。 AI 說得越有把握，風險越高研究人員在論文中寫道，這些系統能生成「聽起來像權威、但實際上可能有瑕疵的回應」，凸顯了 AI 聊天機器人在面向公眾的健康與醫療溝通中，「行為上的重大限制」，以及「重新評估部署方式的必要性」。彭博也引述研究團隊的警告：在缺乏公眾教育與監管機制的情況下，大規模部署聊天機器人的最大風險，就是助長錯誤醫療資訊的傳播與擴散。值得對照的是，JAMA 另有研究指出，AI 在初步診斷案例中的失敗率超過 80%；牛津大學也在 2026 年 2 月發出警告，提醒各界正視 AI 聊天機器人在提供醫療建議方面的系統性風險。 OpenAI 與 Anthropic：研究踩煞車，商業卻踩油門這項研究發布的時間點，頗具戲劇性。就在幾個月前，OpenAI 才在 2026 年 1 月高調推出 ChatGPT Health，這項功能允許使用者連線電子病歷、穿戴裝置與健康應用程式，同時也針對臨床醫師推出專業版工具。OpenAI 公開表示，每日已有 4,000 萬人透過 ChatGPT 查詢健康資訊。幾乎同一時間，Anthropic 也宣布推出 Claude for Healthcare，透過 HIPAA 合規認證，正式進軍醫療市場。這些平台既沒有醫療執照、也缺乏臨床判斷能力，卻正以驚人速度向醫療領域擴張。研究結果與商業擴張方向之間的張力，揭示了一個監管真空地帶：在 AI 醫療工具的市場宣傳與實際醫療安全之間，目前並沒有一道清晰的防護線。信任 AI，但要有條件這不是 AI 醫療應用第一次被點名，但每次研究的結論都在提醒同樣的事：AI 聊天機器人本質上是語言模型，它們擅長的是「聽起來正確」，而非「確保正確」。問題在於，當使用者帶著真實的健康焦慮求助時，聽起來正確往往已經足以影響決策。隨著 OpenAI、Anthropic 等公司持續深入醫療場景，監管與公眾教育的速度，顯然還追不上技術擴張的腳步。在清晰的護欄建立之前，這份研究或許能提醒我們：AI 可以是健康資訊的入口，但不應該是終點。相關報導不要把你的病歷交給聊天機器人？ChatGPT Health 醫療野心下的隱私賭局 AI「篩檢癌症」準確率達98%！劍橋研究只要DNA，就能加速早期診斷與治療 V神首評LLM：Grok本質上拯救了 X 平台「有助真相傳播」，但仍有很多幻覺馬斯克「地表最強 AI」Grok 3 免費向使用者開放：直到伺服器崩潰為止！（含教學）馬斯克最強AI「Grok登陸Telegram」訂閱使用者免費用，會帶來什麼影響？〈研究發現：AI 給的醫療建議近半數有問題，Grok 最糟、OpenAI 仍在擴張醫療野心〉這篇文章最早發佈於動區BlockTempo《動區動趨-最具影響力的區塊鏈新聞媒體》。

市場機遇

GROK實時價格 (GROK)

$0.0004507

$0.0004507$0.0004507

-3.01%

USD

GROK (GROK) 實時價格圖表

只要一分鐘，20 USDT 免費拿！

充值 $100，多拿 $300 GOLD 倉位！

免責聲明: 本網站轉載的文章均來源於公開平台，僅供參考。這些文章不代表 MEXC 的觀點或意見。所有版權歸原作者所有。如果您認為任何轉載文章侵犯了第三方權利，請聯絡 [email protected] 以便將其刪除。MEXC 不對轉載文章的及時性、準確性或完整性作出任何陳述或保證，並且不對基於此類內容所採取的任何行動或決定承擔責任。轉載材料僅供參考，不構成任何商業、金融、法律和/或稅務決策的建議、認可或依據。