Mistral 發布 Leanstral,一個擁有 60 億參數的 AI 代理,用於 Lean 4 形式化驗證,在 Apache 2.0 授權條款下以 1/15 的成本擊敗更大型的模型。(閱讀更多Mistral 發布 Leanstral,一個擁有 60 億參數的 AI 代理,用於 Lean 4 形式化驗證,在 Apache 2.0 授權條款下以 1/15 的成本擊敗更大型的模型。(閱讀更多

Mistral AI 推出 Leanstral 開源證明代理用於 Lean 4

2026/03/17 03:13
閱讀時長 5 分鐘
如需對本內容提供反饋或相關疑問,請通過郵箱 [email protected] 聯絡我們。

Mistral AI 推出 Leanstral 開源證明代理,專為 Lean 4 設計

Zach Anderson 2026年3月16日 19:13

Mistral 發布 Leanstral,一個用於 Lean 4 形式化驗證的 6B 參數 AI 代理,在 Apache 2.0 許可下以 1/15 的成本擊敗更大型模型。

Mistral AI 推出 Leanstral 開源證明代理,專為 Lean 4 設計

Mistral AI 於2026年3月16日發布 Leanstral——首個專為 Lean 4 形式化驗證而建構的開源 AI 代理。這個 120B 參數模型僅運行 6B 活躍參數,並在 Apache 2.0 許可下發布,使生產級定理證明無需企業級預算即可使用。

為什麼這對加密貨幣重要?形式化驗證——證明程式碼確實按其聲稱的方式運作的數學證明——已成為保護智能合約和區塊鏈協議的黃金標準。DeFi 程式碼中的漏洞已造成數十億美元的損失。Leanstral 可能大幅降低尋求驗證安全性專案的門檻。

效能與成本權衡

Mistral 使用 FLTEval 對 Leanstral 進行基準測試,與專有和開源競爭對手進行比較,這是一個測試費馬最後定理形式化專案中實際證明工程任務的新評估套件。

數據令人驚豔。Leanstral 在 pass@2 下獲得 26.3 分,計算成本為 36 美元。Claude Sonnet 4.6 取得 23.7 分,但費用高達 549 美元——成本超過 15 倍,效能卻更差。即使在 pass@16 下,Leanstral 以 290 美元達到 31.9 分,成本仍不到 Claude Opus 4.6 的 1,650 美元價格的五分之一(儘管 Opus 在品質上以 39.6 分領先)。

與開源替代方案相比,效率差距進一步擴大。GLM5-744B-A40B 和 Kimi-K2.5-1T-A32B 儘管擁有 6-8 倍的活躍參數,仍停留在 16-20 分左右。Qwen3.5-397B-A17B 需要四次通過才能達到 25.4 分——Leanstral 僅用兩次就超越了。

技術架構

Leanstral 使用針對證明工程工作流程優化的稀疏專家混合架構。該模型透過 MCP(模型上下文協議)與 Lean 的語言伺服器協議整合,專門訓練以在 lean-lsp-mcp 工具中實現最大效能。

Lean 4 本身於 2023 年 9 月推出穩定版,並在數學形式化方面迅速普及。Mathlib 函式庫——一個龐大的數學證明集合——在同年成功移植到 Lean 4。像費馬最後定理的形式化證明等專案展示了該平台進行嚴肅數學工作的能力。

實際應用

Mistral 展示了 Leanstral 處理關於 Lean 4.29.0-rc6 重大變更的真實 Stack Exchange 除錯問題。該代理診斷出類型別名的定義相等性問題,並正確識別出將 def 替換為 abbrev 將恢復策略匹配。

該模型還展示了跨語言翻譯,將 Rocq(原 Coq)定義轉換為 Lean 4,同時保留證明語義並實現自訂符號。

存取選項

存在三種部署路徑:在 Mistral Vibe 中直接整合(使用 /leanstall 開始)、在 labs-leanstral-2603 的免費 API 端點進行限時回饋收集,或使用 Apache 2.0 權重進行自主託管部署。

對於區塊鏈專案而言,計算很直接。形式化驗證傳統上需要昂貴的審計公司或深厚的內部專業知識。一個能以每項任務 36-290 美元證明程式碼正確性的開源代理可能重塑協議處理安全性的方式——假設證明在生產條件下成立。

圖片來源:Shutterstock
  • mistral ai
  • leanstral
  • lean 4
  • 形式化驗證
  • 開源
免責聲明: 本網站轉載的文章均來源於公開平台,僅供參考。這些文章不代表 MEXC 的觀點或意見。所有版權歸原作者所有。如果您認為任何轉載文章侵犯了第三方權利,請聯絡 [email protected] 以便將其刪除。MEXC 不對轉載文章的及時性、準確性或完整性作出任何陳述或保證,並且不對基於此類內容所採取的任何行動或決定承擔責任。轉載材料僅供參考,不構成任何商業、金融、法律和/或稅務決策的建議、認可或依據。

您可能也會喜歡

Botanix 推出 stBTC 以提供 Bitcoin 原生收益

Botanix 推出 stBTC 以提供 Bitcoin 原生收益

Botanix 推出 stBTC 以提供比特幣原生收益的文章出現在 BitcoinEthereumNews.com。Botanix Labs 已推出 stBTC,這是一種流動性質押代幣,旨在通過將網絡燃料費直接重新分配給用戶,將比特幣轉變為能夠產生收益的資產。該協議將於本週晚些時候開始收益累積,其創世保險庫計劃於 9 月 25 日開放,上限為 50 BTC。這一舉措標誌著首批嘗試在不依賴通脹代幣模型或中心化託管人的情況下產生比特幣原生收益的嘗試之一。 stBTC 的運作方式是允許用戶將比特幣存入 Botanix 的無許可智能合約中,獲得代表其在質押保險庫中份額的 stBTC 代幣。隨著交易的發生,50% 的 Botanix 網絡燃料費(以 BTC 支付)流回 stBTC 持有者。隨著時間推移,stBTC 相對於 BTC 的價值增加,使用戶能夠贖回其原始存款加上收益。 Botanix 估計早期回報可能達到每年 20-50%,然後穩定在約 6-8%,這一水平與以太坊質押相似,但完全以比特幣計價。Botanix 表示,安全審計已由 Spearbit 和 Sigma Prime 完成,該協議建立在 EIP-4626 保險庫標準上,該標準也是基於以太坊的質押產品的基礎。該公司的 Spiderchain 架構由 16 個獨立實體運營,包括 Galaxy、Alchemy 和 Fireblocks,確保網絡安全。 如果採用率增長,Botanix 認為該系統可以使比特幣成為去中心化金融的高效、可組合資產,同時加強網絡共識。 這是一個正在發展的故事。本文在發布前由編輯 Jeffrey Albus 審核,並在 AI 的協助下生成。在您的收件箱中獲取新聞。探索 Blockworks 通訊:來源:https://blockworks.co/news/botanix-launches-stbtc
分享
BitcoinEthereumNews2025/09/18 02:37
GTC 2026:NVIDIA推出Space-1 Vera Rubin太空運算模組,為太空領域提供基於AI的創新能力

GTC 2026:NVIDIA推出Space-1 Vera Rubin太空運算模組,為太空領域提供基於AI的創新能力

NVIDIA於GTC 2026大會宣布NVIDIA Space-1 Vera Rubin太空運算模組,將資料中心級的運算利凝聚到尺寸、重量與能號受限的尺寸,將最新的加速運算模組帶到軌道資料中心、地面地理空間成像與自主太空操作等創新領域。包括Aetherflux、Axiom Space、Kepler Communicat
分享
Cool3c2026/03/17 05:34
GTC 2026:NVIDIA預覽2028年Feynman世代產品藍圖,確認光傳輸、電傳輸並行的網路擴展架構及代號Rosa的新CPU

GTC 2026:NVIDIA預覽2028年Feynman世代產品藍圖,確認光傳輸、電傳輸並行的網路擴展架構及代號Rosa的新CPU

NVIDIA執行長黃仁勳於GTC 2026也再度釋出下一步的產品藍圖規畫,除了進一步確認NVIDIA將在2028年更新至Feynman世代以外,也確立屆時將會維持現行Operon機架系統與Kyber機架系統並行策略,同時黃仁勳強調,Feynman世代將邁入光傳輸與電傳輸並行的網路擴展架構,提供彈性但面相未來的網路架構選
分享
Cool3c2026/03/17 05:14