BitcoinWorld
Patronus AI、AIエージェントのストレステストを行う「デジタルワールド」構築に5,000万ドルを調達
AIエージェントは急速に進化しており、単純な質問応答から、旅行の予約や財務データの分析といった複雑な多段階タスクを自律的に実行するまでになっています。しかし、これらのエージェントが実際のアプリケーションで信頼されるようになるには、無数のシナリオにわたって確実に機能することを厳格に保証する必要があります。2023年にMeta AIの元研究者であるAnand KannappanとRebecca Qianによってサンフランシスコで設立されたスタートアップ、Patronus AIは、シリーズBで5,000万ドルを調達しました。この資金は、トレーニング後のAIエージェントをストレステストするシミュレーションデジタル環境というソリューションの拡大に充てられます。
Patronus AIは「デジタルワールドモデル」と呼ばれるものを構築しています。これはウェブサイトや内部システムのレプリカであり、エージェントは強化学習を使用してテストされます。このプロセスはタスクの完了に成功した場合に報酬を与え、エラーにはペナルティを課すことを繰り返し、AIが安全で管理された環境でミスから学べるようにします。同社はこのアプローチを、Waymoが悪天候やボールを追いかける子供などの稀な危険をシミュレートする合成世界を使って自動運転車を訓練した方法に例えています。AIエージェントの場合、課題は異なります。エージェントはしばしば近道をとり、微妙な形でタスクに失敗することがあります。
シリーズBラウンドはGreenfield Partnersが主導し、Notable Capital、Lightspeed、Datadog、Samsungが参加し、Patronusの累計調達額は7,000万ドルに達しました。Notable CapitalのマネージングディレクターであるGlenn Solomonによると、Patronusのシミュレーション環境への需要は「ほぼ飽くことがない」状態です。同スタートアップの収益は過去1年間で15倍に成長し、フロンティアAIラボや新興スタートアップの双方から強い関心を集めていることが伺えます。「Patronusはハックを発見し、モデルの説明責任を確保することに非常に優れています」とSolomonは述べました。
従来のベンチマークは、AIエージェントが複雑な実世界の業務においてどのようなパフォーマンスを発揮するかを捉えることができないことが多いです。Patronusは、エージェントが数時間、数日、あるいは数週間にわたってテストできる環境を提供することで、そのギャップを埋めることを目指しています。現在はソフトウェアエンジニアリングと金融に注力していますが、同社はクリエイティブなタスクや自由な意思決定など、検証が難しい分野への拡大を計画しています。「今日、私たちは検証可能な問題に非常に集中しています」とKannappanは言いました。「しかし、検証が非常に難しい分野がもっとたくさんあります。」
Patronusは、主要なAIラボの社内評価チームを主な競合相手と見ています。MercorやSurgeのような人間データ企業が人間のフィードバックによる強化学習を支援する一方、Patronusは評価プロセスに人間を一切介在させずに運営しています。この完全自動化されたアプローチにより、エッジケースや予期しない動作を明らかにできる、スケーラブルで一貫性のあるテストが可能となります。
Patronus AIの最新の資金調達ラウンドは、厳格で自動化されたAIエージェント評価の必要性に対する投資家の信頼が高まっていることを示しています。エージェントがより自律的になり、重要なタスクに組み込まれるにつれて、その信頼性を確保するツールが不可欠になります。同社のデジタルワールドモデルは、各業界でより安全で信頼性の高いAIの展開に向けた有望な道筋を提供しています。
Q1: Patronus AIの主な製品は何ですか?
Patronus AIは「デジタルワールドモデル」と呼ばれるシミュレーションデジタル環境を構築し、トレーニング後のAIエージェントをテストします。これらのウェブサイトや内部システムのレプリカにより、エージェントは複雑なタスクを練習し、その信頼性を評価することができます。
Q2: Patronus AIは従来のAIベンチマークとどう違いますか?
従来のベンチマークは特定のタスクのパフォーマンスを測定しますが、予期しないシナリオや近道を含む実世界の複雑さにエージェントがどう対処するかを捉えることはできません。Patronusはシミュレーション環境で強化学習を使用し、エージェントをより徹底的にストレステストします。
Q3: Patronus AIの顧客は誰ですか?
同スタートアップの顧客には、フロンティアAIラボや新興スタートアップ、特にソフトウェアエンジニアリングや金融向けのエージェントを構築している企業が含まれます。同社は時間をかけて他のセクターにも拡大する予定です。
この記事 Patronus AI、AIエージェントのストレステストを行う「デジタルワールド」構築に5,000万ドルを調達 は最初にBitcoinWorldに掲載されました。
