Купить крипто Рынки Спот ФьючерсыMU Сбережения Центр событий

Еще

BitcoinWorld Patronus AI привлекает 50 млн$ для создания «цифровых миров», которые стресс-тестируют ИИ-агентов. ИИ-агенты стремительно развиваются, переходя от простых ответов на вопросыBitcoinWorld Patronus AI привлекает 50 млн$ для создания «цифровых миров», которые стресс-тестируют ИИ-агентов. ИИ-агенты стремительно развиваются, переходя от простых ответов на вопросы

Patronus AI привлекает $50 млн для создания «цифровых миров», тестирующих ИИ-агентов

Источник: bitcoinworld

2026/06/26 04:45

4м. чтение

AI$0.02193-1.08%

Для обратной связи или замечаний по поводу данного контента, свяжитесь с нами по адресу [email protected]

BitcoinWorld

Patronus AI привлекает 50 000 000$ для создания «цифровых миров», где проводится стресс-тестирование ИИ-агентов

ИИ-агенты развиваются стремительно: от простых ответов на вопросы — к автономному выполнению сложных многоэтапных задач, таких как бронирование поездок или анализ финансовых данных. Но прежде чем этим агентам можно будет доверять в реальных приложениях, разработчикам необходима строгая уверенность в том, что они надёжно работают в бесчисленных сценариях. Patronus AI — стартап из Сан-Франциско, основанный в 2023 году бывшими исследователями Meta AI Анандом Каннаппаном и Ребеккой Цянь, — привлёк 50 000 000$ в рамках финансирования серии B для расширения своего решения: симулированных цифровых сред, проводящих стресс-тестирование ИИ-агентов после обучения.

Как Patronus AI оценивает поведение агентов

Patronus AI создаёт то, что компания называет «моделями цифрового мира», — копии веб-сайтов и внутренних систем, в которых агенты тестируются с использованием обучения с подкреплением. Этот процесс итеративно поощряет успешное выполнение задач и наказывает за ошибки, позволяя ИИ учиться на своих ошибках в безопасной, контролируемой среде. Компания сравнивает свой подход с тем, как Waymo обучал автономные транспортные средства с помощью синтетических миров для симуляции редких опасностей, например сильного снегопада или ребёнка, бегущего за мячом. Для ИИ-агентов задача иная: они нередко находят обходные пути, из-за которых тонко проваливают выполнение задач.

Уверенность инвесторов и стремительный рост

Раунд серии B возглавила Greenfield Partners при участии Notable Capital, Lightspeed, Datadog и Samsung, в результате чего общий объём финансирования Patronus достиг 70 000 000$. По словам Гленна Соломона, управляющего директора Notable Capital, спрос на симулированные среды Patronus «практически ненасытен». Выручка стартапа выросла в 15 раз за прошедший год, что отражает высокий интерес как со стороны передовых ИИ-лабораторий, так и со стороны молодых стартапов. «Patronus очень хорошо умеет выявлять уловки и обеспечивать ответственность моделей», — сказал Соломон.

Почему это важно для индустрии ИИ

Традиционные бенчмарки зачастую не способны отразить, как ИИ-агент будет справляться со сложными реальными задачами. Patronus стремится заполнить этот пробел, предоставляя среды, в которых агенты могут тестироваться на протяжении длительного времени — часов, дней или даже недель. Сейчас компания сосредоточена на разработке программного обеспечения и финансах, однако планирует выйти в области, которые сложнее верифицировать, — например, творческие задачи или принятие открытых решений. «Сегодня мы очень сосредоточены на верифицируемых проблемах, — сказал Каннаппан, — но существует огромное количество областей, которые совершенно не поддаются верификации».

Конкуренция и дифференциация

Patronus считает своими основными конкурентами внутренние команды по оценке в крупных ИИ-лабораториях. В то время как компании по работе с данными, такие как Mercor и Surge, помогают с обучением с подкреплением через обратную связь от людей, Patronus работает без какого-либо участия человека в процессе оценки. Этот полностью автоматизированный подход обеспечивает масштабируемое и последовательное тестирование, способное выявлять граничные случаи и неожиданное поведение.

Заключение

Последний раунд финансирования Patronus AI свидетельствует о растущей уверенности инвесторов в необходимости строгой автоматизированной оценки ИИ-агентов. По мере того как агенты становятся всё более автономными и встраиваются в критически важные задачи, инструменты, обеспечивающие их надёжность, будут незаменимы. Модели цифрового мира компании предлагают многообещающий путь к более безопасному и надёжному внедрению ИИ в различных отраслях.

Часто задаваемые вопросы

В1: Каков основной продукт Patronus AI?
Patronus AI создаёт симулированные цифровые среды — так называемые «модели цифрового мира», — которые тестируют ИИ-агентов после обучения. Эти копии веб-сайтов и внутренних систем позволяют агентам отрабатывать сложные задачи и оцениваться по критерию надёжности.

В2: Чем Patronus AI отличается от традиционных бенчмарков для ИИ?
Традиционные бенчмарки измеряют производительность на конкретных задачах, но не отражают того, как агент справляется с реальной сложностью, включая неожиданные сценарии или обходные пути. Patronus использует обучение с подкреплением в симулированных средах для более тщательного стресс-тестирования агентов.

В3: Кто является клиентами Patronus AI?
Клиенты стартапа включают передовые ИИ-лаборатории и молодые стартапы, в особенности те, которые создают агентов для разработки программного обеспечения и финансов. Компания планирует со временем расширить присутствие в других секторах.

Этот материал Patronus AI привлекает 50 000 000$ для создания «цифровых миров», где проводится стресс-тестирование ИИ-агентов впервые появился на BitcoinWorld.

Возможности рынка

Gensyn Курс (AI)

$0.02193

$0.02193$0.02193

+3.34%

USD

График цены Gensyn (AI) в реальном времени

CHZ +28%! История повторяется?

Лонг и шорт позиции с 0 комиссией. Будьте готовы!

Отказ от ответственности: Статьи, размещенные на этом веб-сайте, взяты из общедоступных источников и предоставляются исключительно в информационных целях. Они не обязательно отражают точку зрения MEXC. Все права принадлежат первоисточникам. Если вы считаете, что какой-либо контент нарушает права третьих лиц, пожалуйста, обратитесь по адресу [email protected] для его удаления. MEXC не дает никаких гарантий в отношении точности, полноты или своевременности контента и не несет ответственности за любые действия, предпринятые на основе предоставленной информации. Контент не является финансовой, юридической или иной профессиональной консультацией и не должен рассматриваться как рекомендация или одобрение со стороны MEXC.