OpenAI запускає Privacy Filter для виявлення та редагування PII

Caroline Bishop 24 квітня 2026 18:27

OpenAI представляє Privacy Filter — модель для виявлення та редагування PII з найсучаснішою точністю. Вже доступна для розробників.

OpenAI запускає Privacy Filter для виявлення та редагування PII

OpenAI представила Privacy Filter — нову ШІ-модель з відкритими вагами, призначену для виявлення та редагування персональних ідентифікаційних даних (PII) у тексті. Випущений 23 квітня 2026 року, інструмент забезпечує найсучаснішу точність для робочих процесів із захисту конфіденційності, встановлюючи новий орієнтир для захисту чутливих даних.

Privacy Filter має на меті вирішити давні проблеми виявлення PII, виходячи за межі традиційних систем на основі правил. На відміну від старіших інструментів, що спираються на детерміновані шаблони для форматів на кшталт номерів телефонів або адрес електронної пошти, ця модель використовує розширене розуміння мови для аналізу неструктурованого тексту та прийняття контекстно-зважених рішень. Наприклад, вона може розрізняти публічну та приватну інформацію — ключова можливість у складних сценаріях конфіденційності.

Однією з визначних особливостей є можливість працювати локально, тобто чутливі дані можна обробляти безпосередньо на машині користувача без відправлення на зовнішні сервери. Така конструкція знижує ризик витоку даних і є особливо цінною для застосунків, чутливих до конфіденційності, у галузях охорони здоров'я, фінансів та юридичних послуг.

Модель оптимізована для виробничого використання з ефективністю в основі. Вона може обробляти до 128 000 токенів контексту за один прохід, зберігаючи високі показники точності та відкликання. На широко використовуваному бенчмарку PII-Masking-300k Privacy Filter досяг показника F1 96%, піднявшись до 97,43% на виправленій версії набору даних. Ці показники підкреслюють його здатність виявляти тонкі та складні порушення конфіденційності, мінімізуючи хибні спрацьовування.

OpenAI зробила модель доступною за ліцензією Apache 2.0 через платформи Hugging Face та GitHub, заохочуючи розробників експериментувати, налаштовувати та розгортати її для своїх конкретних потреб. Модель підтримує вісім категорій PII, включаючи private_person, private_address, private_email та account_number. Її можна налаштувати для різних робочих процесів, дозволяючи користувачам балансувати між точністю та відкликанням відповідно до їхніх операційних пріоритетів.

Попри свої можливості, OpenAI визнає, що Privacy Filter не є самостійним рішенням для дотримання нормативних вимог або перегляду політики. Це інструмент, призначений доповнювати ширші стратегії конфіденційності за задумом. Модель може потребувати додаткової доменно-специфічної оцінки або налаштування для адаптації до різних галузей, мов і правил найменування.

Цей випуск є частиною ширших зусиль OpenAI з посилення захисту конфіденційності, керованого ШІ. Компанія наголосила, що мета полягає в тому, щоб системи ШІ навчалися на даних, не порушуючи індивідуальної конфіденційності. Відкриваючи вихідний код Privacy Filter, OpenAI прагне надати розробникам та організаціям можливість інтегрувати надійні засоби захисту конфіденційності у свої робочі процеси.

Privacy Filter являє собою значний крок уперед у технологіях конфіденційності, особливо коли галузь ШІ стикається з дедалі більшою увагою до безпеки даних та етичних практик. Для розробників і компаній, які прагнуть зміцнити свої можливості обробки PII, доступність моделі є вирішальною можливістю впровадити передові інструменти, що ставлять конфіденційність користувачів на перше місце.

Джерело зображення: Shutterstock