OpenAI Lansează Filtrul de Confidențialitate pentru Detectarea și Redactarea PII
Caroline Bishop Apr 24, 2026 15:27
OpenAI prezintă Filtrul de Confidențialitate, un model pentru detectarea și redactarea PII cu acuratețe de ultimă generație. Disponibil acum pentru dezvoltatori.
OpenAI a introdus Filtrul de Confidențialitate, un nou model AI open-weight conceput pentru a detecta și redacta informațiile de identificare personală (PII) din text. Lansat pe 23 aprilie 2026, instrumentul oferă acuratețe de ultimă generație pentru fluxurile de lucru privind confidențialitatea, stabilind un nou standard pentru protejarea datelor sensibile.
Filtrul de Confidențialitate își propune să abordeze provocările îndelungate din domeniul detectării PII, depășind sistemele tradiționale bazate pe reguli. Spre deosebire de instrumentele mai vechi care se bazează pe tipare deterministe pentru formate precum numere de telefon sau adrese de e-mail, acest model utilizează înțelegerea avansată a limbajului pentru a analiza text nestructurat și a lua decizii conștiente de context. De exemplu, poate diferenția între informații publice și private, o capacitate esențială în scenariile nuanțate de confidențialitate.
Una dintre caracteristicile sale remarcabile este capacitatea de a funcționa local, ceea ce înseamnă că datele sensibile pot fi procesate direct pe mașina utilizatorului fără a fi trimise către servere externe. Acest design reduce riscul expunerii datelor și este deosebit de valoros pentru aplicațiile sensibile la confidențialitate din industrii precum sănătatea, finanțele și serviciile juridice.
Modelul este optimizat pentru utilizare în producție, cu eficiența ca element central. Poate procesa până la 128.000 de tokeni de context într-o singură trecere, menținând rate ridicate de precizie și recuperare. Pe benchmark-ul PII-Masking-300k utilizat pe scară largă, Filtrul de Confidențialitate a obținut un scor F1 de 96%, urcând la 97,43% pe o versiune corectată a setului de date. Aceste scoruri evidențiază capacitatea sa de a detecta încălcări subtile și complexe ale confidențialității, minimizând în același timp falsele pozitive.
OpenAI a pus modelul la dispoziție sub o licență Apache 2.0 prin platforme precum Hugging Face și GitHub, încurajând dezvoltatorii să experimenteze, să îl ajusteze și să îl implementeze pentru nevoile lor specifice. Modelul suportă opt categorii PII, inclusiv private_person, private_address, private_email și account_number. Este configurabil pentru diverse fluxuri de lucru, permițând utilizatorilor să echilibreze precizia și recuperarea în funcție de prioritățile lor operaționale.
În ciuda capacităților sale, OpenAI recunoaște că Filtrul de Confidențialitate nu este o soluție autonomă pentru conformitatea reglementară sau revizuirea politicilor. Este un instrument conceput pentru a completa strategiile mai ample de confidențialitate prin proiectare. Modelul poate necesita evaluări sau ajustări suplimentare specifice domeniului pentru a se adapta la diferite industrii, limbi și convenții de denumire.
Această lansare face parte din efortul mai amplu al OpenAI de a îmbunătăți protecțiile de confidențialitate bazate pe AI. Compania a subliniat că scopul este ca sistemele AI să învețe din date fără a compromite confidențialitatea individuală. Prin open-source-izarea Filtrului de Confidențialitate, OpenAI urmărește să îi capaciteze pe dezvoltatori și organizații să integreze măsuri de protecție robuste a confidențialității în fluxurile lor de lucru.
Filtrul de Confidențialitate reprezintă un pas semnificativ înainte în tehnologia confidențialității, în special pe măsură ce industria AI se confruntă cu un control tot mai mare în ceea ce privește securitatea datelor și practicile etice. Pentru dezvoltatorii și companiile care doresc să își consolideze capacitățile de gestionare a PII, disponibilitatea modelului marchează o oportunitate crucială de a adopta instrumente de ultimă generație care prioritizează confidențialitatea utilizatorilor.
Sursă imagine: Shutterstock- ai
- confidențialitate
- openai
- pii
- securitatea datelor








