Gmail sada mnogo bolje prepoznaje spam nakon značajnog unapređenja
Prepoznavanje neželjene pošte u Gmailu trebalo bi da se poboljša zahvaljujući unapređenju identifikacije teksta na nekim Google uslugama.

Novi detektor spama testiran je interno tokom godinu dana
Zahvaljujući ovom sigurnosnom unapređenju, Google tvrdi da je Gmail sada 38% bolji u prepoznavanju neželjene pošte.
Kompanija je nedavno najavila ažuriranje putem objave na Google Security blogu. Pre toga, testirano je interno u Google-u tokom poslednje godine i predstavlja “najveće unapređenje u odbrani u poslednjim godinama”, kako navodi kompanija.
Nova dodatna opcija u prepoznavanju neželjene pošte u Gmailu je RETVec, što označava skraćenicu za Resilient & Efficient Text Vectorizer. Vektorizatori teksta koriste se za identifikaciju sadržaja emaila koji ponekad može biti skriven od strane pošiljaoca. Manipulacijom slova i simbola, korišćenjem homoglifa (različiti znakovi koji izgledaju slično), dodavanjem nevidljivih znakova i korišćenjem pretrpavanja ključnih reči, pošiljalac može pokušati da izbegne filtere za neželjenu poštu.
“RETVec postiže ova poboljšanja koristeći veoma lagan model ugradnje reči (~200k parametara)”, rekao je Google u objavi. “Omogućavajući nam da smanjimo veličinu Transformer modela pri jednako dobroj ili boljoj performansi, i da imamo mogućnost deljenja računanja između domaćina i Tensor Processing Unit (TPU) na efikasan način u vezi sa mrežom i memorijom.”
Najveća prednost RETVec-a je što je 38% bolji u prepoznavanju neželjene pošte, ali postoje i mnoga druga unapređenja. Ovo poboljšanje tačnosti uključuje smanjenje lažnih pozitiva za gotovo 20% i lažnih negativa za gotovo 18%. Lažni negativi su kada Gmail-ov detektor neželjene pošte ne uspe da filtrira email kao neželjen, dok su lažni pozitivi kada se validni emailovi netačno svrstavaju kao neželjeni.
S obzirom na to da je Google uspeo da smanji veličinu Transformer modela, upotreba RETVec-a smanjila je upotrebu Tensor Processing Unit-a za 83%. To je značajna efikasnost koja proizilazi iz korišćenja ovog novog vektorizatora teksta u Gmailu.
RETVec je razvijen od strane Google Research tima i potpuno je otvorenog koda. Nakon dugog internog testiranja u Google-u, kompanija je utvrdila da je “izuzetno efikasan za bezbednost i primene protiv zloupotreba”.
Osobe koje žele koristiti RETVec za svoje aplikacije mogu pratiti tutorijal od Google-a koji objašnjava kako početi.
Izvor: Androidcentral