Bodyguard o aplicație franceză care protejează împotriva comentariilor urâtoare de pe YouTube și Twitter -

Creat de un tânăr dezvoltator francez în vârstă de 22 de ani, Bodyguard își protejează utilizatorii de comentariile urâtoare de pe YouTube și Twitter. Aplicația discută din ce în ce mai mult despre aceasta și pare să-și fi găsit audiența, mai ales în rândul YouTuberilor care acum o folosesc zilnic peste o mie. Cu 97% dintre utilizatori mulțumiți și peste 17.000 de comentarii blocate, Bodyguard pare a fi un bastion eficient împotriva urii pe internet. Pentru a afla mai multe despre serviciu și cum funcționează, i-am adresat creatorului său: Charles Cohen câteva întrebări.

Cum a apărut ideea de a crea această aplicație? ?

M-am născut în generația YouTube, un site pe care l-am frecventat de când aveam 10 ani (când am început dezvoltarea). YouTube este un site unde hărțuirea cibernetică este prezentă încă de la începuturile sale și face ravagii din ce în ce mai mari (închiderea canalului etc.). Într-o zi am dat peste un articol despre sinuciderea unei tinere fete ca urmare a agresiunii cibernetice foarte agresive și am făcut unele cercetări doar pentru a constata că există o mulțime de cazuri similare. Apoi am început să caut soluțiile care erau prezente pentru a combate eficient această problemă: niciuna. Întotdeauna mi-am dorit să dezvolt un startup bazat pe această tehnologie, a fost momentul perfect, mai ales că a îndeplinit o nevoie reală. Am luat apoi pariul și riscul de a mă apuca de dezvoltarea unei AI (fără nicio noțiune de AI), despre care știam că trebuie să aibă o rată de eroare foarte scăzută/fals pozitivă, cu riscul de a-mi pierde imediat utilizatorii, cuvânt de gura și clasificarea Bodyguard drept „cenzor”.

De cât timp lucrezi la acest proiect ?

Lucrez la proiect de 1 an acum, iar aplicația a fost lansată acum 6 luni. M-am confruntat cu o problemă uriașă la început: nu aveam date și nu aveam date pentru a putea antrena bodyguardul să detecteze comentariile de ură. A trebuit să fac niște lucrări de etichetare în primele 3 luni: spunându-i manual Bodyguard-ului ce era urăsc și ce nu era urăsc, pe baza „ciocnirilor” de pe Twitter. Munca de etichetare și învățarea umană continuă până în prezent, dar acum am o bază de date cu 500.000 de comentarii clasificate.

Din punct de vedere tehnic, cum funcționează ?

Garda de corp este gestionată de inteligență artificială: reproduce o acțiune care necesită în mod normal un creier uman (vezi: moderație). Analizăm contextul propoziției și ne adaptăm la utilizatorul pe care îl protejăm. Pentru a rezuma rapid:

În primul rând, căutăm propoziția pentru o serie de cuvinte urâtoare sau o insultă (printre o combinație de câteva zeci de milioane de cuvinte), indiferent de ortografie, emoji, limba SMS, limba LEET, indiferent dacă utilizatorul încearcă să cenzurați insulta sau ocoliți Garda de Corp.

Într-un al doilea pas, vom analiza contextul, și anume ceea ce este înainte și după aceste cuvinte, și pe baza căruia luăm o primă decizie: urât sau nu urăsc.

nu asculta tâmpenii care spun că ești o curvă -> detectată ca ne-urâtă de Bodyguard.
esti un p uuuuuuuuuuuuu t e -> urios.
Uneori vorbesc serios -> nu urăsc.
chiar esti un groooooosssssssseeeeeeeeeeeeeeeeeee ****** -> urios.
t mama c tlmnt 1 p * te -> urios.

Acestea sunt exemple de bază, dar tehnologia, desigur, funcționează cu toate tipurile de violență: amenințări, hărțuire sexuală, moral, trolling, batjocură, ură, homofobie, insulte, rasism ...

Urât -> batjocură -> urât.
Nu te supăra pe cei care spun că ești urât -> nu urăsc.
T video c rahat, nu glumesc -> nu urăsc.
Nu ești frumoasă -> urâtă.
Ești frumoasă -> nu urâtă.
Nu-i asculta pe cei care spun că ești frumoasă -> batjocură -> urâtă.
Ești cu adevărat frumoasă, nu glumesc. -> batjocură -> urât.
Meriți să fii violat. -> hărțuire sexuală -> urâtă.
Mama ta merită palme -> amenințare -> urâtă.
Ești mare 👃 -> batjocură