„Yahoo“ piktnaudžiavimo nustatymo algoritmas veikia 90% laiko ir tai yra didelis žingsnis į priekį savo srityje

kompiuterio algoritmo pagalba

„Yahoo“ naujienų straipsniuose yra daug nemalonių komentarų, panašiai kaip ir visame internete, todėl „Yahoo“ komanda nusprendė naudoti savo komentarų skiltį, norėdama sukurti algoritmą, kuris galėtų sėkmingai nustatyti blogiausius pažeidėjus. Jų naujas piktnaudžiavimo nustatymo algoritmas dirba 90 procentų laiko, o tai, jų teigimu, daro jį efektyvesniu nei kitų organizacijų bandymai imtis panašių žygdarbių ir apibūdinami kaip svarbus žingsnis pirmyn šioje srityje. 90 proc daro skamba gana gerai, aš pripažįstu.

Laidinis praneša, kad „Yahoo“ taip pat išleidžia pirmąją viešai prieinamą internetinės neapykantos kalbos duomenų bazę kaip savo kovos su piktnaudžiavimu projektą. Tai reiškia, kad kitos svetainės galės naudoti „Yahoo“ komentarų duomenų bazę savo algoritmams kurti. „Yahoo“ algoritmas buvo sukurtas remiantis mašininiu mokymusi ir vartotojo pateiktais duomenimis apie jų komentarų skyrius.

Kebliausia komentarus moderuojančio algoritmo dalis yra klaidingų teigiamų rezultatų nagrinėjimas. Daugelis piktnaudžiavimą nustatančių algoritmų ieško konkrečių žodžių ar frazių, pvz., Šmeižto ar įprasto įžeidimo, ir automatiškai pažymi komentarus, kad jie būtų moderuoti. Tačiau dėl to komentarai žymimi, net jei jie, pavyzdžiui, nurodo, kad jie yra netinkami, arba jei komentaras yra sarkastiška trolio imitacija. „Yahoo“ algoritmas, matyt, gali aptikti tam tikrus kalbos modelius, ir jis sukurtas tam, kad būtų galima atskirti juokaujamą sarkazmą nuo faktinio piktnaudžiavimo. (Žinoma, jei jūsų linksmas komentaras neatsiejamas nuo faktinio piktnaudžiavimo, tada esu tikras, kad algoritmas vis tiek jį pažymės, bet negaliu tiksliai pasakyti, kaip ta AI dalis veikia.)

„Yahoo“ pasitelkė apmokytus komentarų moderatorius, kurie padėtų tobulinti algoritmą, be to, jie taip pat mokėjo kai kuriems neapmokytiems moderatoriams. Jie nustatė, kad apmokyti moderatoriai daug geriau išsiaiškino, kurie komentarai yra tinkami (kažkoks ne protas, bet, hei). Kurdamas dirbtinį intelektą, „Yahoo“ nustatė, kad šių apmokytų žmogaus moderatorių darbas buvo būtinas norint išlaikyti algoritmo efektyvumą ir tobulinti jo aptikimo būdus.

Žinoma, algoritmai vis dar turi šališkumų , todėl prireiks (tikiuosi, įvairios) moderatorių komandos, kuri ir toliau kartos komentarų klasifikavimui naudojamas metodikas. Skamba kaip sunkus darbas, tačiau bent jau „Yahoo“ dabar supranta mokymo svarbą ir vertina tiek gerai apmokytų moderatorių, tiek naujojo dirbtinio intelekto kolegos vaidmenis.

George'as Lucas išprievartavo mūsų vaikystę

(per Kitas internetas , vaizdas per Michaelas Cordedda / „Flickr“ )