АЛГОРИТЪМЪТ ЗА ЗЛОУПОТРЕБА НА YAHOO РАБОТИ 90% ОТ ВРЕМЕТО

помощ на компютърен алгоритъм

Статиите в новините на Yahoo съдържат много неприятни коментари, подобно на останалата част от интернет, така че екипът на Yahoo реши да използва раздела за коментари, за да разработи алгоритъм, който може успешно да идентифицира най-лошите нарушители. Техен нов алгоритъм за откриване на злоупотреба работи в 90 процента от времето, което според тях го прави по-ефективен от опитите на други организации да предприемат подобни подвизи и е описано като голяма стъпка напред в тази област. 90 процента прави звучи доста добре, признавам.

Кабелен съобщава, че Yahoo пуска и първата публично достъпна подбрана база данни за онлайн реч на омразата като част от техния проект за борба със злоупотребите. Това означава, че други сайтове ще могат да използват базата данни с коментари на Yahoo, за да проектират свои собствени алгоритми. Алгоритъмът на Yahoo е разработен въз основа на машинно обучение, а също и на съобщени от потребителите данни за техните раздели за коментари.

Най-сложната част от всеки алгоритъм за модериране на коментари се занимава с фалшиви положителни резултати. Много алгоритми за откриване на злоупотреба търсят конкретни думи или фрази, като обиди или обидни обиди, и автоматично сигнализират коментарите за модериране. Това обаче води до маркиране на коментари, дори ако те се позовават на измама в контекста, че например не е подходящо, или ако коментарът е саркастична имитация на трол. Очевидно алгоритъмът на Yahoo може да открие определени модели на реч и е създаден, за да може да разпознае разликата между сарказма на джоки и действителната злоупотреба. (Разбира се, ако вашият весел коментар е неразличим от действителната злоупотреба, тогава съм почти сигурен, че алгоритъмът все още ще го маркира, но не мога да кажа със сигурност как работи тази част от AI.)

Yahoo привлече обучени модератори на коментари, за да помогнат за усъвършенстването на алгоритъма, а също така платиха на някои нетренирани модератори и установиха, че обучените модератори са много по-добре да разберат кои коментари са подходящи (нещо като без умове, но хей). По време на създаването на AI Yahoo установи, че работата на тези обучени човешки модератори е от съществено значение за поддържане на ефективността на алгоритъма и усъвършенстване на техниките му за откриване.

Разбира се, алгоритмите все още имат пристрастия , което би наложило (надявам се разнообразен) екип от човешки модератори да продължи да повтаря методологиите, използвани за класифициране на коментарите. Звучи като трудна работа, но поне Yahoo сега разбира важността на обучението и оценяването на ролите както на техните добре обучени човешки модератори, така и на новия им колега от AI.