Наталья Казаченко — руководитель группы аналитики качества рекомендаций Яндекс.Дзена. Именно она руководит подразделением Дзена, отвечающим за борьбу со спамом (которой долго занималась единолично), а также за ограничение публикаций.
Поэтому интервью, которое она дала журналисту Андрею Байкалову, ведущему подкаста «Ценная инфа» и автору канала в Дзене «Фигачу на удалёнке с 2011 года», на мой взгляд представляет особый интерес.
Мне очень приятно, что Андрей при подготовке интервью спросил меня, что бы я хотел спросить у Натальи, и я очень рад, что в итоге услышал ответы на некоторые из вопросов.
Интервью доступно на платформе Яндекс.Музыка, а я хочу остановиться на нескольких моментах, которые показались мне особенно интересными.
О роли толокеров
Я очень надеюсь, что толокеры, т.е. те, кто выполняет различные задания на сервисе Яндекс.Толока, не знают то, как к ним относятся многие авторы Дзена. Тем более, что это отношение во многом незаслуженно — они не принимают единоличных решений о «судьбе» публикации.
Наталья рассказала, что в день приходится «размечать» порядка 100 тыс. публикаций. Делается это преимущественно в автоматическом режиме, но с участием людей.
Толока используется для разметки публикаций, которые будут использованы для обучения алгоритмов. А алгоритмы принимают решение. При этом если алгоритм «не уверен», то решение принимается модераторами. В команде модераторов порядка 100 человек, каждый из которых за день проверяет порядка 100-200 публикаций.
О двух полосках и «плоскоземельщиках»
Ответ на вопрос о противоречии качества пользовательским реакциям меня откровенно расстроил.
С момента появления «двух полосок» — реакций, авторов беспокоит вопрос, что условная публикация о том, что Земля круглая, наберёт негативные реакции от сторонников плоской земли, и это приведёт к тому, что она фактически будет ограничена в показах.
Наталья в ответ рассказала, что чем меньше купальник на карточке, тем больше пользовательских реакций. Конечно, термин «метрика трусиков», о котором она рассказала, забавный, но хотелось бы понимания, как быть тем каналам, которые в силу темы не могут рассчитывать на «зелёные» реакции пользователей.
На мой взгляд — это две разные проблемы и решать их нужно по-разному.
Интервью получилось интересное. Поэтому я не буду изображать из себя испорченный телефон, послушайте его сами.