Спам-фильтр ВКонтакте и с чем его едят.

Antoshka23

Member
Messages
9
Reputation
1
Reaction score
4
Points
3
Сейчас попробую рассказать о своих наблюдениях за спам-фильтром (СФ) вк.

Где-то я читал о том, что этот фильтр с искусственным интеллектом (ИИ). По началу испугался, но после недели исследований стало ясно, что его ИИ заключается в нескольких вполне логичных формулах.

Как СФ определяет сообщения в папку "спам"?
Фильтр ведет статистику по словам и ссылкам, которые приходят в систему с отправляемых акков (не учитываются лишь кристально белые слова, вроде "привет", "смотри статус"). Далее слова и ссылки делятся на белые и потенциальный спам (те, что пометили пользователи). Как же фильтр ставит точку и решает, что сообщение - спам? Дело в процентом соотношении общего числа сообщений к потенциальному спаму, играет роль и интервал с которым пользователи помечают сообщение как спам (это я про рассылку по онлайну).

?SPAM*100/ALL = х%

Если х%>хз%, то сообщение помечается как спам. В вычислении хз% не было необходимости. Хотя сделать это элементарно, если кому нужно могу подсказать как.

Дополнение от m_script:
M_script said:
Фильтр ведет статистику не столько по словам и ссылкам, сколько по сочетанию слов и ссылок.
Если в сообщении есть слова X1, X2, X3 и ссылка Y1, и такое сообщение 100% идет в спам, то соо6щение со словами X1, X2 и ссылкой Y1 (или X2, X3, Y1) в спам может не идти. X и Y являются не конкретным набором символов, а чем-то вроде регулярок. Самообучаемость заключается в анализе таких сочетаний и автоматическом добавлении их в базу спам-фильтра. Учитываются сообщения, отмечаемые юзерами, как спам. Также есть бот, проверяющий ссылки. Он без проблем проходит по многим видам редиректов и видит конечную страницу. Бот анализирует контент страницы примерно по тому же принципу, что и фильтр сообщений.


Как повысить качество рассылки и сделать спам-блок (СБ) минимальным?
Многие из нас рассылают по схеме 1к акков = 20к сообщений. Допустим есть аудитория в 50к id. Взяли 2.5к акков, разослали. 40% (минимум) уйдет в спам в первый же день, т.е. если из этих 40% сообщений прочитать успели хотя бы 10%, то мы потеряем 30% нашей ценной аудитории. Сейчас так работать нельзя! Не стану запаривать вас формулами, наблюдениями и прочей водой, просто поделюсь опытом: не скупитесь на акках, шлите по 5-8 сообщений с акка. СБ в этом случае минимален. В сочетании с грамотным рандомом он состовляет до 10%.

---

Подобная схема работы СФ используется также и на других сайтах.

Автор статьи antoshka23. Копирование, продажа и распрастраниние данной статьи строго запрещены. Узнаю - найду и накажу!

---

Кому необходимо, могу поделиться софтом для массовой рассылки по друзьям (под вк). Стучите в пм, людям с хорошей репутацией и старой регой выдам бесплатно.

p.s. в этой теме можете задавать вопросы на тему спама в контакте, по возможности буду отвечать.
 

GETHARD

Carder
Messages
62
Reputation
5
Reaction score
5
Points
8
Отличная статья, спасибо!

Сейчас двигаю один свой легальный проект в ВК и уже запарился попадать под спам-фильтр в ЛС. буду пробовать твой метод. Если бы еще в аське с тобой пообщаться, есть пару вопросов...
 
Top