Spam Score – сигналы вероятности спамноcти сайта


136
136 points
Spam Score - сигналы вероятности спамноcти сайта

реклама

27 сигналов Spam Score, которые использует Moz.

*В данной статье есть упоминание соцсетей Instagram и Facebook запрещены в РФ; они принадлежат корпорации Meta, 
которая признана в РФ экстремистской.

Spam Score (SS) — метрика оценки вероятности спамного сайта.

Важно понимать, что оценка вероятности того, что ресурс будет санкционирован Google, даже при оценке в 100%, не является гарантией. Другие показатели, такие как ценность контента, время, проведенное на сайте и общая авторитетность ресурса, также могут играть роль. Если исключить “спамные” факторы из оценки по 27 пунктам, то это может повысить общую ценность сайта и авторитетность ресурса. Оценка спама основана на модели машинного обучения, выявившей 27 общих признаков среди миллионов запрещенных или оштрафованных сайтов в Google, и хотя многие из них могут относиться к англоязычному сегменту Интернета, многие сигналы актуальны и для других частей Сети.

⚫Оценка от 1% до 30% считается низким показателем спама.

⚫Оценка от 31% до 60% считается средней оценкой спама.

Сигналы Spam Score

1. Низкое количество найденных страниц.
Наши краулеры обнаружили лишь небольшое количество страниц на этом домене. Это не проблема, но многие спамерские сайты имеют небольшое количество страниц, отсюда и корреляция.

2. TLD коррелирует со спамными доменами.
Некоторые домены верхнего уровня (например, .download .stream .win .biz) чаще всего ассоциируются со спамными сайтами.

3. Длина доменного имени.
Длина поддомена и корневого домена аналогична тем, которые используются на спамерских сайтах.

4. Доменное имя содержит цифры.
Наличие в доменном имени цифр часто ассоциируется со спамерскими сайтами.

5. Наличие Google Font API.
Домены, в которых не используются специальные шрифты (например, Google Font API), чаще всего оказываются спамерскими сайтами. Отсутствие этой специальной функции шрифта было распространено среди обнаруженных нами спам-сайтов.

6. Google Tag Manager.
Google Tag Manager почти никогда не присутствует на спамерских сайтах.

7. Doubleclick.
Рекламный тег Doubleclick почти никогда не присутствует на спамерских сайтах.

8. Номер телефона присутствует.
На спамерских сайтах редко присутствуют реальные номера телефонов.

9. Ссылки на LinkedIn.
Почти ни один спамерский сайт не имеет связанной с ним страницы LinkedIn, следовательно, отсутствие этой функции коррелирует со спамом.

10. Адрес электронной почты.
Адреса электронной почты почти никогда не присутствуют на спамерских сайтах.

реклама

-->

11. HTTPS по умолчанию.
Немногие спамерские сайты вкладывают средства в SSL-сертификаты; HTTPS часто является хорошим сигналом доверия.

12. Использование мета-ключевых слов.
Страницы, использующие тег мета-ключевых слов, с большей вероятностью являются спамом, чем те, которые его не используют.

13. Рейтинг посещений.
Сайты с очень малым количеством посещений в панелях clickstream чаще оказываются спамом, чем сайты с большим количеством посещений.

14. Rel Canonical.
Использование нелокального тега rel=”canonical” часто ассоциируется со спамом.

15. Длина тега Title.
Страницы с очень длинными или очень короткими тайтлами коррелируют со спамными сайтами.

16. Длина метаописания.
Страницы с очень длинными или очень короткими тегами метаописания коррелируют со спамными сайтами.

17. Длина Meta Keywords.
Страницы с очень длинными тегами meta keywords часто встречаются на спамных сайтах.

18. Иконка браузера.
Спам сайты редко используют фавикон, а неспам сайты используют часто.

19. Пиксель Facebook.
Пиксель отслеживания Facebook почти никогда не присутствует на спамерских сайтах.

20. Количество внешних ссылок.
Спам-сайты чаще имеют аномально высокое или низкое количество внешних ссылок.

21. Количество доменов, на которые ссылаются.
Спамерские сайты, чаще имеют аномально высокие или низкие уникальные домены, на которые они ссылаются.

22. Соотношение внешних ссылок и контента.
Спам сайты чаще имеют ненормальное соотношение ссылок и контента.

23. Гласные/согласные в доменном имени.
Спам сайты часто имеют много последовательных гласных или согласных в своем доменном имени.

24. Дефисы в доменном имени.
Спам-сайты чаще используют несколько дефисов в своем доменном имени.

25. Длина URL-адреса.
Спам-страницы часто имеют аномально короткие или длинные URL-адреса.

26. Наличие ядовитых слов.
Спам-сайты часто используют специфические слова, которые ассоциируются с такими темами спама, как фармацевтика, контент для взрослых, игры и другие.

27. Использование анкорного текста с высоким CPC.
Спам сайты часто используют в анкорном тексте ссылок специфические слова, которые ассоциируются с такими темами спама, как фармацевтика, контент для взрослых, игры и другие.

Не забываем подписываться на наши телеграм каналы:

CPAGRAM — Арбитраж трафика и маркетинг

CPAGRAM Арбитражные кейсы

CPA и арбитраж трафика

Шарим трафик и CPA

CPA MOZG

Тизеры и креативы

 

реклама

-->

CPAGRAM

0 Comments

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Этот сайт использует Akismet для борьбы со спамом. Узнайте, как обрабатываются ваши данные комментариев.

реклама

-->