Факторы ссылочного ранжирования на основе анализа слитых документов Яндекса


199
199 points
Фактора ссылочного ранжирования на основе анализа слитых документов Яндекса

реклама

По слитым документам с факторами ранжирования:

Разбивка по тегам нереально облегчает поиск, группировку и анализ инфы по нужным факторам. При анализе факторов обращаем внимание на тег TG_UNUSED.

В первую очередь меня интересовали ссылочные факторы. Часть из них была знакома, часть в новинку. Выбрал интересные с моей точки зрения(TG_UNUSED и нет).

реклама

Не забываем подписываться на наши телеграм каналы:

CPAGRAM — Арбитраж трафика и маркетинг

CPAGRAM Арбитражные кейсы

CPA и арбитраж трафика

Шарим трафик и CPA

CPA MOZG

Тизеры и креативы

53 фактора ссылочного ранжирования

• “Относительная частота слов запроса в ссылках (1 – слова запроса часто встречаются в ссылках, 0.3 – редко); если точнее, значение этого фактора пессимизируется при условии: TR=0 && LR=0 && (нет ни одной ссылки со всеми словами запроса) && (не прошёл кворум) && (в тексте встречается хотя бы одна пара слов запроса)”
• “В ссылках есть все слова запроса”
• “В одной ссылке есть все слова запроса”
• “Есть ссылка, прошедшая кворум”
• “Какая доля ссылок “хорошая””
• “Насколько много “плохих” ссылок (плохой = dpr = 0)”
• “Максимальный dpr ссылки”
• “TfIdf обычный TF*IDF по ссылкам. Частота слова в ссылках умножается на обратную документную частоту и суммируется по всем словам, потом нормируется на длину документа.”
• “Есть точная форма всех слов запроса в тексте/линках”
• “Есть лемма всех слов запроса в тексте/линках”
• “Число ссылок, точно совпадающих с запросом”
• “Число обратное дисперсии временам появления ссылок со словами запроса”
• “Линковая релевантность с учетом тематичности”
• “Линковая релевантность с учетом качества каждой ссылки”
• “Линковая релевантность с учетом качества каждой ссылки и тематичности каждой ссылки”
• “Линковая релевантность с учетом некоммерческости каждой ссылки”
• “Линковая релевантность с учетом некоммерческости каждой ссылки, качества каждой ссылки и тематичности”
• “Процент входящих ссылок со словами запроса”
• “Процент слов запроса в ссылках (с точностью до синонима)”
• “В ссылках есть все слова запроса (с точностью до синонима)”
• “LR по парам слов запроса в обратном порядке”
• “LR по парам слов запроса через одно слово в текстах”
• “Средний возраст ссылок, внесших что-то в LR LinkAge=Min(log(средний возраст ссылки)/7, 1), за 1 принято 3 года”
• “LR с учетом совпадения языка ссылки и запроса и накрученности”
• “LR по отписанию в Яндекс.Каталоге”
• “Максимальный возраст значимого скопления ссылок, внесших что-то в LR””Хост ранк по максимально выраженному слову запроса (обычно это название сайта)”
• “Доля входящих продажных ссылок. Реализован алгоритм распознавания коммерческих ссылок. Фактор ремапится на [0,1] если доля таких ссылок > 50%, иначе 0.”
• “Фактор CommLinksSEOHosts умноженный на NonCommercialQuery”
• “Характеризует частоту слов в ссылках. Фактор большой, если слово, сыгравшее в линковой релевантности, редкое для ссылок.”
• “Вес слов запроса, которые есть в линках”
• “Простой BM25 по точной форме в текстах ссылок”
• “LR по ссылкам из Яндекс.Маркета”
• “Дополнительные факторы про раскрученность сайта линковыми кольцами”
• “Линковая релевантность с пессимизацией за большой возраст линка”
• “Хостовые факторы, определяют сайты, накрученные линками – вторая и третья входящие степени”
• “Считали LinkQuality для этой страницы или нет (не считали, если ссылок мало)”
• “Количество различных внутренних ссылок на страницу”
• “Периодичность ссылок на сайт”
• “Количество почти-периодических ссылок”
• “Считает сумму вхождений следующего вида: последовательность слов запроса длиной больше двух, встретившихся в одной ссылке; нормировано на кол-во ссылок.”
• “Число входящих ссылок с морд”
• “Бинарный фактор, каждое слово запроса есть в тексте или в линках”
• “Отношение числа входящих ссылок, текст которых является URL, к числу всех входящих ссылок”
• “Количество входящих сео-треш ссылок между хостами”
• “Доля уникальных триграмм заголовка в триграммах ссылок”
• “Сумма максимальных значений SourceRank’ов для каждой входящей ссылки с учётом уникальности владельца.”
• “BM25 по текстам и линкам со спец. весами по уровню совпадения (форма, лемма, синоним)”
• “Вес слов запроса, которые есть в тексте в точной форме”
• “Позволяет оценить является ли документ ‘живым’ с точки зрения ссылок на него приходящих.”
• “Дисперсия количества слов запроса в ссылках.”
• “BM с затуханием по тексту каталожных ссылок.”
• “На данный урл есть ссылка из Infobox-ов в Википедии.”
• “Ранк качества текстов на хосте. Чем выше — тем больше вероятность того, что хост полон статей – рерайта, плохого копирайта, заказанного на биржах контента.

реклама

-->

CPAGRAM

0 Comments

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Этот сайт использует Akismet для борьбы со спамом. Узнайте, как обрабатываются ваши данные комментариев.

реклама

-->