Интернет - это гипертекстовая среда, навигация по которой осуществляется с помощью ссылок (линков). Поэтому чем больше сайтов ссылаются на конкретный ресурс, тем больше вероятность перехода на него посетителей и выше популярность. На этом базируется идея ссылочной цитируемости. Однако учитывать исключительно количество ссылок недальновидно. Данным параметром легко манипулировать, добавляя ссылки на множество сайтов. Поэтому при расчете цитируемости сайта вводятся дополнительные параметры, которые определяют итоговый "вес" каждой ссылки и ее влияние на цитируемость сайта в целом. Существует четыре основных критерия, определяющих качество ссылки: цитируемость сайта, на котором установлена ссылка, тематика сайта, расположение ссылки и якорный текст. Они ограничивают возможность искусственного "накручивая" цитируемости. Больше ценятся ссылки с близких по тематике сайтов, имеющих высокий показатель цитируемости. Логика простая: если авторитетный ресурс рекомендует данный сайт, то поисковые машины тоже считают его интересным для пользователей. Существенное влияние оказывает местоположение ссылки на сайте. Линк на главной странице имеет большее значение, чем аналогичная ссылка на странице второстепенного раздела. Теоретически начальная страница - самая популярная на сайте, и поэтому ссылки с нее должны цениться выше. Этой же логике следуют поисковые машины. Еще один параметр, определяющий ценность ссылки - ссылочный текст (иногда его называют якорный текст). Он располагается между тегами <a> и </a>. Наличие в нем ключевых фраз повышает ценность ссылки.
Систему учета внешних ссылок впервые разработала компания Google. Настоящей революцией стало введение критерия Page Rank (сокр. PR), который учитывает не только количество, но также качество ссылок. В том или ином виде технологию Google стали применять другие поисковые машины. Поэтому когда речь заходит о работе с внешними критериями релевантности, большое внимание уделяется именно Page Rank. Разработчики формулы исходили из того, что пользователи Интернета начинают путешествие по глобальной паутине с произвольного ресурса. Далее они могут перейти по одной из расположенных на странице ссылок или закрыть сайт. Вероятность второго случая принята за 0,15. В большинстве случаев (0,85) пользователь перейдет по ссылке на другую страницу. Параметр Page Rank показывает вероятность нахождения посетителя на конкретной странице.
R(A)= C*(R(B1)/N1+...+R(Bi)/Ni) где: R(A) - Page Rank страницы R(Bi) - Page Rank ссылающейся страницы Bi Ni - количество ссылок на странице B С - коэффициент сглаживания (затухания), используется для страницы или группы страниц. Препятствует "накрутке" Page Rank. Обычно равен 0,15 Параметр Page Rank рассчитывается отдельно для каждой страницы. Поэтому на одном сайте могут быть страницы с различным PR. Как правило, максимальное значение параметра у главной страницы, так как большинство внешних ссылок ставятся на нее. Как видно из формулы, каждая страница получает часть PR ссылающихся на нее страниц. При этом она также передает часть своего PR страницам, на которые ссылается. Чем выше значение PR и меньше ссылок на странице, тем больше PR она передает по ссылкам. Важно отметить, что формула никак не учитывает текст линков. Точное значение Page Rank узнать невозможно. Google ранжирует значение PR на диапазоны от 0 до 10. При этом значение PR и порядок диапазона связаны не напрямую, а посредством логарифмической шкалы. Наглядно связь PR и диапазонов можно показать таблицей: