Ранжирование 

— процесс сортировки страниц в порядке убывания по степени их значимости для пользователя (релевантности).

Со времен основания поисковых систем алгоритмы ранжирования существенно усложнились, качество поиска выросло.

Так, поисковая система Яндекс с ноября 2009 года использует метод машинного обучения «Матрикснет», запущенный в новом алгоритме под названием «Снежинск».

Он позволяет строить и применять сложную формулу ранжирования, в которой используются тысячи факторов и их комбинации.

Процесс ранжирования
Эволюция поисковых алгоритмов Яндекса

Процесс

Условно процесс ранжирования можно разделить на два этапа:

Поскольку на одном сайте может быть несколько страниц, дающих ответ на запрос пользователя, из них выбирается одна, наиболее релевантная.

Чтобы показать наибольшее количество сайтов, в поисковой выдаче для одного сайта показывается, как правило, только одна страница.

В некоторых случаях могут показываться по несколько страниц с одного сайта.

Показатель релевантности определяется посредством применения сложных многоступенчатых формул, где учитываются различные факторы и их комбинации.

Одним из главных факторов оценки релевантности считается степень соответствия содержимого страницы введенному запросу.

В Яндексе к этому фактору практически всегда добавляется региональная принадлежность сайта.

Страницы, которые были отобраны при первой фильтрации, участвуют в дальнейшем, более строгом, отборе.

Чем выше значение релевантности, тем больше факторов участвует в процессе ранжирования страницы и тем точнее она оценивается.

Причем для самых релевантных страниц значения тех или иных факторов может быть различным.

Процесс ранжирования
Определение релевантности с учетом динамических факторов

Факторы

При вычислении релевантности поисковыми системами используются несколько основных групп факторов:

Кроме положительных факторов ранжирования, увеличивающих релевантность страницы и сайта, поисковыми системами могут применяться санкции в виде пессимизации, т.е. намеренное занижение позиций в выдаче. Это так называемые фильтры, которые из-за грубых нарушений могут быть наложены на отдельную страницу, на пару «запрос — страница», а также на сайт в целом.

После вычисления значения релевантности страницы сортируются относительно друг друга. Чем больше значение релевантности для страницы, тем выше она окажется в результатах поиска.