Подробный обзор систем Гугл поиска от Марио Фишера + схема

Статья основана на данных из утечки документации и материалов антимонопольного дела. Написана очень понятным языком, рекомендую к прочтению — это отличная систематизация знаний.

Гугл работает с бесчисленным множеством микросервисов, которые взаимодействуют друг с другом и генерируют атрибуты для документов, которые используются в качестве сигналов самыми разными системами ранжирования и переранжирования и с помощью которых нейронные сети обучаются делать прогнозы.

Про NavBoost
Каждая позиция в SERP имеет средний ожидаемый показатель СTR, служащий эталоном производительности. Если фактический CTR результата значительно отстает от ожидаемого, система NavBoost регистрирует это несоответствие и соответствующим образом корректирует рейтинг DocID. Если результат исторически генерирует значительно больше или меньше кликов, чем ожидалось, NavBoost переместит документ вверх или вниз в ранжировании по мере необходимости.


Про Tangram
Система Tangram занимается геометрической оптимизацией пространства SERP, вычисляя, сколько места требуется каждому элементу и сколько результатов помещается в имеющиеся «ящики». Затем система Glue расставляет эти элементы в соответствующих местах.


Про Twiddlers
В поиске используется несколько сотен систем Twiddler’ов — их можно сравнить с плагинами WordPress. Каждый Twiddler имеет свою собственную конкретную цель фильтра. Они разработаны таким образом, потому что их относительно легко создать и они не требуют изменений в сложных алгоритмах ранжирования в Ascorer. Изменение этих алгоритмов является сложной задачей и требуют обширного планирования и программирования из-за потенциальных побочных эффектов. В отличие от этого, Twiddlers работают параллельно или последовательно и не знают о действиях других Twiddlers.