Как работает SGE (Search Generative Experience) и почему поисково-дополненная генерация (RAG, retrieval-augmented generation) — это наше будущее

Основательное исследование Майкла Кинга (агентство iPullRank) вышло на Search Engine Land.
Некоторые тезисы:

  • Google SGE меняет подход к поиску информации: поиск, каким мы его знаем, был безвозвратно изменен генеративными нейросетями
  • в долгосрочной перспективе, возможно, мы будем вспоминать 10 синих ссылок также, как мы вспоминаем мини-диски и пейджеры
  • очевидно, что трафик 10 синих ссылок для подавляющего большинства запросов будет находиться под угрозой, CTR первой позиции выдачи, скорее всего, резко упадет
  • стремительные улучшения продукта и недавние заявления Сундара Пичаи о его будущем позволяют предположить, что SGE никуда не денется
  • достижения в области обработки естественного языка (NLP, natural language processing), начавшиеся с улучшения поиска, дали нам большие языковые модели на основе трансформеров (transformer-based large language models)
  • по сути, поиск становится многомерным, и задача создателей контента в том, чтобы их контент прошел несколько этапов, чтобы оставаться в наборе для рассмотрения
  • принято считать, что Google создал SGE как ответ Bing’у в начале 2023 года. Однако исследовательская группа Google представила реализацию RAG в своей статье, опубликованной в августе 2020 года
  • SGE использует комбинацию языковых моделей PaLM 2 и MuM с элементами поиска Google (это известно из открытых источников)
  • скорость генерации ИИ-ответа с момента запуска SGE существенно увеличилась
  • интерфейс SGE все еще находится в процессе развития (недавно полный ответ скрыли под кнопкой «Показать еще»)
  • SGE чаще всего использует первые 6 результатов из топ-10 для построения своего ответа, но в 9,5% случаев он не использует ни один из топ-10 результатов.