SAFE: Search-Augmented Factuality Evaluator (оценка фактов, дополненная поиском)

Новый метод, разработанный Google DeepMind для проверки достоверности фактов в тексте. Он лучше, чем рейтеры-люди и в 20 раз дешевле. Хотя цель состоит в том, чтобы повысить точность LLM в длинных текстах, я думаю, что у него довольно много применений в поиске.

Он называется SAFE (Search-Augmented Factuality Evaluator — Оценщик фактов, дополненный поиском) и анализирует длинные тексты, разбивая их на отдельные факты. Затем проверяет их точность, используя результаты поиска Google (да, рискованно, но это работает).
Не кажется ли вам, что это эволюция RECITE (RECITation-augmented gEneration)?

Возможные варианты использования:

заменить рейтеров
улучшить результаты, прежде всего, с точки зрения проверки фактов во featured snippets
как помощники по написанию текстов в режиме реального времени.

via Natzir Turrado @ X