Серия «Epoch/Эпоха»

Кажется, я понял, почему LLM так любят разговаривать. И почему это можно изменить

Серия Epoch/Эпоха

Кажется, я понял, почему LLM так любят разговаривать. И почему это можно изменить.

Недавно пересмотрел фильм «Прибытие» (Arrival).

И поймал себя на мысли, что самое важное в нём — не инопланетяне.

Главная идея фильма в том, что меняется не словарь.

Меняется сама модель мышления.

После этого я решил провести небольшой эксперимент с Codex во время разработки своего мода Epoch World Host для RimWorld.

Не менял модель.

Не искал «идеальный промпт».

Я попробовал изменить только один вопрос.

Вместо:

Что должен делать агент?

Я спросил:

Что агент считает завершённой работой?

По умолчанию большинство LLM отлично умеют поддерживать разговор.

Они отвечают.

Предлагают ещё идеи.

Заканчивают сообщения чем-то вроде:

"Если хочешь, я могу..."

Это логично. Их задача — продолжать диалог.

Я попробовал заменить этот контракт другим.

Вместо:

Produce responses.

на:

Produce artifacts.

И добавил очень простое правило.

После каждого ответа задавать всего один вопрос.

What changed?

Если ответ:

Nothing.

значит работа не была выполнена.

Каким бы красивым ни был текст.

Постепенно из этого родился простой цикл:

Observe ↓ Inspect ↓ Evidence ↓ Artifact ↓ Stop

И начали происходить интересные вещи.

Например, раньше при проблемах со средой агент мог начать рассуждать о проекте почти вслепую.

После изменения контракта он однажды вернул примерно следующее:

  • попытался выполнить pwd;

  • получил ошибку среды;

  • честно сообщил, что не смог исследовать проект;

  • остановился.

То есть вместо красивой импровизации появился проверяемый артефакт.

Я начал называть это Artifact Delta Rule.

Ответ считается полезным только в одном из двух случаев:

  • проект изменился;

  • появилось новое проверенное знание о проекте.

Если не произошло ни того, ни другого — ответ пустой.

Пока это всего лишь серия экспериментов.

Я не утверждаю, что нашёл универсальный способ работы с агентами.

Но у меня появилось ощущение, что следующий этап развития таких систем — это не столько новые промпты, сколько контракты выполнения работы.

Не:

  • "будь умнее";

  • "объясняй лучше";

  • "думай глубже";

а:

  • что считается доказательством;

  • что считается завершением задачи;

  • какой результат должен остаться после взаимодействия.

Именно здесь я неожиданно вспомнил «Прибытие».

Там меняется не объём знаний героини.

Меняется сама структура мышления.

Возможно, с агентами происходит что-то похожее.

Мы слишком долго учили их отвечать.

Может быть, пора начать учить их работать.


Интересно, экспериментировал ли кто-нибудь с подобными контрактами?

Не с «лучшими промптами», а именно с изменением критерия завершения задачи. Если да — какие изменения в поведении моделей вы заметили?

Показать полностью 3

От журнала событий к модели мира

Серия Epoch/Эпоха

Epoch World Host — это адаптер реальности для RimWorld. Он собирает состояние мира, отслеживает ключевые сигналы колонии и подстраивает вмешательства так, чтобы мод органично работал поверх обычных механик. В основе — широкая совместимость и минимальное вмешательство в саму игру.
Сейчас базовая версия уже работает и выглядит стабильной.
Epoch World Host — адаптер реальности для RimWorld. Мод подстраивает вмешательства, чтобы работать поверх обычных механик без лишнего шума. Базовая версия уже живая и стабильная.

От журнала событий к модели мира

https://www.nexusmods.com/rimworld/mods/686

Отличная работа, все прочитано!

Темы

Политика

Теги

Популярные авторы

Сообщества

18+

Теги

Популярные авторы

Сообщества

Игры

Теги

Популярные авторы

Сообщества

Юмор

Теги

Популярные авторы

Сообщества

Отношения

Теги

Популярные авторы

Сообщества

Здоровье

Теги

Популярные авторы

Сообщества

Путешествия

Теги

Популярные авторы

Сообщества

Спорт

Теги

Популярные авторы

Сообщества

Хобби

Теги

Популярные авторы

Сообщества

Сервис

Теги

Популярные авторы

Сообщества

Природа

Теги

Популярные авторы

Сообщества

Бизнес

Теги

Популярные авторы

Сообщества

Транспорт

Теги

Популярные авторы

Сообщества

Общение

Теги

Популярные авторы

Сообщества

Юриспруденция

Теги

Популярные авторы

Сообщества

Наука

Теги

Популярные авторы

Сообщества

IT

Теги

Популярные авторы

Сообщества

Животные

Теги

Популярные авторы

Сообщества

Кино и сериалы

Теги

Популярные авторы

Сообщества

Экономика

Теги

Популярные авторы

Сообщества

Кулинария

Теги

Популярные авторы

Сообщества

История

Теги

Популярные авторы

Сообщества