Серия постов «Epoch/Эпоха»

Серия «Epoch/Эпоха»

Kapibara1980

Лига программистов

Кажется, я понял, почему LLM так любят разговаривать. И почему это можно изменить⁠⁠

Серия Epoch/Эпоха

8 часов назад

Кажется, я понял, почему LLM так любят разговаривать. И почему это можно изменить.

Недавно пересмотрел фильм «Прибытие» (Arrival).

И поймал себя на мысли, что самое важное в нём — не инопланетяне.

Главная идея фильма в том, что меняется не словарь.

Меняется сама модель мышления.

После этого я решил провести небольшой эксперимент с Codex во время разработки своего мода Epoch World Host для RimWorld.

Не менял модель.

Не искал «идеальный промпт».

Я попробовал изменить только один вопрос.

Вместо:

Что должен делать агент?

Я спросил:

Что агент считает завершённой работой?

По умолчанию большинство LLM отлично умеют поддерживать разговор.

Они отвечают.

Предлагают ещё идеи.

Заканчивают сообщения чем-то вроде:

"Если хочешь, я могу..."

Это логично. Их задача — продолжать диалог.

Я попробовал заменить этот контракт другим.

Вместо:

Produce responses.

на:

Produce artifacts.

И добавил очень простое правило.

После каждого ответа задавать всего один вопрос.

What changed?

Если ответ:

Nothing.

значит работа не была выполнена.

Каким бы красивым ни был текст.

Постепенно из этого родился простой цикл:

Observe ↓ Inspect ↓ Evidence ↓ Artifact ↓ Stop

И начали происходить интересные вещи.

Например, раньше при проблемах со средой агент мог начать рассуждать о проекте почти вслепую.

После изменения контракта он однажды вернул примерно следующее:

попытался выполнить pwd;
получил ошибку среды;
честно сообщил, что не смог исследовать проект;
остановился.

То есть вместо красивой импровизации появился проверяемый артефакт.

Я начал называть это Artifact Delta Rule.

Ответ считается полезным только в одном из двух случаев:

проект изменился;
появилось новое проверенное знание о проекте.

Если не произошло ни того, ни другого — ответ пустой.

Пока это всего лишь серия экспериментов.

Я не утверждаю, что нашёл универсальный способ работы с агентами.

Но у меня появилось ощущение, что следующий этап развития таких систем — это не столько новые промпты, сколько контракты выполнения работы.

Не:

"будь умнее";
"объясняй лучше";
"думай глубже";

а:

что считается доказательством;
что считается завершением задачи;
какой результат должен остаться после взаимодействия.

Именно здесь я неожиданно вспомнил «Прибытие».

Там меняется не объём знаний героини.

Меняется сама структура мышления.

Возможно, с агентами происходит что-то похожее.

Мы слишком долго учили их отвечать.

Может быть, пора начать учить их работать.

Интересно, экспериментировал ли кто-нибудь с подобными контрактами?

Не с «лучшими промптами», а именно с изменением критерия завершения задачи. Если да — какие изменения в поведении моделей вы заметили?

Показать полностью 3

Kapibara1980

TECHNO BROTHER

От журнала событий к модели мира⁠⁠

Серия Epoch/Эпоха

15 часов назад

Epoch World Host — это адаптер реальности для RimWorld. Он собирает состояние мира, отслеживает ключевые сигналы колонии и подстраивает вмешательства так, чтобы мод органично работал поверх обычных механик. В основе — широкая совместимость и минимальное вмешательство в саму игру.
Сейчас базовая версия уже работает и выглядит стабильной.
Epoch World Host — адаптер реальности для RimWorld. Мод подстраивает вмешательства, чтобы работать поверх обычных механик без лишнего шума. Базовая версия уже живая и стабильная.

https://www.nexusmods.com/rimworld/mods/686

[моё] Статья Тестирование Инженер Развитие Исследования Rimworld

Отличная работа, все прочитано!

Серия «Epoch/Эпоха»

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества

Теги

Популярные авторы

Сообщества