Искусственный интеллект, как научный руководитель

Здесь в Кракове вспоминал вчера, как я, не программист, работал с кодом раньше?

Сначала, пару лет назад, я просто давал куски кода: кто‑то использовал Sonnet 3.5, или GPT 4, ещё даже не 4, и просил его находить ошибки в конкретных функциях, улучшать их и так далее. Это было для прототипизации, но контекст быстро кончался, и код «терялся». Я копировал фрагменты обратно в свой скрипт и проверял, работает ли всё. Работу делал полностью вручную, вытаскивая программирование по кусочкам, как кирпичики.

Потом появился Cursor. Он стал смотреть на код и предлагать изменения на уровне файла или нескольких. Затем появился Claude Code — он начал файлы прям херачить за меня. Появились в Курсоре чаты и полуавтоматические треды, всё ломалось и запутывалось в итоге, постоянно надо было контролировать. 

Когда контекст иссякал, Cursor и Claude начинали придумывать вещи, врать, и всё разваливалось. Здесь мы были больше года назад.

Claude Code стал бороться с этим лучше остальных, и у нас появились агенты, которые передавали друг другу информацию о проекте, видели весь код и анализировали его. 

Затем появился Devin (и подобные) — набор агентов, сохраняющих сессию и подсказки о том, как работать с код‑базой, а также подбирающих контекст из репозитория. У Cognition, которые придумали Девин, был продукт DeepWiki, который по сутие RAG для документации и кода — и они активно использовали его в Devin для качественного контекста.

Так или иначе, Devin всё равно устаёт, но он интегрируется с Github, куда можно призвать других ревьюеров. CodeRabbit, Seer, Claude, Codex… которые дают советы без знания системы, часто бесполезные, но всё‑равно лучше, чем ничего. По-прежнему — только человек знает систему полностью и продолжает ревью автоматических PR.

Но что-то поменялось буквально за прошлый месяц.

Вчера я сделал мобильную версию и ТЁМНУЮ ТЕМУ для большого энтерпрайз аппа! За 4 часа работу целого месяца.

Было интересно: сперва с помощью Gemini Pro и Claude создал большой документ, описывающий, что нужно сделать и где в коде. Он смотрит в репозиторий, мы меняем только front-end — внешний вид и мобильность, понятно куда в коде смотреть, а куда лезть не стоит.

ОК, документ (пятая его версия) утверждён, по последней версии Claude Opus 4.5 ошибок не показывает. Понёс это к исполнителю.

Devin начал работу и в конце прогнал подробнное Review. Он видит свои же комментарии и даёт советы — типа багов, флагов. Я поработал, скопировал баги и флаги обратно в чатик — ну, мы там пообщались, поправили что-то. Будто с человеком всё.

Гигантский PR собрался, у Devin тупо кончался контекст, приходилось перезапускать, мол, продолжи отсюда. Review при этом продолжало расти, в нём по сути сохранился весь процесс, это позволяет видеть всю историю.

Теперь вижу так ситуацию. Можно сделать 5 тредов в Devin (ограничение контекстного окна), а на сложный таск история всех изменений, проблем и правок останется в review. 

Тред не удержит всё, что делаешь с кодом — это временный подход, пока «студент» не устал. Процесс написани «диплома» — в Review. Там же встречи и логи общения с «научруком».

«Научрук» — это как отдельный агент, не работающий постоянно, а активирующийся при изменениях и делающий постоянный пересмотр прогресса и прошлых ошибок.

Вчера я — опытный специалист, одна штука — выполнил месячную работу связки фронтендер+тестер за 4 часа. Потратив, конечно, много ментальной энергии, как в математической олимпиаде поучаствовал. Но результат получился на 90 % готов к продакшену.

Мы с Девином добавили почти  2000 строк чисто фронтенда, проверили всё в браузере и выкатили на дев. Теперь чуть напильником допилить и во вторник — в прод.

Devin вышел на агентский уровень: он ругает результаты не с позиции сферического программиста вакуума, а с учётом нашей базы знаний и записок, которые вся команда собирает пока общается с «научруком».

Всё чудесатее и чудесатее, снова приятное ощущение, что летим выше, выше, быстрее!

Добавить комментарий прямо сейчас