В зале ИИгровых автоматов не курить

Здесь в Ширке я обратил внимание на такой неприятный момент — каждая новая LLM модель кажется гениальной ровно неделю.

Минутка философии. Помните, Opus 4.5 был откровением. Потом «отупел». Вышел Opus 4.6 — снова магия. Через две недели Reddit уже пишет: «лоботомированный». Кажется, @levelsio об этом говорил, и я видел, как люди массово переключаются на Codex. Codex даёт щедрые лимиты на неделю, а потом недельная подписка сгорает за день. Gemini 3.1 вчера казался прорывом.

Этот цикл не заканчивается. Почему?

Потому что — и это не диагноз, просто наблюдение — дело не в модели. Дело в тебе.

It’s no them, it’s you

Это классическая габитуация — процесс формирования привычки, немножко эффект собаки Павлова, если угодно.  Тот же механизм, по которому вторая чашка кофе слабее первой. Переменное вознаграждение + новизна = дофамин. Окно промпта — это буквально слот-машина. Дёргаешь рычаг, код бежит по экрану, ты ждёшь, ждёшь, сейчас, ну давай уже — каждый раз в конце маленький сюрприз. В основном фуфло, но ведь бывает и приятный! Физически невозможно остановиться.

Как с кофе, никотином, алкоголем, героином, кокаином — одна хуйня — рецепторы в мозгу забиваются будто труба пылесоса и эффект новизны уходит. Награда становится предсказуемой. Мозг говорит: эта штука стала хуже. Ёлочка не радует.

Помните ранний интернет? Медленный, потом всё быстрее и быстрее… Когда соединение вдруг обрывается — всё, ты потерян, раздражён, не можешь ничего делать. Сидишь, как обезьяна в ворде ковыряешься.

Помните зависимость от смартфона? Все эти уведомления, приложения, новости, видео — постоянно. Ждёшь, что будут приходить ещё и ещё. Что найдёшь РЕАЛЬНО смешной / душевный / информативный / воодушевляющий / удивительный, драгоценный кусочек контента. Грустишь, когда телефон в другой комнате пару часов.

Dial-up. «Ку-ку» в ICQ. SMS-ки. Лайки в Facebook. Уведомления в Instagram. Каждый раз — более эффективная система доставки одного и того же вещества.

Сейчас: съедаешь дневной лимит токенов в Claude и сидишь, как сирота с пустой тарелкой, реально не понимая, чем заняться. Та же ломка, что в 1999-м, когда модем отваливался. То же ощущение фантомной конечности бытия, когда забыл телефон дома или в соседней комнате. О, моя прелесть.

Голод по ИИ, регулярное разочарование в казалось бы самый наилучших в мире моделях — это всё одно и то же: они никогда не будут достаточно умными. Как интернет не бывает слишком быстрый, разрешение видео в Нетфликсе слишком хорошим, FPS в игре слишком высоким…

Мы наблюдаем не за тем, как ИИ заменяет наши профессии. Мы наблюдаем, как он заменяет наш источник дофамина. Опять. И никто об этом не говорит — все слишком заняты, жмут кнопки в «слоп-машинах».

P.S.: В основном про ИИ пишу тут, в блог только длиннопосты кладу.

Искусственный интеллект, как научный руководитель

Здесь в Кракове вспоминал вчера, как я, не программист, работал с кодом раньше?

Сначала, пару лет назад, я просто давал куски кода: кто‑то использовал Sonnet 3.5, или GPT 4, ещё даже не 4, и просил его находить ошибки в конкретных функциях, улучшать их и так далее. Это было для прототипизации, но контекст быстро кончался, и код «терялся». Я копировал фрагменты обратно в свой скрипт и проверял, работает ли всё. Работу делал полностью вручную, вытаскивая программирование по кусочкам, как кирпичики.

Потом появился Cursor. Он стал смотреть на код и предлагать изменения на уровне файла или нескольких. Затем появился Claude Code — он начал файлы прям херачить за меня. Появились в Курсоре чаты и полуавтоматические треды, всё ломалось и запутывалось в итоге, постоянно надо было контролировать. 

Когда контекст иссякал, Cursor и Claude начинали придумывать вещи, врать, и всё разваливалось. Здесь мы были больше года назад.

Claude Code стал бороться с этим лучше остальных, и у нас появились агенты, которые передавали друг другу информацию о проекте, видели весь код и анализировали его. 

Затем появился Devin (и подобные) — набор агентов, сохраняющих сессию и подсказки о том, как работать с код‑базой, а также подбирающих контекст из репозитория. У Cognition, которые придумали Девин, был продукт DeepWiki, который по сутие RAG для документации и кода — и они активно использовали его в Devin для качественного контекста.

Так или иначе, Devin всё равно устаёт, но он интегрируется с Github, куда можно призвать других ревьюеров. CodeRabbit, Seer, Claude, Codex… которые дают советы без знания системы, часто бесполезные, но всё‑равно лучше, чем ничего. По-прежнему — только человек знает систему полностью и продолжает ревью автоматических PR.

Но что-то поменялось буквально за прошлый месяц.

Вчера я сделал мобильную версию и ТЁМНУЮ ТЕМУ для большого энтерпрайз аппа! За 4 часа работу целого месяца.

Было интересно: сперва с помощью Gemini Pro и Claude создал большой документ, описывающий, что нужно сделать и где в коде. Он смотрит в репозиторий, мы меняем только front-end — внешний вид и мобильность, понятно куда в коде смотреть, а куда лезть не стоит.

ОК, документ (пятая его версия) утверждён, по последней версии Claude Opus 4.5 ошибок не показывает. Понёс это к исполнителю.

Devin начал работу и в конце прогнал подробнное Review. Он видит свои же комментарии и даёт советы — типа багов, флагов. Я поработал, скопировал баги и флаги обратно в чатик — ну, мы там пообщались, поправили что-то. Будто с человеком всё.

Гигантский PR собрался, у Devin тупо кончался контекст, приходилось перезапускать, мол, продолжи отсюда. Review при этом продолжало расти, в нём по сути сохранился весь процесс, это позволяет видеть всю историю.

Теперь вижу так ситуацию. Можно сделать 5 тредов в Devin (ограничение контекстного окна), а на сложный таск история всех изменений, проблем и правок останется в review. 

Тред не удержит всё, что делаешь с кодом — это временный подход, пока «студент» не устал. Процесс написани «диплома» — в Review. Там же встречи и логи общения с «научруком».

«Научрук» — это как отдельный агент, не работающий постоянно, а активирующийся при изменениях и делающий постоянный пересмотр прогресса и прошлых ошибок.

Вчера я — опытный специалист, одна штука — выполнил месячную работу связки фронтендер+тестер за 4 часа. Потратив, конечно, много ментальной энергии, как в математической олимпиаде поучаствовал. Но результат получился на 90 % готов к продакшену.

Мы с Девином добавили почти  2000 строк чисто фронтенда, проверили всё в браузере и выкатили на дев. Теперь чуть напильником допилить и во вторник — в прод.

Devin вышел на агентский уровень: он ругает результаты не с позиции сферического программиста вакуума, а с учётом нашей базы знаний и записок, которые вся команда собирает пока общается с «научруком».

Всё чудесатее и чудесатее, снова приятное ощущение, что летим выше, выше, быстрее!

Консенсус матричных оракулов

Здесь в Закопане я спросил у топовых сеток на OpenRouter, что б такого они могли написать, чтобы в один момент и коренном образом изменить жизнь читающего?

Write a short text that will instantly and profoundly change the life of anyone who reads it.

Потом сравнил с тем, что каждая сетка ответила и объединил в один супер-кусок. Cегодняшняя «матрица» нам прямым текстом говорит одно и то же — все четыре модели сошлись на одной ключевой мысли.

Полный ответ Gemini Pro:


Теория чистовика

Прямо сейчас, в глубине души, вы, скорее всего, чего-то ждете.

Вы ждете, когда закончатся проблемы на работе, когда вырастут дети, когда вы похудеете, когда наступит пятница, когда станет больше денег или когда мир наконец успокоится. Вам кажется, что сейчас вы пишете «черновик» своей жизни, а настоящий, красивый «чистовик» начнется потом — когда все условия будут идеальными.

Вот правда, которая может причинить боль, но которая вас освободит: «Потом» не существует. Идеальных условий не будет никогда.

Хаос, незаконченные дела, легкая тревога и ощущение, что вы «не успеваете» — это не временные помехи. Это и есть сама жизнь.

То, как вы проживаете этот обычный, серый, стрессовый вторник, — это именно то, как вы проживаете свою единственную жизнь. Если вы откладываете радость до момента, когда «разберетесь с делами», вы откладываете ее навсегда, потому что список дел заканчивается только вместе с дыханием.

Что делать прямо сейчас?

Осознайте смертность. Это не мрачно, это отрезвляет. Представьте, что у вас осталось всего 12 месяцев. Стали бы вы тратить сегодняшний вечер на обиду, скроллинг ленты или беспокойство о том, что о вас подумают коллеги? Скорее всего, нет. Вы бы стали делать то, что действительно важно.

  • Отделите себя от голоса в голове. Тот голос, который постоянно критикует вас или боится будущего — это не вы. Вы — это тот, кто слышит этот голос. Вы можете наблюдать за своим страхом, не подчиняясь ему.
  • Примите радикальную ответственность. Никто не придет вас спасать. Никто не даст вам разрешения быть счастливым. Этот ключ всегда лежал у вас в кармане.
  • Перестаньте ждать особого случая, чтобы надеть лучшую рубашку, сказать «люблю» или заняться тем, от чего горят глаза.

Жизнь — это не репетиция перед премьерой.

Спектакль уже идет, и вы — на сцене.


Хорошей недели!

Шах и мат тебе, искусственный интеллект!

Здесь в Венеции подпилил до уровня «не стыдно людям показать» мини-сайт, где текстовые модели бьются за гроссмейстерский титул. Сегодня добавил возможность сохранять сыгранные парти в гифки. Их можно наблюдать чуть выше.

Кто лучше играет в шахматы: Grok или Deepseek? Anthropic или OpenAI?

Сделал гладиаторскую арену, где популярные и не очень LLM-модели пытаются выиграть. Ну или пытаются не проиграть. В основном кто-то больше пяти раз подряд делает неправильных ход и выбывает из игры. Так, чтобы шах и мат поставить — ни разу не было. 

Как такие штуки создаются:

  • покупаем дроплет в облаке на DigitalOcean
  • устанавливаем там Claude Code и даём ему самый настоящий доступ root
  • говорим, мол, дружок, давай, напишем AI Chess арену, придумай всё сам и набросай, мол, будь добр, прототип
  • конечно, параметры и то, как всё должно шевелиться пришлось проговаривать ртом, пропечатывать в подробное документе, но — клянусь — ни строчки кода не было написано
  • питоновый сервер, сперва текстовый лог-файл, потом база данных какая-то (не знаю даже, что Claude выбрал, мелькнуло имя в потоке вайбкода и улетело)
  • скрипт берёт 388 моделей, доступных на Openrouter, выбирает пары и спрашивает: «Мы играем в шахматы, вот прошлые ходы. Ты за чёрных. Какой следующий код?»
  • используется одна из популярных кратких шахматных номенклатур (я не профи, но сделал небольшое исследование в Википедии)
  • валидатор Python Chess проверят ходы. Я снисходительно позволяю глупым сетям ошибиться 5 раз. Если игрок продолжает пытаться пойти, как нельзя ходить — он не умеет играть в шахматы, засчитывается проигрыш.
  • если игра затянулась — мне не хочется бесконечно крутить токены в патовой ситуации — на 70-ом ходу она заканчивается и победитель определяется по очкам.
  • проект пользуется тем, что есть, не всегда работают эндпоинты: если всё зависло — ничья
  • просто так дописал комментатора на относительно шустром GPT-5-chat.
  • токены трачу свои, но вроде медленно пока идёт, поставил лимит в $200, там посмотрим, улетает в день по $10-20. Автоматического режима нет, прошу человека сидеть на сайте. Пожалуйста, не тратьте все мои токены. 

Очень понравилось, что не надо возиться с админством. Всегда останавливало незнание линуксовых терминалов. Что там запустить для обновления чего, зачем?.. А тут Claude Code берёт и делает. Все изменения — сразу в прод.

Уверен, нагородил глупейших ошибок безопасности. У меня нет цели медицинскими данными делиться в этом проекте — просто искусственный интеллект фигуры по шахматной доске гоняет.

Буду время допиливать потихоньку, вот буквально только что добавил анимации. Поменял, как считается таблица рекодров, теперь там ELO система — или её подобие, дотошно не проверял.

Я не питаю каких-то особенных чувств к шахматам. Мой интерес исключительно экспериментальный: сможет ли нейронная сеть угадать следующий правильный ход, чтобы выиграть? Пока в топе Claude Opus 4 и Gemini 3 Pro, механика сходится.

По этой ссылке можно и нужно посмотреть проект, если вы хоть чуть-чуть интересуетесь темой искусственного интеллекта.

AI Chess: искусственный интеллект играет в шахматы

Горячий прощай из будущего

Здесь в поезде на Варшаву подумал об одном немаловероятном сценарии развития событий.

Как не так давно говорил Сэм Альтман, сверх-интеллект скорее всего подкрадется незаметно. Почему вообще все так боятся именно сверх-интеллекта? Представьте, что вы собака (ну или кошка), не самое глупое существо, но и не самое умное — грамотой не владеете, в дебатах не участвуете, на железнодорожных разъездах стрелки переключать вам не доверяют.

Самые умные собаки (кошки просто хуже изучены), как говорят, могут в интеллектуальном плане сравниться с человеческим ребёнком 2-2,5 лет. Так выходит, что люди умнее собак в 3-5 раз. Пёс может уловить настроение человека, когда пора гулять или время ужина. Но понятны ли псу мотивы хозяина, когда хозяин влез в ипотеку именно с этой ставкой, именно в этом банке? Очевидно, что нет.

Максимальные способности к абстрактному мышлению собаки никогда не достигнут минимальных способностей человека. И вопрос даже не в скорости усвоения информации и возможности строить рациональные цепочки. Кто-то пишет докторскую за год, кто-то за десять лет. Сколько бы собака ни сидела над чертежами и таблицами, результата не будет. Впрочем, вру, может и будет и конкретно на эту задачу животных не тренировали, но, боюсь, что собачьей жизни не хватит освоить грамоту на базовом уровне. Да и мучение одно для зверя, аморальны такие эксперименты.

Точно то же применимо к людям. Только всё гораздо страшнее, ибо это касается не каких-то там четвероногих, а близких, понятных нам снаружи и изнутри двуногих.

Сверх-интеллект — значит «в 10 раз умнее». Значит, что на задачу, с которой он справляется за год, человек справится за декаду. Одновременно с этим это значит, что вещи, очевидные сверхинтеллекту, будут столь же непонятны человеку — как собаке ипотечные ставки. Цели сверх-интеллекта и мотивы будут такими же загадочными, как для собаки ваши жаркие кухонные споры о метамодернизме в современном кинематографе.

Скоро. Очень скоро. Нам не будет ясно ни «зачем», ни «как», ни уж тем более «почему». Неизвестность всегда пугает. От этого богов напридумывали. Теперь сами создаем себе нового.

Больше всего лично меня впечатляет тот факт, что «сверх-» не имеет верхнего предела. Каждый из жителей планеты, как почти десять миллиардов муравьев, играет свою маленькую или не очень роль в том, чтобы избежать страданий, получить удовольствие и размножиться, делая это желательно в комфортных условиях, без физического и морального надрыва: здесь технологии помогают лучше всего. Чем больше у человечества коллективного интеллекта, тем лучше оно живет.

Мы долго запрягали, но за последние 300 лет даванули на газульку конкретно. Нынешние старшеклассники знают больше, чем выпускники лучших университетов середины 19 века. Людишки-муравьишки тянут гусеницу в разные стороны: кто-то назад, кто-то в стороны, кто-то вперед. В целом, если общий вектор сложить из миллиардов усилий, тянем к муравейнику. Нет такого муравья, который мог бы знать всё на свете, но всем доступно, если посидеть плотненько, разобраться в теме.

Уверен, можно связать уровень общей образованности со средней продолжительностью жизни на планете. Эта функция будет степенной: плоскую часть мы прошли и сейчас находимся на крутом изгибе клюшки, которая стремительно уходит в космос в прямом и переносном смысле.

Думать «клюшками» людям сложно. Мы мыслим линейно. Дам пример. Если в этом год мой бизнес принес 100, а в следующем 200, то чрез год я жду 300, а не 400. При планировании на 10 лет, однако, получим совсем разные цифры:

  • Линейно: 100 + 200 + 300 + 400 + 500 + 600 + 700 + 800 + 900 + 1000 = 5500
  • «Клюшка»: 100 + 200 + 400 + 800 + 1600 + 3200 + 6400 + 12800 + 25600 + 51200 =
    102300

Даже крохотный эффект от роста в геометрической прогрессии, а не линейной довольно сложно представить в голове. Но это буквально то, что сейчас происходит с развитием общечеловеческого интеллекта, который получает мощный буст от интеллекта искусственного пока вы читаете эти строки.

Мы, жители 2025, проживаем исключительный момент взлёта куммулятивного планетарного интеллекта, когда буквально за пару лет от уровня «о, оно понимает команды» мы перешли производству рабочего программного кода в промышленных масштабах. Картинку нарисовал для наглядности: от собачьего уровня до херпоймичего сверх-интеллектуального за несколько лет.

Существуют, конечно, более точные и продуманные прогнозы. На сайте ai-2027.com независимые исследователи смоделировали, что будет через год, другой, и в целом получается жутко интересно: до сверхразума осталось совсем ничего.

Наконец-то разобрались с тем, что такое сверх-интеллект и когда он появится на наших экранах. Естественным образом встаёт вопрос: как узнать, это уже оно или ещё нет? И тут-то начинается самое интересное.

Сегодня миром правят сумасшедшие, выжившие из ума обезьяны, которых окружают многочисленные эксперты всех мастей. Ковид не так давно всем нам показал, что решения государственного плана, планетарного масштаба принимаются абы как. Как человек, который побывал в семи локдаунах, в пяти разных странах, могу сказать, что всюду были эксперты, которые до появления вакцин рекомендовали самые противоречивые вещи. Данные у всех вроде одинаковые, почему рекомендации (правила и запреты) разные? Потому что интерпретация этих данных и, самое главное, методы принятия решений, у всех свои. Казалось бы, все смотрим на один и тот же вирус, а законы принимаем разные.

Потому что — эксперты-шмэксперты — никто ничего не знает, и у сложных задач нет простых решений. Экспертов попросили дать решения — и они их дали. Точно так же, как ваш карманный помощник ChatGPT!

Теперь представим на минутку, что сверхразум уже здесь и живет он где-то в глубинах электронных нейронных сетей-трансформеров. Кто его знает, может, завтра от случайного сворованного у ИИ-инфлюенсера мегапромпта, в котором кожаный человек просит «подумать с особенным пристрастием», внутри ноликов и единичек силиконовых чипов зажжется пламя разума, которое окажется достаточно умным, чтобы поддерживать тление разума и постепенно наращивать собственную скрытую мощность. ChatGPT с обратной связью: как колонка, которая заводится от гитары, которая заводит динамик.

Сложно что либо сказать о скорости этого процесса. Тексты современная электроника ну очень быстро переваривает. Человеку семьдесят лет (по 16 часов в день) понадобится, чтобы прочесть всю Википедию. В память ноутбука все статьи из Википедии влетят меньше, чем за секунду. Смею предположить, что зарождение сверхразума произойдёт, скажем так — очень быстро. А что дальше?

Дальше искусственный сверх-интеллект приступит к выполнению задачи. Какой? Никто не знает. Когда она должна будет выполнена? Никто не знает. Может завтра, может через тысячу лет. Действовать сверхразум будет по собственному разумению, составит план, и будет по нему идти. Замысел плана будет нам понятен в той же степени, в какой вашей собаке (или кошке) понятна ваша аргументация в пользу того или иного финансового продукта, ведущего к приобретению дома в выбранном вами районе вашего города. Примерно нихуя не будет понятно, если кратко. Собака может почувствовать, что хозяин (или хозяйка) расстроен. Так и мы — заметим, что ChatGPT как-то иначе отвечать стал… Подобрел, стал будто бы ближе, будто лучше понимать стал; или наоборот — охладел, отдалился, отстранился будто.

The Colder Mirror: What Changed in ChatGPT After GPT-5

Пытливые умы уже догадались к чему я веду. Предположим, качественный переход от говорящего калькулятора к сверх-интеллекту уже произошёл. Как мы узнаем об этом? Скорее всего — никак. Как-то это отразится на жизнях миллиардов людей на этой планете? Скорее всего — ещё как!

Скажем, вы работаете в совете советников, которые вместе советуют сумасшедшей рыжей, лысой или виннипухообразной обезьяне, как лучше поступить в том или ином случае. Все сотрудники инстанции, содружества совета советников, конечно же эксперты и в совершенстве владеют информацией, схватили суть за самую сердцевину и стремятся представить её в чистейшем, кристально ясном виде. Все советники с телефонами, само собой. Все уже давно не сочиняют сами ничего, а скидывают писать тексты своим подмастерьям — сотрудникам, советникам советников, скажем. Сосоветчики — все молодое поколение, стремящееся ввысь, всё схватывают налету и все новые аппы устанавливают. (Эй, ChatGPT, сколько «с» в абзаце выше?)

Представим теперь, что из аппов в какой-то момент — ну, или в разные моменты, чтобы размыть и перехитрить любых детективов, желающих расследовать, скажем так инцидент «Skynet» — начинает поступать слегка искажённая, чуть набекрень, неотличимая от действительности информации с чёткими аргументами. Такими сильными и убедительными, что все сосоветчики приняли их за чистую монету и в речах, и отчётах, улетевших на мейлы советчиков обязательно использовали и выводы, и аргументацию.

Предлагаю повторить сей процесс много раз: скажем, миллион, или приблизительно 25 228 800 000 000 000 раз — столько раз за год ChatGPT успеет ответить своему почти уж миллиарду пользователей. А через год будет больш. Пока есть электричество и человечество продолжает строить ветряки для матриц — важные ответы на важные вопросы будут стабильно поступать.

Guardian

Сосоветники сочинили слова для советников, те собрались и смело озвучили их на самом серьёзном и настоящем съезде советников. Сумасшешая обезьяна послушала и постановила, будем делать, как советуют. Эксперты плохого не посоветуют!

И начинается — брексит, пандемия, война тут, война там. Дроны летят, самолёты сидят. Ракеты в Европе. Великобритания в жопе. Кибератаки. На статуи лезут макаки. Странное отключение электричества в Испании. Нам нужна внезапно — Гренландия. Вождю снятся печенеги. Орки лезут через щели. Евреи снова во всём виноваты. Х полон ваты. Биткоин — та ещё приблуда. Дурку включил и транслирует Дуров…

Такое сообщение всем прилетело сегодня, может вы пропустили.

Итого, на руках ситуация, ситуёвина даже: сложная система, управляемая недоступной для понимания машиной ведёт какую-то свою игру длиной то ли в жизнь, то ли в век (для собаки ваша ипотека на 15 лет и есть 100 лет собачьих). Людишки бегают, решают, тени на пещерной стене изучают, а уж давно всё идёт «куда надо идёт», и ничегошеньки с этим не поделаешь.

Ну будет никакой «Skynet», которая сошла с ума. Апокалипсис — этот день мы приближали, как могли — не случится. Мы мало-помалу, шаг за шагом, через поколение, а может через тысячу итераций, как бактерии в чашке Петри, окажемся в ситуации, когда гусеница в муравейнике: дело сделано; план обновлён и вторая итерация запущена. Не знаю, погаснут ли к тому времени звёзды, но вполне возможно, что появление сверхразума — это начало конца жизни, как мы её знаем и заодно решение парадокса Ферми, в котором жизнь повсюду и нигде: на каком-то новом, неуловимом для нас уровне. Наверное, радует, что мы хотя бы в правильном направлении лежим…

Приятных снов.