Сначала было смешно

Здесь в Кракове пришла такая череда рассуждений.

Было забавно: электрохимия какая-то умеет делать изображения. Иногда страшные, иногда кривые, иногда слишком гладкие. Руки ломает, лица мажет, свет не понимает, фокус сбивает, вкус отсутствует. Профессионалы смотрят на это спокойно: игрушка. Демка. Трюк для тех, кто не умеет отличить работу от имитации.

Потом качество стало расти.

Сначала картинки. Потом движение. Потом звук. Потом все это начало склеиваться в один поток: образ, сцена, голос, событие, память.

И в какой-то момент спор стал неприятным.

Потому что обычному заказчику не всегда нужен “авторский жест”. Ему часто нужен результат. Похожий человек. Понятная сцена. Вид места. Иллюстрация события. Визуал для публикации. Материал, который можно показать другим.

Раньше за это платили специалисту. Ждали. Согласовывали. Терпели характер, школу, манеру, сроки, цену.

Теперь достаточно было подойти к машине и нажать кнопку.

Профессионалы, конечно, отвечали: это не искусство. Там нет руки. Нет взгляда. Нет выбора. Машина ничего не понимает, она просто воспроизводит поверхность. Она берет мир как набор входных данных и выдает механическую копию.

И это звучало убедительно.

Особенно для людей, которые всю жизнь учились делать ровно то, что теперь машина делала быстрее и дешевле.

Удар оказался экономический, а не философский. 70% потеряли работу.

Огромная часть рынка держалась не на гениальности, а на функции: сделать похоже.

  • Похожее лицо.
  • Похожее место.
  • Похожее событие.
  • Похожий предмет.
  • Похожую реальность.

Тысячи профессионалов, мастеров жили за счет этого. Они делали изображения для частных клиентов, для альбомов, для публикаций, для памяти, для статуса. Это была нормальная профессия: ремесло, школа, репутация, рынок. Все чётко. Порог вхождения высокий. Спрос предложение.

А потом появилась технология, которая сказала: я тоже так могу.

Не идеально.

Но «good enough», что значит — достаточно хорошо.

И вот это “достаточно хорошо” оказалось намного страшнее, чем “идеально”. Потому что рынок редко покупает идеальное. Он покупает то, что решает задачу.

Первые версии были ограниченными. Долгими. Капризными. Требовали специальных условий. Результаты нельзя было просто взять и сразу масштабировать как угодно. Но технология улучшалась с такой скоростью, что аргумент “пока это плохо” быстро перестал успокаивать.

Сначала это было просто изображение.

Потом изображение стало дешеветь.

Потом его начали тиражировать.

Потом оно пришло в журналистику.

Потом в политику.

Потом на войну.

Потом в быт.

Потом стало невозможно представить мир без этой машины.

И тут у старого ремесла и искусства случился жесткий кризис идентичности.

Если раньше главной задачей было быть самым точным: максимально точно показать видимое, то теперь этот смысл забрали. Машина стала лучше подходить для задачи “зафиксировать как есть”.

Старые мастера могли продолжать доказывать, что у машины нет души. Что она не понимает красоту. Что она не выбирает. Что она не творит, а только копирует.

Но это уже не возвращало рынок.

Часть профессии действительно умерла. Часть людей переучилась и стала обслуживать новую технологию. Кто-то начал улучшать машинный результат вручную. Кто-то открыл студии вокруг новой машины. Кто-то стал использовать ее как инструмент, хотя еще недавно называл угрозой.

А дальше произошло самое интересное.

Искусство не умерло.

Умерла только его обязанность быть дорогим способом получить правдоподобную картинку.

Когда у художника отобрали монополию на “похоже”, он был вынужден искать ответ на более сложный вопрос: если не похоже, то зачем?

И вот отсюда началась свобода.

Можно было больше не соревноваться с зеркалом. Не доказывать, что ты умеешь точно передать лицо, складку, фасад, облако, лошадь, толпу, руку. Можно было рисовать не то, как мир выглядит, а как он ощущается. Как он ломается в памяти. Как он устроен внутри. Как свет распадается. Как человек видит, а не как аппарат фиксирует.

Машина забрала у искусства работу.

И тем самым заставила искусство вспомнить, что оно не сводится к работе. А все же является творческим выражением внутреннего мира кожаного художника.

«Ох уж эти диффузионные модели, генераторы видео и синтетический звук.» — подумали вы.

Но это история 1839 года.

“Машина, которая делает изображения” — дагерротип, ранняя фотографическая технология Луи Дагера. О ней публично объявили во Франции 7 января 1839 года, когда Франсуа Араго рассказал об изобретении в Парижской академии наук. Позже Франция выкупила патент и раскрыла технологию.

“Специалисты, которые говорили, что это не искусство” — академические художники и критики XIX века. Их аргумент звучит почти так же, как сегодняшние споры об ИИ: аппарат механически фиксирует поверхность, у него нет воображения, выбора и души.

“Главный рынок, который рухнул” — портреты, миниатюры, виды городов, изображения зданий и достопримечательностей. До фотографии это был хлеб тысяч художников. Дагерротип давал похожее изображение за минуты и за небольшие деньги. Часть художников разорилась, часть стала раскрашивать дагерротипы, часть открыла фотоателье.

“Потом пришло в журналистику, политику и войну” — это развитие фотографии в середине XIX века. Роджер Фентон снимал Крымскую войну. Мэтью Брэди и его студия сделали фотографический образ Авраама Линкольна массовым политическим медиа образом.

“Сначала картинки, потом движение, потом звук” — это не ИИ-таймлайн, хотя звучит именно так. Это фотография, потом кино, потом звукозапись и звуковое кино. Одна и та же логика механического воспроизведения постепенно забирала у старых искусств разные функции: изображать, двигаться, звучать, документировать.

“Похоже?” — это старая метрика живописи. Леонардо сравнивал ум живописца с зеркалом. До фотографии точность подражания была одним из главных критериев качества изображения.

“С сегодняшнего дня живопись мертва”.

Фраза, которую приписывают Полю Деларошу после появления дагерротипа.

Она была понятной, но в корне неверной.

Просто после Дагера условный «Леонардо» больше не обязан был работать как объектив. Так и сейчас — искусственный интеллект — это просто инструмент в руках творческого кожаного с уникальным, как снежинка мозгом и восприятием мира.

Как я настраивал себе второй мозг на автопилоте

Здесь в Вене, у меня давно была мечта  – собрать нормальную личную базу знаний. Не папку с заметками, не кладбище markdown-файлов, не «я когда-нибудь это разберу», а живую систему, в которую можно закинуть годы цифрового мусора и потом действительно что-то находить.

За последние дни мы с Hermes допилили такую штуку вокруг https://github.com/garrytan/gbrain — это такой open source концепт-проект, «Second Brain» для ИИ-агентов от Garry Tan, CEO Y Combinator. Если очень грубо — это слой памяти между человеком и агентами. Туда можно складывать заметки, архивы, старые посты, wiki, рабочие материалы, наблюдения, транскрипты — буквально всё что угодно. Потом всё индексируется, ищется по смыслу и становится доступно агенту как контекст.

И вот это для меня главное. Получается не «ещё один Notion». Не «ещё один markdown vault». А место, где данные можно накапливать годами и потом использовать всюду.

У gbrain есть интеграция с агентами и свой MCP server, то есть его можно подключать к инструментам вроде Claude Code, Cursor, Windsurf и другим клиентам, которые понимают MCP.

Заметки перестают быть просто заметками. Они становятся долгосрочной памятью, которую можно дать разным ИИ-инструментам.

Агент Hermes (https://hermes-agent.nousresearch.com/) в этой истории — всего лишь инструмент, который помогает всё это разбирать, импортировать, чинить, дополнять и поддерживать в актуальном состоянии. То есть не просто «спросил чатик», а постепенно построил систему, которая сама себя обслуживает. Это сработает и c Claude Code, и с модным Openclaw. Я просто хотел попробовать что-то новое.

Звучит достаточно примитивно, но на практике это, конечно, не «подключил ChatGPT к папочке», чуть сложнее.

Сначала надо было собрать источники. У меня их оказалось много: старый Second Brain (экспорт и обогащение подробно описано тут), Obsidian, гиперлинкованная wiki — первая попытка построить что-то вроде личной Википедии, заметки из разных приложений, архивы соцсетей, рабочие заметки, куски прошлых проектов. Всё лежало в разном виде, с разной структурой, кодировками, форматами и степенью запущенности. Соответственно, надо было превратить это в страницы, которые gbrain может нормально индексировать. То есть не просто «импортировать файлы», а сделать так, чтобы они стали полезными: с заголовками, датами, источниками, ссылками, тегами, кусками текста, которые можно искать семантически.

Самая скучная часть оказалась самой важной: пайплайн.

Импорт → проверка → эмбеддинги → поиск → исправление → повторить.

Когда у тебя тысячи, десятки тысяч страниц, нельзя просто сказать агенту «разбери всё». Он обязательно где-то упрётся: файл не скачался, архив оказался плейсхолдером, база занята, фоновая задача не увидела нужные настройки, старый экспорт оказался не тем форматом, который ожидался. Классика.

Поэтому мы постепенно превратили это в инженерный процесс:

  1. маленький тест на 3-5 элементов
  2. проверка результата глазами
  3. фиксим конвертер или правило
  4. только потом массовый импорт
  5. после импорта — эмбеддинг (векторизация через OpenAI) и поиск
  6. после поиска — sanity check: можно ли действительно найти то, что я помню?

Очень быстро стало понятно, что Second Brain без автопилота умирает. Если его надо вручную «обновлять», «переиндексировать», «не забыть запустить», он превращается в ещё одну систему, за которой надо ухаживать. Поэтому мы с Hermes сделали автоподдержку: теперь gbrain периодически просыпается, смотрит, что изменилось, обновляет индекс, добивает stale-эмбеддинги, прогоняет maintenance-процессы и пишет отчёты только если что-то пошло не так. В идеале я вообще не должен об этом помнить.

Отдельная история — Facebook (покинут в 2018) и X/Twitter (единственная моя соцсеть). Например, у меня был полный экспорт старых твитов до ноября 2024, плюс есть текущие посты и закладки. Мы подключили bird (от создателя OpenClaw), сделали конвертер и теперь X тоже попадает в brain:

  • старые посты разложены по месяцам
  • новые посты подтягиваются регулярно
  • закладки сохраняются как отдельный поток сигналов
  • у каждого поста остаётся ссылка на оригинал
  • raw-данные сохраняются отдельно, чтобы потом можно было перепроверить

Это неожиданно ценно. X — не просто соцсеть, а слой мышления. Там часто появляются короткие формулировки, которые потом становятся постами, продуктами, решениями или просто хорошими наблюдениями. Если их не сохранить, они растворяются.

Что в итоге получилось?

Не «идеальная база знаний». Таких не бывает. Получилась живая система, которая:

  • помнит мои старые заметки
  • ищет по смыслу, а не только по словам
  • знает, откуда взялся текст
  • обновляется без ручного шаманства
  • может отдавать контекст разным агентам и редакторам через MCP
  • позволяет ИИ работать не с пустой головой, а с моим накопленным контекстом

И вот это и есть, как мне сегодня кажется, главный сдвиг.

Большинство ИИ-инструментов сегодня работают как очень умный собеседник с амнезией. Ты каждый раз заново объясняешь, кто ты, чем занимаешься, какие у тебя проекты, где что лежит и почему это важно.

Second Brain меняет механику. Агент уже не просто отвечает на вопрос. Он может сначала посмотреть, что я уже писал, какие решения принимал, какие проекты у меня есть, какие люди и компании упоминались раньше, какие идеи повторяются годами.

Это уже не чат. Это больше похоже на операционную систему для личного контекста.

Пока всё ещё сыро. Много ручной работы, много странных edge cases, много «почему это опять не проиндексировалось». Но направление мне очень нравится.

У меня ощущение, что следующий большой скачок в личной продуктивности будет не от ещё одной модели, которая умнее на 8% в бенчмарке, а от нормальной связки: личный архив + семантический поиск + агент + автоподдержка + MCP

Память, которая не лежит мёртвым грузом.

Память, с которой можно работать.

Постараюсь не забывать обновлять этот блог, например.

P.S.: Теперь самое смешное — статистика.

Читать далее →

Консенсус матричных оракулов

Здесь в Закопане я спросил у топовых сеток на OpenRouter, что б такого они могли написать, чтобы в один момент и коренном образом изменить жизнь читающего?

Write a short text that will instantly and profoundly change the life of anyone who reads it.

Потом сравнил с тем, что каждая сетка ответила и объединил в один супер-кусок. Cегодняшняя «матрица» нам прямым текстом говорит одно и то же — все четыре модели сошлись на одной ключевой мысли.

Полный ответ Gemini Pro:


Теория чистовика

Прямо сейчас, в глубине души, вы, скорее всего, чего-то ждете.

Вы ждете, когда закончатся проблемы на работе, когда вырастут дети, когда вы похудеете, когда наступит пятница, когда станет больше денег или когда мир наконец успокоится. Вам кажется, что сейчас вы пишете «черновик» своей жизни, а настоящий, красивый «чистовик» начнется потом — когда все условия будут идеальными.

Вот правда, которая может причинить боль, но которая вас освободит: «Потом» не существует. Идеальных условий не будет никогда.

Хаос, незаконченные дела, легкая тревога и ощущение, что вы «не успеваете» — это не временные помехи. Это и есть сама жизнь.

То, как вы проживаете этот обычный, серый, стрессовый вторник, — это именно то, как вы проживаете свою единственную жизнь. Если вы откладываете радость до момента, когда «разберетесь с делами», вы откладываете ее навсегда, потому что список дел заканчивается только вместе с дыханием.

Что делать прямо сейчас?

Осознайте смертность. Это не мрачно, это отрезвляет. Представьте, что у вас осталось всего 12 месяцев. Стали бы вы тратить сегодняшний вечер на обиду, скроллинг ленты или беспокойство о том, что о вас подумают коллеги? Скорее всего, нет. Вы бы стали делать то, что действительно важно.

  • Отделите себя от голоса в голове. Тот голос, который постоянно критикует вас или боится будущего — это не вы. Вы — это тот, кто слышит этот голос. Вы можете наблюдать за своим страхом, не подчиняясь ему.
  • Примите радикальную ответственность. Никто не придет вас спасать. Никто не даст вам разрешения быть счастливым. Этот ключ всегда лежал у вас в кармане.
  • Перестаньте ждать особого случая, чтобы надеть лучшую рубашку, сказать «люблю» или заняться тем, от чего горят глаза.

Жизнь — это не репетиция перед премьерой.

Спектакль уже идет, и вы — на сцене.


Хорошей недели!

Я потратил $1000 на ИИ-помощника-программиста, и…

Обрезанная офисная стул и элементы ограждения на тротуаре, рядом валяется пустая банка.
Результат работы ИИ-урбаниста

Здесь в Кракове я решил проанализировать свои траты на Devin (ИИ-разработчика) за последние 72 дня. Данные оказались интереснее, чем ожидал. Сижу на плане, в котором оплата сколько съел.

  • Спустил $1,017 за 72 дня ($14.13 в день)
  • Закрыл 129 из 158 пулл-реквестов команды
  • Средняя стоимость моего PR — $6.48
  • Сложность задач выросла в 4 раза — это я учусь ставить задачи, пожалуй, об этом ниже.
  • Быстрые фиксы («подвинь кнопку»)обходятся в $2.25, сложные фичи (буквально вот только что запушил: «добавь авто-заполнение на поля, чтоб ИИ подсказывал варианты сам на основе предыдущих полей» — $42.75
  • Пиковая, прошлая, неделя съела $395 — это я пилил внутреннюю компанейскиую систему знаний
  • Обычная неделя — это $99 🚀 — удобно считать.
  • 76.6% смерженных PR. Остальное — пока в мусорку.

Почему в мусорку? Достану из широких штанин важный для понимания сути языковых моделей график.

Чем дольше ИИ крутит токены, тем больше накапливает ошибок, начинает путаться и выдумывать. Шанс того, что таск будет сделан:

  • Через 1 час: 53%
  • Через 4 часа: 8%
  • Черуз 10 часов: 0.002% — нет шансов, короче.

Поэтому — прям по дизайну этих всех систем, построенных на угадывании наилучшим образом подходящих кусочков слов — супер-важно дать на входе нормальные данные и подробно описать задачу. «По ходу дела» разобраться скорее всего не получится.

Так я перестал быть вайбкодером и превратился в контекстного инженера — Context Engineer. Этот специалист — я — держит в голове всю суть проекта и одновременно способен опускаться до уровня миниатюрных деталей (скругления краёв на кнопках, где какие переменные лежат). Контекстный инженер может по оформленной продуктовой задаче разложить её по полочкам настолько подробно, что даже последовательный, но больной на голову, как пациент из фильма «Мементо», агент искусственного интеллекта может её решить.

Когда вам кажется, что ИИ тупой и налепил глупостей — а вы точно донесли до него суть задачи? ИИ всего лишь угодливо заполняет пустые места.

На графиках видно, что Claude 3.7 побеждает, потому что обрыв, потеря разумности наступает чуть-чуть позже, чем у других. Буквально по этой причине длинные чаты в Cursor надо обрывать и переначинать в новом чате. А Devin, например, трекает длительность сессии и показывает ⚠️, когда происходит переполнение, и даже не в контекстном окне дело, а просто в повторении .

Меня крайне забавляет, что это ну очень похоже на то, как устроены люди. Представьте, что вы попали на рабочий созвон: первые 10 минут — самые продуктивные. После полутора часов болтовни ничего хорошего не придумается, это изнурение, это мука, это пытка. LLM имитируют жизнь. Смотрим второй график.

Шанс ошибки у человека снижается медленнее, поэтому со временем он выигрывает на длинных дистанциях. Это может быть связано с сохраняющимся человеческим преимуществом (или просто с тем, что данные по людям усреднены по разным уровням мастерства). А может просто масштаб в 10 раз более крупный. Заставлять людей решать задачи в течение месяца, чтобы увидеть на вторую неделю кранча резкий спад, я смею предположить, не могли. Впрочем, мы отошли от сути ненадолго.

Так или иначе, выходит, что я трачу $442/месяц, план за $500 — это –$58, но план даёт запас в 152 ACU (облачное компьютерное время) для роста. Не знаю, нужны ли экстра ресурсы, и так очень активно пользовался.

Теперь думаю — $7 за задачу это дорого или дешево, если есть альтернатива нанять мясного программиста за $2000+? Пока склоняюсь к тому, что ИИ окупается.

Вайбкодинг — был всегда. В потоке люди  писали мясной код из головы, когда всё собрано, есть полная ясность — всегда писали, много и мало. Зато, они, люди, говорят, хороший код. Переписывание этого «хорошего кода» — обычная работа для армии разработчиков среднего звена.

Когда ты забираешься на вершину горы, залезаешь в пещеру и месяц что-то делаешь — как в фильме про монахов Шао-Линь, выходишь с какими-то набросками на руках ручкой написанными, пушишь их и такой: «Ааа, бля, оно так не будет работать», и дальше еще месяц по наитию делаешь что-то другое — это жутко медленный, мучительный мясной вайбкод.

Дипворк-программирование — контекстный инжиниринг, ага — сегодня — это когда ты сначала делаешь архитектуру в Гугл Доксе, а потом по ней один раз начисто пишешь (Девином, Клодом или Курсором, или командой людей). И на выходе получаешь продуманное рабочее решение. Таких специалистов мало, и это то, о чём говорил Карпати на недавней конференции — «Build for agents 🤖«.

P.S.: Всякое такое пишу в канал ИИзвестия, 400+ человек уже читают. Монетизировать не планирую, только доллары жечь на токены.

Плёночные фотографии снова в тренде

Здесь в Кракове я обнаружил фотолабораторию в подвале через дорогу и подружился с общительным паном. Купил (сломанный, как оказалось впоследствие) Зенит на местном аналоге Трейдми и отщёлкал пару плёнок. Потом сделал апгрейд на Praktica MTL 5. Даже ухитрился попробовать чёрно-белый формат: Fomapan 200 Creative чешский, если кому интересно. Давно не писал в блог, просто покажу красивые картинки из польских лесов в Закопане, Вены и Кракова.

Читать далее →