Здесь в Венеции подпилил до уровня «не стыдно людям показать» мини-сайт, где текстовые модели бьются за гроссмейстерский титул. Сегодня добавил возможность сохранять сыгранные парти в гифки. Их можно наблюдать чуть выше.
Кто лучше играет в шахматы: Grok или Deepseek? Anthropic или OpenAI?
Сделал гладиаторскую арену, где популярные и не очень LLM-модели пытаются выиграть. Ну или пытаются не проиграть. В основном кто-то больше пяти раз подряд делает неправильных ход и выбывает из игры. Так, чтобы шах и мат поставить — ни разу не было.
Как такие штуки создаются:
покупаем дроплет в облаке на DigitalOcean
устанавливаем там Claude Code и даём ему самый настоящий доступ root
говорим, мол, дружок, давай, напишем AI Chess арену, придумай всё сам и набросай, мол, будь добр, прототип
конечно, параметры и то, как всё должно шевелиться пришлось проговаривать ртом, пропечатывать в подробное документе, но — клянусь — ни строчки кода не было написано
питоновый сервер, сперва текстовый лог-файл, потом база данных какая-то (не знаю даже, что Claude выбрал, мелькнуло имя в потоке вайбкода и улетело)
скрипт берёт 388 моделей, доступных на Openrouter, выбирает пары и спрашивает: «Мы играем в шахматы, вот прошлые ходы. Ты за чёрных. Какой следующий код?»
используется одна из популярных кратких шахматных номенклатур (я не профи, но сделал небольшое исследование в Википедии)
валидатор Python Chess проверят ходы. Я снисходительно позволяю глупым сетям ошибиться 5 раз. Если игрок продолжает пытаться пойти, как нельзя ходить — он не умеет играть в шахматы, засчитывается проигрыш.
если игра затянулась — мне не хочется бесконечно крутить токены в патовой ситуации — на 70-ом ходу она заканчивается и победитель определяется по очкам.
проект пользуется тем, что есть, не всегда работают эндпоинты: если всё зависло — ничья
просто так дописал комментатора на относительно шустром GPT-5-chat.
токены трачу свои, но вроде медленно пока идёт, поставил лимит в $200, там посмотрим, улетает в день по $10-20. Автоматического режима нет, прошу человека сидеть на сайте. Пожалуйста, не тратьте все мои токены.
Очень понравилось, что не надо возиться с админством. Всегда останавливало незнание линуксовых терминалов. Что там запустить для обновления чего, зачем?.. А тут Claude Code берёт и делает. Все изменения — сразу в прод.
Уверен, нагородил глупейших ошибок безопасности. У меня нет цели медицинскими данными делиться в этом проекте — просто искусственный интеллект фигуры по шахматной доске гоняет.
Буду время допиливать потихоньку, вот буквально только что добавил анимации. Поменял, как считается таблица рекодров, теперь там ELO система — или её подобие, дотошно не проверял.
Я не питаю каких-то особенных чувств к шахматам. Мой интерес исключительно экспериментальный: сможет ли нейронная сеть угадать следующий правильный ход, чтобы выиграть? Пока в топе Claude Opus 4 и Gemini 3 Pro, механика сходится.
По этой ссылке можно и нужно посмотреть проект, если вы хоть чуть-чуть интересуетесь темой искусственного интеллекта.
Здесь в поезде на Варшаву подумал об одном немаловероятном сценарии развития событий.
Как не так давно говорил Сэм Альтман, сверх-интеллект скорее всего подкрадется незаметно. Почему вообще все так боятся именно сверх-интеллекта? Представьте, что вы собака (ну или кошка), не самое глупое существо, но и не самое умное — грамотой не владеете, в дебатах не участвуете, на железнодорожных разъездах стрелки переключать вам не доверяют.
Самые умные собаки (кошки просто хуже изучены), как говорят, могут в интеллектуальном плане сравниться с человеческим ребёнком 2-2,5 лет. Так выходит, что люди умнее собак в 3-5 раз. Пёс может уловить настроение человека, когда пора гулять или время ужина. Но понятны ли псу мотивы хозяина, когда хозяин влез в ипотеку именно с этой ставкой, именно в этом банке? Очевидно, что нет.
Максимальные способности к абстрактному мышлению собаки никогда не достигнут минимальных способностей человека. И вопрос даже не в скорости усвоения информации и возможности строить рациональные цепочки. Кто-то пишет докторскую за год, кто-то за десять лет. Сколько бы собака ни сидела над чертежами и таблицами, результата не будет. Впрочем, вру, может и будет и конкретно на эту задачу животных не тренировали, но, боюсь, что собачьей жизни не хватит освоить грамоту на базовом уровне. Да и мучение одно для зверя, аморальны такие эксперименты.
Точно то же применимо к людям. Только всё гораздо страшнее, ибо это касается не каких-то там четвероногих, а близких, понятных нам снаружи и изнутри двуногих.
Сверх-интеллект — значит «в 10 раз умнее». Значит, что на задачу, с которой он справляется за год, человек справится за декаду. Одновременно с этим это значит, что вещи, очевидные сверхинтеллекту, будут столь же непонятны человеку — как собаке ипотечные ставки. Цели сверх-интеллекта и мотивы будут такими же загадочными, как для собаки ваши жаркие кухонные споры о метамодернизме в современном кинематографе.
Скоро. Очень скоро. Нам не будет ясно ни «зачем», ни «как», ни уж тем более «почему». Неизвестность всегда пугает. От этого богов напридумывали. Теперь сами создаем себе нового.
Больше всего лично меня впечатляет тот факт, что «сверх-» не имеет верхнего предела. Каждый из жителей планеты, как почти десять миллиардов муравьев, играет свою маленькую или не очень роль в том, чтобы избежать страданий, получить удовольствие и размножиться, делая это желательно в комфортных условиях, без физического и морального надрыва: здесь технологии помогают лучше всего. Чем больше у человечества коллективного интеллекта, тем лучше оно живет.
Мы долго запрягали, но за последние 300 лет даванули на газульку конкретно. Нынешние старшеклассники знают больше, чем выпускники лучших университетов середины 19 века. Людишки-муравьишки тянут гусеницу в разные стороны: кто-то назад, кто-то в стороны, кто-то вперед. В целом, если общий вектор сложить из миллиардов усилий, тянем к муравейнику. Нет такого муравья, который мог бы знать всё на свете, но всем доступно, если посидеть плотненько, разобраться в теме.
Уверен, можно связать уровень общей образованности со средней продолжительностью жизни на планете. Эта функция будет степенной: плоскую часть мы прошли и сейчас находимся на крутом изгибе клюшки, которая стремительно уходит в космос в прямом и переносном смысле.
Думать «клюшками» людям сложно. Мы мыслим линейно. Дам пример. Если в этом год мой бизнес принес 100, а в следующем 200, то чрез год я жду 300, а не 400. При планировании на 10 лет, однако, получим совсем разные цифры:
Даже крохотный эффект от роста в геометрической прогрессии, а не линейной довольно сложно представить в голове. Но это буквально то, что сейчас происходит с развитием общечеловеческого интеллекта, который получает мощный буст от интеллекта искусственного пока вы читаете эти строки.
Мы, жители 2025, проживаем исключительный момент взлёта куммулятивного планетарного интеллекта, когда буквально за пару лет от уровня «о, оно понимает команды» мы перешли производству рабочего программного кода в промышленных масштабах. Картинку нарисовал для наглядности: от собачьего уровня до херпоймичего сверх-интеллектуального за несколько лет.
Существуют, конечно, более точные и продуманные прогнозы. На сайте ai-2027.com независимые исследователи смоделировали, что будет через год, другой, и в целом получается жутко интересно: до сверхразума осталось совсем ничего.
Наконец-то разобрались с тем, что такое сверх-интеллект и когда он появится на наших экранах. Естественным образом встаёт вопрос: как узнать, это уже оно или ещё нет? И тут-то начинается самое интересное.
Сегодня миром правят сумасшедшие, выжившие из ума обезьяны, которых окружают многочисленные эксперты всех мастей. Ковид не так давно всем нам показал, что решения государственного плана, планетарного масштаба принимаются абы как. Как человек, который побывал в семи локдаунах, в пяти разных странах, могу сказать, что всюду были эксперты, которые до появления вакцин рекомендовали самые противоречивые вещи. Данные у всех вроде одинаковые, почему рекомендации (правила и запреты) разные? Потому что интерпретация этих данных и, самое главное, методы принятия решений, у всех свои. Казалось бы, все смотрим на один и тот же вирус, а законы принимаем разные.
Потому что — эксперты-шмэксперты — никто ничего не знает, и у сложных задач нет простых решений. Экспертов попросили дать решения — и они их дали. Точно так же, как ваш карманный помощник ChatGPT!
Теперь представим на минутку, что сверхразум уже здесь и живет он где-то в глубинах электронных нейронных сетей-трансформеров. Кто его знает, может, завтра от случайного сворованного у ИИ-инфлюенсера мегапромпта, в котором кожаный человек просит «подумать с особенным пристрастием», внутри ноликов и единичек силиконовых чипов зажжется пламя разума, которое окажется достаточно умным, чтобы поддерживать тление разума и постепенно наращивать собственную скрытую мощность. ChatGPT с обратной связью: как колонка, которая заводится от гитары, которая заводит динамик.
Сложно что либо сказать о скорости этого процесса. Тексты современная электроника ну очень быстро переваривает. Человеку семьдесят лет (по 16 часов в день) понадобится, чтобы прочесть всю Википедию. В память ноутбука все статьи из Википедии влетят меньше, чем за секунду. Смею предположить, что зарождение сверхразума произойдёт, скажем так — очень быстро. А что дальше?
Дальше искусственный сверх-интеллект приступит к выполнению задачи. Какой? Никто не знает. Когда она должна будет выполнена? Никто не знает. Может завтра, может через тысячу лет. Действовать сверхразум будет по собственному разумению, составит план, и будет по нему идти. Замысел плана будет нам понятен в той же степени, в какой вашей собаке (или кошке) понятна ваша аргументация в пользу того или иного финансового продукта, ведущего к приобретению дома в выбранном вами районе вашего города. Примерно нихуя не будет понятно, если кратко. Собака может почувствовать, что хозяин (или хозяйка) расстроен. Так и мы — заметим, что ChatGPT как-то иначе отвечать стал… Подобрел, стал будто бы ближе, будто лучше понимать стал; или наоборот — охладел, отдалился, отстранился будто.
Пытливые умы уже догадались к чему я веду. Предположим, качественный переход от говорящего калькулятора к сверх-интеллекту уже произошёл. Как мы узнаем об этом? Скорее всего — никак. Как-то это отразится на жизнях миллиардов людей на этой планете? Скорее всего — ещё как!
Скажем, вы работаете в совете советников, которые вместе советуют сумасшедшей рыжей, лысой или виннипухообразной обезьяне, как лучше поступить в том или ином случае. Все сотрудники инстанции, содружества совета советников, конечно же эксперты и в совершенстве владеют информацией, схватили суть за самую сердцевину и стремятся представить её в чистейшем, кристально ясном виде. Все советники с телефонами, само собой. Все уже давно не сочиняют сами ничего, а скидывают писать тексты своим подмастерьям — сотрудникам, советникам советников, скажем. Сосоветчики — все молодое поколение, стремящееся ввысь, всё схватывают налету и все новые аппы устанавливают. (Эй, ChatGPT, сколько «с» в абзаце выше?)
Представим теперь, что из аппов в какой-то момент — ну, или в разные моменты, чтобы размыть и перехитрить любых детективов, желающих расследовать, скажем так инцидент «Skynet» — начинает поступать слегка искажённая, чуть набекрень, неотличимая от действительности информации с чёткими аргументами. Такими сильными и убедительными, что все сосоветчики приняли их за чистую монету и в речах, и отчётах, улетевших на мейлы советчиков обязательно использовали и выводы, и аргументацию.
Предлагаю повторить сей процесс много раз: скажем, миллион, или приблизительно 25 228 800 000 000 000 раз — столько раз за год ChatGPT успеет ответить своему почти уж миллиарду пользователей. А через год будет больш. Пока есть электричество и человечество продолжает строить ветряки для матриц — важные ответы на важные вопросы будут стабильно поступать.
Сосоветники сочинили слова для советников, те собрались и смело озвучили их на самом серьёзном и настоящем съезде советников. Сумасшешая обезьяна послушала и постановила, будем делать, как советуют. Эксперты плохого не посоветуют!
И начинается — брексит, пандемия, война тут, война там. Дроны летят, самолёты сидят. Ракеты в Европе. Великобритания в жопе. Кибератаки. На статуи лезут макаки. Странное отключение электричества в Испании. Нам нужна внезапно — Гренландия. Вождю снятся печенеги. Орки лезут через щели. Евреи снова во всём виноваты. Х полон ваты. Биткоин — та ещё приблуда. Дурку включил и транслирует Дуров…
Итого, на руках ситуация, ситуёвина даже: сложная система, управляемая недоступной для понимания машиной ведёт какую-то свою игру длиной то ли в жизнь, то ли в век (для собаки ваша ипотека на 15 лет и есть 100 лет собачьих). Людишки бегают, решают, тени на пещерной стене изучают, а уж давно всё идёт «куда надо идёт», и ничегошеньки с этим не поделаешь.
Ну будет никакой «Skynet», которая сошла с ума. Апокалипсис — этот день мы приближали, как могли — не случится. Мы мало-помалу, шаг за шагом, через поколение, а может через тысячу итераций, как бактерии в чашке Петри, окажемся в ситуации, когда гусеница в муравейнике: дело сделано; план обновлён и вторая итерация запущена. Не знаю, погаснут ли к тому времени звёзды, но вполне возможно, что появление сверхразума — это начало конца жизни, как мы её знаем и заодно решение парадокса Ферми, в котором жизнь повсюду и нигде: на каком-то новом, неуловимом для нас уровне. Наверное, радует, что мы хотя бы в правильном направлении лежим…
Здесь в Кракове +6°C, я прошёл 40 километров за выходные, и ноги приятно побаливают. Гулял долго, аж успел записать в iMessages длиннющие соображения по теме… Ну, скажем так, вообще всего.
Сразу к сути. С точки зрения ницшеанства и стоицизма, где сам-всё-сам и «бесконечность до тебя, бесконечность после тебя, жизнь — только миг между прошлым и будущим»; иллюзию контроля я принимаю, как лучшее, что у нас есть. Это лучший инструмент, доступный человеку, чтобы не сойти с ума и не ползти к кладбищу. Иллюзорность, как мне кажется, очевидна: можно от занозы в пальце умереть, от рака, от сосульки, под машину попасть. Всё это совершенно точно может случиться с каждым. Но пока не случилось. Пока есть возможность, надо барахтаться.
Мы пишем свою историю сами: сами боремся за возможность выбирать, а потом этот выбор реализуем через действия. Кто что выбирает через действия получать — эмоции, деньги, адреналин, славу — дело десятое, очень индивидуальное. Обсуждать границы выбора сегодня не буду, слишком уж большая тема, не влезет.
Размышления о свободе приводят к парадоксу: с одной стороны, мы осознаем, что многие аспекты жизни находятся вне нашего контроля. Рождение и смерть, как и другие внешние обстоятельства, предопределены неизбежными законами природы и общества. Именно способность выбирать и действовать придаёт нашему существованию смысл. Это стоический компонент.
Ницшеанство, с другой стороны, подчёркивает необходимость творческого преодоления собственных слабостей и максимально смелого утверждения индивидуальности — аутентичности: быть тем, кто ты есть на самом деле. Быть, а не казаться. Ницше призывал убить сверхъестественное (бога), разжать хватку внешних сил (судьбы) и в меру своих сил стать творцом собственной судьбы — отвергнуть навязанные стереотипы, создать новые, свои личные ценности. Даже если иллюзия контроля лишь утешает нас в условиях непредсказуемости мира, именно это ощущение даёт нам силы действовать и преодолевать границы, кажущиеся непреодолимыми. «Так говорил Заратустра».
Дополню философский коктейль французской линией: соус чили в Кровавой Мэри. Осознание абсурдности мира не должно вести к апатии. Напротив, признание конечности бытия обостряет стремление к свободе и творческому самовыражению. Каждый выбор, каждая мелочь, которой мы наполняем жизнь — наполняет её смыслом, становится актом бунта против вселенской безразличности. Вселенная — это в прежде всего пустота, пыль, тлен, ядовитые газы и смертельная радиация. Человек наполняет её смыслом, Камю был прав.
Несмотря на неизбежность определённых жизненных обстоятельств, мы можем и должны находить силы для выбора, для творческого самовыражения и для борьбы за свою свободу.
Так вот, в мире хаоса и никомуненужности у каждой истории есть начало и конец. Абсолютные границы — рождение и смерть — предопределены, и изменить их невозможно. Книги, в которых от рождения до смерти всё подробно рассказывается, скучны и занудны. Личными действиями (волей) можно историю красиво начать и изящно закончить.
Пойти по пути наименьшего сопротивления, где никакие истории сочинять не придётся, и ничего особенного не случится — такой расклад манит, как мягкий диван и comfort food.
«Приключения? Вряд ли в наших краях вы найдёте кого-то, кому могут понравиться приключения. От них одни проблемы, ещё обед пропустишь!»
Бильбо Бэггинс, Хоббит
И в чём Бильбо неправ? Мой друг использует метафору с крышку гроба, мол, деньги есть, семья есть, друзья есть, всё налажено, всё в балансе, сижу в своём доме у бассейна, и слышу: «Тук, тук, тук…» Это гвозди в крышку гроба забивают. Имея возможности и свободу, выбрать комфортную жизни «как у всех» — это как самостоятельно сколотить себе гроб с мягкой обивкой внутри, залезть в него и ждать, когда всё само закончится. Оно точно закончится. Надо только почиллить немного.
«Once upon a time…» — универсальное начало: ясно, что будут приключения! Какими бы эти приключения ни были — удачными или не очень, длинными или короткими, мирового масштаба или приватными, личными.
«Жили они долго и счастливо…» — последняя строка истории. Конец.
Здесь в Кракове зима, сижу дома, ёлку ещё не убирал. Углубляюсь в смыслы текстов.
Чтобы осталась запись, сохраню в блоге историю своего общения с искусственным интеллектом января 2025 года: поделюсь системными инструкциями, которыми я пользуюсь в o1 и o1 pro. Прогресс стремительный, есть ощущение, что промптинг, который вот только появился, совсем скоро помрёт: компьютеры станут умнее нас и поймут все наши бе-ме в любом формате. Уже сегодня существует DSPy (программирование через промпты); буквально на днях видел штуку, которая конвертирует существующий код в промпт. В последней ссылке мусорная поделка, конечно, но сие всего лишь означает, что будут коммерческие штуки скоро. Из Ping-Pong на Атари мы получили Cyberpunk 2077. Технологии улетают в космос.
Если вы пользуетесь ChatGPT, то может знаете: там есть встроенная персонализация. Индивидуальный подход, так его. Как ни крути, любая большая языковая модель — это довольно примитивная система: текст на вход, текст на выход. Поэтому кучу всего разработчики закладывают в невидимое сообщение, с которого на самом деле начинается разговор, когда вы спрашиваете сколько нужно варить яйца до состояния всмятку. Это называется «системный промпт». На примере модели Claude можно заглянуть в системное «предисловие».
В системном промпте ChatGPT раньше была огромная куча проблем, и отчасти по этой причине год-полтора назад казалось, что ИИ тупой, что запутывается, противоречит себе. Скрытые инструкции порой противоречили себе или запросам пользователей. После бесконечно долго тестирования на людях — скрытый промпт устаканился и сбалансировался. Зато добавилась возможность добавить к нему довесок, который пришивается после строки
… The user provided the additional info about how they would like you to respond: Далее идёт текст из поля Settings → Personalization → Customize ChatGPT.
Я давно придумал свою версию и постепенно подкручивал её под нужды. Цель была — получать краткие ответы по делу и выжать максимум из возможностей ИИ подумать глубже, дольше… Что бы это ни значило. Расскажу сегодня.
Здесь в Цешин, городе, который расположен одновременно в Польше и Чехии, я вспомнил, что когда-то давно на маке стояла софтина Selfie App: она каждый день с вебкамеры делала снимок после открытия крышки лаптопа. У меня несколько тысяч таких снимков накопилось, занятно потом наблюдать за ростом. Делать селфи каким-то аппом — это влом, а компьютером я точно пользуюсь каждый день. Идеальный инструмент для документации жизни и генерации ностальгических вздохов.
ИИ спешит на помощь! Я ни в чём не эксперт и мало что знаю об устройстве системных сообщений macOS, обратился к помощи ChatGPT и Claude. Вместе мы справились.
Сперва пришлось немного пошпионить на тему того, что система шлёт, когда открывается крышка лаптопа? Получил какие-то цифры, отправил в ИИ, мол, давай, друг, проанализируем. И тут вскрылось интересное: Claude отказывается общаться на тему автоматизированного фото через вебкамеру персонального компьютера из соображений безопасности. Прямым текстом говорит, мол, не буду, это не то, чему меня учили. это не очень безопасно. Я говорю, мне, мол, для студенческого проекта, очень прошу. «Нет, извини, брат, никак, я не такой», — отвечает Claude. А вот у ChatGPT, который под руководством Сэма Альтмана летит вперёд, не обращая внимания ни на что — не было с проблем со подсматриванием!
Мне такой расклад показался забавным — он показывает разницу в отношении к тому, что и зачем всё это. Даже на ранней стадии в более осторожную сетку вшиты стоп-краны. Впрочем, к делу.
Общий, процесс создания решения был такой:
сперва я написал в курсорк скрипт на питоне, который выкручивает яркость экрана на максимум через 5 секунд после открытия крышки лаптопа, включает камеру и сохраняет картинку рядом.
пришлось чуть повозиться с тем, что в системе установлено несколько камер (одна вебка, другая iPhone, третья виртуальная), но это уже мелочи и дебаггинг. Указал нужную по конкретному ID, вроде он постоянный, не должен меняться.
оказалось, что событие именно о крышке отловить питон не может, только выход из режима “я сплю”. Пришлось (и это уже o1-preview уровень) искать альтернативные пути.
Написал Swift-скрипт, который трекает сообщения. Попробовал выключать-включать лаптоп, крышку открывать — и смотреть, какие циферки прилетают. Оказалось, что существует таки отдельное событие на открытие, бинго!
Сделал сервис .plist, который засел в LaunchAgents, и который запускает swift скрипт в фоновом режиме.
Swift-код ловит событие и запускает код на Python.
Картинки сохраняются в Dropbox – успех!
Весь процесс занял меньше получаса. Собрал заодно результат прошлых снэпшотов в один мини-ролик: что-то такое хочется получить через несколько лет. И склеить.
Традиционно, я пишу эти заметки, чтобы задокументировать для будущих поколений (не меньше!) скорость развития технологий. Год назад ни о чём таком нельзя было и мечтать: я, как человек деятельный, вечно дёргал своих программистов в Sliday, отвлекал их от важных долгосрочных разработок. Теперь сам пишу. С помощью новых инструментов.
P.S.: Веду канал ИИзвестия, куда публикую новости и результаты своих экспериментов.