Винни Пух и тонкая настройка нейронных сетей в домашних условиях

Здесь в Кракове выходные прошли не зря. По просьбам читающих, рассказал, как тренировать свои стили в FLUX.1 Dev. Replicate для этого — идеальная платформа, ничего сверхсложного не понадобится.

Задача: как научить нейронную сеть генерировать картинки в моём, каком надо уникальном стиле?

Что вообще значит «научить»? Как вообще получаются картинки в нейронной сети?

То, как я понимаю процесс в целом: начинается всё с шумного изображения, в котором буквально ничего нет, нет ни одной явной, выделяющейся характеристики. Потом в зависимости от текстового запроса (промпта) пикселы перекрашиваются, чтобы больше подходить под «образ», собранный на основе параметров нейронной сети. Язык, исходный запрос — определяют эти параметры. В модели зашито то, как она представляет текст в изображениях. Через пару десятков итераций пикселы приобретают форму и становятся похожи на что-то осознанное.

Файн-тюнин, точная подстройка — это по сути изобретение нового символа, нового слова, создание триггера, чтобы в выдаче появилось что-то похожее на желаемое. Вы буквально добавляете в лексикон нейроннной сети новый образ. Легко визуализировать этот процесс так: вы показываете маленькому ребёнку, который ещё не умеет говорить, мол, это зебра, зеб-ра. И после спрашиваете: нарисуй зебру? Как умеет, ребёнок рисует полосатое нечто, по памяти, как понял. Если без вашего ведома кто-то показывал на улице дорожный переход и тоже называл это зеброй, то есть шанс, что дитя нарисует белые полосы на асфальте, а не африканское животное.

Текущее состояние мира нейронных сетей лишь имитирует работу невероятно сложного человеческого мозга. Компьютеры тратят кучу сил (буквально энергии в виде тепла), чтобы выдать что-то не ужас-ужас какое кошмарное.

Однако, уже сегодня можно использовать мощные сервера в облаке, чтобы научить общедоступные нейросети своим личным словам и образам.

Читать дальше →

Комментарии

 

Код виляет кодóм

Здесь в Кракове каждый день стараюсь программировать немного. Вчера возникла идея: что, если выборку данных из большого куска искусственный интеллект (ИИ) будет делать “сам”?

Начну чуть издалека. Уже много лет у меня есть расширение для всех браузеров: Site Palette. Его установили себе где-то сто тысяч человек и средне активно генерируют там палитры из скриншотов посещённых сайтов. Никакого ИИ в расширении нет — чистые статистика и математикам на основе доступных в открытом доступе библиотек.

Что делать с этой всей красотой? Захотелось придумать что-нибудь полезное. Выкачал мегабайты анонимных массивов hex-цветов и решил скормить их ИИ. Разумеется, ИИ не хочет есть 20 мегабайт, это слишком много.

Я не программист, поэтому решил, что код писать будет Cursor, а моя работа будет — говорить ему, что делать. Сначала мы с Курсором решили, что данные (сухой набор цветов типа `#884939`) нужно обогатить: и получили более подобный файл, в котором палитры категоризованы по темам и всякое такое.

Потом я сделал скрипт, который придумывает и предлагает на выбор три темы будущего поста (можно самому задать). Вместе с темой придумывает, как данные вытаскивать из общего набора данных. Для тех, кто не понимает, что такое скрипт, что там кто «спрашивает», выглядит оно приблизительно так:

Потом ИИ пишет питоновский скрипт, чтобы выбрать из 900+ палитр список 10 наиболее подходящих. Что значит «подходящих»? Ну, он, ИИ, там сам как-то решает, что использовать: статистические методы, математику — получаются просто мини-питончики такие. Если требуется посчитать самые популярные оттенки, посчитает. Конвертировать в RGB? Сделает. Отсортировать по яркости? Справится. А если ошибётся? Перепишет. Лучше всех прочих моделей текст писал, конечно, Claude Sonnet 3.5.

Затем я попросил ИИ написать блог-пост с выбранными палитрами. Форматирует чистым Markdown. Уже готово к публикации, но можно улучшить. Далее, ИИ пишет код страницы на html+Tailwind. Так, чтобы было видно цвета из выбранных палитр.

Напоследок, ИИ генерирует заглавную картинку в тонах статьи и, если угодно, пишет поверх неё текст для OG картинки с помощью свеженького Flux 1.1 Pro. Получается не хуже поста с орками.

Метаданные для html страницы ИИ тоже, конечно, пишет. Без всяких позорных слов-паразитов вроде «delve» или «let’s dive in».

Так получаются полноценные, готовые к публикации (с купюрами, после проверки глазными яблоками кожаных мешков, конечно) материалы:

Самое интересное — я не программист и не умею писать на Python. Я, пожалуй, могу его читать и понимать, что происходит. Я построил много продуктов и примерно знаю, что нужно получить в итоге, и могу объяснить это на английском с примерами из интернета. А современные IDE вроде Cursor — пишут код. Вместе с o1-preview, последней, наиумнейшей моделью в октябре 2024 (привет, читатели из будущего!) мы — победили.

Самое интересное в этом процессе было наблюдать, как ИИ пишет кусок кода для анализа данных и буквально вшивает (import) в исходный скрипт для дальнейшего использования. В этом магия программирования. Понравилось, как ИИ весьма креатвно подходит к методам обработки данных, учитывает психологию цвета, тренды, сезоны и всё, что «видит» в исходных данных .

В следующий раз попытаюсь написать программу, которая пишет сама себя. Уверен, теперь это возможно. Last famous words.

P.S.: Полное видео и больше примеров конкретно этого приложение ИИ я показал в Telegram-канале ИИзвестия, который я для души и интереса ради веду уж несколько месяцев.

Комментарии

 

Искусственно-интеллектуальная сваха

Здесь в Кракове я вписался в новый проект и начал набирать людей в новую команду. Например, сейчас нужен Frontend Developer, расскажите знакомым. Как только опубликовал вакансию в X, сразу повалили боты. Больше сотник документов, резюме и сопроводительных писем люди прислали. Как водится, часть из них совсем никуда не годится и отправлена наобум и на авось. Так появилась идея написать штуку, которая могла бы резюме оценивать и ранжировать с учётом компанейских «красных флагов» и хотелов.

Удачно сложилось, я сейчас плотно связан с разбором документов с помощью мощностей искусственного интеллекта. Строим с командой большое, промышленных масштабов решение, но ничего не мешает экспериментировать с комнатными, тепличными задачками вроде этой.

Я не программист, поэтому воспользовался cursor.com, эта штуковина умеет конвертировать желания продуктово-настроенного человека в код. Говоришь, мол, так и так, напиши, проверь, работает ли — и пишет, и проверяет. Один из новых, довольно популярных инструментов, ничего особенного. Через год все только в таких и будут программировать.

Набросал схему решения в голове:

  • Вытащить из PDF текст
    • Просто чтением текста из PDF, если не получается, то…
    • Попробовать разобрать с помощью pytesseract, банального OCR то есть. Если не получается, то…
    • Конвертировать в картинки и послать в мультимодальную модель Сomputer Vision.
  • Сопоставить с помощью «умной» нейронной сетки требования из моего объявления о работе в job_description.txt и получить:
    • Оценку совпадений: я чуть ниже опишу, как это оценивалось.
    • Краткий, с личными деталями ответ кандидату на всякий случай
    • Коротенькое объяснение, почему именно этот кандидат именно так «замэтчился»?
    • Ссылка на его вебсайт, если есть
  • Отдельный (не обязательный) запрос проверяет файлы на бонус-очки и «красные флаги»:
    • опечатки,
    • грамматические ошибки,
    • дырки в карьере
    • явные противоречия
  • Результаты двух оценок сливаются в экстазе: пропорция 80/20 по-умолчанию, но можно подкрутить и в другую сторону.
    • 80% финальной оценки — это конкретно сватовство: насколько резюме подходит вакансии
    • 20% — это личные ощущения, желания и персональные «красные флаги» стороны нанимающей. Там же, кстати, про diversity и inclusion написано.
  • Отдельная функция, насколько это возможно, бегает «посмотреть», что на сайте-портфолио. Если там ошибка (самое печальное), это не добавляет очков кандидату.
  • После этого стоит задача: сортировать по результатам и вывести всё со смешными эмоджиками и титулами вроде «Unicorn Candidate»
  • Написать для всех отзывы с учётом полученной оценки. Позвать кого-то на собеседования. Письма никто не отправляет, но, когда их нужно будет отправлять — тексты будут уже готовы.

На этом скрипт заканчивает свою работу и откланивается. Дальше решать придётся человеку.

Что там в кишках?

Далее, по порядку. Откуда взялась схема оценки и сватовства? Самая свежая, самая тормозная, самая умная нейронная сеть от OpenAI o1-preview помогла разработать структурированную схему. Как одна идей из улучшения — для каждого пункта делать отдельный запрос с помощью ультра-дешёвой и глупой модели вроде gpt-4o-mini, вполне возможно, что так результат окажется точнее. Он точно будет прозрачнее.

Схема выглядит приблизительно так, многое происходит «в уме»:

Резюме и описание вакансии подгоняются под единую понятийную систему, приводятся к общему знаменателю.

Искусственный интеллект рассчитывает параметры и выдаёт одну цифру от 0 до 100. Это базовый рейтинг: индикатор того, насколько близко подходит кандидат.

Сердце скрипта — интеграция с API мощной языкового модели Anthropic Claude. Кроме того, я только что добавил поддержку OpenAI. Модель использует передовые методы обработки естественного языка для глубокого анализа резюме и описания вакансии. Теперь Resume Job Matcher может:

  • Ускорить подбор персонала: Автоматизируя рутинные задачи, вы сможете сосредоточиться на стратегических решениях. Это 100% так, уже проверил на себе.
  • Улучшить качество найма: Отсев совсем «левых» кандидатов — снижает риски неправильного выбора.
  • Создать положительный имидж: Персонализированные ответы и профессиональный подход к каждому кандидату укрепят репутацию вашей компании. Эта часть отнимает куууучу времени при каждом найме.

Скачать, дополнить, улучшить скрипт — это здесь: Resume Job Matcher.

Нежданчик

Пока писал этот пост, произошло нечто неожиданное… Проанализировал вчера пачку из приблизительно сотник резюме, отправил нашему главному техническому специалисту кандидата с верхней позиции списка, мол, попробуйте парное программирование устроить. Сегодня они поговорили и — и неожиданно хорошо всё прошло, надеюсь, скоро буду высылать оффер.

Как-то так, мне кажется, ИИ докажет свою небесполезность и захватит мир. Напомню, что в канале ИИзвестия я каждый день публикую результаты своих экспериментов и новости из мира нейросетей. Контент, разумеется, бесплатный и ни на что не претендующий. Мне просто надо куда-то сгружать эту информацию так и эдак. Помогает размышления структурировать. Надеюсь, будет интересно.

Комментарии

 

Лёгкий видео-формат: разговор о переездах, детях, школах и обустройстве

Здесь в Познани я узнал, что вышел очередной болтологический видео-выпуск, в котором я поделился своим опытом жизни в разных странах. В частности — в Новой Зеландии и Польше. Больше двух лет уже живём в центральной Европе и накопились кой-какие наблюдения.

Мы с Димой из ReLife обсудили, как после 20 лет в Новой Зеландии я решил переехать в Европу: какие проблемы решил и какие возможности открыл для себя и своей семьи.

Формат лёгкий, ничего особенного нового в интервью вы не услышите, как мне кажется. Традиционно, одной из ключевых тем разговора стала предсказуемость жизни в Новой Зеландии и желание перемен — этого я никогда не скрывал. Несмотря на комфорт и стабильность, я ощущал потребность в новых впечатлениях и возможностях для роста: личностного и в плане бизнеса. Это привело нас сначала в Чили, а затем в Польшу. И там, и там пришлось столкнуться с новыми культурными и языковыми вызовами.

Как молодые (всё ещё!) родители, поговорили о влиянии переездов на детей. С одной стороны, частые перемены могут быть стрессовыми, но с другой — и за эту позицию я беру ответственность на себя — они открывают ребенку мир во всем его многообразии. Я поделился своими наблюдениями о том, как именно наш сын адаптируется к новым школам и друзьям, и как мы стараемся сделать этот процесс менее болезненным. Всегда есть плюсы, всегда есть минусы.

В заключение мы обсудили важность иммиграционного статуса и долгосрочных планов. Я подчеркнул необходимость иметь четкий путь к постоянному проживанию или гражданству в выбранной стране, чтобы обеспечить стабильность и безопасность для семьи. В эпоху «релоканства» (ненавижу этот новояз), это особенно важный момент, о котором может соберусь написать отдельный пост.

Несмотря на все трудности, я считаю, что опыт жизни в разных странах обогащает нас и открывает новые перспективы. Ну и как бы — нет больше ничего. Прожив в тихом и уютном местечке всю жизнь, не будет второго шанса переиграть и попробовать жить по-другому. Это мой двигатель, моё основное «зачем?»

Спасибо Дмитрию и ReLife за предоставленную возможность.

Двухчасовой разговор с Дмитрием из ReLife.

P.S.: Поделюсь небольшой радостью, мой телеграм-канал ИИзвестия про достижения ИИ дорос до 227 читателей — огромное всем спасибо!

Комментарии

 

Эффект бабочки-матрёшки: как зарабатывать в IT?

Антикварный магазин в Кракове

Здесь в Кракове, пару месяцев назад, если не ошибаюсь, я снова засветился в подкасте. На этот раз в выпуске «Мы обречены» с Андреем и Антоном. Болтали про альтернативные способы заработка в IT, помимо работы по найму и создания классических стартапов. Обсуждали консалтинг, преподавание и, конечно же, инди-хакинг — мою любимую тему.

Инди-хакинг — это про создание небольших, но прибыльных проектов, которые приносят пассивный доход и дают тебе свободу.

Звучит заманчиво, правда? Но как это работает на практике? Как раз это я и хочу рассказать сегодня подробнее.

Идея: дёшево, быстро, много

Главное в инди-хакинге — это скорость. Не нужно тратить месяцы на проработку идеи и создание идеальной архитектуры. Лучше быстро сделать MVP (минимально работающий продукт) и вбросить его на рынок.

Вот как это делаю я:

  • Ищу простые идеи, которые решают конкретные проблемы. Часто это проблемы, с которыми я сам сталкиваюсь в своей работе.
  • Не боюсь делать «говнокод». Главное, чтобы продукт работал и решал задачу.
    • Красота кода не важна, если его никто не видит.
    • Проще потом переписать, если проект выстрелит. А потом переписать ещё.
  • Делаю ставку на количество. Чем больше проектов запущу, тем выше шансы, что какой-то из них выстрелит.
    • Из 60-70 моих проектов «выжили» и приносят хоть какой-то доход только 5-6.
    • Но этого достаточно, чтобы обеспечить финансовую независимость.
    • Доход распределён приблизительно так (в год): $500000, $20000, $5000, $1000, $200 — буквально обратная геометрическая прогрессия.

Пассивный доход: миф или реальность?

Пассивный доход – это миф, не халява. Даже если ты создал продукт, который работает сам по себе, тебе всё равно нужно его поддерживать, обновлять, искать новых пользователей. Постоянно что-то отваливается. Всегда, каждый день, если не стараться держать своё душевное состояние в балансе, найдётся пожар для тушения.

Вот с какими сложностями я сталкиваюсь:

  • Платформы меняют правила игры. То, что работало вчера, может не работать сегодня.
    • Например, Google Chrome может изменить API, и твой плагин перестанет работать.
    • Или Apple App Store может ужесточить правила, и твоё приложение удалят.
  • Появляются конкуренты. Кто-то может сделать продукт лучше, чем твой.
    • Но если ты был первым, у тебя, конечно, всё равно есть небольшое преимущество. Его важно не проэтовать.
    • Ты уже занял нишу и получил первых пользователей. Это очень ценно, потому что мир технологий по-прежнему растёт.
  • Нужно постоянно искать новые идеи. Рынок не стоит на месте, нужно быть в тренде.

Инди-хакинг: образ жизни

Инди-хакинг – это не просто способ заработка, это образ жизни: свобода, независимость, возможность заниматься тем, что тебе нравится и исключать то, что не нравится. Очень подходит для метода ICE, кстати.

Вот что мне нравится в инди-хакинге:

  • Я сам себе хозяин. Я сам решаю, над чем работать, когда работать и сколько работать.
    • Не нужно отчитываться перед начальником и ходить в офис.
    • Я могу работать из любой точки мира.
    • Нужно отчитываться перед клиентами, конечно.
  • Я занимаюсь тем, что мне интересно. Я сам выбираю проекты, которые мне нравятся.
    • Не нужно делать то, что тебе не нравится.
    • Я могу реализовывать свои идеи. Разобраться, что именно хочется делать — это, пожалуй, самая большая проблема. Ощущение отсутствия фокуса или разбегающихся тараканов в голове — есть такой побочный эффект.
  • Я постоянно учусь новому. Инди-хакинг — это постоянное развитие.
    • Нужно быть в курсе новых технологий, новых трендов, новых возможностей.
    • Новый виток развития технологий, который мы переживаем сейчас — очень держит в тонусе и добавляет стресс от упущенных возможностей, не без этого.

Инди-хакинг: не для всех

Инди-хакинг — это не для всех. Это не волшебная красная таблетка, которая сделает тебя богатым и счастливым. Я, например, ничего толком не знаю: не могу назваться специалистом ни в одной из областей. Знаю, где найти ответы на вопросы и вижу множество параллелей в самых разных областях быта, науки и техники. Но я не складирую и оттого не обладаю никакими узко-специальными, знаниями. Генералист — так называется проклятье.

Вот кому не стоит заниматься инди-хакингом:

  • Тем, кто боится рисковать. В инди-хакинге нет гарантий успеха.
    • Ты можешь потратить много времени и сил, и ничего не заработать. Вообще ничего. Даже если измерял и прям шёл по стопам самых умных и удачливых.
    • Нужно быть готовым к неудачам. Динамика помогает в этом: к моменту, когда проект «флопнулся», шлёпнулся и разбился в лепёшку, я уже скорее всего занят чем-то новым.
  • Тем, кто не умеет работать самостоятельно. В инди-хакинге ты сам себе начальник.
    • Нужно уметь организовывать своё время, ставить задачи, мотивировать себя. Огромная работа идёт над содержанием кукушки в порядушке.
    • Нужно быть дисциплинированным и не забывать о глобальной цели: взбивать лапками сливки, пока хватает сил, чтобы получилось масло, на которое можно опереться и выпрыгнуть наконец-то из кувшина.
  • Тем, кто не любит учиться новому. Инди-хакинг — это постоянное развитие.
    • Нужно быть готовым к тому, что придётся постоянно осваивать новые технологии, новые инструменты, новые подходы.
    • Нужно быть любознательным.
    • Это очень ОК не знать, не понимать. Но очень не ОК не пытаться разобраться.

Инди-хакинг: стоит попробовать?

Если ты любишь свободу, независимость и готов к риску, инди-хакинг — это то, что тебе нужно. Это нелегко, но — мне кажется — это того стоит. Особенно пока ты молод и полон сил не до конца опустошён взрослой жизнью.

  • Начни с малого. Не нужно сразу пытаться создать «убийцу» OpenAI.
    • Посмотри на готовые решения, которые работают. Найди в них проблемы. Сделай версию попроще, которая решает конкретную проблему.
    • Сделай мини-продукт и выброси его на рынок.
  • Не бойся ошибаться. Ошибки – это естественная, если не основная, часть процесса.
    • Учись на своих ошибках и двигайся дальше.
    • Не сдавайся после первой неудачи.
    • Из ста проектов сработает один, и это прекрасно!
  • Будь настойчивым. Инди-хакинг — это марафон, а не спринт.
    • Не жди быстрых результатов. Радуйся, если получилось.
    • Продолжай учиться и пробовать, продолжай работать, и скорее всего что-то да получится. Гарантий нет никаких. И никогда не было.

Такова линия моих рассуждений. Разумеется, это не единственный вариант развития событий. Здесь можно посмотреть двухчасовой выпуск «Как ещё зарабатывать в IT», в котором ребята обсудили как минимум две другие стратегии.

Спасибо Андрею и Антону, и всем, кто причастен к проекту «Мы обречены», было интересно.

P.S.: Продолжаю обновлять телеграм-канал об развитии искусственного интеллекта и всего, что с ним связано: @aizvestia — присоединяйтесь, пока не поздно.

Комментарии