← все документы
Настройки
1.mp3 · 18:09 · 2026-05-20 08:51:12 ·
done
· проект: Alex-kurteev
Транскрипт
Speaker 0: Что ж, поехали. Я рад вас приветствовать на нашем мастер-классе Визуальный конвейер эксперта. Сегодня мы рассмотрим как генерировать графику с помощью исскусного интеллекта. И не только графику. Презентации, лид-магниты имеют также графическую составляющую и прямо относятся к нашему мастер-классу. К этому мастер-классу я шел давно. В свое время я мечтал о таком мастер-классе, но так или иначе сложилось, что я исследовал все, что мне было нужно, получил нужный опыт, автоматизировал, систематизировал данный процесс. Сегодня рад с вами поделиться проторенной дорожкой, как это можно делать быстро. С искусственным интеллектом ситуация следующая, что с 1 стороны все инструменты известны или как минимум их можно узнать, но это как черная дыра. Сюда можно вкладывать очень большое количество времени и результат непредсказуемый. Можно получить результат, можно не получить. Может уйти месяц. Поэтому я всегда перехожу к исследованию. Когда у меня есть конкретная четкая цель, я понимаю, что этот момент мне нужно автоматизировать. Этот момент мне нужно упростить. Тогда я иду в искусственный интеллект, начинаю изучать, исследовать, напалмом бить со всех сторон, чтобы получить результат. Выстраиваю свой путь и определенная часть процесса у меня становится систематизированной и я на нее трачу небольшое количество времени уже в будущем. Сразу сейчас расскажу мой подход к работе с искусственным интеллектом. Я не лезу сразу изучать все, что имеется, различные мультиагенты, OpenClove, регистрацию и так далее. Я выбираю те задачи, которые у меня стоят в обычных рутинных дневных задачах. И постепенно смотрю, что из этого я могу ускорить, на что я могу тратить меньше времени, меньше денег, меньше ресурсов. Так получилось. Первая моя задача была это упростить, ускорить процесс создания лендингов. Эту задачу я закрыл системно. Курс по созданию лендингов также записал к такому событию. Сейчас уровень и скорость создания лендингов меня просто восхищает. Когда приходит задача создать новый лендинг, у нас сейчас новый проект еще открывается. 1. Я понимаю, что мне для того, чтобы лендинг это буквально нужно вечер, а потом дальше мы уже детали все утрясаем. Это очень круто. Аналогичная ситуация у меня обстояла с графикой. Графику нужно делать часто, даже чаще чем лендинги и уметь генерировать обложки. Это очень важный навык. В процессе, знаете, когда мы начинаем писать пост, написали и думаем, вот его нужно опубликовать. У нас имеется буквально 10-15-30-60 минут для публикации и нужно идти. Возникает вопрос: что мне сделать? Использовать какую-то картинку, найденную на freepic, либо нарисовать самому, либо отправить без картинки? В искусственный интеллект лезть здесь пока не освоен навык. Сложно, потому что мы полезем и с большей долей вероятности без отточенных действий мы ничего не получим. Поэтому я пришел к графике также системным подходом. Простроил дорожку, создал промты и стал генерировать. Краткая история. Как я этому рассказывал в постах перед мастер-классом, у меня дети учатся в Вальдорской школе. У нас здесь в Сочи солнечная земля. У нас регулярно бывает собрание. Не отчитывание родителей, а собрание, где мы планируем. Мы понимаем, что у нас будет дальше, что от нас сейчас требуется, на что обратить внимание. Собрание, как правило, бывает длинное, не всегда можем присутствовать. Мы придумали, что будем делать аудиозапись. Это вот как раз в сентябре 2025 года. Тогда я говорю: Хорошо, давайте сделаем запись, и я что-нибудь с ней сделаю. Сперва я думал сделать краткое саммари, краткий текст. Потом думаю: у меня есть запись, есть контент и с ним можно как-нибудь поиграть. Я сделал первую презентацию через гамму. Так несколько наших собраний я делал через гамму изучая как можно создавать различные презентации. Потом понял что гамма не особо интересна, хочу исследовать другие варианты. В результате я сделал стиль для нашей школы, которым пользуются не только мои классы, в которых учатся мои дети, но и в целом вся школа, объявления и в целом это такой стиль уже больше ассоциируется с образом самой нашей школы. Сейчас процесс создания краткого содержания и презентации по собранию состоит из 1 шага и занимает 1 минуту. Я просто закидываю аудио, получаю готовый результат, скидываю в классный чат. Аналогичным образом я перевел все создание графики на и сегодня мы с вами рассмотрим все пути, все инструменты и подводные камни, с которыми можно столкнуться. Подводные камни действительно существуют. Они могут сильно тормозить. Мне кажется, я споткнулся большое их количество. Надеюсь, больше их не будет, но так иначе я сегодня расскажу и мы максимально ускоримся. Итак, начинаем. Визуальный конвейер эксперта. Сперва рассмотрим наш арсенал инструментов искусственного интеллекта. Какие модели мы будем использовать и почему именно их мы будем использовать. Итак, основные инструменты, которые мы будем рассматривать на мастер-классе. Это нано банана и ноутбук LM. Это основные. Сейчас поясню почему и поясню на будущее, что почему мы их выбираем и как они нам пригодятся какие альтернативы у нас могут быть. Нана банана это инструмент для создания иллюстрации от гугла. Он входит в 1 из вариантов. Можно пользоваться через gmini. Gmini это модель там же, если мы выбираем создать изображение, у нас подключается нано бананы. Подробно в нашем мастер-классе мы сегодня рассмотрим и нано бананы и ноутбук lm и связку из всех инструментов и конкретно мой опыт пошагово что делать для получения того или иного результата почему мы выбираем нано банан а не какой-нибудь там миджорний кантинского флюкс или так далее. Нано банана отличается архитектурой в целом. Краткая сводка. Существует 2 архитектуры для создания иллюстрации. Первая архитектура это диффузионная модель. По ней работает mijourney. Когда создается изначально серое облако, оно постепенно высветляется, становится четче, появляются детали и таким образом у нас создается иллюстрация. Это отличная модель для создания очень творческих иллюстраций с вау эффектом. Но в этой модели есть минусы. Она не умеет работать с языками абсолютно никак. Будут всегда получаться иероглифы и очень сложно сохранять стопроцентную консистентность. Даже на уровне 90 процентов схожесть с изначальным референсом, так сказать, с изначальной иллюстрацией, сохранять персонажа, сохранять композицию в миджорнии с диффузионной моделью очень сложно. Нано-банана это другая модель, другая архитектура, авторегрессионная. Она работает по следующему принципу. Прежде чем начать создавать иллюстрацию, она создает векторное описание. Вектор это цифра. Создается многомерное из сотен 1000 параметров цифровое описание, на основе которого потом шаг за шагом происходит отрисовка иллюстрации. Когда мы говорим Наня банане, нам нужно убрать яблоко с этой иллюстрации и заменить его допустим на ананас, то Наня банана знает где находится яблоко и заменяет его. Благодаря натренированности на физических объектах, у нас происходит очень точная замена сохранением всех физических свойств. Это благодаря тому, что изначально было подготовлено очень подробное, точное векторное описание иллюстрации. Если образно описать, что такое векторное описание, это тот же самый промпт, только настолько подробный, что описаны абсолютно все детали в этом промпте. Он генерируется автоматически на основе нашего запроса. Так вот, Nano Banano идеально подходит для того, чтобы создавать баннеры, чтобы создавать инфографику, чтобы создавать слайды презентаций и позволяет легко менять фоны, background, менять одежду у человека, менять эмоции, дописывать текст, удалять текст. Но слава богу нано банана не единственный инструмент, потому что, как вы знаете, геополитическая ситуация у нас на данный момент немножко напряженная. Доступы в Россию к искусственным интеллектам то открывают, то закрывают, то ужесточают и еще больше ужесточают как с внешней стороны, так и с внутренней. И иметь 1 инструмент и уповать на то, чтобы его не закрыли это конечно не самый, не самая приятная ситуация. Недавно вышел конкурент Nano Banan от OpenAI. Он работает в ChatGPT, называется imagine. Работает по тому же принципу, использует ту же самую архитектуру. Поэтому, если по каким-то геополитическим причинам у вас нет доступа к Google к Nani Banani, можно использовать ChatGPT. Апологеты OpenAI заявляют, что он работает гораздо круче чем Nano Banano. Но стоит учесть, Nano Banano вышла год назад. Вторая версия вышла полгода назад а иллюстрации от чат g5 вышли буквально месяц назад то есть ждём ответную реакцию наша задача не выбирать не уповать на то, что вот они выпустили лучше. Мы выбираем лучшее. Нам подходит именно модель, которая создает вектор, потом по нему рисует автоэгрессионная модель. Кто будет завтра на коне мы его просто и выбираем. Если иллюстрации подходят больше, если нам больше нравится как работает, то берем. Вопрос не в том, что мы всегда используем бананы и этот мастер-класс применим только бананы. Нет. Вопрос в том, что есть разные модели. Мы выбираем конкретно модель, которая умеет писать, рисовать, удалять. В данном случае нано банана и imagine atchatgpt. Следующий инструмент это ноутбук LM. Ноутбук LM это инструмент также от Google, позволяет вам на основе ваших данных, на основе исследований из интернета общаться с этой информацией, а потом превращать ее в графический вид. Это идеальный инструмент для обучения. Изначально данный инструмент для этого и создавался, чтобы можно было очень быстро освоить определенную информацию. Не секрет, что сейчас информации в нашем мире становится все больше и больше. Нужно очень быстро успевать понимать и изучать. Ноутбук LM это идеальный инструмент для изучения. Но кроме этого его можно использовать и в бизнес-целях для создания для получения идей, для получения сводок. Этот момент мы тоже рассмотрим. Как работает ноутбук LM? Мы загружаем данные, свои аудио, тексты, либо исследуем через интернет, потом общаемся и генерируем. Аналоги ноутбука LM, которые вы вероятно встречали это ChatGPT S, то есть когда на основе своих данных создаем чаты в ChatGPT. Это нейро помощник от Яндекса или, если давно, ИИ, то вероятно встречали такую аббревиатуру как RAG база знаний. Это как раз набор ваших материалов, на основе которых пользователь работает с ИИ. В прошлом году у нас на платформе School Master 1 из первых, до сих пор вроде никто еще не сделал из коллег, сделали рак базу знаний для того, чтобы создавать и кураторов, тренажеры по курсам в рамках платформы. Они работают не с большими данными всей языковой модели, а с конкретными данными. Так вот ноутбук LM как раз собирает ваши данные. Для чего собирает ваши данные? Вы с ними общаетесь, получаете краткую суть и получаете визуализацию этих данных. Для чего нам подойдет ноутбук LM? Если выделить 1 фразой ключевое преимущество это быстрое понимание ключевой сути, которую нужно представить графически. Сейчас также мы ноутбук LM подробно рассмотрим. Дополнительные инструменты, которые нам понадобятся, пригодятся. Это обычная языковая модель. Можно использовать любую: Cloud, Gminai, ChatGPT, ту, которую используете. Я использую Cloud. Он мне гораздо больше по душе, чем все остальные, но в данном мастер-классе, в данном курсе выбор LLM модели не критичен. Мы будем использовать LMM модель для работы с промтами, для создания своих стилей, для видоизменения этих промтов. Дополнительная плюшка, дополнительный бонус. Я расскажу про гамму. Гамма это инструмент для создания презентаций. Кто использовал гамму напишите буквочку Г, кто не использовал напишите циферку 0. Гамма это инструмент для создания презентации. Скажу так PowerPoint на стероидах. Про PowerPoint слышали, я думаю, абсолютно все. И долгое время я искал замену PowerPoint, потому что это устаревшие стили и хотелось какого-то свежего воздуха. Когда я увидел гамму, сперва я не совсем понял ее, но потом как понял, я тут я начал использовать постоянно. Презентация, которую я вам сейчас показываю, сделана на гамме с использованием бананы дополнительно. Эта презентация была сделана за 15 минут. Здесь у нас слайдов раз, 2, 4, 8 штук. Позволяет быстро создавать красивые презентации. Не обычные штампы как у всех, а что-то свое. Сегодня бонусом я расскажу как использовать гамму. Ну что ж, арсенал инструментов мы с вами рассмотрели.
Правки сохраняются при потере фокуса.
Сгенерировать
Шаблон
Продающее описание урока
Контекст для подстановки
Курс
Модуль
№ урока
Название урока
Аудитория и её боли
Сгенерировать
Генерации (
0
)