Midjourney нейросеть Discord
Ученый, стартапер, революционер
Midjourney — разработанная одноименной американской компанией нейросеть, которая поразила пользователей по всему миру картинами (иначе назвать это невозможно), созданными на основе текстовых запросов. В феврале 2022 года проект основал ученый и предприниматель Дэвид Хольц — 33-летний выпускник факультета прикладной математики Университета Северной Каролины в Чапел-Хилл. В студенчестве Хольц успел поработать в Институте Макса Планка, где изучал алгоритмы нейровизуализации и разрабатывал карту мозга крысы на клеточном уровне, и даже в исследовательском центре NASA, где занимался технологией LiDAR (обнаружение и определение дальности с помощью света, используется, в том числе, в камерах iPhone для лучшей фокусировки на объекте).
В 2011 году молодой ученый ушел из аспирантуры и переехал в Сан-Франциско, где основал первую собственную компанию — Leap Motion (сейчас Ultraleap), которая разрабатывает датчики движения и другие системы распознавания человеческих жестов. Хольц руководил фирмой вплоть до 2021 года, но решил выйти из бизнеса: ему, по собственным словам, не хотелось управлять крупной компанией — в интервью The Verge Хольц признался, что ему интересна другая, молодая и быстроразвивающаяся среда.
В начале 2022 года Хольц вышел из состава учредителей Ultraleap и основал Midjourney. По словам предпринимателя, штат компании даже сейчас, когда ее настигла мировая слава, не превышает 10 человек, у проекта нет инвесторов, а деньги не являются главной мотивацией основателя. «Главное, чего я хочу, — чтобы на ближайшие 10 лет у нас был дом, в котором мы могли бы экспериментировать с технологиями и создавать продукты, который будут иметь значение не только для меня, но и для всего мира. Ну и получать удовольствие в процессе», — говорит он.
Хольц описывает Midjourney как "стартап", говоря, что это не деловое предприятие или банк, а научный проект.
Как это работает
Работу Midjourney обеспечивают два технологических прорыва в области искусственного интеллекта, произошедших относительно недавно: умение нейросетей понимать человеческую речь и создавать образы. Чтобы преобразовать два этих скилла в стройную систему, которая по запросу выдает произведения искусства, нейронную сеть обучают выстраивать соответствие между текстовыми описаниями и визуальными образами на сотнях миллионов примеров. Результаты такого обучения позволяют решать различные кросс-модальные задачи — генерацию картинок по текстовому описанию, генерацию текстовых описаний по картинкам, дорисовку частей изображения и так далее, говорит руководитель управления экспериментальных систем машинного обучения SberDevices Сергей Марков. «Midjourney — это диффузионная нейронная сеть и состоит как бы из двух нейросетей: первая отвечает за об обработку и понимание текста, вторая — за генерацию изображения», — объясняет Марков.
В середине июля Midjourney вышла в фазу бета-тестирования и стала доступна пользователям по всему миру. Правда, чтобы дать задание Midjourney, нужно быть зарегистрированным в Discord — кроссплатформенном мессенджере, популярном у геймеров, разработчиков игр и дизайнеров. Сначала нужно зайти на официальный сайт Midjourney и авторизоваться через Discord, затем оплатить подписку или воспользоваться бесплатной версией. Бесплатная версия позволяет сгенерировать и скачать 12 изображений, но не дает доступ к личному кабинету (это мешает отслеживать судьбу своих запросов в общем чате), за $10 можно создавать до 200 изображений в месяц, за $30 — генерировать бесконечное количество картинок. Доступна также корпоративная подписка стоимостью в $600, которая дает сотрудникам компании возможность создавать картинки в команде и просматривать индивидуальные работы друг друга.
По словам Хольца, способ доступа к системе через Discord он выбрал из-за группового принципа работы платформы: люди охотнее фантазируют, когда собираются в группы, считает Хольц. Присоединившись к сервису, можно отправлять текстовые команды для создания изображений вместе с другими пользователями или поодиночке на любом из множества каналов Discord.
Чтобы создать изображение, достаточно внести в чат с ботом Midjourney слова, описывающие картину, которую в итоге хочется получить. Система сгенерирует четыре изображения на выбор, а дальше наиболее подходящую картинку можно масштабировать, изменять и дорабатывать до идеала.
Полученные изображения появляются в общем канале Discord примерно через минуту после отправки запроса. Обладатели платной подписки могут отправлять боту команды в формате личных сообщений, а не через общедоступный канал. Но сгенерированные нейросетью изображения по умолчанию остаются общедоступными для просмотра.
Такой подход позволяет создавать самые разнообразные изображения, от традиционных изображений, таких как пейзаж или городские пейзажи, до очень абстрактных, таких как изображение океана, и более конкретных, таких как портрет одного из членов команды.
Нейросеть Midjourney, как пользоваться
Чтобы начать пользоваться нейронной сетью Midjourney, необходимо перейти по адресу https://discord.gg/midjourney и нажать кнопку «Принять приглашение». Далее подключиться к одному из каналов newbies на боковой панели, затем в чате ввести команду /imagine и нажать на «prompt». После этого напечатать текстовое описание на английском языке, подождать некоторое время пока не произойдет генерация изображения.
Обратите внимание, что в бесплатной версии Midjourney доступно всего 25 генераций. Также для входа необходим действующий аккаунт в Discord.
-
А если войти в Midjourney с одного аккаунта дискорд, использовать свои 25 генераций изображений, а потом зайти с другого аккаунта, то по идее будет ещё двадцать пять.
-
Нажимаю на кнопку «Принять приглашение», а браузер Safari пишет, что ссылка не действительна, что-то там не удалось.
-
Оказывается Midjourney может создавать похожие по образу картинки. Если вы хотите, чтобы нейросеть сгенерировала изображение по вашему эскизу, необходимо в конце текстового описания добавить ссылку на фото.
Не вошедшие пользователи не могут 'Комментарии - Размещать'.
Дата создания:
Дата изменения:
2
1
Нейронная сеть сделает снимок созданного ею эскиза. Результат сохраняется в текстовом файле (в формате JSON).
Нейронная сеть будет работать следующим образом:
Когда изображение будет сгенерировано, программа загрузит изображение из файла и автоматически нарисует фигуру.
Если изображение недостаточно хорошее, программа попытается улучшить его, создав модель изображения.
Вот и все!
Ничего оригинального
Midjourney не первая и не единственная нейросеть, способная генерировать изображения на основе текстовых запросов — до этого мир потрясли DALL-E от OpenAI и Imagen от Google.
Разработку DALL-E обеспечил грант от Microsoft в $1 млрд, который корпорация выделила проекту OpenAI, специализирующемуся на технологиях искусственного интеллекта. На эти средства OpenAI разработал нейросеть на базе третьего поколения алгоритма обработки естественного языка GPT-3, который компания создала годом ранее. Для широкой аудитории нейросеть стала доступна через 2 года — в январе 2021-го, а в апреле 2022 года вышла ее улучшенная версия — DALL-E 2.
В ноябре 2021 года команда разработчиков Sber AI создала аналогичную нейросеть, которая обрабатывает запросы на русском языке. Проект получил название ruDALL-E, но отношения к оригинальному DALL-E не имеет: разработки засекречены, и нейросеть российские специалисты обучали с нуля самостоятельно. Разработчики заявляют, что процесс обучения ruDALL-E стал самой большой вычислительной задачей в России.
В мае 2022 года нейросеть Imagen, генерирующую изображения, выпустил Google. На официальном сайте продукта разработчик утверждает, что Imagen превосходит DALL-E по точности изображений и соответствию картинки техническому заданию.

Никаких технологических «киллер-фичей» у Midjourney нет, уверен директор по науке и технологиям консалтинговой компании «Агентство Искусственного Интеллекта» Роман Душкин. По его словам, все перечисленные системы работают по общему принципу: «человек дает как можно более конкретное текстовое описание той картинки, которую он хочет получить. Благодаря технологии глубокого обучения, нейросеть понимает смысл текста и преобразует его в картинку». Общая модель работы нейросетей такого типа открыта и понятна: о ней пишут подробные статьи в научных журналах. Разница и конкурентное преимущество — в индивидуальных технологических особенностях, которые влияют на пользовательский опыт и которые разработчики не раскрывают. Например, Midjourney обеспечивает более высокое разрешение итоговых картинок и большую детализацию в соответствии с текстовым запросом, отмечает руководитель лаборатории искусственного интеллекта в новых материалах центра в сфере ИИ на базе университета «Иннополис» Руслан Лукин.
Но все же главный «изюм» Midjourney в том, что ею может воспользоваться любой желающий, в отличие от других подобных нейросетей, доступ к которым возможен только по приглашениям или платно, считает исследователь разработчика ИИ-продуктов DeepPavlov.ai Александр Чернявский. «Среди всех генерирующих картинки из текста нейросетей это первая широкодоступная и частично бесплатная сеть, которая благодаря этой особенности „завирусилась“ в интернете», — говорит он. DALL-E 2 тоже можно использовать свободно, но доступ к ней открыли совсем недавно, а Midjourney изначально пошла по пути массового использования и не прогадала, добавляет Сергей Марков из Sber AI:
"Благодаря популярности нейронной сети в настоящее время существует множество руководств по ее использованию. И я думаю, будет справедливо сказать, что Midjourney уже является эффективным инструментом для начинающих".
Как только Midjourney был запущен, стало ясно, что у него будут некоторые недостатки. Прежде всего, количество снимков, которые могут быть сгенерированы с помощью нейронной сети, ограничено. Как следует из названия, нейронная сеть хорошо работает, если входные данные состоят из слов, а не картинок.
Нейросеть Midjourney, как пользоваться
Краткое руководство как пользоваться нейросетью Midjourney.Даже такого базового понимания вполне хватит, чтобы залипнуть на часок и получить на впечатляющие результаты. А вот для проф.работы стоит уж прочесть полное оф.руководство, там есть много интересного.
Итак, нейросеть Midjourney работает на основе дискорда, так что вам нужно будет перейти на соответствующий дискорд-канал сюда
- ищем любой канал с newbie (например, newbie-20). Панель со списком каналов будет слева, присоединяетесь.
- пишем в чате /imagine, у вас выпадает сообщение /imagine prompt: вот после prompt вы и говорите сети, что надо создать. Можно писать через запятую. Советую пролистать вверх ленту с изображениями, там видны запросы, они помогут понять что стоит добавить. Вместо "battle robot" напишите "copper battle robot on the run, oriental, blood red sky". Будьте точнее, результаты будут удивительнее
- дальше вам надо отследить свою картинку в общем потоке изображений других пользователей. Проще всего сделать это, щелкнув правой кнопкой и скопировав ссылку, потом просто откройте её в новом окне.
- Mindjourney предложит вам 4 изображения. Дальше вы можете кнопками u1,u2,u3,u4 увеличить одно из них или же кнопками v1,v2,v3,v4 улучшить. Если вы выберете второе, то итог опять надо будет отлавливать в чате (если кто знает как в Discord удобнее отслеживать свои сообщения, прошу черкнуть в комменты). Когда итоговое улучшенное изображение окончательно вас устроит, то стоит нажать max upscale, чтобы увеличить его. Потом все, вы можете просто сохранить его.
- Если результат вам не понравился, то жмите на кнопку ⟳
Напоследок отмечу что все изображения будут в вашем discord-аккаунте, так что можно потом сохранить их и оттуда.
Сейчас есть ограничение на 25 запросов на создание. Впрочем, никто не мешает вам завести новый аккаунт -) Впрочем, безлимит стоит 30$ - совсем недорого.
Кстати, я уже рассказывал про программу, которая с помощью нейросети увеличивает изображения. Если у вас есть старое маленькое фото, то она может здорово помочь.
Существует также программа, которая может генерировать изображения из существующего изображения. Вот почему я предлагаю сделать шаблон вашего изображения, а затем перейти к инструменту и просто настроить его. Это очень просто!
И еще раз, я хотел бы спросить, знаете ли вы какой-либо метод автоматической сортировки изображений без какого-либо пользовательского ввода?
!!frag-10/14
Комментарии
Отправить комментарий