У меня часто спрашивают — «как ты это делаешь?» Ну вот всю эту музыкальную магию (а мы ведь знаем, что любая продвинутая технология на определенном этапе становится неотличима от магии).
Я мог бы начать рассказывать всякие технические подробности работы с нейросетями и музыкальным софтом — но давайте-ка лучше зайдем с другого бока. Вы ведь наверняка заметили, что я использую нейросети Suno и Riffusion — это совсем разные продукты, но результат у меня выходит довольно похожий. То есть дело как бы не в нейросетях.
Больше того — когда Riffusion выкатили новый уровень нейросети Producer, я некоторое время повозился с ним — а потом вернулся к классическому варианту. Producer, обеспечивающий итерационную схему работы с композицией, когда вы в понятных обычному человеку терминах говорите ему, что нужно изменить в этой самой композиции — проще для дилетанта, но результат… Так себе результат. Из-за невозможности тонко влиять на модель — получается что-то такое очень среднестатистическое, аморфное, и с некоторого момента нейросеть начинает путаться и лишь ухудшает всё.
Поэтому давайте зайдем с основы. И начнем, конечно, с текста.
Я мог бы написать для примера оригинальный текст — но это было бы не так показательно, как если взять за основу что-нибудь общеизвестное. Например, «Любимый город» Евгения Долматовского*, написанный в 1939 году для песни в кинофильм «Истребители».
В далёкий край товарищ улетает,
Родные ветры вслед за ним летят.
Любимый город в синей дымке тает —
Знакомый дом, зелёный сад и нежный взгляд.
Пройдёт товарищ все бои и войны,
Не зная сна, не зная тишины.
Любимый город может спать спокойно
И видеть сны, и зеленеть среди весны.
Когда ж домой товарищ мой вернётся,
За ним родные ветры прилетят.
Любимый город другу улыбнётся:
Знакомый дом, зелёный сад, весёлый взгляд.
Что-то это мне напоминает… А, ну да — «Чубчик» Пети Лещенко:
Пройдет зима, за ней настанет лето
В саду деревья пышно расцветут
А мне бедному да бедному мальчонке
Эх, цепями ручки, ножки закуют
Ну да и ладно, какая разница. Посмотрим внимательно на текст Долматовского, благо он очень простой, всего три куплета и больше ничего.
Первое, что сразу бросается в глаза — в тексте фактически нет развития. Первый куплет — в чистом виде идет эспозиция «в далёкий край товарищ улетает», просто расстановка декораций. Причем всё изложение идет от стороннего, третьего лица.
Затем во втором куплете уверенно излагается центральный нарратив — «Пройдёт товарищ все бои и войны», и поэтому «Любимый город может спать спокойно».
И, наконец, в третьем куплете рассказчик говорит о будущем — мол, «Когда ж домой товарищ мой вернётся», ему там все улыбнутся и всё будет хорошо.
По сути, в тексте ничего нет, никакого действия. Но зато есть настроение — да, Долматовский молодец, он аккуратно загружает слушателя образами — «родные ветры», «любимый город», «в синей дымке тает», «знакомый дом», «зелёный сад», «нежный взгляд» и прочее.
ОК, этого было достаточно во второй половине 1930-х — но сейчас этого уже мало. Надо этот эмоциональный настрой чем-то подкрепить, и более того — надо в моём стиле обеспечить эмоциональные качели, контрапункт, переход от спокойного изложения экспозиции к emotional hook.
Эмоциональные зацепки — это элементы повествования, призванные вызвать сильные чувства у аудитории, вовлечь ее в историю и создать более глубокую связь.
Поэтому я сажусь и пишу припев — от первого лица, конечно, ведь слешателя надо вовлечь в переживания героя и исполнителя, показать искренность и глубокие переживания:
И пусть опять, как прежде, вишни будут,
Краснеть в руках от солнца и тепла.
Я вновь и вновь ищу тебя повсюду,
И я хочу, чтоб ты меня нашла.
Положительно что-то это мне напоминает, но я уже не помню, что. Но звучит хорошо — как бы не лучше, чем остальной текст.
Ставим этот припев после каждого куплета. Делаем черновую разметку для ИИ — указываем секции [Verse] и [Chorus], добавляем в начале какое-нибудь [Electronic Instrumental Intro: Synth Pads, energetic voice], а в конце [Fade Out and End].
Ну вот, черновичок готов. Грузим его в секцию лирикс нейросети, в секции стиля указываем совсем простенькое — навроде Rock ballad, male voice. Ну и делаем первую генерацию, чтобы услышать всё целиком. Будет так-сяк, кривенько — но это же черновик.
Итак, что нам слышно из этого черновика?
- Трёх куплетов — маловато будет. Надо бы добавить в конце какую-то дидактику, обобщение, чтобы слушатель почувствовал общность с лирическим героем, а значит — нужен четвертый куплет.
- Куплеты явно нужно переписать от первого лица, чтобы углубить эмоциональную вовлеченность слушателя.
- К четвертому куплету надо сделать вариативный припев, чтобы освежить восприятие.
- Ну и, конечно, инструментальные проигрыши — в начале (вступление), после припевов (эмоциональное развитие) и в конце.
- Не забываем скорректировать фонетические ошибки нейросети — у нее плохо с русским языком, поэтому те места, где она выпевает неправильно, нам придется расписать фонетикой или заменить слова на те, что она выпевает без ошибок.
Ну что же, делаем — получается что-то вот такое:
[Rich, soulful harmonies]
[Electronic Instrumental Intro: Synth Pads, energetic voice]
[Verse 1]
В далекий край сегодня улетаю,
Родные ветры вслед за мной летят.
Любимый город в синей дымке тает,
Знакомый дом зеленый сад и нежный взгляд.
[Chorus]
И пусть опять, как прежде, вишни будут,
Красньэть в руках от солнца и тепла.
Я вновь и вновь ищу тебя повсюду,
И я хочу, чтоб ты меня нашла.
[Long Electroguitar Solo, hard riffs, Melodic Interlude]
[Verse 2]
Пройду я смело всё — бои и войны,
Не зная сна, не зная тишины.
Любимый город может спать спокойно,
И видеть сны, и зеленеть среди весны.
[Chorus]
И пусть опять, как прежде, вишни будут,
Красньэть в руках от солнца и тепла.
Я вновь и вновь ищу тебя повсюду,
И я хочу, чтоб ты меня нашла.
[Long Electroguitar Solo, hard riffs, Melodic Interlude]
[Verse 3]
Когда ж домой душа моя вернется,
За мной родные ветры прилетят.
Любимый город снова улыбнется:
Знакомый дом, зеленый сад, веселый взгляд.
[Chorus]
И пусть опять, как прежде, вишни будут,
Краснеть в руках от солнца и тепла.
Я вновь и вновь ищу тебя повсюду,
И я хочу, чтоб ты меня нашла.
[Long Electroguitar Solo, hard riffs, Melodic Interlude]
[Verse 4]
Мы в жизни все куда-то улетаем,
Но будем знать повсюду и везде:
Любимый город в синей дымке тает,
На отраженьях в голубой воде.
[Chorus]
И знаю я, что снова вишни будут,
Красньэть в руках от солнца и тепла.
И я тебя, родная, не забуду.
Ведь ты любовь во мне свою нашла.
[Long Melodic Outro]
[Fade Out and End]
Снова запихиваем это в лирикс нейросети, в секции стиля снова указываем что-то совсем простенькое, типа Rock ballad, male voice. Генерируем, слушаем, что получилось.
Ну вот, уже сильно лучше. Теперь начинаем работать со стилем, а заодно по тексту расставлять разметку всяких emotional hook — тут петь спокойно, тут форсировать, тут истерическая шизофрения, тут шизофреническая истерика, building to a powerful chorus with, echoing vocal samples, тут пианино, здесь синтезатор, тут рок-гитара.
Ну и высший пилотаж — это, конечно, самому сыграть пример какого-то соло или там ритмического сопровождения на гитарке или клавишах, и загрузить для нейросети в качестве образца. Даже напеть можно какие-то ходы, чтобы нейросеть поняла — как именно ты хочешь, чтобы было там или сям.
С вокалом — очень важно работать в паре с нейросетью, то есть взять предложенную ей тональность и темп, но отпеть первый куплетик или припев, сделав исправления в мелодике, интонациях и тембре. Я обычно это делаю примитивно, в Sound Forge Pro (да, есть продукты и получше — но на SF и плагины к нему у меня есть лицензия из древних времен, а покупать новое или юзать ломанное для продакшена — плохой стиль работы). В общем — берем болванку от нейросети, вырезаем из нее вокал, чтобы иметь основу, в неправильных местах — снижаем громкость, и затем прямо впараллель с этим вокалом отпеваем так, как надо. Делаем несколько попыток, чистим, и скармливаем в нейросеть.
И помните, что то, что с вашими стараниями сделает нейросеть — это в общем случае еще не финальный продукт, это как бы Draft. С этим мы продолжаем работать средствами классического нелинейного монтажа — как с треками, записанными в студии вживую. Можем что-то поверх наложить, где-то доиграть, в конце концов — разрезать фонограмму на куски и смонтировать иначе, заменить одно на другое.
В результате получится что-то типа вот такого:
Ну как вам такое? Вступление в стиле вестерна — а дальше понеслось. Да, я знаю, что соло-гитары много — но я так люблю делать, мне нравится самовыражаться в соло. Гитарка, кстати, самая простецкая, на такой в консерватории бедные студенты первого курса играют:
Это китайский Terris 39 RD, стоит сущие копейки. Технически это Фендер Стратокастер SSS, довольно аккуратный клон классического страта конца 70-х. Естественно, как и нынешние Фендеры доступных линеек — он требует приложения рук, чтобы довести его до уровня. А значит — зачем платить больше за оригинал? Струнки Ernie Ball Super Slinky 9 — 42, потому что я играю с потяжками и вибрато на ладах, практически никогда не использую механизм тремоло. Ну, я думаю, что характерные подвывания Super Slinky в момент зажатия струн даже слышны на записи — но это такой стиль.
Да это, в общем-то, и неважно — это скорее для удовольствия, чем по реальной необходимости. Иногда хочется руками поиграть, да. Вчерне — ну, например, вот как-то так:
Партии гитары небрежные, так, по-быстрому накидал для примера.
Главное — тяп-ляп — и в продакшен! Всё равно российскому шоубизнесу это не нужно, ты будь хоть новым Паганини и Ленноном в одном лице — нахрен ты им никуда не впёрся, товарищ. Продюссерская модель шоубизнеса предполагает, что исполнитель-фронтмен либо должен быть полной бездарью, легко заменимым болваном — либо за него должны хорошо вбашлять те, кто его толкает (и снова никого не волнует, что он не отличит ноту «ля» от ноты «до»). А ты, мой дорогой друг — в лучшем случае будешь работать на побегушках у этих болванчиков, таскать для них каштаны из огня за мелкий прайс. Это правда то, о чем ты мечтал?
Думаю, что вряд ли. Поэтому делай свою нетленку — много и разную, пипл хочет слушать новое, и никто в реальности не будет это слушать на хорошем аппарате, всему этому — дорога в автомобильную магнитолку и в наушники-вкладыши смартфона, ты так и знай.
Мне сверху видно всё — ты так и знай
Поэтому смешны потуги пафосных музыкантов сделать «хороший звук» — он тупо никому не нужен (кроме кучки фриков) еще с момента прихода компакт-кассет, а затем MP3 и стриминговых сервисов. Лучше больше и чаще ™.
Вот, например, заготовка под титры к фильму (я постарался обойтись без рок-гитары, побольше клавишных, симфонизм и плотная музыка для кино, арабские мотивы):
Неожиданно? Ну я по-всякому умею. Естественно, если это куда-то пойдёт — текст я напишу другой, с чистым копирайтом, а это так, пример аранжировки.
Вкладывай в песню свою душу, чувства и мысли — а не бабло. И тогда… нет, тебя всё равно практически никто не услышит. Но ты кое-что поймёшь о себе. И это — тоже большое дело.
* Текст песни «Любимый город» Евгения Долматовского используется в рамках пародии, для целей обучения как пример.
Поблагодарите автора - поддержите его материально:
