Форум программистов, компьютерный форум, киберфорум
Музыка
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
 
Just Do It!
 Аватар для XLAT
4217 / 2677 / 656
Регистрация: 23.09.2014
Сообщений: 9,142
Записей в блоге: 3

Тестирую нейросеть: Сделал песню про пограмиста

24.10.2025, 11:07. Показов 6217. Ответов 131
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
1
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
24.10.2025, 11:07
Ответы с готовыми решениями:

Неопознаю песню, исполнителя тем более
Может, кто подскажет, кто поёт песню: "Дрянная деввочка" вроде поискал не нашёл, больше нечего...

Найти песню по припеву
Из припева помню только 2 слова) "и снова...". Это "и снова..." повторяется два или три раза...

Не могу найти песню о Запорожье
Хочу найти песню(хотя можно и клип) о Запорожье. Там есть такие слова: "Я люблю этот город, потому...

131
Just Do It!
 Аватар для XLAT
4217 / 2677 / 656
Регистрация: 23.09.2014
Сообщений: 9,142
Записей в блоге: 3
23.01.2026, 21:13  [ТС]
Студворк — интернет-сервис помощи студентам
Цитата Сообщение от Royal_X Посмотреть сообщение
Не делай того, что он говорит
я уже сам догадался, а потом прочёл твоё послание)))

разрабы, как обычно продолжают стоять к обычным юзверям жопой - тут ничего не поменялось ...

я уже почти на 99% уверен, что это заговор, потому что нельзя случайно по недоумию
такую высокотехнологичную разработку положить на витрину в такой говняной упаковке...

Добавлено через 3 минуты
Цитата Сообщение от Royal_X Посмотреть сообщение
Или нужен мощный комп?
автор говорит, что
Рекомендуется дискретная NVIDIA-видеокарта с минимум ~16 GB VRAM для стабильного запуска модели HeartMuLa-oss-3B и других компонентов.
32 GB системной памяти или больше для комфортной работы inference-процесса и зависимостей.
50 GB свободного места для моделей (~20 GB+), зависимостей и рабочих файлов.
Цитата Сообщение от Royal_X Посмотреть сообщение
Не делай того, что он говори
но мы же не будем его слушать, верно?!
))

Добавлено через 2 минуты
Цитата Сообщение от Royal_X Посмотреть сообщение
Не делай того
как думаешь, можно ли изготовить портабл версию для ОДНОКНОПОЧНОЙ установки?
0
Эксперт функциональных языков программированияЭксперт С++
 Аватар для Royal_X
6270 / 2994 / 1051
Регистрация: 01.06.2021
Сообщений: 11,107
23.01.2026, 21:34
XLAT, системные требования высокие. Остаётся надеяться, что они преувеличены и на практике будет работать и на более слабом девайсе.
Портабл, полагаю, можно создать. По крайней мере, для локальной генерации изображений, а также для локального конвертирования звука в текст, у меня все в портабл. Комфи тоже портабл (хотя я его не использую), поэтому полагаю, что это тоже может работать портабл.
0
Эксперт функциональных языков программированияЭксперт С++
 Аватар для Royal_X
6270 / 2994 / 1051
Регистрация: 01.06.2021
Сообщений: 11,107
24.01.2026, 16:05
XLAT, у меня было немного времени, я решил поисследовать HeartMula.

На сайте https://heartmula.github.io/, если пролистать вниз, то можно прослушать и сравнить разные генераторы. И, кажется, что HeartMula довольно неплохая, если сравнивать с другими. Так что, это интересная тема, к тому же, как я тебе уже говорил, я всегда предпочитаю локальную генерацию.

Что касается установки, то я сделал бы так:

1. Поставил бы ComfyUI portable - такая версия официально существует. Скачать можно здесь https://github.com/Comfy-Org/ComfyUI/releases. Если нет дискретной графики NVidia, а следовательно технологии CUDA, то придется скачивать файл ComfyUI_windows_portable_amd.7z

2. ComfyUI portable я давно использовал, но для генерации изображений. Там прикольная нодовая система, которая позволяет создавать самые сложные сценарии. Но потом, для генерации изображений я перешел на AUTOMATIC1111 SD WebUI. В любом случае, ComfyUI не сложная в понимании, за полчаса разберешься в интерфейсе.

3. Далее, нужно установить https://github.com/benjiyaya/HeartMuLa_ComfyUI . Некий чел создал кастомные ноды HeartMula для ComfyUI. Есть даже видео по установке.
Кликните здесь для просмотра всего текста

Думаю, проблем с установкой не должно быть. Судя по видео, этот чувак ничего сложного не сделал.

4. Преимущество использования HeartMula в ComfyUI в том, что не нужно сношаться с консолью, а все входные данные (промт, слова песни, параметры и пр.) вводятся через удобный графический интерфейс и так же само очень удобно получается вывод. Хотя, с другой стороны полагаю, что не обязательно юзать СomfyUI, можно просто создать скрипт на питоне для удобного запуска.

Единственная проблема это системные требования.
У них две модели, обе 3B (7B пока не вышла), одна с Reinforcement Learning, типа немного круче.
Но вот я посмотрел на размеры файлов .safetensors и на глаз прикинул, что для них нужно иметь приличную дискретную графику с VRAM, иначе на интегрированной графике будет использоваться RAM, причем 2 раза больше, чем размер самой модели + столько же, файла подкачки. И это еще не пиковое использование памяти. И обязательно нужно иметь SSD, чтобы от файла подкачки был какой-нибудь толк.

В любом случае, возможно, стоит попробовать модельку без RL - ту, которая весит меньше. С другой стороны, люди в комментах жалуются на качество и ждут 7B.
1
Just Do It!
 Аватар для XLAT
4217 / 2677 / 656
Регистрация: 23.09.2014
Сообщений: 9,142
Записей в блоге: 3
24.01.2026, 16:15  [ТС]
Цитата Сообщение от Royal_X Посмотреть сообщение
у меня было немного времени
нее - надо много времени - щас поставил генер на цпу - возможно к завтрашнему утру будет готово - пока 5%...

вот песню заказал сочинить дипсику про золотой рояль.

годно?
(сам стих я не читал - засунул в настройки не читая)

как закончит генерацию покажу тут, если будя что...
0
Эксперт функциональных языков программированияЭксперт С++
 Аватар для Royal_X
6270 / 2994 / 1051
Регистрация: 01.06.2021
Сообщений: 11,107
24.01.2026, 16:26
Цитата Сообщение от XLAT Посмотреть сообщение
сам стих я не читал
я тоже не прочел, только увидел, что на русском. Думаешь, HeartMula справится с русским текстом?

Разрабы сами пишут так

HeartMuLa: a music language model that generates music conditioned on lyrics and tags with multilingual support including but not limited to English, Chinese, Japanese, Korean and Spanish.
однако, как понимаю, все же лучше давать текст на English, Chinese, Japanese, Korean and Spanish... а еще лучше только на первых двух языках. Разраб, вроде из Китая, а опыт со всякими дипсиками и квенами говорит, что хоть китайские модели работают и на русском, но все же они сильны только на китайском и английском.

Добавлено через 1 минуту
Цитата Сообщение от XLAT Посмотреть сообщение
нее - надо много времени - щас поставил генер на цпу - возможно к завтрашнему утру будет готово - пока 5%...
а с памятью-то как? у меня проц сильный (он у меня генерирует изображения без участия GPU за несколько минут (конечно, всякие RTX генерируют за секунду или за доли сек), хоть это и не его задача), я больше за память переживаю
0
Just Do It!
 Аватар для XLAT
4217 / 2677 / 656
Регистрация: 23.09.2014
Сообщений: 9,142
Записей в блоге: 3
24.01.2026, 17:17  [ТС]
Цитата Сообщение от Royal_X Посмотреть сообщение
а с памятью-то как? у меня проц сильный
прогресс 15%

0
Just Do It!
 Аватар для XLAT
4217 / 2677 / 656
Регистрация: 23.09.2014
Сообщений: 9,142
Записей в блоге: 3
24.01.2026, 17:22  [ТС]
Цитата Сообщение от Royal_X Посмотреть сообщение
я тоже не прочел
в таком виде оно не годно, ибо это не песня, а баллада на редкого любителя ...

надо переделывать и переделывать текст стихов основательно,
чтобы получить четкий смысловой символизм и далее смотреть чтобы он был в балансе с музыкой...

но, тупо, для лабораторного экспа сгодиться...
0
Эксперт функциональных языков программированияЭксперт С++
 Аватар для Royal_X
6270 / 2994 / 1051
Регистрация: 01.06.2021
Сообщений: 11,107
24.01.2026, 18:15
XLAT, у меня всего 16 ГБ памяти, так что даже не знаю, пробовать или нет...

на скриншоте использование памяти для RL модели или обычной?
0
Just Do It!
 Аватар для XLAT
4217 / 2677 / 656
Регистрация: 23.09.2014
Сообщений: 9,142
Записей в блоге: 3
25.01.2026, 08:44  [ТС]
Вложения
Тип файла: rar output.rar (3.24 Мб, 3 просмотров)
1
Эксперт функциональных языков программированияЭксперт С++
 Аватар для Royal_X
6270 / 2994 / 1051
Регистрация: 01.06.2021
Сообщений: 11,107
25.01.2026, 15:47
XLAT, судя по скрину, количество итераций 2500 и нельзя никак понизить?
0
Just Do It!
 Аватар для XLAT
4217 / 2677 / 656
Регистрация: 23.09.2014
Сообщений: 9,142
Записей в блоге: 3
25.01.2026, 17:16  [ТС]
Цитата Сообщение от Royal_X Посмотреть сообщение
количество итераций 2500 и нельзя никак понизить?
я ещё чуть погенерил звуков по 30 секунд.
время генера ~33 минуты...

пробовал промт на муз инструменты,
короче вывод:
гуано - везде играет одно и тоже заунывное пианино...

под снос...
(то что у мя в данной версии)

НО, сам факт, что генерация музыки локально возможна меня очень радует.
0
Эксперт функциональных языков программированияЭксперт С++
 Аватар для Royal_X
6270 / 2994 / 1051
Регистрация: 01.06.2021
Сообщений: 11,107
25.01.2026, 17:25
XLAT, я хочу попробовать AudioCraft от Meta. Там есть MusicGen и AudioGen.
0
Just Do It!
 Аватар для XLAT
4217 / 2677 / 656
Регистрация: 23.09.2014
Сообщений: 9,142
Записей в блоге: 3
25.01.2026, 18:06  [ТС]
Цитата Сообщение от Royal_X Посмотреть сообщение
я хочу попробовать AudioCraft от Meta. Там есть MusicGen и AudioGen.
- сними ролик о нём с впечатлительными резами.
- дай его мне.
- я покладу его на трубу.
- буду с него капусту стричь.
- ...
0
Эксперт функциональных языков программированияЭксперт С++
 Аватар для Royal_X
6270 / 2994 / 1051
Регистрация: 01.06.2021
Сообщений: 11,107
26.01.2026, 11:28
XLAT, у твоих видео обычно до 50 просмотров, только одно набрало больше тысячи. Как это объяснишь?
0
Just Do It!
 Аватар для XLAT
4217 / 2677 / 656
Регистрация: 23.09.2014
Сообщений: 9,142
Записей в блоге: 3
26.01.2026, 11:57  [ТС]
Цитата Сообщение от Royal_X Посмотреть сообщение
Как это объяснишь?
я уже объяснял - и не кому-нибудь другому, а именно, тебе...

коротко напоминаю: я не блогер.

мой самый первый видоз на трубе Ошибки линкера. не собирается проект syobon

Royal_X, если ты думаешь,
что я настолько тупой, что ждал, что его посмотрят лям челов,
то тогда ты сам такой:лол

однако, мы с тобой уже команда с дивергентной организацией)

поэтому меньше балаболь, а живее делай для меня ролл)
0
Эксперт функциональных языков программированияЭксперт С++
 Аватар для Royal_X
6270 / 2994 / 1051
Регистрация: 01.06.2021
Сообщений: 11,107
26.01.2026, 13:23
Цитата Сообщение от XLAT Посмотреть сообщение
то ждал, что его посмотрят лям челов
я за твоей спиной недавно опубликовал несколько роликов в целях эксперимента. Сейчас у каждого из них от 40 тыс. до 68 тыс. просмотров и они продолжают набирать популярность. Правда, я ничего не получаю, поскольку не я автор контента, используемого в этих роллах. Но они помогли мне понять, что нужно юзерам.
0
Just Do It!
 Аватар для XLAT
4217 / 2677 / 656
Регистрация: 23.09.2014
Сообщений: 9,142
Записей в блоге: 3
26.01.2026, 13:39  [ТС]
Цитата Сообщение от Royal_X Посмотреть сообщение
Правда, я ничего не получаю, поскольку не я автор контента,
1. можно ли включить монетизацию или нет решает сначала труба, а уже потом ты)
2. куча народа зарабатывает на чужом контенте добавляя сверху чуть-чуть своего видения/харизмы/или_просто_хари.
3. страйк может прилететь, просто как баг тубовского алгоритма - не повод его бояться...
4. ну, ясень, если тут пострадает честь кошелька чувака из колл-центра и есть сложная задача избежать его ответки ...
5. 4 пункт сильно узкоспециальный...

Цитата Сообщение от Royal_X Посмотреть сообщение
опубликовал
так как пункт 4, то конешно же, ты мне его не покажешь даже в личке?!
)

Добавлено через 4 минуты
Цитата Сообщение от Royal_X Посмотреть сообщение
Сейчас у каждого из них от 40 тыс. до 68 тыс.
самое главное, надеюсь, ты уже понял:

Just Do It!

0
Эксперт функциональных языков программированияЭксперт С++
 Аватар для Royal_X
6270 / 2994 / 1051
Регистрация: 01.06.2021
Сообщений: 11,107
26.01.2026, 13:42
Цитата Сообщение от XLAT
так как пункт 4, то конешно же, ты мне его не покажешь даже в личке?!
А сколько тебе лет? Просто человеку, у которого голос, как в Раскрутки на youtube, я не покажу. Голос, хоть и человека, настроенного на успех, как там некто выразился, однако, такому ещё рано видеть такое.
0
Just Do It!
 Аватар для XLAT
4217 / 2677 / 656
Регистрация: 23.09.2014
Сообщений: 9,142
Записей в блоге: 3
26.01.2026, 13:50  [ТС]
Цитата Сообщение от Royal_X Посмотреть сообщение
А сколько тебе лет?
мне 12 лет

Цитата Сообщение от Royal_X Посмотреть сообщение
такому ещё рано видеть такое.
ты всё же умудрился залить на ютуб(или это xxx.com?) порно.
как?
хочу знать, шоп прикрыть эту лазейку.
0
Эксперт функциональных языков программированияЭксперт С++
 Аватар для Royal_X
6270 / 2994 / 1051
Регистрация: 01.06.2021
Сообщений: 11,107
26.01.2026, 13:54
Цитата Сообщение от XLAT
мне 12 лет
ценю за честность, но, как понимаешь, теперь точно не покажу
Цитата Сообщение от XLAT
ты всё же умудрился залить на ютуб порно.
не на YouTube, но дальше такое обсуждать с 12-летним не хочу
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
26.01.2026, 13:54
Помогаю со студенческими работами здесь

Подскажите песню из The Best Of Italo Disco
Подскажите песню,из 80тых ,не помню ,что там было там трубы типо таджикских играли,даже видео было...

Когда припев портит песню
Нашла несколько классных (на мой извращённый вкус) песен. Но припевы у них почему-то кажутся по...

Ищу песню
Известны лишь слова припева: Невозможно больше ждать,невозможно,невозможно... Исполняет дама....

Кто может переделать песню в минусовку
Парни, кто может удалить голос (полностью) из песни О, боже какой мужчина?

Найти песню по словам
Поет девушка, веселая такая песенка про дискотеку. Где-то в начале есть слова "do you like me or...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
100
Ответ Создать тему
Новые блоги и статьи
[golang] Breadth-First Search
alhaos 19.05.2026
BFS (Breadth-First Search) — это базовый алгоритм обхода графа в ширину, который поуровнево исследует все связанные вершины. Он начинает с выбранной точки и проверяет всех соседей, прежде чем. . .
[golang] Алгоритм «Хак Госпера»
alhaos 17.05.2026
Алгоритм «Хак Госпера» Хак Госпера (Gosper's Hack) — алгоритм нахождения следующего по величине числа с тем же количеством установленных бит. Придуман Биллом Госпером в 1970-х, опубликован в. . .
Рисование бинарного древа до 6-го колена на js, svg.
russiannick 17.05.2026
<svg width="335" height="240" viewBox="0 0 335 240" fill="#e5e1bb"> <style> <!]> </ style> <g id="bush"> </ g> </ svg> function fn(){ let rost;/ / высота древа let xx=165,yy=210,w=256;
FSharp: interface of module
DevAlt 16.05.2026
Интерфейс модуля F# позволяет управлять доступностью членов, содержащихся в реализации модуля. По-умолчанию все члены модуля доступны: module Foo let x = 10 let boo () = printfn "boo" . . .
Хитросплетение родственных связей пантеона греческих богов.
russiannick 14.05.2026
Однооконник, позволяющий узреть и изучить отдельных героев древней Греции. <!DOCTYPE html> <html lang="ru"> <head> <meta charset="UTF-8"> <meta http-equiv="X-UA-Compatible". . .
[golang] Угол между стрелками часов
alhaos 12.05.2026
По заданным значениям часа и минуты необходимо определить значение меньшего угла между стрелками аналогового циферблата часов. import "math" func angleClock(hour int, minutes int) float64 { . . .
Debian 13: Установка Lazarus QT5
ВитГо 09.05.2026
Эта инструкция моя компиляция инструкций volvo https:/ / www. cyberforum. ru/ blogs/ 203668/ 10753. html и его же старой инструкции по установке Lazarus с gtk2. . .
Нейросеть на алгоритме "эстафета хвоста" как перспектива.
Hrethgir 06.05.2026
На десерт, когда запущу сервер. Статья тут https:/ / habr. com/ ru/ articles/ 1030914/ . Автор я сам, нейросеть только помогает в вопросах которые мне не известны - не знаю людей которые знали-бы. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru