Форум программистов, компьютерный форум, киберфорум
ИИ, нейросети, LLM, ML, Data Science, ИИ-агенты
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.86/7: Рейтинг темы: голосов - 7, средняя оценка - 4.86
1 / 1 / 0
Регистрация: 18.09.2018
Сообщений: 118

Как работает Variational AutoEncoder (VAE)?

18.11.2019, 13:13. Показов 1395. Ответов 7

Студворк — интернет-сервис помощи студентам
Кто-нибудь может объяснить как работает VAE из этого туториала (смотрите только ячейку, которая начинается с `class Sampling...`)?

input=(batch_size=64, flatten_pixels=784) идет в слой Dense(64, 'relu'). После идет в два одинаковых слоя Dense(32) параллельно. Почему один из них должен быть z_mean, а другой z_log_var?
На сколько я понимаю разделение на z_mean и z_log_var идет во время минимизации лосса. Формула

Python
1
KL Divergence = CrossEntropy - Entropy = -∑plog(q) - (-∑plog(p))
Почему у них лосс выглядит так, как работает это разделение на z_mean и z_log_var?

Python
1
2
kl_loss = - 0.5 * tf.reduce_mean(
        z_log_var - tf.square(z_mean) - tf.exp(z_log_var) + 1)
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
18.11.2019, 13:13
Ответы с готовыми решениями:

Как называется зап часть VAE (треск из за нее идет)
Здравствуйте. VAE - МФУ. Подскажите , как называется зап часть по которой шестеренка ездит. Принтер hp 3525 при вкл. треск ужасный,...

Как это работает? Я хочу спросить как работает C++ и где можно про него почитать
Привет, котоны. Заранее благодарю. Это будет моих общих вопросов нить, т.к. создавать целую ветку для каждого нецелесообразно. Я хочу...

Include не работает так как хочется или как работает инклуд
Доброго времени суток. Имею структуру папок: basic/ libs/ /sumLib.php animals/ /cats ...

7
533 / 438 / 47
Регистрация: 17.07.2013
Сообщений: 2,236
19.11.2019, 13:55
По запросу: habr vae найдете ответ на свой вопрос
0
1 / 1 / 0
Регистрация: 18.09.2018
Сообщений: 118
19.11.2019, 16:45  [ТС]
Многостраничные математические выводы на эту тему с довольно скудным объяснением происходящего я много где видел. Хотелось бы найти человеческое объяснение, не предполагающее наличие PhD по математике.
0
294 / 265 / 48
Регистрация: 09.04.2013
Сообщений: 1,038
20.11.2019, 10:48
Ну насколько я, как нуб, понял этот вопрос - мы вносим требование чтобы внутреннее представление имело не абы какое распределение, а нормальное. Что позволяет лучше "раскидать" фичи разных классов в пространстве.
Почему именно такой лосс можно сказать только покурив выкладку математических формул. Ну просто потому что так измеряется "расстояние" между двумя нормальными распределниями
0
1 / 1 / 0
Регистрация: 18.09.2018
Сообщений: 118
21.11.2019, 18:23  [ТС]
Математика там не сильно сложная. Берут формулу "расстояния" между двумя нормальными распределниями:
Code
1
-∑plog(q) - (-∑plog(p))
И в нее вместо q и p подставляют формулу нормального распределения для многомерных пространств (multivariate normal density).
А с чего вдруг минимизация этого расстояния должна привести к образованию среднего и вариации не очень ясно.
0
1 / 1 / 0
Регистрация: 18.09.2018
Сообщений: 118
24.11.2019, 11:57  [ТС]
Похоже тут ни кто не в курсе. Видимо специализация форума другая.
0
294 / 265 / 48
Регистрация: 09.04.2013
Сообщений: 1,038
27.11.2019, 12:38
Вот вроде не заумная статья по теме попалась, может будет полезна
https://www.jeremyjordan.me/va... oencoders/
1
1 / 1 / 0
Регистрация: 18.09.2018
Сообщений: 118
21.12.2019, 17:46  [ТС]
Лучше всех объяснил вот этот чел:
https://www.youtube.com/watch?v=uaaqyVS9-rM
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
21.12.2019, 17:46
Помогаю со студенческими работами здесь

SelText в textBox'e отчёта не работает или работает не так как в форме?
Пробовал всяко-разно выудить выделенный текст - не выходит. Пишет: "Введенное выражение содержит недопустимую ссылку на свойство...

Цикл работает неправильно, в то время как POST работает
Всем привет! Я хотел написать под php скрипт с авторизацией, брут, на своем сайте(подбор пароля). Написал код на загрузку словаря +...

setprecision() не работает, или работает не так как нужно
cout << setw(5) << "X=" << setprecision(2) << X; cout << setw(20) << "X=" << setprecision(0)<< X << endl; cout << setw(5) << "Y=" <<...

Русификация.Работает-супер! Обьяснитте, как это работает?
#include <iostream> #include <conio.h> #include <windows.h> using namespace std; char* Rus(const char* text); int main () ...

Почему не работает cin.clear() и как работает sync()?
#include<iostream> #include<cstring> using namespace std; char*input(char*ch,int&n){ cin.getline(ch,20); //cin.sync(); ...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
8
Ответ Создать тему
Новые блоги и статьи
SDL3 для Desktop (MinGW): Создаём пустое окно с нуля для 2D-графики на SDL3, Си и C++
8Observer8 10.03.2026
Содержание блога Финальные проекты на Си и на C++: hello-sdl3-c. zip hello-sdl3-cpp. zip Результат:
Установка CMake и MinGW 13.1 для сборки С и C++ приложений из консоли и из Qt Creator в EXE
8Observer8 10.03.2026
Содержание блога MinGW - это коллекция инструментов для сборки приложений в EXE. CMake - это система сборки приложений. Здесь описаны базовые шаги для старта программирования с помощью CMake и. . .
Как дизайн сайта влияет на конверсию: 7 решений, которые реально повышают заявки
Neotwalker 08.03.2026
Многие до сих пор воспринимают дизайн сайта как “красивую оболочку”. На практике всё иначе: дизайн напрямую влияет на то, оставит человек заявку или уйдёт через несколько секунд. Даже если у вас. . .
Модульная разработка через nuget packages
DevAlt 07.03.2026
Сложившийся в . Net-среде способ разработки чаще всего предполагает монорепозиторий в котором находятся все исходники. При создании нового решения, мы просто добавляем нужные проекты и имеем. . .
Модульный подход на примере F#
DevAlt 06.03.2026
В блоге дяди Боба наткнулся на такое определение: В этой книге («Подход, основанный на вариантах использования») Ивар утверждает, что архитектура программного обеспечения — это структуры,. . .
Управление камерой с помощью скрипта OrbitControls.js на Three.js: Вращение, зум и панорамирование
8Observer8 05.03.2026
Содержание блога Финальная демка в браузере работает на Desktop и мобильных браузерах. Итоговый код: orbit-controls-threejs-js. zip. Сканируйте QR-код на мобильном. Вращайте камеру одним пальцем,. . .
SDL3 для Web (WebAssembly): Синхронизация спрайтов SDL3 и тел Box2D
8Observer8 04.03.2026
Содержание блога Финальная демка в браузере. Итоговый код: finish-sync-physics-sprites-sdl3-c. zip На первой гифке отладочные линии отключены, а на второй включены:. . .
SDL3 для Web (WebAssembly): Идентификация объектов на Box2D v3 - использование userData и событий коллизий
8Observer8 02.03.2026
Содержание блога Финальная демка в браузере. Итоговый код: finish-collision-events-sdl3-c. zip Сканируйте QR-код на мобильном и вы увидите, что появится джойстик для управления главным героем. . . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru