|
0 / 0 / 0
Регистрация: 06.11.2020
Сообщений: 2
|
|
Не градиентный оптимизатор Tensorflow06.11.2020, 12:33. Показов 4106. Ответов 3
Добрый день!
Можно ли в CNN, реализованной через Tensorflow, внедрить кастомный не градиентный оптимизатор? Если да, то как?
0
|
|
| 06.11.2020, 12:33 | |
|
Ответы с готовыми решениями:
3
Оптимизатор SEO оптимизатор |
|
2649 / 1660 / 267
Регистрация: 19.02.2010
Сообщений: 4,392
|
|
| 06.11.2020, 14:01 | |
|
0
|
|
|
0 / 0 / 0
Регистрация: 06.11.2020
Сообщений: 2
|
|
| 06.11.2020, 15:37 [ТС] | |
|
Зачем? Чтобы повысить точность и, возможно, время работы. Например, ряд исследований [1,2] показывают, что использование эвристических методов позволяют получить бОльшую точность по сравнению с градиентными методами. В частности, хочу попробовать внедрить метод имитации отжига (ответ на вопрос какой именно).
0
|
|
|
2649 / 1660 / 267
Регистрация: 19.02.2010
Сообщений: 4,392
|
||
| 06.11.2020, 19:59 | ||
|
Там первая конфигурация сетки для MNIST может учиться градиентным алгоритмом как минимум раз в 30 быстрее (т.е. не более 30 секунд на все 10 эпох при обучении всего лишь на ОДНОМ ядре процессора, и 30/n секунд при распараллеливании обучения на n>1 ядро). Это то, что можно получить простым простым переходом к нормальному софту (вместо юзания старых говноподелок под старый матлаб), не меняя алгоритмы. Т.е. TF обязана (хотя над её скоростью тоже имеются поводы поржать) дать совершенно иные цифры времени, полностью ликвидирующие желание что-либо делать для ускорения расчётов таких простых нейронок в таких примитивных задачах ![]() Далее. Точность на MNIST. Почему-то градиентное обучение у меня первую конфигурацию сетки за 10 эпох спокойно вытягивает на >=97.8% точности обобщения. Может быть, авторы просто взяли плохую величину шага обучения - и сетка медленно сходится. Или размер батча у них плохой (я с дефолтно стоЯщим у меня в софте шагом и без батча попробовал, и при батче на 50 примеров - а дальше стало лень, ну и второй размер сетки тоже лень было смотреть). Т.е. и по точности нет необходимости что-то изменять в алгоритмах (надо просто учить бОльшее число эпох, ибо за 10 эпох до минимума либо до асимптоты ошибки обобщения ещё не добрались). Так что для меня результаты авторов первой статьи ничего вообще не доказывают. Ну и сама идея пооптимальнее перепиливать только последний слой - она гораздо старше, чем думают авторы первой статьи. Например, в статье Huang F.J., LeCun Y. Large-scale Learning with SVM and Convolutional Nets for Generic Object Categorization / Proc. CVPR'06 - у обученной сетки отпиливался последний слой нейронов и вместо него ставилcя SVM. PS. Данный раздел форума к нейросеткам никакого отношения не имеет
0
|
||
| 06.11.2020, 19:59 | |
|
Помогаю со студенческими работами здесь
4
Численный оптимизатор Оптимизатор CSS Оптимизатор в шоке нужен оптимизатор! Начинающий оптимизатор Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
|||
|
делаю науч статью по влиянию грибов на сукцессию
anaschu 13.03.2026
прикрепляю статью
|
SDL3 для Desktop (MinGW): Создаём пустое окно с нуля для 2D-графики на SDL3, Си и C++
8Observer8 10.03.2026
Содержание блога
Финальные проекты на Си и на C++:
hello-sdl3-c. zip
hello-sdl3-cpp. zip
Результат:
|
Установка CMake и MinGW 13.1 для сборки С и C++ приложений из консоли и из Qt Creator в EXE
8Observer8 10.03.2026
Содержание блога
MinGW - это коллекция инструментов для сборки приложений в EXE. CMake - это система сборки приложений. Здесь описаны базовые шаги для старта программирования с помощью CMake и. . .
|
Как дизайн сайта влияет на конверсию: 7 решений, которые реально повышают заявки
Neotwalker 08.03.2026
Многие до сих пор воспринимают дизайн сайта как “красивую оболочку”. На практике всё иначе: дизайн напрямую влияет на то, оставит человек заявку или уйдёт через несколько секунд.
Даже если у вас. . .
|
|
Модульная разработка через nuget packages
DevAlt 07.03.2026
Сложившийся в . Net-среде способ разработки чаще всего предполагает
монорепозиторий в котором находятся все исходники.
При создании нового решения, мы просто добавляем нужные проекты
и имеем. . .
|
Модульный подход на примере F#
DevAlt 06.03.2026
В блоге дяди Боба наткнулся на такое определение:
В этой книге («Подход, основанный на вариантах использования») Ивар утверждает,
что архитектура программного обеспечения — это
структуры,. . .
|
Управление камерой с помощью скрипта OrbitControls.js на Three.js: Вращение, зум и панорамирование
8Observer8 05.03.2026
Содержание блога
Финальная демка в браузере работает на Desktop и мобильных браузерах. Итоговый код: orbit-controls-threejs-js. zip. Сканируйте QR-код на мобильном. Вращайте камеру одним пальцем,. . .
|
SDL3 для Web (WebAssembly): Синхронизация спрайтов SDL3 и тел Box2D
8Observer8 04.03.2026
Содержание блога
Финальная демка в браузере. Итоговый код: finish-sync-physics-sprites-sdl3-c. zip
На первой гифке отладочные линии отключены, а на второй включены:. . .
|