Форум программистов, компьютерный форум, киберфорум
Python: ИИ, нейросети, ML, агенты
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.95/21: Рейтинг темы: голосов - 21, средняя оценка - 4.95
0 / 0 / 0
Регистрация: 06.11.2020
Сообщений: 2

Не градиентный оптимизатор Tensorflow

06.11.2020, 12:33. Показов 4106. Ответов 3

Студворк — интернет-сервис помощи студентам
Добрый день!
Можно ли в CNN, реализованной через Tensorflow, внедрить кастомный не градиентный оптимизатор? Если да, то как?
0
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
06.11.2020, 12:33
Ответы с готовыми решениями:

Tensorflow выдает ошибку Failed to load the native TensorFlow runtime
Пытаюсь запустить tensorflow на gtx 1060. Установил анаконду, запускаю код в спайдере, а он выдает ошибку: Python 3.7.1 (default, Dec 10...

Оптимизатор
Здравствуйте. Имеется портал http://www.lobbying.ru/ По ключевым словам в рамблере и яндексе мы занимаем по ключевым словам мы занимаем...

SEO оптимизатор
Мы находимся на финальной стадии запуска проекта, который представляет из себя Маркетплейс "Все для стройки", на котором наша ЦА...

3
2649 / 1660 / 267
Регистрация: 19.02.2010
Сообщений: 4,392
06.11.2020, 14:01
Цитата Сообщение от Alex_ML Посмотреть сообщение
не градиентный оптимизатор
Какой именно?
И зачем?
(вопросы чисто ради любопытства)
0
0 / 0 / 0
Регистрация: 06.11.2020
Сообщений: 2
06.11.2020, 15:37  [ТС]
Зачем? Чтобы повысить точность и, возможно, время работы. Например, ряд исследований [1,2] показывают, что использование эвристических методов позволяют получить бОльшую точность по сравнению с градиентными методами. В частности, хочу попробовать внедрить метод имитации отжига (ответ на вопрос какой именно).
0
2649 / 1660 / 267
Регистрация: 19.02.2010
Сообщений: 4,392
06.11.2020, 19:59
Цитата Сообщение от Alex_ML Посмотреть сообщение
Чтобы повысить точность и, возможно, время работы.
Посмотрел на цифры из первой работы.

Там первая конфигурация сетки для MNIST может учиться градиентным алгоритмом как минимум раз в 30 быстрее (т.е. не более 30 секунд на все 10 эпох при обучении всего лишь на ОДНОМ ядре процессора, и 30/n секунд при распараллеливании обучения на n>1 ядро). Это то, что можно получить простым простым переходом к нормальному софту (вместо юзания старых говноподелок под старый матлаб), не меняя алгоритмы.
Т.е. TF обязана (хотя над её скоростью тоже имеются поводы поржать) дать совершенно иные цифры времени, полностью ликвидирующие желание что-либо делать для ускорения расчётов таких простых нейронок в таких примитивных задачах

Далее. Точность на MNIST. Почему-то градиентное обучение у меня первую конфигурацию сетки за 10 эпох спокойно вытягивает на >=97.8% точности обобщения. Может быть, авторы просто взяли плохую величину шага обучения - и сетка медленно сходится. Или размер батча у них плохой (я с дефолтно стоЯщим у меня в софте шагом и без батча попробовал, и при батче на 50 примеров - а дальше стало лень, ну и второй размер сетки тоже лень было смотреть).
Т.е. и по точности нет необходимости что-то изменять в алгоритмах (надо просто учить бОльшее число эпох, ибо за 10 эпох до минимума либо до асимптоты ошибки обобщения ещё не добрались).

Так что для меня результаты авторов первой статьи ничего вообще не доказывают.

Ну и сама идея пооптимальнее перепиливать только последний слой - она гораздо старше, чем думают авторы первой статьи.
Например, в статье Huang F.J., LeCun Y. Large-scale Learning with SVM and Convolutional Nets for Generic Object Categorization / Proc. CVPR'06 - у обученной сетки отпиливался последний слой нейронов и вместо него ставилcя SVM.


PS. Данный раздел форума к нейросеткам никакого отношения не имеет
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
06.11.2020, 19:59
Помогаю со студенческими работами здесь

Численный оптимизатор
Дайте ссылку на скачивание программы, несколькими численными методами ищущую оптимум и позволяющую выбирать метод оптимизации, размерность...

Оптимизатор CSS
Здравствуйте. Подскажите пожалуйста он-лайн оптимизатор css, который удалит дубликаты. Удалит первые и оставит последние. Как это делает...

Оптимизатор в шоке
Коллеги я в шоке. По всем продвигаемым сайтам позиции помаленьку падають. Все продвигаються в основном сылками. ВСе ради экспиремента...

нужен оптимизатор!
Для постоянного продвижения нескольких (порядка 15) сайтов нужен человек на постоянную работу в офис. В связи с этим несколько вопросов к...

Начинающий оптимизатор
Вопрос таков: раньше сайт по ключевым запросам выдавался в Google, а сейчас нет =( Если верить сервису...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
4
Ответ Создать тему
Новые блоги и статьи
делаю науч статью по влиянию грибов на сукцессию
anaschu 13.03.2026
прикрепляю статью
SDL3 для Desktop (MinGW): Создаём пустое окно с нуля для 2D-графики на SDL3, Си и C++
8Observer8 10.03.2026
Содержание блога Финальные проекты на Си и на C++: hello-sdl3-c. zip hello-sdl3-cpp. zip Результат:
Установка CMake и MinGW 13.1 для сборки С и C++ приложений из консоли и из Qt Creator в EXE
8Observer8 10.03.2026
Содержание блога MinGW - это коллекция инструментов для сборки приложений в EXE. CMake - это система сборки приложений. Здесь описаны базовые шаги для старта программирования с помощью CMake и. . .
Как дизайн сайта влияет на конверсию: 7 решений, которые реально повышают заявки
Neotwalker 08.03.2026
Многие до сих пор воспринимают дизайн сайта как “красивую оболочку”. На практике всё иначе: дизайн напрямую влияет на то, оставит человек заявку или уйдёт через несколько секунд. Даже если у вас. . .
Модульная разработка через nuget packages
DevAlt 07.03.2026
Сложившийся в . Net-среде способ разработки чаще всего предполагает монорепозиторий в котором находятся все исходники. При создании нового решения, мы просто добавляем нужные проекты и имеем. . .
Модульный подход на примере F#
DevAlt 06.03.2026
В блоге дяди Боба наткнулся на такое определение: В этой книге («Подход, основанный на вариантах использования») Ивар утверждает, что архитектура программного обеспечения — это структуры,. . .
Управление камерой с помощью скрипта OrbitControls.js на Three.js: Вращение, зум и панорамирование
8Observer8 05.03.2026
Содержание блога Финальная демка в браузере работает на Desktop и мобильных браузерах. Итоговый код: orbit-controls-threejs-js. zip. Сканируйте QR-код на мобильном. Вращайте камеру одним пальцем,. . .
SDL3 для Web (WebAssembly): Синхронизация спрайтов SDL3 и тел Box2D
8Observer8 04.03.2026
Содержание блога Финальная демка в браузере. Итоговый код: finish-sync-physics-sprites-sdl3-c. zip На первой гифке отладочные линии отключены, а на второй включены:. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru