|
0 / 0 / 0
Регистрация: 01.04.2024
Сообщений: 17
|
||||||
Высокая тестовая ошибка у нейросети/как коррекно реализовать Dropout методом регуляризации?07.12.2025, 20:42. Показов 700. Ответов 5
Здравствуйте! Для учебы писалась простая нейросеть, распознающая цифры. На вход дается поле 3х5 (то есть 15 пикселей), пользователь вводит цифру, а нейросеть должна ее "отгадать". К нейросети было требование: необходимо было реализовать график средних энергий ошибок. Важно, чтоб нейросеть сходилась меньше, чем за 10 эпох (это сделано), а также, чтоб тестовая ошибка равнялась примерно 0,005 (и даже меньше. В общем, была приближена к 0).
Какая у меня проблема: Мои тестовые значения слишком большие! И у меня никак не получается это исправить. Было предложено сделать функцию Dropout, которая обнуляла бы часть весов, но даже с ней ситуация не изменилась вообще. У меня также были попытки отредактировать выборку, но это все равно ни на что не повлияло. Также, буквально только что я заметил, что моя нейросеть слишком "уверенная" в себе: какую бы корявую цифру я не написал, она все равно будет выдавать результат со 100%. Причем иногда результат совсем неверен. Я предполагаю, что все это происходит из-за того, что моя нейросеть переобучается. Но я совсем не знаю, как это исправить. Код, в котором реализован dropout:
Так как кода много, я прикладываю зип! В тему не помещается второй важный файл: laer.cs, где происходит инициализация весов. В зипе можно будет посмотреть файлы, отвечающие за форвард, бэквард пассы, мою выборку и последние веса, и прочее. Хотелось бы прикрепить график, но форум не позволяет загрузить фото. Очень прошу помощи! Если не исправление кода, то быть может объяснение, в какую сторону мне двигаться, чтоб добиться корректного результата. Примечание: моя нейросеть основывается на LeakyRELU. Код учебный, имеет свои странности!
0
|
||||||
| 07.12.2025, 20:42 | |
|
Ответы с готовыми решениями:
5
Программа для тестов - как грамотно подойти к редактированию тестов Обозреватель тестов не видит тестов при открытии решения с расшаренного сетевого диска сначала запускаю с низким, а затем с высоким. В итоге пока поток с низким приоритетом не завершит работу, приоритет с высоким даже не стартует. |
|
0 / 0 / 0
Регистрация: 01.04.2024
Сообщений: 17
|
|||||||||||
| 07.12.2025, 21:00 [ТС] | |||||||||||
|
Хочется себя дополнить. Я исправил одну вещь в другом файле (см. вложения предыдущего сообщения для полного контекста):
0
|
|||||||||||
|
2627 / 1639 / 266
Регистрация: 19.02.2010
Сообщений: 4,350
|
||
| 07.12.2025, 23:38 | ||
|
Но после обучения с дропаутом - коррекция значений весов (за исключением значений смещений (biases)) слоёв (только тех, НА ВХОДЕ которых делался дропаут) нужна.
0
|
||
|
0 / 0 / 0
Регистрация: 01.04.2024
Сообщений: 17
|
|
| 08.12.2025, 02:15 [ТС] | |
|
Получается, дропаут вообще никак не помогает в ситуации с тестовой ошибкой?
---------------- Я узнал, что если сильно увеличить скорость у нейросети (файл Laer), то тогда страдают эпохи. Но, если все таки довести нейросеть до сходимости, она выдаст приличный результат тестовой ошибки. Проблема в том, что сходиться нейросеть начинает за 50 эпох (и это если повезет), то ужасно, учитывая тот факт, что мне нужно меньше 10. Мне сказали, что вся моя проблема заключается в том, что я попадаю в "локальный" минимум, а не глобальный. Как я понял, это можно исправить путем подбора скорости и моментума. Но как я их не крутил, ситуация неизменчива.
0
|
|
|
2627 / 1639 / 266
Регистрация: 19.02.2010
Сообщений: 4,350
|
||
| 08.12.2025, 13:41 | ||
|
Если проблема с чтением английского - то см хотя-бы на графики ошибок (на те, в подписях к которым или на которых упоминаются test set или validation set) непосредственно из статьи изобретателей https://arxiv.org/pdf/1207.0580 Там везде показаны результаты для обучений как без, так и с дропаутом. Но понятно, что и задачи (базы данных) там могли подбираться так, чтобы отличия вышли посущественнее для человеческого глаза (ибо с формальной точки зрения - необходимо проверять статистические гипотезы о равенстве или различии результатов), и что могут существовать задачи (или даже связки "задача + архитектура нейронки + настройки алгоритма обучения"), где дропаут может не помочь. Но оба моих тутошних поста - только лишь для совета изучать и реализовывать алгоритмы по оригинальным публикациям авторов. Это проще, чем разбираться в созданной пересказчиками/рерайтерами помойке и собственноручным наступанием на грабли выяснять, где в той помойке правда, где только лишь малополезная часть правды (из-за недосказанности чего-то нужного/важного), а где просто враньё/некомпетентность. Т.е. сейчас - дропаут в коде реализован принципиально неправильно. Архив с кодом не смотрел - т.е. ХЗ сколько других ошибок может быть ещё и там.
0
|
||
|
698 / 572 / 75
Регистрация: 20.09.2014
Сообщений: 3,700
|
||
| 15.12.2025, 21:32 | ||
|
https://stats.stackexchange.co... op-connect Добавлено через 7 минут Что можно сделать ещё: обновляйте веса не сразу в обратном проходе слоя, а сначала накопив дельты в отдельных массивах deltaw. Обновление весов в SGD делается после прямого и обратного прохода по всей нейросети. При обратном проходе происходит накопление изменений весов без изменений последних. Либо ещё реже - mini-batch-GD - после изучения батча изображений, обычно порядка 32-256 изображений. Добавлено через 11 минут Почему функция потерь MSE не участвует в обратном распространении ошибки? Или я плохо вижу? Добавлено через 6 минут И почему не используете искусственный интеллект? Он вам такой код на раз-два распишет.
0
|
||
| 15.12.2025, 21:32 | |
|
Помогаю со студенческими работами здесь
6
Матрица: вывести название самой высокой вершины мира, самой высокой вершины заданной страны Странное поведение ошибки в нейросети Как распознать изображения с помощью нейросети
Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
| Опции темы | |
|
|
Новые блоги и статьи
|
|||
|
http://iceja.net/ сервер решения полиномов
iceja 18.01.2026
Выкатила http:/ / iceja. net/ сервер решения полиномов (находит действительные корни полиномов методом Штурма).
На сайте документация по API, но скажу прямо VPS слабенький и 200 000 полиномов. . .
|
Первый деплой
lagorue 16.01.2026
Не спеша развернул своё 1ое приложение в kubernetes.
А дальше мне интересно создать 1фронтэнд приложения и 2 бэкэнд приложения
развернуть 2 деплоя в кубере получится 2 сервиса и что-бы они. . .
|
Расчёт переходных процессов в цепи постоянного тока
igorrr37 16.01.2026
/ *
Дана цепь постоянного тока с R, L, C, k(ключ), U, E, J. Программа составляет систему уравнений по 1 и 2 законам
Кирхгофа, решает её и находит:
токи, напряжения и их 1 и 2 производные при t = 0;. . .
|
Восстановить юзерскрипты Greasemonkey из бэкапа браузера
damix 15.01.2026
Если восстановить из бэкапа профиль Firefox после переустановки винды, то список юзерскриптов в Greasemonkey будет пустым.
Но восстановить их можно так.
Для этого понадобится консольная утилита. . .
|
|
Изучаю kubernetes
lagorue 13.01.2026
А пригодятся-ли мне знания kubernetes в России?
|
Сукцессия микоризы: основная теория в виде двух уравнений.
anaschu 11.01.2026
https:/ / rutube. ru/ video/ 7a537f578d808e67a3c6fd818a44a5c4/
|
WordPad для Windows 11
Jel 10.01.2026
WordPad для Windows 11
— это приложение, которое восстанавливает классический текстовый редактор WordPad в операционной системе Windows 11. После того как Microsoft исключила WordPad из. . .
|
Classic Notepad for Windows 11
Jel 10.01.2026
Old Classic Notepad for Windows 11
Приложение для Windows 11, позволяющее пользователям вернуть классическую версию текстового редактора «Блокнот» из Windows 10. Программа предоставляет более. . .
|