Форум программистов, компьютерный форум, киберфорум
Python: Научные вычисления
Войти
Регистрация
Восстановить пароль
Карта форума Темы раздела Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.69/13: Рейтинг темы: голосов - 13, средняя оценка - 4.69
1 / 1 / 0
Регистрация: 25.05.2019
Сообщений: 4
1

Kaggle, не понятная ситуация с проектом на tensorflow

24.07.2021, 11:09. Показов 2334. Ответов 9

Author24 — интернет-сервис помощи студентам
Добрый день! Я скачал код из Kaggle из конкурса "Grass and Lift Movement Detection with DL". https://www.kaggle.com/zeintiz... on-with-dl , также скачал данные. Когда я запускаю проект на своем компьютере, я вижу совершенно другие результаты, чем на сайте в notebbook - намного хуже, я пробовал запускать как на процессоре, так и на видеокарте - разница только в скорости, результат одинаково плохой. Очень интересно, в чем может быть дело?
Версия Tensorflow 2.5, Процессор I7 10700, ОЗУ 48 ГБ, видеокарта GTX 3090
https://ibb.co/SPdtRcN - результат Каггла
https://ibb.co/8g1WrwF - результат с компьютера

Потом посмотрел версию tensorflow на Kaggle -2.4.1, на работе на компе с 16ГБ ОЗУ на чистый комп поставил tensorflow 2.4.1, notebook - результат так же плох.
Скачал с этого же конкурса проект на pyTorch - результат хороший и такой же как на сайте - то есть данные EEG на сайте нормальные, но я привык работать с keras...

Может кто запустить дома на notebook этот проект (ссылка в начале поста), что бы проверить результаты работы проекта?
Может кто подсказать, в чем тут дело?
0
Programming
Эксперт
94731 / 64177 / 26122
Регистрация: 12.04.2006
Сообщений: 116,782
24.07.2021, 11:09
Ответы с готовыми решениями:

Не понятная ситуация
Здравствуйте, возникла не понятная ситуация, помогите разобраться. Вставляю код в хтмл файл, все...

Не понятная ситуация
Не давно начал пользоваться с этим языком у меня стоит версия xe8 ,работал над свои первым...

Не понятная ситуация с HDD
Здравствуйте, у меня такая проблема: вылетает ошибка bsod 0хf4. Хронология такова: сначала диск...

Не понятная ситуация с базами 1С
Добрый день, такая проблема, в один прекрасный момент, на RDP сервере на диске, все базы стали...

File_get_contents не понятная ситуация
Доброго времени суток. Есть сервер октелла с белым айпи, и есть еще один сервер с белым айпи (на...

9
533 / 438 / 47
Регистрация: 17.07.2013
Сообщений: 2,236
26.07.2021, 08:45 2
Цитата Сообщение от Vladimir_Krim Посмотреть сообщение
Может кто запустить дома на notebook этот проект
Логичнее вначале проверить идентичность входных данных для TF и pT (train, test). Там и StandardScaler есть и вейвлетовский шумодав, они точно во всех вариантах задействованы?
Аппаратная часть вряд-ли даст такое отличие процесса обучения.

Добавлено через 2 минуты
Интересно, а GTX 3090 насколько ускоряет процесс обучения по сравнению с другими карточками

Добавлено через 5 минут
Цитата Сообщение от Vladimir_Krim Посмотреть сообщение
Может кто подсказать, в чем тут дело?
Посмотрите, может это поможет:
"Лучше ли PyTorch, чем Keras / TensorFlow"
https://www.pyimagesearch.com/... s-pytorch/
0
1 / 1 / 0
Регистрация: 25.05.2019
Сообщений: 4
26.07.2021, 08:50  [ТС] 3
Естественно, код и данные 100% идентичные.

3090 ускоряет очень сильно в tensorflow, особенно полезно 24GB на борту
то что считалось на CPU несколько дней теперь - пару часов
0
533 / 438 / 47
Регистрация: 17.07.2013
Сообщений: 2,236
28.07.2021, 09:30 4
Цитата Сообщение от Vladimir_Krim Посмотреть сообщение
Естественно, код и данные 100% идентичные
Может какие начальные (по умолчанию) инициализации дают такую бяку?

Цитата Сообщение от Vladimir_Krim Посмотреть сообщение
3090 ускоряет очень сильно в tensorflow
Логично, интересно сравнение с другими граф карточками
0
1 / 1 / 0
Регистрация: 25.05.2019
Сообщений: 4
28.07.2021, 10:55  [ТС] 5
Настолько сильную разницу в результатах? код же я не менял вообще....

GTX970 небольшие датасеты считал часов 6

3090 - минут 10, вместе с временем загрузки и обработки датасета
Толку от GTX970 было мало - реальный датасет в 8ГБ видеопамяти не влазил
1
1487 / 1414 / 240
Регистрация: 19.02.2010
Сообщений: 3,916
28.07.2021, 11:36 6
Цитата Сообщение от Vladimir_Krim Посмотреть сообщение
особенно полезно 24GB на борту
то что считалось на CPU несколько дней теперь - пару часов
А просто не надо для счёта на CPU юзать тензорфлоу
Вот как, например, в зависимости от числа ядер масштабируется скорость вычислений у никому неизвестного нейрософта
Kaggle, не понятная ситуация с проектом на tensorflow

В качестве видюхи там - NVIDIA Tesla V100 Volta 32GB GPU. Т.е. хоть и не самый свежак (но памяти на борту таки дофига) - ну так и в качестве процессора был серверник Intel Xeon E5-2699A v4 2.40GHz, в бусте берущий всего 3.6ГГц.
Видно на картинке, что могут 8 ядер в сравнении с видюхой?
Сделано это в одном СШАшном университете. После прошлогодней публикации статьи, из которой утянута картинка - к проекту подключился Интел. В итоге в мартовской статье этого года - ещё быстрее стало.
Я годами говорил, говорю и, видимо, буду говорить, что правильный DL на процессоре если и уступает в скорости видюхе - то тормозит максимум в разы, но никак не на порядок-два.
Но если кто хочет кормить барыг-продаванов видюх, подорожавших из-за майнингового хайпа - не смею препятствовать
0
1 / 1 / 0
Регистрация: 25.05.2019
Сообщений: 4
28.07.2021, 13:19  [ТС] 7
Хоть это и не имеет прямого отношения к теме, отвечу. Запускал обучение на сервере, скрин которого прилагаю, ранние мои наработки на DL4J: 2 процессора, 20 ядер, 40 потоков. GTX на насколько порядков быстрее... может нейрософт потому и никому и не известна, что не умеет оптимизировать свой софт под GPU?))
Тот же код, ссылку на который я привел в первом посте, запускал на CPU хватило терпения дождаться только несколько итераций обучения, что бы понять, что результат тот же(по точности) - это сверх медленно...
Обсуждать GPU vs CPU for AI, повторяюсь, вообще не интересно вопрос совсем не в этом
Миниатюры
Kaggle, не понятная ситуация с проектом на tensorflow  
0
533 / 438 / 47
Регистрация: 17.07.2013
Сообщений: 2,236
28.07.2021, 15:14 8
Цитата Сообщение от VTsaregorodtsev Посмотреть сообщение
А просто не надо для счёта на CPU юзать тензорфлоу
Вот как, например, в зависимости от числа ядер масштабируется скорость вычислений у никому неизвестного нейрософта
А что делать? Бесплатный, хорошо протестированный и с относительно подробной документацией, десятками книг по теме, TF безусловно будет юзаться в огромных количествах при всём уважении к "никому неизвестного нейрософта".

Добавлено через 5 минут
Цитата Сообщение от Vladimir_Krim Посмотреть сообщение
GTX970 небольшие датасеты считал часов 6
3090 - минут 10, вместе с временем загрузки и обработки датасета
Спасибо за информацию
0
1487 / 1414 / 240
Регистрация: 19.02.2010
Сообщений: 3,916
28.07.2021, 17:54 9
Цитата Сообщение от Vladimir_Krim Посмотреть сообщение
может нейрософт потому и никому и не известна, что не умеет оптимизировать свой софт под GPU?))
А там на GPU работал тензорфлоу. Поэтому и прямая синенькая линия - что время счёта на видео не зависит от числа ядер. В отличие от двух кривых - для ТФ на ЦПУ и для новинки с вымаранным мной названием, тоже считавшей на ЦПУ, и которой эффективность кода позволила и масштабироваться на бОльшее число ядер, чем ТФ (у которого затык после 16ти ядер), и с некоторого момента обогнать ТФ на GPU. Момент этот (число задействованных ядер), как видим, вполне по силам настольным "домашним" процессорам ценового диапазона <400 баксов.

Цитата Сообщение от Nick07 Посмотреть сообщение
А что делать?
Ну, как минимум, надо правильно сравнивать. Не видюху с процессором - а одинаковые по СТОИМОСТИ компоненты или платформы.
Т.е. сравниваться по производительности с 3090 должен проц, у которого цена=цена(3090)+цена(10700 или иного хост-процессора в компе с видюхой).
А то покупают задорого производительность - но вывод при этом делают неверный (что производительность зависит именно и только от перехода с ЦПУ на видео, а не от повышения стоимости железки в разы / на порядок).
0
533 / 438 / 47
Регистрация: 17.07.2013
Сообщений: 2,236
29.07.2021, 07:57 10
Цитата Сообщение от VTsaregorodtsev Посмотреть сообщение
Ну, как минимум, надо правильно сравнивать
Тогда давайте учитывать также стоимость и soft (TF / "никому неизвестного нейрософта"), затраты на поддержку (организация консалтинга, выпуск новых хорошо оттестированных версий), написание документации, публикацию десятков книг, институтские курсы и ......
С другой стороны, сравнение CPU\GPU актуально для прикидочных работ. Знакомые студенты со второго курса спокойно работают на суперкомпьютерах. Есть доступ к суперкомпьютерам и у школьников.
0
29.07.2021, 07:57
IT_Exp
Эксперт
87844 / 49110 / 22898
Регистрация: 17.06.2006
Сообщений: 92,604
29.07.2021, 07:57
Помогаю со студенческими работами здесь

Не понятная ситуация с keyPressEvent
Добрый день. подскажите пожалуйста в чем причина и куда копать. На линуксе в qt пишу код с...

Не понятная ситуация с мышью
Я работаю на компьютере (беспроводная мышь),Тут мне необходимо было подключить в внешний...

Не понятная ситуация с Жестким диском
Может, кто сталкивался с такой проблемой или знает как её устранить. Последний месяц у меня...

Не понятная ситуация с play market
Некоторые слышали, что в Крыму имеется проблема с установкой программ из play market. Я было...

Не понятная ситуация с длинной varchar
Создал базу firebird. Базу создавал через IBExpert Один из столбцов определил как varchar(50)...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
10
Ответ Создать тему
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2024, CyberForum.ru