0 / 0 / 0
Регистрация: 24.06.2018
Сообщений: 23
|
|
1 | |
Работа с большим объемом данных01.10.2018, 22:06. Просмотров 1762. Ответов 6
Метки нет Все метки)
(
Коллеги, подскажите по такому вопросу.
Есть выборка, несколько миллионов записей. Каким образом с ней правильно работать в Python? Во-первых, если объем большой (допустим считать в датафрейм с использованием pandas), то не все возможно расположить в памяти и есть ограничения. Как вообще в машинном обучении правильно работать с большими данными и в Python вообще? Спасибо!
0
|
|
01.10.2018, 22:06 | |
Oracle и работа с большим набором данных Работа с большим объёмом данных
работа с большим объемом данных |
|
1025 / 946 / 139
Регистрация: 19.02.2010
Сообщений: 2,934
|
|
02.10.2018, 12:22 | 2 |
Кольцевой буфер.
0
|
0 / 0 / 0
Регистрация: 24.06.2018
Сообщений: 23
|
|
02.10.2018, 22:21 [ТС] | 3 |
А могли бы более подробно об это рассказать и какие функции или методы есть в Python? Это опция batch в pandas в read_csv?
0
|
![]() 4178 / 3071 / 1007
Регистрация: 28.10.2013
Сообщений: 7,980
|
|
03.10.2018, 01:02 | 4 |
Это немного. В 4gb ОЗУ вполне влезает до 10-20 млн. строк, если, конечно, у вас не "Война и мир" в каждой записи.
Читать документацию по используемым библиотекам. Считывание данных всегда можно делать итеративно - порциями. read_csv Обучение модели также можно делать итеративно, если в интерфейсе алгоритма есть метод partial_fit. Более подробно ответить вам невозможно, так как единственное, что ясно из вашего поста, это то, что вы работаете с какими-то сферическими конями в вакууме.
0
|
![]() |
|
03.10.2018, 13:02 | 5 |
MrSergey86, несколько миллионов - это объёмы для обычной "настольной" СУБД, наверняка даже SQLite справится, который в питоне "искапорки".
Если же нет - ну, можно что-то помощнее, типа MySQL или Postgres. Добавлено через 47 секунд А "вообще" это вопрос довольно сложный. Нельзя так сразу взять и - - - (нутыпонел).
0
|
05.10.2018, 11:21 | 6 |
Думаю, стоит обратить внимание на асинхронный python3 статья, например, эта https://habr.com/post/421625/
0
|
![]() |
|
05.10.2018, 12:10 | 7 |
IRIP, это уже про обработку конкретных случаев. Тут пока с хранением не разобрались.
0
|
05.10.2018, 12:10 | |
Заказываю контрольные, курсовые, дипломные и любые другие студенческие работы здесь. Работа с большим объемом данных
QtSerialPort Работа с большим объемом данных Как организована работа с большим объемом данных Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |