|
0 / 0 / 0
Регистрация: 30.01.2024
Сообщений: 3
|
|
Загрузка огромных объемов данных(20гб+) в pandas30.01.2024, 14:22. Показов 1875. Ответов 8
Добрый день, работаю в сфере по анализу больших данных. Компания использует устаревший ПО для анализа (Audit Command Language для тех кто шарит). Появилась идея реализовать систему анализа данных на другом более новым и гибком ПО. Рассматриваю переход на связку Python + pandas и смежные библиотеки.
Теперь основная тема. Надо реализовать загрузку и запись больших объемов данных и манипуляцию с ними. Основные проблемы: 1)Ограничение по оперативной памяти 2гб (виртуальная машина на сервере компании) 2)Большие объемы данных (от 20 тыс. строк до 100 млн. строк и объемы могут достигать 30Гб одной таблицей) От вас хочу услышать как у вас это реализовано, какие у вас алгоритмы для записи и обработки данных, может какие нибудь идеи как это можно самому реализовать, какие форматы данных используете, как производите сортировку и т.д. Буду благодарен если поделитесь вашими мыслями пуска даже не конкретными, а хотя бы набросками алгоритмов. Любым обсуждения буду рад.
0
|
|
| 30.01.2024, 14:22 | |
|
Ответы с готовыми решениями:
8
Нужен тип данных для огромных чисел Сериализация больших объемов данных |
|
14087 / 9305 / 1348
Регистрация: 21.01.2016
Сообщений: 34,945
|
|||
| 01.02.2024, 09:44 | |||
|
2024й год на дворе, машины с 32Гб оперативки стоят адекватных денег, особенно для компаний...
1
|
|||
|
282 / 485 / 12
Регистрация: 21.06.2019
Сообщений: 3,018
|
|||||
| 03.02.2024, 19:26 | |||||
Мягко говоря ![]()
1
|
|||||
|
Просто Лис
|
||
| 10.02.2024, 08:14 | ||
|
0
|
||
| 10.02.2024, 09:35 | ||
|
А вообще говоря, все ответившие выше, абсолютно правы - 2гб памяти - это катастрофически мало для задач анализа данных
0
|
||
|
14087 / 9305 / 1348
Регистрация: 21.01.2016
Сообщений: 34,945
|
||
| 10.02.2024, 11:22 | ||
|
0
|
||
|
0 / 0 / 0
Регистрация: 30.01.2024
Сообщений: 3
|
|||
| 12.02.2024, 17:19 [ТС] | |||
|
0
|
|||
|
0 / 0 / 0
Регистрация: 30.01.2024
Сообщений: 3
|
|
| 12.02.2024, 17:53 [ТС] | |
|
Тут предлагали использовать DuckDb в связке с питоном, а там и Dask можно подтянуть. Опробовал DuckDb пока выглядит многообещающи.
0
|
|
| 12.02.2024, 17:53 | |
|
Помогаю со студенческими работами здесь
9
Добавление в бд больших объемов данных Шифрование больших объемов данных
Добавление больших объемов данных Обработка больших объёмов данных Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
||||
|
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта
Симптом:
После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
|
Access
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
|
Новый ноутбук
volvo 07.12.2025
Всем привет.
По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне:
Ryzen 5 7533HS
64 Gb DDR5
1Tb NVMe
16" Full HD Display
Win11 Pro
|
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
|
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
|
|
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов
На странице:
https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/
нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
|
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов.
. . .
|
Ломающие изменения в C#.NStar Alpha
Etyuhibosecyu 20.11.2025
Уже можно не только тестировать, но и пользоваться C#. NStar - писать оконные приложения, содержащие надписи, кнопки, текстовые поля и даже изображения, например, моя игра "Три в ряд" написана на этом. . .
|
Мысли в слух
kumehtar 18.11.2025
Кстати, совсем недавно имел разговор на тему медитаций с людьми. И обнаружил, что они вообще не понимают что такое медитация и зачем она нужна. Самые базовые вещи. Для них это - когда просто люди. . .
|
Создание Single Page Application на фреймах
krapotkin 16.11.2025
Статья исключительно для начинающих. Подходы оригинальностью не блещут.
В век Веб все очень привыкли к дизайну Single-Page-Application .
Быстренько разберем подход "на фреймах".
Мы делаем одну. . .
|