Форум программистов, компьютерный форум, киберфорум
Python
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.67/3: Рейтинг темы: голосов - 3, средняя оценка - 4.67
0 / 0 / 0
Регистрация: 27.06.2016
Сообщений: 22

Почему расход памяти уменьшается со временем?

29.03.2023, 21:00. Показов 789. Ответов 7

Студворк — интернет-сервис помощи студентам
Подскажите, кто разбирается. Есть скрипт, который условно генерирует фразы, затем ищет эту фразу в подключаемом файле txt. В этом файле 30+млн строк, в каждой строке 1 фраза, весит он 1ГБ. скрипт генерит и проверяет 10-12 тыс. фраз в секунду. При запуске питон начинает кушать до 4.3ГБ RAM. Это норма, для такого большого файла. но почему то минут через 10-15 падает до 3.8-4ГБ, а по прошествии примерно часа начинает потреблять всего 1ГБ оперативки. И это значение уже не изменяется. Если перезапускать или запускать дополнительно копию, или даже 3 копии, все то же самое. Почитал про кэширование и очистку RAM самим питоном, но толком не понял, он сам каким то образом кэширует или почему так происходить, что расход памяти уменьшается со временем?
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
29.03.2023, 21:00
Ответы с готовыми решениями:

Непонятный расход памяти (ничего не запущено, кроме антивируса, а расходуется 900 МБ памяти)
Объясните, почему у меня ничего не запущено, кроме антивируса, а расходуется 900 МБ памяти?

HttpWebRequest, расход памяти непомерно больших объемов и , как следствие, утечка памяти
Добрый вечер. Мне была поставлена такая задача. Написать приложение, которая загружает из списка ссылки с сайта и ищет там определенную...

расход памяти в С#
Мне хотелось бы знать сколько моя программа занимает памяти я использую GC.GetTotalMemory(true) однако мне хотелось бы знать сколько ...

7
0 / 0 / 0
Регистрация: 27.06.2016
Сообщений: 22
31.03.2023, 13:46  [ТС]
Нашел такое понятие как "сбор мусора", но подразумевается то, что питон сам выделяет память под сценарий, а затем освобождает ее, если какой то объект больше не используется. Но ведь у меня один тестовый файл, что там может не использоваться? Или другой вариант: он берет память с запасом, а лишнее потом освобождает. Не знаю, точного ответа пока что не нашел
0
Модератор
Эксперт Python
 Аватар для Fudthhh
2696 / 1602 / 513
Регистрация: 21.02.2017
Сообщений: 4,210
Записей в блоге: 1
31.03.2023, 14:17
Цитата Сообщение от fawn Посмотреть сообщение
При запуске питон начинает кушать до 4.3ГБ RAM
Нет, это не нормально.

Цитата Сообщение от fawn Посмотреть сообщение
Это норма, для такого большого файла.
Это говорит о том, что ты не умеешь работать с файлами.

Цитата Сообщение от fawn Посмотреть сообщение
Нашел такое понятие как "сбор мусора"
Это удаление каких то переменных, которые создавались и никогда больше не будут использоваться.
Например ты в функции создал переменную "A", произвел какие то неподобающие вещи, и вышел из функции. Но ты не использовал инструкцию "delete A" перед тем как выйти из функции, ак вот тут то и приходит сборщик мусора и убирает за тобой.
0
Автоматизируй это!
Эксперт Python
 Аватар для Welemir1
7392 / 4819 / 1246
Регистрация: 30.03.2015
Сообщений: 13,694
Записей в блоге: 29
31.03.2023, 19:04
Цитата Сообщение от fawn Посмотреть сообщение
Это норма, для такого большого файла.
не совсем, ты его целиком в память чтоли читаешь? а построчно читать можно? или ты и пишешь туда одновременно? хотя тогда логичнее все в памяти вообще держать.

по памяти, кроме счетчика ссылок который работает быстро и на поверхности, есть сборщик мусора, который стартует после создания более 700 объектов. Но ты говоришь там у тебя тысячами оперирует, значит сборщик точно работает. Возможно ряд строк похожи или одинаковы, тогда питон использует кеш для них. Ну а все остальное надо только по коду и с профилировщиком смотреть.
1
0 / 0 / 0
Регистрация: 27.06.2016
Сообщений: 22
31.03.2023, 20:27  [ТС]
Цитата Сообщение от Fudthhh Посмотреть сообщение
Это говорит о том, что ты не умеешь работать с файлами.
Что значит не умею?

Цитата Сообщение от Welemir1 Посмотреть сообщение
не совсем, ты его целиком в память чтоли читаешь?
Python
1
 load_data = open("text.txt", "r").readlines()
// открываю файл для чтения
Затем генерируемую фразу ищу в текстовом файле через if ... in ...,
если есть совпадения, пишу в другой текстовый файл ТУ фразу, которая совпала
все.
Цитата Сообщение от Welemir1 Посмотреть сообщение
Возможно ряд строк похожи или одинаковы
Они все разные, уникальные 30млн строк, без повторений. Если повторения и есть, то к 30млн это будет меньше 1%.
Цитата Сообщение от Welemir1 Посмотреть сообщение
Но ты говоришь там у тебя тысячами оперирует
да, и сценарий не останавливается сам, пока я не закрою его, то есть он бесконечно генерирует фразу и ищет все возможные совпадения. Все рабочее, вопрос только в потреблении оперы. Мне кажется, как будто просто начинает игнорировать 75% текстового файла. Такого же не может быть?
0
Автоматизируй это!
Эксперт Python
 Аватар для Welemir1
7392 / 4819 / 1246
Регистрация: 30.03.2015
Сообщений: 13,694
Записей в блоге: 29
31.03.2023, 20:50
Цитата Сообщение от fawn Посмотреть сообщение
load_data = open("text.txt", "r").readlines()
зачем? читай построчно! тогда и памяти будет тратиться совсем немного, ведь тебе в конкретный данный момент нужна всего 1 строка для сравнения.

Цитата Сообщение от fawn Посмотреть сообщение
Такого же не может быть?
все может быть, мы не видели кода))
0
0 / 0 / 0
Регистрация: 27.06.2016
Сообщений: 22
31.03.2023, 22:40  [ТС]
Цитата Сообщение от Welemir1 Посмотреть сообщение
зачем? читай построчно!
Либо я вас не понимаю, либо вы меня.
Если я буду читать построчно, тогда же снизится скорость работы? в файле 33млн строк, и читать построчно, когда генерируется +/- 10.000 фраз/с, и все эти фразы нужно сразу сверять со списком...
Безусловно, используя readline(), вместо readlines(), сценарий занимает всего 70мб памяти, но...
не в памяти проблема, а в том, что по каким то причинам уменьшается занимаемое количество, я просто опасаюсь, что в таком случае, что-то идет не совсем по плану)

P.S. и не будет ли упущений в таком случае, если использовать построчное чтение?
0
Автоматизируй это!
Эксперт Python
 Аватар для Welemir1
7392 / 4819 / 1246
Регистрация: 30.03.2015
Сообщений: 13,694
Записей в блоге: 29
01.04.2023, 08:00
ну очевидно что мы не видим всей карины потому можем советовать не то. Я бы этот файлик взял в память в виде каких нибудь хешей, но не строк, как раз для экономии памяти, да еще все это в сет. Генерим фразы, делаем из них тоже хеш и почти мнгновенно проверяем есть ли такой хеш в сете. Но это я опять предполагаю.
2
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
01.04.2023, 08:00
Помогаю со студенческими работами здесь

Расход оперативной памяти
Суть в следующем: стоит Апач 2.2. Оперативной памяти 512 Мб, свободной 260. На серваке хаотично возникают процессы, которые в считанные...

Уменшить расход памяти
#include <iostream> #include <string> #include <cstring> using namespace std; int main() { freopen("input.txt","r",stdin); ...

Огромный расход памяти
Есть следующий код ( каждые 10 секунд делает скрины и сохраняет их) using System; using System.Collections.Generic; using...

Расход памяти ВэбСокетСервером
Всем доброго времени суток! Суть: Берем сервер из официальной доки Берем клиента от туда же Немного подправим QML код клиента: ...

Большой расход памяти
Пишу приложение, которое берёт слово из файла и отправляет его через форму на сайт. И всё работает как надо, вот только потребляемая память...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
8
Ответ Создать тему
Новые блоги и статьи
Программный контроль заполнения реквизита табличной части документа
Maks 02.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "СписаниеМатериалов", разработанного в конфигурации КА2. Задача: реализовать контроль заполнения реквизита "ПричинаСписания". . .
wmic не является внутренней или внешней командой
Maks 02.04.2026
Решение: DISM / Online / Add-Capability / CapabilityName:WMIC~~~~ Отсюда: https:/ / winitpro. ru/ index. php/ 2025/ 02/ 14/ komanda-wmic-ne-naydena/
Программная установка даты и запрет ее изменения
Maks 02.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "СписаниеМатериалов", разработанного в конфигурации КА2. Задача: при создании документов установить период списания автоматически. . .
Вывод данных в справочнике через динамический список
Maks 01.04.2026
Реализация из решения ниже выполнена на примере нетипового справочника "Спецтехника" разработанного в конфигурации КА2. Задача: вывести данные из ТЧ нетипового документа. . .
Программное заполнения текстового поля в реквизите формы документа
Maks 01.04.2026
Алгоритм из решения ниже реализован на нетиповом документе "ВыдачаОборудованияНаСпецтехнику" разработанного в конфигурации КА2, в дополнении к предыдущему решению. На форме документа создается. . .
К слову об оптимизации
kumehtar 01.04.2026
Вспоминаю начало 2000-х, университет, когда я писал на Delphi. Тогда среди программистов на форумах активно обсуждали аккуратную работу с памятью: нужно было следить за переменными, вовремя. . .
Идея фильтра интернета (сервер = слой+фильтр).
Hrethgir 31.03.2026
Суть идеи заключается в том, чтобы запустить свой сервер, о чём я если честно мечтал давно и давно приобрёл книгу как это сделать. Но не было причин его запускать. Очумелые учёные напечатали на. . .
Модель здравосоХранения 6. ESG-повестка и устойчивое развитие; углублённый анализ кадрового бренда
anaschu 31.03.2026
В прикрепленном документе раздумья о том, как можно поменять модель в будущем
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru