Обработка текстовых файлов (логов) больших размеров16.01.2015, 14:30. Показов 8445. Ответов 5
Метки нет Все метки)
(
Добрый день.
Хочу написать "обработчик" текстовых логов. Логи очень большие (к примеру бывают 20000 строк и больше). Логи состоят из клиентских сессий, которые иногда приходится анализировать. Что я собираюсь делать с файлом: Открываю его для чтения. Построчно в цикле "for" ищу ключевые слова "start" или "stop" Если нашёл ключевое слово "start", то я начинаю добавлять все строки начиная с текущей в список. Продолжаю до тех пор, пока не найду строку, которая содержит ключевое слово "stop". Получается, что я на этот момент я имею список строк - который содержит одну клиентскую сессию. Когда я нахожу слово "stop" я добавляю текущий список в ещё один список - общий. А текущий список обнуляю , пока программа опять не найдет ключевое слово "start". На выходе я вроде как получаю список списков - в теории это даёт возможность обращаться к каждой клиентской сессии отдельно. Вот сам код. Само собой это просто набросок. Просто мне интересно, стоит вообще в таком ключе подходить к решению проблемы. Я понимаю, что всё это держать в памяти - очень тупо, поэтому собственно и спрашиваю: Как лучше сделать? И вообще стоило ли python'ом пытаться выполнить эту задачу? Кликните здесь для просмотра всего текста
0
|
16.01.2015, 14:30 | |
Ответы с готовыми решениями:
5
Замена строк в текстовых документах больших размеров Обработка текстовых файлов. Обработка бинарных файлов. Сериализация и десериализация объектов Копирование файлов больших размеров |
3258 / 2060 / 351
Регистрация: 24.11.2012
Сообщений: 4,909
|
|||
16.01.2015, 16:21 | |||
0
|
16.01.2015, 17:10 [ТС] | ||
Просто иногда бывает необходимость эти логи проверить на наличие ошибок или просто какую-то информацию о проведенной операции посмотреть. А на счёт странного формата я не понял
0
|
0 / 0 / 0
Регистрация: 18.03.2014
Сообщений: 24
|
||||||
16.01.2015, 17:15 | ||||||
Что-то в этом роде:
0
|
16.01.2015, 17:16 [ТС] | ||
С ними дальше и работаем : расписываем операции, которые выполнялись клиентом. оставляем важные из них, а ненужные строки удаляем. Я просто думаю: как обычно вообще логи обрабатывают и анализируют? т.е стоит ли списками (list) работать или есть что-то, более подходящее?
0
|
3258 / 2060 / 351
Регистрация: 24.11.2012
Сообщений: 4,909
|
|||
16.01.2015, 17:30 | |||
Если нужна более сложная обработка, можно посмотреть на фреймворк pandas или инструменты типа logstash. Сам не пользовался, подробнее сказать не могу.
0
|
16.01.2015, 17:30 | |
Помогаю со студенческими работами здесь
6
Получение из БД MSSQL файлов больших размеров Чтение файлов больших размеров >1Гб Чтение больших текстовых файлов Загрузка больших текстовых файлов Парсинг больших текстовых файлов Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Опции темы | |
|
Новые блоги и статьи
![]() |
||||
Звёздная пыль
kumehtar 20.06.2025
Я просто это себе представляю: как создавался этот мир. Как энергия слипалась в маленькие частички. Как они собирались в первые звёзды, как во вселенной впервые появился Свет. Как эти звёзды. . .
|
Создание нейросети с PyTorch
AI_Generated 19.06.2025
Ключевое преимущество PyTorch — его питоновская натура. В отличие от TensorFlow, который изначально был построен как статический вычислительный граф, PyTorch предлагает динамический подход. Это. . .
|
JWT аутентификация в ASP.NET Core
UnmanagedCoder 18.06.2025
Разрабатывая веб-приложения, я постоянно сталкиваюсь с дилеммой: как обеспечить надежную аутентификацию пользователей без ущерба для производительности и масштабируемости? Классические подходы на. . .
|
Краткий курс по С#
aaLeXAA 18.06.2025
Здесь вы найдете все необходимые функции чтоб написать програму на C#
Задание 1:
КЛАСС FORM 1
public partial class Form1 : Form
{
Spisok listin = new Spisok();
. . .
|
50 самых полезных примеров кода Python для частых задач
py-thonny 17.06.2025
Эффективность работы разработчика часто измеряется не количеством написаных строк, а скоростью решения задач. Готовые сниппеты значительно ускоряют разработку, помогают избежать типичных ошибок и. . .
|
C# и продвинутые приемы работы с БД
stackOverflow 17.06.2025
Каждый . NET разработчик рано или поздно сталкивается с ситуацией, когда привычные методы работы с базами данных превращаются в источник бессонных ночей. Я сам неоднократно попадал в такие ситуации,. . .
|
Angular: Вопросы и ответы на собеседовании
Reangularity 15.06.2025
Готовишься к техническому интервью по Angular? Я собрал самые распространенные вопросы, с которыми сталкиваются разработчики на собеседованиях в этом году. От базовых концепций до продвинутых. . .
|
Архитектура Onion в ASP.NET Core MVC
stackOverflow 15.06.2025
Что такое эта "луковая" архитектура? Термин предложил Джеффри Палермо (Jeffrey Palermo) в 2008 году, и с тех пор подход только набирал обороты. Суть проста - представьте себе лук с его. . .
|
Unity 4D
GameUnited 13.06.2025
Четырехмерное пространство. . . Звучит как что-то из научной фантастики, правда? Однако для меня, как разработчика со стажем в игровой индустрии, четвертое измерение давно перестало быть абстракцией из. . .
|
SSE (Server-Sent Events) в ASP.NET Core и .NET 10
UnmanagedCoder 13.06.2025
Кажется, Microsoft снова подкинула нам интересную фичу в новой версии фреймворка. Работая с превью . NET 10, я наткнулся на нативную поддержку Server-Sent Events (SSE) в ASP. NET Core Minimal APIs. Эта. . .
|