0 / 0 / 0
Регистрация: 04.08.2011
Сообщений: 7
1

написание программы для поиска и замены части строк в двух текстовых файлах с разным синтаксисом

04.08.2011, 13:33. Показов 2175. Ответов 18
Метки нет (Все метки)

Author24 — интернет-сервис помощи студентам
Здравствуйте! Последний раз программировал около 5 лет назад, на первых курсах колледжа. Забыл все полностью. Сейчас возникла необходимость опять взяться за это дело

Поэтому у меня пара вопросов, сначала первый, собственно он представляет собой поставленную мне задачу. Опишу все подробно, чтобы всем было понятно.

Итак, есть два текстовых файла, представляющие собой отчеты по биллингу от двух разных источников, (один отчет от софтины, которая стоит на предприятии, а второй отчет предоставляет провайдер каждый месяц). Отчеты в *txt, данные в них одинаковые, но так как софт разный, (на предприятии и у провайдера) синтаксис отличается. Далее буду называть их отчет A и отчет B

Текст в отчетах разбит на строки, и выглядит примерно так:

дата/время/длительность/номер с которого был совершен звонок/номер на который был совершен звонок/стоимость звонка/


суть в том, поле /номер с которого был совершен звонок/ у отчета А одно, а у отчета В - другое, то есть, у отчета А в этом поле различные телефонные номера, а у отчета В один и тот же одинаковый номер.

Необходимо произвести анализ обоих отчетов по строкам, по некоторым параметрам, и заменить у отчета В тот самый одинаковый номер на корректные номера из отчета А.

Я представляю это себе примерно так:

Программой анализируется содержимое отчета А и В, затем из первой строки отчета А берутся следующие значения:

дата/время/длительность/номер на который был совершен звонок/, затем в отчете В ищется строка с идентичными значениями, затем в этой строке поле
/номер с которого был совершен звонок/ заменяется на это же поле из отчета А

т.е в отчете А у нас первая строка выглядит так:

дата/время/длительность вызова/внутренний номер (1111)/номер на который был совершен звонок (2222222)/

В отчете В у нас строка немного другая:

дата/время/длительность вызова/единый для всех внешний номер (3333333)/номер на который был совершен звонок(2222222)/стоимость звонка/


Программа должна сделать третий отчет, в котором будет строка вида

дата/время/длительность вызова/внутренний номер(1111)/номер на который был совершен звонок(2222222)/стоимость звонка/

Это может показаться глупым, но прикол в том, что у провайдера естественно есть своя тарификация звонков, а биллинг который стоит на предприятии вообще стоимость считать не умеет. А пров предоставляет отчет в которым невозможно отследить с какого номера был совершен звонок, обратите внимание, в отчете прова внутренние номера не видны, номер в отчете прова единый для всех внутренних. Поэтому в случае чего непонятно, какому сотруднику предъявлять счет на связь с какой нибудь карагандой. Ради этого этот ад и был затеян

Надеюсь я понятно объяснил суть задачи, поэтому у меня второй вопрос. Реально ли осилить написание такой программы в течение 2х недель, или можно вешаться ? Начинаю с нуля, в голове со времен колледжа по программированию у меня не отложилось ничего, никогда не собирался этим заниматься, не мое это. Но сейчас нужно что то предпринимать. Время идет.

Господа, подскажить мне пожалуйста с чего сейчас начать, про что конкретно почитать, от чего отталкиваться ? Может быть что то и получится в итоге
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
04.08.2011, 13:33
Ответы с готовыми решениями:

Изменить текст в одном txt-файле с использованием двух других для поиска и замены строк
Здравствуйте, подскажите, пожалуйста как можно заменить текст в одном тхт файле... список того, что заменить, находится в первом тхт файле,...

Подскажите команды для поиска папок, файлов, текста в файлах и его замены
Доброго времени суток, интересует реализация скрипта,для 1.поиска файлов и папок с последущим их дублированием только с другими именами,...

Замена части определённой строки во всех текстовых файлах заданной директории
Доброго день. Необходима помощь в написании bat, который бы заменил во всех файлаx (.txt) в директории: Заменить: <td...

18
Автор FAQ
 Аватар для -=ЮрА=-
6612 / 4254 / 401
Регистрация: 08.08.2009
Сообщений: 10,325
Записей в блоге: 24
04.08.2011, 14:16 2
Прикрепи для работы файлы отчётов А и В, тогда могу помочь...
0
0 / 0 / 0
Регистрация: 04.08.2011
Сообщений: 7
04.08.2011, 15:08  [ТС] 3
ошибся, отчеты в *xls

ссылка для скачивания:

http://ifolder.ru/25032974
0
Делаю внезапно и красиво
Эксперт С++
 Аватар для Deviaphan
1313 / 1228 / 72
Регистрация: 22.03.2011
Сообщений: 3,744
04.08.2011, 15:25 4
Что-то мне подсказывает, что всё это можно сделать средствами Excel'я...
0
Автор FAQ
 Аватар для -=ЮрА=-
6612 / 4254 / 401
Регистрация: 08.08.2009
Сообщений: 10,325
Записей в блоге: 24
04.08.2011, 15:25 5
Ra1nbowman, я буду преобразовывать всё в тхт - гемор с экселем мне не нужен. В тхт тебя устроит?
0
04.08.2011, 15:27 6

Не по теме:

Кому бы эту инфу толкнуть...

0
Каратель
Эксперт С++
6610 / 4029 / 401
Регистрация: 26.03.2010
Сообщений: 9,273
Записей в блоге: 1
04.08.2011, 15:28 7
Ra1nbowman, ссылки на файлообменники запрещены правилами форума

ошибся, отчеты в *xls
можно вешатся, гораздо проще на шарпе написать
0
0 / 0 / 0
Регистрация: 04.08.2011
Сообщений: 7
04.08.2011, 15:28  [ТС] 8
-=ЮрА=-, конечно, как тебе будет угодно
0
Эксперт С++
 Аватар для fasked
5045 / 2624 / 241
Регистрация: 07.10.2009
Сообщений: 4,310
Записей в блоге: 5
04.08.2011, 15:33 9
Цитата Сообщение от Maxwe11 Посмотреть сообщение
можно вешатся, гораздо проще на шарпе написать
Гораздо проще на питоне, перле и т.д., по-моему они как раз для этого и задумывались
0
Делаю внезапно и красиво
Эксперт С++
 Аватар для Deviaphan
1313 / 1228 / 72
Регистрация: 22.03.2011
Сообщений: 3,744
04.08.2011, 15:37 10
Всё элементарно (даже за две недели сможешь сделать.) )!
Выгружаешь инфу в текстовые файлы с удобным разделителем (пробел не подходит, т.к. есть строки с пробелом). Для упрощения задачи можно выгружать не все столбцы. НАпример, очевидно, что там везде ВЫМПЕЛКОМ в столбце TR_CMP. Но это просто для уменьшения объёма.

Для идентификации звонков используешь трио дата/время/длительность вызова. т.е. создаёшь структуру вида
C++
1
2
3
4
5
6
dtruct CallID
{
      DWORD date;
      DWORD time;
      DWORD call;
};
И ещё одну структуру CallData, содержащую все остальные поля из обоих файлов.

Создаёшь словарь std::map<CallID, CallData> calls;
Построчно считываешь первый файл, заполняя поля структур CallID и CallData и занося их в словарь.

Считываешь второй файл, заполняя структуру типа CallID, находишь в словаре связанную с ней информацию о звонке и дополняешь оставшиеся поля.

Сохраняешь данные из словаря в третий файл.

Я реализацию писать не буду, это скучно.)
0
0 / 0 / 0
Регистрация: 04.08.2011
Сообщений: 7
04.08.2011, 15:52  [ТС] 11
Deviaphan, большое спасибо, правда -=ЮрА=- возможно что нибудь придумает, вообще мне стыдно кого то просить о готовом решении, но если он поможет я буду только рад

а так буду разбираться сам конечно, уже есть правильное направление, почитаю книги, погуглю, глядишь,сваяю что нибудь )
0
Автор FAQ
 Аватар для -=ЮрА=-
6612 / 4254 / 401
Регистрация: 08.08.2009
Сообщений: 10,325
Записей в блоге: 24
04.08.2011, 15:52 12
Ra1nbowman, между колонками cNumber из отчёта А и FROM TO в отчёте В нет ни одного совпадающего номера, ты уверен что инфа в этих файлах об одних и тех же звонках?
0
Каратель
Эксперт С++
6610 / 4029 / 401
Регистрация: 26.03.2010
Сообщений: 9,273
Записей в блоге: 1
04.08.2011, 15:53 13
Цитата Сообщение от fasked Посмотреть сообщение
Гораздо проще на питоне, перле и т.д., по-моему они как раз для этого и задумывались
я имел ввиду не саму обработку текста, а открытие и чтение *.xls файла, под это только .NET и заточен нормально
0
Делаю внезапно и красиво
Эксперт С++
 Аватар для Deviaphan
1313 / 1228 / 72
Регистрация: 22.03.2011
Сообщений: 3,744
04.08.2011, 15:55 14
Цитата Сообщение от Maxwe11 Посмотреть сообщение
под это только .NET и заточен нормально
На PowerShell ещё можно...
0
0 / 0 / 0
Регистрация: 04.08.2011
Сообщений: 7
04.08.2011, 16:04  [ТС] 15
Цитата Сообщение от -=ЮрА=- Посмотреть сообщение
Ra1nbowman, между колонками cNumber из отчёта А и FROM TO в отчёте В нет ни одного совпадающего номера, ты уверен что инфа в этих файлах об одних и тех же звонках?
Да, именно про это я и говорил, столбец FROM в отчете B имеет единый номер 703-11-60.

Этот номер нужно заменить на соответствующий номер из отчета А, и сформировать третий отчет, с замененными номерами.

т.е берем отчет А, выдираем из него местный номер из столбца Extension и заменяем им номер 703-11-60 в отчете В, в столбце FROM.
0
Автор FAQ
 Аватар для -=ЮрА=-
6612 / 4254 / 401
Регистрация: 08.08.2009
Сообщений: 10,325
Записей в блоге: 24
04.08.2011, 16:21 16
Цитата Сообщение от Ra1nbowman Посмотреть сообщение
на соответствующий номер из отчета А
Для наглядности привожу пример поиска самого первого номера в колонке ТО отчёта В в отчёте А. Как видишь нет этого номера - каков алгоритм сопоставления номера, вот о чём я?
Миниатюры
написание программы для поиска и замены части строк в двух текстовых файлах с разным синтаксисом  
0
0 / 0 / 0
Регистрация: 04.08.2011
Сообщений: 7
04.08.2011, 16:36  [ТС] 17
Понял, тогда можно ли каким то образом откинуть семерку и код города ? Или, к примеру, сравнивать только по последним семи цифрам ? тогда по идее все должно получиться, по крайней мере у меня по номеру 631 84 34 поиск прошел по одному и по другому отчету. Правда пришлось отбросить 7 495.
0
Автор FAQ
 Аватар для -=ЮрА=-
6612 / 4254 / 401
Регистрация: 08.08.2009
Сообщений: 10,325
Записей в блоге: 24
04.08.2011, 17:18 18
Цитата Сообщение от Ra1nbowman Посмотреть сообщение
Правда пришлось отбросить 7 495.
- тогда попробую, молниеносное выполнение не гаранирую, но делать берусь...
1
0 / 0 / 0
Регистрация: 04.08.2011
Сообщений: 7
04.08.2011, 19:52  [ТС] 19
спасибо! спешить пока некуда, будет замечательно если все получится
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
04.08.2011, 19:52
Помогаю со студенческими работами здесь

Регулярное выражение для поиска и замены строк по условию
Помогите пожалуйста составить регулярку, если конечно кто-то разбирается в этой шайтан-науке))) Суть такая. В файле строки. В...

Доработка программы для поиска и замены слов
Есть программа. Она берет текст из буфера обмена, находит в нем некоторые слова или части слов(повторяющиеся слова программа пропускает),...

Join в linux для двух файлов с разным количеством строк
Здравствуйте, можно ли соединить 2 файла с разным количеством строк, но чтобы в результате было столько склеек, сколько строк в...

Дописи строк в текстовых файлах
Можете отредактировать программу, чтоб она после запуска сразу закрывалась, и писала строки после полследней, а не сразу за последним...

Программы для гибкого поиска и замены текста по шаблону
Есть ли программы, способные найти все совпадения в тексте, myR5] myR8] myR10], а затем умножить числа в квадратных скобках на 2 ? ...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
19
Ответ Создать тему
Опции темы

Новые блоги и статьи
Сопоставление с образцом (Pattern Matching) в Python: Списки и словари
py-thonny 19.03.2025
Программисты любят, когда код говорит сам за себя. Представьте, что вы можете просмотреть структуру данных и мгновенно понять, что с ней делать — без сложных условий и вложенных проверок. Именно эту. . .
Работа с метаданными EXIF и JPEG в JavaScript
run.dev 19.03.2025
Работа с изображениями в веб-разработке нередко выходит за рамки простого отображения картинки. Современные задачи требуют глубокого понимания структуры файлов и умения манипулировать их внутренними. . .
Чеклист для Kubernetes в продакшене: Лучшие практики для SRE
Mr. Docker 19.03.2025
Когда сталкиваешься с запуском Kubernetes в продакшене, невольно задаешься вопросом: почему то, что так гладко работало в тестовой среде, вдруг начинает вызывать головную боль на боевых системах?. . .
Разработка продвинутого ИИ в Unity с использованием Behavior Graph
GameUnited 19.03.2025
В разработке игр искусственный интеллект персонажей часто становится тем элементом, который превращает хорошую игру в выдающуюся. До недавнего времени разработчикам под Unity приходилось либо писать. . .
Словари в Python: методы работы, оптимизация, сериализация
py-thonny 19.03.2025
Каждый хотя бы раз сталкивался с необходимостью хранить связанные данные, где важна не только сама информация, но и их взаимосвязь. В дебрях Python словари — это тот универсальный инструмент, который. . .
Реализация паттерна CQRS с Event Sourcing в PHP
Jason-Webb 19.03.2025
CQRS (Command Query Responsibility Segregation) — это архитектурный паттерн, который разделяет операции чтения и записи данных в приложении. Если вы столкнулись с ситуацией, когда ваше PHP-приложение. . .
std::span в C++: Подпредставлени­я и срезы
NullReferenced 18.03.2025
Если вы когда-нибудь работали с большими объемами данных в C++, то наверняка сталкивались с необходимостью манипулировать отдельными частями массивов или контейнеров. Традиционные подходы часто. . .
std::span в C++: Доступ к элементам и итерирование
NullReferenced 18.03.2025
В C++ каждый разработчик сталкивается с проблемой эффективного управления последовательностями данных. Представьте: вы работаете с массивом, передаете его в функцию, а затем в другую, и каждый раз. . .
Утечки памяти в C#
UnmanagedCoder 18.03.2025
Когда мы говорим о разработке приложений на C#, то часто успокаиваем себя мыслью, что сборщик мусора решит все наши проблемы с памятью. "Память управляется автоматически" — эта мантра прочно засела в. . .
std::span в C++: Введение в невладеющее представление
NullReferenced 18.03.2025
С появлением стандарта C++20 у нас появился новый инструмент — std::span, который представляет собой невладеющее представление для работы с последовательностями данных. std::span — это легковесный. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2025, CyberForum.ru