Форум программистов, компьютерный форум, киберфорум
С++ для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.67/6: Рейтинг темы: голосов - 6, средняя оценка - 4.67
11 / 15 / 8
Регистрация: 12.10.2011
Сообщений: 811

Обработка большого массива

20.06.2017, 15:47. Показов 1214. Ответов 8
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Добрый день!

Есть большой массив данных в текстовом файле, слова в строчке разделены пробелом, вот пример:
1. Сибирь '\t' 12.04.2016 '\t' заключен '\t' 20.01.2006 '\t' пролонгация '\t' 345445
2. Восток '\t' 15.12.2017 '\t' закрыт '\t' 03.05.2011 '\t' пролонгация '\t' №6565656
3. Восток '\t' 15.12.2017 '\t' закрыт '\t' 03.05.2017 '\t' пролонгация '\t' №6565656
150000. и так много строк

В массиве могут повторяться последние цифры(номер договора) в любом месте, вопрос, как правильно перебирать массив для поиска похожих номеров и сверки в них дат? Я сделал так: беру первый номер, проверяю его по всему массиву (150т.раз) нахожу похожие сравниваю, потом удаляю с массива похожие и все повторяется. Хоть со временем общий массив и уменьшается но все равно все происходит очень долго, тестировал на массиве 1000 строк программа выполнялась за 1.5 сек....
0
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
20.06.2017, 15:47
Ответы с готовыми решениями:

Обработка большого массива данных на C++
Суть проблемы. На работе, дали задание проработать 1 большой файл (вывести графики результата анализа и т.д.). Файл: двоичный. ~ 71 Мб ...

Многопоточная обработка большого массива через ThreadPool с возможностью остановки
Добрый день! Возникла такая задача. В массиве 200 тыс. строк. Их нужно обработать с помощью довольно быстрой функции с максимальной...

Обработка большого массива функцией в цикле foreach занимает много времени
Здравствуйте! Суть скрипта заключается в том, чтоб пинговать в локалке компы и показывать их OFF или ON статусы. Реализовать идею удалось,...

8
17 / 19 / 4
Регистрация: 03.02.2010
Сообщений: 262
21.06.2017, 15:45
Вот здесь посмотрите: Удалить одинаковые элементы массива
0
What a waste!
 Аватар для gray_fox
1610 / 1302 / 180
Регистрация: 21.04.2012
Сообщений: 2,733
21.06.2017, 16:13
Цитата Сообщение от eagl69 Посмотреть сообщение
похожих номеров
А как определяются "похожие номера"? Возможно можно отсортировать данные по "похожести", тогда можно будет удалить лишние "за один проход".
0
11 / 15 / 8
Регистрация: 12.10.2011
Сообщений: 811
21.06.2017, 19:21  [ТС]
Как отсортировать? Номер, это последнее слово в строчке.
0
What a waste!
 Аватар для gray_fox
1610 / 1302 / 180
Регистрация: 21.04.2012
Сообщений: 2,733
21.06.2017, 19:39
Цитата Сообщение от eagl69 Посмотреть сообщение
Как отсортировать? Номер, это последнее слово в строчке.
Вот по номеру и отсортировать. Я просто не уверен, что можно, т.к. не понятен критерий "похожести".

Добавлено через 8 минут
Т.е. нужен аналог операции < для номеров с аналогичными свойствами (транзитивность и пр.). Тогда можно будет упорядочить записи относительно номера и все записи с "похожими" номерами будут расположены последовательно.
0
зомбяк
 Аватар для TRam_
1585 / 1219 / 345
Регистрация: 14.05.2017
Сообщений: 3,940
21.06.2017, 19:39
gray_fox, похожесть - совпадение номера договора. Сортировать видимо надо так, что основной критерий - непрерывное возрастание номера договора, вспомогательный критерий - следование даты закрытия по возрастанию.
0
What a waste!
 Аватар для gray_fox
1610 / 1302 / 180
Регистрация: 21.04.2012
Сообщений: 2,733
21.06.2017, 19:42
Цитата Сообщение от TRam_ Посмотреть сообщение
gray_fox, похожесть - совпадение строки, за исключением первой цифры в этой строке (т.е. типа "5." и "200." в начале). Видимо вначале надо всё считать, потом отсортировать, потом поэлементно копировать (пропуская повторения), потом снова отсортировать, но уже по первой цифре (чтоб восстановился исходный порядок).
Ну я примерно и предполагал sort + unique + sort; как минимум, сложность (асимптотическая) будет меньше.
0
зомбяк
 Аватар для TRam_
1585 / 1219 / 345
Регистрация: 14.05.2017
Сообщений: 3,940
21.06.2017, 20:12
Цитата Сообщение от TRam_ Посмотреть сообщение
похожесть - совпадение строки, за исключением первой цифры в этой строке
невнимательно посмотрел. Там таки в строках даты отличаются...
0
11 / 15 / 8
Регистрация: 12.10.2011
Сообщений: 811
22.06.2017, 09:09  [ТС]
Даты во внимание брать не надо, если сортировать то только по номеру договора по возрастанию например... №6565656
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
22.06.2017, 09:09
Помогаю со студенческими работами здесь

Обработка большого файла
Приветствую. Есть таблица вида: id | field1 | field2 | field3 | field4 | field5 | field6 | field7 и далее до 28. Есть...

Обработка большого файла
Здравствуйте всем, я снова с вопросами , по поводу одной задачи, которую я себе сам придумал на основе прочитанного тут. Суть задачи...

Обработка большого текстового файла
Всем привет. Имеется txt файл размером 16ГБ. Как его обработать по блокам? Допустим по 100к строк.

Обработка большого количества textbox
Суть: в текстбоксы, расположенные по два ряда вводятся цифровые значения. Эти значения по нажатию button2 делятся, перемножаются и...

Обработка большого количества информации
Здравствуйте! Хотелось бы узнать у профессионалов, как можно с помощью средств Qt эффективно решить задачу обработки большого количества...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
9
Ответ Создать тему
Новые блоги и статьи
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта Симптом: После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
Access
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
Новый ноутбук
volvo 07.12.2025
Всем привет. По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне: Ryzen 5 7533HS 64 Gb DDR5 1Tb NVMe 16" Full HD Display Win11 Pro
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов На странице: https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/ нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином. Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов. . . .
Ломающие изменения в C#.NStar Alpha
Etyuhibosecyu 20.11.2025
Уже можно не только тестировать, но и пользоваться C#. NStar - писать оконные приложения, содержащие надписи, кнопки, текстовые поля и даже изображения, например, моя игра "Три в ряд" написана на этом. . .
Мысли в слух
kumehtar 18.11.2025
Кстати, совсем недавно имел разговор на тему медитаций с людьми. И обнаружил, что они вообще не понимают что такое медитация и зачем она нужна. Самые базовые вещи. Для них это - когда просто люди. . .
Создание Single Page Application на фреймах
krapotkin 16.11.2025
Статья исключительно для начинающих. Подходы оригинальностью не блещут. В век Веб все очень привыкли к дизайну Single-Page-Application . Быстренько разберем подход "на фреймах". Мы делаем одну. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2025, CyberForum.ru