Форум программистов, компьютерный форум, киберфорум
С++ для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.58/19: Рейтинг темы: голосов - 19, средняя оценка - 4.58
0 / 0 / 0
Регистрация: 03.07.2012
Сообщений: 7

Быстрый поиск ip адреса в текстовом файле

03.07.2012, 20:59. Показов 3782. Ответов 13
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Нужно найти конкретный ip-адрес в текстовом файле (он может попасться несколько раз). На каждой строчке по 1 ip-адресу. Всего строк ~300 000.

Проблема в том, что простой перебор всех строк не подходит. Нужно придумать алгоритм, чтобы ускорить этот процесс.

Посмотрел в сторону этих алгоритмов - http://algolist.manual.ru/search/esearch/

Но не знаю как использовать их в моем случае, т.к. в них используется обращение к "конкретному элементу", а в С++ к произвольной строке обратиться нельзя.

Посоветуйте что-нибудь. Заранее спасибо.
0
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
03.07.2012, 20:59
Ответы с готовыми решениями:

Каков самый быстрый способ узнать количество строк в оргомном текстовом файле в Windows?
Есть текстовый файл с кучей строк (размер файла ~ 1Гб). Как можно максимально быстро узнать кол-во строк в этом файле? Если делать тупо...

Поиск в текстовом файле всех слов, заданных в другом текстом файле
Вообщем такое задание: Поиск в текстовом файле всех слов, заданных в другом текстом файле; Не могу понять почему не работает: ...

Присвоение переменной значения IP-адреса из таблицы в текстовом файле в соответствии с именем компьютера
Доброго времени суток, уважаемые спецы и начинающие! Есть некий массив имен компьютеров (около 100) и соответствующих им IP-адресов...

13
 Аватар для RaiaNKnight
97 / 71 / 12
Регистрация: 29.06.2011
Сообщений: 465
Записей в блоге: 1
03.07.2012, 21:08
Цитата Сообщение от post_hack Посмотреть сообщение
Нужно найти конкретный ip-адрес в текстовом файле (он может попасться несколько раз). На каждой строчке по 1 ip-адресу. Всего строк ~300 000.

Проблема в том, что простой перебор всех строк не подходит. Нужно придумать алгоритм, чтобы ускорить этот процесс.

Посмотрел в сторону этих алгоритмов - http://algolist.manual.ru/search/esearch/

Но не знаю как использовать их в моем случае, т.к. в них используется обращение к "конкретному элементу", а в С++ к произвольной строке обратиться нельзя.

Посоветуйте что-нибудь. Заранее спасибо.
Каким-то образом ip идут? Порядок есть?
0
0 / 0 / 0
Регистрация: 03.07.2012
Сообщений: 7
03.07.2012, 21:12  [ТС]
Цитата Сообщение от RaiaNKnight Посмотреть сообщение
Каким-то образом ip идут? Порядок есть?
да, они упорядочены. текстовый файл - это собственно таблица маршрутизации.
0
 Аватар для RaiaNKnight
97 / 71 / 12
Регистрация: 29.06.2011
Сообщений: 465
Записей в блоге: 1
03.07.2012, 21:17
Может чем-то вроде бинарного/тернарного поиска?
То есть будем смотреть значения каждой части - они же точками делятся,верно?

Добавлено через 2 минуты
В любом случае, вам нужно будет считывать строку и проверять первые цифры ip-шника, чтобы понимать куда двигаться дальше
0
0 / 0 / 0
Регистрация: 03.07.2012
Сообщений: 7
03.07.2012, 21:18  [ТС]
Цитата Сообщение от RaiaNKnight Посмотреть сообщение
Может чем-то вроде бинарного/тернарного поиска?
То есть будем смотреть значения каждой части - они же точками делятся,верно?
да, я хотел попробовать сделать бинарный поиск.
Но:
во-первых, общее количество записей не известно.
во-вторых, как я обращусь к строчке в середине файла?
в-третьих, как обратиться к первым цифрам конкретной строки я тоже не знаю.
0
 Аватар для RaiaNKnight
97 / 71 / 12
Регистрация: 29.06.2011
Сообщений: 465
Записей в блоге: 1
03.07.2012, 21:19
Цитата Сообщение от post_hack Посмотреть сообщение
да, они упорядочены. текстовый файл - это собственно таблица маршрутизации.
А памяти много выделяется?

Добавлено через 1 минуту
Цитата Сообщение от post_hack Посмотреть сообщение
да, я хотел попробовать сделать бинарный поиск.
Но:
во-первых, общее количество записей не известно.
во-вторых, как я обращусь к строчке в середине файла?
в-третьих, как обратиться к первым цифрам конкретной строки я тоже не знаю.
Допустимо весь файл прочесать?

Скажите, а сколько времени для этой функции уделяется?
0
0 / 0 / 0
Регистрация: 03.07.2012
Сообщений: 7
03.07.2012, 21:20  [ТС]
Цитата Сообщение от RaiaNKnight Посмотреть сообщение
А памяти много выделяется?

Добавлено через 1 минуту


Допустимо весь файл прочесать?
Ограничения по памяти нет. Главная задача - оптимизация времени поиска.

Допустимо весь файл прочесать?
для чего? если для поиска нужного IP - то это не оптимально. Т.к. и IP будет несколько, и каждый раз прочесывать эти 300 000 строк - не оптимально. Если 1 раз для того, чтобы узнать сколько всего строк, то думаю можно. Но как это поможет?

Скажите, а сколько времени для этой функции уделяется?
Для функции поиска? Какой то конкретной цифры нет. Но вариант проходить все каждый раз от начала до конца не подходит.
0
 Аватар для RaiaNKnight
97 / 71 / 12
Регистрация: 29.06.2011
Сообщений: 465
Записей в блоге: 1
03.07.2012, 21:23
Цитата Сообщение от post_hack Посмотреть сообщение
Ограничения по памяти нет. Главная задача - оптимизация времени поиска.
Айпишники ведь в самом начале каждой строки?

Добавлено через 47 секунд
Цитата Сообщение от post_hack Посмотреть сообщение
Ограничения по памяти нет. Главная задача - оптимизация времени поиска.



для чего? если для поиска нужного IP - то это не оптимально. Т.к. и IP будет несколько, и каждый раз прочесывать эти 300 000 строк - не оптимально. Если 1 раз для того, чтобы узнать сколько всего строк, то думаю можно. Но как это поможет?
Да-да, конечно, один раз

А вы можете все айпишники же в хеш-таблицу записать?
0
0 / 0 / 0
Регистрация: 03.07.2012
Сообщений: 7
03.07.2012, 21:25  [ТС]
Цитата Сообщение от RaiaNKnight Посмотреть сообщение
Айпишники ведь в самом начале каждой строки?
Да. Строчки например такого вида:

192.168.1.0 255.255.255.0 10.20.30.1
192.168.1.3 255.255.255.0 10.20.30.55
185.215.1.0 255.255.255.0 10.20.30.51
0
 Аватар для RaiaNKnight
97 / 71 / 12
Регистрация: 29.06.2011
Сообщений: 465
Записей в блоге: 1
03.07.2012, 21:29
Весь файл в начале все равно нужно пробежать для того, чтобы построить систему для поиска в дальнейшем. Ведь необходимо как-то иметь доступ прямой к ip

Добавлено через 1 минуту
Цитата Сообщение от post_hack Посмотреть сообщение
Да. Строчки например такого вида:
Добавлено через 58 секунд
У меня идея. Скиньте ваш скайп, кажется знаю, какой алгоритм. В личку
1
Эксперт С++
 Аватар для Avazart
8484 / 6151 / 615
Регистрация: 10.12.2010
Сообщений: 28,683
Записей в блоге: 30
03.07.2012, 22:56
а в С++ к произвольной строке обратиться нельзя.
Если файл всего лишь один и весит не много, то почему бы его не грузить в начале работы в память?
А там обращайся к нему как хочиш...
Запихнуть все можно в multimap ну можно конечно еще хеш...
0
0 / 0 / 0
Регистрация: 03.07.2012
Сообщений: 7
07.07.2012, 16:05  [ТС]
Такой вопрос возник.. Как мне строку вида "192.168.0.1" преобразовать в u_long число?
Чтобы можно было корректно выполнить операцию &
0
 Аватар для dr.curse
404 / 360 / 36
Регистрация: 11.10.2010
Сообщений: 1,907
07.07.2012, 16:17
Цитата Сообщение от post_hack Посмотреть сообщение
Такой вопрос возник.. Как мне строку вида "192.168.0.1" преобразовать в u_long число?
Чтобы можно было корректно выполнить операцию &
post_hack, насколько знаю это делается по следующей формуле, если адрес имеет такой "a.b.c.d" вод то переводим так
C++
1
((a*256+b)*256+c)*256+d
1
0 / 0 / 0
Регистрация: 03.07.2012
Сообщений: 7
07.07.2012, 18:05  [ТС]
теперь возникла другая проблема.. критерий выбора наилучшего маршрута такой:
1) ип_из_2_файла & маска = 1_ип_в_строке_из_1_файла
то есть не обязательно ип_из_2_файла равен 1_ип_в_строке_из_1_файла

например у нас таблица 0.0.0.0 0.0.0.0 х.х.х.х
а ип из второго файла 10.10.0.0
маршрут х.х.х.х нам подойдет, т.к. 0.0.0.0 & 10.10.0.0 == 0.0.0.0

поэтому решение с хэшем и двоичным поиском не подходит. что делать?
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
07.07.2012, 18:05
Помогаю со студенческими работами здесь

Вывести куда-нибудь информацию, если в текстовом файле есть 2 одинаковых ip-адреса
Здравствуйте , у меня есть текстовый файл туда записываются данные ip адрес и mac и текущее время как мне вывести куда нибудь если в...

Поиск в текстовом файле последовательностей цифр по шаблону и последующий их поиск в именах файлов (с логом)
Уважаемые программисты и хорошие люди! К Вам обращается украинский юрист. Очень нужен bat-файл или скрипт, который решает такую задачу: ...

Копирование заданного файла на все компьютеры в сети, IP-адреса которых находятся в списке в текстовом файле
Доброго времени суток. Требовалось создать *.bat файл, который осуществит копирование файла по всем компьютерам IP адреса которых есть в...

Поиск в текстовом файле
Подскажите пожалуйста, как сделать поиск слова в текстовом файле, а потом вывести всю строку, где есть слово? в StringGrid. Само слово...

Поиск в текстовом файле
Имеется текстовый файл (файл.txt) Каждая строка (количество строк не известно) состоит из 2х букв и 3х цифр. Как оформить поиск такого...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
14
Ответ Создать тему
Новые блоги и статьи
http://iceja.net/ математические сервисы
iceja 20.01.2026
Обновила свой сайт http:/ / iceja. net/ , приделала Fast Fourier Transform экстраполяцию сигналов. Однако предсказывает далеко не каждый сигнал (см ограничения http:/ / iceja. net/ fourier/ docs ). Также. . .
http://iceja.net/ сервер решения полиномов
iceja 18.01.2026
Выкатила http:/ / iceja. net/ сервер решения полиномов (находит действительные корни полиномов методом Штурма). На сайте документация по API, но скажу прямо VPS слабенький и 200 000 полиномов. . .
Расчёт переходных процессов в цепи постоянного тока
igorrr37 16.01.2026
/ * Дана цепь постоянного тока с R, L, C, k(ключ), U, E, J. Программа составляет систему уравнений по 1 и 2 законам Кирхгофа, решает её и находит переходные токи и напряжения на элементах схемы. . . .
Восстановить юзерскрипты Greasemonkey из бэкапа браузера
damix 15.01.2026
Если восстановить из бэкапа профиль Firefox после переустановки винды, то список юзерскриптов в Greasemonkey будет пустым. Но восстановить их можно так. Для этого понадобится консольная утилита. . .
Сукцессия микоризы: основная теория в виде двух уравнений.
anaschu 11.01.2026
https:/ / rutube. ru/ video/ 7a537f578d808e67a3c6fd818a44a5c4/
WordPad для Windows 11
Jel 10.01.2026
WordPad для Windows 11 — это приложение, которое восстанавливает классический текстовый редактор WordPad в операционной системе Windows 11. После того как Microsoft исключила WordPad из. . .
Classic Notepad for Windows 11
Jel 10.01.2026
Old Classic Notepad for Windows 11 Приложение для Windows 11, позволяющее пользователям вернуть классическую версию текстового редактора «Блокнот» из Windows 10. Программа предоставляет более. . .
Почему дизайн решает?
Neotwalker 09.01.2026
В современном мире, где конкуренция за внимание потребителя достигла пика, дизайн становится мощным инструментом для успеха бренда. Это не просто красивый внешний вид продукта или сайта — это. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru