|
45 / 44 / 7
Регистрация: 15.10.2008
Сообщений: 320
|
|
Анализ текстового файла14.05.2010, 14:16. Показов 2540. Ответов 8
Метки нет (Все метки)
Прривет. имеется текстовый файл, который представляет из себя исходный код страницы сайта. Проанализировав его мне надо извлечь все ссылки имеющиеся там. Как это можно сделать? если можно с примерами кода.
Заранее спасибо Добавлено через 3 часа 47 минут В Java испльзуется replaceAll, в php strip_tags и многое другое. В C# нашел такую вещь Replace("<(\n)+?>",""). но почему то не помогло.
0
|
|
| 14.05.2010, 14:16 | |
|
Ответы с готовыми решениями:
8
Анализ текстового файла Анализ текстового файла и отображение в виде графической диаграммы, количества слов, в зависимости от их длины Анализ текстового файла |
|
1936 / 1048 / 109
Регистрация: 29.03.2010
Сообщений: 3,167
|
|||||||
| 14.05.2010, 17:18 | |||||||
0
|
|||||||
|
45 / 44 / 7
Регистрация: 15.10.2008
Сообщений: 320
|
|
| 14.05.2010, 17:33 [ТС] | |
|
l_a_m, я не совсем понял, он будет искать введенную мной ссылку или что? мне надо найти абсолютно все ссылки и затем сохранить в какое нибудь хранилище (база данных, но вопрос не в этом).
0
|
|
|
1936 / 1048 / 109
Регистрация: 29.03.2010
Сообщений: 3,167
|
||||||
| 14.05.2010, 17:38 | ||||||
|
ну собственно давай уже доделаем до конца твой проект, что ли... :-)
link is: http://google.com; title is: ссылка на гугл; link is: http://bing.com; title is: ссылка на бинг; и т.д. естественно при условии, что у вас где-то в вашем исходном коде, есть такой текст: <a href="http://google.com">ссылка на гугл</a> и т.д. ЗЫ: используйте регулярное выражение из этого примера, в предыдущем оно немножко не корректное, я только что заметил и поправил ЗЗЫ: с Вас 100грам и пончик ;-)
2
|
||||||
|
45 / 44 / 7
Регистрация: 15.10.2008
Сообщений: 320
|
||||||
| 14.05.2010, 18:15 [ТС] | ||||||
|
l_a_m, как мне тебя найти, чтобы передать это все ? :-)
Добавлено через 16 минут Еще один вопрос, если не против.
обрабатываемый файл я прикрепил
0
|
||||||
|
45 / 44 / 7
Регистрация: 15.10.2008
Сообщений: 320
|
|
| 14.05.2010, 18:17 [ТС] | |
|
вот файл в архиве
0
|
|
|
45 / 44 / 7
Регистрация: 15.10.2008
Сообщений: 320
|
||||||||||||||||
| 14.05.2010, 19:00 [ТС] | ||||||||||||||||
|
l_a_m, у меня не заходит в
Добавлено через 32 минуты l_a_m, изменил искомый формат
теперь в этом цикле первый раз проходит нормально, а последующие разы не проходит, жалуется на то что файл уже используется
0
|
||||||||||||||||
|
1936 / 1048 / 109
Регистрация: 29.03.2010
Сообщений: 3,167
|
||||||
| 15.05.2010, 23:24 | ||||||
|
посмотрел я Ваш файл, попробуйте использовать такое выражение:
0
|
||||||
|
45 / 44 / 7
Регистрация: 15.10.2008
Сообщений: 320
|
||||||
| 16.05.2010, 11:00 [ТС] | ||||||
|
l_a_m, видно все же это не правильная маска("href\\s*=\\s*["'](?<links>http://[\\w\\d\\.\\\\/=&?]*)), так он ничего не находит. и соответственно ничего не записывает.
Добавлено через 32 минуты Все тема закрыта. сделал вот таким вот образом
0
|
||||||
| 16.05.2010, 11:00 | |
|
Помогаю со студенческими работами здесь
9
Анализ текстового файла!
Анализ текстового файла
Нужно провести анализ текстового файла Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
|||
|
Отправка уведомления на почту при изменении наименования справочника
Maks 24.03.2026
Программная отправка письма электронной почты на примере изменения наименования справочника "Склады" в конфигурации БП3. Перед реализацией необходимо выполнить настройку системной учетной записи. . .
|
модель ЗдравоСохранения 5. Меньше увольнений- больше дохода!
anaschu 24.03.2026
Теперь система здравосохранения уменьшает количество увольнений.
9TO2GP2bpX4
a42b81fb172ffc12ca589c7898261ccb/
https:/ / rutube. ru/ video/ a42b81fb172ffc12ca589c7898261ccb/
Слева синяя линия -. . .
|
Midnight Chicago Blues
kumehtar 24.03.2026
Такой Midnight Chicago Blues, знаешь?. .
Когда вечерние улицы становятся ночными, а ты не можешь уснуть. Ты идёшь в любимый старый бар, и бармен наливает тебе виски. Ты смотришь на пролетающие. . .
|
Контроль уникальности заводского номера - вариант №2
Maks 24.03.2026
В отличие от предыдущего варианта добавлено прерывание циклов, также добавлены новые переменные для сохранения контекста ошибки перед прерыванием цикла:
Процедура ПередЗаписью(Отказ, РежимЗаписи,. . .
|
|
SDL3 для Desktop (MinGW): Вывод текста со шрифтом TTF с помощью библиотеки SDL3_ttf на Си и C++
8Observer8 24.03.2026
Содержание блога
Финальные проекты на Си и на C++:
finish-text-sdl3-c. zip
finish-text-sdl3-cpp. zip
|
Жизнь в неопределённости
kumehtar 23.03.2026
Жизнь — это постоянное существование в неопределённости. Например, даже если у тебя есть список дел, невозможно дойти до точки, где всё окончательно завершено и больше ничего не осталось. В принципе,. . .
|
Модель здравоСохранения: работники работают быстрее после её введения.
anaschu 23.03.2026
geJalZw1fLo
Корпорация до введения программа здравоохранения имела много невыполненных работниками заданий, после введения программы количество заданий выросло.
Но на выплатах по больничным это. . .
|
Контроль уникальности заводского номера - вариант №1
Maks 23.03.2026
Алгоритм контроля уникальности заводского (или серийного) номера на примере документа выдачи шин для спецтехники с табличной частью в конфигурации КА2. Данные берутся из регистра сведений, по. . .
|