|
17 / 22 / 6
Регистрация: 16.10.2013
Сообщений: 316
|
|
Как получить все Hrefs веб странички?25.10.2013, 10:03. Показов 2905. Ответов 24
Метки нет (Все метки)
ПОлучаю веб страничку, построчно считываю и закибываю в файл.
Хочу во время этого дела вырезатьвсе ссылки но не пойму как это реализовать, какими средствами? То есть я смотрю каждую строку и если нахожу <a href></a> то получаю значение href Как єто сделать с помошью регулярок
0
|
|
| 25.10.2013, 10:03 | |
|
Ответы с готовыми решениями:
24
С веб-странички записывает в базу кракозябры, если ввожу данные на русском, на англ. - все отлично Как получить html-код странички в переменную string Как заставить Яшку проиндексить все странички? |
|
57 / 57 / 12
Регистрация: 11.02.2013
Сообщений: 132
|
|||||||||||
| 25.10.2013, 11:57 | |||||||||||
|
если у нас в тексте будет идти просто ссилка...например
то можна поспользоватеся простой конструкцией ![]()
1
|
|||||||||||
|
17 / 22 / 6
Регистрация: 16.10.2013
Сообщений: 316
|
||
| 25.10.2013, 12:20 [ТС] | ||
|
МНе надо получить главную страницу сайта. Далее получить все ссілки на внутряк. НА всех внутренних страницах так же паолучить ссілки. То есть получиться такое себе дерево. Например только до третего уровня вложености получу ссылки. Вот такая задача...
0
|
||
|
2000 / 1427 / 92
Регистрация: 25.11.2010
Сообщений: 3,611
|
||
| 25.10.2013, 12:25 | ||
Сообщение было отмечено как решение
РешениеИскать надо <\s*a\s+href\s*=\s*"([^\"]+?)". Писал навскидку, могу ошибаться.
3
|
||
|
17 / 22 / 6
Регистрация: 16.10.2013
Сообщений: 316
|
||
| 25.10.2013, 12:47 [ТС] | ||
|
Но как из текста вырезать именно то, что мне надо? текст текст текст <a href="some link"></a> текс текст текст... На выходе надо получить = some link
0
|
||
|
57 / 57 / 12
Регистрация: 11.02.2013
Сообщений: 132
|
||
| 25.10.2013, 13:15 | ||
|
я так понимаю патерн должен уже возвращать то что нужно(если им парвельно воспользоваться
) ибо толку от него если он возвратит
1
|
||
|
17 / 22 / 6
Регистрация: 16.10.2013
Сообщений: 316
|
||
| 25.10.2013, 13:26 [ТС] | ||
|
прмер кода? Пусть будет String str = "111111111111<a href="http://google.ru">sdfdsklfklsdfm</a>"; как мне получить http://google.ru ?
0
|
||
|
57 / 57 / 12
Регистрация: 11.02.2013
Сообщений: 132
|
|
| 25.10.2013, 13:33 | |
|
это вопрос к Skipy, самому интересно
0
|
|
|
2000 / 1427 / 92
Регистрация: 25.11.2010
Сообщений: 3,611
|
||||||
| 25.10.2013, 14:38 | ||||||
|
Ну я же скобочки поставил! Matcher.group(1) - это то, что в скобках.
2
|
||||||
|
17 / 22 / 6
Регистрация: 16.10.2013
Сообщений: 316
|
||
| 25.10.2013, 15:51 [ТС] | ||
|
или если поставлбю как должно быть <a href="http://google.ru"> без "\" Exception in thread "main" java.lang.Error: Unresolved compilation problems: Syntax error, insert ";" to complete BlockStatements Syntax error, insert "AssignmentOperator Expression" to complete Assignment Syntax error, insert ";" to complete Statement Pattern cannot be resolved to a variable p cannot be resolved to a variable p cannot be resolved
0
|
||
|
57 / 57 / 12
Регистрация: 11.02.2013
Сообщений: 132
|
||||||
| 25.10.2013, 17:57 | ||||||
|
символы '\' поставлены только для патерна, так как в строке чтоб написать символ " перед ним нужно поставить \, потому что символ " это конец строки, чтоб явно указать что это не конец строки а в тексте будет символ " то перед ним ставится\
Если в файле у вас будет строка
0
|
||||||
|
17 / 22 / 6
Регистрация: 16.10.2013
Сообщений: 316
|
|||||||
| 25.10.2013, 19:32 [ТС] | |||||||
|
И фиг его знает, что там вебмастер написал и как. МОжет он 100500 кавычек поставит. Задача найти хрефс и вырезать, а не бекслешы расставить там где хрефс (вручную) и потом вырезать ))))))) Добавлено через 1 минуту вот для примера
0
|
|||||||
|
57 / 57 / 12
Регистрация: 11.02.2013
Сообщений: 132
|
||||||||||||
| 25.10.2013, 20:40 | ||||||||||||
|
ты не понял
String line = ?; напишы в line что-то, что когда я вызову
1
|
||||||||||||
|
17 / 22 / 6
Регистрация: 16.10.2013
Сообщений: 316
|
||
| 26.10.2013, 10:49 [ТС] | ||
|
Я могу хоть сотню различных языков использовать в каждом теге по ошибке сделать и ни один из них не закрыть, страница все равно будет отображена в браузере. Спасибо, но больше не хочу ваших советов....я как то не вижу в них логики и смысловой нагрузки. Или давайте ответ по делу или прошу пропустить эту тема и все мои последующие темы! Заранее спасибо, что Вы мне больше никогда не ответите.
0
|
||
| 26.10.2013, 11:56 | ||
|
Не по теме:
0
|
||
|
17 / 22 / 6
Регистрация: 16.10.2013
Сообщений: 316
|
||
| 26.10.2013, 12:10 [ТС] | ||
|
Так как я со своим 3х недельным опытом программирования на джава не смог этого сделать, то создал здесь тему. И меня интересует только этот вопрос, а не кавычки. Нельзя использовать стринг!? ТОгда где совет на что его заменить?
0
|
||
| 26.10.2013, 16:22 | |
|
0
|
|
|
2000 / 1427 / 92
Регистрация: 25.11.2010
Сообщений: 3,611
|
||
| 28.10.2013, 11:01 | ||
|
0
|
||
|
6 / 6 / 1
Регистрация: 15.09.2013
Сообщений: 149
|
||
| 28.10.2013, 11:06 | ||
|
Вот мою темку глянь там использую jsoup. Очень удобная штука,кстати. Поисковый двигатель ^Тема
1
|
||
| 28.10.2013, 11:06 | |
|
Помогаю со студенческими работами здесь
20
Почему не выводит метки веб-странички? Получить все ссылки с веб-страницы по webbrowser
Получить информацию с другой странички сайта Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
| Опции темы | |
|
|
Новые блоги и статьи
|
|||
|
Отчёт о затраченных материалах за определенный период с макетом печатной формы
Maks 21.04.2026
Отчёт из решения ниже размещён в конфигурации КА2.
Задача: разработка отчёта по затраченным материалам за определённый период, с возможностью вывода печатной формы отчёта с шапкой и подвалом.
В. . .
|
Отчёт о спецтехнике находящейся в ремонте
Maks 20.04.2026
Отчёт из решения ниже размещен в конфигурации КА2.
Задача: отобразить спецтехнику, которая на данный момент находится в ремонте.
Есть нетиповой документ "Заявка на ремонт спецтехники" который. . .
|
Памятка для бота и "визитка" для читателей "Semantic Universe Layer (Слой семантической вселенной)"
Hrethgir 19.04.2026
Сгенерировано для краткого описания по случаю сборки и компиляции скелета серверного приложения. И пусть после этого скажут, что статьи сгенерированные AI - туфта и не интересно. И это не реклама -. . .
|
Запрет удаления строк ТЧ документа при определённом условии
Maks 19.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "Аккумуляторы", разработанного в конфигурации КА2. У данного документа есть ТЧ, в которой в зависимости от прав доступа. . .
|
|
Модель заражения группы наркоманов
alhaos 17.04.2026
Условия задачи сформулированы тут
Суть:
- Группа наркоманов из 10 человек.
- Только один инфицирован ВИЧ.
- Колются одной иглой.
- Колются раз в день.
- Колются последовательно через. . .
|
Мысли в слух. Про "навсегда".
kumehtar 16.04.2026
Подумалось тут, что наверное очень глупо использовать во всяких своих установках понятие "навсегда". Это очень сильное понятие, и я только начинаю понимать край его смысла, не смотря на то что давно. . .
|
My Business CRM
MaGz GoLd 16.04.2026
Всем привет, недавно возникла потребность создать CRM, для личных нужд. Собственно программа предоставляет из себя базу данных клиентов, в которой можно фиксировать звонки, стадии сделки, а также. . .
|
Знаешь почему 90% людей редко бывают счастливыми?
kumehtar 14.04.2026
Потому что они ждут. Ждут выходных, ждут отпуска, ждут удачного момента. . .
а удачный момент так и не приходит.
|