|
17 / 22 / 6
Регистрация: 16.10.2013
Сообщений: 316
|
|
Как получить все Hrefs веб странички?25.10.2013, 10:03. Показов 2812. Ответов 24
Метки нет (Все метки)
ПОлучаю веб страничку, построчно считываю и закибываю в файл.
Хочу во время этого дела вырезатьвсе ссылки но не пойму как это реализовать, какими средствами? То есть я смотрю каждую строку и если нахожу <a href></a> то получаю значение href Как єто сделать с помошью регулярок
0
|
|
| 25.10.2013, 10:03 | |
|
Ответы с готовыми решениями:
24
С веб-странички записывает в базу кракозябры, если ввожу данные на русском, на англ. - все отлично Как получить html-код странички в переменную string Как заставить Яшку проиндексить все странички? |
|
57 / 57 / 12
Регистрация: 11.02.2013
Сообщений: 132
|
|||||||||||
| 25.10.2013, 11:57 | |||||||||||
|
если у нас в тексте будет идти просто ссилка...например
то можна поспользоватеся простой конструкцией ![]()
1
|
|||||||||||
|
17 / 22 / 6
Регистрация: 16.10.2013
Сообщений: 316
|
||
| 25.10.2013, 12:20 [ТС] | ||
|
МНе надо получить главную страницу сайта. Далее получить все ссілки на внутряк. НА всех внутренних страницах так же паолучить ссілки. То есть получиться такое себе дерево. Например только до третего уровня вложености получу ссылки. Вот такая задача...
0
|
||
|
2000 / 1427 / 92
Регистрация: 25.11.2010
Сообщений: 3,611
|
||
| 25.10.2013, 12:25 | ||
Сообщение было отмечено как решение
РешениеИскать надо <\s*a\s+href\s*=\s*"([^\"]+?)". Писал навскидку, могу ошибаться.
3
|
||
|
17 / 22 / 6
Регистрация: 16.10.2013
Сообщений: 316
|
||
| 25.10.2013, 12:47 [ТС] | ||
|
Но как из текста вырезать именно то, что мне надо? текст текст текст <a href="some link"></a> текс текст текст... На выходе надо получить = some link
0
|
||
|
57 / 57 / 12
Регистрация: 11.02.2013
Сообщений: 132
|
||
| 25.10.2013, 13:15 | ||
|
я так понимаю патерн должен уже возвращать то что нужно(если им парвельно воспользоваться
) ибо толку от него если он возвратит
1
|
||
|
17 / 22 / 6
Регистрация: 16.10.2013
Сообщений: 316
|
||
| 25.10.2013, 13:26 [ТС] | ||
|
прмер кода? Пусть будет String str = "111111111111<a href="http://google.ru">sdfdsklfklsdfm</a>"; как мне получить http://google.ru ?
0
|
||
|
57 / 57 / 12
Регистрация: 11.02.2013
Сообщений: 132
|
|
| 25.10.2013, 13:33 | |
|
это вопрос к Skipy, самому интересно
0
|
|
|
2000 / 1427 / 92
Регистрация: 25.11.2010
Сообщений: 3,611
|
||||||
| 25.10.2013, 14:38 | ||||||
|
Ну я же скобочки поставил! Matcher.group(1) - это то, что в скобках.
2
|
||||||
|
17 / 22 / 6
Регистрация: 16.10.2013
Сообщений: 316
|
||
| 25.10.2013, 15:51 [ТС] | ||
|
или если поставлбю как должно быть <a href="http://google.ru"> без "\" Exception in thread "main" java.lang.Error: Unresolved compilation problems: Syntax error, insert ";" to complete BlockStatements Syntax error, insert "AssignmentOperator Expression" to complete Assignment Syntax error, insert ";" to complete Statement Pattern cannot be resolved to a variable p cannot be resolved to a variable p cannot be resolved
0
|
||
|
57 / 57 / 12
Регистрация: 11.02.2013
Сообщений: 132
|
||||||
| 25.10.2013, 17:57 | ||||||
|
символы '\' поставлены только для патерна, так как в строке чтоб написать символ " перед ним нужно поставить \, потому что символ " это конец строки, чтоб явно указать что это не конец строки а в тексте будет символ " то перед ним ставится\
Если в файле у вас будет строка
0
|
||||||
|
17 / 22 / 6
Регистрация: 16.10.2013
Сообщений: 316
|
|||||||
| 25.10.2013, 19:32 [ТС] | |||||||
|
И фиг его знает, что там вебмастер написал и как. МОжет он 100500 кавычек поставит. Задача найти хрефс и вырезать, а не бекслешы расставить там где хрефс (вручную) и потом вырезать ))))))) Добавлено через 1 минуту вот для примера
0
|
|||||||
|
57 / 57 / 12
Регистрация: 11.02.2013
Сообщений: 132
|
||||||||||||
| 25.10.2013, 20:40 | ||||||||||||
|
ты не понял
String line = ?; напишы в line что-то, что когда я вызову
1
|
||||||||||||
|
17 / 22 / 6
Регистрация: 16.10.2013
Сообщений: 316
|
||
| 26.10.2013, 10:49 [ТС] | ||
|
Я могу хоть сотню различных языков использовать в каждом теге по ошибке сделать и ни один из них не закрыть, страница все равно будет отображена в браузере. Спасибо, но больше не хочу ваших советов....я как то не вижу в них логики и смысловой нагрузки. Или давайте ответ по делу или прошу пропустить эту тема и все мои последующие темы! Заранее спасибо, что Вы мне больше никогда не ответите.
0
|
||
| 26.10.2013, 11:56 | ||
|
Не по теме:
0
|
||
|
17 / 22 / 6
Регистрация: 16.10.2013
Сообщений: 316
|
||
| 26.10.2013, 12:10 [ТС] | ||
|
Так как я со своим 3х недельным опытом программирования на джава не смог этого сделать, то создал здесь тему. И меня интересует только этот вопрос, а не кавычки. Нельзя использовать стринг!? ТОгда где совет на что его заменить?
0
|
||
| 26.10.2013, 16:22 | |
|
0
|
|
|
2000 / 1427 / 92
Регистрация: 25.11.2010
Сообщений: 3,611
|
||
| 28.10.2013, 11:01 | ||
|
0
|
||
|
6 / 6 / 1
Регистрация: 15.09.2013
Сообщений: 149
|
||
| 28.10.2013, 11:06 | ||
|
Вот мою темку глянь там использую jsoup. Очень удобная штука,кстати. Поисковый двигатель ^Тема
1
|
||
| 28.10.2013, 11:06 | |
|
Помогаю со студенческими работами здесь
20
Почему не выводит метки веб-странички? Получить все ссылки с веб-страницы по webbrowser
Получить информацию с другой странички сайта Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
|||
|
http://iceja.net/ математические сервисы
iceja 20.01.2026
Обновила свой сайт http:/ / iceja. net/ , приделала Fast Fourier Transform экстраполяцию сигналов. Однако предсказывает далеко не каждый сигнал (см ограничения http:/ / iceja. net/ fourier/ docs ). Также. . .
|
http://iceja.net/ сервер решения полиномов
iceja 18.01.2026
Выкатила http:/ / iceja. net/ сервер решения полиномов (находит действительные корни полиномов методом Штурма).
На сайте документация по API, но скажу прямо VPS слабенький и 200 000 полиномов. . .
|
Расчёт переходных процессов в цепи постоянного тока
igorrr37 16.01.2026
/ *
Дана цепь(не выше 3-го порядка) постоянного тока с элементами R, L, C, k(ключ), U, E, J. Программа находит переходные токи
и напряжения на элементах схемы классическим методом(1 и 2 з-ны. . .
|
Восстановить юзерскрипты Greasemonkey из бэкапа браузера
damix 15.01.2026
Если восстановить из бэкапа профиль Firefox после переустановки винды, то список юзерскриптов в Greasemonkey будет пустым.
Но восстановить их можно так.
Для этого понадобится консольная утилита. . .
|
|
Сукцессия микоризы: основная теория в виде двух уравнений.
anaschu 11.01.2026
https:/ / rutube. ru/ video/ 7a537f578d808e67a3c6fd818a44a5c4/
|
WordPad для Windows 11
Jel 10.01.2026
WordPad для Windows 11
— это приложение, которое восстанавливает классический текстовый редактор WordPad в операционной системе Windows 11. После того как Microsoft исключила WordPad из. . .
|
Classic Notepad for Windows 11
Jel 10.01.2026
Old Classic Notepad for Windows 11
Приложение для Windows 11, позволяющее пользователям вернуть классическую версию текстового редактора «Блокнот» из Windows 10. Программа предоставляет более. . .
|
Почему дизайн решает?
Neotwalker 09.01.2026
В современном мире, где конкуренция за внимание потребителя достигла пика, дизайн становится мощным инструментом для успеха бренда. Это не просто красивый внешний вид продукта или сайта — это. . .
|