0 / 0 / 0
Регистрация: 20.07.2014
Сообщений: 13
|
|
1 | |
Получение внутренних ссылок из HTML30.11.2016, 12:26. Показов 1947. Ответов 5
Метки нет (Все метки)
Здравствуйте. Делаю генерацию карты сайта (по ссылке). И нужно собрать все внутренние ссылки с сайта. Может кто-то знает регулярное выражение или уже какое-то готовое решение для получения именно внутренних ссылок.
Заранее спасибо)
0
|
30.11.2016, 12:26 | |
Ответы с готовыми решениями:
5
Парсинг внутренних ссылок Парсинг внутренних ссылок Получение ссылок с HTML страницы Стоимость ссылок на внутренних? |
Администратор
|
|
30.11.2016, 23:58 | 2 |
иванзар, я бы не стал использовать регулярные выражения. Лучше взять специализированную библиотеку для работы с HTML - HtmlAgilityPack или AngleSharp. С их помощью выбрать все элементы <a> с атрибутом href. Затем нормализовать каждую ссылку и оставить только те которые которые указывают на текущий сайт.
0
|
Администратор
|
|
01.12.2016, 00:50 | 4 |
Avazart, тем что HTML не имеет регулярной структуры и поэтому его тяжело парсить регулярными выражениями. В то время как специализированные библиотеки позволяют работать с HTML через DOM, xpath и css-селекторы.
Добавлено через 9 минут См. также Parsing Html The Cthulhu Way
1
|
Администратор
|
|
01.12.2016, 11:19 | 6 |
Avazart, ни в чем. Просто на мой взгляд xpath
//a[@href] или css селектор a[href] являются более выразительными и понятными чем регулярное выражение.
1
|
01.12.2016, 11:19 | |
01.12.2016, 11:19 | |
Помогаю со студенческими работами здесь
6
PR внутренних ссылок в SAPE Количество внутренних ссылок Выбор внутренних ссылок Индексация ненужных внутренних ссылок Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |