Форум программистов, компьютерный форум, киберфорум
C# .NET
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.54/13: Рейтинг темы: голосов - 13, средняя оценка - 4.54
 Аватар для body90
467 / 344 / 19
Регистрация: 26.05.2009
Сообщений: 2,696

Проверки URL в HTML

27.05.2011, 02:53. Показов 2387. Ответов 3
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Здравствуйте! Есть HTML страницы, хранящиеся на жестком диске. Все ссылки на "свой же сайт" относительны. Остальные (ссылки на сторонние сайты типа рекламы) абсолютные. Как оптимально проверить относительные ссылки на превильность?
0
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
27.05.2011, 02:53
Ответы с готовыми решениями:

Поиск url в html
Приветствую всех. помогите справиться с проблемкой. Никак не могу подобрать регулярное выражение для выдергивания всех линков вида <a...

xmlhttp и asphttp для проверки правильности URL
Народ, может кто использовал xmlhttp или asphttp для проверки правильности (корректности) URL сайта, не кинете кусочек кода? С уважением,...

Реализовать функцию проверки правильности html-тэгов в html-документе
нужно реализовать функцию на с++.Долго сидел,понять не могу.

3
 Аватар для body90
467 / 344 / 19
Регистрация: 26.05.2009
Сообщений: 2,696
28.05.2011, 14:04  [ТС]
Неужели нет никаких идей?
0
 Аватар для cpentyc
48 / 47 / 4
Регистрация: 26.05.2010
Сообщений: 230
28.05.2011, 19:39
я знаю одного чела который смог бы помоч но к сожелению для тебя это ты)))
1
68 / 66 / 19
Регистрация: 27.12.2008
Сообщений: 212
28.05.2011, 20:10
Вот так можно:

C#
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
//подключить регулярные выражения
using System.Text.RegularExpressions;
 
//установить адрес корневой папки сайта
String basePath = "d://example";
 
//проверить интересующие страницы, передавая их путь
checkPage("d://example/index.php");
 
 private void checkPage(String path)
        {
            //взять содержимое страницы
            String page = System.IO.File.ReadAllText(path, Encoding.Default);
 
            //найти все ее ссылки
            MatchCollection matches = Regex.Matches(page, "href=\"([^\"]+)\"", RegexOptions.Singleline | RegexOptions.IgnoreCase);
 
            //перебрать ссылки
            foreach (Match match in matches)
            {
 
                String url = match.Groups[1].Value;
 
                //если она не абсолютная (возможно, стоит проверять по другому)))
                if (!Regex.Match(url, "://").Success)
                {
                    //установить путь к странице (по умолчанию та же папка что у проверяемой страницы)
                    string pathCurrentPage = System.IO.Path.GetDirectoryName(path);
 
 
                    //если путь от базового адреса, то добавить его к базовому адресу (такая вот тавтология)
                    if (url[0] == '/')
                    {
                        pathCurrentPage = basePath + url;
                    }
                    else
                    {
                        //удалить из пути столько папок, сколько раз встречается "../"
                        while (url.Substring(0, 2) == "..")
                        {
                            //убрать одну папку из текущего пути страницы
                            pathCurrentPage = System.IO.Path.GetDirectoryName(pathCurrentPage);
                            url = url.Substring(3);
                        }
                        //добавить оставшийся путь к текущему
                        pathCurrentPage += "/" + url;
                    }
                    //собственно проверка
                    Boolean goodUrl = System.IO.File.Exists(pathCurrentPage);
                    if (!goodUrl)
                    {
                        Console.Write("\nФайл не найден: адрес = " + pathCurrentPage + " (получен из  " + match.Groups[1].Value + ")");
                    }
 
 
                }
 
            }
        }
1
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
28.05.2011, 20:10
Помогаю со студенческими работами здесь

Punycode для проверки URL (CMS)
Привет! Ребят, что-то запутался.. Наткнулся в просторах инет на такой скрипт: http://artdev.org/skript-opredeleniya-cms.html В...

.html в конце URL
Добрый вечер! Столкнулся с проблемой, в конце URL .html, как его убрать ?

Чтение html из url
последний раз в builder`e лабал давно, и изрядно подзабыл вопрос - как подключиться к инету и прочитать страницу? помню, есть там...

Изменить html через URL
Всем привет, я тут новенький. Вот уже и утро настало, а я никак не могу решить свою проблему :( Суть проблемы такова: Есть определенная...

Вырезать url из динамической html
Доброго всем! Сделал собственный парсер погоды их XML от гистметео, но хочется еще и иконку текуего состояния иметь! Сейчас мне...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
4
Ответ Создать тему
Новые блоги и статьи
Символьное дифференцирование
igorrr37 13.02.2026
/ * Логарифм записывается как: (x-2)log(x^2+2) - означает логарифм (x^2+2) по основанию (x-2). Унарный минус обозначается как ! в-строка - входное арифметическое выражение в инфиксной(обычной). . .
Камера Toupcam IUA500KMA
Eddy_Em 12.02.2026
Т. к. у всяких "хикроботов" слишком уж мелкий пиксель, для подсмотра в ESPriF они вообще плохо годятся: уже 14 величину можно рассмотреть еле-еле лишь на экспозициях под 3 секунды (а то и больше),. . .
И ясному Солнцу
zbw 12.02.2026
И ясному Солнцу, и светлой Луне. В мире покоя нет и люди не могут жить в тишине. А жить им немного лет.
«Знание-Сила»
zbw 12.02.2026
«Знание-Сила» «Время-Деньги» «Деньги -Пуля»
SDL3 для Web (WebAssembly): Подключение Box2D v3, физика и отрисовка коллайдеров
8Observer8 12.02.2026
Содержание блога Box2D - это библиотека для 2D физики для анимаций и игр. С её помощью можно определять были ли коллизии между конкретными объектами и вызывать обработчики событий столкновения. . . .
SDL3 для Web (WebAssembly): Загрузка PNG с прозрачным фоном с помощью SDL_LoadPNG (без SDL3_image)
8Observer8 11.02.2026
Содержание блога Библиотека SDL3 содержит встроенные инструменты для базовой работы с изображениями - без использования библиотеки SDL3_image. Пошагово создадим проект для загрузки изображения. . .
SDL3 для Web (WebAssembly): Загрузка PNG с прозрачным фоном с помощью SDL3_image
8Observer8 10.02.2026
Содержание блога Библиотека SDL3_image содержит инструменты для расширенной работы с изображениями. Пошагово создадим проект для загрузки изображения формата PNG с альфа-каналом (с прозрачным. . .
Установка Qt-версии Lazarus IDE в Debian Trixie Xfce
volvo 10.02.2026
В общем, достали меня глюки IDE Лазаруса, собранной с использованием набора виджетов Gtk2 (конкретно: если набирать текст в редакторе и вызвать подсказку через Ctrl+Space, то после закрытия окошка. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru