![]() 17 / 17 / 5
Регистрация: 13.12.2010
Сообщений: 61
|
|
Программа скачивает код заданной страницы, анализирует его, определяет заголовок страницы и ссылки на другие страницы10.10.2011, 18:33. Показов 5337. Ответов 9
Метки нет Все метки)
(
Подскажите в какую степь думать надо, где прочитать и т.д.
Сделать не прошу так как хочу сделать сам просто подскажите, хочу разобраться! Спасибо Задание: Нужно сделать приложение WinForms, которое на вход получает адрес веб-страницы и на основе этой информации строит дерево зависимостей страницы от других страниц. Программа также должна принимать на вход глубину поиска, игнорировать перекрестные ссылки и исключать повторяющиеся адреса, выводить результат в виде дерева с указанием адреса страницы и его заголовка. Также нужно предусмотреть опцию сохранения результатов работы в XML-файл. Например, программа скачивает код заданной страницы, анализирует его, определяет заголовок страницы и ссылки на другие страницы. После чего, для каждой из найденных ссылок операция повторяется. В результате на выходе мы получим дерево вида: -Test Title (http://www.test.com) ----Test1 Title (http://www.test1.com) --------Test11 Title (http://www.test11.com) ----Test2 (http://www.test2.com) -Test10 Title (http://www.test10.com)
0
|
10.10.2011, 18:33 | |
Ответы с готовыми решениями:
9
Переход на другие страницы в Firefox - адрес меняется, сами страницы - нет При открытии страницы в Google Chrome открываются другие страницы Включить другие страницы в базовый шаблон главной страницы |
![]() ![]() 17810 / 12961 / 3381
Регистрация: 17.09.2011
Сообщений: 21,250
|
|
10.10.2011, 18:36 | |
Думайте в степь классов System.Net.HttpWebRequest и System.Net.HttpWebResponse
Чтобы получить HTML страницы - это пара-тройка строчек кода. После получения думайте в степь System.Text.RegularExpressions.Regex Повторить думанья для каждой ссылки. Потом начинайте думать в степь контрола System.Windows.Forms.TreeView и класса System.Xml.Serialization.XmlSerializer Еще могу порекомендовать додуматься до простого класса или структурки - чтобы хранить информацию по каждой ссылке (заголовок + адрес). Особенно если все-таки надумаете использовать XmlSerializer Почитать обо всем можно на MSDN - просто вбивайте в поиск вышеприведенные классы и тыкайте на первый вариант в списке результатов.
1
|
![]() 179 / 180 / 55
Регистрация: 01.06.2011
Сообщений: 507
|
|
10.10.2011, 18:38 | |
1. Получание html кода страницы
2. Работа со строками (или через стандартные функции, или через регексы) 3. Работа с массивами, а лучше списками (добавление новых ссылок, и другой анализ) Как и просил, ничего не писал, помог определиться с областью поиска информации. Далеко ходить не надо, на форуме много раз всё обсуждалось Добавлено через 54 секунды блин, опередили ![]()
1
|
![]() 17 / 17 / 5
Регистрация: 13.12.2010
Сообщений: 61
|
||||||
11.10.2011, 23:42 [ТС] | ||||||
Сделал такую регулярку для поиска ссылок в HTML странице :
Добавлено через 22 минуты Предложите свою Регулярку для того чтобы вытащить из тега <a> </a> значение атрибута href
0
|
Администратор
![]() ![]() |
|
16.01.2014, 16:38 | |
pina4et, это бесплатный раздел. Если хотите задание за оплату, пишите во Фриланс
0
|
16.01.2014, 16:38 | |
Помогаю со студенческими работами здесь
10
Ссылки на другие страницы
Ссылки на другие страницы... и тиц Ссылки на другие страницы в таблице Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Опции темы | |
|
Новые блоги и статьи
![]() |
||||
Анализ и линтинг кода JavaScript: ESLint, Prettier и JSHint
run.dev 26.04.2025
JavaScript прошёл долгий путь от простого языка для анимации веб-страниц до основы современной веб-разработки. С ростом сложности приложений, увеличением кодовых баз и масштабированием команд. . .
|
Паттерны в Python: Singleton, Factory и Observer
py-thonny 26.04.2025
Паттерны проектирования — это проверенные временем решения типовых проблем разработки программного обеспечения. Их история берёт начало с книги "Приёмы объектно-ориентированного проектирования. . . .
|
Исключения в C#: Stack Overflow, Access Violation и Out of memory
stackOverflow 26.04.2025
Исключения в C# — это не только механизм оповещения о проблемах, а целое искусство управления потоком выполнения программы в экстремальных ситуациях. Обычное исключение, например,. . .
|
Логирование в C# ASP.NET Core с помощью Serilog, ElasticSearch, Kibana
stackOverflow 25.04.2025
Помните те времена, когда для анализа проблемы приходилось подключаться к серверу, искать нужный лог-файл среди десятков других и вручную фильтровать тысячи строк в поисках ошибки? К счастью, эти дни. . .
|
Структура "железный OnKeyUp" вместо антидребезга. Полностью асинхронный счётчик.
Hrethgir 25.04.2025
Программа для симуляции схемы - Logisim Evolution
В общем какое-то время отвлёкся, так было надо, теперь когда запилю это на verilog и FPGA , досоставлю заявку в ФИПС на полезную модель - не готов. . .
|
Автоматизация Amazon Web Services (AWS) с Boto3 в Python
py-thonny 25.04.2025
Облачные вычисления стали неотъемлемой частью современной ИТ-инфраструктуры, а Amazon Web Services (AWS) занимает лидирующие позиции среди провайдеров облачных услуг. Управление многочисленными. . .
|
Apache Kafka vs RabbitMQ в микросервисной архитектуре
ArchitectMsa 25.04.2025
Современная разработка ПО всё чаще склоняется к микросервисной архитектуре — подходу, при котором приложение разбивается на множество небольших, автономных сервисов. В этой распределённой среде. . .
|
Параллельное программирование с OpenMP в C++
NullReferenced 24.04.2025
Параллельное программирование — подход к созданию программ, когда одна задача разбивается на несколько подзадач, которые могут выполняться одновременно. Оно стало необходимым навыком для. . .
|
Цепочки методов в C# с Fluent API
UnmanagedCoder 24.04.2025
Современное программирование — это не только решение функциональных задач, но и создание кода, который удобно поддерживать, расширять и читать. Цепочки методов и Fluent-синтаксис в C# стали мощным. . .
|
Мульти-тенантные БД с PostgreSQL Row Security
Codd 23.04.2025
Современные облачные сервисы и бизнес-приложения всё чаще обслуживают множество клиентов в рамках единой программной инфраструктуры. Эта архитектурная модель, известная как мульти-тенантность, стала. . .
|