С Новым годом! Форум программистов, компьютерный форум, киберфорум
C# для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 5.00/11: Рейтинг темы: голосов - 11, средняя оценка - 5.00
 Аватар для siriusED
32 / 31 / 13
Регистрация: 20.05.2010
Сообщений: 705
.NET 4.x

Как спарсить DOM-дерево + все js скрипты из страницы firefox

12.02.2014, 22:57. Показов 2374. Ответов 5
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Впринцепе я даже не уверен что это вопрос по теме раздела, но:

Задача такая, есть страница в firefox, в ней если смотреть через "Firebug" то там в разделе "Script" я могу посмотреть всё загруженные скрипты с их внутренние коды, или просто через поиск найти нужную мне строчку во всех кодах всех скриптов.

Вопросы:
Возможно ли такое реализовать во обще как стороннее приложение\скрипт?
Можно ли такое реализовать через C#? И если нет, то через какой язык лучше всего это реализовать?
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
12.02.2014, 22:57
Ответы с готовыми решениями:

Написать скрипт, рекурсивно обходящий дерево DOM страницы dom.html, начиная от корня DOM
Написать скрипт на языке JavaScript, рекурсивно обходящий дерево DOM страницы dom.html, начиная от корня DOM (объект document). ...

Как скопировать (спарсить) DOM страницы?
ИСПОЛЬЗУЕТСЯ: WebDriver, С#, Google chrome ВОПРОС 1. Как скопировать (спарсить) DOM страницы?

Как получить код страницы, после того, как все скрипты данной страницы отработают, и выдадут все результаты?
Добрый день! Хотелось бы узнать, как получить код страницы, после того как все скрипты, данной страницы, отработают и выдадут все...

5
Master of Orion
Эксперт .NET
 Аватар для Psilon
6101 / 4957 / 905
Регистрация: 10.07.2011
Сообщений: 14,522
Записей в блоге: 5
12.02.2014, 23:37
siriusED, в страничке все что начинается с function или блока script language или script type - берется и выдирается регуляркой...
0
 Аватар для siriusED
32 / 31 / 13
Регистрация: 20.05.2010
Сообщений: 705
12.02.2014, 23:48  [ТС]
Я не про блоки я про сами файлы *.js которые грузятся вместе со страницей, и потом на странице пишется ссылка типа javascript:void(0) и при нажатии на эту ссылку выполняется функция в этих js скриптах в них же находится нужная мне строка. Вот через Firebug я нахожу эту строку в этих файлах, вот как такой поиск реализовать через C# или какой-то другой язык?
0
Master of Orion
Эксперт .NET
 Аватар для Psilon
6101 / 4957 / 905
Регистрация: 10.07.2011
Сообщений: 14,522
Записей в блоге: 5
12.02.2014, 23:49
siriusED, ну так в начале страницы написаны все js файлы, откуда берутся скрипты. Берете, загружаете файлы по этим ссылкам и смотрите...
0
 Аватар для siriusED
32 / 31 / 13
Регистрация: 20.05.2010
Сообщений: 705
13.02.2014, 02:28  [ТС]
Да они как то походу генерятся уже самой страницей, там на ней скриптов просто миллионы.. Но попробую по этому методу посмотреть, хотя врядле прокатит, уж очень там сильно намучено...

Добавлено через 27 минут
И кстати может быть сама firefox эти скрипты где то хранит? Не вкурсе?

Добавлено через 1 час 55 минут
Короче я разобрался как там намучено...
Во общем когда пользователь жмёт по ссылке - джава сценарий на странице качает дополнительный .js скрипт и только после скачки выполняется функция из этого скачанного скрипта.

Во общем теперь вопрос в том как получить программный доступ к кешу мозилы, что б оттуда вырезать ссылку на этот дополнительный скрипт в котором и лежит нужная мне строчка(собственно всё тело этого скрипта это нужная мне строка) Ссылка в кеше мозилы тоже есть, проверял (about:cache?device=disk)
0
Master of Orion
Эксперт .NET
 Аватар для Psilon
6101 / 4957 / 905
Регистрация: 10.07.2011
Сообщений: 14,522
Записей в блоге: 5
13.02.2014, 10:17
siriusED, я же уже сказал, если неохота париться, просто качаем сами этот скрипт (а не берем из кэша), благо они весят не так уж много, и все.

Добавлено через 1 минуту
Программа на шарпе - не файрфокс же, у вас нету этого кэша. Как до него можно достучаться - не знаю, если честно.
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
13.02.2014, 10:17
Помогаю со студенческими работами здесь

Dom структура Html страницы с возможностью выполнять java-скрипты
Всем Привет. У меня возник такой вопрос. Можно ли средствами c# создать dom html страницы, с возможностью выполнять javascript'ы...

Написать JavaScript, который рекурсивно обходит дерево DOM страницы change.html
Написать скрипт на языке JavaScript, рекурсивно обходящий дерево DOM страницы change.html, начиная от корня DOM (объект document)....

Спарсить все используемые ресурсы страницы
И так задача: спарсить все используемые ресурсы страницы(!), а именно: img, css, js. Собственно казалось бы ничего сложного, но метод...

Вырезать все скрипты из HTML страницы и вернуть обратно
Необходимо вырезать все скрипты из HTML страницы и вернуть обратно. Между этими операциями проходит форматирование кода страницы: убираются...

Как спарсить значение в с web страницы
Доброго времени суток. Есть страница ( клик ) , мне нужно спарсить последнюю цену ( самую верхнюю ) , например сейчас она 0.49 рублей. Мне...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
6
Ответ Создать тему
Новые блоги и статьи
Модель микоризы: классовый агентный подход
anaschu 02.01.2026
Раньше это было два гриба и бактерия. Теперь три гриба, растение. И на уровне агентов добавится между грибами или бактериями взаимодействий. До того я пробовал подход через многомерные массивы,. . .
Учёным и волонтёрам проекта «Einstein@home» удалось обнаружить четыре гамма-лучевых пульсара в джете Млечного Пути
Programma_Boinc 01.01.2026
Учёным и волонтёрам проекта «Einstein@home» удалось обнаружить четыре гамма-лучевых пульсара в джете Млечного Пути Сочетание глобально распределённой вычислительной мощности и инновационных. . .
Советы по крайней бережливости. Внимание, это ОЧЕНЬ длинный пост.
Programma_Boinc 28.12.2025
Советы по крайней бережливости. Внимание, это ОЧЕНЬ длинный пост. Налог на собак: https:/ / **********/ gallery/ V06K53e Финансовый отчет в Excel: https:/ / **********/ gallery/ bKBkQFf Пост отсюда. . .
Кто-нибудь знает, где можно бесплатно получить настольный компьютер или ноутбук? США.
Programma_Boinc 26.12.2025
Нашел на реддите интересную статью под названием Anyone know where to get a free Desktop or Laptop? Ниже её машинный перевод. После долгих разбирательств я наконец-то вернула себе. . .
Thinkpad X220 Tablet — это лучший бюджетный ноутбук для учёбы, точка.
Programma_Boinc 23.12.2025
Рецензия / Мнение/ Перевод Нашел на реддите интересную статью под названием The Thinkpad X220 Tablet is the best budget school laptop period . Ниже её машинный перевод. Thinkpad X220 Tablet —. . .
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта Симптом: После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
Как объединить две одинаковые БД Access с разными данными
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
Новый ноутбук
volvo 07.12.2025
Всем привет. По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне: Ryzen 5 7533HS 64 Gb DDR5 1Tb NVMe 16" Full HD Display Win11 Pro
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru