Форум программистов, компьютерный форум, киберфорум
C# для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.82/11: Рейтинг темы: голосов - 11, средняя оценка - 4.82
 Аватар для Jesterru
3 / 2 / 2
Регистрация: 19.06.2016
Сообщений: 299

Парсинг данных с сайта

14.04.2018, 22:53. Показов 2378. Ответов 12
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Добрый вечер, есть проблема :

Мне надо парсить количество поставленных денег на каждую из команд на на данном сайте (del).
Дело в том, что если просто скачать html (С помощью WebClient.DownloadString(); ), то нужные параметры всегда будут равны нулю. Как мне получить реальные значения на момент парсинга? Встречал много таких сайтов, информацию с которых так просто не запарсишь, но ответа на вопрос Почему? не получил

Добавлено через 7 минут
К сожалению, выглядит как реклама, простите уж, но мне интересно узнать саму причину того, почему я не могу запарсить данные и как это правильно делать
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
14.04.2018, 22:53
Ответы с готовыми решениями:

Парсинг данных с сайта
Работаю с HTML Agility Pack. Нужно считать данные с таблицы сайта. public Form1() { string url =...

Парсинг данных с сайта
Помогите пожалуйста составить регулярное выражение для задания : (Определить количество книг по жанрам на произвольном сайте библиотеки или...

Парсинг данных с сайта с javascript
Есть сайт с некими данными (раз в день обновляемыми, потому и нужна программа), данные выдаются примерно следующим образом: 1....

12
 Аватар для edward_freedom
1569 / 1448 / 303
Регистрация: 01.10.2011
Сообщений: 2,636
14.04.2018, 22:57
Jesterru, Все данные там получаются через сокет. Ты можешь подключится к нему вручную и будешь получать данные в реальном времени. Такие данные будешь получать
JSON
1
["reservation",{"username":"♛ lucky ♛","avatar":"https://steamcdn-a.akamaihd.net/steamcommunity/public/images/avatars/2b/2b5a43a30b9c63fc9b81e2615e256f302f45de90_medium.jpg","openId":"76561198338899780","level":21,"worth":500,"choice":3,"total":5590,"bets":39}]
0
 Аватар для Jesterru
3 / 2 / 2
Регистрация: 19.06.2016
Сообщений: 299
15.04.2018, 00:01  [ТС]
edward_freedom, А каким образом мне через сокет это все получать? Я просто полный ноль в этой теме
0
 Аватар для Jesterru
3 / 2 / 2
Регистрация: 19.06.2016
Сообщений: 299
15.04.2018, 20:13  [ТС]
Мне нужно парсить количество поставленной валюты на каждую из команд на этом сайте. Дело в том, что он динамический, информация постоянно подгружается. С помощью гугл хрома обнаружил, что информация подгружается с помощью вебсокетов. А теперь сам вопрос :

Как на C# подключиться к этому сайту и получать те же данные, что и браузер?

Пытался с помощью обычных сокетов подключиться, но я не знаю, что указывать в параметре порт и как этот адрес для вебсокета перевести в цифры (wss://******/socket.io/?EIO=3&transport=websocket).

Сам класс ClientWebSocket и WebSoket у меня использовать не получилось, вылетали исключения, а документации нет почти
0
управление сложностью
 Аватар для Почтальон
1693 / 1306 / 259
Регистрация: 22.03.2015
Сообщений: 7,545
Записей в блоге: 5
16.04.2018, 12:26
Jesterru, может проще Selenium использовать ?
0
 Аватар для Jesterru
3 / 2 / 2
Регистрация: 19.06.2016
Сообщений: 299
16.04.2018, 13:55  [ТС]
Почтальон, а разве эта библиотека позволит достичь моей цели? Я посмотрел документацию и не нашел решения проблеме. Мне ведь надо просто через вебсокеты получать ту информацию, которую получает мой браузер, но я не пойму как это сделать (Уж и библиотеки разные юзал, и документации читал, эффекта 0)
0
управление сложностью
 Аватар для Почтальон
1693 / 1306 / 259
Регистрация: 22.03.2015
Сообщений: 7,545
Записей в блоге: 5
16.04.2018, 14:37
Цитата Сообщение от Jesterru Посмотреть сообщение
Мне ведь надо просто через вебсокеты получать ту информацию, которую получает мой браузер, но я не пойму как это сделать (Уж и библиотеки разные юзал, и документации читал, эффекта 0)
Если разрабы не дураки, то они шифруют трафик. Вам же, если будете делать через сокеты, придется его еще и дешифровать.
Цитата Сообщение от Jesterru Посмотреть сообщение
Дело в том, что он динамический, информация постоянно подгружается.
С помощью Selenium`а можно тупо периодически обновлять страницу (самое простое).
Либо можно попытаться использовать скрипты, которые шлют инфу чтобы страница обновлялась.
Цитата Сообщение от Jesterru Посмотреть сообщение
С помощью гугл хрома обнаружил, что информация подгружается с помощью вебсокетов.
Каким образом вы это определили ?
0
 Аватар для Jesterru
3 / 2 / 2
Регистрация: 19.06.2016
Сообщений: 299
16.04.2018, 14:55  [ТС]
Цитата Сообщение от Почтальон Посмотреть сообщение
Каким образом вы это определили ?
Через гугл хром в консоли разработчика нашел вкладку "WS", в ней было подключение к сокету

Цитата Сообщение от Почтальон Посмотреть сообщение
Если разрабы не дураки, то они шифруют трафик
Да вроде нет, там все операции "несекретные", все в чистом виде в формате json

Цитата Сообщение от Почтальон Посмотреть сообщение
С помощью Selenium`а можно тупо периодически обновлять страницу (самое простое)
Это решение проблемы, но, к сожалению, мне нужна конечная информация раунда, а этот конец всегда наступает с разной задержкой. А через сокеты я как раз смогу отследить команду, означающую конец раунда.

Веб Сокеты - это ведь обертка над обычными сокетами? А возможно ли через обычные сокеты получать эту информацию?

Добавлено через 11 минут
Извиниюсь, обычные и веб сокеты - разные вещи
0
управление сложностью
 Аватар для Почтальон
1693 / 1306 / 259
Регистрация: 22.03.2015
Сообщений: 7,545
Записей в блоге: 5
16.04.2018, 15:05
Цитата Сообщение от Jesterru Посмотреть сообщение
Через гугл хром в консоли разработчика нашел вкладку "WS", в ней было подключение к сокету
Скорее всего работает скрипт, и уже через него идет прием данных.
0
 Аватар для Jesterru
3 / 2 / 2
Регистрация: 19.06.2016
Сообщений: 299
16.04.2018, 15:15  [ТС]
Цитата Сообщение от Почтальон Посмотреть сообщение
Скорее всего работает скрипт, и уже через него идет прием данных.
Т.е. что это значит? Что это меняет?
0
управление сложностью
 Аватар для Почтальон
1693 / 1306 / 259
Регистрация: 22.03.2015
Сообщений: 7,545
Записей в блоге: 5
16.04.2018, 15:19
Цитата Сообщение от Jesterru Посмотреть сообщение
Т.е. что это значит? Что это меняет?
Отправлять данные скрипту, принимать их и обрабатывать.
1
 Аватар для Jesterru
3 / 2 / 2
Регистрация: 19.06.2016
Сообщений: 299
16.04.2018, 15:50  [ТС]
Цитата Сообщение от Почтальон Посмотреть сообщение
Отправлять данные скрипту, принимать их и обрабатывать
Спасибо! Но не дадите ли вы мне направление, в котором искать информацию по поводу отправки информации скриптам?

Добавлено через 13 минут
Цитата Сообщение от Почтальон Посмотреть сообщение
Скорее всего работает скрипт
Но ведь там сокет есть, почему бы прямо из него и не получать данные?

Добавлено через 14 минут
Возник другой вопрос :
Возможно ли скопировать текст со страницы НЕ через html, а напрямую?
0
управление сложностью
 Аватар для Почтальон
1693 / 1306 / 259
Регистрация: 22.03.2015
Сообщений: 7,545
Записей в блоге: 5
16.04.2018, 16:28
Цитата Сообщение от Jesterru Посмотреть сообщение
Возможно ли скопировать текст со страницы НЕ через html, а напрямую?
Отправить запрос через WebClient, прочитать ответ. Но это не избавит вас от исполнения скриптов
1
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
16.04.2018, 16:28
Помогаю со студенческими работами здесь

Парсинг сайта
Прикладываю файл проекта(украден где-то на форуме)(). ВОт ссылка на страницу - годовой отчет банка....

Парсинг сайта
Имеется страница с примерно следующим содержимым ... <div class="main random"> <b>1</b> <b>123</b> ...

Парсинг сайта
Есть сайт - https://citaty.info/category/zhiznennye-citaty На каждой странице по 11 цитат. Задача спарсить все 11 цитат в List. ...

Парсинг с сайта
Здравствуйте. Не могу никак понять, как парсить "неопределённую" информацию с сайта. Вот допустим количество блогов на cyberforum'е...

Парсинг сайта
Здравствуйте. Помогите пожалуйста решить следующую проблему. При парсинге я выбираю информацию по определенному классу в HTML, например w1....


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
13
Ответ Создать тему
Новые блоги и статьи
http://iceja.net/ математические сервисы
iceja 20.01.2026
Обновила свой сайт http:/ / iceja. net/ , приделала Fast Fourier Transform экстраполяцию сигналов. Однако предсказывает далеко не каждый сигнал (см ограничения http:/ / iceja. net/ fourier/ docs ). Также. . .
http://iceja.net/ сервер решения полиномов
iceja 18.01.2026
Выкатила http:/ / iceja. net/ сервер решения полиномов (находит действительные корни полиномов методом Штурма). На сайте документация по API, но скажу прямо VPS слабенький и 200 000 полиномов. . .
Расчёт переходных процессов в цепи постоянного тока
igorrr37 16.01.2026
/ * Дана цепь постоянного тока с R, L, C, k(ключ), U, E, J. Программа составляет систему уравнений по 1 и 2 законам Кирхгофа, решает её и находит переходные токи и напряжения на элементах схемы. . . .
Восстановить юзерскрипты Greasemonkey из бэкапа браузера
damix 15.01.2026
Если восстановить из бэкапа профиль Firefox после переустановки винды, то список юзерскриптов в Greasemonkey будет пустым. Но восстановить их можно так. Для этого понадобится консольная утилита. . .
Сукцессия микоризы: основная теория в виде двух уравнений.
anaschu 11.01.2026
https:/ / rutube. ru/ video/ 7a537f578d808e67a3c6fd818a44a5c4/
WordPad для Windows 11
Jel 10.01.2026
WordPad для Windows 11 — это приложение, которое восстанавливает классический текстовый редактор WordPad в операционной системе Windows 11. После того как Microsoft исключила WordPad из. . .
Classic Notepad for Windows 11
Jel 10.01.2026
Old Classic Notepad for Windows 11 Приложение для Windows 11, позволяющее пользователям вернуть классическую версию текстового редактора «Блокнот» из Windows 10. Программа предоставляет более. . .
Почему дизайн решает?
Neotwalker 09.01.2026
В современном мире, где конкуренция за внимание потребителя достигла пика, дизайн становится мощным инструментом для успеха бренда. Это не просто красивый внешний вид продукта или сайта — это. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru