Форум программистов, компьютерный форум, киберфорум
C# .NET
Войти
Регистрация
Восстановить пароль
Карта форума Темы раздела Блоги Сообщество Поиск Заказать работу  
 
 
Рейтинг 4.79/34: Рейтинг темы: голосов - 34, средняя оценка - 4.79
36 / 36 / 3
Регистрация: 17.07.2008
Сообщений: 581
1

Парсинг сайта с javascript

24.03.2017, 10:17. Показов 6577. Ответов 31
Метки нет (Все метки)

Author24 — интернет-сервис помощи студентам
Всем доброго вечера. Есть сайт, который ведет поиск по запросу, если конкретно то по телефонному номеру. При просмотре кода не нашел строку запроса, только js. Как с помощью сишарпа написать запрос на такие сайты и обработать запрос?
а вот и сама ссылка ссылка

Добавлено через 14 часов 14 минут
Может что-то посоветуйте? Какие параметры и как отправляет данные поиска на этот сайт?
0
Лучшие ответы (1)
Programming
Эксперт
94731 / 64177 / 26122
Регистрация: 12.04.2006
Сообщений: 116,782
24.03.2017, 10:17
Ответы с готовыми решениями:

Парсинг данных с сайта с javascript
Есть сайт с некими данными (раз в день обновляемыми, потому и нужна программа), данные выдаются...

Парсинг сайта с JavaScript
Мне нужно пропарсить сайт, но информация поялвяеться на сайте только после выполнения JS. Как...

Парсинг html сайта у которого frontend на javascript
Здравствуйте. Пытаюсь запарсить вот этот сайт: http://allsocial.ru Для начала пытаюсь получить...

Парсинг html + javascript
Доброго времени суток! Я хочу написать парсер, чтобы получать нужную информацию с сайта для...

31
Эксперт .NET
12077 / 8386 / 1281
Регистрация: 21.01.2016
Сообщений: 31,593
24.03.2017, 10:26 2
Лучший ответ Сообщение было отмечено frech как решение

Решение

frech, открой окно разработчика в браузере (F12), отправь (руками) поисковой запрос какой-нибудь и посмотри на вкладке Network по какому адресу и с каким содержимым он ушёл. Вот это и нужно будет вопросизвести программно, без всяких JS.
1
36 / 36 / 3
Регистрация: 17.07.2008
Сообщений: 581
24.03.2017, 10:42  [ТС] 3
Usaga, вот первое что нашел
Request URL:http://www.magephonebook.com/search.php
и заметил свои данные в этой графе
Form Data
int:90
number:500+006+0
0
Эксперт .NET
12077 / 8386 / 1281
Регистрация: 21.01.2016
Сообщений: 31,593
24.03.2017, 10:43 4
frech, вот туда параметры запроса и нужно отправлять. И пофиг тебе всякие JS.
1
36 / 36 / 3
Регистрация: 17.07.2008
Сообщений: 581
24.03.2017, 10:58  [ТС] 5
Usaga,
C#
1
 HttpWebRequest request = (HttpWebRequest)WebRequest.Create("http://www.magephonebook.com/search.php");
как послать int:90 number:500+006+0 дата информацию?
0
Эксперт .NET
12077 / 8386 / 1281
Регистрация: 21.01.2016
Сообщений: 31,593
24.03.2017, 11:00 6
frech, тебе нужно отправить POST-запрос.
1
36 / 36 / 3
Регистрация: 17.07.2008
Сообщений: 581
24.03.2017, 11:05  [ТС] 7
Парсинг сайта с javascript
0
36 / 36 / 3
Регистрация: 17.07.2008
Сообщений: 581
24.03.2017, 11:18  [ТС] 8
Usaga, просит авторизацию гуглакаунта. Поэтому ответ на запрос от гугла. Как сделать авторизацию на гугл до запроса поиска?
0
Эксперт .NET
12077 / 8386 / 1281
Регистрация: 21.01.2016
Сообщений: 31,593
24.03.2017, 11:21 9
frech, кто просит авторизацию? Целевой сайт? Значит нужно прикручивать авторизацию в виде куки как на скрине выше.
1
36 / 36 / 3
Регистрация: 17.07.2008
Сообщений: 581
24.03.2017, 11:26  [ТС] 10
Usaga, Так точно, сайт. Авторизуюсь, а дальше не требует определенное время. Потом опять требует авторизацию. Каждый раз куки прикручивать? Я так понял каждый раз создавать куки файл, а потом прикручивать?
0
Эксперт .NET
12077 / 8386 / 1281
Регистрация: 21.01.2016
Сообщений: 31,593
24.03.2017, 11:29 11
frech, куки к каждому запросу прикручиваются.
1
36 / 36 / 3
Регистрация: 17.07.2008
Сообщений: 581
24.03.2017, 11:39  [ТС] 12
Usaga, эти данные куки не будут изменятся через определенное время?
Cookie:PHPSESSID=udg05eephb35n93831cg717kk6; _ga=GA1.2.910075559.1490334802; _gat=1
C#
1
2
3
4
Cookie cookie = new Cookie(какие данные сюда вписать?);
 
request.CookieContainer = new CookieContainer();
request.CookieContainer.Add(cookie);
0
Эксперт .NET
12077 / 8386 / 1281
Регистрация: 21.01.2016
Сообщений: 31,593
24.03.2017, 11:40 13
frech, сессия со временем протухнет и куки станет невалидным. Нужно будет заново авторизовываться.
0
36 / 36 / 3
Регистрация: 17.07.2008
Сообщений: 581
24.03.2017, 11:43  [ТС] 14
Usaga, вот и я об этом. Как решить эту проблему? Имеется логин и пароль, авторизация автоматически
0
Эксперт .NET
12077 / 8386 / 1281
Регистрация: 21.01.2016
Сообщений: 31,593
24.03.2017, 11:44 15
Цитата Сообщение от frech Посмотреть сообщение
Как решить эту проблему?
Всё так же: F12 в браузере и вперёд.
0
36 / 36 / 3
Регистрация: 17.07.2008
Сообщений: 581
24.03.2017, 12:11  [ТС] 16
При запросе до авторизации, мне выдает это:
https://accounts.google.com//o... rompt=auto
Перед новой сессией клиентИД меняется.
Чтобы вы посоветовали бы сделать? Как авторизироваться и получить куки для дальнейшего пользование
0
36 / 36 / 3
Регистрация: 17.07.2008
Сообщений: 581
24.03.2017, 14:39  [ТС] 17
Еще вопрос: Первый пост запросам отправил данные, но сервер мне возвращает вторым запросам результат.
Парсинг сайта с javascript

как видно на фото, первый search.php это post запрос, а второй результат. Как отловить второй?
С первым так работаю
C#
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
 string postData = "int=994&number=050+580+00+61";
            byte[] byteArray = Encoding.UTF8.GetBytes (postData);
           
            
            WebRequest request = WebRequest.Create("http://www.magephonebook.com/search.php");
            ((HttpWebRequest)request).CookieContainer = new CookieContainer();
            ((HttpWebRequest)request).CookieContainer = GetCookieContainer();
            request.Credentials = CredentialCache.DefaultCredentials;
            ((HttpWebRequest)request).UserAgent = "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/56.0.2924.87 Safari/537.36";
            request.Method = "POST";
            request.ContentLength = byteArray.Length;
            request.ContentType = "application/x-www-form-urlencoded; charset=UTF-8";
            
            Stream dataStream = request.GetRequestStream();
            // Write the data to the request stream.
            dataStream.Write(byteArray, 0, byteArray.Length);
            // Close the Stream object.
            dataStream.Close();
            // Get the response.
            WebResponse response = request.GetResponse();
            // Display the status.
            richTextBox1.Text += (((HttpWebResponse)response).StatusDescription);
            // Get the stream containing content returned by the server.
            dataStream = response.GetResponseStream();
            // Open the stream using a StreamReader for easy access.
            StreamReader reader = new StreamReader(dataStream);
            // Read the content.
            string responseFromServer = reader.ReadToEnd();
 
            
            richTextBox1.Text += responseFromServer;
            reader.Close();
            dataStream.Close();
            response.Close();
Его результат код 201 и ОК.
Пытаясь обработать второй, получаю ошибку,
C#
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
WebRequest _request = WebRequest.Create("http://www.magephonebook.com");
            //((HttpWebRequest)request).CookieContainer = new CookieContainer();
            ((HttpWebRequest)_request).CookieContainer = GetCookieContainer();
            _request.Credentials = CredentialCache.DefaultCredentials;
            ((HttpWebRequest)_request).UserAgent = "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/56.0.2924.87 Safari/537.36";
            _request.Method = "GET";
            //_request.ContentLength = byteArray.Length;
            _request.ContentType = "text/html; charset=UTF-8";
 
            Stream _dataStream = _request.GetRequestStream();
            // Write the data to the request stream.
            //dataStream.Write(byteArray, 0, byteArray.Length);
            // Close the Stream object.
            _dataStream.Close();
            // Get the response.
            WebResponse _response = request.GetResponse();
            // Display the status.
            richTextBox1.Text += (((HttpWebResponse)_response).StatusDescription);
            // Get the stream containing content returned by the server.
            dataStream = response.GetResponseStream();
            // Open the stream using a StreamReader for easy access.
            StreamReader _reader = new StreamReader(dataStream);
            // Read the content.
            string _responseFromServer = _reader.ReadToEnd();
 
 
            richTextBox1.Text += _responseFromServer;
невозможно отправить запрос
0
36 / 36 / 3
Регистрация: 17.07.2008
Сообщений: 581
24.03.2017, 14:50  [ТС] 18
исправил
C#
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
 WebRequest _request = WebRequest.Create("http://www.magephonebook.com");
            //((HttpWebRequest)request).CookieContainer = new CookieContainer();
            ((HttpWebRequest)_request).CookieContainer = GetCookieContainer();
            _request.Credentials = CredentialCache.DefaultCredentials;
            ((HttpWebRequest)_request).UserAgent = "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/56.0.2924.87 Safari/537.36";
            _request.Method = "GET";
            //_request.ContentLength = byteArray.Length;
            _request.ContentType = "text/html; charset=UTF-8";
            WebResponse _response = _request.GetResponse();
            Stream _dataStream = _response.GetResponseStream();
            // Write the data to the request stream.
            //dataStream.Write(byteArray, 0, byteArray.Length);
            // Close the Stream object.
            
            // Open the stream using a StreamReader for easy access.
            StreamReader _reader = new StreamReader(_dataStream);
            // Read the content.
            string _responseFromServer = _reader.ReadToEnd();
 
 
            richTextBox1.Text += _responseFromServer;
            _reader.Close();
            _dataStream.Close();
           _response.Close();
0
Эксперт .NET
12077 / 8386 / 1281
Регистрация: 21.01.2016
Сообщений: 31,593
24.03.2017, 14:55 19
frech, Заработало?..
0
36 / 36 / 3
Регистрация: 17.07.2008
Сообщений: 581
24.03.2017, 16:18  [ТС] 20
Usaga, заработал, но в одном участке кода не могу сделать парсинг
<a href="#" tabindex="0" class="popular-names" role="button" data-placement="bottom" data-trigger="focus" data-content="<span>ИМЯ1</span><span>ИМЯ1A</span><span>ИМЯ2</span><span>ИМЯ3</span>"><i class="material-icons">arrow_drop_down</i></a>
НАДО вытащить слова ИМЯ
0
24.03.2017, 16:18
IT_Exp
Эксперт
87844 / 49110 / 22898
Регистрация: 17.06.2006
Сообщений: 92,604
24.03.2017, 16:18
Помогаю со студенческими работами здесь

Парсинг страницы с JavaScript
Привет! Помогите пожалуйста советом/примером! Суть в следующем: Есть список кодов...

Парсинг сайтов, написанных на javascript
Мне нужно на C# сделать парсинг сайта, написанного на javascript. Как это сделать, есть ли какие-то...

Парсинг сайта с JavaScript
Есть сайт, на котором контент формируется JavaScript'ом, соответственно, при парсинге через cURL я...

Парсинг данных с сайта или страницы сайта
Здравствуйте, добрые люди! Есть задача спарсить данные с страницы соц сети. Или просто со...

Парсинг javascript
Здравствуйте, пытался пропарсить js на C#, но он невидит его, как на php пропарсить этот код...

Парсинг на javascript
Ситуация такая: Необходимо парсить весь исходный код чужой страницы на стороне пользователя (потому...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
20
Ответ Создать тему
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2024, CyberForum.ru