170 / 118 / 48
Регистрация: 30.11.2012
Сообщений: 1,311
1

c++ парсер html страниц

03.06.2013, 21:24. Показов 4612. Ответов 8
Метки нет (Все метки)

Хочу изучить парсер html страниц через с++, но нигде не могу найти нужной литературы, даже примерно где искать не знаю. В поисковике уже разные вариации испробовал, если кто нибудь знает где можно найти нужную информацию скажите пожалуйста. Или может есть какие нибудь книги где можно почитать про парсер Html??
0
Programming
Эксперт
94731 / 64177 / 26122
Регистрация: 12.04.2006
Сообщений: 116,782
03.06.2013, 21:24
Ответы с готовыми решениями:

Парсер HTML страниц
Здравствуйте, Начал учить C++, интересует информация, исходник парсера HTML страницы. Очень был...

Парсер HTML
Хочу написать прогу по выборке из своих html файлов некоторых тегов (img например). Пошел искать...

Парсер HTML на C++
Помогите найти библиотеку для синтаксического анализа HTML на C++ или Си. Желательно, работающую с...

Парсер html на c++
В консольном приложении хочу чтобы для конвертации валют использовались актуальные данные с сайта....

8
37 / 5 / 0
Регистрация: 13.04.2011
Сообщений: 193
03.06.2013, 21:26 2
[cut]
google по твоему запросу полон
0
170 / 118 / 48
Регистрация: 30.11.2012
Сообщений: 1,311
03.06.2013, 21:30  [ТС] 3
Мне бы с самого нуля, сначала прочитать что это такое, как использовать..
0
37 / 5 / 0
Регистрация: 13.04.2011
Сообщений: 193
03.06.2013, 21:33 4
Вот вроде с "нуля". http://blog.alno.name/ru/2008/... ost-spirit
или вы С++ с нуля хотите?
0
170 / 118 / 48
Регистрация: 30.11.2012
Сообщений: 1,311
03.06.2013, 21:52  [ТС] 5
С++ с нуля не хочу. Расскажу немного о своей проблеме. У меня есть вот такая программа-кликер.
C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
#include <iostream>
#include <ostream>
#include <clocale>
#include <conio.h>
#include <Windows.h> //для определения окна
#include <WinUser.h> //для определения окна
 
using namespace std;
 
//Объявление функций
void bonus (HWND Handle, int x, int y);
void gala (HWND Handle, int x, int y);
void besk_dali (HWND Handle, int x, int y);
void bt (HWND Handle, int x, int y);
void kr (HWND Handle, int x, int y);
void yn (HWND Handle, int x, int y);
void sz (HWND Handle, int x, int y);
void megarab (HWND Handle, int x, int y);
void dalee1 (HWND Handle, int x, int y);
void dalee2 (HWND Handle, int x, int y);
void dalee3 (HWND Handle, int x, int y);
void relog (HWND Handle, int x, int y);
void orbita (HWND Handle, int x, int y);
 
 
 
 
 
void main()
{
 
    HWND Handle;
    
    setlocale(LC_CTYPE, "Russian"); //Руссификатор
    cout << "Экспедиция Worldogame для Opera - маштаб 80%, разрешение экрана 1024х768  \n"; //Вывести начальный текст
    cout << "Как должен выглядеть флот http://*************/s/5amJ52\n";
    Handle = FindWindow(NULL, L"Обзор - Fast [x1000] - World Ogame - Opera"); // получаю хендл окна по его заголовку
   
    
    if(Handle) //Проверка Хендла окна
    {   
        Sleep(1000);
        cout << "Игра найдена\n"; //Выводим текст на экран
        
        
        int i;
        while(1) //Бесконечный цикл
        {
          relog(Handle, 115,45); //Релогин
          Sleep(5000);
          bonus(Handle, 107,238); //Получаю бонус если такой имеется
          Sleep(5000);
          Sleep(1000);
          cout << " \n>>>>Отправка экспедиции...\n"; //Выводим текст на экран
          for (i = 1; i<7; i++)
          {
              //FindWindow(NULL, L"Обзор - Fast [x1000] - World Ogame - Opera"); //Если такой хендл, то бот начинает работу
              gala(Handle, 47, 455); //Переходим в галактику
              Sleep(5000);
              besk_dali(Handle, 640,694); //Бесконечные дали
              Sleep(5000);
              bt(Handle, 781,207); //Выбор БТ
              Sleep(2000);
              kr(Handle, 781,298); //Выбор КРЫС
              Sleep(2000);
              yn(Handle, 781,450); //Выбор УНИКОВ
              Sleep(2000);
              sz(Handle, 781,541); //Выбор СЗ
              Sleep(2000);
              megarab(Handle, 781,605); //Выбор МЕГАРАБОВ
              Sleep(1000);
              dalee1(Handle, 615,678); //Далее 1
              Sleep(5000);
              dalee2(Handle, 622,716); //Далее 2
              Sleep(5000);
              dalee3(Handle, 619,377); //Далее 3
              Sleep(5000);
          }
          orbita(Handle, 40,344); //Далее 3
          cout << "  \nОжидаем 6.5 минут минут\n";
          Sleep(390000);
        }
    
    }
    else //Если хендл окна ложен выдать текст
    {
        Sleep(1000);
        cout << "\nИгра не запущена, пожалуйста откройте игру на странице обзора"; //Выводим текст на экран
    }
    getch();
}
    //Функции нажатия клавиш
void bonus (HWND Handle, int x, int y)
    {
        SendMessage(Handle, WM_MOUSEMOVE, MK_LBUTTON, MAKELONG(x,y)); //навести курсор в координаты
        SendMessage(Handle, WM_LBUTTONDOWN,MK_LBUTTON,MAKELONG(x,y)); //нажать в координатах
        SendMessage(Handle,WM_LBUTTONUP,0,MAKELONG(x,y)); //отпустить в координатах
 
        Sleep(800);
        SendMessage(Handle, WM_LBUTTONDOWN,MK_LBUTTON,MAKELONG(x,y)); //нажать в координатах
        SendMessage(Handle,WM_LBUTTONUP,0,MAKELONG(x,y)); //отпустить в координатах
        cout << "\n  >>Получаю бонус если такой имеется\n";
    }
 
    void gala (HWND Handle, int x, int y)
    {
        SendMessage(Handle, WM_MOUSEMOVE, MK_LBUTTON, MAKELONG(x,y)); //навести курсор в координаты
        SendMessage(Handle, WM_LBUTTONDOWN,MK_LBUTTON,MAKELONG(x,y)); //нажать в координатах
        SendMessage(Handle,WM_LBUTTONUP,0,MAKELONG(x,y)); //отпустить в координатах
 
        Sleep(800);
        SendMessage(Handle, WM_LBUTTONDOWN,MK_LBUTTON,MAKELONG(x,y)); //нажать в координатах
        SendMessage(Handle,WM_LBUTTONUP,0,MAKELONG(x,y)); //отпустить в координатах
        cout << "\n  >>Галактика\n";
    }
 
    void besk_dali (HWND Handle, int x, int y)
    {
        SendMessage(Handle, WM_MOUSEMOVE, MK_LBUTTON, MAKELONG(x,y)); //навести курсор в координаты
        SendMessage(Handle, WM_LBUTTONDOWN,MK_LBUTTON,MAKELONG(x,y)); //нажать в координатах
        SendMessage(Handle,WM_LBUTTONUP,0,MAKELONG(x,y)); //отпустить в координатах
 
        Sleep(800);
        SendMessage(Handle, WM_LBUTTONDOWN,MK_LBUTTON,MAKELONG(x,y)); //нажать в координатах
        SendMessage(Handle,WM_LBUTTONUP,0,MAKELONG(x,y)); //отпустить в координатах
        cout << "  >>Бесконечные дали\n";
    }
 
    void bt (HWND Handle, int x, int y)
    {
        SendMessage(Handle, WM_MOUSEMOVE, MK_LBUTTON, MAKELONG(x,y)); //навести курсор в координаты
        SendMessage(Handle, WM_LBUTTONDOWN,MK_LBUTTON,MAKELONG(x,y)); //нажать в координатах
        SendMessage(Handle,WM_LBUTTONUP,0,MAKELONG(x,y)); //отпустить в координатах
 
        Sleep(800);
        SendMessage(Handle, WM_LBUTTONDOWN,MK_LBUTTON,MAKELONG(x,y)); //нажать в координатах
        SendMessage(Handle,WM_LBUTTONUP,0,MAKELONG(x,y)); //отпустить в координатах
        SendMessage(Handle, WM_SETTEXT, 0, (LPARAM)"100000"); //вставить 100000 бт
        PostMessage(Handle, WM_KEYDOWN, 0x32, 0);
        PostMessage(Handle, WM_KEYDOWN, 0x35, 0);
        PostMessage(Handle, WM_KEYDOWN, 0x30, 0);
        PostMessage(Handle, WM_KEYDOWN, 0x30, 0);
        PostMessage(Handle, WM_KEYDOWN, 0x30, 0);
        PostMessage(Handle, WM_KEYDOWN, 0x30, 0);
        cout << "  >>Большой транспорт: 250.000\n";
    }
 
     void kr (HWND Handle, int x, int y)
    {
        SendMessage(Handle, WM_MOUSEMOVE, MK_LBUTTON, MAKELONG(x,y)); //навести курсор в координаты
        SendMessage(Handle, WM_LBUTTONDOWN,MK_LBUTTON,MAKELONG(x,y)); //нажать в координатах
        SendMessage(Handle,WM_LBUTTONUP,0,MAKELONG(x,y)); //отпустить в координатах
 
        Sleep(800);
        SendMessage(Handle, WM_LBUTTONDOWN,MK_LBUTTON,MAKELONG(x,y)); //нажать в координатах
        SendMessage(Handle,WM_LBUTTONUP,0,MAKELONG(x,y)); //отпустить в координатах
        SendMessage(Handle, WM_SETTEXT, 0, (LPARAM)"100000"); //вставить 100000 бт
        PostMessage(Handle, WM_KEYDOWN, 0x32, 0);
        PostMessage(Handle, WM_KEYDOWN, 0x35, 0);
        PostMessage(Handle, WM_KEYDOWN, 0x30, 0);
        PostMessage(Handle, WM_KEYDOWN, 0x30, 0);
        PostMessage(Handle, WM_KEYDOWN, 0x30, 0);
        PostMessage(Handle, WM_KEYDOWN, 0x30, 0);
        cout << "  >>Крейсер: 250.000\n";
    }
 
 void yn (HWND Handle, int x, int y)
    {
        SendMessage(Handle, WM_MOUSEMOVE, MK_LBUTTON, MAKELONG(x,y)); //навести курсор в координаты
        SendMessage(Handle, WM_LBUTTONDOWN,MK_LBUTTON,MAKELONG(x,y)); //нажать в координатах
        SendMessage(Handle,WM_LBUTTONUP,0,MAKELONG(x,y)); //отпустить в координатах
 
        Sleep(800);
        SendMessage(Handle, WM_LBUTTONDOWN,MK_LBUTTON,MAKELONG(x,y)); //нажать в координатах
        SendMessage(Handle,WM_LBUTTONUP,0,MAKELONG(x,y)); //отпустить в координатах
        SendMessage(Handle, WM_SETTEXT, 0, (LPARAM)"100000"); //вставить 100000 бт
        PostMessage(Handle, WM_KEYDOWN, 0x35, 0);
        PostMessage(Handle, WM_KEYDOWN, 0x30, 0);
        PostMessage(Handle, WM_KEYDOWN, 0x30, 0);
        PostMessage(Handle, WM_KEYDOWN, 0x30, 0);
        cout << "  >>Уничтожители: 5.000\n";
    }
 
  void sz (HWND Handle, int x, int y)
    {
        SendMessage(Handle, WM_MOUSEMOVE, MK_LBUTTON, MAKELONG(x,y)); //навести курсор в координаты
        SendMessage(Handle, WM_LBUTTONDOWN,MK_LBUTTON,MAKELONG(x,y)); //нажать в координатах
        SendMessage(Handle,WM_LBUTTONUP,0,MAKELONG(x,y)); //отпустить в координатах
 
        Sleep(800);
        SendMessage(Handle, WM_LBUTTONDOWN,MK_LBUTTON,MAKELONG(x,y)); //нажать в координатах
        SendMessage(Handle,WM_LBUTTONUP,0,MAKELONG(x,y)); //отпустить в координатах
        SendMessage(Handle, WM_SETTEXT, 0, (LPARAM)"100000"); //вставить 100000 бт
        PostMessage(Handle, WM_KEYDOWN, 0x31, 0);
        cout << "  >>Сверхновая звезда: 1\n";
    }
 
   void megarab (HWND Handle, int x, int y)
    {
        SendMessage(Handle, WM_MOUSEMOVE, MK_LBUTTON, MAKELONG(x,y)); //навести курсор в координаты
        SendMessage(Handle, WM_LBUTTONDOWN,MK_LBUTTON,MAKELONG(x,y)); //нажать в координатах
        SendMessage(Handle,WM_LBUTTONUP,0,MAKELONG(x,y)); //отпустить в координатах
 
        Sleep(800);
        SendMessage(Handle, WM_LBUTTONDOWN,MK_LBUTTON,MAKELONG(x,y)); //нажать в координатах
        SendMessage(Handle,WM_LBUTTONUP,0,MAKELONG(x,y)); //отпустить в координатах
        SendMessage(Handle, WM_SETTEXT, 0, (LPARAM)"100000"); //вставить 100000 бт
        PostMessage(Handle, WM_KEYDOWN, 0x32, 0);
        PostMessage(Handle, WM_KEYDOWN, 0x30, 0);
        PostMessage(Handle, WM_KEYDOWN, 0x30, 0);
        cout << "  >>Мегапереработчик: 200\n";
    }
 
    void dalee1 (HWND Handle, int x, int y)
    {
        SendMessage(Handle, WM_MOUSEMOVE, MK_LBUTTON, MAKELONG(x,y)); //навести курсор в координаты
        SendMessage(Handle, WM_LBUTTONDOWN,MK_LBUTTON,MAKELONG(x,y)); //нажать в координатах
        SendMessage(Handle,WM_LBUTTONUP,0,MAKELONG(x,y)); //отпустить в координатах
 
        Sleep(800);
        SendMessage(Handle, WM_LBUTTONDOWN,MK_LBUTTON,MAKELONG(x,y)); //нажать в координатах
        SendMessage(Handle,WM_LBUTTONUP,0,MAKELONG(x,y)); //отпустить в координатах
        SendMessage(Handle, WM_SETTEXT, 0, (LPARAM)"100000"); //вставить 100000 бт
        cout << "  >>Далее 1\n";
    }
 
     void dalee2 (HWND Handle, int x, int y)
    {
        SendMessage(Handle, WM_MOUSEMOVE, MK_LBUTTON, MAKELONG(x,y)); //навести курсор в координаты
        SendMessage(Handle, WM_LBUTTONDOWN,MK_LBUTTON,MAKELONG(x,y)); //нажать в координатах
        SendMessage(Handle,WM_LBUTTONUP,0,MAKELONG(x,y)); //отпустить в координатах
 
        Sleep(800);
        SendMessage(Handle, WM_LBUTTONDOWN,MK_LBUTTON,MAKELONG(x,y)); //нажать в координатах
        SendMessage(Handle,WM_LBUTTONUP,0,MAKELONG(x,y)); //отпустить в координатах
        SendMessage(Handle, WM_SETTEXT, 0, (LPARAM)"100000"); //вставить 100000 бт
        cout << "  >>Далее 2\n";
    }
 
      void dalee3 (HWND Handle, int x, int y)
    {
        SendMessage(Handle, WM_MOUSEMOVE, MK_LBUTTON, MAKELONG(x,y)); //навести курсор в координаты
        SendMessage(Handle, WM_LBUTTONDOWN,MK_LBUTTON,MAKELONG(x,y)); //нажать в координатах
        SendMessage(Handle,WM_LBUTTONUP,0,MAKELONG(x,y)); //отпустить в координатах
 
        Sleep(800);
        SendMessage(Handle, WM_LBUTTONDOWN,MK_LBUTTON,MAKELONG(x,y)); //нажать в координатах
        SendMessage(Handle,WM_LBUTTONUP,0,MAKELONG(x,y)); //отпустить в координатах
        SendMessage(Handle, WM_SETTEXT, 0, (LPARAM)"100000"); //вставить 100000 бт
        cout << "  >>Далее 3\n";
    }
 
        void relog (HWND Handle, int x, int y)
    {
        SendMessage(Handle, WM_MOUSEMOVE, MK_LBUTTON, MAKELONG(x,y)); //навести курсор в координаты
        SendMessage(Handle, WM_LBUTTONDOWN,MK_LBUTTON,MAKELONG(x,y)); //нажать в координатах
        SendMessage(Handle,WM_LBUTTONUP,0,MAKELONG(x,y)); //отпустить в координатах
 
        Sleep(800);
        SendMessage(Handle, WM_LBUTTONDOWN,MK_LBUTTON,MAKELONG(x,y)); //нажать в координатах
        SendMessage(Handle,WM_LBUTTONUP,0,MAKELONG(x,y)); //отпустить в координатах
        SendMessage(Handle, WM_SETTEXT, 0, (LPARAM)"100000"); //вставить 100000 бт
        cout << "  >>Релогин\n";
    }
 
   void orbita (HWND Handle, int x, int y)
    {
        SendMessage(Handle, WM_MOUSEMOVE, MK_LBUTTON, MAKELONG(x,y)); //навести курсор в координаты
        SendMessage(Handle, WM_LBUTTONDOWN,MK_LBUTTON,MAKELONG(x,y)); //нажать в координатах
        SendMessage(Handle,WM_LBUTTONUP,0,MAKELONG(x,y)); //отпустить в координатах
 
        Sleep(800);
        SendMessage(Handle, WM_LBUTTONDOWN,MK_LBUTTON,MAKELONG(x,y)); //нажать в координатах
        SendMessage(Handle,WM_LBUTTONUP,0,MAKELONG(x,y)); //отпустить в координатах
        SendMessage(Handle, WM_SETTEXT, 0, (LPARAM)"100000"); //вставить 100000 бт
        cout << "\n  >>Отправка экспедиции закончена, выходим на орбиту\n";
    }
Программа тыкает по координатам в браузере Опера, мне эту программу нужно привести в нормальный вид, то есть сделать не кликером, а чем-то нормальным. Знакомый подсказал что копать нужно в сторону парсера html страниц. Что такое парсер и с чего его едят я понятия не имею, никогда с ним не сталкивался и честно говоря у меня глаза по пять рублей когда я вижу сообщения типа "создать парсер на C", чего создать? зачем создать?
Мне бы учебник где было все как для тупого написано, пошагово, вплоть до "Создаем Console Application" потом тыкаем туда и т.д.

Вот нашёл что-то более менее подходящее (ссылка), но всё равно ничего не получается.. вставил готовый код в Visual Studio, а он ошибки подчеркивает..

Надеюсь у меня получилось объяснить насколько я глуп и на сколько я хочу чуть чуть посвятиться в этом направлении
0
5226 / 3198 / 362
Регистрация: 12.12.2009
Сообщений: 8,105
Записей в блоге: 2
03.06.2013, 22:02 6
Для начала хотя бы на википедии почитай что такое "парсер". Складывается ощущение, что у тебя в голове "парсер html" это 2 неразделимых слова.

Все зависит от целей - если цель написать html парсер на С++, то удачи
Если цель просто написать парсер html, то С++ не лучший выбор, для этого есть другие, более удобные языки.
Если цель заиметь для себя парсер html, то можно легко нагуглить готовый, их полно.
1
170 / 118 / 48
Регистрация: 30.11.2012
Сообщений: 1,311
03.06.2013, 22:04  [ТС] 7
Цитата Сообщение от Kastaneda Посмотреть сообщение
Для начала хотя бы на википедии почитай что такое "парсер". Складывается ощущение, что у тебя в голове "парсер html" это 2 неразделимых слова.

Все зависит от целей - если цель написать html парсер на С++, то удачи
Если цель просто написать парсер html, то С++ не лучший выбор, для этого есть другие, более удобные языки.
Если цель заиметь для себя парсер html, то можно легко нагуглить готовый, их полно.
Вообще мне говорили что то что я задумал удобно будет делать на Java, но я как-то в колледже проходил Java и абсолютно там ничего не понимал.. другое дело по C++ у меня хоть что-то получалось
0
503 / 352 / 94
Регистрация: 22.03.2011
Сообщений: 1,112
03.06.2013, 22:26 8
Ерунду вам говорили. Если вы хотите легально оперировать с домом, то почитайте про расширения для браузеров там используется javascript и html, ограничение - песочница. Если еще ниже то это апплеты это уже или java или c++. Еще ниже на уровне пакетов и протокола это с++ или с.

Нелегально это хуки, инжекты и т.д. это с++ или с.

Добавлено через 7 минут
п.с. На уровне пакетов любой язык умеющий отправлять/принимать запросы. На уровне протокола любой язык работающий с сокетами.
0
What a waste!
1607 / 1299 / 180
Регистрация: 21.04.2012
Сообщений: 2,727
03.06.2013, 22:34 9
Цитата Сообщение от Nalik Посмотреть сообщение
Вообще мне говорили что то что я задумал удобно будет делать на Java, но я как-то в колледже проходил Java и абсолютно там ничего не понимал.. другое дело по C++ у меня хоть что-то получалось
Просто наверняка есть уже готовое решение для этого (на C, C++, и уж наверное на Яве); написать полноценный парсер html - не самая тривиальная задача.

Добавлено через 41 секунду
Если написание парсера - не самоцель - стоит взять готовое.
0
IT_Exp
Эксперт
87844 / 49110 / 22898
Регистрация: 17.06.2006
Сообщений: 92,604
03.06.2013, 22:34
Помогаю со студенческими работами здесь

Парсер html страниц
Возникают какие-то странные ошибки при парсинге страниц. Бьюсь над ними уже долго, никак не могу...

Парсер страниц
всем привет. подскажите вариант исполнения или код: дано - список улов страниц в текстовом файле....

Парсер страниц VK
Здравствуйте. Возникла необходимость создать парсер, который сохраняет аватарку пользователя vk по...

Парсер страниц
Здравствуйте, хочу распарсить несколько страниц, но парсить их хочу в 3 Этапа, 1. Вытащить нужный...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
9
Ответ Создать тему
Опции темы

КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2023, CyberForum.ru