Вытащить из веб-страницы только полезную информацию, отбросив весь «мусор» - C++ - Обсуждение 1359172 |
|
Обсуждение
Всего сообщений: 29
|
||||
Имя | Дата | Сообщение | ||
Читать обсуждение полностью: Вытащить из веб-страницы только полезную информацию, отбросив весь «мусор» |
||||
MS24 | 21.01.2015 22:10 |
https://www.cyberforum.ru/post7134059.html
Дали задание на собесе, ребята подскажите...
|
||
DU | 21.01.2015 22:16 |
https://www.cyberforum.ru/post7134075.html
если винда, то гляньте тут:...
|
||
Renji | 22.01.2015 00:53 |
https://www.cyberforum.ru/post7134579.html
Фильтровать - регулярными выражениями.
Мне интересно, в...
|
||
MS24 | 27.01.2015 14:57 |
https://www.cyberforum.ru/post7153151.html
Ребят, накатал вот такой пример, но не могу понять, все...
|
||
KOPOJI | 27.01.2015 15:04 |
https://www.cyberforum.ru/post7155754.html
Эмм..
bool IsStringContain(const string* Str, const char*...
|
||
Morr123 | 27.01.2015 16:50 |
https://www.cyberforum.ru/post7156144.html
Может ты к https сайту пытаешь подконектиться?
|
||
MS24 | 27.01.2015 17:06 |
https://www.cyberforum.ru/post7156171.html
Здесь я отрезаю http от строки, что бы в ф-ю gethostbyname...
|
||
Morr123 | 27.01.2015 17:07 |
https://www.cyberforum.ru/post7156230.html
https это усовершенствованный http, используется для...
|
||
MS24 | 27.01.2015 18:17 |
https://www.cyberforum.ru/post7156349.html
Короче, вывел в файл, все вывелось!!! :yahoo:
Не могу...
|
||
KOPOJI | 27.01.2015 18:51 |
https://www.cyberforum.ru/post7156656.html
Парсить лучше вручную. Хотя можете и регулярками.. Что то...
|
||
MS24 | 27.01.2015 19:05 |
https://www.cyberforum.ru/post7156704.html
не могу вставить сюда, слишком длинный 65000 символов, как...
|
||
KOPOJI | 27.01.2015 19:07 |
https://www.cyberforum.ru/post7156714.html
ну вам же не весь файл надо парсить, а какое то...
|
||
MS24 | 27.01.2015 19:16 |
https://www.cyberforum.ru/post7156759.html
Весь файл! Т.е нужно убрать все лишнее и сделать его...
|
||
KOPOJI | 27.01.2015 19:22 |
https://www.cyberforum.ru/post7156778.html
MS24, я еще раз повторяю - я без понятия, что вы считаете...
|
||
MS24 | 27.01.2015 19:25 |
https://www.cyberforum.ru/post7156798.html
Я хочу видеть только текст и форматирование.
|
||
KOPOJI | 27.01.2015 19:30 |
https://www.cyberforum.ru/post7156823.html
MS24, я не знаю, как вам еще сказать.
Грубо говоря, код...
|
||
MS24 | 27.01.2015 19:37 |
https://www.cyberforum.ru/post7156852.html
Блин не пинайте Вы сильно меня, я начинающий все таки. Я не...
|
||
castaway | 27.01.2015 19:38 |
https://www.cyberforum.ru/post7156855.html
А там кроме текста и форматирования больше ничего и нет.
...
|
||
MS24 | 27.01.2015 19:42 |
https://www.cyberforum.ru/post7156873.html
Блин вот я скачал страницу сайта, теперь мне обычному...
|
||
OlegKri | 27.01.2015 19:49 |
https://www.cyberforum.ru/post7156900.html
libxml2 - вот библиотека в помощь. и html, xml и др
|
||
MS24 | 27.01.2015 19:52 |
https://www.cyberforum.ru/post7156913.html
Забыл сказать, извините, по условиям ТЗ не должно...
|
||
castaway | 27.01.2015 19:53 |
https://www.cyberforum.ru/post7156920.html
Это сложная задача. Необходимо парсить всё и "коверкать"...
|
||
KOPOJI | 27.01.2015 22:58 |
https://www.cyberforum.ru/post7157592.html
Можно "зарегуляриться", например.
#include <iostream>...
|
||
MS24 | 13.04.2015 21:21 |
https://www.cyberforum.ru/post7475438.html
Вообщем был написан код, если кому-то понадобится мое...
|
||
KOPOJI | 13.04.2015 21:39 |
https://www.cyberforum.ru/post7475529.html
ну так выкладывайте код сюда, зачем в личку. Может, вам тут...
|
||
MS24 | 13.04.2015 22:55 |
https://www.cyberforum.ru/post7475900.html
Ну вообщем - то удалось мне только распарсить башорг )) вот...
|
||
KOPOJI | 14.04.2015 00:25 |
https://www.cyberforum.ru/post7476173.html
Я не плюсовик, но...
IsStringContain я бы добавил,...
|
||
Renji | 14.04.2015 00:59 |
https://www.cyberforum.ru/post7476242.html
Надо было качать страницу хотя-бы через curl. Явно не та...
|
||
MS24 | 14.04.2015 16:58 |
https://www.cyberforum.ru/post7478792.html
Та ребят вы меня сильно не пинайте, я сам...
|
||
|
||||
Similar |
Извлечь из веб-страницы только полезную информацию отбросив весь «мусор» Как получить из веб-страницы только полезную информацию, отбросив весь «мусор» (навигацию, рекламу и тд) Вытащить информацию с веб-страницы Вытащить информацию из веб-страницы |
|||
Ads |
|
|||
MoreAnswers |
Убрать весь мусор с распарсеной страницы HtmlAgilityPack Вытащить инфу из веб-страницы Получить весь текст веб-страницы Как вытащить нужную информацию из кода страницы? |
|||