Форум программистов, компьютерный форум, киберфорум
C++ Builder
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 5.00/13: Рейтинг темы: голосов - 13, средняя оценка - 5.00
4 / 4 / 0
Регистрация: 23.08.2011
Сообщений: 26

Получить все ссылки со страницы сайта

06.10.2011, 23:07. Показов 2732. Ответов 2
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Здравствуйте ув. форумчане!
Подскажите как получить все ссылки со страницы сайта (CppWebbrowser).

Добавлено через 13 минут
Нашел рабочий код для bcb (borland c++ builder)... Если кому интересно:
C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
#include "mshtml.h"
TStringList *mass_link = new TStringList();  // массив ссылок, из html
 
void getLinksFromDoc(IHTMLDocument2 *pDoc)
{
    TComInterface<IHTMLElementCollection> pCollection;
    if(SUCCEEDED(pDoc->get_links(&pCollection)))
    {
        TComInterface<IDispatch> pDisp;
        long len;
        pCollection->get_length(&len); // всего ссылок
        for(long i = 0; i < len; i++)
        {
            TComInterface<IDispatch> pDisp;
            if(SUCCEEDED(pCollection->item(TVariant(i), TVariant(0), &pDisp)))
            {
                TComInterface<IHTMLElement> pElement;
                if(SUCCEEDED(pDisp->QueryInterface(IID_IHTMLElement, (LPVOID*)&pElement)))
                {
                    WideString link;
                    pElement->toString(&link);
                    //pElement->click();
                    mass_link->Add(link);
                }
            }
        }
    }
}
 
 
void get_link(int brauser_num)
{ // получить все ссылки находящиеся на странице
 
    mass_link->Clear();      //очищаем массив
    TCppWebBrowser *CppWB = Form1->CppWebBrowser1; // Здесь выбирай, с чем работать
 
 
    IHTMLDocument2 *pHTMLDocument = NULL ;
    try
    {
        if( SUCCEEDED(CppWB->Document->QueryInterface(IID_IHTMLDocument2, (LPVOID*)&pHTMLDocument)) )
        {
            IDispatch* iDisp;
            IHTMLDocument2* iDoc;
            IHTMLFramesCollection2 *pFrames = NULL;
            long frameCount = 0;
 
            if(SUCCEEDED(pHTMLDocument->get_frames(&pFrames)))
            {
                pFrames->get_length(&frameCount);
                VARIANT vFrame;
                VARIANT ret;
                vFrame.vt = VT_UINT;
 
                for(long frameIx = 0; frameIx < frameCount; frameIx++)
                {
                    vFrame.lVal = frameIx;
                    if(SUCCEEDED(pFrames->item(&vFrame, &ret)))
                    {
                        IHTMLWindow2 *pWindow = NULL;
                        if(SUCCEEDED(ret.pdispVal->QueryInterface(IID_IHTMLWindow2, (LPVOID*)&pWindow)))
                        {
                            IHTMLDocument2 *pDoc = NULL;
                            if(SUCCEEDED(pWindow->get_document(&pDoc)))
                            {
                                getLinksFromDoc(pDoc);
                            }
                        }
                    }
                }
            }
 
            getLinksFromDoc(pHTMLDocument);
        }
    }
    catch (Exception &exception)
    {
        // ...
    }
}
4
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
06.10.2011, 23:07
Ответы с готовыми решениями:

Как получить все ссылки на страницы сайта, которые находятся в выдаче гугл?
Как получить все ссылки на страницы сайта, которые находятся в выдаче гугл? Нужно считывать все ссылки которыые находятся в выдаче у...

Получить все ссылки с веб-страницы по webbrowser
Как получить абсолютные адреса страниц ссылок с загруженного адреса ?

Получить все ссылки и заголовки с сайта
Здравствуйте, есть задание: На вход программа получает адрес веб-сайта. Необходимо вытащить все ссылки и заголовок для каждой ссылки,...

2
 Аватар для cpp_developer
20124 / 5691 / 417
Регистрация: 09.04.2010
Сообщений: 22,546
Записей в блоге: 1
07.10.2011, 11:25
а использование ?
0
4 / 4 / 0
Регистрация: 23.08.2011
Сообщений: 26
07.10.2011, 17:32  [ТС]
Используйте процедуру:
get_link(int brauser_num)
Все найденные ссылки будут хранится в mass_link (TStringList)

P.S. не вижу необходимости во входящем параметре "int brauser_num"...
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
07.10.2011, 17:32
Помогаю со студенческими работами здесь

Получить все ответвления сайта (ссылки)
Доброй день дорогие пользователи :) Передо мной стоит задача получить все ответвления сайт(ссылки). Я пробовал извлечь из ответа,но...

Как получить все ссылки со страницы регулярными выражениями?
Здравствуйте, скажите пожалуйста как получить все ссылки со страницы регулярными выражениями? Добавлено через 6 минут &lt;? ...

Как получить все ссылки меню с сайта?
Как получить все ссылки меню с сайта,если они даже не указанны в меню?

Получить все внутренние ссылки с какого-либо сайта
Здравствуйте. Как можно получить все ссылки с какого-то сайта, которые ведет на этот же сайт. Нужно получить только те ссылки которые...

Получить все страницы сайта
Есть ли возможность получить все страницы и папки на сайте ? Просто вроде давно где-то видел пример и не могу найти сейчас


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
3
Ответ Создать тему
Новые блоги и статьи
Access
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
Новый ноутбук
volvo 07.12.2025
Всем привет. По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне: Ryzen 5 7533HS 64 Gb DDR5 1Tb NVMe 16" Full HD Display Win11 Pro
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов На странице: https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/ нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином. Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов. . . .
Ломающие изменения в C#.NStar Alpha
Etyuhibosecyu 20.11.2025
Уже можно не только тестировать, но и пользоваться C#. NStar - писать оконные приложения, содержащие надписи, кнопки, текстовые поля и даже изображения, например, моя игра "Три в ряд" написана на этом. . .
Мысли в слух
kumehtar 18.11.2025
Кстати, совсем недавно имел разговор на тему медитаций с людьми. И обнаружил, что они вообще не понимают что такое медитация и зачем она нужна. Самые базовые вещи. Для них это - когда просто люди. . .
Создание Single Page Application на фреймах
krapotkin 16.11.2025
Статья исключительно для начинающих. Подходы оригинальностью не блещут. В век Веб все очень привыкли к дизайну Single-Page-Application . Быстренько разберем подход "на фреймах". Мы делаем одну. . .
Фото: Daniel Greenwood
kumehtar 13.11.2025
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2025, CyberForum.ru