Форум программистов, компьютерный форум, киберфорум
Наши страницы
C++ Builder
Войти
Регистрация
Восстановить пароль
 
Рейтинг 4.50/6: Рейтинг темы: голосов - 6, средняя оценка - 4.50
c0lumb
4 / 4 / 0
Регистрация: 23.08.2011
Сообщений: 26
1

Получить все ссылки со страницы сайта

06.10.2011, 23:07. Просмотров 1054. Ответов 2
Метки нет (Все метки)

Здравствуйте ув. форумчане!
Подскажите как получить все ссылки со страницы сайта (CppWebbrowser).

Добавлено через 13 минут
Нашел рабочий код для bcb (borland c++ builder)... Если кому интересно:
C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
#include "mshtml.h"
TStringList *mass_link = new TStringList();  // массив ссылок, из html
 
void getLinksFromDoc(IHTMLDocument2 *pDoc)
{
    TComInterface<IHTMLElementCollection> pCollection;
    if(SUCCEEDED(pDoc->get_links(&pCollection)))
    {
        TComInterface<IDispatch> pDisp;
        long len;
        pCollection->get_length(&len); // всего ссылок
        for(long i = 0; i < len; i++)
        {
            TComInterface<IDispatch> pDisp;
            if(SUCCEEDED(pCollection->item(TVariant(i), TVariant(0), &pDisp)))
            {
                TComInterface<IHTMLElement> pElement;
                if(SUCCEEDED(pDisp->QueryInterface(IID_IHTMLElement, (LPVOID*)&pElement)))
                {
                    WideString link;
                    pElement->toString(&link);
                    //pElement->click();
                    mass_link->Add(link);
                }
            }
        }
    }
}
 
 
void get_link(int brauser_num)
{ // получить все ссылки находящиеся на странице
 
    mass_link->Clear();      //очищаем массив
    TCppWebBrowser *CppWB = Form1->CppWebBrowser1; // Здесь выбирай, с чем работать
 
 
    IHTMLDocument2 *pHTMLDocument = NULL ;
    try
    {
        if( SUCCEEDED(CppWB->Document->QueryInterface(IID_IHTMLDocument2, (LPVOID*)&pHTMLDocument)) )
        {
            IDispatch* iDisp;
            IHTMLDocument2* iDoc;
            IHTMLFramesCollection2 *pFrames = NULL;
            long frameCount = 0;
 
            if(SUCCEEDED(pHTMLDocument->get_frames(&pFrames)))
            {
                pFrames->get_length(&frameCount);
                VARIANT vFrame;
                VARIANT ret;
                vFrame.vt = VT_UINT;
 
                for(long frameIx = 0; frameIx < frameCount; frameIx++)
                {
                    vFrame.lVal = frameIx;
                    if(SUCCEEDED(pFrames->item(&vFrame, &ret)))
                    {
                        IHTMLWindow2 *pWindow = NULL;
                        if(SUCCEEDED(ret.pdispVal->QueryInterface(IID_IHTMLWindow2, (LPVOID*)&pWindow)))
                        {
                            IHTMLDocument2 *pDoc = NULL;
                            if(SUCCEEDED(pWindow->get_document(&pDoc)))
                            {
                                getLinksFromDoc(pDoc);
                            }
                        }
                    }
                }
            }
 
            getLinksFromDoc(pHTMLDocument);
        }
    }
    catch (Exception &exception)
    {
        // ...
    }
}
4
Similar
Эксперт
41792 / 34177 / 6122
Регистрация: 12.04.2006
Сообщений: 57,940
06.10.2011, 23:07
Ответы с готовыми решениями:

Получить все URL с указанной страницы
Добрый день. Имеется две задачи: 1) Собрать все УРЛы на сайте 2) Для заданного списка УРЛов...

Как получить все ссылки на страницы сайта, которые находятся в выдаче гугл?
Как получить все ссылки на страницы сайта, которые находятся в выдаче гугл? Нужно считывать все...

Получить все ссылки с веб-страницы по webbrowser
Как получить абсолютные адреса страниц ссылок с загруженного адреса ?

Получить все ссылки и заголовки с сайта
Здравствуйте, есть задание: На вход программа получает адрес веб-сайта. Необходимо вытащить все...

Получить все ответвления сайта (ссылки)
Доброй день дорогие пользователи :) Передо мной стоит задача получить все ответвления...

2
LK
Заблокирован
07.10.2011, 11:25 2
а использование ?
0
c0lumb
4 / 4 / 0
Регистрация: 23.08.2011
Сообщений: 26
07.10.2011, 17:32  [ТС] 3
Используйте процедуру:
get_link(int brauser_num)
Все найденные ссылки будут хранится в mass_link (TStringList)

P.S. не вижу необходимости во входящем параметре "int brauser_num"...
0
MoreAnswers
Эксперт
37091 / 29110 / 5898
Регистрация: 17.06.2006
Сообщений: 43,301
07.10.2011, 17:32

Как получить все ссылки со страницы регулярными выражениями?
Здравствуйте, скажите пожалуйста как получить все ссылки со страницы регулярными выражениями? ...

Как получить все ссылки меню с сайта?
Как получить все ссылки меню с сайта,если они даже не указанны в меню?

Получить все внутренние ссылки с какого-либо сайта
Здравствуйте. Как можно получить все ссылки с какого-то сайта, которые ведет на этот же сайт....


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
3
Ответ Создать тему
Опции темы

КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin® Version 3.8.9
Copyright ©2000 - 2019, vBulletin Solutions, Inc.
Рейтинг@Mail.ru