30 / 26 / 8
Регистрация: 17.09.2015
Сообщений: 498
Записей в блоге: 6

Парсинг HTML

02.01.2018, 16:22. Показов 2875. Ответов 6
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
С Новым Годом!

Звучит банально "парсинг html".
Написал десяток парсеров, получил за это деньги, все хорошо.

Делаю так:

1. Загружаю текст из ресурса
2. Прогоняю html через этот код
Кликните здесь для просмотра всего текста
Delphi
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
function GetHTMLColection(Responce: string): IHTMLDocument2;
var
 i                // счетчик
 : integer;
 V           : OleVariant;           // OLe
 Doc         : IHTMLDocument2;
 DocAll,                             // весь документ
 TagColection
         : IHTMLElementCollection;
 adr      : IHTMLElementCollection;
begin
 // создаем экземпляр
  Doc := coHTMLDocument.Create as IHTMLDocument2;
  if Doc = nil then
  begin
    exit;
  end;
 
  v := VarArrayCreate([0,0],VarVariant);
  v[0] := Responce;
  Doc.write(PSafeArray(TVarData(v).VArray));
 
  result := Doc;
end;


3. Далее все как по накатанной

Кликните здесь для просмотра всего текста
Delphi
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
var
 n: integer;
 TagColection : IHTMLElementCollection;
 element      : IHTMLElement;
 href         : string;
begin
  CoInitialize(nil);
  result := nil;
  result := TStringList.Create;
 
  {коллекция тэгов}
  TagColection := GetHTMLColection(HtmlSource).all;
 
  // перебираем теги
  for n := 0 to TagColection.length -1 do
  begin
   element := TagColection.item(n,0) as IHTMLElement;
   try
     if AnsiLowerCase(element._className) = AnsiLowerCase(_ClassName) then
     begin
       href := element.getAttribute('href',0);
       if href <> '' then
         result.Add(href);
     end;
   except
 
   end;
 
  end;
  TagColection := nil;
  CoUninitialize;


Но вижу следующее.

Я думаю далее комментарии не нужны...

Кликните здесь для просмотра всего текста


Всего 16 элементов, должно быть больше.
0
Лучшие ответы (1)
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
02.01.2018, 16:22
Ответы с готовыми решениями:

Парсинг html
У меня есть программа, которая парсит определенный текст из html между двумя другими определенными текстами. Код следующий: ...

Парсинг HTML
Всем привет. В общем, нужно спарсить баланс одного сайта, вот код с сайта: Ваш баланс: &lt;b&gt;&lt;a...

Парсинг HTML
Здравствуйте, очень давно увлекался Delphi, и вот для решения задчки пригодилось, к сожалению многое забыл, буду рад если поможите. Цель...

6
30 / 26 / 8
Регистрация: 17.09.2015
Сообщений: 498
Записей в блоге: 6
02.01.2018, 16:22  [ТС]
В чем беда?
Этот феномен не на всех сайтах происходит.
0
5989 / 4564 / 1096
Регистрация: 29.08.2013
Сообщений: 28,207
Записей в блоге: 3
02.01.2018, 16:41
сразу после присваивания напиши
Delphi
1
2
TagCollection:=...
Showmessage(inttostr(TagCollection.Length));
0
30 / 26 / 8
Регистрация: 17.09.2015
Сообщений: 498
Записей в блоге: 6
02.01.2018, 16:45  [ТС]
Цитата Сообщение от qwertehok Посмотреть сообщение
сразу после присваивания напиши
DelphiВыделить код
1
2
TagCollection:=...
Showmessage(inttostr(TagCollection.Lengt h));
0
30 / 26 / 8
Регистрация: 17.09.2015
Сообщений: 498
Записей в блоге: 6
02.01.2018, 16:48  [ТС]
HTML5
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
<!DOCTYPE html>
<!--[if IE]><![endif]-->
<!--[if IE 8 ]><html dir="ltr" lang="ru" class="ie8"><![endif]-->
<!--[if IE 9 ]><html dir="ltr" lang="ru" class="ie9"><![endif]-->
<!--[if (gt IE 9)|!(IE)]><!-->
<html dir="ltr" lang="ru">
<!--<![endif]-->
<head>
<meta charset="UTF-8" />
<meta name="viewport" content="width=device-width, initial-scale=1">
<meta http-equiv="X-UA-Compatible" content="IE=edge">
<title>Каталог авто запчастей - Выбор производителя</title>
<base href="http://autoparts.local/" />
<meta name="description" content="Каталог авто запчастей" />
<meta name="keywords" content= "ACURA,ALFA ROMEO,AUDI,BMW,CADILLAC,CHERY,CHEVROLET,CHRYSLER,CITROËN,DACIA,DAEWOO,DAF,DAIHATSU,FAW,FIAT,FORD,GAZ,GEELY,GMC,GREAT WALL,HONDA,HUMMER,HYUNDAI,INFINITI,IVECO,JEEP,KIA,LADA,LANCIA,LAND ROVER,LEXUS,MAZDA,MERCEDES-BENZ,MG,MINI,MITSUBISHI,MOSKVICH,NISSAN,OPEL,PEUGEOT,PORSCHE,RENAULT,SAAB,SEAT,SKODA,SMART,SSANGYONG,SUBARU,SUZUKI,TOYOTA,UAZ,VOLVO,VW,ZAZ" />
<script src="catalog/view/javascript/jquery/jquery-2.1.1.min.js" type="text/javascript"></script>
<link href="catalog/view/javascript/bootstrap/css/bootstrap.min.css" rel="stylesheet" media="screen" />
                
                <script src="catalog/view/javascript/mf/jquery-ui.min.js" type="text/javascript"></script>
            
<script src="catalog/view/javascript/bootstrap/js/bootstrap.min.js" type="text/javascript"></script>
<link href="catalog/view/javascript/font-awesome/css/font-awesome.min.css" rel="stylesheet" type="text/css" />
<link href="//fonts.googleapis.com/css?family=Open+Sans:400,400i,300,700" rel="stylesheet" type="text/css" />
<link href="catalog/view/theme/default/stylesheet/stylesheet.css" rel="stylesheet">
<script src="catalog/view/javascript/common.js" type="text/javascript"></script>
<link href="http://autoparts.local/" rel="canonical" />
</head>
<body class="common-tecdoc_module">
<nav id="top">
  <div class="container">
        <div class="pull-left">
<form action="http://autoparts.local/autoparts/index.php?route=common/language/language" method="post" enctype="multipart/form-data" id="language">
  <div class="btn-group">
    <button class="btn btn-link dropdown-toggle" data-toggle="dropdown">
                    <img src="image/flags/<b>Notice</b>: Undefined index: image in <b>/home/admin/web/autoparts.local/public_html/catalog/view/theme/default/template/common/language.tpl</b> on line <b>8</b>" alt="Rus" title="Rus">
            <span class="hidden-xs hidden-sm hidden-md">Язык</span> <i class="fa fa-caret-down"></i></button>
    <ul class="dropdown-menu">
            <li><a href="en-gb"><img src="image/flags/<b>Notice</b>: Undefined index: image in <b>/home/admin/web/autoparts.local/public_html/catalog/view/theme/default/template/common/language.tpl</b> on line <b>14</b>" alt="English" title="English" /> English</a></li>
            <li><a href="ru-ru"><img src="image/flags/<b>Notice</b>: Undefined index: image in <b>/home/admin/web/autoparts.local/public_html/catalog/view/theme/default/template/common/language.tpl</b> on line <b>14</b>" alt="Rus" title="Rus" /> Rus</a></li>
          </ul>
  </div>
  <input type="hidden" name="code" value="" />
  <input type="hidden" name="redirect" value="/autoparts/" />
</form>
</div>
    <div id="top-links" class="nav pull-right">
      <ul class="list-inline">
        <li><a href="http://autoparts.local/autoparts/index.php?route=information/contact"><i class="fa fa-phone"></i></a> <span class="hidden-xs hidden-sm hidden-md">123456789</span></li>
        <li class="dropdown"><a href="http://autoparts.local/autoparts/index.php?route=account/account" title="Личный кабинет" class="dropdown-toggle" data-toggle="dropdown"><i class="fa fa-user"></i> <span class="hidden-xs hidden-sm hidden-md">Личный кабинет</span> <span class="caret"></span></a>
          <ul class="dropdown-menu dropdown-menu-right">
                        <li><a href="http://autoparts.local/autoparts/index.php?route=account/register">Регистрация</a></li>
            <li><a href="http://autoparts.local/autoparts/index.php?route=account/login">Авторизация</a></li>
                      </ul>
        </li>
        <li><a href="http://autoparts.local/autoparts/index.php?route=account/wishlist" id="wishlist-total" title="Закладки (0)"><i class="fa fa-heart"></i> <span class="hidden-xs hidden-sm hidden-md">Закладки (0)</span></a></li>
        <li><a href="http://autoparts.local/autoparts/index.php?route=checkout/cart" title="Корзина"><i class="fa fa-shopping-cart"></i> <span class="hidden-xs hidden-sm hidden-md">Корзина</span></a></li>
        <li><a href="http://autoparts.local/autoparts/index.php?route=checkout/checkout" title="Оформление заказа"><i class="fa fa-share"></i> <span class="hidden-xs hidden-sm hidden-md">Оформление заказа</span></a></li>
      </ul>
    </div>
  </div>
</nav>
<header>
  <div class="container">
    <div class="row">
      <div class="col-sm-4">
        <div id="logo">
                    <a href="http://autoparts.local/autoparts/index.php?route=common/home"><img src="http://autoparts.local/image/catalog/TecDoc.png" title="Your Store" alt="Your Store" class="img-responsive" /></a>
                  </div>
      </div>
      <div class="col-sm-5"><div class="input-group">
  <input type="text" name="search" id="artnum" value="" placeholder="Поиск" class="form-control input-lg" />
  <span class="input-group-btn">
    <button type="button" class="btn btn-default btn-lg" onclick="TDMArtSearch()"><i class="fa fa-search"></i></button>
  </span>
</div>
<script type="text/javascript">
function TDMArtSearch(){
    var art = $('#artnum').val();
    if(art!=''){
        art = art.replace(/[^a-zA-Z0-9.-]+/g, '');
        //art = art.replace(/[^a-zA-Z\/0-9.-]+/g, ''); art = art.replace('/', '!');
        location = '/autoparts/search/'+art+'/';
    }
}
$('#artnum').keypress(function (e){
  if(e.which == 13){ TDMArtSearch(); return false;}
});
</script>      </div>
      <div class="col-sm-3"></div>
    </div>
  </div>
</header>
<div class="container">
  <div class="row">                <div id="content" class="col-sm-12">
    <link rel="stylesheet" href="/autoparts/styles.css" type="text/css">
<script src="/autoparts/media/js/jquery-1.11.0.min.js"></script>
<script src="/autoparts/media/js/jquery-migrate-1.2.1.min.js"></script>
<script src="/autoparts/media/js/tdmfuncs.js"></script><div class="tdm_content"><link rel="stylesheet" href="/autoparts/templates/manufacturers/asd/style.css" type="text/css"><script src="/autoparts/templates/manufacturers/asd/funcs.js"></script>   <link rel="stylesheet" href="/autoparts/media/js/jquery-ui-1.10.4.custom/custom.css" />
    <script src="/autoparts/media/js/jquery-ui-1.10.4.custom/min.js"></script>  <script>$(function() {$( "#tabs" ).tabs();});</script>
<div class="tclear"></div>
<h1>Выбор производителя</h1>
 
 
    <div id="tabs">
        <ul>
            <li><a href="/autoparts/#cars" class="tbcars">Легковые авто</a></li>
            <li><a href="/autoparts/#tracks" class="tbtracks">Коммерческий транспорт</a></li>
        </ul>
        <div id="cars">
            <script>var AllLng = 'Все';</script>
            <div class="carsfilter">
                <a href="javascript:void(0)">Все</a>
            </div>
 
            <a href="/autoparts/acura/" class="fav_logo carsbuts" style="background:url(/autoparts/media/brands/90/ACURA.png)" title="ACURA"><div class="tdmbut-text">ACURA</div></a><a href="/autoparts/alfa-romeo/" class="fav_logo carsbuts" style="background:url(/autoparts/media/brands/90/ALFA.png)" title="ALFA ROMEO"><div class="tdmbut-text">ALFA ROMEO</div></a><a href="/autoparts/audi/" class="fav_logo carsbuts" style="background:url(/autoparts/media/brands/90/AUDI.png)" title="AUDI"><div class="tdmbut-text">AUDI</div></a><a href="/autoparts/bmw/" class="fav_logo carsbuts" style="background:url(/autoparts/media/brands/90/BMW.png)" title="BMW"><div class="tdmbut-text">BMW</div></a><a href="/autoparts/chery/" class="fav_logo carsbuts" style="background:url(/autoparts/media/brands/90/CHERY.png)" title="CHERY"><div class="tdmbut-text">CHERY</div></a><a href="/autoparts/chevrolet/" class="fav_logo carsbuts" style="background:url(/autoparts/media/brands/90/CHEVR.png)" title="CHEVROLET"><div class="tdmbut-text">CHEVROLET</div></a><a href="/autoparts/daewoo/" class="fav_logo carsbuts" style="background:url(/autoparts/media/brands/90/DAEWOO.png)" title="DAEWOO"><div class="tdmbut-text">DAEWOO</div></a><a href="/autoparts/fiat/" class="fav_logo carsbuts" style="background:url(/autoparts/media/brands/90/FIAT.png)" title="FIAT"><div class="tdmbut-text">FIAT</div></a><a href="/autoparts/ford/" class="fav_logo carsbuts" style="background:url(/autoparts/media/brands/90/FORD.png)" title="FORD"><div class="tdmbut-text">FORD</div></a><a href="/autoparts/honda/" class="fav_logo carsbuts" style="background:url(/autoparts/media/brands/90/HONDA.png)" title="HONDA"><div class="tdmbut-text">HONDA</div></a><a href="/autoparts/hyundai/" class="fav_logo carsbuts" style="background:url(/autoparts/media/brands/90/HYUNDAI.png)" title="HYUNDAI"><div class="tdmbut-text">HYUNDAI</div></a><a href="/autoparts/kia/" class="fav_logo carsbuts" style="background:url(/autoparts/media/brands/90/KIA.png)" title="KIA"><div class="tdmbut-text">KIA</div></a><a href="/autoparts/mazda/" class="fav_logo carsbuts" style="background:url(/autoparts/media/brands/90/MAZDA.png)" title="MAZDA"><div class="tdmbut-text">MAZDA</div></a><a href="/autoparts/mercedes-benz/" class="fav_logo carsbuts" style="background:url(/autoparts/media/brands/90/MERCE.png)" title="MERCEDES-BENZ"><div class="tdmbut-text">MERCEDES-BENZ</div></a><a href="/autoparts/mitsubishi/" class="fav_logo carsbuts" style="background:url(/autoparts/media/brands/90/MITSUBISHI.png)" title="MITSUBISHI"><div class="tdmbut-text">MITSUBISHI</div></a><a href="/autoparts/nissan/" class="fav_logo carsbuts" style="background:url(/autoparts/media/brands/90/NISSA.png)" title="NISSAN"><div class="tdmbut-text">NISSAN</div></a><a href="/autoparts/opel/" class="fav_logo carsbuts" style="background:url(/autoparts/media/brands/90/OPEL.png)" title="OPEL"><div class="tdmbut-text">OPEL</div></a><a href="/autoparts/peugeot/" class="fav_logo carsbuts" style="background:url(/autoparts/media/brands/90/PEUGE.png)" title="PEUGEOT"><div class="tdmbut-text">PEUGEOT</div></a><a href="/autoparts/renault/" class="fav_logo carsbuts" style="background:url(/autoparts/media/brands/90/RENAU.png)" title="RENAULT"><div class="tdmbut-text">RENAULT</div></a><a href="/autoparts/seat/" class="fav_logo carsbuts" style="background:url(/autoparts/media/brands/90/SEAT.png)" title="SEAT"><div class="tdmbut-text">SEAT</div></a><a href="/autoparts/skoda/" class="fav_logo carsbuts" style="background:url(/autoparts/media/brands/90/SKODA.png)" title="SKODA"><div class="tdmbut-text">SKODA</div></a><a href="/autoparts/subaru/" class="fav_logo carsbuts" style="background:url(/autoparts/media/brands/90/SUBAR.png)" title="SUBARU"><div class="tdmbut-text">SUBARU</div></a><a href="/autoparts/suzuki/" class="fav_logo carsbuts" style="background:url(/autoparts/media/brands/90/SUZUK.png)" title="SUZUKI"><div class="tdmbut-text">SUZUKI</div></a><a href="/autoparts/toyota/" class="fav_logo carsbuts" style="background:url(/autoparts/media/brands/90/TOYOT.png)" title="TOYOTA"><div class="tdmbut-text">TOYOTA</div></a><a href="/autoparts/vw/" class="fav_logo carsbuts" style="background:url(/autoparts/media/brands/90/VW.png)" title="VW"><div class="tdmbut-text">VW</div></a>         <div class="tclear"></div>
            <a href="/autoparts/cadillac/" class="tdmbut carsbuts">
                <div class="tdmbut-logo" style="background:url(/autoparts/media/brands/CADIL.png)"></div>
                <div class="tdmbut-text">CADILLAC</div></a><a href="/autoparts/chrysler/" class="tdmbut carsbuts">
                <div class="tdmbut-logo" style="background:url(/autoparts/media/brands/CHRYS.png)"></div>
                <div class="tdmbut-text">CHRYSLER</div></a><a href="/autoparts/citro%c3%8bn/" class="tdmbut carsbuts">
                <div class="tdmbut-logo" style="background:url(/autoparts/media/brands/CITRO.png)"></div>
                <div class="tdmbut-text">CITROËN</div></a><a href="/autoparts/dacia/" class="tdmbut carsbuts">
                <div class="tdmbut-logo" style="background:url(/autoparts/media/brands/DACIA.png)"></div>
                <div class="tdmbut-text">DACIA</div></a><a href="/autoparts/daf/" class="tdmbut carsbuts">
                <div class="tdmbut-logo" style="background:url(/autoparts/media/brands/DAF.png)"></div>
                <div class="tdmbut-text">DAF</div></a><a href="/autoparts/daihatsu/" class="tdmbut carsbuts">
                <div class="tdmbut-logo" style="background:url(/autoparts/media/brands/DAIHA.png)"></div>
                <div class="tdmbut-text">DAIHATSU</div></a><a href="/autoparts/faw/" class="tdmbut carsbuts">
                <div class="tdmbut-logo" style="background:url(/autoparts/media/brands/FAW.png)"></div>
                <div class="tdmbut-text">FAW</div></a><a href="/autoparts/gaz/" class="tdmbut carsbuts">
                <div class="tdmbut-logo" style="background:url(/autoparts/media/brands/GAZ.png)"></div>
                <div class="tdmbut-text">GAZ</div></a><a href="/autoparts/geely/" class="tdmbut carsbuts">
                <div class="tdmbut-logo" style="background:url(/autoparts/media/brands/GEELY.png)"></div>
                <div class="tdmbut-text">GEELY</div></a><a href="/autoparts/gmc/" class="tdmbut carsbuts">
                <div class="tdmbut-logo" style="background:url(/autoparts/media/brands/GMC.png)"></div>
                <div class="tdmbut-text">GMC</div></a><a href="/autoparts/great-wall/" class="tdmbut carsbuts">
                <div class="tdmbut-logo" style="background:url(/autoparts/media/brands/GREAT_WALL.png)"></div>
                <div class="tdmbut-text">GREAT WALL</div></a><a href="/autoparts/hummer/" class="tdmbut carsbuts">
                <div class="tdmbut-logo" style="background:url(/autoparts/media/brands/HUMME.png)"></div>
                <div class="tdmbut-text">HUMMER</div></a><a href="/autoparts/infiniti/" class="tdmbut carsbuts">
                <div class="tdmbut-logo" style="background:url(/autoparts/media/brands/INFIN.png)"></div>
                <div class="tdmbut-text">INFINITI</div></a><a href="/autoparts/iveco/" class="tdmbut carsbuts">
                <div class="tdmbut-logo" style="background:url(/autoparts/media/brands/IVECO.png)"></div>
                <div class="tdmbut-text">IVECO</div></a><a href="/autoparts/jeep/" class="tdmbut carsbuts">
                <div class="tdmbut-logo" style="background:url(/autoparts/media/brands/JEEP.png)"></div>
                <div class="tdmbut-text">JEEP</div></a><a href="/autoparts/lada/" class="tdmbut carsbuts">
                <div class="tdmbut-logo" style="background:url(/autoparts/media/brands/LADA.png)"></div>
                <div class="tdmbut-text">LADA</div></a><a href="/autoparts/lancia/" class="tdmbut carsbuts">
                <div class="tdmbut-logo" style="background:url(/autoparts/media/brands/LANCIA.png)"></div>
                <div class="tdmbut-text">LANCIA</div></a><a href="/autoparts/land-rover/" class="tdmbut carsbuts">
                <div class="tdmbut-logo" style="background:url(/autoparts/media/brands/LANDROVER.png)"></div>
                <div class="tdmbut-text">LAND ROVER</div></a><a href="/autoparts/lexus/" class="tdmbut carsbuts">
                <div class="tdmbut-logo" style="background:url(/autoparts/media/brands/LEXUS.png)"></div>
                <div class="tdmbut-text">LEXUS</div></a><a href="/autoparts/mg/" class="tdmbut carsbuts">
                <div class="tdmbut-logo" style="background:url(/autoparts/media/brands/MG.png)"></div>
                <div class="tdmbut-text">MG</div></a><a href="/autoparts/mini/" class="tdmbut carsbuts">
                <div class="tdmbut-logo" style="background:url(/autoparts/media/brands/MINI.png)"></div>
                <div class="tdmbut-text">MINI</div></a><a href="/autoparts/moskvich/" class="tdmbut carsbuts">
                <div class="tdmbut-logo" style="background:url(/autoparts/media/brands/MOSKV.png)"></div>
                <div class="tdmbut-text">MOSKVICH</div></a><a href="/autoparts/porsche/" class="tdmbut carsbuts">
                <div class="tdmbut-logo" style="background:url(/autoparts/media/brands/PORSC.png)"></div>
                <div class="tdmbut-text">PORSCHE</div></a><a href="/autoparts/saab/" class="tdmbut carsbuts">
                <div class="tdmbut-logo" style="background:url(/autoparts/media/brands/SAAB.png)"></div>
                <div class="tdmbut-text">SAAB</div></a><a href="/autoparts/smart/" class="tdmbut carsbuts">
                <div class="tdmbut-logo" style="background:url(/autoparts/media/brands/SMART.png)"></div>
                <div class="tdmbut-text">SMART</div></a><a href="/autoparts/ssangyong/" class="tdmbut carsbuts">
                <div class="tdmbut-logo" style="background:url(/autoparts/media/brands/SSANG.png)"></div>
                <div class="tdmbut-text">SSANGYONG</div></a><a href="/autoparts/uaz/" class="tdmbut carsbuts">
                <div class="tdmbut-logo" style="background:url(/autoparts/media/brands/UAZ.png)"></div>
                <div class="tdmbut-text">UAZ</div></a><a href="/autoparts/volvo/" class="tdmbut carsbuts">
                <div class="tdmbut-logo" style="background:url(/autoparts/media/brands/VOLVO.png)"></div>
                <div class="tdmbut-text">VOLVO</div></a><a href="/autoparts/zaz/" class="tdmbut carsbuts">
                <div class="tdmbut-logo" style="background:url(/autoparts/media/brands/ZAZ.png)"></div>
                <div class="tdmbut-text">ZAZ</div></a>          <div class="tclear"></div>
            
        </div>
        <div id="tracks">
            
            <a href="/autoparts/daewoo-trucks/" class="fav_logo" style="background:url(/autoparts/media/brands/90/DAEWOO.png)" title="DAEWOO"></a><a href="/autoparts/fiat-trucks/" class="fav_logo" style="background:url(/autoparts/media/brands/90/FIAT.png)" title="FIAT"></a><a href="/autoparts/ford-trucks/" class="fav_logo" style="background:url(/autoparts/media/brands/90/FORD.png)" title="FORD"></a><a href="/autoparts/hyundai-trucks/" class="fav_logo" style="background:url(/autoparts/media/brands/90/HYUNDAI.png)" title="HYUNDAI"></a><a href="/autoparts/kia-trucks/" class="fav_logo" style="background:url(/autoparts/media/brands/90/KIA.png)" title="KIA"></a><a href="/autoparts/mercedes-benz-trucks/" class="fav_logo" style="background:url(/autoparts/media/brands/90/MERCE.png)" title="MERCEDES-BENZ"></a><a href="/autoparts/mitsubishi-trucks/" class="fav_logo" style="background:url(/autoparts/media/brands/90/MITSUBISHI.png)" title="MITSUBISHI"></a><a href="/autoparts/nissan-trucks/" class="fav_logo" style="background:url(/autoparts/media/brands/90/NISSA.png)" title="NISSAN"></a><a href="/autoparts/vw-trucks/" class="fav_logo" style="background:url(/autoparts/media/brands/90/VW.png)" title="VW"></a>            <div class="tclear"></div>
            <a href="/autoparts/daf-trucks/" class="tdmbut tracksbuts">
                <div class="tdmbut-logo" style="background:url(/autoparts/media/brands/DAF.png)"></div>
                <div class="tdmbut-text">DAF</div></a><a href="/autoparts/gaz-trucks/" class="tdmbut tracksbuts">
                <div class="tdmbut-logo" style="background:url(/autoparts/media/brands/GAZ.png)"></div>
                <div class="tdmbut-text">GAZ</div></a><a href="/autoparts/iveco-trucks/" class="tdmbut tracksbuts">
                <div class="tdmbut-logo" style="background:url(/autoparts/media/brands/IVECO.png)"></div>
                <div class="tdmbut-text">IVECO</div></a><a href="/autoparts/volvo-trucks/" class="tdmbut tracksbuts">
                <div class="tdmbut-logo" style="background:url(/autoparts/media/brands/VOLVO.png)"></div>
                <div class="tdmbut-text">VOLVO</div></a>            <div class="tclear"></div>
            
        </div>
    </div>
 
<div class="tclear"></div></div><a href="http://tecdoc-module.com" target="_blank" class="tdmversion" title="3200">&nbsp;</a><style>.tdmversion{font-size:10px; display:block; color:#c1c1c1!important; float:right; margin:8px;}</style>   </div>
    </div>
</div>
<footer>
  <div class="container">
    <div class="row">
            <div class="col-sm-3">
        <h5>Информация</h5>
        <ul class="list-unstyled">
                    <li><a href="http://autoparts.local/autoparts/about_us">About Us</a></li>
                    <li><a href="http://autoparts.local/autoparts/guarantees_returns">Гарантии и возврат</a></li>
                    <li><a href="http://autoparts.local/autoparts/delivery">delivery</a></li>
                    <li><a href="http://autoparts.local/autoparts/terms">Terms &amp; Conditions</a></li>
                  </ul>
      </div>
            <div class="col-sm-3">
        <h5>Служба поддержки</h5>
        <ul class="list-unstyled">
          <li><a href="http://autoparts.local/autoparts/index.php?route=information/contact">Обратная связь</a></li>
          <li><a href="http://autoparts.local/autoparts/index.php?route=account/return/add">Возврат товара</a></li>
          <li><a href="http://autoparts.local/autoparts/index.php?route=information/sitemap">Карта сайта</a></li>
        </ul>
      </div>
      <div class="col-sm-3">
        <h5>Дополнительно</h5>
        <ul class="list-unstyled">
          <li><a href="http://autoparts.local/autoparts/index.php?route=product/manufacturer">Производители</a></li>
          <li><a href="http://autoparts.local/autoparts/index.php?route=account/voucher">Подарочные сертификаты</a></li>
          <li><a href="http://autoparts.local/autoparts/index.php?route=affiliate/account">Партнерская программа</a></li>
          <li><a href="http://autoparts.local/autoparts/index.php?route=product/special">Акции</a></li>
        </ul>
      </div>
      <div class="col-sm-3">
        <h5>Личный Кабинет</h5>
        <ul class="list-unstyled">
          <li><a href="http://autoparts.local/autoparts/index.php?route=account/account">Личный Кабинет</a></li>
          <li><a href="http://autoparts.local/autoparts/index.php?route=account/order">История заказов</a></li>
          <li><a href="http://autoparts.local/autoparts/index.php?route=account/wishlist">Закладки</a></li>
          <li><a href="http://autoparts.local/autoparts/index.php?route=account/newsletter">Рассылка</a></li>
        </ul>
      </div>
    </div>
    <hr>
    <p>Работает на <a href="http://opencart.com/">OpenCart</a></p>
  </div>
</footer>
 
<!--
OpenCart is open source software and you are free to remove the powered by OpenCart if you want, but its generally accepted practise to make a small donation.
Please donate via PayPal to donate@opencart.com
//-->
 
<!-- Theme created by Welford Media for OpenCart 2.0 www.welfordmedia.co.uk -->
 
</body></html>
Добавлено через 40 секунд
Это тот самый зловещий html
0
5989 / 4564 / 1096
Регистрация: 29.08.2013
Сообщений: 28,207
Записей в блоге: 3
02.01.2018, 16:51
ну смотри глубже
значит что то у тебя в GetHtmlCollention().all
0
30 / 26 / 8
Регистрация: 17.09.2015
Сообщений: 498
Записей в блоге: 6
02.01.2018, 17:57  [ТС]
Лучший ответ Сообщение было отмечено Joey как решение

Решение

qwertehok, C GetHtmlCollention
все в порядке.

Он же в других проектах работает и проблем нет.

Документ в UTF8
Может удалить все лишние управляющие символы?

Добавлено через 20 минут
Загрузил в парсер чистую структуру html

HTML5
1
2
3
4
5
6
7
8
9
10
11
12
13
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html4/strict.dtd">
<html>
 <head>
  <meta http-equiv="Content-Type" content="text/html; charset=utf-8">
  <title>Пример веб-страницы</title>
 </head>
 <body>
  <h1>Заголовок</h1>
  <!-- Комментарий -->
  <p>Первый абзац.</p>
  <p>Второй абзац.</p>
 </body>
</html>
Все работает!
Видимо есть какая то несовместимость в интерфейсах, хз.

буду копать.

Добавлено через 42 минуты
Проблема решилась после того, как я удалил теги

<script></sctipt>

Не понимаю почему эти теги повлияли на работу mshtml
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
02.01.2018, 17:57
Помогаю со студенческими работами здесь

Парсинг HTML кода
Добрый день! Есть такой &lt;span class=&quot;ui-button-text&quot;&gt; купить за 2820.31 едениц. &lt;span...

Парсинг HTML страницы
Имеется следующий текств html странице: &lt;/thead&gt;&lt;tbody&gt;&lt;tr class=&quot;OutOfBlock&quot;&gt;&lt;td...

Парсинг HTML кода
Добрый день! Есть такая &lt;/span&gt;&lt;/a&gt;&lt;span class=&quot;b_user_menu__item b_drop js_b_drop&quot;&gt;&lt;span class=&quot;text&quot;&gt;&lt;span&gt;Аккаунт&lt;/span&gt;&lt;span...

Парсинг html-страницы
Здравствуйте, помогите пожалуйста! есть html-текст: &lt;html&gt; &lt;head&gt; &lt;title&gt;Test&lt;/title&gt; &lt;body&gt; Программист. Хочу спарсить...

delphi и html парсинг)
Здравствуйте уважаемые программисты ! Делаю программу, неважно какую, но мне потребовалось извлечь из html файла тег &lt;form&gt; и его...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
7
Ответ Создать тему
Опции темы

Новые блоги и статьи
Валидация и контроль данных табличной части документа перед записью
Maks 22.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа, разработанного в КА2. Задача: контроль и валидация данных табличной части документа перед записью с учетом регламента компании. . .
Отчёт о затраченных материалах за определенный период с макетом печатной формы
Maks 21.04.2026
Отчёт из решения ниже размещён в конфигурации КА2. Задача: разработка отчёта по затраченным материалам за определённый период, с возможностью вывода печатной формы отчёта с шапкой и подвалом. В. . .
Отчёт о спецтехнике находящейся в ремонте
Maks 20.04.2026
Отчёт из решения ниже размещен в конфигурации КА2. Задача: отобразить спецтехнику, которая на данный момент находится в ремонте. Есть нетиповой документ "Заявка на ремонт спецтехники" который. . .
Памятка для бота и "визитка" для читателей "Semantic Universe Layer (Слой семантической вселенной)"
Hrethgir 19.04.2026
Сгенерировано для краткого описания по случаю сборки и компиляции скелета серверного приложения. И пусть после этого скажут, что статьи сгенерированные AI - туфта и не интересно. И это не реклама -. . .
Запрет удаления строк ТЧ документа при определённом условии
Maks 19.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "Аккумуляторы", разработанного в конфигурации КА2. У данного документа есть ТЧ, в которой в зависимости от прав доступа. . .
Модель заражения группы наркоманов
alhaos 17.04.2026
Условия задачи сформулированы тут Суть: - Группа наркоманов из 10 человек. - Только один инфицирован ВИЧ. - Колются одной иглой. - Колются раз в день. - Колются последовательно через. . .
Мысли в слух. Про "навсегда".
kumehtar 16.04.2026
Подумалось тут, что наверное очень глупо использовать во всяких своих установках понятие "навсегда". Это очень сильное понятие, и я только начинаю понимать край его смысла, не смотря на то что давно. . .
My Business CRM
MaGz GoLd 16.04.2026
Всем привет, недавно возникла потребность создать CRM, для личных нужд. Собственно программа предоставляет из себя базу данных клиентов, в которой можно фиксировать звонки, стадии сделки, а также. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru