Форум программистов, компьютерный форум, киберфорум
C#: Web, ASP.NET
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.50/14: Рейтинг темы: голосов - 14, средняя оценка - 4.50
0 / 1 / 3
Регистрация: 27.03.2012

Не могу разобраться с Microsoft.XMLHTTP и Pattern

25.07.2007, 14:12. Показов 2685. Ответов 12
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Знаю, что писали уже где-то об этом, но что-то у меня не получается, так что не ругайтесь сильно... Проблема в следующем, есть скрипт http://www.relib.com/xml_test.asp который сдирает данные с другой страницы. Сдирает полностью, а мне надо только серединку, начиная от 'Документы 1 - 10 из 35' и заканчивая '[Вернуться на главную страницу Relib.com]'. Функцию использую следующую:

' ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
' Function to return binary data
' ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Function GetHTMLBin(strURL)
Dim objXMLHTTP, strReturn
Set objXMLHTTP = Server.CreateObject('Microsoft.XMLHTTP')

objXMLHTTP.Open 'GET', strURL, False
objXMLHTTP.Send Cstr(Rnd())

GetHTMLBin = objXMLHTTP.responseBody
Set objXMLHTTP = Nothing
End Function

Оригинал находится по адресу:

http://sitelevel.whatuseek.com/query.go?crid=1fa387c33db52314&query=iis &slice_title=site&page=&domain=&exclude= &autocustomize=

Что надо написать в Pattern, чтобы выдрать код как надо?
0
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
25.07.2007, 14:12
Ответы с готовыми решениями:

Не могу разобраться с Microsoft acces 2003
Не могу разобраться с Microsoft acces 2003 в последнем задании "добавить итоговое поле в примечание отчета" и получить зачет. Помогите...

Не могу разобраться с visual studio and Microsoft sql server
Здравствуйте проблема заключается в том,что в sql я не могу создать таблицы, а в визуал студио не могу загрузить базу данных. Я вижу что...

Microsoft.XMLHTTP: System error -1072896748
есть страничка с клиенстким JScript: var req; var url = "test.asp" req = new ActiveXObject("Microsoft.XMLHTTP"); ...

12
4 / 4 / 5
Регистрация: 10.05.2007
Сообщений: 1,616
25.07.2007, 15:15
Документы 1 - 10 из 35 (.|
)*[Вернуться на главную страницу Relib.com]

Я тебе и отвечал в прошлый раз.
0
0 / 1 / 3
Регистрация: 27.03.2012
25.07.2007, 16:13
okey, исправил процедуру на следующее:

Function GetHTMLBin(strURL)
Dim objXMLHTTP, strReturn
Set objXMLHTTP = Server.CreateObject('Microsoft.XMLHTTP')

objXMLHTTP.Open 'GET', strURL, False
objXMLHTTP.Send Cstr(Rnd())

Set oRegExp=CreateObject('VBScript.RegExp')
oRegExp.Global=True
oRegExp.IgnoreCase=True
oRegExp.Pattern='Документы 1 - 10 из 35 (.|
)*[Вернуться на главную страницу Relib.com]'
Set oMatches=oRegExp.Execute(objXMLHTTP.resp onseBody)

GetHTMLBin = oMatches.Item(0).SubMatches(0)
Set objXMLHTTP = Nothing
End Function

Результат следующий:

Error Type:
Microsoft VBScript runtime (0x800A0005)
Invalid procedure call or argument
/xml_test.asp, line 18
0
0 / 1 / 3
Регистрация: 27.03.2012
25.07.2007, 16:14
В 18-й строке написано следующее:

GetHTMLBin = oMatches.Item(0).SubMatches(0)
0
4 / 4 / 5
Регистрация: 10.05.2007
Сообщений: 1,616
25.07.2007, 16:38
Ну я ж тебе для примера написал pattern, там суть в том что (.|
)*. А ошибка это значит не нашел он ничего по этому образцу и коллекция пустая
Pattern примерно так выглядит
и.
(.|
)[В
0
4 / 4 / 5
Регистрация: 10.05.2007
Сообщений: 1,616
25.07.2007, 16:54
Сейчас проверил очень долго работает поиск регэкспа, что естественно, гораздо прагматичнее в твоем случае искать строку где начало и искать строку где конец - вот она по моему '<p align=center><a href=http://www.relib.com>'

РегЭкспы слабо эффективны при вырезании информации из больших текстов, да и в твоем случае это нужно по-моему. Лучше обойтись Left,Right,Mid,InStr
0
0 / 1 / 3
Регистрация: 27.03.2012
25.07.2007, 17:47
Спасибо, с Left,Right я попробую, чтобы сравнить быстродействие, но хочется добить этот RegExp, раз уж начал... попробовал и

oRegExp.Pattern='и.
(.|
)[В'

и

oRegExp.Pattern='До.
(.|
)<p align=center><a href=http://www.relib.com>'

результат одинаковый oMatches.Count=0

Сейчас код такой:

<%
' ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
' Function to return binary data
' ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Function GetHTMLBin(strURL)
Dim objXMLHTTP, strReturn
Set objXMLHTTP = Server.CreateObject('Microsoft.XMLHTTP')

objXMLHTTP.Open 'GET', strURL, False
objXMLHTTP.Send Cstr(Rnd())

Set oRegExp=CreateObject('VBScript.RegExp')
oRegExp.Global=True
oRegExp.IgnoreCase=True
oRegExp.Pattern='До.
(.|
)<p align=center><a href=http://www.relib.com>'
Set oMatches=oRegExp.Execute(objXMLHTTP.resp onseBody)

if oMatches.Count > 0 then
GetHTMLBin = RetStr & oMatches.Item(0).SubMatches(0)
else
GetHTMLBin = 'No records found'
end if
Set objXMLHTTP = Nothing
End Function

' ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
' Function to convert binary data to text
' ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Function BinToText(varBinData, intDataSizeInBytes) ' as String
Const adFldLong = &H00000080
Const adVarChar = 200
Set objRS = Server.CreateObject('ADODB.Recordset')

objRS.Fields.Append 'txt', adVarChar, intDataSizeInBytes, adFldLong
objRS.Open

objRS.AddNew
objRS.Fields('txt').AppendChunk varBinData
BinToText = objRS('txt').Value

objRS.Close
Set objRS = Nothing
End Function

Response.Write BinToText(GetHTMLBin('http://sitelevel.whatuseek.com/query.go?crid=1fa387c33db52314&query=iis &slice_title=&page=&domain=&exclude=&aut ocustomize='), 35000)
%>

Где проблема?
0
4 / 4 / 5
Регистрация: 10.05.2007
Сообщений: 1,616
25.07.2007, 17:58
Я сделал нормальный паттерн по которому можно вырезать информацию и проверил на этом сайте. Тормозит зверски. А фишка в том что надо вместо
ставить [
]

='и.[
](.|[
])*[В'
0
0 / 1 / 3
Регистрация: 27.03.2012
25.07.2007, 18:03
Может я чего не так делаю? Взгляни ;-(

http://www.relib.com/xml_test.asp

то же самое с твоей последней pattern
0
4 / 4 / 5
Регистрация: 10.05.2007
Сообщений: 1,616
25.07.2007, 18:04
Черт, оказалось не так уж зверски.

В файле a.html HTML того URL, который ты давал.

Set oRegExp=CreateObject('VBScript.RegExp')
With oRegExp
.Global=True
.IgnoreCase=True
.Pattern='и.[
]+(.|[
])*[В'
End With
Set oFSO=CreateObject('Scripting.FileSystemO bject')
Set oFile=oFSO.OpenTextFile('a.html',1)
Data=oFile.ReadAll
Set oMatches=oRegExp.Execute(Data)
Set oFile=oFSO.CreateTextFile('b.html',2)
oFile.Write oMatches.Item(0)
0
4 / 4 / 5
Регистрация: 10.05.2007
Сообщений: 1,616
25.07.2007, 18:09
Ну че заработало? а то мне скоро домой уходить :-)
0
0 / 1 / 3
Регистрация: 27.03.2012
25.07.2007, 18:28
Слушай, последний пример работает, но там используется статический файл, который я по твоему примеру сделал и положил на сервер. А вот то что я посылал и пытался сделать - разбор на лету не работает, выдает 0 результатов и хоть ты тресни! Может быть проблема тут где-то?

Set oMatches=oRegExp.Execute(objXMLHTTP.resp onseBody)

Ладно, я еще поэкспериментирую и о результатах доложу :-) Спасибо за помощь!
0
4 / 4 / 5
Регистрация: 10.05.2007
Сообщений: 1,616
25.07.2007, 18:53
вроде все работает

Function GetHTMLBin(strURL)
Dim objXMLHTTP, strReturn
Set objXMLHTTP = CreateObject('Microsoft.XMLHTTP')

objXMLHTTP.Open 'GET', strURL, False
objXMLHTTP.Send Cstr(Rnd())

Set oRegExp=CreateObject('VBScript.RegExp')
oRegExp.Global=True
oRegExp.IgnoreCase=True
oRegExp.Pattern='и.[
]+((.|[
])*)[&#1042'
Set oMatches=oRegExp.Execute(BinToText(objXM LHTTP.responseBody,LenB(objXMLHTTP.respo nseBody)))

if oMatches.Count > 0 then
GetHTMLBin = RetStr & oMatches.Item(0).Submatches(0)
else
GetHTMLBin = 'No records found'
end if
Set objXMLHTTP = Nothing
End Function

' ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
' Function to convert binary data to text
' ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Function BinToText(varBinData, intDataSizeInBytes) ' as String
Const adFldLong = &H00000080
Const adVarChar = 200
Set objRS = CreateObject('ADODB.Recordset')

objRS.Fields.Append 'txt', adVarChar, intDataSizeInBytes, adFldLong
objRS.Open

objRS.AddNew
objRS.Fields('txt').AppendChunk varBinData
BinToText = objRS('txt').Value

objRS.Close
Set objRS = Nothing
End Function

MsgBox GetHTMLBin('http://sitelevel.whatuseek.com/query.go?crid=1fa387c33db52314&query=iis &slice_title=&page=&domain=&exclude=&aut ocustomize=')
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
25.07.2007, 18:53
Помогаю со студенческими работами здесь

Чтение содержимого русскоязычного сайта с помощью Microsoft.XMLHTTP -> ?????
Код выдергивания содержимого setlocale('ru') Session.LCID = 1049 url = 'http://www.mail.ru' Set oXHTTP =...

microsoft.xmlhttp... Как считать посланные данные на ASP странице?
JavaScript посылает через xmlhttp данные на ASP страницу. Посылает XML в виде строки или в виде объекта DOM... var x_xmlhttp=new...

Что отдает Microsoft.XMLHTTP? (нужно вытащить html source code)
Есть код &lt;code&gt; Set oXMLHTTP = CreateObject ('Microsoft.XMLHTTP') oXMLHTTP.Open 'POST', 'http://someurl', False ...

Разобраться в Regex pattern
В общем. Есть код: public static string Text2(string text) { string pat =...

Задали работу, не могу разобраться. Используется делфи 10, не могу разобраться, как это сделать
В одномерном массиве, состоящем из n вещественных элементов, вычислить: минимальный элемент массива и сумму элементов массива,...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
13
Ответ Создать тему
Новые блоги и статьи
Thinkpad X220 Tablet — это лучший бюджетный ноутбук для учёбы, точка.
Programma_Boinc 23.12.2025
Thinkpad X220 Tablet — это лучший бюджетный ноутбук для учёбы, точка. Рецензия / Мнение Это мой обзор планшета X220 с точки зрения школьника. Недавно я решила попытаться уменьшить свой. . .
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта Симптом: После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
Как объединить две одинаковые БД Access с разными данными
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
Новый ноутбук
volvo 07.12.2025
Всем привет. По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне: Ryzen 5 7533HS 64 Gb DDR5 1Tb NVMe 16" Full HD Display Win11 Pro
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов На странице: https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/ нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином. Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов. . . .
Ломающие изменения в C#.NStar Alpha
Etyuhibosecyu 20.11.2025
Уже можно не только тестировать, но и пользоваться C#. NStar - писать оконные приложения, содержащие надписи, кнопки, текстовые поля и даже изображения, например, моя игра "Три в ряд" написана на этом. . .
Мысли в слух
kumehtar 18.11.2025
Кстати, совсем недавно имел разговор на тему медитаций с людьми. И обнаружил, что они вообще не понимают что такое медитация и зачем она нужна. Самые базовые вещи. Для них это - когда просто люди. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2025, CyberForum.ru