Форум программистов, компьютерный форум, киберфорум
PHP: RegExp
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 5.00/5: Рейтинг темы: голосов - 5, средняя оценка - 5.00
0 / 0 / 0
Регистрация: 12.10.2013
Сообщений: 5

Спарсить со страницы данные о домене

26.11.2013, 18:05. Показов 1013. Ответов 3
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Доброго времени суток, подскажите, как реализовать следующее

проверяю домены на занятость. сервис отдает страничку, где домены вот в таком виде выводятся
HTML5
1
2
3
4
5
6
7
8
9
<tr class="tr_even">
  <td class="td_left td_all">
    <em>01</em>
    MUSIC.RU
  </td>
  <td class="td_right td_all" style="background-color:#ccffcc;" onmouseover="showHint('hint', '<p>Поставьте галочку, чтобы выбрать домен для дальнейшей регистрации.</p>')" onmouseout="hideHint('hint')">
    <input type="checkbox" name="01MUSICru" checked="">
  </td>
</tr>

С регулярками я не особо дружу, не пойму как отсюда вытянуть свободен домен или нет. На странице информация о 500+ доменах

Я предпологаю, что логично спарсить в массив все строки <td class="td_left td_all">(.*)</tr> и потом их уже обрабатывать?

У кого есть варианты как сделать это наиболее правильно и выгодно, подскажите куда копать. Надеюсь на вашу помощь, спасибо!
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
26.11.2013, 18:05
Ответы с готовыми решениями:

Спарсить данные с HTML страницы
Имеется HTML страница, со следующими содержаниеми: &lt;table class=&quot;table table-hover&quot;&gt; &lt;thead&gt; ...

Спарсить подгружающиеся данные со страницы (grab)
Добрый день. Я, к сожалению, новичок в Python и вообще в Web. Задача - раз в какой-то период заходить на сайт, проходить аутентификацию,...

Спарсить конкретные поля со страницы
Здравствуйте, помогите пожалуйста разобраться, задача такая: Я вставляю ссылку на страницу в текстбокс и необходимо получить данные из...

3
 Аватар для rus_dao
19 / 19 / 3
Регистрация: 26.07.2013
Сообщений: 61
28.11.2013, 17:58
Должен признаться, что регулярные выражения вовсе никакое не колдунство, а поиск вхождений по заданной маске. Из чего здесь можно сделать вывод ,что домен "MUSIC.RU" свободен? По псевдоклассу ячейки таблицы? "td_left td_all" или по сообщению - <p>Поставьте галочку, чтобы выбрать домен для дальнейшей регистрации.</p> ? если домен уже недоступен для регистрации, то как будет выглядеть ответ сервера? Так же?
Это необходимо знать, чтобы составить регулярное выражение. ещё внимательно сравните, все ли положительные ответы сервера выглядят одинаково?
0
0 / 0 / 0
Регистрация: 12.10.2013
Сообщений: 5
28.11.2013, 18:05  [ТС]
rus_dao, да я понимаю что не колдовство, просто нигде не могу найти нормальной справки)) сам пытаюсь составить, но чета както не идет..
HTML5
1
2
3
4
<td class="td_left td_all">
    <em>01</em>
    MUSIC.RU
  </td>
здесь доме 01music.ru
HTML5
1
2
3
<td class="td_right td_all" style="background-color:#ccffcc;" onmouseover="showHint('hint', '<p>Поставьте галочку, чтобы выбрать домен для дальнейшей регистрации.</p>')" onmouseout="hideHint('hint')">
    <input type="checkbox" name="01MUSICru" checked="">
  </td>
здесь признак можно взять, например, style="background-color:#ccffcc;", либо текст как вы сказали

но нужно учитывать что таких строк таблицы
HTML5
1
2
3
4
5
6
7
8
9
<tr class="tr_even">
  <td class="td_left td_all">
    <em>01</em>
    MUSIC.RU
  </td>
  <td class="td_right td_all" style="background-color:#ccffcc;" onmouseover="showHint('hint', '<p>Поставьте галочку, чтобы выбрать домен для дальнейшей регистрации.</p>')" onmouseout="hideHint('hint')">
    <input type="checkbox" name="01MUSICru" checked="">
  </td>
</tr>
будет до 1тысячи
0
 Аватар для rus_dao
19 / 19 / 3
Регистрация: 26.07.2013
Сообщений: 61
28.11.2013, 18:32
попробуйте вот так (только подставьте правильно "ваш_файл" - прочитайте его в переменную)
PHP
1
2
3
$fPattern = '|<tr\s+class="tr\_even">\s+<td\s+class="td\_left\s+td\_all">(.*?)<\/td>\s+<td\s+class="td\_right\s+td\_all"\s+style="background\-color\:\#ccffcc\;"|is';
preg_match_all($fPattern, $ваш_файл, $fArr);
var_dump($fArr);
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
28.11.2013, 18:32
Помогаю со студенческими работами здесь

TXT файл спарсить на страницы
Есть книга в виде txt файла 157 уроков по 10-30 слов в каждом уроке, нужно каждый урок закинуть отдельный колонку в mysql базе чтобы каждый...

Как спарсить значение в с web страницы
Доброго времени суток. Есть страница ( клик ) , мне нужно спарсить последнюю цену ( самую верхнюю ) , например сейчас она 0.49 рублей. Мне...

Как скопировать (спарсить) DOM страницы?
ИСПОЛЬЗУЕТСЯ: WebDriver, С#, Google chrome ВОПРОС 1. Как скопировать (спарсить) DOM страницы?

Спарсить все используемые ресурсы страницы
И так задача: спарсить все используемые ресурсы страницы(!), а именно: img, css, js. Собственно казалось бы ничего сложного, но метод...

Как спарсить скрытую информацию со страницы html?
Пишу парсер на C# VS 2017 используя Browser.FindElements(); Но не получается достать скрытую Нужную информацию со страницы (она не...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
4
Ответ Создать тему
Новые блоги и статьи
Идея фильтра интернета (сервер = слой+фильтр).
Hrethgir 31.03.2026
Суть идеи заключается в том, чтобы запустить свой сервер, о чём я если честно мечтал давно и давно приобрёл книгу как это сделать. Но не было причин его запускать. Очумелые учёные напечатали на. . .
Модель здравосоХранения 6. ESG-повестка и устойчивое развитие; углублённый анализ кадрового бренда
anaschu 31.03.2026
В прикрепленном документе раздумья о том, как можно поменять модель в будущем
10 пpимет, которые всегда сбываются
Maks 31.03.2026
1. Чтобы, наконец, пришла маршрутка, надо закурить. Если сигарета последняя, маршрутка придет еще до второй затяжки даже вопреки расписанию. 2. Нaдоели зима и снег? Не надо переезжать. Достаточно. . .
Перемещение выделенных строк ТЧ из одного документа в другой
Maks 31.03.2026
Реализация из решения ниже выполнена на примере нетипового документа "ВыдачаОборудованияНаСпецтехнику" с единственной табличной частью "ОборудованиеИКомплектующие" разработанного в конфигурации КА2. . . .
Functional First Web Framework Suave
DevAlt 30.03.2026
Sauve. IO Апнулись до NET10. Из зависимостей один пакет, работает одинаково хорошо как в режиме проекта так и в интерактивном режиме. из сложностей - чисто функциональный подход. Решил. . .
Автоматическое создание документа при проведении другого документа
Maks 29.03.2026
Реализация из решения ниже выполнена на нетиповых документах, разработанных в конфигурации КА2. Есть нетиповой документ "ЗаявкаНаРемонтСпецтехники" и нетиповой документ "ПланированиеСпецтехники". В. . .
Настройка движения справочника по регистру сведений
Maks 29.03.2026
Решение ниже реализовано на примере нетипового справочника "ТарифыМобильнойСвязи" разработанного в конфигурации КА2, с целью учета корпоративной мобильной связи в коммерческом предприятии. . . .
Автозаполнение реквизита при выборе элемента справочника
Maks 27.03.2026
Программный код из решения ниже на примере нетипового документа "ЗаявкаНаРемонтСпецтехники" разработанного в конфигурации КА2. При выборе "Спецтехники" (Тип Справочник. Спецтехника), заполняется. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru