Форум программистов, компьютерный форум, киберфорум
JavaScript: RegExp
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.50/4: Рейтинг темы: голосов - 4, средняя оценка - 4.50
18 / 0 / 3
Регистрация: 29.01.2014
Сообщений: 180

регулярные выражения (РВ)

11.05.2014, 17:15. Показов 862. Ответов 3
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
сайт для парсинга, не могу разобраться с регулярными выражениями
вот собственно сайт:
http://jobim.esy.es/index.php

какие значения нужно ввести чтобы получить хоть что нибудь?
0
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
11.05.2014, 17:15
Ответы с готовыми решениями:

Регулярные выражения
с помощью регулярных выражений надо вытащить из исходного кода название продукта. Это то что стоит в ковычках после слова title (т.е....

Регулярные выражения
Как с помощью регулярного выражения найти 20 символов? В символах есть только большие английские буквы и цифры.

Регулярные выражения - [$]
Почему когда я заключаю $ в квадратные кавычки, то он перестаёт считаться?

3
 Аватар для romchiksoad
1957 / 796 / 89
Регистрация: 03.11.2009
Сообщений: 3,066
Записей в блоге: 2
11.05.2014, 17:30
сновидящий, все обсуждения должно происходить в теме, выкладывайте код скриптов в тему.
0
18 / 0 / 3
Регистрация: 29.01.2014
Сообщений: 180
11.05.2014, 17:34  [ТС]
PHP/HTML
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
<?
Error_Reporting(E_ALL & ~E_NOTICE);
/* --- 1 --- Проверка правильности заполнения формы запроса */
$error = "";
$action = $_POST["action"];
if (!empty($action))
{   
    $url = trim($_POST["url"]);
    $i1 = trim($_POST["i1"])*1;
    $i2 = trim($_POST["i2"])*1;
    $step = trim($_POST["step"])*1;
    $regexp = trim($_POST["regexp"]);
    $kodirovka = trim($_POST["kodirovka"]);
    $separator = trim($_POST["separator"]);
    $othersep1 = trim($_POST["othersep1"]);
    
    if (empty($url)) // если не введён основной адрес страницы
    {
        $action = "";
        $error = $error."<LI>Вы не ввели адрес страницы\n";
    };
    if (empty($regexp)) // если не введёно регулярное выражение
    {
        $action = "";
        $error = $error."<LI>Вы не ввели регулярное выражение\n";
    };
/* --- 2 --- Получение контента со страницы */
    if (empty($error)) // если ошибок нет, пробуем получить контент страницы выдачи
    {
        switch ($separator) {
            case "new":
                $separator = "\n";
                break;
            case "new2":
                $separator = "\n\n";
                break;
            case "space":
                $separator = " ";
                break;
            case "other":
                $separator = $othersep1;
                break;
        }
        
        $regexp = stripslashes($regexp);
        for($i=$i1; $i<=$i2; $i+=$step)
        {
            $din_url = str_replace("{i}", $i, $url);    
            $page = file_get_contents($din_url);
 
            if(empty($page))
                $error = $error."<LI>Нет доступа к странице или неверный адрес: ".$din_url;
            else
            {
/* --- 3 --- Обработка контента со страницы */
                if($kodirovka != "UTF-8")
                    $page = iconv("WINDOWS-1251", "UTF-8//IGNORE", $page);
 
                preg_match_all($regexp, $page, $buffer);
            
                $len_buffer_rows = count($buffer);
                for($k=1; $k<$len_buffer_rows; $k++)
                { 
                    $len_buffer_cols = count($buffer[$k]);
                    $sum_records += $len_buffer_cols;
                    for($j=0; $j<$len_buffer_cols; $j++)
                    { 
                        $result .= $buffer[$k][$j].$separator;
                    };
                    if($len_buffer_rows>2)
                        $result .= "\n";
                };
            };
            $page = "";
            $buffer = "";
        };
/* --- 4 --- Запись полученных данных в файл */
        $file = fopen("result.txt","a");
        if(empty($file))
            $error = $error."<LI>Не удалось создать файл для записи результата";
        // записываем информацию в файл, по одной строчке на каждое поле
        fputs($file, "Время: ".date("d-m-Y H:i:s", time())."\n");
        fputs($file, $result);
        // закрываем файл
        fclose($file);
    };
};
/* --- 5 --- Вывод формы для формирования запроса */
?>
    <HTML>
    <HEAD>
    <TITLE>Универсальный парсер html контента</TITLE>
    <META http-equiv="Content-Type" content="text/html; charset=utf-8">
    <META name="robots" content="noindex,nofollow">
    <META NAME="description" CONTENT="Парсер html страниц выдачи на PHP">
    <META NAME="keywords" CONTENT="парсер, страница выдачи, биржи контента, магазины статей, php, html">
    </HEAD>
    <BODY>
    <style>
    .full_input {
        width: 100%;
    }
    .primer {
        width: 900px;
        text-align: left;
        margin: 10px auto;
    }
    h1 {
        text-align: center;
        font-size: 24px;
        padding: 20px;
    }
    h1 a {
        text-decoration: none;
        color: rgb(30, 144, 255);
    }
    table, td {
        border: solid 1px;
    }
    .copyright {
        width: 900px;
        text-align: center;
        margin: 10px auto;
    }
    </style>
    <div id="main-content">
    <H1>
      <a href="index.php" title="Начальная страница">Универсальный парсер html контента</a>
    </H1>
    <!-- пишем HTML-код формы формирования запроса !-->
    <center>
    <?
    if (!empty($error)) // если есть ошибки, выводим сообщение об ошибках
    {
        echo "<P><font color='green'>Во время обработки запроса произошли следующие ошибки:</font></P>\n";
        echo "<UL>\n";
        echo $error;
        echo "</UL>\n";
        echo "<P>Статус: <font color='green'>FAIL</font>, ";
        if(!empty($sum_records))
            echo "записей: ".$sum_records."</P>\n";
        else
            echo "записей нет</P>\n";
    }
    else
    {
        echo "<P>Статус: <font color='green'>OK</font>, ";
        if(!empty($sum_records))
            echo "записей: ".$sum_records."</P>\n";
        else
            echo "записей нет</P>\n";
    };
    $default['url'] = "http://www.etxt.ru/articles/legal/?id_language=15&page={i}";
    $default['regexp'] = "/<div class=\\\"mod-item-main\\\">\s*<h4>(.*)<\/h4>/";
    ?>
    <script type="text/javascript">
        function checksep1(value)
            {
                if (value) document.parserform.separator.value = "other";
            };
    </script>
     <table border='0'>
     <form action='index.php' name="parserform" enctype="multipart/form-data" method='post'>
     <input type='hidden' name='action' value='start'>
    <tr>
     <td width='25%'>Адрес страницы:</td>
     <td>
       <input type='text' name='url' class="full_input" value=<? if(empty($url)) echo "'".$default['url']."'"; else echo "'".$url."'"; ?>>
     </td>
    </tr>
    <tr>
      <td width='25%'>Интервал изменения параметра:</td>
      <td>
        от <input type='text' name='i1' maxlength='10'
        value=<? if(empty($i1)) echo "1"; else echo "'".$i1."'"; ?>>
        до <input type='text' name='i2' maxlength='10'
        value=<? if(empty($i2)) echo "1"; else echo "'".$i2."'"; ?>>
        шаг <input type='text' name='step' maxlength='10'
        value=<? if(empty($step)) echo "1"; else echo "'".$step."'"; ?>>
      </td>
    </tr>
    <tr>
      <td width='25%'>Регулярное выражение (РВ):</td>
      <td>
       <input type='text' name='regexp' class="full_input" value=<? if(empty($regexp)) echo "'".$default['regexp']."'"; else echo "'".$regexp."'"; ?>>
      </td>
    </tr>
    <tr>
      <td width='25%'>Кодировка данных:</td>
      <td>
        <input type='radio' name='kodirovka' <? if($kodirovka == "UTF-8") echo "checked='checked'"; ?> value='UTF-8'><B>UTF-8     </B>
        <input type='radio' name='kodirovka' <? if(empty($kodirovka)||$kodirovka == "WINDOWS-1251") echo "checked='checked'"; ?> value='WINDOWS-1251'><B>WINDOWS-1251</B>
      </td>
    </tr>
    <tr>
      <td width='25%'>Разделитель записей:</td>
      <td>
       <select name="separator">
                          <option selected="selected" value="new">Новая строка</option>
                          <option value="new2">Двойная строка</option>
                          <option value="|">Черта | </option>
                          <option value=" : ">Двоеточие</option>
                          <option value=", ">Запятая</option>
                          <option value="space">Пробел</option>
                          <option value="other">Другое</option>
                        </select>
                        <input name="othersep1" onblur="checksep1(this.value);" type="text">
      </td>
    </tr>
    <tr>
      <td colspan='2' align='center'><input type="submit" value="Старт"></td>
    </tr>
   </table>
    </center>
  <!-- /* --- 6 --- Шпаргалка, примеры и подсказки */ !-->
  <DIV class="primer">
  <P><font color='green'>Шпаргалка:</font></P>
  <P><strong>Для биржи etxt:</strong></P>
  <UL>
    <li><strong>Адрес:</strong> http://www.etxt.ru/articles/<i>category_name</i>/?id_language=15&page={i}</li>
    <li><strong>РВ:</strong> /&lt;div class=\&quot;mod-item-main\&quot;&gt;\s*&lt;h4&gt;(.*)&lt;\/h4&gt;/</li>
    <li><strong>Шаг:</strong> 1</li>
    <li><strong>Кодировка:</strong> WINDOWS-1251</li>
  </UL>
  <P><strong>Для биржи ********:</strong></P>
  <UL>
    <li><strong>Адрес:</strong> http://www.********.ru/index.php?ca=<i>номер</i>&next={i}</li>
    <li><strong>РВ:</strong> /&lt;p class=\&quot;arttitle\&quot;&gt;&lt;a href=\&quot;.*\&quot;&gt;(.*)&lt;\/a&gt;&lt;\/p&gt;/</li>
    <li><strong>Шаг:</strong> 20</li>
    <li><strong>Кодировка:</strong> WINDOWS-1251</li>
  </UL>
  <P><strong>Для биржи Advego:</strong></P>
  <UL>
    <li><strong>Адрес:</strong>  http://advego.ru/shop/find/?c=<i>номер</i>&p={i}</li>
    <li><strong>РВ:</strong> /&lt;a class=\&quot;order-title\&quot; .*&gt;(.*)&lt;\/a&gt;/</li>
    <li><strong>Шаг:</strong> 1</li>
    <li><strong>Кодировка:</strong> UTF-8</li>
  </UL>
  </DIV>
  <DIV class="copyright">
  &copy Автор идеи <a href="http://www.seorubl.ru/" title="Записки Предприимчивого Человека" rel="generator">Seorubl</a>.<br>
  Универсальный парсер html контента seorubl-parser-v 1.3.2 18.04.2014 г.
  </DIV>
  </div>
  </BODY>
  </HTML>
0
18 / 0 / 3
Регистрация: 29.01.2014
Сообщений: 180
11.05.2014, 17:39  [ТС]
в самом коде все правильно (писал не я)
не могу разобраться что писать в поле "Регулярное выражение (РВ):" см сайт или код
Миниатюры
регулярные выражения (РВ)  
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
11.05.2014, 17:39
Помогаю со студенческими работами здесь

Регулярные выражения
Не работают регулярные выражения, ничего не выдаёт вообще на экран, верно и неверно не выдаёт. &lt;html&gt; &lt;head&gt; ...

Регулярные выражения
Помогите тупому нубу новичку. var text = &quot;echo 123&quot;; var keywords =...

Регулярные выражения - ?<=
Добрый день! Пишу функцию, которая выделяет смесь раскладок в слове jQuery.fn.lightLay = function() { // Со второй...

Регулярные выражения
Пользователь может зарегестрироваться на 3-х сайтах: mail.ru, google.ru, yandex.ru. До позиции @ e-mail может содержать 3 символа, затем...

регулярные выражения
Господа, вот такой скрипт выводит в столбик все буквы &quot;в&quot; написанные в промте, а как сделать, чтоб и само регулярное выражение тоже с ходу...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
4
Ответ Создать тему
Новые блоги и статьи
Символьное дифференцирование
igorrr37 13.02.2026
/ * Логарифм записывается как: (x-2)log(x^2+2) - означает логарифм (x^2+2) по основанию (x-2). Унарный минус обозначается как ! */ #include <iostream> #include <stack> #include <cctype>. . .
Камера Toupcam IUA500KMA
Eddy_Em 12.02.2026
Т. к. у всяких "хикроботов" слишком уж мелкий пиксель, для подсмотра в ESPriF они вообще плохо годятся: уже 14 величину можно рассмотреть еле-еле лишь на экспозициях под 3 секунды (а то и больше),. . .
И ясному Солнцу
zbw 12.02.2026
И ясному Солнцу, и светлой Луне. В мире покоя нет и люди не могут жить в тишине. А жить им немного лет.
«Знание-Сила»
zbw 12.02.2026
«Знание-Сила» «Время-Деньги» «Деньги -Пуля»
SDL3 для Web (WebAssembly): Подключение Box2D v3, физика и отрисовка коллайдеров
8Observer8 12.02.2026
Содержание блога Box2D - это библиотека для 2D физики для анимаций и игр. С её помощью можно определять были ли коллизии между конкретными объектами и вызывать обработчики событий столкновения. . . .
SDL3 для Web (WebAssembly): Загрузка PNG с прозрачным фоном с помощью SDL_LoadPNG (без SDL3_image)
8Observer8 11.02.2026
Содержание блога Библиотека SDL3 содержит встроенные инструменты для базовой работы с изображениями - без использования библиотеки SDL3_image. Пошагово создадим проект для загрузки изображения. . .
SDL3 для Web (WebAssembly): Загрузка PNG с прозрачным фоном с помощью SDL3_image
8Observer8 10.02.2026
Содержание блога Библиотека SDL3_image содержит инструменты для расширенной работы с изображениями. Пошагово создадим проект для загрузки изображения формата PNG с альфа-каналом (с прозрачным. . .
Установка Qt-версии Lazarus IDE в Debian Trixie Xfce
volvo 10.02.2026
В общем, достали меня глюки IDE Лазаруса, собранной с использованием набора виджетов Gtk2 (конкретно: если набирать текст в редакторе и вызвать подсказку через Ctrl+Space, то после закрытия окошка. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru