Форум программистов, компьютерный форум, киберфорум
JavaScript: RegExp
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.50/4: Рейтинг темы: голосов - 4, средняя оценка - 4.50
18 / 0 / 3
Регистрация: 29.01.2014
Сообщений: 180

регулярные выражения (РВ)

11.05.2014, 17:15. Показов 855. Ответов 3
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
сайт для парсинга, не могу разобраться с регулярными выражениями
вот собственно сайт:
http://jobim.esy.es/index.php

какие значения нужно ввести чтобы получить хоть что нибудь?
0
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
11.05.2014, 17:15
Ответы с готовыми решениями:

Регулярные выражения
с помощью регулярных выражений надо вытащить из исходного кода название продукта. Это то что стоит в ковычках после слова title (т.е....

Регулярные выражения
Как с помощью регулярного выражения найти 20 символов? В символах есть только большие английские буквы и цифры.

Регулярные выражения - [$]
Почему когда я заключаю $ в квадратные кавычки, то он перестаёт считаться?

3
 Аватар для romchiksoad
1957 / 796 / 89
Регистрация: 03.11.2009
Сообщений: 3,066
Записей в блоге: 2
11.05.2014, 17:30
сновидящий, все обсуждения должно происходить в теме, выкладывайте код скриптов в тему.
0
18 / 0 / 3
Регистрация: 29.01.2014
Сообщений: 180
11.05.2014, 17:34  [ТС]
PHP/HTML
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
<?
Error_Reporting(E_ALL & ~E_NOTICE);
/* --- 1 --- Проверка правильности заполнения формы запроса */
$error = "";
$action = $_POST["action"];
if (!empty($action))
{   
    $url = trim($_POST["url"]);
    $i1 = trim($_POST["i1"])*1;
    $i2 = trim($_POST["i2"])*1;
    $step = trim($_POST["step"])*1;
    $regexp = trim($_POST["regexp"]);
    $kodirovka = trim($_POST["kodirovka"]);
    $separator = trim($_POST["separator"]);
    $othersep1 = trim($_POST["othersep1"]);
    
    if (empty($url)) // если не введён основной адрес страницы
    {
        $action = "";
        $error = $error."<LI>Вы не ввели адрес страницы\n";
    };
    if (empty($regexp)) // если не введёно регулярное выражение
    {
        $action = "";
        $error = $error."<LI>Вы не ввели регулярное выражение\n";
    };
/* --- 2 --- Получение контента со страницы */
    if (empty($error)) // если ошибок нет, пробуем получить контент страницы выдачи
    {
        switch ($separator) {
            case "new":
                $separator = "\n";
                break;
            case "new2":
                $separator = "\n\n";
                break;
            case "space":
                $separator = " ";
                break;
            case "other":
                $separator = $othersep1;
                break;
        }
        
        $regexp = stripslashes($regexp);
        for($i=$i1; $i<=$i2; $i+=$step)
        {
            $din_url = str_replace("{i}", $i, $url);    
            $page = file_get_contents($din_url);
 
            if(empty($page))
                $error = $error."<LI>Нет доступа к странице или неверный адрес: ".$din_url;
            else
            {
/* --- 3 --- Обработка контента со страницы */
                if($kodirovka != "UTF-8")
                    $page = iconv("WINDOWS-1251", "UTF-8//IGNORE", $page);
 
                preg_match_all($regexp, $page, $buffer);
            
                $len_buffer_rows = count($buffer);
                for($k=1; $k<$len_buffer_rows; $k++)
                { 
                    $len_buffer_cols = count($buffer[$k]);
                    $sum_records += $len_buffer_cols;
                    for($j=0; $j<$len_buffer_cols; $j++)
                    { 
                        $result .= $buffer[$k][$j].$separator;
                    };
                    if($len_buffer_rows>2)
                        $result .= "\n";
                };
            };
            $page = "";
            $buffer = "";
        };
/* --- 4 --- Запись полученных данных в файл */
        $file = fopen("result.txt","a");
        if(empty($file))
            $error = $error."<LI>Не удалось создать файл для записи результата";
        // записываем информацию в файл, по одной строчке на каждое поле
        fputs($file, "Время: ".date("d-m-Y H:i:s", time())."\n");
        fputs($file, $result);
        // закрываем файл
        fclose($file);
    };
};
/* --- 5 --- Вывод формы для формирования запроса */
?>
    <HTML>
    <HEAD>
    <TITLE>Универсальный парсер html контента</TITLE>
    <META http-equiv="Content-Type" content="text/html; charset=utf-8">
    <META name="robots" content="noindex,nofollow">
    <META NAME="description" CONTENT="Парсер html страниц выдачи на PHP">
    <META NAME="keywords" CONTENT="парсер, страница выдачи, биржи контента, магазины статей, php, html">
    </HEAD>
    <BODY>
    <style>
    .full_input {
        width: 100%;
    }
    .primer {
        width: 900px;
        text-align: left;
        margin: 10px auto;
    }
    h1 {
        text-align: center;
        font-size: 24px;
        padding: 20px;
    }
    h1 a {
        text-decoration: none;
        color: rgb(30, 144, 255);
    }
    table, td {
        border: solid 1px;
    }
    .copyright {
        width: 900px;
        text-align: center;
        margin: 10px auto;
    }
    </style>
    <div id="main-content">
    <H1>
      <a href="index.php" title="Начальная страница">Универсальный парсер html контента</a>
    </H1>
    <!-- пишем HTML-код формы формирования запроса !-->
    <center>
    <?
    if (!empty($error)) // если есть ошибки, выводим сообщение об ошибках
    {
        echo "<P><font color='green'>Во время обработки запроса произошли следующие ошибки:</font></P>\n";
        echo "<UL>\n";
        echo $error;
        echo "</UL>\n";
        echo "<P>Статус: <font color='green'>FAIL</font>, ";
        if(!empty($sum_records))
            echo "записей: ".$sum_records."</P>\n";
        else
            echo "записей нет</P>\n";
    }
    else
    {
        echo "<P>Статус: <font color='green'>OK</font>, ";
        if(!empty($sum_records))
            echo "записей: ".$sum_records."</P>\n";
        else
            echo "записей нет</P>\n";
    };
    $default['url'] = "http://www.etxt.ru/articles/legal/?id_language=15&page={i}";
    $default['regexp'] = "/<div class=\\\"mod-item-main\\\">\s*<h4>(.*)<\/h4>/";
    ?>
    <script type="text/javascript">
        function checksep1(value)
            {
                if (value) document.parserform.separator.value = "other";
            };
    </script>
     <table border='0'>
     <form action='index.php' name="parserform" enctype="multipart/form-data" method='post'>
     <input type='hidden' name='action' value='start'>
    <tr>
     <td width='25%'>Адрес страницы:</td>
     <td>
       <input type='text' name='url' class="full_input" value=<? if(empty($url)) echo "'".$default['url']."'"; else echo "'".$url."'"; ?>>
     </td>
    </tr>
    <tr>
      <td width='25%'>Интервал изменения параметра:</td>
      <td>
        от <input type='text' name='i1' maxlength='10'
        value=<? if(empty($i1)) echo "1"; else echo "'".$i1."'"; ?>>
        до <input type='text' name='i2' maxlength='10'
        value=<? if(empty($i2)) echo "1"; else echo "'".$i2."'"; ?>>
        шаг <input type='text' name='step' maxlength='10'
        value=<? if(empty($step)) echo "1"; else echo "'".$step."'"; ?>>
      </td>
    </tr>
    <tr>
      <td width='25%'>Регулярное выражение (РВ):</td>
      <td>
       <input type='text' name='regexp' class="full_input" value=<? if(empty($regexp)) echo "'".$default['regexp']."'"; else echo "'".$regexp."'"; ?>>
      </td>
    </tr>
    <tr>
      <td width='25%'>Кодировка данных:</td>
      <td>
        <input type='radio' name='kodirovka' <? if($kodirovka == "UTF-8") echo "checked='checked'"; ?> value='UTF-8'><B>UTF-8     </B>
        <input type='radio' name='kodirovka' <? if(empty($kodirovka)||$kodirovka == "WINDOWS-1251") echo "checked='checked'"; ?> value='WINDOWS-1251'><B>WINDOWS-1251</B>
      </td>
    </tr>
    <tr>
      <td width='25%'>Разделитель записей:</td>
      <td>
       <select name="separator">
                          <option selected="selected" value="new">Новая строка</option>
                          <option value="new2">Двойная строка</option>
                          <option value="|">Черта | </option>
                          <option value=" : ">Двоеточие</option>
                          <option value=", ">Запятая</option>
                          <option value="space">Пробел</option>
                          <option value="other">Другое</option>
                        </select>
                        <input name="othersep1" onblur="checksep1(this.value);" type="text">
      </td>
    </tr>
    <tr>
      <td colspan='2' align='center'><input type="submit" value="Старт"></td>
    </tr>
   </table>
    </center>
  <!-- /* --- 6 --- Шпаргалка, примеры и подсказки */ !-->
  <DIV class="primer">
  <P><font color='green'>Шпаргалка:</font></P>
  <P><strong>Для биржи etxt:</strong></P>
  <UL>
    <li><strong>Адрес:</strong> http://www.etxt.ru/articles/<i>category_name</i>/?id_language=15&page={i}</li>
    <li><strong>РВ:</strong> /&lt;div class=\&quot;mod-item-main\&quot;&gt;\s*&lt;h4&gt;(.*)&lt;\/h4&gt;/</li>
    <li><strong>Шаг:</strong> 1</li>
    <li><strong>Кодировка:</strong> WINDOWS-1251</li>
  </UL>
  <P><strong>Для биржи ********:</strong></P>
  <UL>
    <li><strong>Адрес:</strong> http://www.********.ru/index.php?ca=<i>номер</i>&next={i}</li>
    <li><strong>РВ:</strong> /&lt;p class=\&quot;arttitle\&quot;&gt;&lt;a href=\&quot;.*\&quot;&gt;(.*)&lt;\/a&gt;&lt;\/p&gt;/</li>
    <li><strong>Шаг:</strong> 20</li>
    <li><strong>Кодировка:</strong> WINDOWS-1251</li>
  </UL>
  <P><strong>Для биржи Advego:</strong></P>
  <UL>
    <li><strong>Адрес:</strong>  http://advego.ru/shop/find/?c=<i>номер</i>&p={i}</li>
    <li><strong>РВ:</strong> /&lt;a class=\&quot;order-title\&quot; .*&gt;(.*)&lt;\/a&gt;/</li>
    <li><strong>Шаг:</strong> 1</li>
    <li><strong>Кодировка:</strong> UTF-8</li>
  </UL>
  </DIV>
  <DIV class="copyright">
  &copy Автор идеи <a href="http://www.seorubl.ru/" title="Записки Предприимчивого Человека" rel="generator">Seorubl</a>.<br>
  Универсальный парсер html контента seorubl-parser-v 1.3.2 18.04.2014 г.
  </DIV>
  </div>
  </BODY>
  </HTML>
0
18 / 0 / 3
Регистрация: 29.01.2014
Сообщений: 180
11.05.2014, 17:39  [ТС]
в самом коде все правильно (писал не я)
не могу разобраться что писать в поле "Регулярное выражение (РВ):" см сайт или код
Миниатюры
регулярные выражения (РВ)  
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
11.05.2014, 17:39
Помогаю со студенческими работами здесь

Регулярные выражения
Не работают регулярные выражения, ничего не выдаёт вообще на экран, верно и неверно не выдаёт. &lt;html&gt; &lt;head&gt; ...

Регулярные выражения
Помогите тупому нубу новичку. var text = &quot;echo 123&quot;; var keywords =...

Регулярные выражения - ?<=
Добрый день! Пишу функцию, которая выделяет смесь раскладок в слове jQuery.fn.lightLay = function() { // Со второй...

Регулярные выражения
Пользователь может зарегестрироваться на 3-х сайтах: mail.ru, google.ru, yandex.ru. До позиции @ e-mail может содержать 3 символа, затем...

регулярные выражения
Господа, вот такой скрипт выводит в столбик все буквы &quot;в&quot; написанные в промте, а как сделать, чтоб и само регулярное выражение тоже с ходу...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
4
Ответ Создать тему
Новые блоги и статьи
Советы по крайней бережливости. Внимание, это ОЧЕНЬ длинный пост.
Programma_Boinc 28.12.2025
Советы по крайней бережливости. Внимание, это ОЧЕНЬ длинный пост. Налог на собак: https:/ / **********/ gallery/ V06K53e Финансовый отчет в Excel: https:/ / **********/ gallery/ bKBkQFf Пост отсюда. . .
Кто-нибудь знает, где можно бесплатно получить настольный компьютер или ноутбук? США.
Programma_Boinc 26.12.2025
Нашел на реддите интересную статью под названием Anyone know where to get a free Desktop or Laptop? Ниже её машинный перевод. После долгих разбирательств я наконец-то вернула себе. . .
Thinkpad X220 Tablet — это лучший бюджетный ноутбук для учёбы, точка.
Programma_Boinc 23.12.2025
Рецензия / Мнение/ Перевод Нашел на реддите интересную статью под названием The Thinkpad X220 Tablet is the best budget school laptop period . Ниже её машинный перевод. Thinkpad X220 Tablet —. . .
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта Симптом: После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
Как объединить две одинаковые БД Access с разными данными
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
Новый ноутбук
volvo 07.12.2025
Всем привет. По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне: Ryzen 5 7533HS 64 Gb DDR5 1Tb NVMe 16" Full HD Display Win11 Pro
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов На странице: https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/ нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином. Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов. . . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2025, CyberForum.ru