Форум программистов, компьютерный форум, киберфорум
PHP: RegExp
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.71/7: Рейтинг темы: голосов - 7, средняя оценка - 4.71
0 / 1 / 1
Регистрация: 18.02.2012
Сообщений: 244

Парсинг текста в теге не считая самого тега

02.07.2016, 13:46. Показов 1450. Ответов 12
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Суть в чём: https://regex101.com/r/zW8zR9/42

PHP
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
<?php
 
$txt = "
[hide=0] [hide=1] test [/hide] [/hide]
";
 
preg_match_all("/\[hide\=(.+?)\](.+?)\[\/hide\]/is", $txt, $matches);
        
for($i = 0 ; $i < count( $matches[0]) ; $i++)
{               
    $option = $matches[1][$i];
    $value  = $matches[2][$i];
    
    echo $value."\n";
}
 
?>
На выходе имею " [hide=1] test " вместо " [hide=1] test [/hide] ", но то и понятно, что читает первый попавшийся тег
То есть что бы считало только первый и последний [hide=] и [/hide]

По желательно еще что бы [hide=текст] вместо текст была либо только цифра либо любой текст через запетую с цифрами или без типа: [hide=test1,test2,1337,14,name test,your]
0
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
02.07.2016, 13:46
Ответы с готовыми решениями:

Парсинг кодировки в начальном теге xml
Есть строка &lt;?xml version=&quot;1.0&quot; encoding=&quot;UTF-8&quot;?&gt;, &lt;?xml version=&quot;1.0&quot; encoding=&quot;ANSI-1251&quot;?&gt;, или любая другая, начинающаяся на &lt;?xml....

Определение самого короткого и самого длинного слова во введенной строке текста
прошу помогите написать блок схему к задаче. Создать в системе программирования Visual Studio 200* проект VB-программы с одной формой для...

парсинг тега
например, дана строка &lt;rob name=&quot;lol&quot; value=&quot;2&quot; x=&quot;1.0&quot; type=&quot;3&quot; /&gt; мне нужно спарсить в php определённые данные независимо от...

12
1137 / 685 / 412
Регистрация: 07.11.2015
Сообщений: 1,102
02.07.2016, 16:43
Для вложенных конструкций нужен рекурсивный шаблон с (?R).
https://regex101.com/r/zW8zR9/45
2
Hello Kitty
 Аватар для WhiteMind
690 / 562 / 402
Регистрация: 12.02.2016
Сообщений: 1,436
Записей в блоге: 1
02.07.2016, 16:47
PHP
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
<?php
 
$txt = "
[hide=name1,name2,name3]
    [hide=text]
        [hide=admin,mdr]
            for admin text
        [/hide]
        ml txt
        [hide=admin,mdr,nick1]
            for admin , nick1 text
        [/hide]
        txt =) 
    [/hide] 
[/hide]
 
[hide=01] [hide=1] test [/hide] [/hide]
[hide=02] [hide=11] test [/hide] [/hide]
";
 
print_r( ReadHide( $txt ) );
 
function ReadHide( $txt ) {
    $list = [];
    while(strpos($txt,$prf = substr(str_shuffle(implode('',range("a","z"))),0,16))!==false);
    for($i=0; ($_stxt=$txt) !== ($txt = preg_replace_callback( '~\[hide\s*\=\s*([^\[\]]*)\]([^\[\]]*)\[\/hide\s*]~isD' , function($m) use ($prf,&$list,&$i) {
        $list[$key=$prf.($i++)."\x20"] = [
            'attr' => explode(',',$m[1]),
            'children' => $m[2] ,
        ]; 
        return $key;
    } , $txt )); );
    $f=function($txt) use(&$f,$prf,$list) {
        $info = [];
        while( preg_match( '~(.*?)('.preg_quote($prf,'~').'[0-9]*'.preg_quote("\x20",'~').')(.*)~sD' , $txt , $m ) ) {
            if ( strlen($m[1]) ) { $info[] = $m[1]; }
            $tmp = $list[ $m[2] ];
            $tmp['children'] = $f($tmp['children']);
            $info[] = $tmp;
            if ( strlen($m[3]) ) { $txt = $m[3]; }
        }
        if ( strlen($txt) ) { $info[] = $txt; }
        return $info;
    };
    return $f( $txt );
}
 
 
?>
Добавлено через 15 секунд
http://sandbox.onlinephpfuncti... e4ff797d1c

Добавлено через 1 минуту
_or_75, не ужели сами сделать не можете?
1
0 / 1 / 1
Регистрация: 18.02.2012
Сообщений: 244
02.07.2016, 17:21  [ТС]
Цитата Сообщение от Emilien Посмотреть сообщение
Для вложенных конструкций нужен рекурсивный шаблон с (?R).
https://regex101.com/r/zW8zR9/45
А тут уже видим не сработает, почти получилось но опять не то): https://regex101.com/r/zW8zR9/47
0
1137 / 685 / 412
Регистрация: 07.11.2015
Сообщений: 1,102
02.07.2016, 17:31
Для подержки [hide=] нужно поменять квантификатор + на * в фрагменте \[hide=([^\]]+)\]
https://regex101.com/r/zW8zR9/49
1
0 / 1 / 1
Регистрация: 18.02.2012
Сообщений: 244
02.07.2016, 17:36  [ТС]
Цитата Сообщение от WhiteMind Посмотреть сообщение
PHP
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
<?php
 
$txt = "
[hide=name1,name2,name3]
    [hide=text]
        [hide=admin,mdr]
            for admin text
        [/hide]
        ml txt
        [hide=admin,mdr,nick1]
            for admin , nick1 text
        [/hide]
        txt =) 
    [/hide] 
[/hide]
 
[hide=01] [hide=1] test [/hide] [/hide]
[hide=02] [hide=11] test [/hide] [/hide]
";
 
print_r( ReadHide( $txt ) );
 
function ReadHide( $txt ) {
    $list = [];
    while(strpos($txt,$prf = substr(str_shuffle(implode('',range("a","z"))),0,16))!==false);
    for($i=0; ($_stxt=$txt) !== ($txt = preg_replace_callback( '~\[hide\s*\=\s*([^\[\]]*)\]([^\[\]]*)\[\/hide\s*]~isD' , function($m) use ($prf,&$list,&$i) {
        $list[$key=$prf.($i++)."\x20"] = [
            'attr' => explode(',',$m[1]),
            'children' => $m[2] ,
        ]; 
        return $key;
    } , $txt )); );
    $f=function($txt) use(&$f,$prf,$list) {
        $info = [];
        while( preg_match( '~(.*?)('.preg_quote($prf,'~').'[0-9]*'.preg_quote("\x20",'~').')(.*)~sD' , $txt , $m ) ) {
            if ( strlen($m[1]) ) { $info[] = $m[1]; }
            $tmp = $list[ $m[2] ];
            $tmp['children'] = $f($tmp['children']);
            $info[] = $tmp;
            if ( strlen($m[3]) ) { $txt = $m[3]; }
        }
        if ( strlen($txt) ) { $info[] = $txt; }
        return $info;
    };
    return $f( $txt );
}
 
 
?>
Добавлено через 15 секунд
http://sandbox.onlinephpfuncti... e4ff797d1c

Добавлено через 1 минуту
_or_75, не ужели сами сделать не можете?
Сделать нет не могу, не знаю почему у вас всё так сложно, но на выходе массив конечно не нужен )

По идеи всё просто:

PHP
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
<?php
 
$txt = "
 
[hide=1] [hide=11] test [/hide] [/hide]
 
[hide=2] [hide=] test [/hide] [hide=] 123 [/hide] [/hide] [/hide]
 
[hide=1,2,3,4] aa bb cc [/hide] [/hide] [hide=] [/hide]
 
";
 
preg_match_all("/\[hide\=(.+?)\](.+?)\[\/hide\]/is", $txt, $matches);
        
for($i = 0 ; $i < count( $matches[0]) ; $i++)
{               
    $option = $matches[1][$i];
    $value  = $matches[2][$i];
    
    echo $value."\n";
}
 
?>
На выходе имеем:
-------------------------------
[hide=11] test
[hide=] test

aa bb cc
-------------------------------
Нужно же:
-------------------------------
[hide=11] test [/hide]
[hide=] test [/hide] [hide=] 123 [/hide] [/hide]
aa bb cc [/hide] [/hide] [hide=]
-------------------------------
В принципе всё , поменять только же нужно будет preg_match_all а вот как уже не знаю в этом то и вопрос )

Добавлено через 3 минуты
Цитата Сообщение от Emilien Посмотреть сообщение
Для подержки [hide=] нужно поменять квантификатор + на * в фрагменте \[hide=([^\]]+)\]
https://regex101.com/r/zW8zR9/48
https://regex101.com/r/zW8zR9/50

И опять всё ломается , нужно только первый [hide=] и последний [/hide] а между ними неважно что и сколько [hide=] и [/hide] и в каком порядке )
0
1137 / 685 / 412
Регистрация: 07.11.2015
Сообщений: 1,102
02.07.2016, 17:47
Как это неважно там же нет закрывающего [/hide]
Ну если так нужно, то можно сделать его необязательным заменив [/hide] на (?: \[/hide\] )?
https://regex101.com/r/zW8zR9/51
1
Hello Kitty
 Аватар для WhiteMind
690 / 562 / 402
Регистрация: 12.02.2016
Сообщений: 1,436
Записей в блоге: 1
02.07.2016, 18:47
Цитата Сообщение от _or_75 Посмотреть сообщение
Сделать нет не могу, не знаю почему у вас всё так сложно
Что тут сложного?
Цитата Сообщение от _or_75 Посмотреть сообщение
На выходе имеем:...
всеравно не ясно что вы хотите.
в любом случае я дал вам полностью готовый код, который парсит ваше дерево, любая вложенность, понимает более 1о узла и разбирает ваш hide=... в массив имен
Цитата Сообщение от _or_75 Посмотреть сообщение
Сделать нет не могу
как же так то?

Добавлено через 56 секунд
Цитата Сообщение от _or_75 Посмотреть сообщение
но на выходе массив конечно не нужен
из этого массива вы можете как угодно собрать результат
1
0 / 1 / 1
Регистрация: 18.02.2012
Сообщений: 244
02.07.2016, 20:38  [ТС]
Цитата Сообщение от WhiteMind Посмотреть сообщение
Что тут сложного?
Цитата Сообщение от WhiteMind Посмотреть сообщение
как же так то?
Ну вот так, с preg_ функциями совсем не работал а ругулярки делать не моё )

Цитата Сообщение от WhiteMind Посмотреть сообщение
все равно не ясно что вы хотите.
в любом случае я дал вам полностью готовый код, который парсит ваше дерево, любая вложенность, понимает более 1о узла и разбирает ваш hide=... в массив имен
Цитата Сообщение от WhiteMind Посмотреть сообщение
из этого массива вы можете как угодно собрать результат
Да но, вложенные [hide=] уже в hide трогать не надо совсем )

Вот пример как щяс: http://sandbox.onlinephpfuncti... 820e7369f1

А вот что должно быть в result в итоге:

0
Hello Kitty
 Аватар для WhiteMind
690 / 562 / 402
Регистрация: 12.02.2016
Сообщений: 1,436
Записей в блоге: 1
02.07.2016, 21:15
Лучший ответ Сообщение было отмечено _or_75 как решение

Решение

Цитата Сообщение от _or_75 Посмотреть сообщение
А вот что должно быть в result в итоге:
PHP
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
<?php
 
$txt = "
[hide=name1,name2,name3]
    [hide=text]
        [hide=admin,mdr]
            for admin text
        [/hide]
        ml txt
        [hide=admin,mdr,nick1]
            for admin , nick1 text
        [/hide]
        txt =) 
    [/hide] 
[/hide]
 
[hide=01] [hide=1] test [/hide] [/hide]
[hide=02] [hide=11] test [/hide] [/hide]
";
 
$a = ReadHide( $txt );
$s = '';
foreach($a as $v) {
    if ( is_array($v) )
        $s.=ToString($v['children']);
}
echo $s;
 
 
 
function ReadHide( $txt ) {
    $list = [];
    while(strpos($txt,$prf = substr(str_shuffle(implode('',range("a","z"))),0,16))!==false);
    for($i=0; ($_stxt=$txt) !== ($txt = preg_replace_callback( '~\[hide\s*\=\s*([^\[\]]*)\]([^\[\]]*)\[\/hide\s*]~isD' , function($m) use ($prf,&$list,&$i) {
        $list[$key=$prf.($i++)."\x20"] = [
            'attr' => explode(',',$m[1]),
            'children' => $m[2] ,
        ]; 
        return $key;
    } , $txt )); );
    $f=function($txt) use(&$f,$prf,$list) {
        $info = [];
        while( preg_match( '~(.*?)('.preg_quote($prf,'~').'[0-9]*'.preg_quote("\x20",'~').')(.*)~sD' , $txt , $m ) ) {
            if ( strlen($m[1]) ) { $info[] = $m[1]; }
            $tmp = $list[ $m[2] ];
            $tmp['children'] = $f($tmp['children']);
            $info[] = $tmp;
            if ( strlen($m[3]) ) { $txt = $m[3]; }
        }
        if ( strlen($txt) ) { $info[] = $txt; }
        return $info;
    };
    return $f( $txt );
}
function ToString( $a ) {
    $s='';
    foreach($a as $v) {
        if ( is_string($v) ) {
            $s .= $v;
            continue;
        }
        $s .= '[hide='.implode(',',$v['attr']).']'. ToString($v['children']) . '[/hide]';
    }
    return $s;
}
 
?>
Добавлено через 14 секунд
http://sandbox.onlinephpfuncti... 8fc44de67b
1
0 / 1 / 1
Регистрация: 18.02.2012
Сообщений: 244
02.07.2016, 21:55  [ТС]
Цитата Сообщение от WhiteMind Посмотреть сообщение
PHP
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
<?php
 
$txt = "
[hide=name1,name2,name3]
    [hide=text]
        [hide=admin,mdr]
            for admin text
        [/hide]
        ml txt
        [hide=admin,mdr,nick1]
            for admin , nick1 text
        [/hide]
        txt =) 
    [/hide] 
[/hide]
 
[hide=01] [hide=1] test [/hide] [/hide]
[hide=02] [hide=11] test [/hide] [/hide]
";
 
$a = ReadHide( $txt );
$s = '';
foreach($a as $v) {
    if ( is_array($v) )
        $s.=ToString($v['children']);
}
echo $s;
 
 
 
function ReadHide( $txt ) {
    $list = [];
    while(strpos($txt,$prf = substr(str_shuffle(implode('',range("a","z"))),0,16))!==false);
    for($i=0; ($_stxt=$txt) !== ($txt = preg_replace_callback( '~\[hide\s*\=\s*([^\[\]]*)\]([^\[\]]*)\[\/hide\s*]~isD' , function($m) use ($prf,&$list,&$i) {
        $list[$key=$prf.($i++)."\x20"] = [
            'attr' => explode(',',$m[1]),
            'children' => $m[2] ,
        ]; 
        return $key;
    } , $txt )); );
    $f=function($txt) use(&$f,$prf,$list) {
        $info = [];
        while( preg_match( '~(.*?)('.preg_quote($prf,'~').'[0-9]*'.preg_quote("\x20",'~').')(.*)~sD' , $txt , $m ) ) {
            if ( strlen($m[1]) ) { $info[] = $m[1]; }
            $tmp = $list[ $m[2] ];
            $tmp['children'] = $f($tmp['children']);
            $info[] = $tmp;
            if ( strlen($m[3]) ) { $txt = $m[3]; }
        }
        if ( strlen($txt) ) { $info[] = $txt; }
        return $info;
    };
    return $f( $txt );
}
function ToString( $a ) {
    $s='';
    foreach($a as $v) {
        if ( is_string($v) ) {
            $s .= $v;
            continue;
        }
        $s .= '[hide='.implode(',',$v['attr']).']'. ToString($v['children']) . '[/hide]';
    }
    return $s;
}
 
?>
Добавлено через 14 секунд
http://sandbox.onlinephpfuncti... 8fc44de67b
Так всё отлично, но можно ли одной строкой как тут ?:

PHP
1
preg_match_all("/\[hide\=(.+?)\](.+?)\[\/hide\]/is", $txt, $matches);
0
Hello Kitty
 Аватар для WhiteMind
690 / 562 / 402
Регистрация: 12.02.2016
Сообщений: 1,436
Записей в блоге: 1
03.07.2016, 00:51
Лучший ответ Сообщение было отмечено _or_75 как решение

Решение

Цитата Сообщение от _or_75 Посмотреть сообщение
но можно ли одной строкой как тут ?:
вам Emilien, дал во 2м сообщении полностью готовый код
надо только скопировать в php и выставить модификаторы.
...да можно
PHP
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
<?php
$txt = "
[hide=name1,name2,name3]
    [hide=text]
        [hide=admin,mdr]
            for admin text
        [/hide]
        ml txt
        [hide=admin,mdr,nick1]
            for admin , nick1 text
        [/hide]
        txt =) 
    [/hide] 
[/hide]
 
[hide=01] [hide=1] test [/hide] [/hide]
[hide=02] [hide=11] test [/hide] [/hide]
";
 
preg_match_all('~\[hide=([^\]]+)\]((?: [^\[]+ | (?! \[/?hide ) . | (?R) )++)\[/hide\]~sxi', $txt, $m);
$txt = implode('', $m[2]);
echo $txt;
Добавлено через 30 секунд
http://sandbox.onlinephpfuncti... 3cf6862084
1
0 / 1 / 1
Регистрация: 18.02.2012
Сообщений: 244
03.07.2016, 11:41  [ТС]
Всем спасибо )
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
03.07.2016, 11:41
Помогаю со студенческими работами здесь

Парсинг тега <span>
Есть следующий тег &lt;div class=&quot;AБРАКАДАБРА&quot;&gt; &lt;span class=&quot;nowrap&quot;&gt;AAA&lt;/span&gt; &lt;span class=&quot;nowrap&quot;&gt;BBB&lt;/span&gt; &lt;span...

Парсинг тега <div>
Есть следующий тег &lt;div class=&quot;AБРАКАДАБРА&quot;&gt; &lt;div AAA=&quot;TEXT&quot;&gt;&lt;/div&gt; ..... &lt;div AAA=&quot;TEXT&quot;&gt;&lt;/div&gt; .... &lt;div...

Парсинг из тега по страницам
Нужно спарсить ники пользователей на сайте. Посмотрел тему https://www.cyberforum.ru/delphi-beginners/thread814186.html#post4285219 но не...

Выравнивание текста в теге INPUT TEXT
как сделать выравнивание вводимого текста в теге INPUT TEXT например по правой части

Парсинг XML (получение строки из определённого тега)
здравствуйте, есть xml-документ который необходимо пропарсить: &lt;?xml version=&quot;1.0&quot; encoding=&quot;utf-8&quot;?&gt; &lt;rss...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
13
Ответ Создать тему
Новые блоги и статьи
SDL3 для Web (WebAssembly): Основы отладки веб-приложений на SDL3 по USB и Wi-Fi, запущенных в браузере мобильных устройств
8Observer8 07.02.2026
Содержание блога Браузер Chrome имеет средства для отладки мобильных веб-приложений по USB. В этой пошаговой инструкции ограничимся работой с консолью. Вывод в консоль - это часть процесса. . .
SDL3 для Web (WebAssembly): Обработчик клика мыши в браузере ПК и касания экрана в браузере на мобильном устройстве
8Observer8 02.02.2026
Содержание блога Для начала пошагово создадим рабочий пример для подготовки к экспериментам в браузере ПК и в браузере мобильного устройства. Потом напишем обработчик клика мыши и обработчик. . .
Философия технологии
iceja 01.02.2026
На мой взгляд у человека в технических проектах остается роль генерального директора. Все остальное нейронки делают уже лучше человека. Они не могут нести предпринимательские риски, не могут. . .
SDL3 для Web (WebAssembly): Вывод текста со шрифтом TTF с помощью SDL3_ttf
8Observer8 01.02.2026
Содержание блога В этой пошаговой инструкции создадим с нуля веб-приложение, которое выводит текст в окне браузера. Запустим на Android на локальном сервере. Загрузим Release на бесплатный. . .
SDL3 для Web (WebAssembly): Сборка C/C++ проекта из консоли
8Observer8 30.01.2026
Содержание блога Если вы откроете примеры для начинающих на официальном репозитории SDL3 в папке: examples, то вы увидите, что все примеры используют следующие четыре обязательные функции, а. . .
SDL3 для Web (WebAssembly): Установка Emscripten SDK (emsdk) и CMake для сборки C и C++ приложений в Wasm
8Observer8 30.01.2026
Содержание блога Для того чтобы скачать Emscripten SDK (emsdk) необходимо сначало скачать и уставить Git: Install for Windows. Следуйте стандартной процедуре установки Git через установщик. . . .
SDL3 для Android: Подключение Box2D v3, физика и отрисовка коллайдеров
8Observer8 29.01.2026
Содержание блога Box2D - это библиотека для 2D физики для анимаций и игр. С её помощью можно определять были ли коллизии между конкретными объектами. Версия v3 была полностью переписана на Си, в. . .
Инструменты COM: Сохранение данный из VARIANT в файл и загрузка из файла в VARIANT
bedvit 28.01.2026
Сохранение базовых типов COM и массивов (одномерных или двухмерных) любой вложенности (деревья) в файл, с возможностью выбора алгоритмов сжатия и шифрования. Часть библиотеки BedvitCOM Использованы. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru