0 / 0 / 0
Регистрация: 18.01.2017
Сообщений: 56

Ошибки удаления строки после определенного знака

19.06.2017, 15:12. Показов 1825. Ответов 22
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Доброго времени суток. Суть такова. Имею кучу строк в файле где в перемешку с текстом лежат url выдергиваю их при помощи
PHP
1
preg_match_all("/(http:\\/\\/)?([a-z_0-9-.]+\\.[a-z]{2,3}(([ \"'>\r\n\t])|(\\/([^ \"'>\r\n\t]*)?)))/", $a, $b);
отправляю в txt файл с разделителем | получается вот такая картина.
Большенство URL в отличном виде как и нужно http://site/catalog/file

Но процентов 10 в таком виде http://site/catalog/file;текст

попытался избавиться от этого добра вот таким образом

PHP
1
2
3
4
5
6
7
8
9
10
11
12
13
14
   $a = file_get_contents('text.txt');
   
   $arr = explode('|', $a);
 
   
   $arr1 = array();
   
   $count = count($arr);
     for ($i=0; $i<$count; $i++){
         $str = array_shift($arr);
        
         $str = preg_replace("/\;.*/", "", $stri);
         array_push($arr1, $str);    
     }
Отлично убирает в окончании где есть знак ; и все что после него. Но почему то происходит следующее, часть очень не значительная url теряется. Просто исчезает. При всем при этом нет ни какой закономерности в окончаниях url к примеру какой то заканчивается на file какой то на file; какой то на file;текст, нет ни какой зависимости пропадания url. Пропажи происходят со всеми окончаниями, я уже пересмотрел предшествиников перед пропажей, тоже самое ни каких отличительных черт. Может есть какой то способ по другому отчистить url от мусора после ; и включая его?

Добавлено через 1 час 22 минуты
Лоханулся с регуляркой preg_match_all("/(http:\\/\\/)?([a-z_0-9-.]+\\.[a-z]{2,3}(([ "'>\r\n\t])|(\\/([^ "'>\r\n\t]*)?)))/", $a, $b); выборки url. там еще пропускается
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
19.06.2017, 15:12
Ответы с готовыми решениями:

Почему после удаления строки из таблицы у следующей строки ID на 1 больше удаленной?
Почему после удаления строки из таблицы у следующей строки ID на 1 больше удаленной? В БД стоит галочка на AI. По сути ведь все данные...

Удалить из текста находящегося в файле,самую длинную строку. Сохранить его после удаления этой строки
Проблема в том,что не могу понять как сосчитать самую длинную строку и как сохранять. Я сам составил код на удаление,определенной...

Вывести текст после определенного знака
есть вот такая запись : bla bla bla @ 33BD нужно вывести все что после этого знака @ пытался через греп , но выводит только @...

22
0 / 0 / 0
Регистрация: 18.01.2017
Сообщений: 56
19.06.2017, 23:23  [ТС]
Студворк — интернет-сервис помощи студентам
Пифагор, Да я просто не капипастил а написал на скорую руку вот и такие ошибки, а по идее было так
PHP
1
2
3
4
5
6
7
8
9
10
11
12
13
14
$a = file_get_contents('text.txt');
   
   $arr = explode('|', $a);
 
   
   $arr1 = array();
   
   $count = count($arr);
     for ($i=0; $i<$count; $i++){
         $stri = array_shift($arr);
        
         $stri = preg_replace("/\;.*/", "", $stri);
         array_push($arr1, $stri);    
     }
Добавлено через 2 минуты
Пифагор, на счет explode сраху мысля, просто теперь перевариваю в бошке как это в цикле замутить. Хотя.... в строку по разделителю пробел, потом из строки в массив по этому же разделителю и не нужны ни какие циклы.
0
 Аватар для Пифагор
2172 / 1655 / 840
Регистрация: 10.01.2015
Сообщений: 5,207
19.06.2017, 23:29
Сделайте вложенный цикл. На моем примере:
PHP
1
2
3
4
5
6
7
8
9
10
11
12
13
14
$file = file('file.txt');
$arr = array();
 
foreach($file as $v){
  preg_match_all("~(http.+jpg)~iu", $v, $m);
  $array = explode(" ", $m[0][0]);
  $count = count($array);
  for($i = 0; $i < $count; $i++){
    $arr[] = $array[$i];
  }
}
echo '<pre>';
print_r($arr);
echo '</pre>';
Code
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
Array
(
    [0] => http://site/images/big/0/52.jpg
    [1] => http://site/images/big/0/52-1.jpg
    [2] => http://site/images/big/0/52-2.jpg
    [3] => http://site/images/big/0/52-3.jpg
    [4] => http://site/images/big/0/52-4.jpg
    [5] => http://site/images/big/0/52-5.jpg
    [6] => http://site/images/big/0/53.jpg
    [7] => http://site/images/big/0/53-1.jpg
    [8] => http://site/images/big/0/53-2.jpg
    [9] => http://site/images/big/0/53-3.jpg
    [10] => http://site/images/big/0/53-4.jpg
    [11] => http://site/images/big/0/53-5.jpg
)
1
0 / 0 / 0
Регистрация: 18.01.2017
Сообщений: 56
20.06.2017, 16:57  [ТС]
Пифагор, Ок, попробую, но уже завтра)))

Добавлено через 14 часов 32 минуты
Странное дело. Описываю кратко.
Если делаю по своему
PHP
1
2
3
4
5
$a = file_get_contents('57adcc572b1b97 (1).53987341');
 
preg_match_all("~(http.+jpg)~iu", $a, $b);
 
$result = array_unique($b[0]);
То в массиве $result через var dump выдает все позиции. При попытке записи в txt без разницы каким способом, хоть преобразуя в строку, хоть прямиком массив $result теряются позиции. Ориентируюсь на цифру 59916 Если смотреть в $result позиция есть, если записать в файл или к примеру перекинуть в другой массив для разбития единичных url в ячейку то начинается вот такое. 58989 и следом 59933 то есть теряется так не хило. И не в одном месте, просто я только одно место выловил. Если ставить ваш код
PHP
1
2
3
4
5
6
7
8
9
10
11
12
13
14
$file = file('file.txt');
$arr = array();
 
foreach($file as $v){
  preg_match_all("~(http.+jpg)~iu", $v, $m);
  $array = explode(" ", $m[0][0]);
  $count = count($array);
  for($i = 0; $i < $count; $i++){
    $arr[] = $array[$i];
  }
}
echo '<pre>';
print_r($arr);
echo '</pre>';
То позиции теряются сразу и по такой же схеме 58989 и следом 59933

Добавлено через 2 часа 45 минут
Пифагор, Все решилось путем изменения одной строки

PHP
1
2
3
$result = array_unique($b[0]); 
// поменяно на
$result = ($b[0]);
Проблема ушла, скрипт отработал, проверил наличие рисунков, сверил адреса и скачал не достающие.
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
20.06.2017, 16:57
Помогаю со студенческими работами здесь

Возврат строки до определенного знака
Есть столбец (String) в котором такие значение &quot;20/34/45 &quot;, &quot;34/5/122&quot; и т.д. Как мне выбрать значение строки до первого слэша...

Сравнение элементов матрицы до определенного знака после запятой
Можно ли сравнивать элементы матрицы до определенного знака после запятой? Как лучше это реализовать. Нужно создавать цикл посимвольного...

Обрезать (не округлить) число до определенного знака после запятой
подскажите как обрезать число до определённого знака - не округлить, а обрезать. 1.555666 в итоге чтобы получить 1.555 что-то с trunc?

Чтение строки типа string до определенного знака
добрый вечер, не совсем понятно как организовать чтение из файла до знака &quot;:&quot;. Слова разделены &quot;;&quot;. А вообще задача...

Как получить часть строки до определенного знака
Всем Здравствуйте! Прошу знатоков о помощи. Есть строка, разделенная &quot;;&quot; - &quot;Строка1; Строка2; Строка3; и т.д.&quot;. Можно ли из этой...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
23
Ответ Создать тему
Опции темы

Новые блоги и статьи
Гайд, как ворваться в вайб-кодинг в мае 2026
Noname2331 17.05.2026
Простите за получившееся полотно текста, я даже не знаю, как его разбить на главы. Тут, что называется, ни добавить ни убавить, одна сцена одним дублем. На моих глазах недавно случилось чудо. Как. . .
[golang] Алгоритм «Хак Госпера»
alhaos 17.05.2026
Алгоритм «Хак Госпера» Хак Госпера (Gosper's Hack) — алгоритм нахождения следующего по величине числа с тем же количеством установленных бит. Придуман Биллом Госпером в 1970-х, опубликован в. . .
Рисование бинарного древа до 6-го колена на js, svg.
russiannick 17.05.2026
<svg width="335" height="240" viewBox="0 0 335 240" fill="#e5e1bb"> <style> <!]> </ style> <g id="bush"> </ g> </ svg> function fn(){ let rost;/ / высота древа let xx=165,yy=210,w=256;
FSharp: interface of module
DevAlt 16.05.2026
Интерфейс модуля F# позволяет управлять доступностью членов, содержащихся в реализации модуля. По-умолчанию все члены модуля доступны: module Foo let x = 10 let boo () = printfn "boo" . . .
Хитросплетение родственных связей пантеона греческих богов.
russiannick 14.05.2026
Однооконник, позволяющий узреть и изучить отдельных героев древней Греции. <!DOCTYPE html> <html lang="ru"> <head> <meta charset="UTF-8"> <meta http-equiv="X-UA-Compatible". . .
[golang] Угол между стрелками часов
alhaos 12.05.2026
По заданным значениям часа и минуты необходимо определить значение меньшего угла между стрелками аналогового циферблата часов. import "math" func angleClock(hour int, minutes int) float64 { . . .
Debian 13: Установка Lazarus QT5
ВитГо 09.05.2026
Эта инструкция моя компиляция инструкций volvo https:/ / www. cyberforum. ru/ blogs/ 203668/ 10753. html и его же старой инструкции по установке Lazarus с gtk2. . .
Нейросеть на алгоритме "эстафета хвоста" как перспектива.
Hrethgir 06.05.2026
На десерт, когда запущу сервер. Статья тут https:/ / habr. com/ ru/ articles/ 1030914/ . Автор я сам, нейросеть только помогает в вопросах которые мне не известны - не знаю людей которые знали-бы. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru