Форум программистов, компьютерный форум, киберфорум
PHP: RegExp
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.83/30: Рейтинг темы: голосов - 30, средняя оценка - 4.83
 Аватар для alpex
603 / 578 / 103
Регистрация: 16.07.2012
Сообщений: 1,762

Регулярка для поиска телефонов

02.01.2013, 19:05. Показов 5684. Ответов 5
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Что то не получается регулярку составить, что бы выдирать телефоны, формат написания которых заранее не известен, т.е могут быть варианты

(495) 280-06-57
495 280 06 57
4952800657
495 280-06-57
8(495) 280-06-57
ну или еще какие то , т.е абсолютно любые варианты, которые могут встретится просто на сайтах.

В общем задача по определенному поисковому запросу получаем все ссылки из гугла , а потом переходим по каждой ссылке, и считываем мыло и контактные данные, которые находятся на этой странице, и записываем все в файл.

Но вот с телефонами немогу никак разобраться
0
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
02.01.2013, 19:05
Ответы с готовыми решениями:

Как правильно составить маску для поиска номеров телефонов?
Вобщем хочу написать парсер который будет ходить по сайту и собирать телефонные номера. Да вот только для этого нужно правильно сделать...

Нужна быстрая регулярка для поиска внешних ссылок в тегах <a>, которые не являются внутренними
ищу готовую и БЫСТРУЮ регулярку, для поиска внешних ссылок в тегах &lt;a&gt; которые не являются внутренними с последующей заменой для...

Регулярка для поиска IPEndPoint
пытаюсь такую написать, почему то у него нет метода Parse :( почему вот это не срабатывает? @&quot;{4}\:(\d+)&quot; на вход подается...

5
508 / 358 / 13
Регистрация: 12.03.2012
Сообщений: 1,896
02.01.2013, 20:39
Цитата Сообщение от alpex Посмотреть сообщение
получаем все ссылки из гугла , а потом
А может эти телефоны только для людей, а не для ботов?
0
Почетный модератор
Эксперт HTML/CSSЭксперт PHP
 Аватар для KOPOJI
16844 / 6724 / 880
Регистрация: 12.06.2012
Сообщений: 19,967
02.01.2013, 21:26
самый простой способ - это как то так
PHP
1
2
3
4
$pattern = '~(\(\d{3}\)\s\d{3}\-\d{2}\-\d{2})|(\d{3}\s\d{3}\s\d{2}\s\d{2})|(\d{10})|(\d{3}\s\d{3}\-\d{2}\-\d{2})|(8\(\d{3}\)\s\d{3}\-\d{2}\-\d{2})~s';
 if(preg_match_all($pattern, $text, $match)) {
    print_r($match[0]);
 }
Добавлено через 1 минуту
правда это не совсем верно
1
 Аватар для alpex
603 / 578 / 103
Регистрация: 16.07.2012
Сообщений: 1,762
03.01.2013, 06:39  [ТС]
Цитата Сообщение от OnYourLips Посмотреть сообщение
А может эти телефоны только для людей, а не для ботов?
ну так я для людей бота и делаю

Добавлено через 5 минут
Цитата Сообщение от KOPOJI Посмотреть сообщение
правда это не совсем верно
да не правильно выбирает
0
 Аватар для Vovan-VE
13210 / 6599 / 1041
Регистрация: 10.01.2008
Сообщений: 15,069
03.01.2013, 08:35
Если бы я ориентировался только на федеральные номера с своей стране, то искал бы 10 цифр с необязательной "7" или "8" впереди (и некоторыми разделителями между цифрами), и чтобы до и после цифры отсутствовали.
Code
1
/(?<![\d-()\s])[-()\s]*(?:[78][-()\s]*)?(?:\d[-()\s]*){10}(?!\d)/
Code
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
/
    (?<!
        [\d-()\s]
    )
    [-()\s]*
    (?:
        [78]
        [-()\s]*
    )?
    (?:
        \d
        [-()\s]*
    ){10}
    (?!
        \d
    )
/x
Добавлено через 5 минут
И то я бы не нашел всех телефонов. Например в сабжевом посте:
Цитата Сообщение от alpex Посмотреть сообщение
т.е могут быть варианты
(495) 280-06-57
495 280 06 57
4952800657
495 280-06-57
8(495) 280-06-57
ну или еще какие то
я бы не нашел ничего, ибо (не считая разделителей) вокруг 10 цифр есть еще цифры. Надо добавить между телефонами, например, запятые:
т.е могут быть варианты
(495) 280-06-57,
495 280 06 57,
4952800657,
495 280-06-57,
8(495) 280-06-57
ну или еще какие то
1
 Аватар для alpex
603 / 578 / 103
Регистрация: 16.07.2012
Сообщений: 1,762
03.01.2013, 09:26  [ТС]
Цитата Сообщение от Vovan-VE Посмотреть сообщение
я бы не нашел ничего, ибо (не считая разделителей) вокруг 10 цифр есть еще цифры. Надо добавить между телефонами, например, запятые:
нет такой возможности добавить(

Добавлено через 28 минут
такой паттерн вроде бы все выбирает, но только еще огромную кучу мусора тоже
Code
1
'#((8|\+7)-?)?\(?\d{3,5}\)?-?\d{1}-?\d{1}-?\d{1}-?\d{1}-?\d{1}((-?\d{1})?-?\d{1})?#'
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
03.01.2013, 09:26
Помогаю со студенческими работами здесь

Регулярка для поиска значения
Есть строка 'first|second|third' Мне нужно получить 3 первых символа после знака |. Пыталась сделать что-то типа: но безуспешно ...

Регулярка для поиска не отрицательных чисел
import java.util.ArrayList; import java.util.Arrays; import java.util.List; import java.util.Collections; public class Lab1 { ...

Регулярка для поиска номера телефона
Привет ! Сделал такую регулярку: const string myReg1 = @&quot;((\+38|8)?)?(?\d{3}??)?{6,14}&quot;; Она не ловит все варианты...

Регулярка для поиска пути к корню диска
Добрый день. Мне понадобилось решить простую задачу: определить, ведет ли путь, указанный в строке к корню диска. Казалось бы все просто,...

Регулярка для поиска email в html-коде
Java, поиск e-mail в html-коде. Само регулярное выражение (сразу прикладываю несколько вариантов, которые перепробовал с Pattern.MULTILINE...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
6
Ответ Создать тему
Новые блоги и статьи
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта Симптом: После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
Access
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
Новый ноутбук
volvo 07.12.2025
Всем привет. По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне: Ryzen 5 7533HS 64 Gb DDR5 1Tb NVMe 16" Full HD Display Win11 Pro
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов На странице: https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/ нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином. Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов. . . .
Ломающие изменения в C#.NStar Alpha
Etyuhibosecyu 20.11.2025
Уже можно не только тестировать, но и пользоваться C#. NStar - писать оконные приложения, содержащие надписи, кнопки, текстовые поля и даже изображения, например, моя игра "Три в ряд" написана на этом. . .
Мысли в слух
kumehtar 18.11.2025
Кстати, совсем недавно имел разговор на тему медитаций с людьми. И обнаружил, что они вообще не понимают что такое медитация и зачем она нужна. Самые базовые вещи. Для них это - когда просто люди. . .
Создание Single Page Application на фреймах
krapotkin 16.11.2025
Статья исключительно для начинающих. Подходы оригинальностью не блещут. В век Веб все очень привыкли к дизайну Single-Page-Application . Быстренько разберем подход "на фреймах". Мы делаем одну. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2025, CyberForum.ru