Аватар для alpex
603 / 578 / 103
Регистрация: 16.07.2012
Сообщений: 1,762

Регулярка для поиска телефонов

02.01.2013, 19:05. Показов 5731. Ответов 5
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Что то не получается регулярку составить, что бы выдирать телефоны, формат написания которых заранее не известен, т.е могут быть варианты

(495) 280-06-57
495 280 06 57
4952800657
495 280-06-57
8(495) 280-06-57
ну или еще какие то , т.е абсолютно любые варианты, которые могут встретится просто на сайтах.

В общем задача по определенному поисковому запросу получаем все ссылки из гугла , а потом переходим по каждой ссылке, и считываем мыло и контактные данные, которые находятся на этой странице, и записываем все в файл.

Но вот с телефонами немогу никак разобраться
0
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
02.01.2013, 19:05
Ответы с готовыми решениями:

Как правильно составить маску для поиска номеров телефонов?
Вобщем хочу написать парсер который будет ходить по сайту и собирать телефонные номера. Да вот только для этого нужно правильно сделать...

Нужна быстрая регулярка для поиска внешних ссылок в тегах <a>, которые не являются внутренними
ищу готовую и БЫСТРУЮ регулярку, для поиска внешних ссылок в тегах &lt;a&gt; которые не являются внутренними с последующей заменой для...

Регулярка для поиска IPEndPoint
пытаюсь такую написать, почему то у него нет метода Parse :( почему вот это не срабатывает? @&quot;{4}\:(\d+)&quot; на вход подается...

5
508 / 358 / 13
Регистрация: 12.03.2012
Сообщений: 1,896
02.01.2013, 20:39
Цитата Сообщение от alpex Посмотреть сообщение
получаем все ссылки из гугла , а потом
А может эти телефоны только для людей, а не для ботов?
0
Почетный модератор
Эксперт HTML/CSSЭксперт PHP
 Аватар для KOPOJI
16844 / 6724 / 880
Регистрация: 12.06.2012
Сообщений: 19,967
02.01.2013, 21:26
самый простой способ - это как то так
PHP
1
2
3
4
$pattern = '~(\(\d{3}\)\s\d{3}\-\d{2}\-\d{2})|(\d{3}\s\d{3}\s\d{2}\s\d{2})|(\d{10})|(\d{3}\s\d{3}\-\d{2}\-\d{2})|(8\(\d{3}\)\s\d{3}\-\d{2}\-\d{2})~s';
 if(preg_match_all($pattern, $text, $match)) {
    print_r($match[0]);
 }
Добавлено через 1 минуту
правда это не совсем верно
1
 Аватар для alpex
603 / 578 / 103
Регистрация: 16.07.2012
Сообщений: 1,762
03.01.2013, 06:39  [ТС]
Цитата Сообщение от OnYourLips Посмотреть сообщение
А может эти телефоны только для людей, а не для ботов?
ну так я для людей бота и делаю

Добавлено через 5 минут
Цитата Сообщение от KOPOJI Посмотреть сообщение
правда это не совсем верно
да не правильно выбирает
0
 Аватар для Vovan-VE
13210 / 6599 / 1041
Регистрация: 10.01.2008
Сообщений: 15,069
03.01.2013, 08:35
Если бы я ориентировался только на федеральные номера с своей стране, то искал бы 10 цифр с необязательной "7" или "8" впереди (и некоторыми разделителями между цифрами), и чтобы до и после цифры отсутствовали.
Code
1
/(?<![\d-()\s])[-()\s]*(?:[78][-()\s]*)?(?:\d[-()\s]*){10}(?!\d)/
Code
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
/
    (?<!
        [\d-()\s]
    )
    [-()\s]*
    (?:
        [78]
        [-()\s]*
    )?
    (?:
        \d
        [-()\s]*
    ){10}
    (?!
        \d
    )
/x
Добавлено через 5 минут
И то я бы не нашел всех телефонов. Например в сабжевом посте:
Цитата Сообщение от alpex Посмотреть сообщение
т.е могут быть варианты
(495) 280-06-57
495 280 06 57
4952800657
495 280-06-57
8(495) 280-06-57
ну или еще какие то
я бы не нашел ничего, ибо (не считая разделителей) вокруг 10 цифр есть еще цифры. Надо добавить между телефонами, например, запятые:
т.е могут быть варианты
(495) 280-06-57,
495 280 06 57,
4952800657,
495 280-06-57,
8(495) 280-06-57
ну или еще какие то
1
 Аватар для alpex
603 / 578 / 103
Регистрация: 16.07.2012
Сообщений: 1,762
03.01.2013, 09:26  [ТС]
Цитата Сообщение от Vovan-VE Посмотреть сообщение
я бы не нашел ничего, ибо (не считая разделителей) вокруг 10 цифр есть еще цифры. Надо добавить между телефонами, например, запятые:
нет такой возможности добавить(

Добавлено через 28 минут
такой паттерн вроде бы все выбирает, но только еще огромную кучу мусора тоже
Code
1
'#((8|\+7)-?)?\(?\d{3,5}\)?-?\d{1}-?\d{1}-?\d{1}-?\d{1}-?\d{1}((-?\d{1})?-?\d{1})?#'
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
03.01.2013, 09:26
Помогаю со студенческими работами здесь

Регулярка для поиска значения
Есть строка 'first|second|third' Мне нужно получить 3 первых символа после знака |. Пыталась сделать что-то типа: но безуспешно ...

Регулярка для поиска не отрицательных чисел
import java.util.ArrayList; import java.util.Arrays; import java.util.List; import java.util.Collections; public class Lab1 { ...

Регулярка для поиска номера телефона
Привет ! Сделал такую регулярку: const string myReg1 = @&quot;((\+38|8)?)?(?\d{3}??)?{6,14}&quot;; Она не ловит все варианты...

Регулярка для поиска пути к корню диска
Добрый день. Мне понадобилось решить простую задачу: определить, ведет ли путь, указанный в строке к корню диска. Казалось бы все просто,...

Регулярка для поиска email в html-коде
Java, поиск e-mail в html-коде. Само регулярное выражение (сразу прикладываю несколько вариантов, которые перепробовал с Pattern.MULTILINE...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
6
Ответ Создать тему
Опции темы

Новые блоги и статьи
Отчёт о затраченных материалах за определенный период с макетом печатной формы
Maks 21.04.2026
Отчёт из решения ниже размещён в конфигурации КА2. Задача: разработка отчёта по затраченным материалам за определённый период, с возможностью вывода печатной формы отчёта с шапкой и подвалом. В. . .
Отчёт о спецтехнике находящейся в ремонте
Maks 20.04.2026
Отчёт из решения ниже размещен в конфигурации КА2. Задача: отобразить спецтехнику, которая на данный момент находится в ремонте. Есть нетиповой документ "Заявка на ремонт спецтехники" который. . .
Памятка для бота и "визитка" для читателей "Semantic Universe Layer (Слой семантической вселенной)"
Hrethgir 19.04.2026
Сгенерировано для краткого описания по случаю сборки и компиляции скелета серверного приложения. И пусть после этого скажут, что статьи сгенерированные AI - туфта и не интересно. И это не реклама -. . .
Запрет удаления строк ТЧ документа при определённом условии
Maks 19.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "Аккумуляторы", разработанного в конфигурации КА2. У данного документа есть ТЧ, в которой в зависимости от прав доступа. . .
Модель заражения группы наркоманов
alhaos 17.04.2026
Условия задачи сформулированы тут Суть: - Группа наркоманов из 10 человек. - Только один инфицирован ВИЧ. - Колются одной иглой. - Колются раз в день. - Колются последовательно через. . .
Мысли в слух. Про "навсегда".
kumehtar 16.04.2026
Подумалось тут, что наверное очень глупо использовать во всяких своих установках понятие "навсегда". Это очень сильное понятие, и я только начинаю понимать край его смысла, не смотря на то что давно. . .
My Business CRM
MaGz GoLd 16.04.2026
Всем привет, недавно возникла потребность создать CRM, для личных нужд. Собственно программа предоставляет из себя базу данных клиентов, в которой можно фиксировать звонки, стадии сделки, а также. . .
Знаешь почему 90% людей редко бывают счастливыми?
kumehtar 14.04.2026
Потому что они ждут. Ждут выходных, ждут отпуска, ждут удачного момента. . . а удачный момент так и не приходит.
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru