Форум программистов, компьютерный форум, киберфорум
Наши страницы
Алгоритмы
Войти
Регистрация
Восстановить пароль
 
Diplomat52ru
0 / 0 / 0
Регистрация: 05.11.2014
Сообщений: 5
1

Задача для аналитика отдела обработки

06.11.2014, 00:12. Просмотров 356. Ответов 3
Метки нет (Все метки)

Вот небольшая задача для аналитика отдела обработки.
В базе лежат мейлы, собранные с источников. Иногда в это поле летит разного рода «мусор», иногда что-то лишнее прибавляется к мейлам. Небольшую выгрузку с емейлами прикрепила к письму.
Общая задача состоит в следующем: провести обработку поля таким образом, чтобы это можно было вывести в систему и не краснеть за качество информации. Часть аналитика тут – донести до программиста\базиста, КАК тот должен обработать поле.

Если сделать декомпозицию задачи аналитика, получается следующее:
- провести анализ имеющихся в базе данных

- оценить необходимость и возможность обработки мейлов

- написать правило валидации на это поле, чтобы подтвердить, что здесь именно email указан, а не другая инфорация (сайт, телефон и проч.)

- описать алгоритм\правила обработки поля

Вот такую задачу мне сегодня скинули. Кто нибудь помогите с ней пожалуйсто я сам в алгоритмах очень плохо разбираюсь. И если можно то с обьяснениями пожалуйсто я хочу чтобы я сам понимал.
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
Similar
Эксперт
41792 / 34177 / 6122
Регистрация: 12.04.2006
Сообщений: 57,940
06.11.2014, 00:12
Ответы с готовыми решениями:

Парсер + работа с БД + серьезная аналитика + графические отчеты + веб интерфейс
Здравствуйте! Задача: 1. Заходить на сайты с нужными мне БД (количество от...

Программа для обработки видео
Здравствуйте. Суть вопроса состоит в том что есть камера которая снимает...

Компиляторы для параллельной обработки информации
У меня завтра экзамен, хотелось бы, чтобы вы срочно дали подробный ответ на...

Указать код в OnCloseUp, чтоб при выборе, например, Отдела Технического в DBLookupComboBox выходили услуги этого отдела
Вопрос заключается в следующим. У меня в бд есть 2 таблицы: ОтделУслуг,...

Задача обработки строк
Дана строка символов.Группы символов,разделенные одним или несколькими...

3
Diplomat52ru
0 / 0 / 0
Регистрация: 05.11.2014
Сообщений: 5
06.11.2014, 00:21  [ТС] 2
ID GUID Actual Email
1 C9F1BEB3-8212-414D-A028-97C56017FF7D NULL <Email,nvarchar(100),>
338 E169168D-6495-4641-8C86-C34A9AD4AFF3 NULL post@kamkombank.ru
339 FFF27DCB-D392-4F9C-99E7-6038D33EBBE9 NULL akkb@kamkombank.ru
482 FE3316FE-384F-4D1F-A646-85FCCB584CFA NULL INFO@DIGISALON.RU
609 FE382348-6D6F-4201-A8E7-78B36AC9D158 NULL info@parisii.ru
993 FF2D46B4-F14A-403C-9B7B-8C0E9C85CC8E NULL info@santarini.ru
1254 F9FFB99E-841A-433F-9262-36D39281AD1A NULL boxoffice@mikhailovsky.ru
1297 F770C2F5-D310-4878-AB02-ED00B3FAF02F NULL orendramteatr@mail.ru
1311 FEBC9BB9-E2E6-4AD6-BC1F-D115D822D3BA NULL tickets@mariinsky.ru
1385 FAABE9E9-4B25-471E-AD82-189364434313 NULL Buratino-2006@yandex.ru
1406 D3F36720-872E-4829-B3CB-BB707C5001C5 NULL ticket@muzcomedy.spb.ru
1430 F47515AC-ED37-4853-8F11-D9EEB9241363 NULL tickets@lensov-theatre.spb.ru
1442 FC3CE15B-3941-4253-AB45-192FC2A4F509 NULL teatr@komediaspb.ru
1584 FEE985F7-7DC2-4582-AACF-A05109C99375 NULL bashopera@ufanet.ru,ufa.opera.ballet@gmail.com
2063 FFED625B-A14D-46CA-A0B2-814867531984 NULL info@skazkindom.ru
2245 FE6AF803-7FF0-42B5-AD40-01DC6AA4E2AE NULL naneve@mail.ru,naneve@rambler.ru
2266 ACDA1C6D-0842-4261-81B0-CC2632D1166B NULL info@skazkindom.ru
2271 FF46F9A3-828E-45D7-B11D-1CE2006445BF NULL theatre_conserv@mail.ru
2558 F8C1E357-0D53-4CA4-BE2E-F40D985F3AC7 NULL info@kedr-spa.ru
2563 FC2B374B-8EC0-4E7E-850F-5BBA1683F5E8 NULL admin@pkteatr.ru
2630 FD85BF37-6859-402C-BF2A-1727A4DB369D NULL admin@zazercal.spb.ru
2677 FD7375AA-6054-465A-8A75-DF55972125A4 NULL fc@baltichouse.spb.ru
2980 FFAE27F1-A999-42DB-A92D-8A2623B8B859 NULL Lacantinetto@mail.ru
3177 FD145C62-3300-466D-83EF-CD60D90BF0A3 NULL posolstvo-pab@mail.ru
3413 FEED1FCA-23A9-4240-9C5F-1A946F74DB2B NULL korchma@pir.nn.ru
4181 FF67B0A9-4492-460A-A586-C3A30525B710 NULL karamel@pir.nn.ru
4681 FFFC7CF7-DB86-43A7-9179-0D3BF98E9FFF NULL billy@pir.nn.ru
4940 FCA97A39-B5EF-45DD-BEA4-3F919FA36FD0 NULL gans@pir.nn.ru
5270 FFFB79F2-2C06-490F-B935-17213D5A56D1 NULL Gavrosh_pir@inbox.ru
5467 FE3E447B-FA47-404C-A95D-23E9241DBBB4 NULL ptkn10@mail.ru
5859 FC6114E9-215B-4D07-AADD-2857819123F0 NULL stroganov.nn@mail.ru
6042 FE5FA547-B9FE-4081-86F7-548CB779130B NULL sport-bar@pir.nn.ru
6259 FBCA38C2-325A-40FD-8431-2CE50A7085A7 NULL tubeteyka@pir.nn.ru
6509 CF6339E9-5D90-43E9-8AFF-2468CA9B7ABA NULL 52366@subway.ru
6510 77BC984B-EED8-486D-AAA1-ED5B62466C7E NULL 52981@subway.ru
6511 4482424E-054F-4E9D-9CA8-6D4B525E3E26 NULL 52383@subway.ru
6513 A725F08E-3864-4736-9C45-6EA7CE5F4F08 NULL 52196@subway.ru
6516 F2E54FA0-0A0D-4EEB-AC60-565509425AA3 NULL 52600@subway.ru
6517 3D5D1E8E-10A8-4290-9794-65445855649A NULL 52423@subway.ru
6519 4EC937E0-3A61-41D0-A9C3-375E3D4C659C NULL 52425@subway.ru



вот такого вида информация в файле
0
PavelPol
53 / 52 / 32
Регистрация: 05.11.2014
Сообщений: 241
06.11.2014, 00:24 3
Я бы это реализовал на PHP примерно в таком порядке:

1. Если проходит через функцию filter_var($email_a, FILTER_VALIDATE_EMAIL), то все верно и следующие шаги не выполнять
2. Проверить наличие "@" и "." - если нет одного из знаков - сразу удалять, иначе к пункту 3.
3. Проверять на наличие знаков, запрещенных в email и удалить куски до знака, если @ следует далее, или после знака, если @ была до этого.
4. Циклически со смещением по символу до @ проверять filter_var($email_a, FILTER_VALIDATE_EMAIL).
0
Diplomat52ru
0 / 0 / 0
Регистрация: 05.11.2014
Сообщений: 5
06.11.2014, 21:39  [ТС] 4
Вся проблема у меня именно в описании алгоритма. Понятия не имею как он выглядеть должен.

Добавлено через 9 часов 30 минут
в файле присутствует мусор в виде тегов которые я так понял и надо поубирать
вот пример.
7020 BB9EEF33-544E-4D49-93CE-F2D0717EBACA NULL moscow2@finotdel.ru</a></p><p>
7021 94C6391D-C82F-4FD6-85F2-C4C78D5BCC44 NULL moscow3@finotdel.ru
7022 F1763D97-2AB2-4788-A162-923E05D51F6C NULL astrakhan@finotdel.ru
7023 8922FBE8-3B87-4919-AE12-1BC1BA24DAD4 NULL balakovo@finotdel.ru
7024 50D3F6DD-6261-4DD2-BD92-CA03E02B7A4C NULL belgorod@finotdel.ru
7025 8A3EC7EB-D5BF-43BB-A357-76E875656871 NULL bryansk@finotdel.ru
7026 C5B16A6D-37EA-4736-8127-8510311EC979 NULL velikiynovgorod@finotdel.ru
7027 48712550-A53E-4FF5-9D78-EEFB96DC5251 NULL volgograd@finotdel.ru
7028 CE2B9A69-6FB2-4912-B6EA-B75C24215B00 NULL volzhkiy@finotdel.ru
7029 851766CC-250D-401B-8199-779F715F049C NULL voronezh@finotdel.ru
7030 C7BFF03E-710B-4425-A8E1-C2256214360E NULL dmitrov@finotdel.ru
7031 90BAC0BC-8B47-4F60-90A6-7C2988CD6959 NULL ekaterinburg@finotdel.ru
7032 6ABC619B-EC17-4A2A-8A46-0CDA79FAA4BB NULL ivanovo@finotdel.ru
7033 761980E7-63DC-4AE8-A89C-D4E4178529F1 NULL izhevsk@finotdel.ru</a></p><p>
7034 17B086A6-8DC0-4155-9681-A41E297026CB NULL <br/></a></p><p>
0
MoreAnswers
Эксперт
37091 / 29110 / 5898
Регистрация: 17.06.2006
Сообщений: 43,301
06.11.2014, 21:39

Система тикетов для ИТ-отдела
Доброго времени суток! Возможно кто-то задавался вопросом о введении системы...

Прокси для отдела из 8 пользователей
Здравствуйте, подскажите какой прокси использовать? имеется отдел по набору...

БД для отдела кадров на Оракле
можно ли на Оракле создать БД для отдела кадров???и соединить ее с Delphi?


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
4
Ответ Создать тему
Опции темы

КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin® Version 3.8.9
Copyright ©2000 - 2018, vBulletin Solutions, Inc.
Рейтинг@Mail.ru