|
0 / 0 / 0
Регистрация: 26.12.2012
Сообщений: 15
|
|
Нужен скрипт, чтобы проверить email на схожесть09.04.2015, 15:15. Показов 1506. Ответов 2
Метки нет (Все метки)
Доброе время суток. Создаю тему в данном разделе, поскольку мой вопрос можно отнести к разным языкам как думаю.
Задача проста, но для несведущего в программировании сложна. Есть база данных email, база большая, несколько десятков тысяч. Так вот попадаются порой схожие email, например: c.h.e.a.po.akl.e.y.s.ou.t.l.et.au@gmail.com c.hea.poa.kleysu.nglass.esa.us.ale@gmail.com chea.poakley.su.n.g.la.sses.au.s.ale@gmail.com chea.poa.kley.sungl.assesa.u.sal.e@gmail.com Суть в том, что до @ порядок и количество букв одинаковое, только вот расположение точек разное. Нужно убрать такие email. Можно проверять на схожесть конечно на сайтах подобных, но там строку со строкой только, поодиночке. Возможно ли как то реализовать скрипт, который бы проверял по строкам, где по одному email, или что удобней таблицу, саму с собой для выявления и удаления таких email? Буду очень благодарен в помощи. Если есть наметки, или уже видели подобное где-то, или знаете и это довольно просто, прошу помочь. Требовать готовый код, особенно если он трудоемкий даже не думал. С уважением, Дмитрий.
0
|
|
| 09.04.2015, 15:15 | |
|
Ответы с готовыми решениями:
2
Проверить на схожесть записи Какой нужен код, чтобы проверить выбран ли элемент в ComboBox? |
|
|
|
| 09.04.2015, 16:19 | |
|
Если по памяти ограничений нет (речь о нескольких десятках мегабайт), то просто читать все адреса в std::set. Только set'у подсунуть компаратор, который будет сравнивать адреса, предварительно удалив оттуда все точки до символа @. В итоге получим множество уникальных адресов, которое можно сбросить в файл.
Но С++ не самый удачный выбор, проще может на питоне это сделать)
0
|
|
|
196 / 197 / 120
Регистрация: 27.05.2011
Сообщений: 545
|
||||||
| 11.04.2015, 09:56 | ||||||
Сообщение было отмечено KeyDiWeb как решение
Решение
Ну, вот, наверное, как-то так. Я думаю, на С++ будет всё-таки быстрее, чем на питоне. Сравнивать "вручную" я тоже решил ради скорости, чтобы не было лишних копирований. Конечно же, компилировать стоит с максимальной опитимизацией.
Кликните здесь для просмотра всего текста
Можно попытаться использовать unordered_map, правда, в результате могут тогда исчезнуть какие-то неповторяющиеся адреса. Тут только надо правильно построить хеш-функцию.
0
|
||||||
| 11.04.2015, 09:56 | |
|
Помогаю со студенческими работами здесь
3
Скрипт отправки данных на email Скрипт отправки данных на email Проверить, является ли строка email Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
|||
|
SDL3 для Web (WebAssembly): сборка C/C++ проекта из консоли
8Observer8 30.01.2026
Содержание блога
Если вы откроете примеры для начинающих на официальном репозитории SDL3 в папке: examples, то вы увидите, что все примеры используют следующие четыре обязательные функции, а. . .
|
Установка Emscripten SDK (emsdk) и CMake на Windows для сборки C и C++ приложений в WebAssembly (Wasm)
8Observer8 30.01.2026
Чтобы скачать Emscripten SDK (emsdk) необходимо сначало скачать и уставить Git: Install for Windows. Следуйте стандартной процедуре установки Git через установщик. Система контроля версиями Git. . .
|
Подключение Box2D v3 к SDL3 для Android: физика и отрисовка коллайдеров
8Observer8 29.01.2026
Содержание блога
Box2D - это библиотека для 2D физики для анимаций и игр. С её помощью можно определять были ли коллизии между конкретными объектами. Версия v3 была полностью переписана на Си, в. . .
|
Инструменты COM: Сохранение данный из VARIANT в файл и загрузка из файла в VARIANT
bedvit 28.01.2026
Сохранение базовых типов COM и массивов (одномерных или двухмерных) любой вложенности (деревья) в файл, с возможностью выбора алгоритмов сжатия и шифрования.
Часть библиотеки BedvitCOM
Использованы. . .
|
|
Загрузка PNG с альфа-каналом на SDL3 для Android: с помощью SDL_LoadPNG (без SDL3_image)
8Observer8 28.01.2026
Содержание блога
SDL3 имеет собственные средства для загрузки и отображения PNG-файлов с альфа-каналом и базовой работы с ними. В этой инструкции используется функция SDL_LoadPNG(), которая. . .
|
Загрузка PNG с альфа-каналом на SDL3 для Android: с помощью SDL3_image
8Observer8 27.01.2026
Содержание блога
SDL3_image - это библиотека для загрузки и работы с изображениями. Эта пошаговая инструкция покажет, как загрузить и вывести на экран смартфона картинку с альфа-каналом, то есть с. . .
|
Влияние грибов на сукцессию
anaschu 26.01.2026
Бифуркационные изменения массы гриба происходят тогда, когда мы уменьшаем массу компоста в 10 раз, а скорость прироста биомассы уменьшаем в три раза. Скорость прироста биомассы может уменьшаться за. . .
|
Воспроизведение звукового файла с помощью SDL3_mixer при касании экрана Android
8Observer8 26.01.2026
Содержание блога
SDL3_mixer - это библиотека я для воспроизведения аудио. В отличие от инструкции по добавлению текста код по проигрыванию звука уже содержится в шаблоне примера. Нужно только. . .
|