Быстрое удаление символов по заданному списку05.07.2024, 11:57. Показов 494. Ответов 4
Приветствую!
В огромной таблице (50 млн строк по ~ 300 символов) нужно произвести удаление всех символов, не входящих в список «разрешённых» (WhiteList). Пример простого WhiteList: ‘0-9A-Za-z ,.+-*/:-’ Сейчас формирую строку BlackList (из всех символов Юникода (65 535), за исключением WhiteList), использую её в Translate (заменяя их на NChar(0)) и затем вычищаю Char(0) с помощью Replace(). Полагаю, что, т.к. WhiteList в сотни раз короче BlackList, должен быть способ не УДАЛЯТЬ ненужные, а ОСТАВЛЯТЬ нужные. Или же, просто другой, более быстрый, подход. Желательно, оформить решение в виде функции (скалярной или табличной — что быстрее). Все варианты протестирую на своих данных и сообщу результат. Важно! Присутствует таблица с индексами, которая может очень помочь.
0
|
||||||
| 05.07.2024, 11:57 | |
|
Ответы с готовыми решениями:
4
Принадлежит ли число заданному списку |
|
5393 / 1465 / 513
Регистрация: 31.05.2012
Сообщений: 5,153
|
|
| 05.07.2024, 13:36 | |
|
если это не разовая блажь может стоит подумать над clr-функцией удаляющей "плохие" символы из строки
0
|
|
| 05.07.2024, 13:51 [ТС] | |
|
Аватар, пока, к сожалению, нет возможности...
В будущем будет реализовано на регулярках в C#
0
|
|
|
1304 / 358 / 97
Регистрация: 14.10.2022
Сообщений: 1,089
|
||||||
| 06.07.2024, 11:00 | ||||||
Сообщение было отмечено Jack Famous как решение
Решение
Эээ...
1
|
||||||
| 08.07.2024, 11:26 [ТС] | |
|
uaggster, буду разбирать) спасибо большое!
0
|
|
| 08.07.2024, 11:26 | |
|
Помогаю со студенческими работами здесь
5
Проверка времени по заданному списку (ObservableCollection) Проверка логина, пароля по заданному списку Clojure Найти медиану по заданному списку чисел
Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
|||
|
SDL3 для Web (WebAssembly): Работа со звуком через SDL3_mixer
8Observer8 08.02.2026
Содержание блога
Пошагово создадим проект для загрузки звукового файла и воспроизведения звука с помощью библиотеки SDL3_mixer. Звук будет воспроизводиться по клику мышки по холсту на Desktop и по. . .
|
SDL3 для Web (WebAssembly): Основы отладки веб-приложений на SDL3 по USB и Wi-Fi, запущенных в браузере мобильных устройств
8Observer8 07.02.2026
Содержание блога
Браузер Chrome имеет средства для отладки мобильных веб-приложений по USB. В этой пошаговой инструкции ограничимся работой с консолью. Вывод в консоль - это часть процесса. . .
|
SDL3 для Web (WebAssembly): Обработчик клика мыши в браузере ПК и касания экрана в браузере на мобильном устройстве
8Observer8 02.02.2026
Содержание блога
Для начала пошагово создадим рабочий пример для подготовки к экспериментам в браузере ПК и в браузере мобильного устройства. Потом напишем обработчик клика мыши и обработчик. . .
|
Философия технологии
iceja 01.02.2026
На мой взгляд у человека в технических проектах остается роль генерального директора. Все остальное нейронки делают уже лучше человека. Они не могут нести предпринимательские риски, не могут. . .
|
|
SDL3 для Web (WebAssembly): Вывод текста со шрифтом TTF с помощью SDL3_ttf
8Observer8 01.02.2026
Содержание блога
В этой пошаговой инструкции создадим с нуля веб-приложение, которое выводит текст в окне браузера. Запустим на Android на локальном сервере. Загрузим Release на бесплатный. . .
|
SDL3 для Web (WebAssembly): Сборка C/C++ проекта из консоли
8Observer8 30.01.2026
Содержание блога
Если вы откроете примеры для начинающих на официальном репозитории SDL3 в папке: examples, то вы увидите, что все примеры используют следующие четыре обязательные функции, а. . .
|
SDL3 для Web (WebAssembly): Установка Emscripten SDK (emsdk) и CMake для сборки C и C++ приложений в Wasm
8Observer8 30.01.2026
Содержание блога
Для того чтобы скачать Emscripten SDK (emsdk) необходимо сначало скачать и уставить Git: Install for Windows. Следуйте стандартной процедуре установки Git через установщик. . . .
|
SDL3 для Android: Подключение Box2D v3, физика и отрисовка коллайдеров
8Observer8 29.01.2026
Содержание блога
Box2D - это библиотека для 2D физики для анимаций и игр. С её помощью можно определять были ли коллизии между конкретными объектами. Версия v3 была полностью переписана на Си, в. . .
|