|
50 / 49 / 3
Регистрация: 27.07.2019
Сообщений: 459
|
|
Выбор из большого списка текстовых строк только с разными регистрами09.06.2025, 14:50. Показов 3185. Ответов 28
Метки нет (Все метки)
Уважаемые форумчане, добрый день!
Очень нужна помощь в совсем непраздном вопросе (разрабы кассового ПО забыли про сканеры штрих-кодов, если они на cbd, то чувствительны к клавише caps lock и теперь надо найти все ошибки марок, которые не выбыли и-за замены регистра): есть много файлов со строками, в которых много повторяющихся данных, но, среди них иногда могут попадаться такие же, но с инвертированными регистрами, примерно так: 01046100177028712100CN8IGD5VTE8 01046100177028712100ZAE8TSVCZUY 01046100177028712100DB6J1634PCB 01046100177028712100ZAE9TFGJKNE 01046100177028712100ZAE9TFGJKNE 01046100177028712100ZAE9TFGJKNE 01046100177028712100zae9tfgjkne Вот как раз нижняя строка показывает то, что надо найти. Сама проблема, найти в файлах повторения с разными регистрами и как то их выкинуть в отдельный файл, либо удалить не повторяющиеся с различным регистром данные. Т.е. в итоге должно остаться: 01046100177028712100ZAE9TFGJKNE 01046100177028712100zae9tfgjkne Во вложенеии файл с маленькой выборкой, в нём я с ходу нашел (визуально): 01046100177028712100ZAE9TFGJKNE 01046100177028712100zae9tfgjkne 01046100177028712100ydzg14b69n2 01046100177028712100YDZG14B69N2 010366558500391321TWD8NC2MX5ND1 010366558500391321twd8nc2mx5nd1 05.txt
0
|
|
| 09.06.2025, 14:50 | |
|
Ответы с готовыми решениями:
28
|
| 09.06.2025, 15:42 | |||||||
ИИ: Давайте разберём эту строчку кода на PowerShell по частям
### 1. `Get-Content -Path .\05.txt` - **`Get-Content`**: Это команда (или "cmdlet") в PowerShell, которая используется для чтения содержимого файлов. Она позволяет получить текст, который находится в указанном файле. - **`-Path`**: Это параметр, который указывает путь к файлу, содержимое которого мы хотим прочитать. В данном случае, путь указан как `.\05.txt`. - **`.\05.txt`**: Это относительный путь к файлу `05.txt`, который находится в текущей директории (обозначается `.`). То есть, если вы находитесь в папке, где находится файл `05.txt`, команда будет работать корректно. ### 2. `|` - Этот символ называется "пайп" (pipe). Он используется для передачи вывода одной команды в качестве ввода для другой команды. В данном случае, вывод команды `Get-Content` (содержимое файла `05.txt`) передаётся следующей команде. ### 3. `Select-Object -Unique` - **`Select-Object`**: Это ещё одна команда в PowerShell, которая используется для выбора определенных свойств объектов или для фильтрации данных. - **`-Unique`**: Это параметр, который указывает, что мы хотим получить только уникальные (различные) значения из переданных данных. То есть, если в файле `05.txt` есть повторяющиеся строки, команда `Select-Object -Unique` оставит только одну копию каждой уникальной строки. ### Итог Таким образом, вся команда `Get-Content -Path .\05.txt | Select-Object -Unique` делает следующее: 1. Читает содержимое файла `05.txt`. 2. Передаёт это содержимое в команду `Select-Object`. 3. Фильтрует строки, оставляя только уникальные значения. В результате вы получите список строк из файла `05.txt`, в котором каждая строка будет представлена только один раз, даже если она встречалась в файле несколько раз. Команда `Select-Object -Unique` в PowerShell чувствительна к регистру. Это означает, что строки, которые отличаются только по регистру, будут считаться уникальными. Например, если в вашем файле `05.txt` есть следующие строки: ``` Hello hello HELLO ``` То при использовании `Select-Object -Unique` вы получите три уникальные строки: ``` Hello hello HELLO ```
1
|
|||||||
|
50 / 49 / 3
Регистрация: 27.07.2019
Сообщений: 459
|
||||||
| 09.06.2025, 15:53 [ТС] | ||||||
|
Это не рабочий вариант.
Вот рабочее решение:
0
|
||||||
|
Любознательный
7401 / 2247 / 359
Регистрация: 10.03.2016
Сообщений: 5,188
|
|||||||
| 09.06.2025, 19:22 | |||||||
1
|
|||||||
|
|
|||||||
| 09.06.2025, 19:49 | |||||||
Сообщение было отмечено farmsnab как решение
Решение
farmsnab, Если задача найти именно такие пары то можно так
1
|
|||||||
|
50 / 49 / 3
Регистрация: 27.07.2019
Сообщений: 459
|
|||
| 10.06.2025, 06:56 [ТС] | |||
|
Совпадающие строки: 0104602233007977211EVWKHGWBCKY3 0104602233007977211evwkhgwbcky3 Совпадающие строки: 010465027706014421icx5j9VE23i22 010465027706014421ICX5J9ve23I22 Совпадающие строки: 01046100177025742100C1GBLXXRK33 01046100177025742100c1gblxxrk33 Совпадающие строки: 0104605964012524211507842K95MEX 0104605964012524211507842k95mex Добавлено через 2 минуты
0
|
|||
|
Любознательный
7401 / 2247 / 359
Регистрация: 10.03.2016
Сообщений: 5,188
|
|||
| 10.06.2025, 08:46 | |||
|
Да и вообще, здесь главное то, что есть тот результат, который требовался... если устраивает, то и хорошо.
0
|
|||
|
50 / 49 / 3
Регистрация: 27.07.2019
Сообщений: 459
|
||
| 10.06.2025, 08:57 [ТС] | ||
|
Это я не правильно пост оформил))))) Да, он выводит в файл. В принципе, эта тема уже выполнена. Не по теме: Теперь долгий процесс выявления всех ошибок и много-много кофе((((.
0
|
||
|
Любознательный
7401 / 2247 / 359
Регистрация: 10.03.2016
Сообщений: 5,188
|
||||||||
| 10.06.2025, 09:07 | ||||||||
|
Кстати: если нужна таблица именно:
2
|
||||||||
| 10.06.2025, 10:32 | |||||||
|
YuS_2, а если смешанный регистр и в группе больше элементов? ![]()
2
|
|||||||
|
Любознательный
7401 / 2247 / 359
Регистрация: 10.03.2016
Сообщений: 5,188
|
||
| 10.06.2025, 12:03 | ||
select - uni... до лампочки... регистр и количество полных дубликатов, т.к. он регистрозависим, поэтому останутся уникальные значения и одинаковые пары с разным регистром. Про select -uni
Это ведь, кстати, твоя идея именно с селектом... и ты ведь с гопотой там общался, он же в разборе полетов на это указал тоже.
Далее, группировка с фильтром счетчика больше двух, уже отфильтрует фактически уникальные, которые в единственном экземпляре и оставит только одинаковые пары с разным регистром, которые и требовались в итоге. Ты запусти скрипт для проверки... получишь результат. группировка ведь регистронезависима...
0
|
||
| 10.06.2025, 13:20 | ||||||
|
YuS_2, дело не в select, дело в количестве элементов в группе, скажем при
Но я не знаю чего надо выводить, может так и надо
0
|
||||||
|
Любознательный
7401 / 2247 / 359
Регистрация: 10.03.2016
Сообщений: 5,188
|
||
| 10.06.2025, 13:26 | ||
select -uni их, в принципе, не может быть больше двух... такшта всё нормально.
0
|
||
| 10.06.2025, 13:32 | |||||||
1
|
|||||||
|
Любознательный
7401 / 2247 / 359
Регистрация: 10.03.2016
Сообщений: 5,188
|
||
| 10.06.2025, 13:36 | ||
|
Но это уже зависит от того, что требуется дальше с ними делать. Ведь, как минимум, одна пара найдена, поэтому лучше проверить именно эти значения на наличие других разнорегистровых псевдо-дублей... в общем, ТЗ надо уточнить. Добавлено через 3 минуты ну или да, вывести сразу все найденные, а не первые два, что гораздо лучше и менее затратно будет. Всё верно
0
|
||
|
|
||||||
| 10.06.2025, 20:32 | ||||||
|
для жалующихся на фантомные боли
0
|
||||||
|
Любознательный
7401 / 2247 / 359
Регистрация: 10.03.2016
Сообщений: 5,188
|
|||||||
| 11.06.2025, 13:17 | |||||||
Сообщение было отмечено farmsnab как решение
Решение
farmsnab,
1
|
|||||||
|
|
|||||||||||||||||||||
| 13.06.2025, 09:43 | |||||||||||||||||||||
|
для спринтеров
Добавлено через 55 минут Ну и в конечном итоге я так понимаю нас интересовали различные варианты написания строки
все фигня... давай по новой )))
1
|
|||||||||||||||||||||
|
6627 / 2258 / 346
Регистрация: 10.12.2013
Сообщений: 7,809
|
||||||
| 13.06.2025, 22:05 | ||||||
Output: 010366558500391321twd8nc2mx5nd1|2 01046100177028712100ydzg14b69n2|2 01046100177028712100ZAE9TFGJKNE|2 Итак, на выходе всегда будут пары одинаковых значений но в разных регистрах ( остальные отсеются при импорте данных из текст. файла из-за декларации UNIQUE в предложении CREATE TABLE ) Как тебе такое,
0
|
||||||
|
|
|||||||||||||||||||||||||
| 14.06.2025, 07:04 | |||||||||||||||||||||||||
|
volodin661, Впечатляет, если заменить опцию уникального ограничения с replace на ignore даст еще прироста производительности
Для тестирования скопировал стоки до миллиона.
то вот код утилиты, которая решает эту задачу за 473.9827ms
0
|
|||||||||||||||||||||||||
| 14.06.2025, 07:04 | |
|
Помогаю со студенческими работами здесь
20
Для всех файлов, кроме текстовых, установить атрибут "Только для чтения", а для текстовых — атрибут "Архивный"
Поменять IP-адрес и порт на взятые из списка в текстовом файле и удалить их из этого списка
Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
||||
|
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта
Симптом:
После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
|
Access
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
|
Новый ноутбук
volvo 07.12.2025
Всем привет.
По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне:
Ryzen 5 7533HS
64 Gb DDR5
1Tb NVMe
16" Full HD Display
Win11 Pro
|
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
|
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
|
|
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов
На странице:
https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/
нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
|
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов.
. . .
|
Ломающие изменения в C#.NStar Alpha
Etyuhibosecyu 20.11.2025
Уже можно не только тестировать, но и пользоваться C#. NStar - писать оконные приложения, содержащие надписи, кнопки, текстовые поля и даже изображения, например, моя игра "Три в ряд" написана на этом. . .
|
Мысли в слух
kumehtar 18.11.2025
Кстати, совсем недавно имел разговор на тему медитаций с людьми. И обнаружил, что они вообще не понимают что такое медитация и зачем она нужна. Самые базовые вещи. Для них это - когда просто люди. . .
|
Создание Single Page Application на фреймах
krapotkin 16.11.2025
Статья исключительно для начинающих. Подходы оригинальностью не блещут.
В век Веб все очень привыкли к дизайну Single-Page-Application .
Быстренько разберем подход "на фреймах".
Мы делаем одну. . .
|