|
475 / 294 / 29
Регистрация: 01.06.2018
Сообщений: 3,676
|
|
Разбор текста на части09.11.2020, 15:16. Показов 1436. Ответов 15
Метки нет (Все метки)
Всем привет,
добрался тут до текста и его разбора, основной список задач такой: - подсчёт слов/символов с разными разделителями (включая пробелы, переносы строк, табуляции) - выборка текста с фильтрацией, например выбрать все символы, которые не являются буквами английского алфавита, и т.п. - составление словаря с подсчётом из первого пункта собственно я могу всё сделать на уровне команд а-ля 1999 года, но например тот же LINQ вдруг предложит что-то более интересное. Во вложении пример файла для работы. Достаточно консольного приложения с выводом результатов в отдельные файлы. PS: немного комментариев по пунктам. Под разделителями я понимаю не просто один символ, а скорее список символов - сразу например пробел, табуляция, перевод строки, запятая, точка, восклицательный знак, вопрос и т.д. Можно пойти от противного и считать разделителем всё что не английская буква. Иметь возможность оперировать с регистрозависимым текстом, July != july, числительные воспринимать как слова.
0
|
|
| 09.11.2020, 15:16 | |
|
Ответы с готовыми решениями:
15
Разбор методов реализованных в проекте и разьяснение части кода Калькулятор. Разбор текста из TextBox |
|
1469 / 1010 / 456
Регистрация: 30.10.2017
Сообщений: 2,799
|
|
| 09.11.2020, 18:23 | |
|
belalugoci, смотрите в сторону регулярных выражений. Думаю с ними задача станет намного проще.
0
|
|
|
475 / 294 / 29
Регистрация: 01.06.2018
Сообщений: 3,676
|
|
| 09.11.2020, 19:10 [ТС] | |
|
0
|
|
|
1469 / 1010 / 456
Регистрация: 30.10.2017
Сообщений: 2,799
|
||||||
| 09.11.2020, 23:00 | ||||||
|
belalugoci, зря вы так. Вот пример подсчета повторений слов в вашем тексте.
1
|
||||||
|
475 / 294 / 29
Регистрация: 01.06.2018
Сообщений: 3,676
|
|||||||
| 10.11.2020, 00:57 [ТС] | |||||||
Еще за сегодня появилась необходимость разбирать слова как однокоренные, например blow blowup blowing blowed unblow reblow blowin и т.п. Но не обязательно строго английским правилам, это скорее просто поиск вхождений слов. За пример спасибо, уже почитал немного про простые регэкспы, чтобы хоть понимать.
0
|
|||||||
|
1469 / 1010 / 456
Регистрация: 30.10.2017
Сообщений: 2,799
|
|||
| 10.11.2020, 01:13 | |||
|
0
|
|||
|
475 / 294 / 29
Регистрация: 01.06.2018
Сообщений: 3,676
|
|||||||||
| 10.11.2020, 02:10 [ТС] | |||||||||
Пример вывода как сейчас: ': 2989и вот два последних не должны склеиваться в кучу, а быть в подсчете отдельно как пробелы, точки и восклицательный знак. Добавлено через 14 минут еще ломаю голову как исключить все x.Count()<2Добавлено через 9 минут Where(x => x.Count() > 1) в конце всей строки и получилось.Добавлено через 10 минут upи upriseуже исключаются, а analи analizeостаются. Потом нужно как-то запрос сделать чтобы прогон был для каждого слова, то есть where еще один после всех остальных действий. Пока не улавливаю как именно.
0
|
|||||||||
|
1469 / 1010 / 456
Регистрация: 30.10.2017
Сообщений: 2,799
|
||||||||
| 10.11.2020, 03:25 | ||||||||
0
|
||||||||
|
|
|
| 10.11.2020, 05:57 | |
|
0
|
|
|
475 / 294 / 29
Регистрация: 01.06.2018
Сообщений: 3,676
|
|
| 10.11.2020, 07:25 [ТС] | |
|
0
|
|
|
475 / 294 / 29
Регистрация: 01.06.2018
Сообщений: 3,676
|
||||||||||||
| 14.11.2020, 07:22 [ТС] | ||||||||||||
newspape ewspaper то есть я неправильно понимаю логику работы.
0
|
||||||||||||
|
1469 / 1010 / 456
Регистрация: 30.10.2017
Сообщений: 2,799
|
|
| 14.11.2020, 12:07 | |
|
belalugoci, мне кажется вы усложняете. Регуляркой просто собираете коллекцию слов, а дальше обрабатываете обычным кодом так как нравится.
0
|
|
|
475 / 294 / 29
Регистрация: 01.06.2018
Сообщений: 3,676
|
||
| 14.11.2020, 12:55 [ТС] | ||
|
0
|
||
|
14307 / 9388 / 1355
Регистрация: 21.01.2016
Сообщений: 35,404
|
|
| 14.11.2020, 13:19 | |
|
А что за словарь составляется и для какой цели?
0
|
|
|
475 / 294 / 29
Регистрация: 01.06.2018
Сообщений: 3,676
|
|
| 14.11.2020, 13:21 [ТС] | |
|
0
|
|
|
14307 / 9388 / 1355
Регистрация: 21.01.2016
Сообщений: 35,404
|
|
| 14.11.2020, 13:52 | |
|
belalugoci, тогда никакие LINQ и RegExp не применимы. Такие алгоритмы руками реализуются.
0
|
|
| 14.11.2020, 13:52 | |
|
Помогаю со студенческими работами здесь
16
Разбор исходного текста программы
Регулярные выражения - построчный разбор текста, исправить код QtextEdit возможность редактирования части текста и запрет перевода курсора на другие части текста Разбор строки на 3 части Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
|||
|
SDL3 для Desktop (MinGW): Рисуем цветные прямоугольники с помощью рисовальщика SDL3 на Си и C++
8Observer8 17.03.2026
Содержание блога
Финальные проекты на Си и на C++:
finish-rectangles-sdl3-c. zip
finish-rectangles-sdl3-cpp. zip
|
Символические и жёсткие ссылки в Linux.
algri14 15.03.2026
Существует два типа ссылок — символические и жёсткие.
Ссылка в Linux — это запись в каталоге, которая может указывать либо на inode «файла-ИСТОЧНИКА», тогда это будет «жёсткая ссылка» (hard link),. . .
|
[Owen Logic] Поддержание уровня воды в резервуаре количеством включённых насосов: моделирование и выбор регулятора
ФедосеевПавел 14.03.2026
Поддержание уровня воды в резервуаре количеством включённых насосов: моделирование и выбор регулятора
ВВЕДЕНИЕ
Выполняя задание на управление насосной группой заполнения резервуара,. . .
|
делаю науч статью по влиянию грибов на сукцессию
anaschu 13.03.2026
прикрепляю статью
|
|
SDL3 для Desktop (MinGW): Создаём пустое окно с нуля для 2D-графики на SDL3, Си и C++
8Observer8 10.03.2026
Содержание блога
Финальные проекты на Си и на C++:
hello-sdl3-c. zip
hello-sdl3-cpp. zip
Результат:
|
Установка CMake и MinGW 13.1 для сборки С и C++ приложений из консоли и из Qt Creator в EXE
8Observer8 10.03.2026
Содержание блога
MinGW - это коллекция инструментов для сборки приложений в EXE. CMake - это система сборки приложений. Здесь описаны базовые шаги для старта программирования с помощью CMake и. . .
|
Как дизайн сайта влияет на конверсию: 7 решений, которые реально повышают заявки
Neotwalker 08.03.2026
Многие до сих пор воспринимают дизайн сайта как “красивую оболочку”. На практике всё иначе: дизайн напрямую влияет на то, оставит человек заявку или уйдёт через несколько секунд.
Даже если у вас. . .
|
Модульная разработка через nuget packages
DevAlt 07.03.2026
Сложившийся в . Net-среде способ разработки чаще всего предполагает
монорепозиторий в котором находятся все исходники.
При создании нового решения, мы просто добавляем нужные проекты
и имеем. . .
|