|
2 / 2 / 1
Регистрация: 16.11.2009
Сообщений: 51
|
|
Алгоритм для работы со строками17.03.2010, 21:05. Показов 3377. Ответов 8
Метки нет (Все метки)
Здравствуйте! Прошу помощи.
Есть массив, в котором записан текст из текстового файла. Так вот, нужно проверить, чтобы первое слово каждого предложения начиналось с заглавной буквы, и откорректировать. У меня есть код, но он работает по обычному линейному алгоритму, т.е. он срабатывает когда такая схема текста: <Предложение>! <Сл.Предложение>, т.е после ! должен идти пробел, а потом начинаться следующее предложение. Но хотелось бы и так, чтобы обрабатывались ситуации, когда между предложениями нет пробелов. Спасибо!
0
|
|
| 17.03.2010, 21:05 | |
|
Ответы с готовыми решениями:
8
Алгоритм для автоматизации рутиной работы в Adobe Класс для работы сo строками Функции для работы со строками в VB |
|
4043 / 2654 / 583
Регистрация: 11.09.2009
Сообщений: 9,487
|
|
| 18.03.2010, 01:53 | |
|
Bloomfield, те варианты ошибок, при которых формально нельзя различить признак начала предложения, без смыслового анализа исправить не получится, так что рассматриваем только формальные признаки - и вперёд!
Что является формальным признаком конца предложения? - Перевод строки (случаи форматирования по ширине вручную относим к ошибкам); - Символ конца предложения ("." "!" "?" "..." и, может быть, ещё что-нибудь) Пробелы вообще не учитываем (не буква). Итого: Если в тексте при последовательном просмотре обнаружен символ конца предложения - следующий буквенный символ должен быть в верхнем регистре.
1
|
|
|
Платежеспособный зверь
8966 / 4389 / 1655
Регистрация: 28.10.2009
Сообщений: 11,647
|
||
| 18.03.2010, 11:44 | ||
Более точным выглядит следующий алгоритм: Если предложения в файле не разбиваются на отдельные куски в разных строках, то: Считываем из файла очередную строку. Проверяем 1 букву строки на регистр. Идём по строке. Если находим символ, которым должно кончиться предложение (. ! ?), то проверяем следующий за ним символ. Если он не пробел, а буква, проверяем на регистр, если пробел, то берём следующий символ, пока не дойдём до буквы или конца строки. Таким образом мы проверим регистр и при наличии пробела между предложениями, и без пробелов.
1
|
||
|
4043 / 2654 / 583
Регистрация: 11.09.2009
Сообщений: 9,487
|
||
| 18.03.2010, 18:20 | ||
|
кот Бегемот: "Если предложения в файле не разбиваются на отдельные куски в разных строках, то:" i8085: "случаи форматирования по ширине вручную относим к ошибкам" кот Бегемот: "Считываем из файла очередную строку. Проверяем 1 букву строки на регистр. Идём по строке. Если находим символ, которым должно кончиться предложение (. ! ?), то..." i8085: "... признаком конца предложения ... - Перевод строки ... - Символ конца предложения ("." "!" "?" "..." кот Бегемот: "...если пробел, то берём следующий символ i8085: "Пробелы вообще не учитываем" кот Бегемот: "Если находим символ, которым должно кончиться предложение (. ! ?), то проверяем следующий за ним символ. Если он ..." i8085: "Если в тексте при последовательном просмотре обнаружен символ конца предложения - следующий буквенный символ должен быть в верхнем регистре." А проверять вообще не нужно - сразу меняем на верхний регистр, даже если он и так верхний. Так быстрее. Всегда надо минимизировать логические функции, даже в программировании.
1
|
||
|
2 / 2 / 1
Регистрация: 16.11.2009
Сообщений: 51
|
|
| 18.03.2010, 20:36 [ТС] | |
|
Извиняюсь что сразу не сказал - буквы только русские! Поэтому проверить всё же придётся, т.к вычитаю шестнадцатеричное значение (Windows-1251). toupper с русскими буквами не работает.
0
|
|
|
Платежеспособный зверь
8966 / 4389 / 1655
Регистрация: 28.10.2009
Сообщений: 11,647
|
|
| 18.03.2010, 20:49 | |
|
i8085
не стоило так бурно возмущаться, я уже указал в цитате, что меня смутила только одна ваша фраза, которая сбивает с толку, именно это я и хотел исправить
0
|
|
|
4043 / 2654 / 583
Регистрация: 11.09.2009
Сообщений: 9,487
|
|
| 19.03.2010, 01:40 | |
|
кот Бегемот, да какое возмущение, бог с вами, скажете тоже...
![]() Написал, потому что абсолютно не въехал, чем отличается моё "Пробелы вообще не учитываем (не буква)", что вы процитировали с комментарием " которая сбивает с толку, ", от вашего "Если он не пробел, а буква, проверяем на регистр, если пробел, то берём следующий символ". Логически это одно и то же - пробелы игнорируем. Сейчас понял. За время модераторства тут, у вас выработался стиль разжёвывать каждую фразу в ответах юзерам. И это правильно.
0
|
|
|
2 / 2 / 1
Регистрация: 16.11.2009
Сообщений: 51
|
||||||
| 20.03.2010, 07:17 [ТС] | ||||||
|
Немного отходя от темы раздела:
Код будет примерно таким:
0
|
||||||
|
|
|
| 20.03.2010, 12:02 | |
|
Я бы алгоритм ещё дополнил некой системой поправления пользователя, а именно:
насколько мне известно, правила хорошего тона требуют, чтобы всякое новое слово по отношению к предшествующему разделителю (не к каждому в целом, но для любого разделителя предложений) было отделено переводом строки или собственно пробелом (или же табом по вертикали, или переходом по странице — я с этими символами не знаком). Поэтому, если откинуть вариант "Пробелы вообще не учитываем (не буква)." , я предлогию добавлять пробел после .?!... перед непосредственно последующим буквенным символом или, в случае более чем одного пробела между ними, удалять лишние. Как по мне, если "заказчик" просит следить за регистром с целью сделать читабельным текст, это добавление ему понравиться : )
0
|
|
| 20.03.2010, 12:02 | |
|
Помогаю со студенческими работами здесь
9
Класс для работы сo строками Класс для работы со строками Класс для работы со строками Пакет для работы со строками
Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
| Опции темы | |
|
|
Новые блоги и статьи
|
|||
|
Символические и жёсткие ссылки в Linux.
algri14 15.03.2026
Существует два типа ссылок — символические и жёсткие.
Ссылка в Linux — это запись в каталоге, которая может указывать либо на inode «файла-ИСТОЧНИКА», тогда это будет «жёсткая ссылка» (hard link),. . .
|
[Owen Logic] Поддержание уровня воды в резервуаре количеством включённых насосов: моделирование и выбор регулятора
ФедосеевПавел 14.03.2026
Поддержание уровня воды в резервуаре количеством включённых насосов: моделирование и выбор регулятора
ВВЕДЕНИЕ
Выполняя задание на управление насосной группой заполнения резервуара,. . .
|
делаю науч статью по влиянию грибов на сукцессию
anaschu 13.03.2026
прикрепляю статью
|
SDL3 для Desktop (MinGW): Создаём пустое окно с нуля для 2D-графики на SDL3, Си и C++
8Observer8 10.03.2026
Содержание блога
Финальные проекты на Си и на C++:
hello-sdl3-c. zip
hello-sdl3-cpp. zip
Результат:
|
|
Установка CMake и MinGW 13.1 для сборки С и C++ приложений из консоли и из Qt Creator в EXE
8Observer8 10.03.2026
Содержание блога
MinGW - это коллекция инструментов для сборки приложений в EXE. CMake - это система сборки приложений. Здесь описаны базовые шаги для старта программирования с помощью CMake и. . .
|
Как дизайн сайта влияет на конверсию: 7 решений, которые реально повышают заявки
Neotwalker 08.03.2026
Многие до сих пор воспринимают дизайн сайта как “красивую оболочку”. На практике всё иначе: дизайн напрямую влияет на то, оставит человек заявку или уйдёт через несколько секунд.
Даже если у вас. . .
|
Модульная разработка через nuget packages
DevAlt 07.03.2026
Сложившийся в . Net-среде способ разработки чаще всего предполагает
монорепозиторий в котором находятся все исходники.
При создании нового решения, мы просто добавляем нужные проекты
и имеем. . .
|
Модульный подход на примере F#
DevAlt 06.03.2026
В блоге дяди Боба наткнулся на такое определение:
В этой книге («Подход, основанный на вариантах использования») Ивар утверждает,
что архитектура программного обеспечения — это
структуры,. . .
|