2 / 2 / 1
Регистрация: 16.11.2009
Сообщений: 51
|
|
1 | |
Алгоритм для работы со строками17.03.2010, 21:05. Показов 3216. Ответов 8
Метки нет (Все метки)
Здравствуйте! Прошу помощи.
Есть массив, в котором записан текст из текстового файла. Так вот, нужно проверить, чтобы первое слово каждого предложения начиналось с заглавной буквы, и откорректировать. У меня есть код, но он работает по обычному линейному алгоритму, т.е. он срабатывает когда такая схема текста: <Предложение>! <Сл.Предложение>, т.е после ! должен идти пробел, а потом начинаться следующее предложение. Но хотелось бы и так, чтобы обрабатывались ситуации, когда между предложениями нет пробелов. Спасибо!
0
|
17.03.2010, 21:05 | |
Ответы с готовыми решениями:
8
Алгоритм для автоматизации рутиной работы в Adobe Класс для работы сo строками Функции для работы со строками в VB Класс для работы сo строками |
3218 / 2361 / 540
Регистрация: 11.09.2009
Сообщений: 8,604
|
|
18.03.2010, 01:53 | 2 |
Bloomfield, те варианты ошибок, при которых формально нельзя различить признак начала предложения, без смыслового анализа исправить не получится, так что рассматриваем только формальные признаки - и вперёд!
Что является формальным признаком конца предложения? - Перевод строки (случаи форматирования по ширине вручную относим к ошибкам); - Символ конца предложения ("." "!" "?" "..." и, может быть, ещё что-нибудь) Пробелы вообще не учитываем (не буква). Итого: Если в тексте при последовательном просмотре обнаружен символ конца предложения - следующий буквенный символ должен быть в верхнем регистре.
1
|
Платежеспособный зверь
8926 / 4354 / 1642
Регистрация: 28.10.2009
Сообщений: 11,568
|
|
18.03.2010, 11:44 | 3 |
Более точным выглядит следующий алгоритм: Если предложения в файле не разбиваются на отдельные куски в разных строках, то: Считываем из файла очередную строку. Проверяем 1 букву строки на регистр. Идём по строке. Если находим символ, которым должно кончиться предложение (. ! ?), то проверяем следующий за ним символ. Если он не пробел, а буква, проверяем на регистр, если пробел, то берём следующий символ, пока не дойдём до буквы или конца строки. Таким образом мы проверим регистр и при наличии пробела между предложениями, и без пробелов.
1
|
3218 / 2361 / 540
Регистрация: 11.09.2009
Сообщений: 8,604
|
|
18.03.2010, 18:20 | 4 |
Ну и в чём отличия?
кот Бегемот: "Если предложения в файле не разбиваются на отдельные куски в разных строках, то:" i8085: "случаи форматирования по ширине вручную относим к ошибкам" кот Бегемот: "Считываем из файла очередную строку. Проверяем 1 букву строки на регистр. Идём по строке. Если находим символ, которым должно кончиться предложение (. ! ?), то..." i8085: "... признаком конца предложения ... - Перевод строки ... - Символ конца предложения ("." "!" "?" "..." кот Бегемот: "...если пробел, то берём следующий символ i8085: "Пробелы вообще не учитываем" кот Бегемот: "Если находим символ, которым должно кончиться предложение (. ! ?), то проверяем следующий за ним символ. Если он ..." i8085: "Если в тексте при последовательном просмотре обнаружен символ конца предложения - следующий буквенный символ должен быть в верхнем регистре." А проверять вообще не нужно - сразу меняем на верхний регистр, даже если он и так верхний. Так быстрее. Всегда надо минимизировать логические функции, даже в программировании.
1
|
2 / 2 / 1
Регистрация: 16.11.2009
Сообщений: 51
|
|
18.03.2010, 20:36 [ТС] | 5 |
Извиняюсь что сразу не сказал - буквы только русские! Поэтому проверить всё же придётся, т.к вычитаю шестнадцатеричное значение (Windows-1251). toupper с русскими буквами не работает.
0
|
Платежеспособный зверь
8926 / 4354 / 1642
Регистрация: 28.10.2009
Сообщений: 11,568
|
|
18.03.2010, 20:49 | 6 |
i8085
не стоило так бурно возмущаться, я уже указал в цитате, что меня смутила только одна ваша фраза, которая сбивает с толку, именно это я и хотел исправить
0
|
3218 / 2361 / 540
Регистрация: 11.09.2009
Сообщений: 8,604
|
|
19.03.2010, 01:40 | 7 |
кот Бегемот, да какое возмущение, бог с вами, скажете тоже...
Написал, потому что абсолютно не въехал, чем отличается моё "Пробелы вообще не учитываем (не буква)", что вы процитировали с комментарием " которая сбивает с толку, ", от вашего "Если он не пробел, а буква, проверяем на регистр, если пробел, то берём следующий символ". Логически это одно и то же - пробелы игнорируем. Сейчас понял. За время модераторства тут, у вас выработался стиль разжёвывать каждую фразу в ответах юзерам. И это правильно.
0
|
2 / 2 / 1
Регистрация: 16.11.2009
Сообщений: 51
|
||||||
20.03.2010, 07:17 [ТС] | 8 | |||||
Немного отходя от темы раздела:
Код будет примерно таким:
0
|
20.03.2010, 12:02 | 9 |
Я бы алгоритм ещё дополнил некой системой поправления пользователя, а именно:
насколько мне известно, правила хорошего тона требуют, чтобы всякое новое слово по отношению к предшествующему разделителю (не к каждому в целом, но для любого разделителя предложений) было отделено переводом строки или собственно пробелом (или же табом по вертикали, или переходом по странице — я с этими символами не знаком). Поэтому, если откинуть вариант "Пробелы вообще не учитываем (не буква)." , я предлогию добавлять пробел после .?!... перед непосредственно последующим буквенным символом или, в случае более чем одного пробела между ними, удалять лишние. Как по мне, если "заказчик" просит следить за регистром с целью сделать читабельным текст, это добавление ему понравиться : )
0
|
20.03.2010, 12:02 | |
20.03.2010, 12:02 | |
Помогаю со студенческими работами здесь
9
Класс для работы со строками Класс для работы со строками Пакет для работы со строками Библиотека для работы со строками Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |