2 / 2 / 1
Регистрация: 16.11.2009
Сообщений: 51

Алгоритм для работы со строками

17.03.2010, 21:05. Показов 3377. Ответов 8
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Здравствуйте! Прошу помощи.

Есть массив, в котором записан текст из текстового файла. Так вот, нужно проверить, чтобы первое слово каждого предложения начиналось с заглавной буквы, и откорректировать.

У меня есть код, но он работает по обычному линейному алгоритму, т.е. он срабатывает когда такая схема текста: <Предложение>! <Сл.Предложение>, т.е после ! должен идти пробел, а потом начинаться следующее предложение. Но хотелось бы и так, чтобы обрабатывались ситуации, когда между предложениями нет пробелов.

Спасибо!
0
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
17.03.2010, 21:05
Ответы с готовыми решениями:

Алгоритм для автоматизации рутиной работы в Adobe
Доброго времени суток всем. Есть цель маленькая. Имеется Архив в котором находится отсортировонные по годам папки, которые в свою очередь...

Класс для работы сo строками
Помогите пжл разработать следующие элементы класса: Конструктор, позволяющий создать строку из n символов Конструктор в данном коде...

Функции для работы со строками в VB
Помогите со строками. Какие есть функции для обработки строк? В хелпе ничего разобрать не смог, а очень надо.

8
4043 / 2654 / 583
Регистрация: 11.09.2009
Сообщений: 9,487
18.03.2010, 01:53
Bloomfield, те варианты ошибок, при которых формально нельзя различить признак начала предложения, без смыслового анализа исправить не получится, так что рассматриваем только формальные признаки - и вперёд!
Что является формальным признаком конца предложения?
- Перевод строки (случаи форматирования по ширине вручную относим к ошибкам);
- Символ конца предложения ("." "!" "?" "..." и, может быть, ещё что-нибудь)
Пробелы вообще не учитываем (не буква).
Итого:
Если в тексте при последовательном просмотре обнаружен символ конца предложения - следующий буквенный символ должен быть в верхнем регистре.
1
Платежеспособный зверь
 Аватар для кот Бегемот
8966 / 4389 / 1655
Регистрация: 28.10.2009
Сообщений: 11,647
18.03.2010, 11:44
Пробелы вообще не учитываем (не буква).
Это не совсем точно.
Более точным выглядит следующий алгоритм:
Если предложения в файле не разбиваются на отдельные куски в разных строках, то:
Считываем из файла очередную строку.
Проверяем 1 букву строки на регистр.
Идём по строке.
Если находим символ, которым должно кончиться предложение (. ! ?),
то проверяем следующий за ним символ. Если он не пробел, а буква, проверяем на регистр, если пробел, то берём следующий символ, пока не дойдём до буквы или конца строки.
Таким образом мы проверим регистр и при наличии пробела между предложениями, и без пробелов.
1
4043 / 2654 / 583
Регистрация: 11.09.2009
Сообщений: 9,487
18.03.2010, 18:20
Цитата Сообщение от кот Бегемот Посмотреть сообщение
Это не совсем точно...
Ну и в чём отличия?

кот Бегемот: "Если предложения в файле не разбиваются на отдельные куски в разных строках, то:"
i8085: "случаи форматирования по ширине вручную относим к ошибкам"


кот Бегемот: "Считываем из файла очередную строку. Проверяем 1 букву строки на регистр. Идём по строке. Если находим символ, которым должно кончиться предложение (. ! ?), то..."
i8085: "... признаком конца предложения ... - Перевод строки ... - Символ конца предложения ("." "!" "?" "..."

кот Бегемот: "...если пробел, то берём следующий символ
i8085: "Пробелы вообще не учитываем"

кот Бегемот: "Если находим символ, которым должно кончиться предложение (. ! ?),
то проверяем следующий за ним символ. Если он ..."

i8085: "Если в тексте при последовательном просмотре обнаружен символ конца предложения - следующий буквенный символ должен быть в верхнем регистре."

А проверять вообще не нужно - сразу меняем на верхний регистр, даже если он и так верхний. Так быстрее.
Всегда надо минимизировать логические функции, даже в программировании.
1
2 / 2 / 1
Регистрация: 16.11.2009
Сообщений: 51
18.03.2010, 20:36  [ТС]
Извиняюсь что сразу не сказал - буквы только русские! Поэтому проверить всё же придётся, т.к вычитаю шестнадцатеричное значение (Windows-1251). toupper с русскими буквами не работает.
0
Платежеспособный зверь
 Аватар для кот Бегемот
8966 / 4389 / 1655
Регистрация: 28.10.2009
Сообщений: 11,647
18.03.2010, 20:49
i8085
не стоило так бурно возмущаться, я уже указал в цитате, что меня смутила только одна ваша фраза, которая сбивает с толку, именно это я и хотел исправить
0
4043 / 2654 / 583
Регистрация: 11.09.2009
Сообщений: 9,487
19.03.2010, 01:40
кот Бегемот, да какое возмущение, бог с вами, скажете тоже...
Написал, потому что абсолютно не въехал, чем отличается моё "Пробелы вообще не учитываем (не буква)", что вы процитировали с комментарием " которая сбивает с толку, ", от вашего "Если он не пробел, а буква, проверяем на регистр, если пробел, то берём следующий символ". Логически это одно и то же - пробелы игнорируем.

Сейчас понял. За время модераторства тут, у вас выработался стиль разжёвывать каждую фразу в ответах юзерам. И это правильно.
0
2 / 2 / 1
Регистрация: 16.11.2009
Сообщений: 51
20.03.2010, 07:17  [ТС]
Немного отходя от темы раздела:

Код будет примерно таким:
C
1
2
3
4
5
6
7
8
9
10
for (i=0; i<N-2;i++)
        if (i == 0 || ispunct(A[i]))
            if (!isspace(A[i+1])){
                if (A[i+1] > 'а' && A[i+1] < 'я')
                        A[i+1] = A[i+1] - 0x20;
            }
            else 
                if (isspace(A[i+1]) && (!isspace(A[i+2])))
                    if (A[i+2] > 'а' && A[i+2] < 'я')
                        A[i+2] = A[i+2] - 0x20;
0
Эксперт функциональных языков программированияЭксперт по математике/физике
4313 / 2105 / 431
Регистрация: 19.07.2009
Сообщений: 3,205
Записей в блоге: 24
20.03.2010, 12:02
Я бы алгоритм ещё дополнил некой системой поправления пользователя, а именно:
насколько мне известно, правила хорошего тона требуют, чтобы всякое новое слово по отношению к предшествующему разделителю (не к каждому в целом, но для любого разделителя предложений) было отделено переводом строки или собственно пробелом (или же табом по вертикали, или переходом по странице — я с этими символами не знаком). Поэтому, если откинуть вариант "Пробелы вообще не учитываем (не буква)." , я предлогию добавлять пробел после .?!... перед непосредственно последующим буквенным символом или, в случае более чем одного пробела между ними, удалять лишние. Как по мне, если "заказчик" просит следить за регистром с целью сделать читабельным текст, это добавление ему понравиться : )
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
20.03.2010, 12:02
Помогаю со студенческими работами здесь

Класс для работы сo строками
Помогите пжл разработать следующие элементы класса: Конструктор, позволяющий создать строку из n символов Конструктор в данном коде...

Класс для работы со строками
Вот мой класс: public class stroka { string Line; int n; public double Razmer { ...

Класс для работы со строками
Нужно написать класс работы со строками и один метод (сложение строк). Помогите пожалуйста сделать, а то не могу разобраться с классом

Пакет для работы со строками
Всем привет! решил выложить пакет для работы со строками из учебника Тома Свана (может кому пригодится:)) В архиве MTA_LIB лежат...

Библиотека для работы со строками
Нужно определить результат выполнения фрагмента программы: char str1=&quot;C++ language&quot;; char *str2=&quot;12345&quot;; int n=13; ...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
9
Ответ Создать тему
Опции темы

Новые блоги и статьи
Символические и жёсткие ссылки в Linux.
algri14 15.03.2026
Существует два типа ссылок — символические и жёсткие. Ссылка в Linux — это запись в каталоге, которая может указывать либо на inode «файла-ИСТОЧНИКА», тогда это будет «жёсткая ссылка» (hard link),. . .
[Owen Logic] Поддержание уровня воды в резервуаре количеством включённых насосов: моделирование и выбор регулятора
ФедосеевПавел 14.03.2026
Поддержание уровня воды в резервуаре количеством включённых насосов: моделирование и выбор регулятора ВВЕДЕНИЕ Выполняя задание на управление насосной группой заполнения резервуара,. . .
делаю науч статью по влиянию грибов на сукцессию
anaschu 13.03.2026
прикрепляю статью
SDL3 для Desktop (MinGW): Создаём пустое окно с нуля для 2D-графики на SDL3, Си и C++
8Observer8 10.03.2026
Содержание блога Финальные проекты на Си и на C++: hello-sdl3-c. zip hello-sdl3-cpp. zip Результат:
Установка CMake и MinGW 13.1 для сборки С и C++ приложений из консоли и из Qt Creator в EXE
8Observer8 10.03.2026
Содержание блога MinGW - это коллекция инструментов для сборки приложений в EXE. CMake - это система сборки приложений. Здесь описаны базовые шаги для старта программирования с помощью CMake и. . .
Как дизайн сайта влияет на конверсию: 7 решений, которые реально повышают заявки
Neotwalker 08.03.2026
Многие до сих пор воспринимают дизайн сайта как “красивую оболочку”. На практике всё иначе: дизайн напрямую влияет на то, оставит человек заявку или уйдёт через несколько секунд. Даже если у вас. . .
Модульная разработка через nuget packages
DevAlt 07.03.2026
Сложившийся в . Net-среде способ разработки чаще всего предполагает монорепозиторий в котором находятся все исходники. При создании нового решения, мы просто добавляем нужные проекты и имеем. . .
Модульный подход на примере F#
DevAlt 06.03.2026
В блоге дяди Боба наткнулся на такое определение: В этой книге («Подход, основанный на вариантах использования») Ивар утверждает, что архитектура программного обеспечения — это структуры,. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru