С Новым годом! Форум программистов, компьютерный форум, киберфорум
С++ для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.88/16: Рейтинг темы: голосов - 16, средняя оценка - 4.88
1 / 1 / 1
Регистрация: 07.05.2010
Сообщений: 55

Анализ текста

24.05.2011, 19:15. Показов 3349. Ответов 9
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Нужно написать программу выделяющую последовательности букв и числа из произвольного текста.
Программа должно читать из входного файла по одному символу и управляться с помощью таблиц.

пример:

Input:
Test 2.2 is a number.

Output:
Test - word
2.2 - number
is - word
a - word
number - word

Первое с чего начал это естественно гугл. Гуглил по запросу "лексический анализатор",но ничего про таблицы не смог нагуглить.
Как я понял в таблице должно быть описание типа данных: word, number.
Есть какие-нибудь идеи?
0
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
24.05.2011, 19:15
Ответы с готовыми решениями:

Анализ текста
Всем привет. Есть программа, которая шифрует файлы. Я хотел бы перебором всех ключей (ключевое пространство небольшое) вычислить открытый...

Морфологический анализ текста
Здравствуйте, нужна помощь в написании программы: Создать программу проводящую морфологический анализ текста (а именно Личных местоимений),...

Символьный анализ текста
2. Дана строка. Выполните символьный анализ текста. Ниже представлен рекомендуемый вид диалога во время работы программы. Данные, вводимые...

9
 Аватар для Mиxaил
542 / 447 / 162
Регистрация: 10.12.2009
Сообщений: 1,857
24.05.2011, 20:22
первое, что пришло в голову - выделять слова из строки, а потом проверять на характер символов этого слова. Если в нем встречаются только цифры или цифры и ".", то это число. Если только буквы без цифр - слова... Как - то так...
В данной задаче, я пользовался бы множеством ( set )
0
1 / 1 / 1
Регистрация: 07.05.2010
Сообщений: 55
24.05.2011, 21:39  [ТС]
А таблицы тогда причем? Нужно делать задание используя таблицы! Но инфы про них я не нашел.
0
Эксперт С++
623 / 467 / 57
Регистрация: 28.01.2011
Сообщений: 605
24.05.2011, 21:41
Ну дак вы выделяете из текста лексемы, определяя , что вам встретилось, число или слово, и помещаете это в таблицу, где у вас каждой лексеме будет сопоставляться её тип.
0
1 / 1 / 1
Регистрация: 07.05.2010
Сообщений: 55
24.05.2011, 22:10  [ТС]
Так получается что таблица нужна только для хранения лексем? Если выходные данные должны быть записаны в файл, то тогда смысл ее размещения в этой таблице?
Или я что-то не так понял?
0
Эксперт С++
623 / 467 / 57
Регистрация: 28.01.2011
Сообщений: 605
24.05.2011, 22:19
Я вижу только такое применение таблицы в данном случае. Представьте, что после того, как вы разобрали текст, вы еще что-то хотите поделать с этими словами, числами, это будет намного удобнее делать, если будет таблица, в таком случае смысл появится, а в данной задаче, видимо, требуется только лишь показать, что вы понимаете, как это делается.
0
 Аватар для Mиxaил
542 / 447 / 162
Регистрация: 10.12.2009
Сообщений: 1,857
24.05.2011, 23:08
А можно просто использовать класс string (STL) и решить любую задачу без использования массивов - экономичней!
0
Freelance
Эксперт С++
 Аватар для asics
2891 / 1826 / 356
Регистрация: 09.09.2010
Сообщений: 3,841
24.05.2011, 23:31
Mиxaил, Класс string - это просто обертка строки Си-стиля(масива символов), так что строка - это всегда, хоть иногда и не явно, масив.
0
1 / 1 / 1
Регистрация: 07.05.2010
Сообщений: 55
24.05.2011, 23:42  [ТС]
Я извиняюсь, недописал задание.

Написать программу, использующую механизм управления при помощи таблиц (управление осуществляется данными!). Необходимо во входном потоке данных выделить заранее предопределенные лексемы (набор лексем для выделения получить у преподавателя). Входные данные: текстовый файл, содержащий фрагмент текста. Выходные данные: текстовый файл с распознанными лексемами.
В исходном файле лексемы отделяются друг от друга разделителями.
Ограничения, накладываемые на реализацию: программа может запоминать только текущее состояние и последний введенный символ. Не должны использоваться никакие дополнительные массивы для хранения введенных данных.

Тут указано что таблица должна как то управлять данными.
0
4866 / 3288 / 468
Регистрация: 10.12.2008
Сообщений: 10,570
25.05.2011, 08:53
Цитата Сообщение от stark91
Гуглил по запросу "лексический анализатор",но ничего про таблицы не смог нагуглить.
wiki. конечный автомат
там есть таблица переходов
символ -> состояние
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
25.05.2011, 08:53
Помогаю со студенческими работами здесь

Частотный анализ текста
Помогите решить задачу! Дана строка, содержащая текст, набранный заглавными русскими буквами. Провести частотный анализ текста, т.е....

Анализ тональности текста
Нужно написать программу анализа тональности текста. Решил воспользоваться самым примитивным способом, подсчет "положительных" и...

Частотный анализ текста
Вообщем задача, Есть текст в файле, необходимо определить, какие символы и сколько раз встречаются в тексте. Упорядочить их в порядке...

Частотный анализ текста (символьный)
Частотный анализ текста (символьный). (Подсчитывается относительная частота встречаемости каждого символа в тексте.) Текст вводится из...

Частотный анализ текста (пословный)
24. Частотный анализ текста (пословный). (Подсчитывается относительная частота встречаемости каждого слова в тексте; границами слов...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
10
Ответ Создать тему
Новые блоги и статьи
Почему дизайн решает?
Neotwalker 09.01.2026
В современном мире, где конкуренция за внимание потребителя достигла пика, дизайн становится мощным инструментом для успеха бренда. Это не просто красивый внешний вид продукта или сайта — это. . .
Модель микоризы: классовый агентный подход 3
anaschu 06.01.2026
aa0a7f55b50dd51c5ec569d2d10c54f6/ O1rJuneU_ls https:/ / vkvideo. ru/ video-115721503_456239114
Owen Logic: О недопустимости использования связки «аналоговый ПИД» + RegKZR
ФедосеевПавел 06.01.2026
Owen Logic: О недопустимости использования связки «аналоговый ПИД» + RegKZR ВВЕДЕНИЕ Введу сокращения: аналоговый ПИД — ПИД регулятор с управляющим выходом в виде числа в диапазоне от 0% до. . .
Модель микоризы: классовый агентный подход 2
anaschu 06.01.2026
репозиторий https:/ / github. com/ shumilovas/ fungi ветка по-частям. коммит Create переделка под биомассу. txt вход sc, но sm считается внутри мицелия. кстати, обьем тоже должен там считаться. . . .
Расчёт токов в цепи постоянного тока
igorrr37 05.01.2026
/ * Дана цепь постоянного тока с сопротивлениями и напряжениями. Надо найти токи в ветвях. Программа составляет систему уравнений по 1 и 2 законам Кирхгофа и решает её. Последовательность действий:. . .
Новый CodeBlocs. Версия 25.03
palva 04.01.2026
Оказывается, недавно вышла новая версия CodeBlocks за номером 25. 03. Когда-то давно я возился с только что вышедшей тогда версией 20. 03. С тех пор я давно снёс всё с компьютера и забыл. Теперь. . .
Модель микоризы: классовый агентный подход
anaschu 02.01.2026
Раньше это было два гриба и бактерия. Теперь три гриба, растение. И на уровне агентов добавится между грибами или бактериями взаимодействий. До того я пробовал подход через многомерные массивы,. . .
Советы по крайней бережливости. Внимание, это ОЧЕНЬ длинный пост.
Programma_Boinc 28.12.2025
Советы по крайней бережливости. Внимание, это ОЧЕНЬ длинный пост. Налог на собак: https:/ / **********/ gallery/ V06K53e Финансовый отчет в Excel: https:/ / **********/ gallery/ bKBkQFf Пост отсюда. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru