Форум программистов, компьютерный форум, киберфорум
Java SE (J2SE)
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.80/5: Рейтинг темы: голосов - 5, средняя оценка - 4.80
16 / 16 / 9
Регистрация: 16.03.2012
Сообщений: 437

Лексический анализ

24.11.2018, 16:04. Показов 1047. Ответов 3

Студворк — интернет-сервис помощи студентам
Добрый день!

Как сделать с помощью regexp, чтобы вылавливался смвол ":=" и вылавливался "End;" и чтобы можно было отличить ключевое слово от идентификатора?

Сейчас выводится отдельно: delimiter ":", delimiter2 "=", "End" ";"

Ключевое слово, которые хотел бы найти, например: procedure, TObject, var. Идентификаторы TForm1, Button2Click, SEnder.

Java
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
import java.util.ArrayList;
import java.util.regex.Pattern;
import java.util.regex.Matcher;
 
public class Lexer {
    public static enum TokenType {
        // Token types cannot have underscores
        NUMBER("-?[0-9]+"),
        WHITESPACE("[ \t\f\r\n]+"),
        IDENTIFIER ("\\w+"),
        STRING ("\'([^\']*)\'"),
        DELIMITER("[.|(|)|:|;|[|]|>|=|*|/|+|-]"),
        DELIMITER2(":="),
        //KEYWORD("procedure");
        public final String pattern;
 
        private TokenType(String pattern) {
            this.pattern = pattern;
        }
    }
 
    public static class Token {
        public TokenType type;
        public String data;
 
        public Token(TokenType type, String data) {
            this.type = type;
            this.data = data;
        }
 
        @Override
        public String toString() {
            return String.format("%-10s:  %s", type.name(), data);
        }
    }
 
    public static ArrayList<Token> lex(String input) {
        // The tokens to return
        ArrayList<Token> tokens = new ArrayList<Token>();
 
        // Lexer logic begins here
        StringBuffer tokenPatternsBuffer = new StringBuffer();
        for (TokenType tokenType : TokenType.values())
            tokenPatternsBuffer.append(String.format("|(?<%s>%s)", tokenType.name(), tokenType.pattern));
        Pattern tokenPatterns = Pattern.compile(new String(tokenPatternsBuffer.substring(1)));
 
        // Begin matching tokens
        Matcher matcher = tokenPatterns.matcher(input);
        while (matcher.find()) {
            if (matcher.group(TokenType.NUMBER.name()) != null) {
                tokens.add(new Token(TokenType.NUMBER, matcher.group(TokenType.NUMBER.name())));
                continue;
            } else if (matcher.group(TokenType.IDENTIFIER.name()) != null) {
                tokens.add(new Token(TokenType.IDENTIFIER, matcher.group(TokenType.IDENTIFIER.name())));
                continue;
            } else if (matcher.group(TokenType.STRING.name()) != null) {
                tokens.add(new Token(TokenType.STRING, matcher.group(TokenType.STRING.name())));
                continue;
            } else if (matcher.group(TokenType.DELIMITER.name()) != null) {
                tokens.add(new Token(TokenType.DELIMITER, matcher.group(TokenType.DELIMITER.name())));
                continue;
            } else if (matcher.group(TokenType.DELIMITER2.name()) != null) {
                tokens.add(new Token(TokenType.DELIMITER2, matcher.group(TokenType.DELIMITER2.name())));
                continue;
            } else if (matcher.group(TokenType.WHITESPACE.name()) != null)
                continue;
        }
 
        return tokens;
    }
 
    public static void main(String[] args) {
        String input =
                "procedure TForm1.Button2Click(SEnder: TObject);" +
                "var M:set of char;" +
                "ch:char;" +
                "S:string;" +
                "i,k:integer;" +
                "Begin M:=[];" +
                    "k:=0;" +
                        "for i:=i to ListBox1.Items.Count-1" +
                        "do S:=S+Listbox1.Items[i];" +
                    "Begin " +
                        "for i:=1 to Length(S)" +
                        "do if S[i] in M then  M:=M+[S[i]]" +
                    "else  if M>5 then ShowMessage('Impossible')" +
                  "End;" +
                "End;"
                ;
 
        // Create tokens and print them
        ArrayList<Token> tokens = lex(input);
        for (Token token : tokens)
            System.out.println(token);
    }
}
0
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
24.11.2018, 16:04
Ответы с готовыми решениями:

Лексический анализ (Си -> Java)
Подаскажите пожалуйста как переделать задачку по лексическому анализу с С на JAVA не так много знала, да еще и все забыла О_о за...

Лексический анализатор
Добрый день!Надо распарсить строку на лексемы.Строка :&quot;set String i_MyVar=&quot;Eto moya stroka&quot;&quot;.Чтобы получить в ArrayList следующее:!.Пока...

Лексический анализатор языка С
Доброго времени суток, пишу лексический анализатор языка Си. По заданию нужно распределить числа, строчные и символьные...

3
Эксперт функциональных языков программированияЭксперт Java
 Аватар для korvin_
4575 / 2774 / 491
Регистрация: 28.04.2012
Сообщений: 8,765
24.11.2018, 17:09
Цитата Сообщение от SlashX6 Посмотреть сообщение
Как сделать с помощью regexp
Лексический анализатор, как правило, делают не через регулярки.

Цитата Сообщение от SlashX6 Посмотреть сообщение
Ключевое слово, которые хотел бы найти, например: procedure, TObject, var. Идентификаторы TForm1, Button2Click, SEnder.
Во-первых, TObject — не ключевое слово, а идентификатор.
Во-вторых, ты же помнишь, что в Паскале и Делфи грамматика регистронезависимая?

Добавлено через 4 минуты
Начни отсюда.
1
16 / 16 / 9
Регистрация: 16.03.2012
Сообщений: 437
24.11.2018, 17:21  [ТС]
korvin_, через регулярные выражения казалось проще сделать, по этому и делал через них.
А кусок кода надо разобрать как он дан, учитывая регистр. За ссылку спасибо, гляну.
0
510 / 272 / 60
Регистрация: 14.12.2010
Сообщений: 548
26.11.2018, 07:52
Цитата Сообщение от SlashX6 Посмотреть сообщение
Как сделать с помощью regexp, чтобы вылавливался смвол ":=" и вылавливался "End;" и чтобы можно было отличить ключевое слово от идентификатора?
Coco/R.
1
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
26.11.2018, 07:52
Помогаю со студенческими работами здесь

Написать лексический анализатор для программы на Pascal
Всем привет, нужна помощь Нужно, чтобы программа, считывающая файл построчно, на выходе давала два файла: таблицу лексем(идентификатор,...

Лексический распознаватель для языка Pascal
Нужно написать лексический распознаватель на джава для языка паскаль Входная программа: program com1; var t, i: integer; ...

Лексический анализ
Программа должна выводить в соответствующие StringGrid`ы : служебны слова, идентификаторы, числа и наборы символов. Вот процедура...

лексический анализ
Добрый вечер всем. У меня такая проблема: мне надо разобрать строку на запчасти. Смысл такой - с клавиатуры вводится многочлен, его надо...

лексический анализ.....
Составить таблицу терминальных символов (включая операции +, – = и объявление типов), таблицу литералов и таблицу идентификаторов, на...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
4
Ответ Создать тему
Новые блоги и статьи
Загрузка PNG с альфа-каналом на SDL3 для Android: с помощью SDL_LoadPNG (без SDL3_image)
8Observer8 28.01.2026
Содержание блога SDL3 имеет собственные средства для загрузки и отображения PNG-файлов с альфа-каналом и базовой работы с ними. В этой инструкции используется функция SDL_LoadPNG(), которая. . .
Загрузка PNG с альфа-каналом на SDL3 для Android: с помощью SDL3_image
8Observer8 27.01.2026
Содержание блога SDL3_image - это библиотека для загрузки и работы с изображениями. Эта пошаговая инструкция покажет, как загрузить и вывести на экран смартфона картинку с альфа-каналом, то есть с. . .
влияние грибов на сукцессию
anaschu 26.01.2026
Бифуркационные изменения массы гриба происходят тогда, когда мы уменьшаем массу компоста в 10 раз, а скорость прироста биомассы уменьшаем в три раза. Скорость прироста биомассы может уменьшаться за. . .
Воспроизведение звукового файла с помощью SDL3_mixer при касании экрана Android
8Observer8 26.01.2026
Содержание блога SDL3_mixer - это библиотека я для воспроизведения аудио. В отличие от инструкции по добавлению текста код по проигрыванию звука уже содержится в шаблоне примера. Нужно только. . .
Установка Android SDK, NDK, JDK, CMake и т.д.
8Observer8 25.01.2026
Содержание блога Перейдите по ссылке: https:/ / developer. android. com/ studio и в самом низу страницы кликните по архиву "commandlinetools-win-xxxxxx_latest. zip" Извлеките архив и вы увидите. . .
Вывод текста со шрифтом TTF на Android с помощью библиотеки SDL3_ttf
8Observer8 25.01.2026
Содержание блога Если у вас не установлены Android SDK, NDK, JDK, и т. д. то сделайте это по следующей инструкции: Установка Android SDK, NDK, JDK, CMake и т. д. Сборка примера Скачайте. . .
Использование SDL3-callbacks вместо функции main() на Android, Desktop и WebAssembly
8Observer8 24.01.2026
Содержание блога Если вы откроете примеры для начинающих на официальном репозитории SDL3 в папке: examples, то вы увидите, что все примеры используют следующие четыре обязательные функции, а. . .
моя боль
iceja 24.01.2026
Выложила интерполяцию кубическими сплайнами www. iceja. net REST сервисы временно не работают, только через Web. Написала за 56 рабочих часов этот сайт с нуля. При помощи perplexity. ai PRO , при. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru