Форум программистов, компьютерный форум, киберфорум
Python для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.94/34: Рейтинг темы: голосов - 34, средняя оценка - 4.94
 Аватар для GulgDev
132 / 118 / 29
Регистрация: 09.07.2019
Сообщений: 1,071

Напишите lexer

13.07.2019, 17:00. Показов 7279. Ответов 7
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
У меня есть код:
Python
1
2
3
4
5
6
7
8
9
10
KEYWORDS = {
'var':'RESERVED'
'=':'RESERVED'
';':'END'
}
LINE = 'var x = "hello world!";'
def lex(LINE,KEYWORDS):
    ...
# Мне надо получить
tokens = lex(LINE,KEYWORDS) # [('var','RESERVED'),('x','NORMAL'),('=','RESERVED'),('"hello world!"','NORMAL'),(';','END')]

Не по теме:

Если я вас достал, забаньте меня...

0
Лучшие ответы (1)
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
13.07.2019, 17:00
Ответы с готовыми решениями:

Операция вложения для Lexer'a
Здравствуйте. Пишу программу (Lexer) для чтения кода. Хочу понять, как встроенный языки программирования. Выбрал Pascal из-за его...

AST, Lexer и PABC.NET
Решил задать маленький вопрос (вернее, большой): недавно поставил себе цель - написать интерпретатор на Pabc.net. Добавлено через 7...

ANTLR. Как создать Lexer/Parser?
Используется: Visual Studio - 2019 Для установки `ANTLR` я использую tunnelvisionlabs/antlr4cs // github.com Граматики я...

7
1293 / 677 / 367
Регистрация: 07.01.2019
Сообщений: 2,300
13.07.2019, 17:31
Начинайте с самого простого

Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
KEYWORDS = {
'var':'RESERVED',
'=':'RESERVED'
}
LINE = 'var x = "hello"'
 
def lex(LINE,KEYWORDS):
    ret = []
    lines = LINE.split()
    for line in lines:
        if line in KEYWORDS:
            ret.append((line, KEYWORDS[line]))
        else:
            ret.append((line, 'NORMAL'))
    return ret
 
# Мне надо получить
tokens = lex(LINE,KEYWORDS)
print(tokens)
0
 Аватар для Andrey B
170 / 122 / 61
Регистрация: 06.02.2015
Сообщений: 300
13.07.2019, 17:39
Для конкретного примера неоптимальное решение
Кликните здесь для просмотра всего текста
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
KEYWORDS = {
'var':'RESERVED',
'=':'RESERVED',
';':'END',
}
 
LINE = 'var x = "hello world!";'
 
def lex(LINE,KEYWORDS):
    k=0
    tmp=[]
    res=[]
    for i in range(len(LINE)):
        if LINE[i]==" ":
            tmp=LINE.split(LINE[i],k)
            k=k+1
            
    for i in range(len(tmp)):
        if ";" in tmp[i]:
            tmp.append(";")
            tmp[i]=tmp[i].replace(";","")
 
    for i in range(len(tmp)):
        if tmp[i] in KEYWORDS:
            res.append([tmp[i],KEYWORDS[tmp[i]]])
        else:
            if all(x.isalpha() or x.isspace() or '' in x or "" in x for x in tmp[i]):
               res.append([tmp[i],'NORMAL'])
                
    return res
 
tokens = lex(LINE,KEYWORDS) # [('var','RESERVED'),('x','NORMAL'),('=','RESERVED'),('"hello world!"','NORMAL'),(';','END')]
print(tokens)
0
Автоматизируй это!
Эксперт Python
 Аватар для Welemir1
7390 / 4817 / 1246
Регистрация: 30.03.2015
Сообщений: 13,664
Записей в блоге: 29
13.07.2019, 18:19
Лучший ответ Сообщение было отмечено Hyppoprogramm как решение

Решение

Hyppoprogramm, ты пойми -это не простая задача, нельзя разбивать по пробелу как помогли тебе выше, так как знак типа точки с запятой могут быть вплотную к выражению и вообще юзер может без пробелов все ввести и тогда по какому признаку разбивать?
вот пример, но только для твоей конкретной задачи (обрати внимание и на ключевые слова), дальше давай сам, жажду увидеть твой код:
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
import re
 
KEYWORDS = {'RESERVED': ['var', '='], 'END': [';']}
 
 
def lexer(line: str, keywords: dict) -> list:
    result = []
    quoted_text = re.findall('"(.*?)"', line)
    if quoted_text:
        line = line.replace('"' + quoted_text[0] + '"', '$REPLACED ')
    for word in line.split():
        for k, v in keywords.items():
            if word in v:
                result.append((word, k))
                break
        else:
            word = word if word != '$REPLACED' else '"' + quoted_text[0] + '"'
            result.append((word, 'NORMAL'))
    return result
 
 
LINE = 'var x = "hello world!";'
tokens = lexer(LINE, KEYWORDS)
print(lexer(LINE, KEYWORDS))
1
 Аватар для GulgDev
132 / 118 / 29
Регистрация: 09.07.2019
Сообщений: 1,071
13.07.2019, 19:05  [ТС]
Welemir1, большое спасибо! Получилось!
P.S. Немного исправил код:
Исправил словарь ключевых слов и заменил in на ==
0
Автоматизируй это!
Эксперт Python
 Аватар для Welemir1
7390 / 4817 / 1246
Регистрация: 30.03.2015
Сообщений: 13,664
Записей в блоге: 29
13.07.2019, 19:10
Цитата Сообщение от Hyppoprogramm Посмотреть сообщение
Получилось!
ничего не получилось, это только для этого примера, немного изменить запись и все -работать не будет.
завязывай с интерпретатором
0
 Аватар для GulgDev
132 / 118 / 29
Регистрация: 09.07.2019
Сообщений: 1,071
13.07.2019, 19:14  [ТС]
И кстате, подумал немного и получил ответ на предыдущий вопрос.
Кому интересно, вот полный код:
Кликните здесь для просмотра всего текста
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
KEYWORDS = {
'var':'RESERVED',
'=':'RESERVED',
'+':'RESERVED'
}
LINE = 'var abc = "some" + "text";'
 
import re
def lex(line: str, keywords: dict) -> list:
    result = []
    quoted_text = re.findall('"(.*?)"', line)
    quoted_text += re.findall("'(.*?)'",line)
    if quoted_text:
        line = line.replace('"' + quoted_text[0] + '"', '$REPLACED ')
    for word in line.split()[:-1]:
        for v, k in keywords.items():
            if word in v:
                result.append((word, k))
                break
        else:
            word = word if word != '$REPLACED' else '"' + quoted_text[0] + '"'
            result.append((word, 'NORMAL'))
    word = line.split()[-1]
    END = word[-1]
    word = word[:-1]
    for v, k in keywords.items():
        if word in v:
            result.append((word, k))
            break
    else:
        word = word if word != '$REPLACED' else '"' + quoted_text[0] + '"'
        result.append((word, 'NORMAL'))
    result.append((END,'END'))
    return result
tokens = lex(LINE, KEYWORDS)
print(lex(LINE, KEYWORDS)) # [('var','RESERVED'),('abc','NORMAL'),('=','RESERVED'),('"some"','NORMAL'),('+','RESERVED'),('"text"','NORMAL'),(';','END')]
0
Супер-модератор
Эксперт функциональных языков программированияЭксперт Python
 Аватар для Catstail
38161 / 21096 / 4306
Регистрация: 12.02.2012
Сообщений: 34,680
Записей в блоге: 14
14.07.2019, 14:22
Вот простейший парсер:

Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
def parse(line):
    delims=" ,;()[]=:;<>"
    lex=[]
    acc=""
    for a in line:
        if a in delims:
            if acc != "":
                lex+=[acc]
            if a != " ":
                lex+=[a]
            acc=""
        else:
            acc=acc+a
    if acc != "":
        lex+=[acc]
    return lex
 
print(str(parse("var x,y,z : integer;")))
Вывод: ['var', 'x', ',', 'y', ',', 'z', ':', 'integer', ';']

https://onlinegdb.com/ryNOg5OZr
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
14.07.2019, 14:22
Помогаю со студенческими работами здесь

напишите программу на паскале!!! если можно напишите в комментах что где делаете!!!
1)Найти наибольший элемент матрицы X(4,5). Записать единицы в те строку и столбец, где он находиться. 2)Даны две квадратные вещественные...

Напишите программу с использованием методов ArrayList. Контрольный метод: contains(). Напишите if блок используя значени
Напишите программу с использованием методов ArrayList. Контрольный метод: contains(). Напишите if блок используя значение метода...

Напишите программу, реализующую работу очереди. Напишите функции для добавления/удаления элемента в очередь
Помогите пожалуйста написать программу. Готовый Queue не нужен( Нужно изобрести велосипед заново. Задание: Напишите программу,...

Напишите метод, возвращающий количество значений true в булевом массиве. Напишите функцию main() с примером вызова мето
Напишите метод, возвращающий количество значений true в булевом массиве. Напишите функцию main() с примером вызова метода

Напишите программу умножения двух рациональных дробей. Если полученный результат является сократимой дробью, то сократите эту дробь. Напишите пожалуйс
Напишите программу умножения двух рациональных дробей. Если полученный результат является сократимой дробью, то сократите эту дробь. ...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
8
Ответ Создать тему
Новые блоги и статьи
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта Симптом: После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
Access
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
Новый ноутбук
volvo 07.12.2025
Всем привет. По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне: Ryzen 5 7533HS 64 Gb DDR5 1Tb NVMe 16" Full HD Display Win11 Pro
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов На странице: https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/ нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином. Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов. . . .
Ломающие изменения в C#.NStar Alpha
Etyuhibosecyu 20.11.2025
Уже можно не только тестировать, но и пользоваться C#. NStar - писать оконные приложения, содержащие надписи, кнопки, текстовые поля и даже изображения, например, моя игра "Три в ряд" написана на этом. . .
Мысли в слух
kumehtar 18.11.2025
Кстати, совсем недавно имел разговор на тему медитаций с людьми. И обнаружил, что они вообще не понимают что такое медитация и зачем она нужна. Самые базовые вещи. Для них это - когда просто люди. . .
Создание Single Page Application на фреймах
krapotkin 16.11.2025
Статья исключительно для начинающих. Подходы оригинальностью не блещут. В век Веб все очень привыкли к дизайну Single-Page-Application . Быстренько разберем подход "на фреймах". Мы делаем одну. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2025, CyberForum.ru