С Новым годом! Форум программистов, компьютерный форум, киберфорум
Python для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.82/11: Рейтинг темы: голосов - 11, средняя оценка - 4.82
0 / 0 / 0
Регистрация: 23.07.2023
Сообщений: 5

Транслитерация 2.0

24.07.2023, 16:03. Показов 2398. Ответов 1

Студворк — интернет-сервис помощи студентам
Добрый день! Встретил такую задачу:

Для международных документов русский текст преобразуется с использованием латинского алфавита. ГОСТ Р 52535.1-2006 задаёт правила транслитерации идентификационных карт.
Ниже приведена таблица замен:

А — A
Б — B
В — V
Г — G
Д — D
Е — E
Ё — E
Ж — ZH
З — Z
И — I
Й — I
К — K
Л — L
М — M
Н — N
О — O
П — P
Р — R
С — S
Т — T
У — U
Ф — F
Х — KH
Ц — TC
Ч — CH
Ш — SH
Щ — SHCH
Ы — Y
Э — E
Ю — IU
Я — IA
Давайте транслитерируем русский текст.
Букву «ё» транслитерируйте как «e», «й» как «и», а «ъ» и «ь» (и их заглавные версии «Ъ» и «Ь») должны исчезнуть из текста. Строчные буквы заменяются на строчные, заглавные заменяются на заглавные. Если заглавная буква превращается при транслитерации в несколько букв, то заглавной должна остаться только первая из них (например, «Ц» → «Tc»). Все некириллические символы должны остаться на месте.

Формат ввода
В одной папке с вашей программой лежит файл cyrillic.txt. В нём, в числе прочих, содержится некоторое количество кириллических символов.

Формат вывода
В файл transliteration.txt записать результат транслитерации исходного файла.

Написал такой код для решения задачи:
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
diction = {'А': 'A',
           'Б': 'В',
           'В': 'V',
           'Г': 'G',
           'Д': 'D',
           'Е': 'E',
           'Ё': 'E',
           'Ж': 'Zh',
           'З': 'Z',
           'И': 'I',
           'Й': 'I',
           'К': 'K',
           'Л': 'L',
           'М': 'M',
           'Н': 'N',
           'О': 'O',
           'П': 'P',
           'Р': 'R',
           'С': 'S',
           'Т': 'T',
           'У': 'U',
           'Ф': 'F',
           'Х': 'Kh',
           'Ц': 'Tc',
           'Ч': 'Ch',
           'Ш': 'Sh',
           'Щ': 'Shch',
           'Ы': 'Y',
           'Э': 'E',
           'Ю': 'Iu',
           'Я': 'Ia',
           'Ь': '',
           'Ъ': '',
           'а': 'a',
           'б': 'b',
           'в': 'v',
           'г': 'g',
           'д': 'd',
           'е': 'e',
           'ё': 'e',
           'ж': 'zh',
           'з': 'z',
           'и': 'i',
           'й': 'i',
           'к': 'k',
           'л': 'l',
           'м': 'm',
           'н': 'n',
           'о': 'o',
           'п': 'p',
           'р': 'r',
           'с': 's',
           'т': 't',
           'у': 'u',
           'ф': 'f',
           'х': 'kh',
           'ц': 'tc',
           'ч': 'ch',
           'ш': 'sh',
           'щ': 'shch',
           'ы': 'y',
           'э': 'e',
           'ю': 'iu',
           'я': 'ia',
           'ь': '',
           'ъ': ''
           }
with open('cyrillic.txt', encoding='UTF-8') as file:
    data = [i.rstrip('\n').split() for i in file]
true_data = list()
for sentence in data:
    packet = list()
    for word in sentence:
        w = ''
        for letter in word:
            if diction.get(letter) or letter == 'ь' or letter == 'Ь' or letter == 'Ъ' or letter == 'ъ':
                w += diction[letter]
            else:
                w += letter
        packet.append(w)
    true_data.append(packet)
with open('transliteration.txt', 'w', encoding='UTF-8') as new_file:
    for i in true_data:
        new_file.write(' '.join(i) + '\n')
К сожалению, программа выполняется слишком долго. Подскажите, пожалуйста, как можно оптимизировать программу, не прибегая к модулям и библиотекам.
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
24.07.2023, 16:03
Ответы с готовыми решениями:

Транслитерация
Надо превратить .csv файл на русском языке в файл на транслите, хз как это сделать

Транслитерация
Дан русский текст. Вам необходимо транслитерировать его, то есть заменить все русские буквы на английские по правилам транслитерации...

Транслитерация
Доброго всем времени суток, во время решения задачи столкнулся с проблемой некорректной работы, а определить где косяк не могу.(далее суть...

1
Эксперт PythonЭксперт Java
19530 / 11067 / 2931
Регистрация: 21.10.2017
Сообщений: 23,294
24.07.2023, 17:14
Зачем исходный текст бить на слова, складывать в лист, потом джойнить и т.д.?
Просто txt = f.read()
Далее бежишь циклом по тексту посимвольно и складываешь результаты в список. Есть значение в словаре - заменяешь. Нету - добавляешь символ как есть. Со всеми запятыми, пробелами, переносами строки и проч.
Ну и джойн/запись
2
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
24.07.2023, 17:14
Помогаю со студенческими работами здесь

Посимвольная транслитерация
Написать программу, которая находит в тексте английские буквы (a,A,B,c,C,e,E,K,M,H,o,O,p,P,T,x,X,y) и рандомно заменяет на русские...

Транслитерация
Дан русский текст. Вам необходимо транслитерировать его, то есть заменить все русские буквы на английские по правилам транслитерации...

Транслитерация
Дан русский текст. Вам необходимо транслитерировать его, то есть заменить все русские буквы на английские по правилам транслитерации...

Транслитерация в Python
Всем привет! Может кто-нибудь подсказать, как лучше всего провести в python сопоставление кириллических ФИО и транслителированных ФИО...

Транслитерация текста
diction = {'А': 'A', 'Б': 'В', 'В': 'V', 'Г': 'G', 'Д': 'D', 'Е': 'E', ...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
2
Ответ Создать тему
Новые блоги и статьи
изучаю kubernetes
lagorue 13.01.2026
А пригодятся-ли мне знания kubernetes в России?
сукцессия микоризы: основная теория в виде двух уравнений.
anaschu 11.01.2026
https:/ / rutube. ru/ video/ 7a537f578d808e67a3c6fd818a44a5c4/
WordPad для Windows 11
Jel 10.01.2026
WordPad для Windows 11 — это приложение, которое восстанавливает классический текстовый редактор WordPad в операционной системе Windows 11. После того как Microsoft исключила WordPad из. . .
Classic Notepad for Windows 11
Jel 10.01.2026
Old Classic Notepad for Windows 11 Приложение для Windows 11, позволяющее пользователям вернуть классическую версию текстового редактора «Блокнот» из Windows 10. Программа предоставляет более. . .
Почему дизайн решает?
Neotwalker 09.01.2026
В современном мире, где конкуренция за внимание потребителя достигла пика, дизайн становится мощным инструментом для успеха бренда. Это не просто красивый внешний вид продукта или сайта — это. . .
Модель микоризы: классовый агентный подход 3
anaschu 06.01.2026
aa0a7f55b50dd51c5ec569d2d10c54f6/ O1rJuneU_ls https:/ / vkvideo. ru/ video-115721503_456239114
Owen Logic: О недопустимости использования связки «аналоговый ПИД» + RegKZR
ФедосеевПавел 06.01.2026
Owen Logic: О недопустимости использования связки «аналоговый ПИД» + RegKZR ВВЕДЕНИЕ Введу сокращения: аналоговый ПИД — ПИД регулятор с управляющим выходом в виде числа в диапазоне от 0% до. . .
Модель микоризы: классовый агентный подход 2
anaschu 06.01.2026
репозиторий https:/ / github. com/ shumilovas/ fungi ветка по-частям. коммит Create переделка под биомассу. txt вход sc, но sm считается внутри мицелия. кстати, обьем тоже должен там считаться. . . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru