Форум программистов, компьютерный форум, киберфорум
Python для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
0 / 0 / 0
Регистрация: 19.04.2022
Сообщений: 4

Формирование индекса

21.04.2022, 23:12. Показов 498. Ответов 1

Студворк — интернет-сервис помощи студентам
Pascal
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
    def create_index(self):
        indexes = {}
        keywords = self.get_keyword_list()
        for kw in keywords:
            indexes[kw] = {}
        for file in self.get_file_list(self.get_dir_list()):
            file_text = open(file, 'r', encoding='utf-8')
            clean_file = re.sub(r'[^А-Яа-я0-9\n ]+', '', file_text.read())
            for i, word in enumerate(clean_file.split()):
                if word in keywords:
                    if file not in indexes[word]:
                        indexes[word][file] = []
                    indexes[word][file].append(i)
            file_text.close()
        with open('index.json', 'w', encoding='utf-8') as index_file:
            index_file.write(json.dumps(indexes, ensure_ascii=False, indent=2))
            index_file.close()
 
        messagebox.showinfo('Сообщение', 'Индекс создан')
 
    def get_index_stats(self):
        words = []
        self.index_textbox.config(state='normal')
        self.index_textbox.delete(0.0, END)
        for i in self.keywords_listbox.curselection():
            words.append(self.keywords_listbox.get(i))
        index_file = open('index.json', 'r', encoding='utf8')
        index_json = json.loads(index_file.read())
        for word in words:
            if word in index_json:
                count = 0
                self.index_textbox.insert(INSERT, '%s' % word + '\n')
                for file in index_json[word]:
                    self.index_textbox.insert(INSERT, str(file) + ': ' + str(index_json[word][file]) + '\n')
                    count += len(index_json[word][file])
                self.index_textbox.insert(INSERT, 'Кол-во найденных вхождений: %d \n' % count)
                self.index_textbox.insert(INSERT, '----------------\n\n')
        self.index_textbox.config(state='disabled')
Как сделать так, чтобы индекс формировался по соответствию первому символу (т.е., слова «дом», «Дом», «дочь» соответствуют ключевому символу «Д»).
0
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
21.04.2022, 23:12
Ответы с готовыми решениями:

Как сделать формирование индекса по первому символу слова(за исключением регистра)?
def create_index(self): indexes = {} keywords = self.get_keyword_list() for kw in keywords: ...

Формирование индекса
def create_index(self): indexes = {} keywords = self.get_keyword_list() for kw in keywords: ...

Формирование почтового индекса
Даны: исходные данные 1. натуральное число n (n<=999999) 2. вариант интерфейса - свободная навигация.Предназначен для записи введенного...

1
 Аватар для Пифагор
2172 / 1655 / 840
Регистрация: 10.01.2015
Сообщений: 5,207
22.04.2022, 10:08
del
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
22.04.2022, 10:08
Помогаю со студенческими работами здесь

Процедура: составление индекса и бинарный поиск при помощи индекса
Индексом называется таблица, содержащая отсортированные значения некоторых ключей и их местоположение в массиве записей. Индексом...

Переворот элементов массива от индекса m до индекса n
У меня есть массив заполненный числами Как можно равзерунть массив от индекса до индекса? Например есть массив {7 8 9 12 13 15 16 },...

Отличие создания индекса от монтирования индекса
Чем отличается создание индекса от монтирования индекса?

В данном линейном целочисленном массиве каждый элемент с четным индексом увеличить на значение индекса, с нечетным — уменьшить на значение индекса
В данном линейном целочисленном массиве каждый элемент с четным индексом увеличить на значение индекса, с нечетным — уменьшить на значение...

"Ключ кластерного индекса" означает корень дерева кластерного индекса или что-то иное?
Некластерный индекс на листовом уровне содержит отсортированные значения индексированного столбца и row locator – указатель на остальные...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
2
Ответ Создать тему
Новые блоги и статьи
Знаешь почему 90% людей редко бывают счастливыми?
kumehtar 14.04.2026
Потому что они ждут. Ждут выходных, ждут отпуска, ждут удачного момента. . . а удачный момент так и не приходит.
Фиксация колонок в отчете СКД
Maks 14.04.2026
Фиксация колонок в СКД отчета типа Таблица. Задача: зафиксировать три левых колонки в отчете. Процедура ПриКомпоновкеРезультата(ДокументРезультат, ДанныеРасшифровки, СтандартнаяОбработка) / / . . .
Настройки VS Code
Loafer 13.04.2026
{ "cmake. configureOnOpen": false, "diffEditor. ignoreTrimWhitespace": true, "editor. guides. bracketPairs": "active", "extensions. ignoreRecommendations": true, . . .
Оптимизация кода на разграничение прав доступа к элементам формы
Maks 13.04.2026
Алгоритм из решения ниже реализован на нетиповом документе, разработанного в конфигурации КА2. Задачи, как таковой, поставлено не было, проделанное ниже исключительно моя инициатива. Было так:. . .
Контроль заполнения и очистка дат в зависимости от значения перечислений
Maks 12.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "ПланированиеПерсонала", разработанного в конфигурации КА2. Задача: реализовать контроль корректности заполнения дат назначения. . .
Архитектура слоя интернета для сервера-слоя.
Hrethgir 11.04.2026
В продолжение https:/ / www. cyberforum. ru/ blogs/ 223907/ 10860. html Знаешь что я подумал? Раз мы все источники пишем в голове ветки, то ничего не мешает добавить в голову такой источник, который сам. . .
Подстановка значения реквизита справочника в табличную часть документа
Maks 10.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "ПланированиеПерсонала", разработанного в конфигурации КА2. Задача: при выборе сотрудника (справочник Сотрудники) в ТЧ документа. . .
Очистка реквизитов документа при копировании
Maks 09.04.2026
Алгоритм из решения ниже применим как для типовых, так и для нетиповых документов на самых различных конфигурациях. Задача: при копировании документа очищать определенные реквизиты и табличную. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru