С Новым годом! Форум программистов, компьютерный форум, киберфорум
Python для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
0 / 0 / 0
Регистрация: 19.04.2022
Сообщений: 4

Формирование индекса

21.04.2022, 23:12. Показов 471. Ответов 1

Студворк — интернет-сервис помощи студентам
Pascal
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
    def create_index(self):
        indexes = {}
        keywords = self.get_keyword_list()
        for kw in keywords:
            indexes[kw] = {}
        for file in self.get_file_list(self.get_dir_list()):
            file_text = open(file, 'r', encoding='utf-8')
            clean_file = re.sub(r'[^А-Яа-я0-9\n ]+', '', file_text.read())
            for i, word in enumerate(clean_file.split()):
                if word in keywords:
                    if file not in indexes[word]:
                        indexes[word][file] = []
                    indexes[word][file].append(i)
            file_text.close()
        with open('index.json', 'w', encoding='utf-8') as index_file:
            index_file.write(json.dumps(indexes, ensure_ascii=False, indent=2))
            index_file.close()
 
        messagebox.showinfo('Сообщение', 'Индекс создан')
 
    def get_index_stats(self):
        words = []
        self.index_textbox.config(state='normal')
        self.index_textbox.delete(0.0, END)
        for i in self.keywords_listbox.curselection():
            words.append(self.keywords_listbox.get(i))
        index_file = open('index.json', 'r', encoding='utf8')
        index_json = json.loads(index_file.read())
        for word in words:
            if word in index_json:
                count = 0
                self.index_textbox.insert(INSERT, '%s' % word + '\n')
                for file in index_json[word]:
                    self.index_textbox.insert(INSERT, str(file) + ': ' + str(index_json[word][file]) + '\n')
                    count += len(index_json[word][file])
                self.index_textbox.insert(INSERT, 'Кол-во найденных вхождений: %d \n' % count)
                self.index_textbox.insert(INSERT, '----------------\n\n')
        self.index_textbox.config(state='disabled')
Как сделать так, чтобы индекс формировался по соответствию первому символу (т.е., слова «дом», «Дом», «дочь» соответствуют ключевому символу «Д»).
0
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
21.04.2022, 23:12
Ответы с готовыми решениями:

Как сделать формирование индекса по первому символу слова(за исключением регистра)?
def create_index(self): indexes = {} keywords = self.get_keyword_list() for kw in keywords: ...

Формирование индекса
def create_index(self): indexes = {} keywords = self.get_keyword_list() for kw in keywords: ...

Формирование почтового индекса
Даны: исходные данные 1. натуральное число n (n<=999999) 2. вариант интерфейса - свободная навигация.Предназначен для записи введенного...

1
 Аватар для Пифагор
2172 / 1655 / 840
Регистрация: 10.01.2015
Сообщений: 5,207
22.04.2022, 10:08
del
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
22.04.2022, 10:08
Помогаю со студенческими работами здесь

Процедура: составление индекса и бинарный поиск при помощи индекса
Индексом называется таблица, содержащая отсортированные значения некоторых ключей и их местоположение в массиве записей. Индексом...

Переворот элементов массива от индекса m до индекса n
У меня есть массив заполненный числами Как можно равзерунть массив от индекса до индекса? Например есть массив {7 8 9 12 13 15 16 },...

Отличие создания индекса от монтирования индекса
Чем отличается создание индекса от монтирования индекса?

В данном линейном целочисленном массиве каждый элемент с четным индексом увеличить на значение индекса, с нечетным — уменьшить на значение индекса
В данном линейном целочисленном массиве каждый элемент с четным индексом увеличить на значение индекса, с нечетным — уменьшить на значение...

"Ключ кластерного индекса" означает корень дерева кластерного индекса или что-то иное?
Некластерный индекс на листовом уровне содержит отсортированные значения индексированного столбца и row locator – указатель на остальные...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
2
Ответ Создать тему
Новые блоги и статьи
Почему дизайн решает?
Neotwalker 09.01.2026
В современном мире, где конкуренция за внимание потребителя достигла пика, дизайн становится мощным инструментом для успеха бренда. Это не просто красивый внешний вид продукта или сайта — это. . .
Модель микоризы: классовый агентный подход 3
anaschu 06.01.2026
aa0a7f55b50dd51c5ec569d2d10c54f6/ O1rJuneU_ls https:/ / vkvideo. ru/ video-115721503_456239114
Owen Logic: О недопустимости использования связки «аналоговый ПИД» + RegKZR
ФедосеевПавел 06.01.2026
Owen Logic: О недопустимости использования связки «аналоговый ПИД» + RegKZR ВВЕДЕНИЕ Введу сокращения: аналоговый ПИД — ПИД регулятор с управляющим выходом в виде числа в диапазоне от 0% до. . .
Модель микоризы: классовый агентный подход 2
anaschu 06.01.2026
репозиторий https:/ / github. com/ shumilovas/ fungi ветка по-частям. коммит Create переделка под биомассу. txt вход sc, но sm считается внутри мицелия. кстати, обьем тоже должен там считаться. . . .
Расчёт токов в цепи постоянного тока
igorrr37 05.01.2026
/ * Дана цепь постоянного тока с сопротивлениями и напряжениями. Надо найти токи в ветвях. Программа составляет систему уравнений по 1 и 2 законам Кирхгофа и решает её. Последовательность действий:. . .
Новый CodeBlocs. Версия 25.03
palva 04.01.2026
Оказывается, недавно вышла новая версия CodeBlocks за номером 25. 03. Когда-то давно я возился с только что вышедшей тогда версией 20. 03. С тех пор я давно снёс всё с компьютера и забыл. Теперь. . .
Модель микоризы: классовый агентный подход
anaschu 02.01.2026
Раньше это было два гриба и бактерия. Теперь три гриба, растение. И на уровне агентов добавится между грибами или бактериями взаимодействий. До того я пробовал подход через многомерные массивы,. . .
Советы по крайней бережливости. Внимание, это ОЧЕНЬ длинный пост.
Programma_Boinc 28.12.2025
Советы по крайней бережливости. Внимание, это ОЧЕНЬ длинный пост. Налог на собак: https:/ / **********/ gallery/ V06K53e Финансовый отчет в Excel: https:/ / **********/ gallery/ bKBkQFf Пост отсюда. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru