Форум программистов, компьютерный форум, киберфорум
Python
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.77/35: Рейтинг темы: голосов - 35, средняя оценка - 4.77
0 / 0 / 0
Регистрация: 06.01.2015
Сообщений: 40

Работа с текстом в Python

06.01.2015, 15:07. Показов 6850. Ответов 10
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Доброго времени суток. в Python я вообще не силен, как и в остальных языках. Однако задача передо мной стоит следующая:
1. Нужно удалить слова текста А из текста В (причем со всеми повторами)
2. Нужно определить сколько слов из полученного текста В совпадают со словами из текста С, D, E...

Пока моих усилий хватило только на нахождение количества слов из А в В
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
import sys
import re
 
file=open("B.txt",'r')
text=file.read()
p = re.compile("([a-zA-Z-']+)")
res=p.findall(text)
print(res)
 
file2=open('A.txt', 'r')
text2=file2.read()
p2 = re.compile("([a-zA-Z-']+)")
spisok = p2.findall(text2)
print(spisok)
 
 
i =0
count = 0
while i < len(spisok):
    a= spisok[i]
    file=open("B.txt",'r')
    text=file.read()
    if a in res:
        count +=1
    i +=1
print('Число слов из A найденных в B = ', count, 'из', len(spisok))
Буду рад получить любую помощь!
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
06.01.2015, 15:07
Ответы с готовыми решениями:

Работа с текстом python
Дана последовательность слов. Напечатать те слова последовательности, которые отличны от последнего слова и в слове нет повторяющихся букв

Работа с текстом в Python
Всем доброго времени суток. Очень нужна помощь. Дан текстовый файл txt состоящий из множества подобных строк: VB110 HY2 R = 100 T =...

python и sql работа с текстом с картинки
Здравствуйте. Мне необходимо добавить текст, который считался с картинки в базу данных. Для чтения текста с картинки использовала...

10
2742 / 2341 / 620
Регистрация: 19.03.2012
Сообщений: 8,830
06.01.2015, 16:39
Efresco,
1 задача
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
import re
 
text1 = """При этом, по словам представителя QIWI Ксении Васильевой, это не покупка в ее привычном понимании, а
размещение платежных инструментов QIWI на площадках Mail Детали сделки уже обговорены, однако широкому кругу
пользователей они пока не раскрываются, мы узнаем о них позже, в процессе интеграции процессингов."""
 
text2 = """При этом, по словам представителя QIWI Ивана Ивановича, это не покупка в ее привычном понимании, а
размещение платежных инструментов QIWI на площадках Mail Детали сделки уже обговорены, однако широкому кругу
пользователей они пока не доступны, мы узнаем о них позднее, в процессе интеграции процессингов."""
 
 
def create_set(text):
    pattern = "[,.!?]"
    pure = re.sub(pattern, '', text)
    return {i for i in pure.split(' ')}
 
set_text1 = create_set(text1)
set_text2 = create_set(text2)
 
set_text2.difference_update(set_text1)
print(set_text2)
1
0 / 0 / 0
Регистрация: 06.01.2015
Сообщений: 40
07.01.2015, 20:05  [ТС]
Спасибо большое, то что нужно, буду теперь разбираться)
0
0 / 0 / 0
Регистрация: 06.01.2015
Сообщений: 40
09.01.2015, 02:05  [ТС]
Подскажите еще пожалуйста, как открыть txt в Python, как string?
0
2742 / 2341 / 620
Регистрация: 19.03.2012
Сообщений: 8,830
09.01.2015, 02:16
Python
1
2
3
inp = open('file_name')
data = inp.read()
inp.close()
1
0 / 0 / 0
Регистрация: 06.01.2015
Сообщений: 40
15.01.2015, 16:56  [ТС]
Подскажите как добавить модуль(библиотеку) PyPdf на Windows 8

Добавлено через 5 часов 1 минуту
Устанавливать модули я понял как. Объясните, кто работал с Xpdf или PyPdf, как вытаскивать из pdf текст, пожалуйста. Или конвертировать. Я облазил уже все не могу найти ничего, что бы работало. Спасибо заранее.
0
431 / 385 / 200
Регистрация: 12.08.2011
Сообщений: 1,610
15.01.2015, 18:33
Цитата Сообщение от Efresco Посмотреть сообщение
1. Нужно удалить слова текста А из текста В (причем со всеми повторами)
Текст B при этом обязан сохранить порядок следования слов или нет? Допустим, B состоит из слов "Маша ела кашу", А - только из слова "ела". В тексте B обязательно должно быть "Маша кашу" или можно "кашу Маша"?
0
0 / 0 / 0
Регистрация: 06.01.2015
Сообщений: 40
15.01.2015, 21:35  [ТС]
Порядок не имеет значения
0
431 / 385 / 200
Регистрация: 12.08.2011
Сообщений: 1,610
15.01.2015, 22:20
Python
import re
 
def read_words_from_file_to_set(filename):
    return set(re.compile("([a-zA-Z-']+)").findall(open(filename, 'r').read()))
 
a = read_words_from_file_to_set('A.txt')
b = read_words_from_file_to_set('B.txt')
 
b.difference_update(a)
print(len(b))
1
2742 / 2341 / 620
Регистрация: 19.03.2012
Сообщений: 8,830
15.01.2015, 22:23
Vtulhu, Тоже самое, что сделал и я
0
0 / 0 / 0
Регистрация: 06.01.2015
Сообщений: 40
16.01.2015, 20:12  [ТС]
Такая ситуация:
есть набор терминов: квадратный стол, круглое кресло, площадка ... В каком виде они представлены я не знаю, хотелось бы чтоб подгружались с файла Excel, словарем например.
нужно узнать есть ли эти слова в тексте А и если есть, то посчитать сколько слов из словаря присутствуют в тексте. Например 15 из 20 слов из Словаря обнаружены в тексте А. Морфология пока не интересует, а вот чтоб словосочетания находились желательно.

Добавлено через 21 час 44 минуты
Всем спасибо за помощь и за потраченное на меня время. Все сделал!)
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
16.01.2015, 20:12
Помогаю со студенческими работами здесь

Удалить из файла с текстом слово с заданным номером
Нужно написать программу на питоне, которая будет удалять слово из файла с заданным номером. И главное чтобы это был модуль пайтон, чтобы...

Работа с текстом.
помогите написать программы. (ассемблер не знаю) 1. Подсчитать кол-во предложений из файла .txt. 2. Подсчитать кол-во слов в...

Работа с текстом
unit Unit1; interface uses Windows, Messages, SysUtils, Variants, Classes, Graphics, Controls, Forms, Dialogs, StdCtrls; ...

Работа с текстом
Здравствуйте. Допустим у меня есть переменная $row как сделать проверку его начинания с конкретной буквы.Допустим все которые начинаются...

Работа с текстом.
Здравствуйте. Помогите написать программу, которая будет заменять в веденном тексте все большие буквы на маленькие.


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
11
Ответ Создать тему
Новые блоги и статьи
Уведомление о неверно выбранном значении справочника
Maks 06.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "НарядПутевка", разработанного в конфигурации КА2. Задача: уведомлять пользователя, если в документе выбран неверный склад. . .
Установка Qt Creator для C и C++: ставим среду, CMake и MinGW без фреймворка Qt
8Observer8 05.04.2026
Среду разработки Qt Creator можно установить без фреймворка Qt. Есть отдельный репозиторий для этой среды: https:/ / github. com/ qt-creator/ qt-creator, где можно скачать установщик, на вкладке Releases:. . .
AkelPad-скрипты, структуры, и немного лирики..
testuser2 05.04.2026
Такая программа, как AkelPad существует уже давно, и также давно существуют скрипты под нее. Тем не менее, прога живет, периодически что-то не спеша дополняется, улучшается. Что меня в первую очередь. . .
Отображение реквизитов в документе по условию и контроль их заполнения
Maks 04.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "ПланированиеСпецтехники", разработанного в конфигурации КА2. Данный документ берёт данные из другого нетипового документа. . .
Фото всей Земли с борта корабля Orion миссии Artemis II
kumehtar 04.04.2026
Это первое подобное фото сделанное человеком за 50 лет. Снимок называют новым вариантом легендарной фотографии «The Blue Marble» 1972 года, сделанной с борта корабля «Аполлон-17». Новое фото. . .
Вывод диалогового окна перед закрытием, если документ не проведён
Maks 04.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "СписаниеМатериалов", разработанного в конфигурации КА2. Задача: реализовать программный контроль на предмет проведения документа. . .
Программный контроль заполнения реквизитов табличной части документа
Maks 02.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "СписаниеМатериалов", разработанного в конфигурации КА2. Задача: 1. Реализовать контроль заполнения реквизита. . .
wmic не является внутренней или внешней командой
Maks 02.04.2026
Решение: DISM / Online / Add-Capability / CapabilityName:WMIC~~~~ Отсюда: https:/ / winitpro. ru/ index. php/ 2025/ 02/ 14/ komanda-wmic-ne-naydena/
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru