Форум программистов, компьютерный форум, киберфорум
Python
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.77/35: Рейтинг темы: голосов - 35, средняя оценка - 4.77
0 / 0 / 0
Регистрация: 06.01.2015
Сообщений: 40

Работа с текстом в Python

06.01.2015, 15:07. Показов 6827. Ответов 10
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Доброго времени суток. в Python я вообще не силен, как и в остальных языках. Однако задача передо мной стоит следующая:
1. Нужно удалить слова текста А из текста В (причем со всеми повторами)
2. Нужно определить сколько слов из полученного текста В совпадают со словами из текста С, D, E...

Пока моих усилий хватило только на нахождение количества слов из А в В
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
import sys
import re
 
file=open("B.txt",'r')
text=file.read()
p = re.compile("([a-zA-Z-']+)")
res=p.findall(text)
print(res)
 
file2=open('A.txt', 'r')
text2=file2.read()
p2 = re.compile("([a-zA-Z-']+)")
spisok = p2.findall(text2)
print(spisok)
 
 
i =0
count = 0
while i < len(spisok):
    a= spisok[i]
    file=open("B.txt",'r')
    text=file.read()
    if a in res:
        count +=1
    i +=1
print('Число слов из A найденных в B = ', count, 'из', len(spisok))
Буду рад получить любую помощь!
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
06.01.2015, 15:07
Ответы с готовыми решениями:

Работа с текстом python
Дана последовательность слов. Напечатать те слова последовательности, которые отличны от последнего слова и в слове нет повторяющихся букв

Работа с текстом в Python
Всем доброго времени суток. Очень нужна помощь. Дан текстовый файл txt состоящий из множества подобных строк: VB110 HY2 R = 100 T =...

python и sql работа с текстом с картинки
Здравствуйте. Мне необходимо добавить текст, который считался с картинки в базу данных. Для чтения текста с картинки использовала...

10
2742 / 2341 / 620
Регистрация: 19.03.2012
Сообщений: 8,830
06.01.2015, 16:39
Efresco,
1 задача
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
import re
 
text1 = """При этом, по словам представителя QIWI Ксении Васильевой, это не покупка в ее привычном понимании, а
размещение платежных инструментов QIWI на площадках Mail Детали сделки уже обговорены, однако широкому кругу
пользователей они пока не раскрываются, мы узнаем о них позже, в процессе интеграции процессингов."""
 
text2 = """При этом, по словам представителя QIWI Ивана Ивановича, это не покупка в ее привычном понимании, а
размещение платежных инструментов QIWI на площадках Mail Детали сделки уже обговорены, однако широкому кругу
пользователей они пока не доступны, мы узнаем о них позднее, в процессе интеграции процессингов."""
 
 
def create_set(text):
    pattern = "[,.!?]"
    pure = re.sub(pattern, '', text)
    return {i for i in pure.split(' ')}
 
set_text1 = create_set(text1)
set_text2 = create_set(text2)
 
set_text2.difference_update(set_text1)
print(set_text2)
1
0 / 0 / 0
Регистрация: 06.01.2015
Сообщений: 40
07.01.2015, 20:05  [ТС]
Спасибо большое, то что нужно, буду теперь разбираться)
0
0 / 0 / 0
Регистрация: 06.01.2015
Сообщений: 40
09.01.2015, 02:05  [ТС]
Подскажите еще пожалуйста, как открыть txt в Python, как string?
0
2742 / 2341 / 620
Регистрация: 19.03.2012
Сообщений: 8,830
09.01.2015, 02:16
Python
1
2
3
inp = open('file_name')
data = inp.read()
inp.close()
1
0 / 0 / 0
Регистрация: 06.01.2015
Сообщений: 40
15.01.2015, 16:56  [ТС]
Подскажите как добавить модуль(библиотеку) PyPdf на Windows 8

Добавлено через 5 часов 1 минуту
Устанавливать модули я понял как. Объясните, кто работал с Xpdf или PyPdf, как вытаскивать из pdf текст, пожалуйста. Или конвертировать. Я облазил уже все не могу найти ничего, что бы работало. Спасибо заранее.
0
431 / 385 / 200
Регистрация: 12.08.2011
Сообщений: 1,610
15.01.2015, 18:33
Цитата Сообщение от Efresco Посмотреть сообщение
1. Нужно удалить слова текста А из текста В (причем со всеми повторами)
Текст B при этом обязан сохранить порядок следования слов или нет? Допустим, B состоит из слов "Маша ела кашу", А - только из слова "ела". В тексте B обязательно должно быть "Маша кашу" или можно "кашу Маша"?
0
0 / 0 / 0
Регистрация: 06.01.2015
Сообщений: 40
15.01.2015, 21:35  [ТС]
Порядок не имеет значения
0
431 / 385 / 200
Регистрация: 12.08.2011
Сообщений: 1,610
15.01.2015, 22:20
Python
import re
 
def read_words_from_file_to_set(filename):
    return set(re.compile("([a-zA-Z-']+)").findall(open(filename, 'r').read()))
 
a = read_words_from_file_to_set('A.txt')
b = read_words_from_file_to_set('B.txt')
 
b.difference_update(a)
print(len(b))
1
2742 / 2341 / 620
Регистрация: 19.03.2012
Сообщений: 8,830
15.01.2015, 22:23
Vtulhu, Тоже самое, что сделал и я
0
0 / 0 / 0
Регистрация: 06.01.2015
Сообщений: 40
16.01.2015, 20:12  [ТС]
Такая ситуация:
есть набор терминов: квадратный стол, круглое кресло, площадка ... В каком виде они представлены я не знаю, хотелось бы чтоб подгружались с файла Excel, словарем например.
нужно узнать есть ли эти слова в тексте А и если есть, то посчитать сколько слов из словаря присутствуют в тексте. Например 15 из 20 слов из Словаря обнаружены в тексте А. Морфология пока не интересует, а вот чтоб словосочетания находились желательно.

Добавлено через 21 час 44 минуты
Всем спасибо за помощь и за потраченное на меня время. Все сделал!)
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
16.01.2015, 20:12
Помогаю со студенческими работами здесь

Удалить из файла с текстом слово с заданным номером
Нужно написать программу на питоне, которая будет удалять слово из файла с заданным номером. И главное чтобы это был модуль пайтон, чтобы...

Работа с текстом.
помогите написать программы. (ассемблер не знаю) 1. Подсчитать кол-во предложений из файла .txt. 2. Подсчитать кол-во слов в...

Работа с текстом
unit Unit1; interface uses Windows, Messages, SysUtils, Variants, Classes, Graphics, Controls, Forms, Dialogs, StdCtrls; ...

Работа с текстом
Здравствуйте. Допустим у меня есть переменная $row как сделать проверку его начинания с конкретной буквы.Допустим все которые начинаются...

Работа с текстом.
Здравствуйте. Помогите написать программу, которая будет заменять в веденном тексте все большие буквы на маленькие.


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
11
Ответ Создать тему
Новые блоги и статьи
Советы по крайней бережливости. Внимание, это ОЧЕНЬ длинный пост.
Programma_Boinc 28.12.2025
Советы по крайней бережливости. Внимание, это ОЧЕНЬ длинный пост. Налог на собак: https:/ / **********/ gallery/ V06K53e Финансовый отчет в Excel: https:/ / **********/ gallery/ bKBkQFf Пост отсюда. . .
Кто-нибудь знает, где можно бесплатно получить настольный компьютер или ноутбук? США.
Programma_Boinc 26.12.2025
Нашел на реддите интересную статью под названием Anyone know where to get a free Desktop or Laptop? Ниже её машинный перевод. После долгих разбирательств я наконец-то вернула себе. . .
Thinkpad X220 Tablet — это лучший бюджетный ноутбук для учёбы, точка.
Programma_Boinc 23.12.2025
Рецензия / Мнение/ Перевод Нашел на реддите интересную статью под названием The Thinkpad X220 Tablet is the best budget school laptop period . Ниже её машинный перевод. Thinkpad X220 Tablet —. . .
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта Симптом: После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
Как объединить две одинаковые БД Access с разными данными
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
Новый ноутбук
volvo 07.12.2025
Всем привет. По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне: Ryzen 5 7533HS 64 Gb DDR5 1Tb NVMe 16" Full HD Display Win11 Pro
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов На странице: https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/ нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином. Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов. . . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2025, CyberForum.ru