|
0 / 0 / 0
Регистрация: 06.01.2015
Сообщений: 40
|
||||||
Работа с текстом в Python06.01.2015, 15:07. Показов 6827. Ответов 10
Метки нет (Все метки)
Доброго времени суток. в Python я вообще не силен, как и в остальных языках. Однако задача передо мной стоит следующая:
1. Нужно удалить слова текста А из текста В (причем со всеми повторами) 2. Нужно определить сколько слов из полученного текста В совпадают со словами из текста С, D, E... Пока моих усилий хватило только на нахождение количества слов из А в В
0
|
||||||
| 06.01.2015, 15:07 | |
|
Ответы с готовыми решениями:
10
python и sql работа с текстом с картинки |
|
2742 / 2341 / 620
Регистрация: 19.03.2012
Сообщений: 8,830
|
||||||
| 06.01.2015, 16:39 | ||||||
|
Efresco,
1 задача
1
|
||||||
|
0 / 0 / 0
Регистрация: 06.01.2015
Сообщений: 40
|
|
| 07.01.2015, 20:05 [ТС] | |
|
Спасибо большое, то что нужно, буду теперь разбираться)
0
|
|
|
0 / 0 / 0
Регистрация: 06.01.2015
Сообщений: 40
|
|
| 09.01.2015, 02:05 [ТС] | |
|
Подскажите еще пожалуйста, как открыть txt в Python, как string?
0
|
|
|
2742 / 2341 / 620
Регистрация: 19.03.2012
Сообщений: 8,830
|
||||||
| 09.01.2015, 02:16 | ||||||
1
|
||||||
|
0 / 0 / 0
Регистрация: 06.01.2015
Сообщений: 40
|
|
| 15.01.2015, 16:56 [ТС] | |
|
Подскажите как добавить модуль(библиотеку) PyPdf на Windows 8
Добавлено через 5 часов 1 минуту Устанавливать модули я понял как. Объясните, кто работал с Xpdf или PyPdf, как вытаскивать из pdf текст, пожалуйста. Или конвертировать. Я облазил уже все не могу найти ничего, что бы работало. Спасибо заранее.
0
|
|
|
431 / 385 / 200
Регистрация: 12.08.2011
Сообщений: 1,610
|
||
| 15.01.2015, 18:33 | ||
|
0
|
||
|
0 / 0 / 0
Регистрация: 06.01.2015
Сообщений: 40
|
|
| 15.01.2015, 21:35 [ТС] | |
|
Порядок не имеет значения
0
|
|
|
431 / 385 / 200
Регистрация: 12.08.2011
Сообщений: 1,610
|
|
| 15.01.2015, 22:20 | |
|
Python import re def read_words_from_file_to_set(filename): return set(re.compile("([a-zA-Z-']+)").findall(open(filename, 'r').read())) a = read_words_from_file_to_set('A.txt') b = read_words_from_file_to_set('B.txt') b.difference_update(a) print(len(b))
1
|
|
|
2742 / 2341 / 620
Регистрация: 19.03.2012
Сообщений: 8,830
|
|
| 15.01.2015, 22:23 | |
|
Vtulhu, Тоже самое, что сделал и я
0
|
|
|
0 / 0 / 0
Регистрация: 06.01.2015
Сообщений: 40
|
|
| 16.01.2015, 20:12 [ТС] | |
|
Такая ситуация:
есть набор терминов: квадратный стол, круглое кресло, площадка ... В каком виде они представлены я не знаю, хотелось бы чтоб подгружались с файла Excel, словарем например. нужно узнать есть ли эти слова в тексте А и если есть, то посчитать сколько слов из словаря присутствуют в тексте. Например 15 из 20 слов из Словаря обнаружены в тексте А. Морфология пока не интересует, а вот чтоб словосочетания находились желательно. Добавлено через 21 час 44 минуты Всем спасибо за помощь и за потраченное на меня время. Все сделал!)
0
|
|
| 16.01.2015, 20:12 | |
|
Помогаю со студенческими работами здесь
11
Удалить из файла с текстом слово с заданным номером Работа с текстом. Работа с текстом
Работа с текстом. Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
||||
|
Советы по крайней бережливости. Внимание, это ОЧЕНЬ длинный пост.
Programma_Boinc 28.12.2025
Советы по крайней бережливости. Внимание, это ОЧЕНЬ длинный пост.
Налог на собак: https:/ / **********/ gallery/ V06K53e
Финансовый отчет в Excel: https:/ / **********/ gallery/ bKBkQFf
Пост отсюда. . .
|
Кто-нибудь знает, где можно бесплатно получить настольный компьютер или ноутбук? США.
Programma_Boinc 26.12.2025
Нашел на реддите интересную статью под названием Anyone know where to get a free Desktop or Laptop?
Ниже её машинный перевод.
После долгих разбирательств я наконец-то вернула себе. . .
|
Thinkpad X220 Tablet — это лучший бюджетный ноутбук для учёбы, точка.
Programma_Boinc 23.12.2025
Рецензия / Мнение/ Перевод
Нашел на реддите интересную статью под названием The Thinkpad X220 Tablet is the best budget school laptop period . Ниже её машинный перевод.
Thinkpad X220 Tablet —. . .
|
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта
Симптом:
После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
|
Как объединить две одинаковые БД Access с разными данными
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
|
|
Новый ноутбук
volvo 07.12.2025
Всем привет.
По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне:
Ryzen 5 7533HS
64 Gb DDR5
1Tb NVMe
16" Full HD Display
Win11 Pro
|
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
|
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
|
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов
На странице:
https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/
нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
|
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов.
. . .
|