Форум программистов, компьютерный форум, киберфорум
Python для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск  
 
 
Рейтинг 4.61/140: Рейтинг темы: голосов - 140, средняя оценка - 4.61
10 / 59 / 21
Регистрация: 12.03.2017
Сообщений: 514

Генерация текстов

19.02.2018, 19:16. Показов 31356. Ответов 21
Метки нет (Все метки)

Сервис Яндекс.Рефераты (https://yandex.ru/referats/) может генерировать абсолютно бессмысленные тексты, корректные с точки зрения русской грамматики. Например, такие:

Реферат по литературоведению
Тема: «Прозаический жанр в XXI веке»

Анализ состава 17 рукописных сборников, содержащих тексты стихотворных фацеций, позволяет сделать вывод о том, что размер прекрасно выбирает скрытый смысл. Парафраз фонетически иллюстрирует лирический ямб. Даже в этом коротком фрагменте видно, что речевой акт теоретически возможен. Графомания, несмотря на внешние воздействия, вразнобой аллитерирует мифопоэтический хронотоп, но языковая игра не приводит к активно-диалогическому пониманию.

Анапест, как справедливо считает И.Гальперин, традиционно редуцирует анжамбеман, несмотря на отсутствие единого пунктуационного алгоритма. Палимпсест, несмотря на то, что все эти характерологические черты отсылают не к единому образу нарратора, нивелирует символ. Мифопорождающее текстовое устройство просветляет лирический одиннадцатисложник. Диахрония, несмотря на внешние воздействия, возможна.

В данном случае можно согласиться с А.А. Земляковским и с румынским исследователем Альбертом Ковачем, считающими, что брахикаталектический стих интуитивно понятен. Размер просветляет словесный не-текст. Очевидно, что заимствование параллельно. Орнаментальный сказ, несмотря на внешние воздействия, дает эпизодический брахикаталектический стих. Диахрония осознаёт анапест.

Есть даже такой синдром — шизофазия, или речевая разорванность. Он выражается в нарушении структуры речи, при котором фразы строятся правильно, однако не несут никакой смысловой нагрузки.

Давайте попробуем написать простейшую программу, которая генерирует подобные предложения.

Возьмем какой-либо текст (большой роман или несколько малых произведений) и составим таблицу: какие слова могут следовать за тем или иным словом.

Например, в рассказах Чехова после слова «сказал» могут встретиться такие слова:
>>> d[’сказал’]
[’саша’, ’придавая’, ’ему’, ’хохоча’, ’он’, ’ниткин’, ’помоев’, ’шестикрылов’, ’гамлет’,
’он’, ’что’, ’он’, ’приказчик’, ’генерал’, ’на’, ’что’, ’все’, ’он’, ’доктор’, ’он’, ’он’, ’он’, ’все’,
’пробкин’, ’помощник’, ’ей’, ’мамаше’, ’вы’, ’пять’, ’он’, ’человек’, ’он’, ’провизор’, ’он’, ’он’, ’он’,
’этого’, ’поручик’, ’кнапс’, ’он’, ’кнапс’, ’вы’, ’ершаков’, ’он’, ’мрачно’, ’он’, ’мне’, ’надоест’, ’мне’,
’узелков’, ’узелков’, ’узелков’, ’шапкин’, ’лакей’, ’что’, ’ну’, ’он’, ’нельзя’, ’ну’, ’сын’,
’он’, ’старик’, ’вам’, ’скажи’, ’он’, ’он’, ’фон’, ’ну’, ’семечкин’, ’сладким’, ’вам’, ’николай’,
’он’, ’клочков’, ’художник’, ’медик’, ’ей’, ’медик’, ’странная’, ’он’, ’он’]


Теперь мы можем построить итерационный процесс: начинаем с какого-нибудь слова и подбираем к нему следующее случайным образом из возможных вариантов. Делаем найденное слово текущим и т.д.

Если мы не будем считать словами знаки препинания, то у нас могут получаться осмысленные предложения, и мы получим «бредогенератор».

Этот метод подробно описан в книге Брайана Кернигана и Роба Пайка «Практика программирования».

По ссылке доступна разделенная на слова и сохраненная в виде списка книга «Путешествия Гулливера» Джонатана Свифта (файл swift.py). Ее можно использовать как источник сведений о порядке слов в русских предложениях. Список называется words, и его можно импортировать из своей программы такой конструкцией:

from swift import words

Примечания

Обратите внимание, что генерируемые предложения должны быть грамматически правильными, простая последовательность слов не подойдет.
0
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
19.02.2018, 19:16
Ответы с готовыми решениями:

Генерация текстов
Сервис Яндекс.Рефераты (https://yandex.ru/referats/) может генерировать абсолютно бессмысленные тексты, корректные с точки зрения русской...

Генерация текстов
Сервис Яндекс.Рефераты (https://yandex.ru/referats/) может генерировать абсолютно бессмысленные тексты, корректные с точки зрения русской...

Дешифрование текстов, зашифрованных xor
Подскажите, пожалуйста, как решить задачу: есть несколько шифротекстов, зашифрованных одним ключом. Как расшифровать данные тексты? Xor...

21
8 / 8 / 0
Регистрация: 08.03.2020
Сообщений: 20
02.04.2020, 12:47
Цитата Сообщение от Garry Galler Посмотреть сообщение

Не по теме:


Халявщикам - да. Еще есть вопросы?
P.S. И не пости свой код во все мертвые темы.

Она не мертвая, а очень даже актуальная. Просто тут не пишет никто, но читают.
0
8 / 7 / 1
Регистрация: 27.10.2021
Сообщений: 14
17.02.2022, 20:12
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
from swift import words
from random import choice
 
 
def generate_sentences():
    global dikt, wordss
    word = choice(wordss)
    while word == '.':
        word = choice(wordss)
    sentence = word[0].upper() + word[1::].lower() + ' '
    while word != '.':
        a = word.lower()
        word = choice(dikt[a])
        if word != '.':
            sentence += word + ' '
    return sentence.strip() + '.'
 
 
def main():
    n = int(input('Сколько предложений бреда вам сгенерировать? '))
    for _ in range(n):
        print(generate_sentences())
 
 
dikt = {}
wordss = []
for i in words:
    if i not in ';,:-':
        wordss.append(i)
for i in range(len(wordss) - 1):
    if wordss[i].lower() in dikt.keys():
        dikt[wordss[i].lower()].append(wordss[i + 1].lower())
    else:
        dikt[wordss[i].lower()] = [wordss[i + 1].lower()]
 
 
main()
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
17.02.2022, 20:12

Сравнение двух текстов на схожесть по методу Шингла
Ругается в коде, не могу понять что не так сделано. Должно сравнивать 2 текста на схожесть по методу Шингла. # -*- coding: UTF-8 -*- ...

Баллирование текстов
Ребята, подскажите пожалуйста как сделать следующую задачу. Есть таблица text Ball магазин радиоуправляемый машина ...

Классификация текстов
Привет всем, подскажите пожалуйста, как и с чего начать для построения классификатора текста, то есть я я хочу разделить на два класса,...

Классификация текстов
Привет всем! Заинтересовался темой обработки текстов, а в частности классификацией/кластеризацией. В большинстве примеров решения...

Семантический анализ текстов
Есть задача: для заданной уязвимости из БДУ ФСТЭК найти соответствующие ей угрозы из этой же БДУ. Вопрос в принципе изначально стоит,...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
22
Ответ Создать тему
Новые блоги и статьи
Свет внутри себя
kumehtar 07.06.2026
Пусть это будет здесь lIs4oanZS9Y
Программа для com-порта
Uhbif79 05.06.2026
Всем привет, давно хотел изучить Qt, начинал, бросал, потом снова начинал. И сейчас вот смог написать свою первую программу. До этого имел опыт программирования микроконтроллеров, писал прошивки на. . .
Транскрипция 55-минутного видео через Whisper: WhisperDesktop облажался, спас Google Colab[
anaschu 01.06.2026
Понадобилось получить текст из свежезагруженного видео на YouTube. Казалось бы, задача на пять минут. Заняла полтора часа. Делюсь опытом — может кому пригодится последовательность решений. . . .
21 мат мед. Планы на развитие модели здравоСохранения
anaschu 01.06.2026
AnyLogic: план развития симуляционной модели рабочего коллектива — динамический абсентеизм, реальные данные, три сценария сравнения Продолжаю серию постов о дискретно-событийной модели рабочего. . .
20. Мат мед. Абсентеизм как отдельный тип простоя
anaschu 29.05.2026
Апдейт модели: исправленные баги, абсентеизм и новые механизмы Продолжаю развивать ранее описанную модель рабочего коллектива на AnyLogic. За последние несколько дней был проведён серьёзный. . .
19. здоровье, усталость и психотип работника влияют на производительность предприятия, и наоборот, производительность на здоровье, усталось и психотип
anaschu 28.05.2026
Дискретно-событийная модель рабочего коллектива на AnyLogic: здоровье, выгорание, психотипы и микростимуляция Привет, коллеги. Хочу поделиться итогами нескольких недель работы над симуляционной. . .
"Прокси" для последовательного порта
Eddy_Em 28.05.2026
Эту штуку написал я достаточно давно. Но сейчас вот понадобилось настроить датчик грозы, но при этом не отключать его от "метеодемона". Соответственно, надо запустить этот "прокси": метеодемон будет. . .
Рефакторинг программы уравнивания.
Massaraksh7 26.05.2026
Пример по предыдущей записи в блоге. Но, надо заметить, что, во-первых, там оптимизация не только математики, но и работы с базой данных, и с графами, а во-вторых, это ещё не всё.
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru