Модифікувати програму генерації випадкового тексту для виконання наступного: тренування програми на текстах двох різних жанрів та генерації тексту об’єднаного жанру.
Задачу 9 приблизно виконуєте наступним чином:
bigrams = nltk.bigrams(text)
text-тексту жанру1
nltk.ConditionalFreqDist(bigrams)
generate_model(cfd, 'слово за вашим бажанням')
text-тексту жанру2
nltk.ConditionalFreqDist(bigrams)
generate_model(cfd, 'те саме слово ')
text-тексту жанр1+жанр2
nltk.ConditionalFreqDist(bigrams)
generate_model(cfd, 'те саме слово ')
ті три стрічки які згенерувались порівнюєте, яка скоріше зациклилась, де текст більш
інтеректуальний.....
Задачі 8-9.
ВідповістиВидалитиПрограма генерації тексту працює на основі даних, які отримуємо після обробки (побудова
умовного частотного розподілу) біграмів. Ця обробка і є це "тренування"
задача 8
bigrams = nltk.bigrams(text1)
text1-тексту жанру1(text1=nltk.corpus.brown.words(categories="vvvkk"))
cfd=nltk.ConditionalFreqDist(bigrams)
generate_model(cfd, 'слово1 за вашим бажанням')
generate_model(cfd, 'слово2 за вашим бажанням')
generate_model(cfd, 'слово3 за вашим бажанням')
generate_model(cfd, 'слово4 за вашим бажанням')
generate_model(cfd, 'слово5 за вашим бажанням')
bigrams = nltk.bigrams(text2)
text2-тексту жанру2(text2=nltk.corpus.brown.words(categories="asdek"))
cfd=nltk.ConditionalFreqDist(bigrams)
generate_model(cfd, 'те саме слово1 ')
generate_model(cfd, 'те саме слово2 ')
generate_model(cfd, 'те саме слово3 ')
generate_model(cfd, 'те саме слово4 ')
generate_model(cfd, 'те саме слово5 ')
і стрічки (5+5) які згенерувались порівнюєте, яка скоріше зациклилась,
де текст більш інтеректуальний.....
Задачу 9 приблизно виконуєте наступним чином:
bigrams = nltk.bigrams(text1)
text1-тексту жанру1(text1=nltk.corpus.brown.words(categories="vvvkk"))
cfd=nltk.ConditionalFreqDist(bigrams)
generate_model(cfd, 'слово за вашим бажанням')
bigrams = nltk.bigrams(text2)
text2-тексту жанру2(text2=nltk.corpus.brown.words(categories="asdek"))
cfd=nltk.ConditionalFreqDist(bigrams)
generate_model(cfd, 'те саме слово ')
bigrams = nltk.bigrams(text2+text1)
text-тексту жанр1+жанр2
cfd=nltk.ConditionalFreqDist(bigrams)
generate_model(cfd, 'те саме слово ')
ті три стрічки які згенерувались порівнюєте, яка скоріше зациклилась,
де текст більш інтеректуальний.....