Комп'ютерна лінгвістика: Задача №9 Лабораторна робота №4

неділя, 29 листопада 2009 р.

Задача №9 Лабораторна робота №4

Модифікувати програму генерації випадкового тексту для виконання наступного: тренування програми на текстах двох різних жанрів та генерації тексту об’єднаного жанру.

Задачу 9 приблизно виконуєте наступним чином:
bigrams = nltk.bigrams(text)
text-тексту жанру1
nltk.ConditionalFreqDist(bigrams)
generate_model(cfd, 'слово за вашим бажанням')
text-тексту жанру2
nltk.ConditionalFreqDist(bigrams)
generate_model(cfd, 'те саме слово ')
text-тексту жанр1+жанр2
nltk.ConditionalFreqDist(bigrams)
generate_model(cfd, 'те саме слово ')

ті три стрічки які згенерувались порівнюєте, яка скоріше зациклилась, де текст більш
інтеректуальний.....

1 коментар:

Андрій Романюк29 листопада 2009 р. о 02:51
Задачі 8-9.
Програма генерації тексту працює на основі даних, які отримуємо після обробки (побудова
умовного частотного розподілу) біграмів. Ця обробка і є це "тренування"
задача 8
bigrams = nltk.bigrams(text1)
text1-тексту жанру1(text1=nltk.corpus.brown.words(categories="vvvkk"))
cfd=nltk.ConditionalFreqDist(bigrams)
generate_model(cfd, 'слово1 за вашим бажанням')
generate_model(cfd, 'слово2 за вашим бажанням')
generate_model(cfd, 'слово3 за вашим бажанням')
generate_model(cfd, 'слово4 за вашим бажанням')
generate_model(cfd, 'слово5 за вашим бажанням')
bigrams = nltk.bigrams(text2)
text2-тексту жанру2(text2=nltk.corpus.brown.words(categories="asdek"))
cfd=nltk.ConditionalFreqDist(bigrams)
generate_model(cfd, 'те саме слово1 ')
generate_model(cfd, 'те саме слово2 ')
generate_model(cfd, 'те саме слово3 ')
generate_model(cfd, 'те саме слово4 ')
generate_model(cfd, 'те саме слово5 ')

і стрічки (5+5) які згенерувались порівнюєте, яка скоріше зациклилась,
де текст більш інтеректуальний.....

Задачу 9 приблизно виконуєте наступним чином:
bigrams = nltk.bigrams(text1)
text1-тексту жанру1(text1=nltk.corpus.brown.words(categories="vvvkk"))
cfd=nltk.ConditionalFreqDist(bigrams)
generate_model(cfd, 'слово за вашим бажанням')

bigrams = nltk.bigrams(text2)
text2-тексту жанру2(text2=nltk.corpus.brown.words(categories="asdek"))
cfd=nltk.ConditionalFreqDist(bigrams)
generate_model(cfd, 'те саме слово ')

bigrams = nltk.bigrams(text2+text1)
text-тексту жанр1+жанр2
cfd=nltk.ConditionalFreqDist(bigrams)
generate_model(cfd, 'те саме слово ')
ті три стрічки які згенерувались порівнюєте, яка скоріше зациклилась,
де текст більш інтеректуальний.....
ВідповістиВидалити
Відповіді

Додати коментар

неділя, 29 листопада 2009 р.

Задача №9 Лабораторна робота №4

1 коментар:

неділя, 29 листопада 2009 р.