неділю, 29 листопада 2009 р.

Задача №9 Лабораторна робота №4

Модифікувати програму генерації випадкового тексту для виконання наступного: тренування програми на текстах двох різних жанрів та генерації тексту об’єднаного жанру.

Задачу 9 приблизно виконуєте наступним чином:
bigrams = nltk.bigrams(text)
text-тексту жанру1
nltk.ConditionalFreqDist(bigrams)
generate_model(cfd, 'слово за вашим бажанням')
text-тексту жанру2
nltk.ConditionalFreqDist(bigrams)
generate_model(cfd, 'те саме слово ')
text-тексту жанр1+жанр2
nltk.ConditionalFreqDist(bigrams)
generate_model(cfd, 'те саме слово ')

ті три стрічки які згенерувались порівнюєте, яка скоріше зациклилась, де текст більш
інтеректуальний.....

1 коментар:

  1. Задачі 8-9.
    Програма генерації тексту працює на основі даних, які отримуємо після обробки (побудова
    умовного частотного розподілу) біграмів. Ця обробка і є це "тренування"
    задача 8
    bigrams = nltk.bigrams(text1)
    text1-тексту жанру1(text1=nltk.corpus.brown.words(categories="vvvkk"))
    cfd=nltk.ConditionalFreqDist(bigrams)
    generate_model(cfd, 'слово1 за вашим бажанням')
    generate_model(cfd, 'слово2 за вашим бажанням')
    generate_model(cfd, 'слово3 за вашим бажанням')
    generate_model(cfd, 'слово4 за вашим бажанням')
    generate_model(cfd, 'слово5 за вашим бажанням')
    bigrams = nltk.bigrams(text2)
    text2-тексту жанру2(text2=nltk.corpus.brown.words(categories="asdek"))
    cfd=nltk.ConditionalFreqDist(bigrams)
    generate_model(cfd, 'те саме слово1 ')
    generate_model(cfd, 'те саме слово2 ')
    generate_model(cfd, 'те саме слово3 ')
    generate_model(cfd, 'те саме слово4 ')
    generate_model(cfd, 'те саме слово5 ')

    і стрічки (5+5) які згенерувались порівнюєте, яка скоріше зациклилась,
    де текст більш інтеректуальний.....

    Задачу 9 приблизно виконуєте наступним чином:
    bigrams = nltk.bigrams(text1)
    text1-тексту жанру1(text1=nltk.corpus.brown.words(categories="vvvkk"))
    cfd=nltk.ConditionalFreqDist(bigrams)
    generate_model(cfd, 'слово за вашим бажанням')

    bigrams = nltk.bigrams(text2)
    text2-тексту жанру2(text2=nltk.corpus.brown.words(categories="asdek"))
    cfd=nltk.ConditionalFreqDist(bigrams)
    generate_model(cfd, 'те саме слово ')

    bigrams = nltk.bigrams(text2+text1)
    text-тексту жанр1+жанр2
    cfd=nltk.ConditionalFreqDist(bigrams)
    generate_model(cfd, 'те саме слово ')
    ті три стрічки які згенерувались порівнюєте, яка скоріше зациклилась,
    де текст більш інтеректуальний.....

    ВідповістиВидалити