неділю, 13 листопада 2011 р.

Відповідь на лист стосовно 19го завдання 9ї лабораторної"Згадайте про n-грами"

Лист
Доброго вечора)
Маю до Вас запитання стосовно 19го завдання 9ї лабораторної.
Напишіть програми для знаходження слів та словосполучень згідно відповідних їм тегів для відповіді на наступне питання:
які послідовності слів маркуються як IN + DET + NN.

Чи можна це записати як:
brown_tagged=nltk.corpus.brown.tagged_words()
def findwords(text):
        s=nltk.defaultdict(list)
        for i in text:
                s[i[0]]+=[i[1]]
                a=[]
        for i in s.items():
                if 'IN' in i[1]:
                        a+=[i[0]]
        return a [:50]
findwords(brown_tagged)
Чи ось так:
cfd=nltk.ConditionalFreqDist((tag,word) for (word,tag) in
brown_tagged)
cfd['IN'].keys()
Або так:
brown_tagged=nltk.corpus.brown.tagged_words()
cfd=nltk.ConditionalFreqDist(brown_tagged)
[w for w in cfd.conditions() if 'IN' in cfd[w]]
Порадьте щось будь ласка)) Буду вдячна!!!




Відповідь у темі....
help(nltk.trigrams)
help(nltk.ngrams)
Також сподіваюсь Ви читали 10 сторінку методичних вказівок
for (w1,t1), (w2,t2), (w3,t3) in nltk.trigrams(sentence):

Немає коментарів:

Дописати коментар