urllib.urlopen('http://www.nltk.org/').read(), який заданий в умові першого завдання
лабораторної роботи №5 не працює і видає таку помилку:
raw_contents = urllib.urlopen('http://www.nltk.org/').read()
File "
raw_contents = urllib.urlopen('http://www.nltk.org/').read()
NameError: name 'urllib' is not defined
хоча такого не повинно би було бути,бо цей вираз заміняє вираз:
from urllib import urlopen
url = "http://www.gutenberg.org/files/2554/2554.txt";
raw = urlopen(url).read()
url = "http://www.gutenberg.org/files/2554/2554.txt";
raw = urlopen(url).read()
def net(url):
tokens=nltk.word_tokenize(raw)
return tokens
Допоможіть,будьласка.
і ще, якщо можна підскажіть з 12тим завданням тієї ж 5лабораторної роботи!!! Щиро
вдячна!!!
1) !!!import urllib!!!
ВідповістиВидалити2) Фантастично проста задача
-дивимось методичні вказівки до лаб.роб.№3 третя сторінка внизу.
-беремо частину (category) lore та частину learned корпуса Brown
-для кожної з частин визначаємо int(num_chars/num_words), int(num_words/num_sents)
-для кожної з частин визначаємо ARI за формулою із завдання
все!!!
А воно і в мене так не працює. Треба писати без urllib:
ВідповістиВидалитиraw_contents =
urlopen('назва сайту').read()
Дивно
ВідповістиВидалити>>> raw_contents =urllib.urlopen('http://www.nltk.org/').read()
Traceback (most recent call last):
File "", line 1, in
raw_contents =urllib.urlopen('http://www.nltk.org/').read()
NameError: name 'urllib' is not defined
>>> import urllib
>>> raw_contents =urllib.urlopen('http://www.nltk.org/').read()
>>> raw_contents[:10]
'>>