неділю, 29 листопада 2009 р.

Лабораторна робота №5

добрий вечір!!!! поясніть будь ласка,чому вираз raw_contents =
urllib.urlopen('http://www.nltk.org/').read(), який заданий в умові першого завдання
лабораторної роботи №5 не працює і видає таку помилку:
raw_contents = urllib.urlopen('http://www.nltk.org/').read()
Traceback (most recent call last):
File "", line 1, in
raw_contents = urllib.urlopen('http://www.nltk.org/').read()
NameError: name 'urllib' is not defined
хоча такого не повинно би було бути,бо цей вираз заміняє вираз:
from urllib import urlopen
url = "http://www.gutenberg.org/files/2554/2554.txt";
raw = urlopen(url).read()
моя функція для цієї задачі така:
def net(url):
raw_contents=urllib.urlopen(url).read() raw=nltk.clean_html(raw_contents)
tokens=nltk.word_tokenize(raw)
return tokens
Допоможіть,будьласка.
і ще, якщо можна підскажіть з 12тим завданням тієї ж 5лабораторної роботи!!! Щиро
вдячна!!!

3 коментарі:

  1. 1) !!!import urllib!!!
    2) Фантастично проста задача
    -дивимось методичні вказівки до лаб.роб.№3 третя сторінка внизу.
    -беремо частину (category) lore та частину learned корпуса Brown
    -для кожної з частин визначаємо int(num_chars/num_words), int(num_words/num_sents)
    -для кожної з частин визначаємо ARI за формулою із завдання
    все!!!

    ВідповістиВидалити
  2. А воно і в мене так не працює. Треба писати без urllib:
    raw_contents =
    urlopen('назва сайту').read()

    ВідповістиВидалити
  3. Дивно
    >>> raw_contents =urllib.urlopen('http://www.nltk.org/').read()

    Traceback (most recent call last):
    File "", line 1, in
    raw_contents =urllib.urlopen('http://www.nltk.org/').read()
    NameError: name 'urllib' is not defined
    >>> import urllib
    >>> raw_contents =urllib.urlopen('http://www.nltk.org/').read()
    >>> raw_contents[:10]
    '>>

    ВідповістиВидалити