понедельник, 31 января 2011 г.

lxml vs BeautifulSoup

Задача была разобрать произвольную веб-страницу на текст и ссылки.
Снчала для разбора html использовал lxml.html: