信息抓取是将非结构化的信息从网站中抓取出来保存到结构化的数据库中的过程。
本文还详细探讨了信息抓取模块中负责访问网络部分的效率分析,采用DNS预转换的方式加速网络爬虫的访问速度。
The efficiency of the information fetch component access the network is discussed, the KM takes DNS pre-convert method to accelerate the speed of access the internet.
汉堡法庭在2009年5月做出决定认为,用屏幕抓取技术倒卖瑞安航空公司的机票是非法的。 紧接着瑞安航空继续向爱尔兰法庭控告这些用屏幕信息抓取技术以倒卖机票的网站。
Following the May 2009 decision of the Hamburg courts that screenscraping to resell Ryanair’s flights is unlawful, Ryanair continues to pursue screenscraper websites in the courts in Ireland.
但抓取网页然后提供利用网页信息的服务,并且没有说明出处,可能就是非法的了。
But scraping of the page and then offering a service that leverages the information without crediting the original source, is unlikely to be legal.
应用推荐