...),下载某个页面P后,页面p的cash均分到包含的每个链接上,最终根据链接cash大小排序下载。大站优先策略(larger sites first):优先下载等待下载页面最多的网站。2.4 网页更新策略 目的:决定何时更新已下载的网页,使得本地数据与互联网原始页面内容一致。
基于254个网页-相关网页
... 向量空间模型(Vector Space Model) 大站优先战略(Larger Sites First) 数据区分算法(Partitioning Algorithm) ...
基于40个网页-相关网页