-
基于Java的大型分布式网络爬虫体系结构
分布式网络爬虫包含多个爬虫,每个爬虫需要完成的任务和单个的爬行器类似,它们从互联网上下载网页,并把网页保存在本地的磁盘,从中抽取URL并沿着这些URL的指向继续爬行。由于并行爬行器需要分割下载任务
技术 2018-07-06
-
避免上网行为管理产品选型时的误区
任何新事物出现一样,总有一些不负责任、技术手段落后的厂商,以某些噱头来误导用户。在上网行为管理领域,最大的误导就是极力鼓吹URL网址数据库的数量。URL网址数据库仅仅是上网行为管理的初级手段、他的存在
厂商动态 2008-09-04
-
来就来酷的 把Ghost克隆玩得再专业一点
地为我们工作,前面几个例子,我们就使用了Ghost的参数做出了一张[URL=http://www.heibai.net]自动[/URL]备份和恢复硬盘[URL=http://www.heibai.net]数
应用 2007-08-24
-
邮箱及IE安全设置指南
展开“用户配置”、“Windows 设置”、“Internet Explorer 维护”,“URL”。双击右侧窗口中“重要URL”项,在弹出的对话框中点击勾选“自定义主页URL”复选框,在随之
应用 2007-08-07
-
域名欺骗技术
域名欺骗有多种实现方法,本文所说的是利用客户端浏览器的漏洞来欺骗用户。
多数浏览器都会存在这个漏洞,目前暂时还没相应的补丁。漏洞是这样的:
当用户通过浏览器访问一个url,如果这个url是经过
应用 2007-07-21
-
HTTP协议是什么
我们在浏览器的地址栏里输入的网站地址叫做URL(UniformResourceLocator,统一资源定位符)。就像每家每户都有一个门牌地址一样,每个网页也都有一个Internet地址。当你在浏览器
应用 2007-06-19