在Mapreduce实现爬虫的几个问题

【在Mapreduce实现爬虫的几个问题】

在Mapreduce实现爬虫的几个问题

文章插图
在Mapreduce中实现爬虫的几个问题简介在Mapreduce中实现爬虫的几个问题:1 。如何用Mapreduce实现循环爬行,因为我觉得输出文件夹输出在运行时是不能存在的 。难道不需要将Output捕获的URL放入input中继续循环吗?2.我是在reduce功能下载的,用的 。