火车头采集器采到了标题没有采到内容是怎么回事?
原创

火车头采集器采到了标题没有采到内容是怎么回事?

好文
试试语音读文章

热门回答:

可能是你的方法不对。或者是采集的网站有代码限制禁止采集。可以参考下面方法。

进入主窗口。点击“第二步:采集内容规则”。如下图:

创建任务之采集内容规则

这个窗口左侧用来添加或编辑文章页面相关标签的规则。右侧是用来测左侧的内容规则。我们采集文章一般要采集到对方文章的标题、内容、标签这3个。当然。如果你还需要作者等相关信息。也可以添加。这里。我只需要采集到标题、文章内容、标签这3样就可以了。

1、添加或编辑标题:双击左侧的“标题”。

双击后会弹出如下图窗口

然后。我们打开卢松松博客“好友分享”分类的任何一篇文章。查看其源代码页面。源代码中。我们可以看到文章标题在<title>与</title>。因为我们只想取文章的标题。不想取卢松博客名。所以我们在上图的窗口中右侧中添加的是\" -卢松松博客</title>”。而不是</title>。

2、添加或编辑内容标签:双击“内容”。

然后在文章源代码页面中找到文章的内容前的唯一标签 <dd class=\"con\"> (如下图)。再找到文章内容结束后唯一标签 字符 “ 相关阅读”(因为卢松博客文章后台都有“相关阅读”推荐列表)。然后把它们都添加到上图中的 1 和他2 处

这样我们就可以采集到文章的内容。但是。文章中可能有链接、有框架、DIV…… 如果不想要这些。我们是可以设置的。单击左侧的“添加”——>“html标签过滤”






其他观点:

应该是相关的开始或结束标签设置错误。或者是设置的标签重复出现。

您还感兴趣的文章推荐

以上就是由互联网推广工程师 网创网 整理编辑的,如果觉得有帮助欢迎收藏转发~

分享到 :
相关推荐

发表评论

您的电子邮箱地址不会被公开。

评论(2)

  • 陌上柳絮倾城雪 永久VIP 2022年12月28日 09:03:01

    标签,文章,内容,标题,双击,规则,源代码,如下图,博客,或者是

  • 少年狂 永久VIP 2022年12月28日 09:03:01

    没想到大家都对火车头采集器采到了标题没有采到内容是怎么回事?感兴趣,不过这这篇解答确实也是太好了

  • 苏梦北 永久VIP 2022年12月28日 09:03:01

    可能是你的方法不对。或者是采集的网站有代码限制禁止采集。可以参考下面方法。进入主窗口。点击“第二步:采集内容规则”。如