2018年对于为热衷于搞采集的站长来说,打击比较巨大,那年百度推出了飓风算法,打击采集站,博主的几个高权重站一夜流量暴降,再加上网站是备过案的,经常有文章违规被WJ叫去喝茶,便把几个网站都关掉了。之后便经常在站长论坛潜水,看看最近又有哪些倒霉蛋被百度搞了,就这样一天天的混日子,直到有一天,脑子里突然迸发灵感,有了一个新的采集思路,而这个思路就是这篇文章要讲的内容。

先讲一下主要的思路,百度喜欢收录原创的内容且内容要与网站主题及文章标题相关,而且要保证内容可读性,不能是伪原创或者用市面上的原创文章生成器制造的文章,所以,要写出百度喜欢的内容必须是人工围绕主题来写。而靠采集如何采集到人工写出的文章且不用花钱,只有一种,就是“网友评论”,当然也不是所有网站的“网友评论”都能采集,例如豆瓣之类的评论都被百度收录了,采集过来就容易被发现。因此,一定要找百度不容易收录到的网站来采集,比如博主选择了QQ音乐评论。

首先采集歌手列表,把所有歌手采集到,然后每个歌手页面可以采集到他(她)的所有歌曲,每首歌曲的页面就可以采集到歌词和评论,我们以采集到周杰伦的《一路向北》为例:

标题:一路向北歌词及歌曲介绍 周杰伦演唱的《一路向北》网友评价
正文:
歌曲《一路向北》由歌手(组合):周杰伦演唱,并被收录到专辑《J III MP3 Player》中。接下来我们为大家介绍下歌曲一路向北歌词及一路向北评论等内容。

以下网友对于歌曲《一路向北》的评论内容,本内容仅为部分网友观点不代表大众观点!网友言论:
//这里的内容是QQ音乐上网友评论,最好筛选一下,把一些无意义很短的评论删掉

以下为《一路向北》原版歌词内容:
//这里是这首歌的歌词部分

这样整合后就是一篇全新的文章,而且可读性较高,最最重要的是,就算有人跟你方法一样,只要不是同一天采集的内容,你们俩的采集到的评论内容也基本不会重复。

PS:QQ音乐网友评论是用JS加载的,直接查看源代码是看不到的,直接找到对应JS接口地址就可以直接读取出评论,所以采集规则还是比较好写的。

最后你需要做的就是写好采集规则,采集内容填充网站,有时间做做外链或者同样方法再做几个网站就可以,本方法博主亲自用过,确实是可行的,并非空谈,各位也可以类推方法,比如采集购物网站评论、买家秀等等。