去评论
dz插件网

自研文章采集器,视频演示,能不能吊打其他采集器,你来提意见!

迪巴拉
2022/04/17 08:01:25
之前我不是发了一篇文章嘛,详见可点我dz插件网头像看我上一篇文章哈~
当时,得到了坛友的热烈讨论,今天周末,正好有时间我来录个视频演示下,接下来我逐一解释和说明一下!

一、为什么要做这么个采集器

背景交代:
本人业余站长,最近1年,看到很多人做采集站做的风生水起,于是我在想,我要不要也去做个采集站呢?
于是乎,我就去下载了八爪鱼和火车头,研究了半天,我放弃了,对我而言,太!难!了!

是的,现在市面上那么多的采集器,对小白而言学习成本还是很大的,特别是火车头!

所以我在想,

1、我能不能做个采集器,点一下按钮就发布到草稿箱或者发布了呢?(针对高质量采集)
2、我能不能做个采集器,输一下目标网址就能把它全站的内容全部同步到我自己的草稿箱或者发布了呢?(针对泛采集)

都5G人工智能时代了,为什么没有这样的采集器呢?

于是,怀揣着这样的想法,我们的技术团队开始着手干这件事了!我要做一个真正无须动脑的小白采集器!

二、视频演示的是当前已经开发好了的功能

之前坛友说,你录个视频来演示一下吧,OK,视频已经录好

如视频所示,当前我们已经实现了基础功能,即:

任意你想爬的网站,只要点一下“采集”按钮,就会自动发送到我的wordpress网站的草稿箱里面,

Your browser does not support the video tag

说明一下:
视频中右下角有一个操作面板,这个操作面板上写的是我自己的2个网站的名字(实际上就是2个按钮,代表的功能是<采集到网站1、采集到网站2>),一个是wordpress,另一个是自研的文章系统,所以我打个码,毕竟我这小破站实在难登大雅之堂,还请见谅。

大家看下视频,当我点一下右下角面板里“采集”按钮的时候,头条的文章就自动同步到wordpress后台的草稿箱,排版美观、代码格式已清洗、图片自动本地化(我用的是七牛)

三、你们这个采集器上线了没?什么时候上线、都有哪些功能?

答1:
没有上线,目前在我自己电脑上可以用了,
我们准备商业化,基础功能研发好之后还需要解决黑客“破解”的问题,
否则花这么大代价被人破解了,我们也就没兴趣继续再研发新功能了,不然这个采集器此时应该已经面世了

答2:
本来准备五一节后上线,只不过最近我们某个游戏项目需要再增加个系统,于是技术部都跑去搞那个了,
不出意外的话,采集器预计要到6月中旬正式上线跟大家见面,届时,我会在dz插件网以广告位的形式告诉大家;

答3:
初版上线之后只有一个基础功能,也就是视频中演示的,能一键采集任意网站到你的wordpress、zblog等cms后台(各大cms的插件我们会挨个开发,大概是先上线wordpress),所谓任意网站包括但不限于某乎、某知道、某问答、某公众号等等,没错,你不用写任何规则,不用学习任何东西。

小特色1:比如某问答网站的某个问题下面有100条回答,而你只看中了第36条回答,只想采集第36条,那么OK,你点一下按钮就行了,这条回答就采集回去了~
小特色2:基本上任意网站我们都能采、任何防爬措施对我们采集器都不起作用,除非像大众点评那样的网站(这种网站也不是不能采,之所以市面上没有采集器能采是因为他们做了非常严格防爬措施,另外他们网站里面很多文字并不是真正的“字”而是一些svg格式的图片,这种站的防爬对我们没用,但是他们的图片我们需要写反编译规则才行,目前我们还没时间写那玩意,纯体力活)

关于这个项目未来的一些功能,目前我就不透露了,我们的目标是超乎想象,我们的梦想是星辰大海,嘿嘿~

好了,就先写这么多吧,因为我写这2篇的主要目的是想看看大家的想法,这样一款商业化产品你们怎么看,能卖的出去吗~