去评论
dz插件网

关于AI关键词生成文本【劝退帖】 附送程序

镖师
2022/07/13 10:21:32
接上个帖子https://www.4414.cn/thread-99086-1-1.html

程序我就不更新发出来了,这个事情纯粹是赔钱赚吆喝的、也动了一些人的利益
看下面一个图,半天不到刷了我差不多3万的字符,我发出的测试程序是单步点击的,里面并没有批量、多线程什么的,为啥能刷这么多?有人故意抓我程序数据包的接口去刷的。。。。。。人心险恶。


ai生成文章有没有用?
肯定是有用的,ai生成的文章原创度非常高,只要语料够多、训练次数够多,内容比人写的还好。
我调这个程序差不多一个多月(每天啥都不干,连付费活都不接的那种),也拿一个挂掉的站不断在测试,稳定下、批量上内容 应该可以稳定起飞了。

关于程序
程序都是基于gpt2和cpm改的,可以说市面上所有ai生成文本的程序都是基于这两个。
https://github.com/search?q=cpm&type=
https://github.com/search?q=gpt2


很多人跃跃欲试,其实没必要。
一般人可能真玩不起来,不是说技术问题,这个其实没啥技术,无非就是各种调参、根据结果来调整。是很多人硬件跟不上 时间上不允许
算笔时间账,抓取100万语料你要多久时间?其实100万语料真不够。。。真想玩这个,语料是按G算 的。100万篇也就3-4g的样子。
2022-07-13 04:10:44,491 - INFO - epoch 14: loss 1.6804532314722735, predict_acc 0.6540738706160654
2022-07-13 04:10:44,491 - INFO - saving model for epoch 14
2022-07-13 04:10:48,707 - INFO - epoch 14 finished
2022-07-13 04:10:48,747 - INFO - time for one epoch: 7:08:20.521345
2022-07-13 04:10:48,749 - INFO - train loss list:[2.7903, 2.1889, 2.0377, 1.9512, 1.8925, 1.8486, 1.8138, 1.7855, 1.7616, 1.7411, 1.7233, 1.7075, 1.6932, 1.6805]

我上面是没算抓取语料的时间,这个模型目前训练到了15轮,一轮大概7个多小时,损失率从2.7降到1.6,后面的学习率非常低
目前花了差不多 103个小时、差不多5天时间,现在的生成的文章勉强可以用,不过可能还会再花5天时间把损失率降到0.几。
这个是时间上的。
再说说硬件上,训练模型必须要有gpu,通过模型生成文章也必须要有gpu。
训练模型可以通过白嫖九天毕昇的解决,生成模型的就必须花钱了,一个月可能几千吧,我现在是一个月差不多600$,光生成文章的服务器费用。
别想着本机生成了,卡的要死,相信很多人受不了这个。
千辛万苦搞出来的  可能惨不忍睹

最后说说我这边的
我这边站群软件付费用户大概有30多个。当然,之前所有人-1买之前我都说过,软件不是ai生成的,之前都是通过抓取计算整合的(如果我要稍微吹个牛逼,应该可以至少多赚4万以上吧)


因为我自己现在在玩这个ai生成的,也抢了很多训练模型用的机子,基本上可以同时跑十几个模型。
所以之前的每个付费用户都可以免费提一个模型要求,我这边负责抓取语料并训练模型,然后做成api接口,然后在站群软件上直接通过接口生成文本

有玩这个的可以加下面的签名qq一起交流。上来就一连三问的就别了、没这个时间。