人工智能正制造网络垃圾:低质量AI生成网站获广告支撑迅猛发展
·“网站创造了顺畅的、功能丰富的平台,并向任何人敞开大门,让他们加入。他们把盒子放在我们面前,我们用文字和图片填满这些盒子,人们就来看看这些盒子的内容。这些公司追逐规模,因为一旦有足够的人聚集在任何地方,通常就有办法从他们身上赚钱。但人工智能改变了这些假设。”
·即使网络上充斥着人工智能的垃圾,它也可能被证明是有益的,能刺激资金更充足的平台发展。
新闻网站评级工具NewsGuard发布2023年6月的错误信息监控结果,称141个品牌正在向低质量的人工智能(AI)生成的网站提供广告收入,来支持这些不可靠网站的发展。
这些网站在几乎没有人监督的情况下运行,每天平均生成上千条文章,其中包括错误信息,特别是误导用户的医疗健康信息。
科技媒体The Verge称,人工智能正在扼杀旧网络,而新网络正在挣扎着诞生,“生成式人工智能模型正在改变网络经济,使生成低质量内容变得更便宜。我们才刚刚开始看到这些变化的影响。”
发现217个不可靠的AI生成新闻和信息网站
NewsGuard分析发现,发布在AI生成内容网站上的广告似乎是以编程方式生成的,这意味着公司不是选择将其广告投放在这些网站上,而是通过投放广告的系统自动定位。大多数广告是由谷歌的工具投放的。
NewsGuard将不可靠的AI生成新闻和信息网站(UAIN)定义为,在很少或没有人类监督的情况下运行的网站,并发布主要或完全由机器人撰写的文章。就在上个月,NewsGuard分析师将新推出的UAIN网站跟踪器上的网站数量从49个更新为217个。
尽管许多广告商及其广告代理商维护着“品牌不安全”网站的“排除列表”,但这些列表往往没有保持最新状态,显然没有跟上UAIN网站激增的步伐。
2023年5月和6月,NewsGuard分析师确定了来自141个主要品牌的393个程序化广告(programmatic ad,利用技术手段实现数字广告购买和销售的过程),这些广告出现在NewsGuard确定的217个UAIN网站中的55个上。NewsGuard发现的广告,提供给了美国、德国、法国和意大利四个国家的互联网分析师。
一家运动服装公司的广告出现在NoticiasDeEmprego.com.br网站上,这是一家UAIN网站,发布由人工智能生成的关于巴西工作机会的新闻。NewsGuard用一个黑块屏蔽了这个程序化广告。NewsGuard没有点名提供这些广告的公司,它们包括各种各样的蓝筹广告商:6家大型银行和金融服务公司、4家豪华百货公司、3家运动服装领先品牌、3家电器制造商、两家世界上最大的消费技术公司、两家全球电子商务公司、两家美国顶级宽带提供商、美国广播网络提供的3家流媒体服务、一个硅谷数字平台和一家欧洲大型连锁超市。
程序化广告使用算法和高级拍卖流程,直接向个人用户而不是特定网站提供具有高度针对性的数字广告。这意味着广告在用户浏览互联网时有效地“关注”他们。由于这个过程非常不透明,品牌可能不知道他们正在资助UAIN网站的传播,因为广告是通过第三方购买的,并且涉及多个中介机构。
假作者传播可疑健康信息
NewsGuard发现的所有393个广告都直接出现在包含由AI生成的错误信息的文章旁边。
一些出现主要品牌广告的UAIN网站似乎使用人工智能工具重写主流新闻媒体的文章。例如,AlaskaCommons.com发表的一篇文章似乎是英国小报《太阳报》美国版文章的AI重写版本,连图片和措辞都类似。AlaskaCommons.com的文章经常将作者名写为Ingrid Taylor,自今年年初以来,这位“作者”已经发表了4364篇文章,其中仅在2023年6月15日一天就发表了108篇文章。
一些网站平均每天生成超过1200篇文章,几乎没有明显的人工编辑监督。相比之下,根据2022年4月的数据,《纽约时报》通常每天发表约150篇文章。
大多数AI生成的网站质量低,但不会传播错误信息。然而,NewsGuard发现,MedicalOutline.com推广未经证实和潜在有害的自然健康疗法,标题如“柠檬能治愈皮肤过敏吗?”“ADHD的5种自然疗法是什么?”和“你如何自然地预防癌症。”
对于UAIN网站来说,快速将其内容货币化非常简单。在谷歌AdSense的登录页面上,谷歌称网站可以轻松地赚取程序化广告收入:“您所要做的就是将AdSense代码放入您的网站,它就会立即开始工作。”
自2023年5月首次开始跟踪UAIN网站以来,NewsGuard每周已确定约25个新网站,5月初,其报告还只确定了49个“似乎几乎完全由人工智能软件编写”的网站。而UAIN网站的总数可能比NewsGuard目前识别的217个网站多得多。
一家全球租车公司的广告出现在FoodingWorld.com上,这是一个UAIN网站,发布AI生成的关于食物的文章。NewsGuard用黑块挡住了这些程序化广告。如果一个网站符合以下所有4个标准,则NewsGuard将其视为不可靠的人工智能生成新闻和信息网站:第一,有明确的证据表明,该网站的很大一部分内容是由人工智能制作的;第二,有强有力的证据表明,内容是在没有人类监督的情况下发布的;第三,该网站的呈现方式让普通读者认为其内容是由人类作家或记者制作的;第四,该网站没有明确披露其内容是由人工智能制作的。
也不一定是坏事
近几个月来,已有多家媒体报道AI生成内容正在污染互联网。当地时间6月26日,The Verge高级记者詹姆斯·文森特(James Vincent)发表了一篇措辞激烈的评论文章。他写道:“ChatGPT正被用来生成全是垃圾的网站。Etsy(手工艺品电子商务网站)充斥着“AI生成的垃圾”。聊天机器人在错误信息的乌龙中相互引用。LinkedIn正在使用人工智能来刺激疲劳的用户。Snapchat和Instagram希望机器人能在你朋友不在时与你交谈……互联网档案馆正在对抗数据刮刀,而人工智能正在把维基百科撕碎。旧的网络正在消亡,而新的网络正在挣扎着诞生。”
文森特认为,当然,网络多年来一直在死亡,被那些从网站上转移流量的应用程序或奖励“缩短注意力”的算法所扼杀。但在2023年,它又在消亡,一个新的催化剂在发挥作用:人工智能。
他打了一个比方:“网站创造了顺畅的、功能丰富的平台,并向任何人敞开大门,让他们加入。他们把盒子放在我们面前,我们用文字和图片填满这些盒子,人们就来看看这些盒子的内容。这些公司追逐规模,因为一旦有足够的人聚集在任何地方,通常就有办法从他们身上赚钱。但人工智能改变了这些假设。”
因为,只要有资金和计算能力,人工智能系统,尤其是目前流行的生成模型,可以毫不费力地进行扩展。它们会产生大量文本和图像,很快也会产生音乐和视频。其产出有可能超过或胜过人们现在所依赖的新闻、信息和娱乐平台。但这些系统的质量往往很差。“这些模型是在上个网络时代奠定的数据层上训练出来的,它们对这些数据的再现并不完美。公司从开放的网络上搜刮信息,并将其提炼成机器生成的内容,这些内容生成成本低,但可靠性差。然后这种产品与之前的平台和人争夺注意力。”文森特指出。
最成功的网站往往是利用规模发挥其优势的网站,要么通过增加社会联系或产品选择,要么通过对构成互联网本身的巨大信息群进行分类,但这种规模依赖于大量人类来创造潜在价值,在大规模生产方面,人类显然无法击败人工智能。
但文森特最后也谈到,这不一定是件坏事。“有人会说,这只是世界运行的方式,指出网络本身就扼杀了之前的东西,而且往往是为了更好的发展。例如,印刷版百科全书几乎已经绝迹,但我更喜欢维基百科的广度和可及度,而不是《大英百科全书》的厚重感和安全感。对于所有与人工智能生成的写作有关的问题,也有很多方法可以改进它——从改进引用功能到更多的人工监督。此外,即使网络上充斥着人工智能的垃圾,它也可能被证明是有益的,能刺激资金更充足的平台发展。例如,如果谷歌在搜索中不断给你提供垃圾结果,你可能会更倾向于为你信任的来源付费并访问它们。”
归根结底,人工智能目前引起的变化只是网络历史上长期斗争的最新成果。从本质上讲,这是一场关于信息的战斗——关于谁制造信息,如何获取信息,以及谁获得报酬。
(本文来自澎湃新闻,更多原创资讯请下载“澎湃新闻”APP)
·即使网络上充斥着人工智能的垃圾,它也可能被证明是有益的,能刺激资金更充足的平台发展。
新闻网站评级工具NewsGuard发布2023年6月的错误信息监控结果,称141个品牌正在向低质量的人工智能(AI)生成的网站提供广告收入,来支持这些不可靠网站的发展。
这些网站在几乎没有人监督的情况下运行,每天平均生成上千条文章,其中包括错误信息,特别是误导用户的医疗健康信息。
科技媒体The Verge称,人工智能正在扼杀旧网络,而新网络正在挣扎着诞生,“生成式人工智能模型正在改变网络经济,使生成低质量内容变得更便宜。我们才刚刚开始看到这些变化的影响。”
发现217个不可靠的AI生成新闻和信息网站
NewsGuard分析发现,发布在AI生成内容网站上的广告似乎是以编程方式生成的,这意味着公司不是选择将其广告投放在这些网站上,而是通过投放广告的系统自动定位。大多数广告是由谷歌的工具投放的。
NewsGuard将不可靠的AI生成新闻和信息网站(UAIN)定义为,在很少或没有人类监督的情况下运行的网站,并发布主要或完全由机器人撰写的文章。就在上个月,NewsGuard分析师将新推出的UAIN网站跟踪器上的网站数量从49个更新为217个。
尽管许多广告商及其广告代理商维护着“品牌不安全”网站的“排除列表”,但这些列表往往没有保持最新状态,显然没有跟上UAIN网站激增的步伐。
2023年5月和6月,NewsGuard分析师确定了来自141个主要品牌的393个程序化广告(programmatic ad,利用技术手段实现数字广告购买和销售的过程),这些广告出现在NewsGuard确定的217个UAIN网站中的55个上。NewsGuard发现的广告,提供给了美国、德国、法国和意大利四个国家的互联网分析师。
一家运动服装公司的广告出现在NoticiasDeEmprego.com.br网站上,这是一家UAIN网站,发布由人工智能生成的关于巴西工作机会的新闻。NewsGuard用一个黑块屏蔽了这个程序化广告。NewsGuard没有点名提供这些广告的公司,它们包括各种各样的蓝筹广告商:6家大型银行和金融服务公司、4家豪华百货公司、3家运动服装领先品牌、3家电器制造商、两家世界上最大的消费技术公司、两家全球电子商务公司、两家美国顶级宽带提供商、美国广播网络提供的3家流媒体服务、一个硅谷数字平台和一家欧洲大型连锁超市。
程序化广告使用算法和高级拍卖流程,直接向个人用户而不是特定网站提供具有高度针对性的数字广告。这意味着广告在用户浏览互联网时有效地“关注”他们。由于这个过程非常不透明,品牌可能不知道他们正在资助UAIN网站的传播,因为广告是通过第三方购买的,并且涉及多个中介机构。
假作者传播可疑健康信息
NewsGuard发现的所有393个广告都直接出现在包含由AI生成的错误信息的文章旁边。
一些出现主要品牌广告的UAIN网站似乎使用人工智能工具重写主流新闻媒体的文章。例如,AlaskaCommons.com发表的一篇文章似乎是英国小报《太阳报》美国版文章的AI重写版本,连图片和措辞都类似。AlaskaCommons.com的文章经常将作者名写为Ingrid Taylor,自今年年初以来,这位“作者”已经发表了4364篇文章,其中仅在2023年6月15日一天就发表了108篇文章。
一些网站平均每天生成超过1200篇文章,几乎没有明显的人工编辑监督。相比之下,根据2022年4月的数据,《纽约时报》通常每天发表约150篇文章。
大多数AI生成的网站质量低,但不会传播错误信息。然而,NewsGuard发现,MedicalOutline.com推广未经证实和潜在有害的自然健康疗法,标题如“柠檬能治愈皮肤过敏吗?”“ADHD的5种自然疗法是什么?”和“你如何自然地预防癌症。”
对于UAIN网站来说,快速将其内容货币化非常简单。在谷歌AdSense的登录页面上,谷歌称网站可以轻松地赚取程序化广告收入:“您所要做的就是将AdSense代码放入您的网站,它就会立即开始工作。”
自2023年5月首次开始跟踪UAIN网站以来,NewsGuard每周已确定约25个新网站,5月初,其报告还只确定了49个“似乎几乎完全由人工智能软件编写”的网站。而UAIN网站的总数可能比NewsGuard目前识别的217个网站多得多。
一家全球租车公司的广告出现在FoodingWorld.com上,这是一个UAIN网站,发布AI生成的关于食物的文章。NewsGuard用黑块挡住了这些程序化广告。如果一个网站符合以下所有4个标准,则NewsGuard将其视为不可靠的人工智能生成新闻和信息网站:第一,有明确的证据表明,该网站的很大一部分内容是由人工智能制作的;第二,有强有力的证据表明,内容是在没有人类监督的情况下发布的;第三,该网站的呈现方式让普通读者认为其内容是由人类作家或记者制作的;第四,该网站没有明确披露其内容是由人工智能制作的。
也不一定是坏事
近几个月来,已有多家媒体报道AI生成内容正在污染互联网。当地时间6月26日,The Verge高级记者詹姆斯·文森特(James Vincent)发表了一篇措辞激烈的评论文章。他写道:“ChatGPT正被用来生成全是垃圾的网站。Etsy(手工艺品电子商务网站)充斥着“AI生成的垃圾”。聊天机器人在错误信息的乌龙中相互引用。LinkedIn正在使用人工智能来刺激疲劳的用户。Snapchat和Instagram希望机器人能在你朋友不在时与你交谈……互联网档案馆正在对抗数据刮刀,而人工智能正在把维基百科撕碎。旧的网络正在消亡,而新的网络正在挣扎着诞生。”
文森特认为,当然,网络多年来一直在死亡,被那些从网站上转移流量的应用程序或奖励“缩短注意力”的算法所扼杀。但在2023年,它又在消亡,一个新的催化剂在发挥作用:人工智能。
他打了一个比方:“网站创造了顺畅的、功能丰富的平台,并向任何人敞开大门,让他们加入。他们把盒子放在我们面前,我们用文字和图片填满这些盒子,人们就来看看这些盒子的内容。这些公司追逐规模,因为一旦有足够的人聚集在任何地方,通常就有办法从他们身上赚钱。但人工智能改变了这些假设。”
因为,只要有资金和计算能力,人工智能系统,尤其是目前流行的生成模型,可以毫不费力地进行扩展。它们会产生大量文本和图像,很快也会产生音乐和视频。其产出有可能超过或胜过人们现在所依赖的新闻、信息和娱乐平台。但这些系统的质量往往很差。“这些模型是在上个网络时代奠定的数据层上训练出来的,它们对这些数据的再现并不完美。公司从开放的网络上搜刮信息,并将其提炼成机器生成的内容,这些内容生成成本低,但可靠性差。然后这种产品与之前的平台和人争夺注意力。”文森特指出。
最成功的网站往往是利用规模发挥其优势的网站,要么通过增加社会联系或产品选择,要么通过对构成互联网本身的巨大信息群进行分类,但这种规模依赖于大量人类来创造潜在价值,在大规模生产方面,人类显然无法击败人工智能。
但文森特最后也谈到,这不一定是件坏事。“有人会说,这只是世界运行的方式,指出网络本身就扼杀了之前的东西,而且往往是为了更好的发展。例如,印刷版百科全书几乎已经绝迹,但我更喜欢维基百科的广度和可及度,而不是《大英百科全书》的厚重感和安全感。对于所有与人工智能生成的写作有关的问题,也有很多方法可以改进它——从改进引用功能到更多的人工监督。此外,即使网络上充斥着人工智能的垃圾,它也可能被证明是有益的,能刺激资金更充足的平台发展。例如,如果谷歌在搜索中不断给你提供垃圾结果,你可能会更倾向于为你信任的来源付费并访问它们。”
归根结底,人工智能目前引起的变化只是网络历史上长期斗争的最新成果。从本质上讲,这是一场关于信息的战斗——关于谁制造信息,如何获取信息,以及谁获得报酬。
(本文来自澎湃新闻,更多原创资讯请下载“澎湃新闻”APP)