东方朋友 发表于 2023-10-22 10:23:44

AI生成书籍泛滥:谁在制造“假书”?

作者:南方周末


亚马逊的自助出版系统允许任何人在亚马逊上自行出版和销售书籍,这给AI生成书籍的泛滥提供了漏洞。 (视觉中国/图)

“谁在写我的传记?”


当罗里·塞兰-琼斯在亚马逊上发现一本自己的传记时,他奇怪地发出疑问。他翻阅了部分内容,书中显示他生活在一个学术家庭中,父亲是一位和蔼可亲的学者,母亲是一名教师。这本书几乎可以与他自己写的回忆录相媲美,只不过上面的信息“完全是幻想”,他告诉《卫报》。

事实上,罗里的父亲是BBC的一位电视导演,母亲也在BBC工作。某一天,他在一个装着信件的鞋盒中发现了父母的感情故事,并由此揭开家族的历史真相,这些故事被记录在他真正的回忆录中。

至于那本有关他的传记,罗里从未听说过那位传记作者,不过,他很快发现,这本书是由AI生成的。

罗里的遭遇并非孤例。据多家外媒报道,AI生成的书籍正充斥在亚马逊上,这些书籍涉及范围广泛,从传记、食谱、科普书籍到旅游指南等,无所不有。其中,有些书中的某些错误信息甚至会威胁到生命。

纽约真菌学会(NYMS)便公开表示,亚马逊等电商平台上的许多AI生成的蘑菇觅食科普书籍存在诸多错误描述,这可能会误导大众吃到有毒蘑菇,“意味着生与死”。

“AI已经击垮亚马逊”


6月,作家凯特琳·林奇在社交平台上发帖,指出在亚马逊青少年当代爱情电子书畅销排行榜的前100名中,只有19本是正常的书籍,其余都是AI生成的“废话”。

她还附上了一本书的截图,名字叫《等你爱我》,封面是一张黑白的海鸥照片。在此之前,在亚马逊的青少年当代爱情类别前100名畅销书排行榜中,这本书位于第90名。底下的两条一星评论也指出,它是一本由AI生成的书籍。

“AI已经击垮了亚马逊。”林奇在推文中这样写道。

据8月《纽约时报》报道,旅游指南也成为AI书籍泛滥的主要类别之一。3月,旅行者艾米·科尔斯基为即将到来的法国之旅在亚马逊上购买旅行指南。当她输入几个搜索关键词“旅行”“指南”“法国”后,一本排名靠前的《法国旅游指南》引起了她的注意。

根据作者页面显示,该书作者迈克·史蒂夫斯是一位“著名的旅行作家”。书籍的界面上有一百多个五星好评,该指南还承诺有行程安排和当地人的推荐。于是,艾米·科尔斯基下了单。

令她失望的是,收到书籍后,她发现里面的描述模糊、文字重复,并且缺乏行程安排,看起来像是从维基百科上复制粘贴的。她将这本书退回了。

《纽约时报》发现事情并不简单。他们无法找到该书所谓的“作者”之前发表的任何作品,甚至界面上“作者”的照片也显得奇怪,比如耳朵附近存在的异常元素、歪歪扭扭的衣服等,看起来是由AI生成的照片。

根据AI检测工具Originality.ai的结果,几乎可以肯定迈克·史蒂夫斯的书AI生成。此外,《纽约时报》发现,AI生成的书籍也开始渗透到烹饪、编程、医学、园艺等许多类别中。

而在许多媒体的报道中,AI生成的书籍不仅给读者带来误导信息,也给真人作者造成了极大的困扰。8月,作家简·弗里德曼在自己的博客上称,有一些“垃圾书”被上传到亚马逊上,作者一栏赫然写着她的名字,但她并没有写过这些书,它们极大可能是AI生成的。

从2009年开始,她一直在写博客,很多内容都是公开的,可以用于AI的模型训练。因此,当她读到这些“假书”的第一页时,就像在阅读自己生成的ChatGPT回复一样。更让她觉得雪上加霜的是,这些“假书”被添加到她的Goodreads个人资料中,这很容易引起误导。

她在社交平台上抱怨这件事情之后,一些作者回应称,他们也有过类似的经历。“人们一直告诉我他们买了我的新书,上面有我的名字,但我从未写过。”一位作者说。还有的作者仅仅一周就举报了29本类似情况的书籍。

“可怕的是,这种情况可能发生在任何一个有名声、有地位、有需求的人身上,有人看到了从中获利的途径。”在接受美国有线电视新闻网采访时,简·弗里德曼说道。

“实际上是在允许‘垃圾书’的存在”


在罗里发现有关他的传记是AI生成的内容后,亚马逊给他发了一封电子邮件,上面推荐说,“你可能会喜欢这本书”。这让罗里感到生气,亚马逊的算法竟认为这是一本他想要的书。

“他们实际上是在允许‘垃圾书’的存在,还把它推荐给最讨厌它的人。”罗里告诉《卫报》。尽管亚马逊之后删除了这本书,但还是有很多作品通过了旨在剔除低质量图书的过滤系统。

实际上,许多AI生成的书籍出现在亚马逊平台上,跟它本身的自助出版系统KDP(Kindle Direct Publishing)被滥用有很大关系。2007年,亚马逊创建KDP,允许任何人在亚马逊上自行出版和销售书籍。目前,它可以提供超过45种语言选择。

在亚马逊KDP平台,作者可以自由选择自助出版电子书或纸质书,完成自助出版书籍的上传流程后,亚马逊大约72小时内就能通过审核并进行销售。在此平台上自助出版书籍是免费的,不过,如果出版纸质书,印刷成本会从每本书销售所得的版税中扣除。一般来说,作者可获得的纸质书版税最高为60%,电子书的版税为35%或70%。

另外,随着人工智能技术的发展,在YouTube、TikTok等平台上,许多利用AI生成书籍的教程也纷纷出现,其主题范围广泛,不少用户可以从中快速掌握AI生成书籍的方法,再加上亚马逊自助出版功能的便利与收益,滥用此功能进行AI书籍出版和销售的行为也很难避免。

在接到许多作者的投诉后,9月,亚马逊在其KDP的社区页面上引入了新的规则和指南。新规要求作者在发布作品时,回答系统关于作品是否为人工智能生成的提问。在其内容指南部分,亚马逊也增加了有关AI的内容,包括对“人工智能生成”和“人工智能辅助”的定义。

据《卫报》报道,出于对人工智能的担忧,亚马逊推出限制自助出版者每日最多发布3本书的新规。

但即使新规已经发布,有些影响却已造成。简·弗里德曼的相关事件发酵后,那些假冒她之名的书籍从亚马逊和她的Goodreads个人资料中被删去。但这一过程并不顺利,亚马逊一开始拒绝停止出售那些书籍。简·弗里德曼认为,最终是由于她在写作和出版界的知名度和声誉才促使亚马逊撤下那些书。

“现在亚马逊上发布的人工智能内容泛滥成灾,有时还以误导或欺诈的方式归属于作者,怎么能理所当然地指望在职作者在余生中每周都花时间来监管这些内容呢?”她发出质问。

而即使那些书不再出现在她的亚马逊或Goodreads页面上,它们的影响仍然存在。简·弗里德曼在自己的博客上写道:“不幸的是,即使你把这些疯狂的书从你的官方资料中删除了,它们仍然会和你的名字在一起……而你对此却无能为力。”

南方周末记者 翁榕榕 南方周末实习生 陈荃新

责编 李慕琰
页: [1]
查看完整版本: AI生成书籍泛滥:谁在制造“假书”?