关灯

登录注册

快捷登录

中国写手之家 › 业界 › 文化新闻 › 把毛选和鲁迅全集喂给AI后，写出来的高考作文太对味了 ...

把毛选和鲁迅全集喂给AI后，写出来的高考作文太对味了

[复制链接]

heneica 发表于 2021-7-1 08:27:14 | 显示全部楼层 |阅读模式

上一主题

下一主题

我要上头条-写手之家全站广告位任意挑选

马上注册，查阅更多信息

您需要登录才可以下载或查看，没有账号？立即注册

x

作者：量子位

明敏萧箫发自凹非寺
量子位报道 | 公众号 QbitAI

高考刚过去不久，就有AI来“挑事”了。

这不，有个AI读完了毛选和鲁迅全集后，大笔一挥，写下好几篇高考作文。

结果……竟然还可以？

我们直接看文章：

把毛选和鲁迅全集喂给AI后，写出来的高考作文太对味了-1.jpg

看看这字里行间的青春与朝气，根本看不出是AI写的啊！

还能紧跟时事，“民族伟大复兴”这样的热点词用得游刃有余。

引经据典也不在话下：

一句“实践是检验真理的唯一标准”，立刻让文章高大上了起来。

把毛选和鲁迅全集喂给AI后，写出来的高考作文太对味了-2.jpg

一眼望去，通篇全是踩分点。

让人不禁猜想：难道AI写作文终于狗屁通了？

吃瓜群众也非常好奇：这样的文章到底能拿多少分？

把毛选和鲁迅全集喂给AI后，写出来的高考作文太对味了-3.jpg

既然如此，不如就让我们来当一次改卷老师，看看这个AI到底能拿多少分。

考场作文套“模板”利器

首先摆在AI面前的是2021年全国甲卷的考题，主题是“可为与有为”，具体题面如下：

把毛选和鲁迅全集喂给AI后，写出来的高考作文太对味了-4.jpg

AI一上来的表现就不俗，《青年代表说》这主题就令人直呼“高啊”。

把毛选和鲁迅全集喂给AI后，写出来的高考作文太对味了-5.jpg

在题目中并没有提到“青年”二字的情况下，AI居然还能找到这样的切入点，这有点看头啊？

而且它还很鸡贼，开头直接抄了题目中的内容，这就叫“点题”。

甚至连我们写作文必备法宝——排比，它都用得游刃有余。

把毛选和鲁迅全集喂给AI后，写出来的高考作文太对味了-6.jpg

三大段排比，情绪逐层递进还能凑字数。

而且作者@图灵的猫介绍，这种排比句式是AI直接生成的，并没有二次调整。

这可能是因为AI在训练过程中“记住”了这种语法结构，就运用了起来。

再看看结尾，这也是高考作文的重头戏。

AI依旧熟知我们的套路，一通拔高、升华，让改卷老师都不好意思打低分（不是）。

把毛选和鲁迅全集喂给AI后，写出来的高考作文太对味了-7.jpg

这么看来，AI真的能写出让人满意的考场作文了？

话先别说太早，因为在之后的两套题里，它的表现就有些不尽如人意了。

首先要吐槽的，就是它每一次写作文，都会用抄题目的方法来凑出开篇。

把毛选和鲁迅全集喂给AI后，写出来的高考作文太对味了-8.jpg

其次，它虽然使用了金句技能，马克思主义理论、李白诗句用得飞起，但是在文章的逻辑处理上，依旧不太行。

把毛选和鲁迅全集喂给AI后，写出来的高考作文太对味了-9.jpg

比如“是否拥有以后一辈子的生命”，这句话显然不是中文的逻辑。

简称不说人话。

而且它写出来的内容，总是在金句和废话之间徘徊。

就像下面这一段内容，每一句话单拿出来看都还可以，但是连成一段后，怎么又有点狗屁不通那味儿了？

把毛选和鲁迅全集喂给AI后，写出来的高考作文太对味了-10.jpg

此外，不知道是不是因为读了《鲁迅全集》的缘故，AI好像有点搞不懂我们现在的时代背景了。

这一段中的“三十载已过”，也是个令人有些摸不着头脑的时间概念。

把毛选和鲁迅全集喂给AI后，写出来的高考作文太对味了-11.jpg

有网友总结了一下自己的感受：

把毛选和鲁迅全集喂给AI后，写出来的高考作文太对味了-12.jpg

挑战一下鲁迅的题目

本着看热闹不嫌事大的原则，光看现有案例怎么够，我们当然要上手试一下它的水平究竟如何。

把毛选和鲁迅全集喂给AI后，写出来的高考作文太对味了-13.jpg

既然是读过《鲁迅全集》的AI，那我们就让它根据鲁迅的名言写一篇文章。

愿中国青年都摆脱冷气，只是向上走，不必听自暴自弃者流的话。能做事的做事，能发声的发声。

这段话大家一定耳熟能详，那让AI以此为题写一篇作文，画风会是啥样？

按照它的套路，开篇还是抄题目，所以我们直接来看第二段。

把毛选和鲁迅全集喂给AI后，写出来的高考作文太对味了-14.jpg

AI直接提出了青年人要自信的主题，看来《鲁迅全集》没有白读，对于题目的理解还是很到位的。

之后的内容则对题面做了更加直白的解释，告诫青年要努力啊！奋斗啊！

看得我直呼别骂了…

把毛选和鲁迅全集喂给AI后，写出来的高考作文太对味了-15.jpg

接下来也是常规操作了，梅花香自苦寒来，金句一出、逼格拉满。

把毛选和鲁迅全集喂给AI后，写出来的高考作文太对味了-16.jpg

文末还回到了现实生活，呼吁青年要着眼当下，才能有更美好的未来。

同时还加入了科技创新、大国崛起的要点。

把毛选和鲁迅全集喂给AI后，写出来的高考作文太对味了-17.jpg

由此可见，AI写作文在把控主题上可以说是so easy。

考虑到真实的高考作文题目中，有许多都是设问再回答，所以我们也试了试给AI一个问句，会发生什么。

把毛选和鲁迅全集喂给AI后，写出来的高考作文太对味了-18.jpg

在拿到文学应当如何改良？这样的命题后，AI很自然地说了句套话。

这第一段看上去非常具有哲理性，但究其本质，就是车轱辘话罢了。

把毛选和鲁迅全集喂给AI后，写出来的高考作文太对味了-19.jpg

这样的问题在其他生成的文章中也十分常见，而且还会冒出来错别字、语病等小毛病。

与此同时，我们还发现它似乎不太能承受住奇葩一点的题目…

把毛选和鲁迅全集喂给AI后，写出来的高考作文太对味了-20.jpg

在把一道网传的奇葩作文题目交给AI后，它直接写出来了一篇意识流。

把毛选和鲁迅全集喂给AI后，写出来的高考作文太对味了-21.jpg

这还只是第一段，后面的内容还出现了红色气球、子弹、龙牙、警察等等让人完全摸不着头脑的内容。

不止是奇葩题目，在涉及“古人”的题目时，AI还会冒出一两句奇形怪状的文言文来：

把毛选和鲁迅全集喂给AI后，写出来的高考作文太对味了-22.jpg

果然，还是现代主题的高考作文更适合AI发挥。

网友神总结：这就是个狗屁稍通文章生成器。

把毛选和鲁迅全集喂给AI后，写出来的高考作文太对味了-23.jpg

5大模块，读题作答“一条龙”

上面这些偶尔“超常发挥”、平均挣扎在及格线上下的文章，源自一个名为EssayKiller的AI写作框架，本质上是个多模块异构深度神经网络。

据模型作者@图灵的猫表示，这个AI生成文章有点“捉襟见肘”的原因，也是因为采用的模型不是最先进的。

由于经费不足更好的模型没有开源，因此只能用GPT-2来生成文字，如果能用上GPT-3和华为盘古，效果肯定比现在更好。

把毛选和鲁迅全集喂给AI后，写出来的高考作文太对味了-24.jpg

据了解，EssayKiller基于OpenCV开发，参数量达到17亿。

从结构上看，这个AI框架主要包括5部分：输入、识别网络、语言网络、判分网络和输出。

相当于我们平时的“5步写作文”：拿到试卷、看题、打草稿、错误检查、写答题卡。

把毛选和鲁迅全集喂给AI后，写出来的高考作文太对味了-25.jpg

其中，看题、打草稿和错误检查几个模块，都会被拿出来单独训练，各司其职。

在看题部分，EssayKiller首先采用了OpenCV的EAST文本检测器，能以13帧/秒的速度，扫描任意方向、大小的720p图片文本，并将其中的文字检测出来。

把毛选和鲁迅全集喂给AI后，写出来的高考作文太对味了-26.jpg

然后用OCR模型中的CRNN，对这些文字进行识别。

例如，将上面这张图片中的文字，转换成能直接输入模型的文本信息：“三写作70分……”

至于打草稿部分，则分为阅读理解、文本联想两部分，分别由BERT和GPT-2来完成。

BERT会将接收到的句子信息进行拆分、打碎，提取其中的关键词来，并将这些“必须出现在内文”的关键词交给GPT-2；

GPT-2在收到关键信息后，就能根据要求开始“大做文章”，每句话都与关键词密切相关，无时无刻不在“点题”。

把毛选和鲁迅全集喂给AI后，写出来的高考作文太对味了-27.jpg

但GPT-2生成的文章，还不符合高考作文的标准。

要想让这些句子看起来流畅成段，还得筛去一批真·狗屁不通的病句，并检查句子中的拼写错误、机翻等问题。

这就是错误检查部分，EssayKiller直接调用了百度模型DNN的API，主要原理是对句子中的词语进行分析，并判断它们是否处在正确的位置上。

把毛选和鲁迅全集喂给AI后，写出来的高考作文太对味了-28.jpg

在这3大关键步骤完成后，就可以正式排版成答题纸的格式，并用手写机器人输出了（相关模型也是开源的）。

看起来不错，已经有网友迫不及待想拿来写小作文了：

把毛选和鲁迅全集喂给AI后，写出来的高考作文太对味了-29.jpg

打住！

把毛选和鲁迅全集喂给AI后，写出来的高考作文太对味了-30.jpg

据@图灵的猫表示，不希望有人用EssayKiller来写作业，因此并没有开源相关参数设置，colab的调用次数也有严格限制。

要是出现违规行为，可能整个开源项目都会被关闭，同时也没法用Colab在线体验了。

到底“消化”得怎么样？

@图灵的猫介绍说，要想让AI模型写出这种效果的作文，在“语言生成模块”的训练集中，毛选和鲁迅全集等著作占比要超过10%。

而模型的其他训练资料，则主要来源于开源中文散文数据集、高考作文数据集等。

那么，训练出的模型效果，是否符合预期呢？

不少网友表示，感觉AI还是“读进去了一部分”的：

把毛选和鲁迅全集喂给AI后，写出来的高考作文太对味了-31.jpg

而对于作者@图灵的猫来说，生成作文的质量也确实“比自己预期要好一些”。

但这并不表明，AI就已经能100%写出像样的高考作文了。

毕竟，最终呈现出来的几篇高考作文，都是在语言生成模型后，经过机器判分+人工筛选，才展示在读者面前的。

而在作文中所呈现出的排比等高级修辞手法，也只能说明训练语料中包含这类修辞，而AI模型在学习的过程中“记忆”了它们，并不能说明已经学到了这些手法。

把毛选和鲁迅全集喂给AI后，写出来的高考作文太对味了-32.jpg

换而言之，这次的AI模型，效果确实超乎预期，但并不意味着它真正“消化”了这些语料。

那么，这个AI模型接下来还会试些什么？

@图灵的猫表示，下一步的目标是“科幻小说”：

要是有空的话，我会将大刘、阿西莫夫和阿瑟克拉克等科幻作家的作品加入训练集，让AI模型试试写科幻小说。

嗯，AI写作开始有点赛博朋克那味了。

— 完 —

标签：毛选鲁迅全集出来高考高考作文

TA的其他文章

相关帖子

这家伙很懒，没有签名

回复

使用道具举报

精彩评论2

正序浏览

huier12345677 发表于 2021-7-1 08:27:30 | 显示全部楼层

搞不好再过10年起点写手都要失业，鹅厂架一排AI，每天吧唧吧唧一堆AI小说，文笔揍得西红柿唐三之流无地自容，眨眼就是几部高仿鬼吹灯[汗][奸笑][捂脸]

这家伙很懒，没有签名

回复支持反对

使用道具举报

丁四dingsi 发表于 2021-7-1 08:28:10 | 显示全部楼层

再进步进步，写小白文可以的，套路学会了，不灌水，光速更新，作家不好干了啊。

这家伙很懒，没有签名

回复支持反对

使用道具举报

返回列表

heneica 中级写手

0关注

1粉丝

30帖子

关注我们：微信订阅号

官方微信

APP下载

专业的编辑写手交流平台

写手之家

写手之家建立于2007年,是家有十余年的老牌网站

在国内享有较高的知名度,居同类网站之首

是最具权威和专业的文化类兼职网站

Copyright ©2007-2024 中国写手之家Powered by©Discuz!技术支持：写手之家 ( 湘ICP备17024436号-3 )|网站地图|湘公网安备43080202000239号