马上注册,查阅更多信息
您需要 登录 才可以下载或查看,没有账号?立即注册
x
2022年12月底,Open AI发布的基于GPT-3.5的ChatGPT进入人工智能的市场游戏,开启了人工智能时代的新篇章。GPT(Generative Pre-Trained Transformer)作为生成式预训练模型,以Transformer为基础模型,使用预训练技术得到通用的文本模型。GPT-3.5通过海量数据和超强算力让模型的自然语言处理能力产生质的变化,实现“智慧涌现”。ChatGPT的价值观、正确程度以及在模仿人类语言和行为模式的真实性上都得到了大幅提升,引起了业界不小的轰动。比尔·盖茨曾表示,聊天机器人ChatGPT可以对用户查询做出惊人的类似人类的反应,其重要性不亚于互联网的发明。
毫无疑问,Open AI发布ChatGPT后,开辟了人工智能和语言模型的全新赛道。微软、苹果、谷歌、百度等科技公司纷纷加入这场AIGC(人工智能生产内容)的游戏。2月,微软将ChatGPT接入新版Bing,打开了GPT类产品在搜索引擎应用市场上的新战场。北京时间3月15日凌晨,Open AI再出大招,发布GPT-4,比GPT-3.5更快、更精准,能处理更加复杂的内容,甚至可以识别图片内容及其隐藏的情感含义。3月16日,百度发布文心一言,在中文语义处理上更优秀,可以由文字生成语音、图片、视频等。可以说从2月开始,人工智能的科技革命正式开始了,并且在科技巨头的内卷中,从个人到行业到世界的格局,都在被AIGC推动着变革。 人工智能技术迎来奇点,对个人和生活的影响是巨大的,清博智能高级副总裁、清博研究院院长黄丽媛表示,脑力输出者将败给体力输出者,至少舆情分析、大数据分析行业是如此。黄丽媛测试了热搜上的某高校事件,AI水平显示相当于中级分析师。黄丽媛还表示,人们对已存在知识和信息的掌握和使用门槛,将“一夜回到解放前”,除非是尚存在于脑间心中的、无从可“查”内容。 DCCI互联网研究院院长、知名互联网学者刘兴亮认为,ChatGPT出来后,人们太过于担心哪种工作会首先被替代,而忽视了能力才是最重要的。一个人能多大程度地利用AI得到自己想要的答案,这在未来将成为一种基础能力。工作不是被AI淘汰的,而是被那些掌握AI工具的人淘汰的。普通人的机会在于如何更好地以GPT类产品为路径,将其应用于自己的行业。 北京印刷学院新闻出版学院院长陈丹认为,AIGC会将内容爆炸推向新的高潮,识别、判断和鉴赏高质量内容的能力将进一步成为拉开人与人差距的关键之一。传媒工作者需要在技术渗透进入行业的同时,及时调适自己的能力和角色定位。 《AIGC:智能创作时代》作者、科技加速器QAQ创始人杜雨认为,AI在“升维”到未来的过程中,短期内传统生产关系会受到冲击,社会方方面面都会受到影响而产生“阵痛”,但从长远看,这种“阵痛”会更让人类集中于“创造”。“未来,如何运用AIGC赋能自我也是一种能力,因此,出版传媒业要拥抱AIGC的东风,就必须培养能够运用AIGC工具赋能业务的人才,推动行业发展。” 龙源创新数字传媒(北京)股份有限公司执行总裁汤杨表示,生成式人工智能是对内容生产方式的革新,让知识和知识人,摆脱了内容生产成本的束缚、对媒体介质的束缚,甚至摆脱了文笔能力的束缚。这个革新出版业必须拥抱。 AI革命,阵痛是一种必然 ■受访人:杜 雨(《AIGC:智能创作时代》作者、科技加速器QAQ创始人) □采访人:张馨宇(中国出版传媒商报记者) 创作中感受科技进步 □您创作《AIGC:智能创作时代》的初衷是什么?请介绍一下这本书的创作过程,期间有哪些小故事可以分享? ■作为一名投资人,我经常会接触到一些科技前沿公司,在与这些科技公司对话时我发现,像AIGC(人工智能生成内容)这类新兴科技一方面离民众很“近”,会对大众的工作生活产生深刻的影响;一方面又离民众很“远”,技术在大众心里往往是高深莫测、让人敬而远之的。《AIGC:智能创作时代》是我继《WEB3.0:赋能数字经济新时代》后的第二本书了,写作的初衷也是希望能用通俗易懂的话语向更多的人科普AIGC这样的新兴科技领域。同时,投资人写书的优势在于,能够从商业和消费者的角度提供更多视角,更贴近人们工作生活,也更容易激发大家的科技兴趣。 因为是AIGC主题的书,所以在创作过程中我们也尝试了各种AIGC工具,期间也发生了一些有趣的小故事。当我们尝试用一些早年推出的AI文本生成工具生成AIGC主题内容的时候,它写了一长段言情小说,其中男主角的名字叫“AIGC”,让人啼笑皆非。不过,现在我们用ChatGPT这类最新的文本生成工具的时候,已经不会出现这种夸张的错误了,这其实也是技术进步的体现。 □您对预训练大模型的了解是怎样的?将大模型套嵌入搜索引擎、办公软件等后,将会给相关公司、用户体验以及商业、就业格局带来怎样的改变? ■我们常说数据、算法、模型是AI领域发展的三要素,如果用通俗的话语来解释预训练大模型,就是运用大规模数据量进行预训练、具有超强算法、具备超大参数量的模型。这样的模型往往通用性较强,也非常适合接入像搜索引擎、办公软件这类的应用场景。例如,之前就有GPT-4接入搜索引擎、办公软件的消息,从一些公开的演示视频中我们就可以看到这些应用和软件强大的功能飞越。比如用自然的对话语言去辅助搜索,用简单的语言描述就可以完成复杂的Excel数据处理、将文稿自动转成排版好的PPT等,在提升用户工作效率的同时大大优化了用户体验。而微软也因为AIGC在搜索引擎和Office中的接入而大大受益,成为大众关注的焦点。在就业格局上,一些低端机械化的内容创作岗位可能会受到冲击,就像OpenAI和宾夕法尼亚大学的相关研究人员发布的语言大模型对劳动力市场的潜在影响的论文中显示的那样,受影响程度较高的职业包括报税员、作家、数学家、网页设计师和记者等。 □您认为在ChatGPT类产品发展的不同阶段,可以重点投入哪些环节以赶上技术和投资的风口? ■风口更多是一个强调及时性的词,与其划分不同的阶段,更适合的方式是从产业链的侧重模块去理解该如何赶上风口。我们可以把整个AIGC类产品的产业链分为上游数据服务、中游算法模型、下游应用拓展。对于当前的创业公司来说,主要的机会可能在上下游,中游的算法模型因为投入较大,可能不是短期内就可以简简单单赶上的。从上游来看,AIGC赛道的热门会拉动对于数据标注等数据服务需求的增长,聚焦于这些数据服务的公司可能会有比较好的机会;从下游来看,一些能够结合AIGC能力提升原有业务效率的方向值得关注。 出版业需培养以AI赋能业务的人才 □AI辅助创作对出版传媒产业有哪些影响?您对AIGC有怎样的看法?美国作家协会反对使用图书“喂养”人工智能技术,您对此如何看? ■最显著的积极影响是作者的创作效率会提高,在创作灵感和文段写作方面都能给到作者很大的裨益,优质作者的创作效率提高了,可以为出版行业带来更多优质的作品。之前比较成熟的AI辅助创作应用技术有标题、摘要的结构化写作,对于编辑在编校书籍,增加一些概述性的标题、内容简介时可以有帮助。而ChatGPT这样更智能的新型生成式对话机器人的出现,可以更灵活地为编辑提供编校思路等。 除了出版行业,早前在传媒行业也有很多成熟应用,比如生成一些格式相对固定、但对时间要求比较高的简讯报道,很早就在地震等灾害报道或财经、体育等时效性较强的资讯报道中加以应用。而后续一些内容更加灵活的报道也可以运用生成式对话机器人辅助完成。 但需要注意的是,伴随着AI降低创作门槛,也可能浮现出不少低质量的投稿,出版业对于投稿类作品的筛选难度可能加大。此外,维护AI创作作品版权的法律法规尚不完善。 美国作家协会对于用图书喂养AI的担忧,我认为可以理解,但并不能将人工智能完全视为敌人。当有了丰富的图书训练语料后,AIGC技术就可以帮助作家更好地创作内容、提升写作效率。我们要辩证地看待新技术的两面性,不能一味地反对它的发展。无论是出版业还是传媒业,若要赶上AIGC的东风,就必须培养能够运用AIGC工具赋能业务的人才,以此来推动行业发展。 AI的未来是信息维度的共同富裕 □您预测文心一言未来会激起多大的水花?热度会持续多久?GPT或文心模型在革新几代后会是元宇宙时代或人工智能时代的奇异点吗? ■自从文心一言发布会以后,出现了许多ChatGPT和文心一言的对比报道。虽然在某些性能方面,文心一言还比不上GPT-4,但在一些特殊领域还是有优势的。比如,之前量子位的报道就从文学创作、商业文案创作、数理逻辑推算、中文理解和多模态生成5个方面对比了二者,文心一言在内容和速度表现方面都不存在明显短板,在重点宣传的中文语言理解能力方面,与GPT-4相差也不大,但对中国文化的理解上表现优异。 GPT-4和文心模型都对元宇宙时代内容生成效率的提升具有重要意义,也是人工智能发展的重要里程碑,是元宇宙时代或人工智能时代的奇点。 □未来AI会成为生活的标配,在这一“升维”过程中,我们会有怎样的经历感受?是否会有“阵痛期”? ■AI在“升维”到未来的过程中,本质是科技带来的生产力的提升,在生产力提升的同时,短期内传统生产关系也会受到冲击,社会的方方面面都会因受到影响而产生阵痛。就像最近大家讨论比较多的“机器替代”问题,短期内原先从事创意附加值较低工作的人,可能会被替代,造成短期的失业。但阵痛期是为长期发展作铺垫的,AI可以让人类更加专注于更具创造性的工作,例如思考社会影响、分析现象本质等高价值的问题,而把组织文段等工作交给AIGC工具来做,长期来看是有利于文明进步的。 □您认为,GPT类产品会加大数字鸿沟吗? ■我觉得,当GPT类产品足够普及时,反而会缩小数字鸿沟而非加大。这类产品可以让获取信息的门槛变得更低,比如过去不会使用电子产品和搜索引擎的人想要获取信息无疑是困难的。但有了GPT类产品加上语音处理模块,人们只需要把自己想要查询的信息描述出来,接入文字转语音的GPT类产品就会直接生成答案。如此来看,GPT类产品其实缩小了数字鸿沟与信息上的贫富差距,促进了信息维度的共同富裕。 □如果您来设计人工智能,你最想它拥有的功能是什么?为什么? ■如果不考虑技术实现,我最想让它拥有的功能是通用性的决策能力。这其实也是很多科幻电影里描绘最多的人工智能的样子,在驾驶宇宙飞船的过程中,人工智能可以帮助规划安全的飞行路线,给出各种突发状况的解决方案,甚至有任何疑难问题的时候都可以请教它,让它给出数据层面的决策建议。现在虽然已经有很多专业领域的AI决策应用,但还做不到科幻电影里的决策广度。 工作是被掌握AI工具的人淘汰的 ■刘兴亮(DCCI互联网研究院院长、知名互联网学者) 目前市场已经存在的生成式预训练语言模型和产品包括GPT-4、基于GPT-3.5的ChatGPT、文心一言和New Bing,这4种模型有一些本质的区别。首先就是多模态的问题,GPT-4和GPT-3.5之间的第一个区别就是多模态问题,GPT-3.5模型只能处理文字,而GPT-4可以处理图片。第二,GPT-4在处理结果上也更加准确。第三个区别是GPT-4能够处理更复杂的指令,读取和生成的文字篇幅可以达到2.5万字。New Bing和GPT模型也不太一样,它首先是一个搜索场景,因此会回答得丰富得多,是2种不同的场景和产品形态。文心一言和以上3种模型在文字处理上大同小异,除了拥有可以输出图片、视频的能力,文心一言对于中文的理解更强,这是它的亮点。 人工智能:是颠覆还是赋能?自从语言模型在国内引起舆论风暴后,很多人都在问,“是不是我要失业了?”“这种人工智能对我自己的行业有什么影响?”OpenAI和宾夕法尼亚大学的相关研究人员在预印本网站arXiv上,发布了一篇有关语言大模型对劳动力市场潜在影响的论文,论文结论指出,对于约80%的美国人来说,至少10%的工作任务会受到大模型的影响;此外有约19%的人的工作任务受影响的比例超过50%,受影响的职业包括记者。因此毫不夸张地说,人工智能对传媒行业的影响将会是巨大的,甚至传媒行业可能成为第一批次被冲击和影响的行业。假设办一个互联网大会,3天的会议素材如果用人工处理,即使是高效率的人,起码也需要2~3天,但如果由AI来完成,只需要20分钟,包括添加字幕、自动分发等等,只要你可以传达正确的指令,AI甚至还可以根据不同平台内容进行不同尺寸、不同内容框架的制作。 这当然是非常消极的一种说法,乐观地看,AI让所有以脑力劳动为主的行业中的个人都拥有了一个智能助理。几乎所有人都在问,哪个行业会被代替?360行难以穷尽,但是总结规律来看,具备了以下两个能力的人很难被AI代替:第一就是提问的能力,提出一个有价值的问题是很需要积累和深度思考的;第二就是纠偏答案的能力,可以类比搜索引擎的“搜商”,一个人能多大程度地利用AI得到自己想要的答案,这在未来是一种基础能力。工作不是被AI淘汰的,而是被那些掌握AI工具的人淘汰的。掌握AI工具,在生活和工作中就会如虎添翼。 对传播格局来说也是如此,AI可以把传播权力赋能到个人,也可以帮助个人筛选信息,在人工智能的筛选下,人们只需要看到最先发布或最权威的消息。未来的传播链条中,人们会更关注于自己需要的内容,因此新闻媒体属性、传播范围等都会发生大的变革。因此,未来在垂直内容领域,对于头部媒体来说是一种话语权的上升,其传播内容也会更加细分化。 搜索引擎大变局?人工智能除了信息处理能力外,更让人关注的是百度、谷歌、微软在搜索引擎方面的竞争。将大模型套嵌进入搜索引擎之后,搜索引擎格局会发生怎样的改变?Gmail创始人保罗·布赫海特(Paul Buchheit)反复强调GPT模型会颠覆搜索引擎、摧毁谷歌,就像当初搜索引擎摧毁网络黄页一样。我的观点没有那么激进,我认为目前的生成式对话机器人只做到了可用,还做不到可信。目前的大模型训练内容中,还存在很多错误内容。搜索引擎的逻辑是,当用户输入关键词或输入问题的时候,搜索引擎会给出很多答案供其选择和辨别。但是对话模型的原理在于,除了极个别特殊问题它会回答“不知道”以外,99%的场景下,即使不确定的问题,它都会给你一个答案,就会出现所谓“一本正经地胡说八道”,这是因为产品的原理不一样。 所以短期来看,GPT类产品还取代不了搜索引擎,并且搜索引擎和GPT类产品是相辅相成的。就像New Bing一样,让用户自己选择,是想和它聊天还是沿用传统搜索模式,把选择权交给用户,不要替用户去做选择。未来往远了不好说,至少短期两三年内二者是互补的关系。 应用赛道才是真机会。文心一言正式发布后受到了不少“冷嘲热讽”,但它确实有自己的优势,那就是更懂中国。我们可以理解为,未来通用的串联GPT类产品更多地是一种路径,需要更垂直深入进各行各业,在专业知识方面,AI比人类会做得更快更全面。生成式大模型目前的赛道虽然是科技巨头的赛道,但初创公司依然有自己的机会,即在于如何能将自己的业务内容和GPT类产品更好地结合,让大模型的内容和结果赋能自己的产业内容。3月16日微软发布由GPT-4模型驱动的Copilot人工智能服务,适用于Word、PowerPoint、Excel、Outlook等Microsoft 365商业软件,主要运用于工作场景,帮助用户生成文档、电子邮件以及幻灯片等。这是一个很好的例子,未来我们会看到医疗、电商、物流、传媒等领域与大模型结合的创新,这是未来“众生”的机会。 面对AIGC,传媒工作者需调适角色定位 ■陈 丹(北京印刷学院新闻出版学院院长) 在我国,AI的发展得益于政策支持、资本投入、人才基础,以及不能缺席的企业家精神。智能家居、艺术创作、自动驾驶等,都是我们能日常能够接触到的AI应用领域。传媒界尤其关注AIGC(人工智能生产内容),这方面的挑战和机遇并存。最近,来自北京大学的研究团队推出了辅助办公的ChatExcel,“动动嘴皮子就把表格改完了”。这代表了一个趋势,即依托于大语言模型的人工智能,未来将更加广泛地与既有的专业工具融合,降低学习成本和使用门槛,显著提升生产效率。 这种基于语言模型的人工智能以及生成式对话模型对传媒业的影响是全方位的,但核心还要归于AIGC,这也是现在学界业界广泛讨论的话题。人工智能微软小冰出版诗集《阳光失了玻璃窗》,已经接近6年的时间了,当时它给普遍认为人工智能只能用来写程式化文稿的传媒界,带来了很大的认知冲击。去年年底,OpenAI公司推出了ChatGPT,它基于大规模语料库和生成式模型,具有十分强大的通用性能力和逻辑推理能力,甚至超越了很多AI从业者的设想。北京时间2023年3月15日凌晨,ChatGPT发布了4.0版本,性能进一步提升,拥有多模态能力,甚至可以接受图像输入并理解图像内容。基于ChatGPT的技术路线,它更加适合解决复杂的AIGC问题,再一次引发传媒界的关注和震动。 国内,2月7日百度官宣文心一言,也就是国内版“ChatGPT”后,先后有650家企业接入其中,但这只是绝对数字看起来较大,在全部机构这个总量面前仍然只是很小的一部分。根据李彦宏在内部信中透露的信息,百度的搜索、云服务、自动驾驶、智能硬件等都将接入文心一言。这从一个侧面能够反映出它广阔的应用空间,也是这些机构竞相接入的基本前提。 创新扩散需要一个社会过程,最近10多年来,相关机构在AI的传播和普及方面做得较好,AI领域也确实产出了一些效益良好的项目,尤其最近国外一些企业利用ChatGPT提升效率、降低成本,将创新扩散的进程快速推进到一个新高度。因此而剧烈发展的AIGC可能将内容爆炸推向新的高潮,识别、判断和鉴赏高质量内容的能力将进一步成为拉开人与人差距的关键之一。生成式对话机器人对工作中各个流程的微观渗透可能十分快速和深入,辅助、引导创作和生产过程,提升产业效率。因此,传媒工作者要明确人类工作者的主体地位,并基于技术现实,有效调适自己的能力和角色定位。 不过,人工智能生成物的可版权性和版权归属问题,在经历了前几年的集中讨论后,有待各国的立法和司法实践检验。未来,可预期的一类关键影响,可能表现在伦理层面——如何规范用户的使用行为,使其在负责任的框架内创造价值;如何借由人工智能填平数字鸿沟,而非因个体判断能力的缺失导致认知和公平正义层面不平等的加剧。同时还要看到,国家安全、隐私保护、政策环境、系统兼容等因素无不在不同角度发挥着关键影响,尤其是不同硬件商是否有意愿打破既有利益格局,其中的博弈错综复杂。因此可以说,具体的某一个生成式对话机器人的未来有很大的不确定性。 马克思主义认为,量变会引起质变;库茨维尔定理指出,一旦信息和经验积累到一定的程度,技术就会以指数的形式快速发展。GPT是诸多技术路线中的一种,当前的确体现出一定的技术优势,获得了市场和资本的青睐。随着其算法的改进、训练数据和参数的不断丰富,其能力有较大概率会实现质变,但仅此依然难以认定其会成为元宇宙时代或人工智能时代的奇异点——我们很难预料其他路线的技术爆炸。 GenAI是对内容生产方式的革新 ■汤 杨(龙源创新数字传媒(北京)股份有限公司执行总裁) 对于各行各业,特别是对于出版传媒行业而言,所有的Generative AI(GenAI,生成式人工智能)都会是一个重大创新。如果互联网是对传播方式为主的革新,那么GenAI就是对内容生产方式的革新。它的革新点,让知识和知识人,摆脱了内容生产成本的束缚、对媒体介质的束缚,甚至摆脱了文笔能力的束缚。这个革新我们必须拥抱,而且应该带着摩拳擦掌跃跃欲试的态度。这个世界上有很多人是具备真知灼见的,但是他们的言辞未必优美,很多内容因此埋没,GenAI的出现让这些人凭借核心认知,就可以生成适合传播的内容。两个极端的比喻,一个6岁的孩子,还没有形成真正的自我价值观和见解,赋予再多工具也很难生产出好内容。反之如果霍金还活着,利用GenAI可以把自己对这个宇宙的理解,表达得淋漓尽致。 百度推出的文心一言是一款类GPT产品,也是中国自己的生成式对话人工智能,相比GPT模型更懂中文。内测有650家企业接入文心一言,这是趋势,也是必然。面对大模型领域的商业空白,出版业站在选择的十字路口,是否该利用大模型技术与产业结合或者为大模型贡献内容。我认为,出版业肯定应该无一例外地对大模型进行应用,特别是付费应用,相比于人工和传统技术服务,其效果和成本性价比都极高。 但如果想要将内容接入某一个大模型,我则建议要慎重。版权内容进入大模型和内容上网是不同的,内容上网是可逆的,内容可以下线。但是一旦进入大模型,其过程是不可逆的。龙源也正在联合出版业、传媒集团积极探讨与文心一言的合作路径。我们要极力避免近一个世纪生产的内容,最后成为了某一家或多家公司的私有财产,而内容的创作者完全没有回报和收益。但是同时,如果站在国家竞争力的角度,出版单位是否能聚合中华民族的集体智慧,打造出中国领先于世界的GenAI,是需要平衡和探讨的问题。如果所有的版权内容都不进入大模型,无论是哪家公司的大模型对中文世界的服务都不可能是最好的。 龙源目前也在积极拥抱人工智能。我们正在为出版行业研发一套利用GenAI进行内容确权、选题、生成、汇编、传播等的全产业链内容生产辅助工具。如果说文心一言/GPT等同于互联网时代的HTTPS协议,那么龙源做的是网站和APP这种可被广泛使用的应用, 我们在2022年底已经上线了“知识树”平台,其定位就是利用AIGC技术,成为出版产业的AI赋能和应用平台。 不少出版人对AIGC保持警惕态度,我并没有这样消极。最让我兴奋的是,现在有至少80%的知识精英并没有在创作内容,随着AIGC的赋能,这一情况一定会改变。之前时尚领域有一句玩笑,说8000元月薪的编辑在教月薪8万元的人怎么穿搭,而未来更多真正有知识的人可以低门槛地创作内容。目前可以看到的AIGC最简单的应用是减少出版企业的内容生产成本,创收应用是把每一本书都变成一个机器人,用户看了书后可以和这本书对话、答疑解惑。龙源近期就会推出这样的解决方案,我们将和出版传媒同行一起,借力通用平台技术成果共创AIGC驱动的数字化新格局。 来源:中国出版传媒商报 | 张馨宇
|