ChatGPT,能成为新的「维基百科」吗?
手机网易网 2023-05-14 10:56:53

今日看点

9min read

ChatGPT,能成为新的「维基百科」吗?


(资料图片)

Moonshot2023/05/13

摘要

维基百科胜在知识结构清晰,ChatGPT 长于具体问题,双方未必不可调和。

22 年前,2001 年初,维基百科 Wikipedia 横空出世,在其后的互联网时代,成为人们获取知识的重要平台。

但在刚开始,人们对维基「人人可编辑」的组织形式产生过质疑。甚至有电视主持人讽刺其为「wikiality」,即如果在维基百科上编造条目,只要有足够多的人同意,它就会成为现实。

后来,随着《自然》(Nature)杂志的调查研究,发现维基百科准确度接近大英百科全书,Google 开始把维基百科放到搜索结果的首项,维基社区和内容贡献者也持续壮大,维基百科用了很多年时间终于取得了公众的信任。

诞生之初遭到质疑,越来越多人参与去完善,而后平反收到大众认可,继而成为日常的工具,这一过程,仅诞生半年的 ChatGPT 正在经历,不仅于此,它还成为了维基百科的挑战者。

不久前,维基媒体基金会召开 2023-2024 年度计划的电话会议,会议中提及了 35 次 AI,讨论的主题也是围绕 ChatGPT 带来的挑战。

但维基百科所担心的挑战,并不是被 ChatGPT 取代。而是更深刻地考验:未来的维基百科,会由 ChatGPT 来撰写吗

维基百科的内容哪里来的?

要想知道 ChatGPT 能否撰写维基百科,得先知道维基百科目前内容来源于哪里。

维基百科主要是由来自互联网上的志愿者共同合作编写而成,任何使用网络进入维基百科的用户都可以编写和修改里面的文章。它是互联网上一个极大的自由内容、公开编辑、多语言的网络百科全书协作计划。

截至 2021 年初,所有语种的维基百科条目数量达 5500 万条,如何确保内容上的准确,全靠维基社群志愿者们的筛查。

在 ChatGPT 出现前,维基百科已经长期在用 AI 去减少一些人力成本。应用最多的就是把现有条目直接机器翻译,再由人工编辑校对。

2016 年时,资深科学家 Aaron Halfaker 开发了一套开源机器学习算法,可以自动识别维基百科里那些恶意破坏条目和编辑假消息的行为;2020 年,MIT 的研究人员也为维基百科推出过基于 AI 的修改功能,可以精确定位维基百科句子中的特定信息,并自动替换为类似于人类编辑的语言。

Wikipedia 关于 ChatGPT 的页面|Wikipedia

以及如维基社群所述,人工智能非常擅长总结把一篇很长的技术类条目,总结成儿童都能理解的版本,让 AI 去生成儿童版的维基百科效果很好

翻译、检查、概括简化已有内容,维基百科一直以来对 AI 的应用仅限于此,直到大型语言模型 ChatGPT 的出现。

目前仍以文字方式交互为主的 ChatGPT,除了回答用户直接的提问以外,还可以用于甚为复杂的语言工作,包括自动生成文本、自动问答、自动摘要等等。

ChatGPT 可以写出相似真人的文章,并在许多知识领域给出详细和清晰的回答。哪怕 ChatGPT 生成内容的事实准确度还需要人工去二次查阅,但这时维基百科面临的问题已经很明显了:志愿者能否用 ChatGPT 来撰写维基百科条目?

能不能和想不想

纽约市维基媒体分会的老维基人 Richard Knipel 就用 ChatGPT 在维基百科上起草了一个名为「艺术作品标题」的新条目,Knipel 表示,ChatGPT 给出的版本一般但语法正确,定义了艺术作品标题的概念,给出了从古至今的例子。他在草稿基础上只做了轻微修改。

但另一位编辑在条目上标注,将会进行大量修改并完善。如今,我们再点进这一条目,会发现它增加了大量内容和理论索引,还梳理出了目录,给出了图片案例。像 Knipel 这样的维基人认为,ChatGPT 可以作为生成维基百科条目草稿、骨架的工具,在此基础上,人工再验证内容,编辑和充实条目

但另一派维基人则认为,在维基百科条目的创作里 ChatGPT 应该完全被禁用。一位维基百科编辑就表示「我们应该强烈呼吁不使用 AI 工具来生成条目草稿,即使这些条目随后会被人工审阅。ChatGPT 太擅长引入那些看起来很有道理的谎言。」

ChatGPT起草,人工简单编辑的版本|Wikipedia

人工大量干预后产生的版本|Wikipedia

但另一派也反驳这种说法,就像 Knipel 认为,修改并丰富不完善的信息,这就是维基百科在实践中一直运作的方式。ChatGPT 将继续存在并飞速发展,利用它同时强调人工干预的必要性怎么就不行呢?把 ChatGPT 上来就视作洪水猛兽实在有些偏颇。

但在想不想之前,我们先看看能不能。ChatGPT 还够不够格直接编写维基百科呢?

3 月 30 日时,维基百科创始人 Jimmy Wales 在接受 Evening Standard 采访时讨论了这个议题。Wales 认为,让 ChatGPT 能独立写一个完整的维基条目,目前还有一段距离,但距离多远就难说了。「ChatGPT 的一大问题是会胡编乱造,业内把这种情况称为 hallucinating(幻觉)——我称之为编瞎话。」(One of the issues with the existing ChatGPT is what they call in the field 『hallucinating』—I call it lying.)

「ChatGPT 有一种凭空捏造的倾向,这对维基百科来说真的不太行。」Wales 在采访里说道。实践中也是如此,你在维基百科上搜一个词,维基百科可能会反馈「该条目不存在」,但你问 ChatGPT,它可能会给你生成一段没由头的假消息。

ChatGPT 会「说瞎话」,这种事已经不新鲜了。但 ChatGPT 诞生仅半年,它的自我迭代能力已经令人咋舌,让 ChatGPT「句句吐真言」,似乎只是时间问题,那维基百科现在担忧的是什么呢?

人力有限,算力「无限」

维基百科团队并没有那么担心内容到底来源于人类还是 AI,它担心的是内容质量是否过关。

在维基媒体基金会在电话会议总结报告里,「挑战」被放到了开篇,其中最大比重的部分,也是维基百科团队最大的担忧在于:维基百科涌入大量 AI 生成的内容,把真正高质量的、正确的信息给淹没了

「Wiki 项目有大量高质量的、可靠的,结构化的、分类好的内容。这就是我们带给世界的价值。最让我害怕的不是人们使用 GPT 之类的大语言模型来获取知识,而是需要巡查的 AI 生成的内容会爆炸式增长。

对高质量内容来说,创作比消费的时间成本高很多,就像一篇较为完整的维基条目,需要许多人参与撰写,花许多时间,走过很多流程后完成,对读者来说几分钟就阅读完了。

像维基百科这种平台,为了保证内容质量,还需要专业人士核查一条条目中每个信息、数据、引用是否来源准确,筛查和编辑的成本同样很高。因此 AI 生成内容越多,人工核查的时间也更长。而且哪怕 ChatGPT 给出了正确的结论,但它并不会直接给出结论的论据来源何处,人工还需要再找到论据。到最后,修正可能比撰写耗时更长

Wikipedia 的条目下会有很多延展阅读链接|Wikipedia

目前维基百科志愿者们已经发现了许多 ChatGPT 自动生成内容上的问题。比如 ChatGPT 很容易太笼统地概括定义,导致表意不明。还有 ChatGPT 遣词造句过于肯定,不够匹配维基百科想呈现的客观中性的文字风格。

最重要的是信源难以查询,维基百科的可信度和扩展阅读性,很大程度上是基于条目底下丰富的信息参考来源,但 ChatGPT 不会主动提供参考,甚至会凭空捏造。

担任了 20 年维基百科志愿编辑的 Andrew Lih 在用 ChatGPT 起草新条目时就发现,ChatGPT 概述定义做得很不错,但它所提供的消息来源于《福布斯》、《卫报》、《今日心理学》,但 Lih 仔细查阅后发现,这些信源文章并不存在,甚至 ChatGPT 给出的 URL 都是自动生成找不到页面的假链接

综上,维基百科团队直接表示,AI 生成内容的速度和效率,可能会超出项目的运行能力。

除此之外,还有许多维基百科团队会担心的点,比如如今的维基百科贡献者里,使用英语的白人男性依旧是主体,维基内容已带有语言和内容偏见,ChatGPT 靠吸纳互联网信息为养料的 AI 机器,生成出的内容会进一步放大偏见。

Wikipedia 联合创始人 Jimmy Wales 在接受 Standard 采访时谈及AI参与撰写维基的问题|Standard.co

维基百科团队也无法把握志愿者对 AI 工具使用的倾向。Lih 就认为,维基人不缺动力,缺的是时间,ChatGPT 生成的糟糕草稿,可以激发维基志愿者的修改欲。这也符合维基之父 Ward Cunningham 所提出的「坎宁安定律」:在互联网上得到优秀答案的最佳方法不是去提问而是发布一个错误的答案

维基百科团队还担心,当维基百科充斥着 AI 生成的内容时,用户们会降低对它信息的信任度,转而去信任更有「人类作者」标识的媒体内容,比如会出镜的视频,标记了作者的媒体报刊。

就不能共存吗

维基百科和 ChatGPT 有很多相似性,比如都以文本为主,试图「回答一切」。但二者最显著的区别,在于回答方式的不同

维基百科是有框架、系统、详细索引的百科式信息,你点进一个条目,可以从最简单的概括式介绍了解到其历史的变化,通过条目里丰富的扩展链接,可以在纵向里深入了解,也能在横向里在不同条目之间跳转,扩展对一整个领域的了解。

ChatGPT 目前呈现出的还是提问式的交互,需要用户明确了解自己想知道的问题,向外扩展也是需要建立在 ChatGPT 给出的回答之上,进一步询问。

不同用户获取信息的倾向不同,选择工具也不同,维基百科无法做到 ChatGPT 一样能回答非常具体的问题,ChatGPT 也不会像维基百科一样有那么精准且梳理好的知识类信息。这二者的使用方式,就像我们选择阅读教科书,还是直接向教授提问。

就像维基百科并没有因为搜索引擎 Google 的崛起而磨灭,反而它会出现在 Google 搜索结果的第一条和边栏上。

维基百科团队也并没有如 Google 一般有那么大的危机感,在年度会议里,虽然开篇点了 ChatGPT 带来的挑战,但整个会议更多的时间留给了「机会」。

「当互联网上有大量 AI 生成的内容时会发生什么?在一个由数万亿个低质量、低可信度的页面组成的互联网,创建大模型的人和用户都需要去找到可靠的信息,他们可能会更多地使用维基百科。」这就是维基人眼中的「机会」。

利用大语言模型去查 bug、翻译、内容总结、丰富媒体形式,比如 GPT-4 中体现的视频生成,AI 生成的图片也可以放到很多抽象概念的条目里,增加可读性,还可以在文本和语音之间互相转换。

但以上的前提,都是不能让大语言模型打打辅助,不能喧宾夺主。「维基百科是关于人类聚集在一起试图定义真相。这些工具不可靠,会分散我们对实际任务的注意力。我们应该小心要以多快的速度追赶这一趋势,而不是放弃它。我们应该关注创造知识的人。」

维基百科团队的态度,也折射了我们当下对 AI 的审慎态度。没有被取代,想充分利用 AI 的同时不够信任它,想发挥 AI 的最大价值,但真正有价值的内容又不敢轻易交付,难以放下人类本位的核心概念,谨慎地靠近,小心地追赶。

维基百科如何和大语言模型共存,或许就回答了我们人类如何与 AI 共存。

Wikipedia维基百科ChatGPT

ChatGPT,能成为新的「维基百科」吗?

2023-05-14 10:56:53

手冻疮的治疗方法_冻疮的治疗方法_全球最资讯

2023-05-14 09:54:20

十二星座的脾气排名表_十二星座的脾气排名|每日热门

2023-05-14 08:42:18

2083材料硬度_2083是什么材料

2023-05-14 07:42:47

华中农业大学学生邮箱登陆(华中农业大学邮箱登陆)

2023-05-14 06:31:36

诺奖得主警告:美对华“敌对”政策或使世界分裂

2023-05-14 04:55:27

环球快播:丝绸之路的资料和故事介绍_丝绸之路的资料和故事

2023-05-14 01:40:33

天天亮点!振水音查体_振水音检查多少钱

2023-05-13 22:46:56

湖里区建设行业协会企业合规经营指导中心揭牌

2023-05-13 21:37:00

黎巴嫩主帅去年8月上任至今,率队三场国际A级赛事全败且一球未进

2023-05-13 20:02:21

大乐透23053期分享:不为模糊不清的未来而担忧,只为现在而努力|精选

2023-05-13 19:54:10

意大利驻华使馆澄清签证停办传闻:毫无根据

2023-05-13 18:42:10

天天头条:网贷卡号错了要交6000解冻金怎么追回?简单一文进行探讨

2023-05-13 17:22:52

皮划艇世界杯匈牙利站:中国队夺得女子500米四人皮艇冠军 全球热推荐

2023-05-13 16:25:21

每日消息!G7财长对美国债务危机发出警告:全球经济不确定性将加剧

2023-05-13 15:09:09

疑似侮辱女性?“五个女博士”涉低俗广告宣传被立案调查

2023-05-13 14:30:21

身体和大脑同奔跑!杭州创业马拉松“创橙橙”跑团首站活动钱塘江畔开跑-天天观速讯

2023-05-13 13:14:08

世界资讯:中国足彩网竞彩13日推荐:大巴黎有望大胜

2023-05-13 12:08:27

大钦岛乡:植树造林添新绿 美化海岛护生态_当前热门

2023-05-13 11:59:09

万家年年恒荣C基金经理发生变更|世界动态

2023-05-13 11:02:15

当前热点-鸿蒙3.0操作系统 华为Mate 50高配版到手价4499元

2023-05-13 10:01:02

今日热议:太奇怪!高铁被打女素质低,说太多脏话,为何很多人还强烈支持她

2023-05-13 09:05:21

中国建筑(601668):5月12日北向资金减持535.49万股_速看料

2023-05-13 08:27:49

中粮糖业:融资净买入1060.68万元,融资余额7.58亿元(05-12) 焦点播报

2023-05-13 07:34:53

全球热讯:奇门遁甲金口诀图解_奇门遁甲金口诀

2023-05-13 06:06:17

世界今日报丨5d开奖体彩5d开奖结果 体彩5d开奖结果

2023-05-13 04:19:11

环球今日报丨春夏秋冬分别是哪几个月的几号 春夏秋冬分别是哪几个月

2023-05-13 01:13:11

东北春耕正忙,地里农民为何减少了?——东北三省粮食生产蹲点调研之四_世界热文

2023-05-12 22:56:14

全球动态:旧谣新传博眼球 杜撰政策行骗局——中国互联网联合辟谣平台2023年4月辟谣榜综述

2023-05-12 22:07:55

每日讯息!艾灸治疗白内障的方法_治疗白内障的方法

2023-05-12 21:11:09

AI防火 四川全省已共享近1000个高点哨兵 世界要闻

2023-05-12 20:52:02

2023世界动力电池大会全球推介会在北京举行 宜宾再次向世界抛出“橄榄枝”_环球即时

2023-05-12 19:58:22

环球焦点!埃安销量持续高增,广丰恢复增长

2023-05-12 19:39:12

2023大专男生最吃香的十大专业有哪些

2023-05-12 19:06:43

飘落的树叶像什么写一个比喻句_飘落的树叶像什么

2023-05-12 18:26:42

宪法与普通法律的关系_宪法和法律委员会

2023-05-12 17:59:38

省队教练去世乒赛,陈幸同和王艺迪教练没去,陈梦的教练也没去_今日快看

2023-05-12 17:27:25

以康复新品牌打通创面修复之路,好医生助力中药品牌高质量发展-焦点短讯

2023-05-12 16:59:32

世界百事通!圣骑士汽车为什么没有生产越野汽车?为什么没人玩圣骑士?

2023-05-12 16:55:21

博扬:梅西令人难以置信,但小罗是心中最佳&总是微笑着施展魔法 全球观天下

2023-05-12 16:11:56

快乐翻倍!一机多用厨房小家电大搜罗

2023-05-12 16:10:02

054期樊可双色球预测奖号:历史同期奖号定位分析|讯息

2023-05-12 15:42:34

集美大学诚毅学院举办“诚毅讲坛”建院20周年系列学术讲座——当前婚姻家庭领域的热点法律问题_天天观点

2023-05-11 19:25:35

“凤舞楚天”扮靓湖北馆 全球今亮点

2023-05-11 17:57:22

2023年破壁机行业现状分析:九阳占破壁机市场销售份额35.5%-全球热消息

2023-05-11 17:21:26

黄河诗词大赛特别报道:任城,千古文脉里的诗意儒风-天天快讯

2023-05-11 16:55:59

央行:4月新增信贷7188亿元 M2同比增长12.4% 社融增量为1.22万亿元

2023-05-11 16:37:32

“大厂垄断大模型”,会被开源终结吗?

2023-05-11 16:14:31

世界信息:人力资源管理是干嘛的(人力资源管理的职位有哪些)

2023-05-11 15:47:09

【利威尔bg】与君同行 第六十三章

2023-05-11 15:07:33

【世界新视野】鹏鼎控股(002938)2022年年报及2023年一季报点评:主业稳健 汽车+服务器助力成长新动能

2023-05-11 14:21:39

深圳社保缴费标准2020年11月_深圳社保缴费标准2020 当前关注

2023-05-11 14:05:02

动态:佛山美的鹭湖爱丽丝庄园夜场营业时间

2023-05-11 13:14:22

【环球速看料】辰溪县:政法干警下基层,立足职能携手共绘振兴新图景

2023-05-11 12:36:15

焦点速讯:午评:沪指连续补跌,创业板涅槃重生!

2023-05-11 12:04:27

部分东南亚机票价格腰斩 节后机票价格大跳水

2023-05-11 11:31:54

全球简讯:热情服务暖民心 群众满意送锦旗

2023-05-11 11:02:21

市水利局召开全市水旱灾害防御暨水利工程运行管理工作会

2023-05-11 10:56:34

滚动:闲人愁多,懒人病多,忙人......

2023-05-11 10:23:05

贾玲“整容式”近照曝光:暴瘦40斤,颜值逆天,我却笑不出来......

2023-05-11 10:03:37

四川:前3月跨境电商进出口交易规模为295.4亿元|世界热消息

2023-05-11 09:37:43

世界新动态:营业执照一般多长时间有效期

2023-05-11 08:55:06

史上最耐用铰链!谷歌Pixel Fold折叠屏手机发布:处理器独一无二_天天观点

2023-05-11 08:48:30

威创股份收到深交所年报问询函 公司称:今年发展会正常化-世界观点

2023-05-11 07:47:26

天天观察:强信心·开新局|河北一季度外贸运行一线观察:增速加快 品质提升

2023-05-11 07:06:35

全球消息!琴斯托霍瓦拉科夫足球俱乐部_关于琴斯托霍瓦拉科夫足球俱乐部介绍

2023-05-11 06:07:03

全球极濒危树种资源冷杉野外回归第二期工程启动

2023-05-11 04:58:59

毕竟的意思是什么呢_毕竟造句 天天热推荐

2023-05-11 02:57:22

吕四港念五总村江素芳:坚守30年,为村民撑起健康保护伞

2023-05-11 00:00:45

票投民进党,警察、女人都被推上战场-世界热门

2023-05-10 22:39:24

胜捷企业(06090)一季度收益同比增长5%至4710万新元

2023-05-10 21:38:05

当前时讯:应付账款周转率怎么算啊_请问应付帐款周转率怎样计算的 能详细列示吗

2023-05-10 21:09:54

阿里巴巴据悉取消首席技术官职位 拆分技术团队_天天速讯

2023-05-10 20:14:42

柘中股份(002346.SZ):董事长陆仁军辞职

2023-05-10 19:28:32

英雄联盟代练价格表图_英雄联盟代练 世界新动态

2023-05-10 18:58:25

看得见山、望得见水、记得住乡愁 外国网红打卡商丘时庄文化艺术村(视频)

2023-05-10 18:22:25

西安潮宏基今日黄金价格查询(2023年5月10日)

2023-05-10 17:50:37

朱元璋赐死宋国公冯胜

2023-05-10 17:10:23

火烧赤壁是谁的计谋_火烧赤壁介绍-每日看点

2023-05-10 16:59:37

陆奇最新大模型论断:中国要先赶上GPT-3.5 世界热资讯

2023-05-10 16:22:39

黑格尔为何只夸老子?如何评价古代的“人文宇宙”?

2023-05-10 15:48:12

每日视点!手机上的开发者选项在哪里(手机上的开发者选项在哪)

2023-05-10 15:41:28

喜报!普陀这个创意园获评优秀工业遗产保护利用示范案例

2023-05-10 15:10:04

六角恐龙鱼怎么养(蝾螈和娃娃鱼的区别)

2023-05-10 14:20:16

牡丹的花期是多少天 牡丹花哪时候开花呢|最新资讯

2023-05-10 13:47:27

终结的炽天使第二季出了吗 终结的炽天使第二季为什么和第一季一样_天天快资讯

2023-05-10 13:19:04

开封市顺河回族区:“四个强化”强力推动物业全覆盖

2023-05-10 12:54:12

世界微速讯:疑似不满大连人进球被吹,谢晖:我们那个球是5月的雪

2023-05-10 12:21:48

小区与公路存高度差导致护栏和出入口无法施工

2023-05-10 11:50:43

【全球报资讯】2022年平均工资出炉!

2023-05-10 11:16:19

“春雨工程”——文化和旅游志愿服务边疆行计划启动_当前关注

2023-05-10 10:51:15

诸葛找房王小嫱:关于5月8日两部门十方面举措加强房地产经纪机构管理政策的点评

2023-05-10 10:18:58

《信访工作条例》实施一周年主题宣传暨全省第六个信访法治宣传月活动启动-焦点热闻

2023-05-10 09:57:56

LOL鬼蟹再度搞事情,将加快新英雄更新速度,大量英雄将被重做!

2023-05-10 09:47:09

中泰证券:生命科学服务行业景气度有望逐渐回升 全球实时

2023-05-10 08:58:24

内外微调 比亚迪海豹冠军版将于5月10日上市

2023-05-10 08:26:36

当前快看:山东每年将组织实施100项重大科技创新工程项目

2023-05-10 08:05:48

环球热头条丨A-史密斯:如詹姆斯能在38岁拿下第五冠 值得讨论他能否超越乔丹

2023-05-10 07:12:18

紧急避孕药月经会推迟多久(紧急避孕药月经会推迟几天)

2023-05-10 06:11:01

杨绳苕_关于杨绳苕概略 环球快看点

2023-05-10 05:07:50