-
维基百科:ChatGPTorNot?这是一个问题
维基百科胜在知识结构清晰,ChatGPT 长于具体问题,双方未必不可调和。作者 | Moonshot编辑| 靖宇22年前,2001年初,维基百科 Wikipedia 横空出世,在其后的互联网时代,成为人们获取知识的重要平台。但在刚开始,人们对维基「人人可编辑」的组织形式产生过质疑。甚至有电视主持人讽刺其为「wikiality」,即如果在维基百科上编造条目,只要有足够多的人同意,它就会成为现实。后来,随着《自然》(Nature)杂志的调查研究,发现维基百科准确度接近大英百科全书,Google 开始把维基百科放到搜索结果的首项,维基社区和内容贡献者也持续壮大,维基百科用了很多年时间终于取得了公众的信任。诞生之初遭到质疑,越来越多人参与去完善,而后平反收到大众认可,继而成为日常的工具,这一过程,仅诞生半年的 ChatGPT 正在经历,不仅于此,它还成为了维基百科的挑战者。不久前,维基媒体基金会召开2023-2024年度计划的电话会议,会议中提及了35次 AI,讨论的主题也是围绕 ChatGPT 带来的挑战。但维基百科所担心的挑战,并不是被 ChatGPT 取代。而是更深刻地考验:未来的维基百科,会由 ChatGPT 来撰写吗?01维基百科的内容哪里来的?要想知道 ChatGPT 能否撰写维基百科,得先知道维基百科目前内容来源于哪里。维基百科主要是由来自互联网上的志愿者共同合作编写而成,任何使用网络进入维基百科的用户都可以编写和修改里面的文章。它是互联网上一个极大的自由内容、公开编辑、多语言的网络百科全书协作计划。截至2021年初,所有语种的维基百科条目数量达5500万条,如何确保内容上的准确,全靠维基社群志愿者们的筛查。在 ChatGPT 出现前,维基百科已经长期在用 AI 去减少一些人力成本。应用最多的就是把现有条目直接机器翻译,再由人工编辑校对。2016年时,资深科学家 Aaron Halfaker 开发了一套开源机器学习算法,可以自动识别维基百科里那些恶意破坏条目和编辑假消息的行为;2020年,MIT 的研究人员也为维基百科推出过基于 AI 的修改功能,可以精确定位维基百科句子中的特定信息,并自动替换为类似于人类编辑的语言。Wikipedia 关于 ChatGPT 的页面|Wikipedia以及如维基社群所述,人工智能非常擅长总结把一篇很长的技术类条目,总结成儿童都能理解的版本,让 AI 去生成儿童版的维基百科效果很好。翻译、检查、概括简化已有内容,维基百科一直以来对 AI 的应用仅限于此,直到大型语言模型 ChatGPT 的出现。目前仍以文字方式交互为主的 ChatGPT,除了回答用户直接的提问以外,还可以用于甚为复杂的语言工作,包括自动生成文本、自动问答、自动摘要等等。ChatGPT 可以写出相似真人的文章,并在许多知识领域给出详细和清晰的回答。哪怕 ChatGPT 生成内容的事实准确度还需要人工去二次查阅,但这时维基百科面临的问题已经很明显了:志愿者能否用 ChatGPT 来撰写维基百科条目?02能不能和想不想纽约市维基媒体分会的老维基人 Richard Knipel 就用 ChatGPT 在维基百科上起草了一个名为「艺术作品标题」的新条目,Knipel 表示,ChatGPT 给出的版本一般但语法正确,定义了艺术作品标题的概念,给出了从古至今的例子。他在草稿基础上只做了轻微修改。但另一位编辑在条目上标注,将会进行大量修改并完善。如今,我们再点进这一条目,会发现它增加了大量内容和理论索引,还梳理出了目录,给出了图片案例。像 Knipel 这样的维基人认为,ChatGPT 可以作为生成维基百科条目草稿、骨架的工具,在此基础上,人工再验证内容,编辑和充实条目。但另一派维基人则认为,在维基百科条目的创作里 ChatGPT 应该完全被禁用。一位维基百科编辑就表示「我们应该强烈呼吁不使用 AI 工具来生成条目草稿,即使这些条目随后会被人工审阅。ChatGPT 太擅长引入那些看起来很有道理的谎言。」ChatGPT 起草,人工简单编辑的版本|Wikipedia人工大量干预后产生的版本|Wikipedia但另一派也反驳这种说法,就像 Knipel 认为,修改并丰富不完善的信息,这就是维基百科在实践中一直运作的方式。ChatGPT 将继续存在并飞速发展,利用它同时强调人工干预的必要性怎么就不行呢?把 ChatGPT 上来就视作洪水猛兽实在有些偏颇。但在想不想之前,我们先看看能不能。ChatGPT 还够不够格直接编写维基百科呢?3月30日时,维基百科创始人 Jimmy Wales 在接受 Evening Standard 采访时讨论了这个议题。Wales 认为,让 ChatGPT 能独立写一个完整的维基条目,目前还有一段距离,但距离多远就难说了。「业内把这种情况称为 hallucinating(幻觉)——我称之为编瞎话。」(One of the issues with the existing ChatGPT is what they call in the field 『hallucinating』—I call it lying.)「ChatGPT 有一种凭空捏造的倾向,这对维基百科来说真的不太行。」Wales 在采访里说道。实践中也是如此,你在维基百科上搜一个词,维基百科可能会反馈「该条目不存在」,但你问 ChatGPT,它可能会给你生成一段没由头的假消息。ChatGPT 会「说瞎话」,这种事已经不新鲜了。但 ChatGPT 诞生仅半年,它的自我迭代能力已经令人咋舌,让 ChatGPT「句句吐真言」,似乎只是时间问题,那维基百科现在担忧的是什么呢?03人力有限,算力「无限」维基百科团队并没有那么担心内容到底来源于人类还是 AI,它担心的是内容质量是否过关。在维基媒体基金会在电话会议总结报告里,「挑战」被放到了开篇,其中最大比重的部分,也是维基百科团队最大的担忧在于:维基百科涌入大量 AI 生成的内容,把真正高质量的、正确的信息给淹没了。「Wiki 项目有大量高质量的、可靠的,结构化的、分类好的内容。这就是我们带给世界的价值。最让我害怕的不是人们使用 GPT 之类的大语言模型来获取知识,而是需要巡查的 AI 生成的内容会爆炸式增长。」对高质量内容来说,创作比消费的时间成本高很多,就像一篇较为完整的维基条目,需要许多人参与撰写,花许多时间,走过很多流程后完成,对读者来说几分钟就阅读完了。像维基百科这种平台,为了保证内容质量,还需要专业人士核查一条条目中每个信息、数据、引用是否来源准确,筛查和编辑的成本同样很高。因此 AI 生成内容越多,人工核查的时间也更长。而且哪怕 ChatGPT 给出了正确的结论,但它并不会直接给出结论的论据来源何处,人工还需要再找到论据。到最后,修正可能比撰写耗时更长。Wikipedia 的条目下会有很多延展阅读链接|Wikipedia目前维基百科志愿者们已经发现了许多 ChatGPT 自动生成内容上的问题。比如 ChatGPT 很容易太笼统地概括定义,导致表意不明。还有 ChatGPT 遣词造句过于肯定,不够匹配维基百科想呈现的客观中性的文字风格。最重要的是信源难以查询,维基百科的可信度和扩展阅读性,很大程度上是基于条目底下丰富的信息参考来源,但 ChatGPT 不会主动提供参考,甚至会凭空捏造。担任了20年维基百科志愿编辑的 Andrew Lih 在用 ChatGPT 起草新条目时就发现,ChatGPT 概述定义做得很不错,但它所提供的消息来源于《福布斯》、《卫报》、《今日心理学》,但 Lih 仔细查阅后发现,这些信源文章并不存在,甚至 ChatGPT 给出的 URL 都是自动生成找不到页面的假链接。综上,维基百科团队直接表示,AI 生成内容的速度和效率,可能会超出项目的运行能力。除此之外,还有许多维基百科团队会担心的点,比如如今的维基百科贡献者里,使用英语的白人男性依旧是主体,维基内容已带有语言和内容偏见,ChatGPT 靠吸纳互联网信息为养料的 AI 机器,生成出的内容会进一步放大偏见。Wikipedia 联合创始人 Jimmy Wales 在接受 Standard 采访时谈及 AI 参与撰写维基的问题|Standard...
智能设备 2023-05-14 11:22:09 -
赶超ChatGPT?别着急为科大讯飞立flag
本文系网易新闻网易号特色内容激励计划签约账号【道总有理】原创内容,未经账号授权,禁止随意转载国内大模型赛道上,又迎来一位选手—科大讯飞。5月6日,科大讯飞召开发布会,正式推出了讯飞星火认知大模型,在通用能力上,星火认知大模型支持多风格多任务长文本生成、多层次跨语种语言理解、泛领域开放式知识问答等等。在会上,科大讯飞还同步发布了讯飞AI学习机、讯飞听见、讯飞智能办公本、讯飞智能座舱和讯飞开放平台等5项应用成果。星火认知大模型的技术成色几何,仅从现场演示还无法看透,可科大讯飞似乎野心勃勃,刘庆峰直言,“10月24日科大讯飞全球开发者大会期间,星火有望能够全面对标ChatGPT:在中文上要超越ChatGPT,在英文上要达到跟它相当的水平”。巧的是,次日周鸿祎做客东方甄选,在直播间里说了这样一句话,“如果不经过两年模仿,上来就说超越,那叫吹牛”,不知是否意有所指。这几年,随着人工智能的热潮退去以及商业化的艰难,外界对科大讯飞的滤镜渐渐消失,质疑声也越来越多。如今在大模型赛道上,科大讯飞姗姗来迟,可蹭上大模型的热度,并不能消解这些质疑。拉升股价,画饼充饥?近期,有网友发现讯飞星火大模型在有些问答中会出现“我是由 OpenAI 开发的”等内容,因此质疑其套壳ChatGPT,随后科大讯飞否认了这一说法。反驳的理由也颇有一番自卖自夸的嫌疑:科大讯飞认为,如果是套壳 ChatGPT,就不可能出现讯飞星火大模型的响应速度比 ChatGPT 还快;更不会出现讯飞星火大模型在文本生成、知识问答、数学能力等方面的结果均优于 ChatGPT 的情况。从中立角度来看,讯飞星火大模型是否套壳是技术问题,非专业人士一时难下定论,但科大讯飞在资本市场却也颇为懂得一些“套路”。在科大讯飞宣布推出大模型之时,公司向二级市场交出了一份非常难看的财报。根据财报,2022年,科大讯飞实现营收188.2亿元,同比仅增长2...
智能设备 2023-05-13 10:19:17 -
凌晨重磅!Google版ChatGPT史诗级更新,新模型赶超GPT-4,要把搜索彻底颠覆
文章开始之前先说个冷知识:今年是Google举办I/O开发者大会的第15个年头。纵观近七年来的I/O大会,AI内容一直是Google的重中之重...
智能设备 2023-05-11 11:11:08 -
亚马逊被曝秘密研发新家用机器人具备类似ChatGPT功能
5月10日消息,据泄露的内部文件显示,零售巨头亚马逊正秘密研发其家用机器人Astro的升级版,以使它能更好地理解其所观察到的东西,并更智能化地对事物做出反应。文件显示,该项目的内部代号为“Burnham”,该项目为Astro增加了一层“智能和对话语音界面”...
业界动态 2023-05-10 07:34:19 -
安恒信息苗春雨:ChatGPT会进一步加深AI数字鸿沟,是一个时代的变迁
5月9日消息,自ChatGPT发布以来,一直都是科技圈热议的对象。作为一款人工智能聊天软件,它在一些人的眼里具有革命性的意义,就连比尔·盖茨都盛赞ChatGPT,称其“不亚于互联网诞生”...
业界动态 2023-05-09 18:49:47 -
英特尔表示正调查BootGuard私钥泄露事件
IT之家5月9日消息,英特尔针对近日曝光的微星产品泄露事件,表示正在调查私钥泄露情况,并采取相应的措施为用户提供保护,阻止在设备上安装恶意UEFI固件。MoneyMessage勒索团伙于今年3月向微星发起攻击,窃取了包括固件、源代码和数据库在内的1.5TB数据...
智能设备 2023-05-09 12:43:02 -
ChatGPT等生成式AI兴起扎克伯格曾痴迷的元宇宙熄火了
5月9日消息,承诺让用户沉浸在虚拟世界中的元宇宙技术曾风靡一时。但随着ChatGPT等生成式人工智能技术的兴起,三年后元宇宙业务已经被商界所抛弃...
业界动态 2023-05-09 11:02:40 -
图灵奖得主LeCun:我赞成用LLM写论文!科研老将更恨ChatGPT?
新智元报道编辑:LRS【新智元导读】最近康奈尔大学的一位副教授调研了业界用ChatGPT写论文的态度,支持与反对者大致相同,但混迹科研圈越久的人,越反对ChatGPT。ChatGPT发布后,「用语言模型辅助论文写作」到底算作弊剽窃,还是合理使用写作工具,目前各高校、论文会议中仍然没有统一标准,甚至不同的科研人员对ChatGPT都持有不同的态度...
智能设备 2023-05-08 13:15:58 -
巴菲特体验ChatGPT后感到担忧将AI比作原子弹
【网易科技5月8日报道】近几个月,AI的快速发展让科技圈迎来了“大地震”。近日,巴菲特在伯克希尔哈撒韦公司年会上发表对于人工智能的观点,表示对其快速发展感到担忧...
智能设备 2023-05-08 11:20:21 -
ChatGPT引爆热潮,非洲会议探讨AI对穷国的挑战和机遇
5月7日消息,在人工智能的前景与危险日益受到关注之际,来自世界各地的2000多名研究人员和工程师本周聚集在卢旺达,就人工智能未来的不同愿景展开了激烈辩论。一种愿景是构建像ChatGPT这样的更强大的系统,旨在超越人类智能,以提高工人生产率和促进经济增长...
业界动态 2023-05-07 19:33:33 -
ChatGPT背后的外包工人:在美时薪超15美元,干的都是苦力活
5月7日消息OpenAI的聊天机器人ChatGPT靠外包工人的训练工作才能成就辉煌。这些工人为训练数据打标签,和机器人来回对话并纠正系统生成的答案...
业界动态 2023-05-07 16:57:44 -
IBM入局!任意大模型低成本变ChatGPT方法开源,个别任务超GPT-4
衡宇发自凹非寺量子位|公众号QbitAI科幻中有机器人三原则,IBM说不够,要十六原则最新大模型研究工作中,以十六原则为基础,IBM让AI自己完成对齐流程。全程只需300行(或更少)人类标注数据,就把基础语言模型变成ChatGPT式的AI助手...
智能设备 2023-05-07 13:10:33