“大厂垄断大模型”,会被开源终结吗?
中金在线财经号 2023-05-11 16:14:31

谷歌和OpenAI在AI方面的种种积累,最终真的会败给一群隐藏在民间的“草头侠”吗?


【资料图】

最近,正在进行AI大战的各个大厂,被谷歌泄漏的一份内部文件,翻开了窘迫的一面。

这份泄露的内部文件声称:“我们没有‘护城河’,OpenAI 也没有。当我们还在争吵时,第三个方已经悄悄地抢了我们的饭碗——开源。”

这份文件认为,现在的一些开源模型,一直在照搬谷歌、微软这些大厂的劳动成果,并且双方差距正在以惊人的速度缩小。开源模型更快、可定制性更强、更私密,而且功能性也不落下风。

比如,这些开源模型可以用 100 美元外加 13B 参数,加上几个礼拜的时间就能出炉,而谷歌这样的大厂,要想训练大模型,则需要面对千万美元的成本和 540B 参数,以及长达数月的训练周期。

那么,事实是否真的像这份文件所说的那样,谷歌和OpenAI在AI方面的种种积累,最终真的会败给一群隐藏在民间的“草头侠”?

所谓“大厂垄断大模型”的时代,真的要终结了吗?

要回答这个问题,我们就得先了解下目前开源模型的生态,看看这些如雨后春笋般涌现的开源模型,究竟是如何一步步蚕食谷歌这些“正规军”的江山的。

01 异军突起的开源模型

其实,最早的开源模型,其诞生完全是一场“偶然”。

今年2月,Meta发布了自家的大型语言模型LLaMA,参数量从70亿到650亿不等,并仅用130亿的参数,就在大多数基准测试下超越了GPT-3。

但万万没想到的是,刚发布没几天,LLaMA的模型文件就被泄露了。

至此之后,开源模型的浪潮就如决堤一般,变得一发不可收拾。

如八仙过海一般的ChatGPT开源替代品——「羊驼家族」,随即粉墨登场。

与ChatGPT这类大模型相比,此类开源模型最显著的特点,就是训练成本与时间都极其低廉。

以LlaMA的衍生模型Alpaca为例,其训练成本仅用了52k数据和600美元。

然而,如果开源光靠低成本,还不足以让谷歌这类大厂感到威胁,重要的是,在极低的训练成本下,这些开源模型还能屡次达到和GPT-3.5匹敌的性能。

这下谷歌和OpenAI就坐不住了。

斯坦福研究者对GPT-3.5(text-davinci-003)和Alpaca 7B进行了比较,发现这两个模型的性能非常相似。Alpaca在与GPT-3.5的比较中,获胜次数为90对89。

重点来了:这些开源模型,究竟是怎么做到这点的?

斯坦福团队的答案是两点:1、一个强大的预训练语言模型;2、一个高质量的指令遵循数据。

在这里,我们将强大的预训练语言模型(如LlaMA或GPT-3),比喻为一位有着丰富知识和经验的老师。

对于自然语言处理领域的任务,强大的预训练语言模型,可以利用大规模的文本数据进行训练,学习到自然语言的模式和规律,并且可以帮助指令遵循等任务的模型更好地理解和生成文本,提高模型的表达和理解能力。

这就相当于学生使用老师的知识和经验,来提高语言能力,指令遵循等任务的模型可以使用预训练语言模型的知识和经验来提高自己的表现。

除了借助这位“老师”的知识外,开源模型的另一“利刃”,就是指令微调。

指令微调,或指令调优,是指现有的大语言模型生成指令遵循数据后,对数据进行优化的过程。

具体来说,指令微调是指在生成的指令数据中,对一些不合适或错误的指令进行修正,使其更符合实际应用场景。

而指令调优是指在生成的指令数据中,对一些重要、复杂或容易出错的指令进行加重或重复,以提高指令遵循模型对这些指令的理解和表现能力。

凭借着这样的“微调”,人们可以生成更准确、更有针对性的指令遵循数据,从而提高开源模型在特定任务上的表现能力。

如此一来,即使只用很少的数据,开源社区也能训练出性能匹敌ChatGPT的新模型。

然而,又一个问题是:面对自己辛苦打下的江山,被开源社区用“四两拨千斤”的方式步步蚕食,谷歌和OpenAI为何一直没有予以反制呢?

哪怕是如法炮制,以毒攻毒,推出同样快速迭代的小模型,也不失为一种破局之策啊。

02 骑虎难下

实际上,谷歌这样的头部企业,不是没有意识到开源的优势。

在那份泄漏的文件中,谷歌就提到:几乎任何人都能按照自己的想法实现模型微调,到时候一天之内的训练周期将成为常态。以这样的速度,微调的累积效应将很快帮助小模型克服体量上的劣势。

可问题是,身为AI领域巨头的谷歌和OpenAI,既不能,也不愿完全放弃训练成本高昂的大参数模型。

从某种程度上说,这是其保证自身优势地位的必要手段。

作为AI领域的巨头,谷歌和OpenAI需要不断提升自己的技术实力和创新能力。而传统的大参数训练模型,则是提供这一探索和创新的必经之路。

因为大模型的底层技术若想取得突破,AI领域的研究者和科学家,就需要更深入地理解模型和算法的基本原理,探索AI技术的局限性和发展方向,这需要进行大量的理论研究、实验验证和数据探索,而不仅仅是微调和优化。

例如,在训练大参数模型时,AI领域的科学家,可以探索模型的泛化能力和鲁棒性,在不同的数据集和场景下评估模型的性能和效果。谷歌的BERT模型,也正是在此过程中得到了不断强化。

同时,大参数模型的训练,还可以帮助科学家探索模型的可解释性和可视化,

例如,对今天的GPT来说至关重要的Transformer模型,虽然在性能上表现出色,但其内部结构和工作原理却相对复杂,不利于理解和解释。

通过大参数模型的训练,人们可以可视化Transformer模型的内部结构和特征,从而更好地理解模型是如何对输入进行编码和处理的,并进一步提高模型的性能和应用效果。

因此,开源和微调的方式,虽然可以促进AI技术的快速发展和优化,但不足以替代对AI基础问题的深入研究和探索。

但话说到这,一个十分尖锐的矛盾又摆了出来:一方面,谷歌和OpenAI不能放弃对大参数模型的研究,并坚持对其技术进行保密。但另一方面,免费、高质量的开源替代品,又让谷歌等大厂的“烧钱”策略难以为继。

因大模型耗费的巨大算力资源和数据,仅是在 2022 年,OpenAI 总计花费就达到了 5.4 亿美元,与之形成鲜明对比的,则是其产生的收入只有 2800 万美元。

与此同时,开源社区的具有的灵活性上的优势,也让谷歌等大厂感到难以匹敌。

在那份泄漏的文件中,谷歌就认为:开源阵营真正的优势在于“个人行为”。

相较于谷歌这些大厂,开源社区的参与者可以自由地探索和研究技术,不受任何限制和压力,从而有更多机会发现新的技术方向和应用场景。

而谷歌研究和开发新技术时,则必须考虑产品的商业可行性和市场竞争力。这就对人才的研究方向产生了一定的限制和约束。

此外,由于保密协议的存在,谷歌的人才也难以像开源社区那样,与外界充分地交流和分享技术研究的成果。

如果说,低价、灵活的开源模型,终将成为一种不可阻挡的趋势,那么当谷歌等大厂面对这浩瀚的战场时,又该怎样在新时代生存下去呢?

03 另辟蹊径

倘若谷歌这样的头部企业,最终在开源阵营的攻势下,选择了“打不过就加入”的策略,那如何在开源的情况下,找到一条可行的商业路径,就成了一件头等大事。

毕竟,在目前的市场认知下,开源几乎就等于“人人皆可免费使用。”

之前,Stable Diffusion背后的明星公司——Stability AI,就因为在开源后,没有找到明确的盈利途径,目前正面临严重的财政危机,以至于到了快倒闭的地步。

不过,关于如何在开源的情况下实现盈利,业界也不是完全没有先例可循。

例如,之前谷歌对Android系统的开源,就是一个经典的案例。

当年,由谷歌主导开发和推广的Android系统开源后,谷歌仍然通过各种途径,从Android操作系统的设备制造商那里获取了收益。

具体来说,这些途径可分为以下几种:

1.收取授权费用:当设备制造商希望在其设备上预装Google Play商店等谷歌应用和服务时,他们需要遵守谷歌的授权协议,并支付相应的授权费用。

2.推出定制设备:谷歌通过与设备制造商合作,推出一些定制的Android设备,如Google Pixel智能手机和Google Nexus平板电脑等,并从中获得收入。这些定制设备通常具有更高的价值和更好的性能,而且会预装谷歌的应用和服务。

3.销售应用:当设备使用者在Google Play商店中购买应用、游戏或媒体内容时,谷歌会从中提取一定的佣金。

虽然这些途径的收益,也许并不像谷歌的主业——搜索和广告那样让其赚得盆满钵满,但谷歌仍然从中获得了各种“隐性收益”。

因为Android 的存在,避免了某一家企业垄断移动平台的入口,只要互联网是开放的,谷歌就能通过吸引更多人使用Android上的应用,来收集用户的行为数据,对这些数据进行加工,从而使得广告投放可以更加精准。

由此可见,开源模式并非与商业化的盈利模式完全冲突,这对于谷歌和开源社区的参与者而言,都是一种好事。

因为只有通过商业化途径,源源不断地为自身“造血”,谷歌和OpenAI等大厂,才能继续承担起训练大参数模型所需的巨额成本。

而只有大参数模型的持续研发,各大开源社区,才能继续以高性能、高质量的预训练语言模型为基础,微调出种类更多,应用场景更为丰富的开源模型。

基于这样的关系,开源模型与封闭的大模型之间,其实不仅仅只是对立与竞争,同时也是一种互助共生的生态。

“大厂垄断大模型”,会被开源终结吗?

2023-05-11 16:14:31

世界信息:人力资源管理是干嘛的(人力资源管理的职位有哪些)

2023-05-11 15:47:09

【利威尔bg】与君同行 第六十三章

2023-05-11 15:07:33

【世界新视野】鹏鼎控股(002938)2022年年报及2023年一季报点评:主业稳健 汽车+服务器助力成长新动能

2023-05-11 14:21:39

深圳社保缴费标准2020年11月_深圳社保缴费标准2020 当前关注

2023-05-11 14:05:02

动态:佛山美的鹭湖爱丽丝庄园夜场营业时间

2023-05-11 13:14:22

【环球速看料】辰溪县:政法干警下基层,立足职能携手共绘振兴新图景

2023-05-11 12:36:15

焦点速讯:午评:沪指连续补跌,创业板涅槃重生!

2023-05-11 12:04:27

部分东南亚机票价格腰斩 节后机票价格大跳水

2023-05-11 11:31:54

全球简讯:热情服务暖民心 群众满意送锦旗

2023-05-11 11:02:21

市水利局召开全市水旱灾害防御暨水利工程运行管理工作会

2023-05-11 10:56:34

滚动:闲人愁多,懒人病多,忙人......

2023-05-11 10:23:05

贾玲“整容式”近照曝光:暴瘦40斤,颜值逆天,我却笑不出来......

2023-05-11 10:03:37

四川:前3月跨境电商进出口交易规模为295.4亿元|世界热消息

2023-05-11 09:37:43

世界新动态:营业执照一般多长时间有效期

2023-05-11 08:55:06

史上最耐用铰链!谷歌Pixel Fold折叠屏手机发布:处理器独一无二_天天观点

2023-05-11 08:48:30

威创股份收到深交所年报问询函 公司称:今年发展会正常化-世界观点

2023-05-11 07:47:26

天天观察:强信心·开新局|河北一季度外贸运行一线观察:增速加快 品质提升

2023-05-11 07:06:35

全球消息!琴斯托霍瓦拉科夫足球俱乐部_关于琴斯托霍瓦拉科夫足球俱乐部介绍

2023-05-11 06:07:03

全球极濒危树种资源冷杉野外回归第二期工程启动

2023-05-11 04:58:59

毕竟的意思是什么呢_毕竟造句 天天热推荐

2023-05-11 02:57:22

吕四港念五总村江素芳:坚守30年,为村民撑起健康保护伞

2023-05-11 00:00:45

票投民进党,警察、女人都被推上战场-世界热门

2023-05-10 22:39:24

胜捷企业(06090)一季度收益同比增长5%至4710万新元

2023-05-10 21:38:05

当前时讯:应付账款周转率怎么算啊_请问应付帐款周转率怎样计算的 能详细列示吗

2023-05-10 21:09:54

阿里巴巴据悉取消首席技术官职位 拆分技术团队_天天速讯

2023-05-10 20:14:42

柘中股份(002346.SZ):董事长陆仁军辞职

2023-05-10 19:28:32

英雄联盟代练价格表图_英雄联盟代练 世界新动态

2023-05-10 18:58:25

看得见山、望得见水、记得住乡愁 外国网红打卡商丘时庄文化艺术村(视频)

2023-05-10 18:22:25

西安潮宏基今日黄金价格查询(2023年5月10日)

2023-05-10 17:50:37

朱元璋赐死宋国公冯胜

2023-05-10 17:10:23

火烧赤壁是谁的计谋_火烧赤壁介绍-每日看点

2023-05-10 16:59:37

陆奇最新大模型论断:中国要先赶上GPT-3.5 世界热资讯

2023-05-10 16:22:39

黑格尔为何只夸老子?如何评价古代的“人文宇宙”?

2023-05-10 15:48:12

每日视点!手机上的开发者选项在哪里(手机上的开发者选项在哪)

2023-05-10 15:41:28

喜报!普陀这个创意园获评优秀工业遗产保护利用示范案例

2023-05-10 15:10:04

六角恐龙鱼怎么养(蝾螈和娃娃鱼的区别)

2023-05-10 14:20:16

牡丹的花期是多少天 牡丹花哪时候开花呢|最新资讯

2023-05-10 13:47:27

终结的炽天使第二季出了吗 终结的炽天使第二季为什么和第一季一样_天天快资讯

2023-05-10 13:19:04

开封市顺河回族区:“四个强化”强力推动物业全覆盖

2023-05-10 12:54:12

世界微速讯:疑似不满大连人进球被吹,谢晖:我们那个球是5月的雪

2023-05-10 12:21:48

小区与公路存高度差导致护栏和出入口无法施工

2023-05-10 11:50:43

【全球报资讯】2022年平均工资出炉!

2023-05-10 11:16:19

“春雨工程”——文化和旅游志愿服务边疆行计划启动_当前关注

2023-05-10 10:51:15

诸葛找房王小嫱:关于5月8日两部门十方面举措加强房地产经纪机构管理政策的点评

2023-05-10 10:18:58

《信访工作条例》实施一周年主题宣传暨全省第六个信访法治宣传月活动启动-焦点热闻

2023-05-10 09:57:56

LOL鬼蟹再度搞事情,将加快新英雄更新速度,大量英雄将被重做!

2023-05-10 09:47:09

中泰证券:生命科学服务行业景气度有望逐渐回升 全球实时

2023-05-10 08:58:24

内外微调 比亚迪海豹冠军版将于5月10日上市

2023-05-10 08:26:36

当前快看:山东每年将组织实施100项重大科技创新工程项目

2023-05-10 08:05:48

环球热头条丨A-史密斯:如詹姆斯能在38岁拿下第五冠 值得讨论他能否超越乔丹

2023-05-10 07:12:18

紧急避孕药月经会推迟多久(紧急避孕药月经会推迟几天)

2023-05-10 06:11:01

杨绳苕_关于杨绳苕概略 环球快看点

2023-05-10 05:07:50

绿盟科技(300369):5月9日北向资金减持266.47万股

2023-05-10 03:21:00

当前热门:钢材q345b是什么意思_钢材q345c是什么意思

2023-05-10 01:16:18

斗罗大陆之神界之战小说_斗罗大陆之神界公主 每日播报

2023-05-09 22:53:03

过去三年,无锡法院立案审查破产申请案件1400余件

2023-05-09 21:56:37

天天微动态丨基于单层过渡金属硫化物的单光子源研究获进展

2023-05-09 21:10:44

他俩早高峰突然停车,数十位司机无一鸣笛

2023-05-09 21:00:12

广信材料(300537.SZ):光伏绝缘胶产品已在光伏电池组件企业实现销售,将成为公司今年在光伏领域率先实现突破和快速增长的产品

2023-05-09 19:51:19

这5种蔬菜别生吃,小心感染寄生虫!一招教你正确清洗蔬菜|关注

2023-05-09 19:18:31

直播电商行业增速趋缓?快手选择向内挖流量价值 今头条

2023-05-09 18:38:40

房地产中介迎强监管!中介费会降吗?

2023-05-09 18:12:10

百胜智能:公司外贸业务主要销往白俄罗斯、德国、墨西哥、葡萄牙、印度、泰国等多个国家

2023-05-09 17:41:06

重庆龙裕城乡建设开发有限公司原党委书记、董事长刘劲松涉嫌严重违纪违法接受审查调查|全球简讯

2023-05-09 17:21:21

“深圳惠民保”正式发布!保费88元 保额超300万元|每日动态

2023-05-09 16:48:16

德州:五个振兴同频共振 全面推进乡村振兴

2023-05-09 16:25:08

清热解毒是什么意思戒指_清热解毒是什么意思_环球速递

2023-05-09 15:59:30

十日谈 | 河畔清风,来自于城市的发展 天天新消息

2023-05-09 15:27:05

抖音出手规范AI生成内容!全球监管呼声四起 数字水印会是一剂良方吗? 全球热闻

2023-05-09 14:48:50

我在B端做数据分析——指标篇 天天热议

2023-05-09 14:19:39

天天短讯!我需要多少布料来制作大号床身裙?_姐送弟弟什么生日礼物

2023-05-09 13:26:08

双11剩余喵糖每天会清空吗

2023-05-09 12:44:45

23宁夏债08今日发布发行公告 全球热文

2023-05-09 12:12:18

今日晴好,周末夏天体感来袭!

2023-05-09 11:53:30

2023年补助地方公共文化服务资金下达 世界讯息

2023-05-09 11:31:53

第18届威尼斯国际建筑双年展中国国家馆展览新闻通气会在京举行

2023-05-09 10:46:44

26个省份用电量正增长 用电数据彰显经济活力 观察

2023-05-09 10:37:55

数智驱动商业增量 虹口这家企业打通“一盘货”

2023-05-09 10:16:05

环球速讯:永州陆港“向南向海向外”通道搭建成型

2023-05-09 09:37:04

天天微动态丨年内完成万例白内障普筛 苏州公益救助项目启动

2023-05-09 09:26:45

数字带、绿色带、创新带三频共振显效果

2023-05-09 08:43:16

世界快资讯:综合评分都优秀,从细节看差距 最新中保研新能源SUV碰撞测试点评

2023-05-09 08:19:32

【LOL赛事歌单】2023 S13 MSI季中冠军赛 ‖ 赛事BGM·音乐歌单 TEST

2023-05-09 07:09:06

全球微速讯:​​李明俊在全市重点产业项目协调会上强调:加大服务力度 加快项目建设 为高质量发展提供有力产业支撑

2023-05-09 06:16:19

DNF2021魔皇加点(魔皇刷图加点最新2021)

2023-05-09 04:54:07

环球今头条!“骂死”大学生被判赔19万_房东上诉

2023-05-09 03:04:45

世界观速讯丨南京社保中心电话号码_南京社保中心

2023-05-09 00:54:41

宁波两项工程获中国水利工程优质(大禹)奖-焦点速读

2023-05-08 22:56:29

杞县阳堌镇:“一把手”走流程 提升服务新效能

2023-05-08 21:52:50

时隔6年!36岁前国足中场核心再在中超送绝妙助攻,差点带队逆转!-环球速递

2023-05-08 20:51:07

【热闻】呼斯楞鸿雁原唱歌词(呼斯楞的 鸿雁 歌词)

2023-05-08 20:20:36

CAPCOM于各国申请《魔物猎人》益智游戏商摽

2023-05-08 19:53:59

微盟集团(02013)根据2020年受限制股份单位计划发行1412.65万股新股份 报道

2023-05-08 19:09:39

当前快讯:昆虫记每章节内容概括八年级上人教版(昆虫记每章节内容概括八年级上)

2023-05-08 18:30:38

龙利叶的功效与作用_带你深入了解它

2023-05-08 17:53:16

环球今亮点!到底在制裁谁?波兰国企:每天因俄油禁令多出数千万美元成本

2023-05-08 17:20:59

苹果官网怎么查询序列号_苹果官网如何查询序列号-天天热推荐

2023-05-08 16:58:51

“渴望以自己方式讲述故乡”的万玛才旦,故事只讲了一半|文艺评论

2023-05-08 16:13:28

每日快看:全球首创!木质晶体管横空出世 硅基计算霸主地位受威胁

2023-05-08 15:58:22