“如果我是一个领导者,一切都以经济为基础,我肯定会更愿意倒闭。就像当时苹果领先一样,因为可以从中获得更多的钱,所以愿意建立一个相对封闭的生态。ChatGPT目前好像就是这个位置。”
【编者按】在2023年人工智能开发者全球先锋大会期间,澎湃科技在上海临港中心开设了一个“超宇宙聊天室”。2月25日下午,在主题为“AI与开源:社区中的社区”的讨论中,Kyligence联合创始人兼CTO李阳、CSDN创始人董事长、极客帮创投创始合伙人江涛、Linux基金会布道者主席APAC、上海市人工智能行业协会秘书长钟俊豪就开源的重要性、开源社区的建设、工程师的待遇等问题进行了探讨,嘉宾们特别谈到了ChatGPT背后的大模式开源。以下为对话实录,有删减。
去开源社区不如去大厂实习。
(上海人工智能行业协会秘书长):我想请李会长先给我们介绍一下布道者的情况。这是什么意思?为什么叫传道士?
李建生(APAC福音传道者Linux基金会主席):从技术角度来看,有很多争论。传播自己的知识,需要传播知识。作为知识火种的热情传播者,一个人被称为传教士。它起源于宗教。现在,对于我们技术开发人员来说,技术是我们的信仰。我们都疯狂于某一种技术,比如我是Linux的超级粉丝,或者我是Java的超级粉丝。事实上,我是一个开源传教士。很多人认为开源需要说教。我们经常低估开源。作为一个从业20年的人,我探索开源的东西越多,发现用两句话解释开源并不是那么简单。我可能需要写三本书才能把这两个字解释清楚。
让我们来谈谈我们的LF APAC福音传道团队。今年我被选为主席。Linux是一种开源技术,也是一个开源社区。后来成立了开源基金会,这是迄今为止世界上最大的基金会之一,相当于一个非常重要的项目,承载了我们很多现代的数字基础设施。Linux基金会亚太区想传播技术和理念,让技术人员拥抱技术,让企业和组织受益,所以招募了一批人,他们以纯粹志愿者的方式做事,不领工资。
钟俊豪:开发者一进入开源社区,他们就必须开源并贡献自己的代码。也有人告诉我,开源不代表以后没有商业价值。
江涛(CSDN创始人董事长、极客帮创投创始合伙人):我给你讲个故事吧。我是一名程序员。对于一个程序员来说,他的最终价值就是作为代码输出。那么代码收费吗,代码有价值吗?比尔盖茨曾经写过一封信,说我们辛辛苦苦写的代码,为什么卖不出去?于是微软建立了微软帝国,微软生来就是卖软件的,所以软件可以卖钱。
但与此同时,一个人出现了。自由软件的创始人理查德斯托尔曼说,你可以卖钱,但是你的代码应该对我公开。因为买了家电,出了问题可以修。你可以卖给我软件,但你得让我来修。以前的软件叫闭源,把软件锁起来。理查德斯托曼说软件不应该被封闭在里面。如果你扩展它,你必须公开代码。所以在1998年,一群人提出了自由软件。能不能改成开源,开源就这样发展。
开源代码,怎么才能传递价值,每个人都能贡献?这是有文化的,里面有各种深刻的道理。我说浅一点。我自己也是程序员。我写了金山词霸,词霸1,词霸2。当时我们录了一个真人,让一个外国人录发音。我给了他一个单词表。他看完之后,我记录下来,变成了文字。我不得不关掉声音。这是我写的程序。一个人念了一串字,我想把它剪开。那时候开源还没那么丰富,因为找不到代码所以自己写了一段,效果也不好。所以汽巴1和汽巴2的话最后可能不太准确,因为我切的不好。
后来我出来创业,我做了复读机,就是你读一段,我给你复读。我还需要切断声音。当时网上起来了,就去网上找,找不到。我问了一个问题,就是想区分一个人说的一句话中一个词的切分音。某专家论坛说,人与人之间是可以交流的。一个德国人说,你的问题很简单。他说你给我100分(积分),我就给你一段代码。我拿了他的代码试了试。太完美了,比我写的好多了。后来我问他,我能用这个代码吗?他说是开源的。他们是搞语音识别的,这个功能是他们最基本的功能,而且是开源代码,拿过来用就行了。
所以人类的进步是科技带来的,是共享开放的,软件属于科技。软件的开放就是开放源代码,人类智慧的结晶就在这个领域。但是你不能只是开放,你要有经济模式,所以这几年开源有了很大的进步,它的商业化和开源生态已经被接受和认可。华为现在投入开源,看到开源对它建立行业领先地位非常重要。开源并不意味着免费。开源现在甚至和商业密切相关。但是程序员喜欢开源,因为你想学点东西。现在最好的软件的代码都是开源的,你可以学习世界上最好的程序员都写了什么,这是人类的财富。
钟俊豪:第一类是每个人都为技术建立了这样一个技术开源社区。第二类是人工智能开发者全球先锋大会邀请的开源和开放社区大概有四五十个。我也看到一些学习型组织,大家一起成长,一起学习。第三类是为可以商业化的项目而组建的组织。
李阳(Kyligence联合创始人兼CTO):这个挺有意思的。一个是社区,一个是免费开源,一个是商业。有句话叫社群比代码更重要,正好呼应了布道者。沉淀下来的是人的知识,代码是知识的一部分,还有描述设计理念的文档和一些软件项目管理项目,记录了知识发展的过程。这个想法是什么时候产生的,第一份草案设计是什么时候,第一份代码成型是什么时候,测试是什么时候?这些都是除了代码以外更大的知识。所以传承下来的开源理念是知识,代码是知识的一部分,承载知识的人可能更重要,这种思想也慢慢演变了。
现在知识开放了,怎么做生意?可以为爱情发电。但不可能每个人都为了爱情发电。这不是永动机。这就把我们带到了开源商业模式的话题上。我先简单回答一下。企业,尤其是传统行业,采购一个开源软件主要是为了服务,其采购的本质是一种技术服务。
钟俊豪:让我打断一下。既然是开源,为什么要购买?
李阳:我用一个俚语的例子,特别好理解。因为我在IBM工作过一段时间,所以IBM有句老话,不会因为收购IBM而解雇甲方。你这话是什么意思?如果我是金融企业,我买了一个IBM数据库。总有一天,银行的金融服务垮了,IBM会出来背锅。IBM会说我错了,我的系统没做好。IBM会对当时做采购决策的甲方采购经理负责,帮助他一起解决危机。尽快解决问题,这就是我所说的技术服务。即使我给你整个免费代码,包括它的相关知识,你自己经营这个业务,你也需要对这个基础设施负全责。但是你可以通过购买技术服务来分担这部分责任。
李建生:让我们从另一个角度来看商业付款的问题。刚才江总提到了一件非常好的事情。如果一个开源项目解决了我们的实际问题,那么它就是有意义的。无论是什么项目,软件,工程,建筑,还是人工智能,想要进入项目,肯定需要各方面的资源。首先需要解决人和物的问题。这个时候我们需要融入大社会,方法有很多。首先是建立商业信任。IBM建立的品牌完全是一种商业逻辑。你信任我,我信任你,大家可以背靠背工作。这是商业非常注重的一个基石,那就是信任。不管我的代码是不是开源的,你都应该通过付费把事情做好。这是方式之一,商业被我们的现代世界所接受。
另一种是捐赠。比如Linux基金会要向政府注册一个合法组织,接受社会、个人、企业、政府的资金。对于全世界的企业和组织来说,帮助一个对所有人都有利的项目,并让它发挥作用,是一个了不起的项目。
钟俊豪:这是因为每个人的热情吗?
江涛:有些人愿意花钱解决问题,而有些人愿意花时间解决问题。有一个开源项目,我自己也花时间折腾过。但是你能保证把自己折腾好就能做到这一点吗?然后对自己有信心。不愿意花钱,这是一种人,80%是这种人,他花不起钱,或者他愿意花时间。还有一类人愿意花钱,比如银行,因为可靠性很重要。这两者形成一个生态。除了捐款,银行用了这个东西,银行说我还有一些功能。你能做到吗?它形成了一个社区。社区分为:不给钱的用户也要需求,给钱的用户也要需求。如果你想影响这个项目,给更多的钱。所以生态的玩法有很多。
钟俊豪:开源的商业形式非常多样。并不是所有人都认为因为开源,所有人都必须免费享受所有的好处。
江涛:你应该致力于开源。首先,你可以学到世界上最好的技术和知识。你说,哦,我可以送我们的孩子去百度实习吗?不会,如果发到Linux社区会好很多。开源是世界上最好的技术展览,你的问题真的有答案;第二,做好开源可以赚钱。
李建生:关于免费的理解,一些经济学家应该普及科学。天下没有免费的午餐,有个学名叫机会成本。其实你在选择开源项目的时候,已经投入了大量的资源,不一定能选择其他的方式。其实这个是需要计算的。你投入开源的时间和资源和你花钱买的有区别吗?很多公司就是因为这个把自己的技术拖向深渊。
互联网给我们所有人带来的改变是协作的改变。今天来到临港,有一个上千人的大聚会。这种事情不可能经常发生。一年一次,最多两次,既费钱又费人。但是互联网给了我们什么机会呢?我在北京,李阳在上海,我们的另一个朋友可能在土耳其。全球化是相连的,我们不区分地区来合作。坐在电脑前,我们只需要一台可以上网的电脑。当然现在更多了,像代码仓库,甚至你可以跑到一些云服务器去验证你的模型。它降低了所有人合作的门槛,不管是哪个地区。
在信息知识的生产中,开源带来了一种新的协作,这是最厉害的地方。信息行业的人可以放眼全球,这几乎是不可能的。地理位置都消失了,这种协作是前所未有的。即使我们可能很难遇到和你一样或互补的问题,但这么多人因为一个共同的问题而一起工作,这是非常了不起的。
李阳:说到开源和国际化,我还是有一些热情的。从精神层面来说,开源精神一定是国际性的东西。但正如我前面提到的,它是开源社区。开源社区从精神落到具体的个人身上,有各种各样的动机。它成立的动机和背后的支持者,如果有一家、两家、三家公司做后盾,就会带进一些商业属性。但我觉得这很正常。世界是多姿多彩的,没有什么是如此简单纯粹的。如果一定要说些或大或小的话,我想开源社区的大部分贡献者还是有感觉的。他(她)会觉得人类的知识作为一个整体是真正的代代相传。
2月25日下午,“元宇宙聊天室”以“AI与开源:社区的共同体”为题,讨论了开源的重要性、开源社区的建设、工程师的待遇等问题。左起,上海市人工智能行业协会秘书长钟俊豪、创始人兼合伙人江涛、Kyligence联合创始人兼CTO李阳、LF APAC福音派董事长李建生。
“制定开放源代码搜索和救援政策”
钟俊豪:上海孵化了世界人工智能大会下的开发者大会。其实之前有三届,准确的说这一届是第四届。第四届是独一无二的,作为新IP是独立的。我们已经看到有许多开发者社区。开发者社区需要什么?或者在推进上海三大主导产业的过程中,有什么可以帮助开发者群体做好的?我们如何服务好社区?如何让这些社区做得更好?如何做好“社区共同体”,让这些共同体更好地在上海安家?
江涛:像我们这样的大型社区肯定有一定的商业化考虑。首先,你得有钱。钱从哪里来?政府能不能成为有钱的社区,很难说。世上无例。我觉得要看国内有没有模式。
从本质上来说,开发者社区和开源社区的实现是一个国际性的问题。因此,我们所有的竞争产品都售出了。全球最大的开源平台卖给了微软,英文最大的开发者内容社区卖给了南非基金,也就是腾讯的母公司。头部开源项目能赚钱,腰部开源项目不能,这也是世界难题,国外也有很多研究。总的来说,不是国家怎么支持,而是中国的开源文化和开源体系怎么走出我们的特色。一方面可能要和国际接轨,另一方面可能要发挥自己的某些优势。比如工程师的荣誉。学校有教授和助理教授。工程师可能为全世界的开源项目做出了巨大的贡献。他还不如随便哪个学校硕士毕业,现在到处都是硕士。但是他为全世界的开源做出了贡献。国家评价体系鼓励他吗?
钟俊豪:这段时间,围绕人事协会,我们在推动人工智能整体产业,培育人才高地的时候,确实开始尝试研究这方面的内容。我们现在在考虑论文的引用情况,已经在考虑这个指标了。第二个是在开源和开放社区中的贡献价值,我们也开始考虑了。
江涛:许多开源项目都有一个经济账户。另一方面,国家也要算好经济账,如何对开源方向和AI方向给予各种支持和扶持,做出开源的SAR政策。
钟俊豪:也许我们可以去临港试试。
李阳:确实是价值闭环,闭环之后可以螺旋上升。这是一个关键的机制。我确实有一个非常不成熟的想法。最近很流行自然语言模型ChatGPT。有一种理解是,这个模型的能力实际上来自于学习所有为其语料库做出贡献的人的知识。按照这个价值链的逻辑,我是不是把我的知识贡献给了一个AI模型?这个AI模型建立起来之后,它的服务能力和商业价值可以反馈给为AI学习提供智慧的那群人,这就像形成了一个闭环,实际上适合所有的知识贡献者。
这也可以是一个具体的例子,如果投射到一个开源代码的社区。比如我有一个机器人,它学习GitHub(全球最大的开发者社区)上所有的开源代码,学习编程。不能帮助所有程序员写程序吗?作为一个给这个开源社区贡献过算法的人,我可以优先使用它来帮我写程序吗?或者我有折扣,看起来合理。而今天的信息技术应该是可以的。因为我上面说的这些知识资产,其实都是数字化的,已经被系统管理过了,账本也很清楚,虽然可能工作量很大。
李建生:让我从传道的角度谈谈建立一个社区。我们应该相信知识的力量。当一个人掌握了一些知识,能够理解所有的机制,他就会做出自己的选择。我们站在拥护开源的一边,但是很多人站在诋毁开源或者认为开源不可行的一边。我传道是为了普及知识。当然有传统的国民教育渠道和培训机构来普及知识,但我们是从个人角度去搞联盟。我觉得从地域上来说,比如临港可以办一些文化沙龙,谈项目,谈问题。我们要打造这个文化高地,让知识先流动起来。
钟俊豪:最后一个问题。在ChatGPT的状态下,我们也知道类似ChatGPT的开源已经开始存在。我们来分析一下这个非常有前瞻性的模型。它的开源或闭源路径会是什么样的?
李建生:我最近读完了一本名为《算法的力量》的书。开源书里有一本经典的书叫《代码2.0》。这两本书有一个共同点。他们不说开源或者闭源,而是说他们是我们社会的力量,商业的力量,政府的力量,法律的力量,技术的力量。这四种力量粘合在一起。不管是开源还是闭源,我们的政府能不能承担成本,让公众受益。我们的世界不是一分为二的开放和封闭。我们都处于全面的利益平衡之中。
有时候商业的力量很强大,我掌控着高科技。我当然可以坐地起价,但是政府允许吗?法律会允许你吗?社区会允许你吗?这是各种力量的胶水。我觉得我们每个人都要做一个平衡,努力让它开源,也要平衡背后的力量。在开放和封闭之间,从长远来看,我们都要开源。但是到了一定阶段,就像我们要和商人达到和谐一样,你让别人受益。
李阳:如果要说ChatGPT和开源,我觉得有一个领导者和一个追赶者的逻辑。如果我是领导,一切以经济为基础,我肯定更愿意被封闭。就像当时苹果领先一样,因为可以从中获得更多的钱,所以愿意建立一个相对封闭的生态。ChatGPT目前似乎就处于这样的位置。所以如果它选择封闭,我觉得是很合理的,是符合底层经济学原理的。
从追赶者的角度来说,更适合开放式的模式。因为会牺牲一些短期的利益,但长远来看会促进交流,碰撞火花,更快的技术进步。在此期间,政府可以发挥很大的力量。从最长远的角度来看,政府有最长远的眼光和勇气进行长期投资。
也希望国内类似ChatGPT的技术快点起来。但在现阶段,我们需要尽最大努力去开放,开放我们的态度。而且这里我觉得不仅仅是代码角度,算法只是一部分,人工智能还有很大一部分是数据语料库,甚至把中文世界的所有语料库的质量和英文世界的进行对比。如果我的语料质量更弱,那么我所学的东西的出发点肯定会更弱。所以我觉得这不仅仅是算法本身,还有数据和语料。所有的信息知识本身都需要开放,然后要提高质量。说到以前的价值闭环,如果我打开了,我就可以有一个价值闭环,就像我献血,然后我生病了,我就可以先回馈。形成这个循环可能是最好的效果。
江涛:ChatGPT会重写所有的软件。它将是一个新的操作系统,因此它将立即面临巨大的变化。短期内,也许三年内谁也赶不上。我们只能跟随它的脚步。这个应该是比较确定的。
它将对行业产生颠覆性的革命,对人类软件使用方式的重大改变,从命令行到鼠标再到触摸,现在是对话,一定会转化为语音交互。这是一个巨大的历史时刻。
这个产品投入巨大,数据很重要,数据迭代和优化又不能开源和开放,领先优势巨大。OpenAI是绝对不可能开源的。未来有了这样的公司和机器人,大部分人类都不需要工作了,因为物质生产是由算法和机器人来完成的,所以我们可以做其他的工作。OpenAI的联合创始人山姆奥特曼(Sam Altman)非常理想化。他已经想到了这一点,所以这种公司将来应该属于国家。OpenAI收入的90%要上缴美国财政部或者联合国基金会,给全世界人民送钱。这是未来的趋势。
短期内呢?大家恐慌的时候,就会出来开源的模式,但是一家做不出来。ChatGPT是新一代的“苹果”,新一代的应用是ChatGPT交互应用。没人能做到,那就开始开源吧。开源产品一开始肯定是不好的,但是开源的好处就是和时间做朋友,一个开放的大模式新生态一定会出来对抗微软。未来三到五年会发生新的变化。基于ChatGPT或对话智能的新应用时代,每个人都应该学习新技术。
钟俊豪:总之,这是给今年会议的一个信息。
李建生:愿开源更成功。
李阳:开源和AI是很好的结合。加上上海的金融之都,三个要素加起来,是可以预期的。
江涛:我希望未来的大会有更多开源社区的味道,有更多独立的会议和活动。
(对话记录由张静整理。请观看直播和回放视频。)