每经记者:陈婷
行业属性:虚拟数字人
估值/融资轮次:2021年11月,中科申智获得陈山资本约1000万美元的B轮融资。
核心竞争力:自主研发CLAP算法;多模态驾驶技术;3D AIGC产品
未来关键词:元宇宙时代;AGI;AIGC
2月25日,OpenAI首席执行官山姆奥特曼(Sam altman)再次公开提到AGI(General Artificial Intelligence)。
《当前全球焦点》在他发表的文章中强调,OpenAI的使命是确保AGI造福全人类。他认为,如果AGI被成功创造出来,它可以通过增加财富、促进全球经济发展和帮助发现改变可能性极限的新科学知识来帮助改善人类。
最近引发全球关注的“新物种”ChatGPT于2022年11月30日被Open AI引入世界。也就是说,山姆奥特曼可以被称为“ChatGPT之父”,同时,他也是AGI的崇拜者和实践者。
在通往人工智能未来的道路上,千千有成千上万的人在努力,中科申智创始人兼CEO程维忠就是其中之一。相比山姆奥特曼和他的开放AI,他创办的程维忠和中科申智选择了更差异化的竞技路线。
程伟忠毕业于中国科学技术大学物理系半导体专业,硕士毕业于复旦大学世界经济学院。他曾就职于中兴通讯、光明乳业和魏碑科技等上市公司。作为一名创业老兵,2016年,他创办了中科申智。创始团队没有选择Open AI的大语言模型方向,而是选择了虚拟人动作和表情生成技术这个相对较小的切入点。
原因是在《每日经济新闻》《谈未来商业》(点击直接话题:谈未来商业|记录、预见、让未来发生)的专访中,程维忠向记者透露,ChatGPT突破的大语言模式被业界视为AGI的“圣杯”,是大厂必须涉足的战场。中科申智的创业团队审时度势,巩固了自己作为一家应该避开边缘的创业公司的地位。
与开放的AI路径不同,但与山姆奥特曼对AGI的热情类似,程维忠在接受记者采访时不止一次提到“信念”这个词,他的信念就是“技术”本身。
“对于我们这些做技术的人来说,如果只是想盈利,却不能发自内心的做好技术,公司可能很快就会死掉。”程伟忠说。
但目前来看,短短两个月就俘获全球1亿用户的ChatGPT的推出,引发了人们对元宇宙时代能否真的到来的质疑,甚至对虚拟人的未来感到担忧。
ChatGPT引爆全球关注。每经记者刘雪梅摄。
对此,程伟忠表示,ChatGPT可以提高虚拟人的智力。“但我们仍然需要使用其他大模型来解决虚拟人的表情动作。”在程维忠看来,元宇宙和ChatGPT不是替代品。元宇宙是下一代互联网的代名词,是一个更广泛的概念。“除非有一天我们确认下一代互联网不是由3D视觉和沉浸式环境主导,那么元宇宙的概念还没有被推翻。”
他说,ChatGPT一炮而红,不仅仅是因为技术上的成就,更因为ChatGPT的出现预示着下一代互联网整个交互方式的改变。
程维忠认为,互联网的发展可以分为三个阶段。第一阶段是PC互联网时代,第二阶段是移动互联网时代,第三阶段是元宇宙时代。他认为元宇宙时代的关键词是“对话”,即人与机器的拟人化交流。基于这种认知,ChatGPT等LLM必不可少,“生成式AI虚拟人也不可或缺”。
“这个方向真的被我们赢了”带领中科申智走到现在,程维忠有些“赌”了。
“2015年的时候,我和创始团队就在讨论,是按照原来的移动互联网的方向走,还是重新创业的话找一个新的方向。”程伟忠回忆道。
当时移动互联网的创新机会越来越少,程维忠和他的创业伙伴把目光投向了下一代互联网。当时没有完整概念的元宇宙,成了他们押注的未来。
“我们当时在想,下一代互联网无非是制造场景的技术,或者是制造物体的技术,或者是做人的技术。——我们认为人类技术更重要。”程伟忠说。基于这些考虑,当初,程维忠给中科申智这样的定位:围绕虚拟人动作和表情的生成技术,为各行各业提供软件和算法驱动的内容制作工具。
当记者问为什么不选择大语模赛道时,程伟忠说,“我觉得大厂要是进来,肯定会把我们打死。”
中科申智成立于2016年,那是人工智能方兴未艾的一年。不到一年前,2015年12月,Open AI诞生。成立时定位为非盈利组织,由奥特曼、特斯拉创始人马斯克、PayPal联合创始人Thiel等硅谷科技巨头共同创立,承诺投资10亿美元。
“刚成立的时候,开放AI的调门挺高的。当然没有像现在这样全世界都知道,但我们(业界)当时就知道了。”程维忠回忆说,当时Open AI计划做一个开源的大语言模型。“虽然当时开放AI的方向不是那么明确,因为它现在使用的底层技术是谷歌在2017年发布的。”
即使今天大名鼎鼎的Open AI在当时也只是一个初出茅庐的状态,但包括程维忠在内的业内人士已经意识到,资金基础雄厚的大厂迟早会专注于大语音模型。
之所以这么肯定,和大语言模型的特殊性有关。程伟忠透露,ChatGPT所突破的大语言模式,一直被业界视为AGI的“圣杯”。
“在人类数据中,最全面的信息是语言的信息。样本量最大,知识体系最丰富。做培训会比较容易。”在此基础上,很多美国专家有一个基本观点:从数学的角度来看,人脑和语言的数学结构是相似的(隐马尔可夫模型)。如果这个假设成立,通过语言的不断迭代训练,AGI就会实现大突破之后。
虽然下定决心不做大语言模型,但中科申智一开始还是走了一条试错的路。
“早期有很多工艺可以尝试。直到2017年谷歌推出Transformer,我们找到了方向,道路变得清晰。”程伟忠提到ChatGPT的底层技术也是Transformer。“当时谷歌做了很多基于Transformer的demo,我们也很兴奋,慢慢就专注于这个方向了。”
无论Open AI还是沈重科智,把技术重心放在《变形金刚》上风险都很大。
因为我们早期一直专注于底层技术的研发,没有做太多的商业化,所以中科申智的前期研发费用是团队筹集的。2019年,公司推出了第一代更成熟的产品,情况有所好转。2020年,成立四年后,中科申智终于拿到了数千万的天使轮融资。
下一个转折点将在2021年。企业调查显示,今年年初,中科申智获得由著名投资机构金沙江创投领投的数千万人民币A轮融资。2021年11月,中科申智获得陈山资本另一轮约1000万美元的融资。
也是在这一年,程伟忠觉得自己“赌对了”。
“从整个发展趋势来看,这个方向真的被我们走了,我们觉得自己做得越来越对了。”程伟忠说。
理想与现实的平衡当金沙江创投正式宣布关于中科申智的融资消息时,时任金沙江创投管理合伙人的朱啸虎表示:“未来将是消费互联网和企业服务并重的10年。我们c
获得明星投资人的青睐是好事,但作为一个有技术背景的创业者,程维忠总有一种“壮志未酬”的感觉。他希望资本能看到中科申智更多的技术价值。
程维忠说,“投资者对我们有信心,因为他们认为我们确实是虚拟人领域的领先公司。一方面我们做得早,另一方面我们也很专注。”
程伟忠表示,国内投资者更关注具体产品的落地,关注核心业务在市场上的表现和应用前景。“他们没有兴趣告诉他们一些特殊的‘浮动’。”
这可能也是中科申智获得第一笔融资较晚的原因。
程伟忠回忆道:“当时我们觉得最痛苦的是,虽然我们认为这个方向很重要,但是我们和VC谈的时候很难明确具体的实现路径。我们认为这条路是可行的,但关于做什么样的大模型,有许多可能性和不确定性。”他清楚地记得,当时有投资人对他说,“既然你觉得很重要,那你就先花钱吧。”
所以早期公司创始团队都是自掏腰包支持公司的发展。
交谈中,Open AI借助美元资本的崛起也让程维忠感慨。在他看来,国内的资本市场逻辑和环境,更注重快速和短期的回报,会给在垂直领域推动生成式AI技术研发的企业带来压力。
忠实的妻子,得到明星资本的赌注也是阶段性的成功。在平衡资本的现实需求和对自身技术理想的追求之间,中科申智走出了一条独特的发展路线。
程维忠告诉记者,中科申智的定位是生成式AI虚拟人和3D AIGC技术公司,目前已经发展成三个部分。
第一部分是底层算法,用程维忠的话来说就是“我觉得很珍贵的东西”。据悉,中科申智的底层算法是自主研发的CLAP算法,即语言-动作对比训练算法。
第二部分是虚拟人业务的中间平台Motionverse。资料显示,它是一款多模态运动生成驱动引擎,融合了XR和AI技术,可以通过传感器、语音、视频等多种方式让虚拟人随时移动并与用户交互。程维忠将这部分定义为“外界认为很重要,公司认为也很重要”。
第三部分是3D AIGC产品。这部分,在程伟忠看来,是投资人比较看重的部分。
产品方面,以单品为例,针对市场需求,中科申智推出了“自动播报”虚拟直播产品,让虚拟主播全年滚动直播。根据中科申智提供的数据,其虚拟主播产品已服务超过2000家客户,占主流电商平台虚拟主播的近70%。
“整个市场在不断变化。一个产品今年很好,三年后还很难确定会不会火。但算法的方向是,一旦平滑,就会越来越平滑。所以我们认为底层的东西会更重要。”程伟忠说。
知止后来认定,在涉及业务范围时,中科申智是谨慎的。“脱离技术的东西,比如打造IP,不是我们的业务范围。”程伟忠说。
事实上,程维忠认为,一个技术领先的公司在推出产品时,需要考虑很多方面。
“为什么ChatGPT这么火,Open AI还没推出一款产品?”程维忠分析,“一方面,Open AI的团队认为算法还不够成熟。这种情况下,大量推出产品可能会让用户产生反感。另一方面,当一个公司不考虑营收和产品时,公司可以全部在算法的迭代中,算法的迭代必然会更快。”
程维忠认为,如果一个公司的算法迭代还没有达到理想状态,就会“自然不舒服”。
超级虚拟助手:超宇宙时代的入口?随着ChatGPT的流行,大量的质疑攻击了虚拟人,甚至是元宇宙赛道。甚至有观点认为,随着ChatGPT成为焦点,虚拟人乃至背后的元宇宙都将成为“过去式”。
程维忠显然不同意这种观点。在他看来,ChatGPT的出现加速了一个新的超宇宙时代的到来。未来将会有一个超级虚拟助手扮演“超宇宙时代入口”的角色。
“过去我们与互联网的交互方式是菜单式的,这是科技发展的结果,与我们的本能差距非常大。”程维忠说,“人类交流的本能方式是通过语音交流或者面对面交流。”
在他看来,ChatGPT提供了新的可能性:“现在,ChatGPT提供了文本对话,然后它也可以通过语音进行交流。在对未来的进一步想象中,也可以是对面的虚拟人,我们可以和虚拟人交流。”
也就是说,在程伟忠预见的未来,人们目前习惯的文字对话,很快就会变成语音对话,并最终演变成有声音和视觉的多媒体对话。也正是因为这个原因,程伟忠认为,作为新时代的入口,虚拟人在未来世界的地位不可撼动。
这一切的前提是虚拟人技术的进一步成熟。值得一提的是,虽然大多数业内人士认为ChatGPT可以提高虚拟人的智力,赋予他们“灵魂”,但从技术上来说,距离理想的虚拟人真正到来还有一段路要走。
程伟忠提到,ChatGPT并不能解决虚拟人人机交互的所有问题。如果你想让一个虚拟人像人类一样笑着走路,你需要中科申智做一个虚拟人动作表情驱动的大模型算法。“从技术角度来说,虽然ChatGPT会大大提升虚拟人的智能,但它并不能让虚拟人与人的交互更流畅、更生动。”程伟忠说。
要把这条路走通,资本的支持必不可少。ChatGPT带动的这种“傲慢”能否给中科申智的发展带来更多机遇?资本的态度会有新的变化吗?
“我不确定。”程伟忠赶紧回答。在他看来,目前外界的注意力更多集中在大语言模型上,未来一个明显的转折点可能会在GPT4问世后出现。“GPT4的重点可能是从大语言模型到多模态学习。到那一天,VC可能会认为垂直行业的多模态培训才是未来更有吸引力的方向。我坚信这一天会到来。”
多模态培训是中科申智擅长的领域。通过多模态驾驶技术,中科申智使虚拟人能够更有力地与人互动。
程伟忠告诉记者,所谓多模态训练,就是当一个人向虚拟人输入一条短信时,ChatGPT可以将文本处理成虚拟人能够理解的语言。而到了后期,虚拟人具体如何行动,与ChatGPT无关,需要更多的模态参与。
目前ChatGPT的出现,在一级市场上给中科申智带来了一定的收益。至少,程维忠觉得,当他跟别人说起中科申智做的事情时,越来越多的人明白了。
在他的预言中,虚拟人的发展将比超宇宙快一步。“虽然虚拟人技术是元宇宙原始技术的一部分,但虚拟人本身也是一种交互工具,解决了交互问题,将对互联网的交互升级起到关键作用。”
他认为,在元宇宙到来之前,未来三到五年,只要有屏幕,有网络,就会有虚拟人。
国家商业日报