周伯文:大模型时代技术路线的“不确定”对创始人要求更高了 全球聚焦
2023-05-30 19:55:31 南方都市报

5月28日下午,由科技部、北京市人民政府主办,北京智源人工智能研究院和中国科学技术信息研究所共同承办的“2023中关村论坛—大模型发展论坛”召开。创新工场董事长兼CEO李开复在演讲中表示,以GPT-4等大模型为代表的生成式AI在全球延烧,意味着AI 2.0时代已经到来,它将带来比移动互联网时代大十倍的机会,穿透各行各业极大地提振生产力。

清华大学惠妍讲席教授/电子系长聘教授、衔远科技创始人周伯文接受南都记者专访时表示,在过去几个月,有越来越多高质量的中文数据被释放出来,“我们能够用很多种方案获得高质量、多元化的数据来帮助训练。”

北京市副市长于英杰在致辞中提到,推动大模型创新发展是实现2030年我国人工智能世界领先目标的战略选择。他表示,下一步,北京市将持续发挥政府引导作用和创新平台催化作用,整合创新资源,加强要素配置,营造创新生态,重视风险防范,推动我国通用人工智能实现创新引领。


【资料图】

在论坛上,北京智源人工智能研究院院长黄铁军发布通用分割模型SegGPT(Segment Everything In Context)与中文开源指令数据COIG(Chinese Open Instruction Generalist)。据了解,SegGPT是世界上首个利用视觉提示完成任意分割任务的通用视觉模型,具有国际领先的通用、灵活推理、自动视频分割和追踪能力。COIG聚焦中文语料,数据类型多样,经过了人工质检与修正,数据质量可靠,同时可商用。该数据集填补了开源、可商用的大规模中文指令数据的空白,进一步夯实我国大模型产业生态发展。

在主题演讲环节,各位从业者都表达了自己对大模型未来趋势的判断。创新工场董事长兼CEO李开复在演讲中表示,以GPT-4等大模型为代表的生成式AI在全球延烧,意味着AI 2.0时代已经到来,它将带来比移动互联网时代大十倍的机会,穿透各行各业极大地提振生产力。

“AI大模型是中国不容错过的历史机遇。一是中国拥有广大的中文语料和市场,二是通过发展AI大模型,中国还可以推动创新产业的发展,实现科技与经济的双重红利;三是发展大模型可以使中国在AI领域保持技术引领地位,并在多个应用领域取得竞争优势。四是中国拥有庞大基数的年轻工程师和最坚韧的企业家 ,为发展 AI大模型提供了强大的人才支持。”李开复坦言,大模型赛道是未来技术的兵家必争之地,因此自主创新是中国企业的必经之路和重大责任,而中国的中小微企业是重要创新力量。

李开复认为,AI大模型赛道可以分成基础模型层-中间层-应用层三个层级,其规模巨大足以容纳巨头、中小企业和初创公司在里面赛马。创业公司也与巨头各擅其长:正如ChatGPT背后的Open AI一样,创业公司更灵活更专研,从硅谷经验看很多技术创新的发起者。而技术领先、市场反应快,能打硬仗、落地执行力强的团队是中国大模型公司成功关键之一。“创新需要合作,开放共创未来。我们期待中国大模型赛道能形成巨头、中小微创新企业一起发展的‘创新综合体’,一起把AI 2.0做大做强。”

百度首席技术官王海峰认为,大模型的产业化,类似芯片代工厂模式。具有算法、算力和数据综合优势的企业,可以将模型生产的复杂过程封装起来,通过低门槛、高效率的生产平台,为千行百业提供大模型服务。

对于大模型的局限,清华大学惠妍讲席教授/电子系长聘教授、衔远科技创始人周伯文告诉南都记者,目前大模型的主要问题是给出的答案往往“外行看着觉得内行,内行还是觉得很外行”,衔远科技希望通用大模型在具备通用智能的水平上,技术上更具备专业性,可以在产品的创新设计各个环节里帮助企业更好地提升效率。

在周伯文看来,大模型时代的技术路线是“不确定”的,“会有很多种技术路线去做判断,往左走还是往右走。在这个人工智能的创新创业时代。对团队、对创始人的要求都比以前更高了,需要能够做有前瞻性的技术判断。”

对于“中文公域数据质量不如英文公域数据高”的观点,周伯文认为,“其实并不是缺少这些数据,只是没有打通。”此外,在过去几个月,有越来越多高质量的中文数据被释放出来,“我们能够用很多种方案获得高质量、多元化的数据来帮助训练。所以我觉得数据问题的影响远远小于大家比较的中文互联网上的数据数量跟英文的差异。”

(文章来源:南方都市报)

相关新闻: