大模型“百舸争流”竞逐 智能+“千帆竞渡”落地


发布日期:2024-04-15 19:00    点击次数:77

  年终总结你写好了吗?在2023年的倒数第二周,被网友戏称为真人版“硅谷真还传”的主角之一、OpenAI CEO山姆·奥特曼,就给这一年打上了一个新标签——“世界开始认真对待人工智能的一年”,并将他的17条总结经验公布在网上,希望对正在思考2024年该做什么的人们有所帮助。

  一年前的岁末之时,人工智能初创公司OpenAI的Chat GPT横空出世,以人工智能为代表的数字科技再次出现革命性技术进步,开启了全球新一轮的科技浪潮。

  在万里之外的中国,国产大模型“百舸争流”,“智能+”加速落地千行百业。2023年是当之无愧的以大模型为代表的 AI技术狂飙之年。这一年来新赛道带来了哪些新机遇?新事物又面临哪些新挑战?

  纵观个人计算机40年发展,没有任何一场技术革命像大模型一样,能在短时间内让几乎所有人快速形成共识,并以一日千里的速度发展。上一次,这样的激情与机遇,还是在移动互联网兴起之时。

  2023年,放眼全球,推出Chat GPT的OpenAI,引领谷歌、Meta、马斯克旗下的xAI,以及百度、阿里、腾讯、华为、字节等公司加入大模型“生态圈”。

  在国内从“混元”“轩辕”到“盘古”“星火”,从“通义千问”到“文心一言”,令人眼花缭乱,名字仿佛让人“掉入书袋”的大模型纷至沓来,“百模大战”更被形容大模型赛道中竞争的激烈。

  据不完全统计,仅到今年5月,中国10亿参数规模以上的大模型已发布79个。

  “技术进步的速度绝不会放缓。”中国(深圳)综合开发研究院院长樊纲12月初表示,当前要做的就是抓紧研究大模型。

  所谓AI大模型,是指拥有数百万以上参数规模的深度神经网络模型。在自然语言处理、机器视觉和多模态等领域,国内已涌现出多个具有行业影响力的预训练大模型。

  而在AI大模型创业大军中,美团创始人之一王慧文、搜狗创始人王小川、投资人李开复、清华、北大、上海交大等诸多业界大咖和科研院所也纷纷加入。中小创业者摩拳擦掌希望在大模型基础上开发出医疗、零售、教育、游戏等垂直行业的AI应用。

  “理想上慢一步,落地上快三步。”12月起,开启大模型创业8个月的王小川表示,相比美国,做应用是中国传统强项,中国公司反而面临着一个更好的机会。

  来自工信部赛迪研究院的数据显示,今年,我国生成式人工智能市场规模有望突破10万亿元。生成式人工智能正在加速渗透制造业、零售业、电信行业和医疗健康等四大行业。

  值得关注的是,“百模大战”也带来了关于算力荒、数据荒的思考。

  百度创始人、董事长兼首席执行官李彦宏就在12月表示,中国现在有好几百个基础模型,是对社会资源巨大的浪费,尤其在算力还受限制的情况下,更多资源应该放在探索跟各行各业的结合。

  中国科学院科技战略咨询研究院研究员万劲波认为,大模型创新发展重点在于创新生态构建和行业示范应用,包括政务、金融、医疗、制造业等各行各业的应用落地。如华为盘古政务大模型在深圳福田落地,腾讯在长沙有“超级城市大脑”,南方电网研发自主可控的电力大模型等。行业领军企业开放应用场景,协同大学院所共同开展前沿技术研发,推动智能+在千行百业加速落地应用,加快形成新质生产力和先进生产力,塑造创新发展新动能、新优势。

  深圳国家高技术产业创新中心大数据平台研究部部长卢春江表示,算力、数据、大模型是未来的“基础设施”,行业应用需要解决“基础设施”的问题,将行业知识与行业大模型结合,另外也需要创造自主可控的生态。

  12月22日,全国首个官方“大模型标准符合性测试”结果公布,包括腾讯混元大模型、百度文心一言、360智脑、阿里云通义千问四款国产大模型首批通过国家大模型标准测试。

  作为长期关注人工智能技术的行业专家,腾讯研究院前沿科技研究中心主任王强表示,迈入通用人工智能门槛后,AI有望成为通用目的技术,进而成为新的生产力,给全球经济、社会带来全方位的巨大影响。其中,从文本到图像、音视频等更多维度,多模态将推动AI应用广度,人工智能体的发展大幅拓展应用深度,生成式AI对科学研究的助益日益明显。

  但AI大模型席卷全球,为各行业带来颠覆式创新机遇的同时,也面临挑战。

  8月15日正式实施的《生成式人工智能服务管理暂行办法》提出,对生成式人工智能服务实行包容审慎和分类分级监管。

  联想集团董事长兼CEO杨元庆在2023年世界互联网大会乌镇峰会上表示,要想让人工智能大模型在各行各业落地应用,真正实现人工智能的普惠,还有一些现实问题有待解决,尤其是如何在解放生产力、带来便捷的同时,保护隐私、数据安全的问题。

  他表示,跟公共大模型对话时,要想得到恰当、正确的反馈,就必须“投喂”真实的数据和信息。企业一旦将公共大模型直接应用到业务中,企业数据就会变成公共大数据的一部分,存在泄露商业机密、用户信息、知识产权等风险。