股价猛涨30%!商汤科技发布了全新版本的日日新5.0,彻底击败了GPT-4。

股价暴涨30%!商汤发布日日新5.0,暴打GPT-4_图1

经过一段时间的沉寂,人工智能巨头商汤再次引起了市场的关注。

股价沉寂多日的人工智能巨头商汤,在4月24日迎来了大爆发,当天股价上涨了31.15%。这样的大涨行情,也让商汤成为了市场焦点,在当天上午11时15分起,公司股票暂停了买卖。

股价暴涨30%!商汤发布日日新5.0,暴打GPT-4_图2

而到了4月25日,商汤的股价已经上涨超过15%。这样的涨幅背后,是商汤在4月23日推出了其规模达到6000亿参数的大模型“日日新5.0”。这个新模型在知识、数学、推理和代码能力方面有了大幅提升,综合性能甚至能够与GPT-4 Turbo全面对标。

谁能想到,如此炙手可热的商汤,在之前还面临着亏损危机。

暴打GPT-4,推理速度快到看不清

目前市场上认为商汤近期股价暴涨的原因是其最新发布的“日日新5.0”大模型。商汤公司于2023年4月发布了第一代“日日新”大模型体系,并在同年8月获得了上线批准。根据商汤官网的资料显示,日日新大模型体系包括了商量大语言模型、秒画文生图大模型、语音大模型和向量模型等。

股价暴涨30%!商汤发布日日新5.0,暴打GPT-4_图3

时隔一年,“日日新5.0”正式诞生,它基于超过10TB tokens训练,覆盖了大量合成数据;同时也采用了当前业内主流的混合专家架构(MoE架构),上下文窗口可达到200K左右,在综合能力上,可以全面对标GPT-4 Turbo,“主流客观评测上达到或超越GPT-4 Turbo”。

股价暴涨30%!商汤发布日日新5.0,暴打GPT-4_图4

在发布会现场上,商汤还进行了一次《街头霸王》游戏PK,两个角色分别由商汤新发布的日日新端侧大模型SenseChat Life(商量轻量版)和GPT-4操纵。其中绿人由GPT-4操纵,红人则由商量轻量版操作。当GPT-4还在思考如何决策时,商量轻量版的拳头就已经打了上去,名副其实的“暴打GPT-4,生动地展示了商量轻量版推理速度之快。

股价暴涨30%!商汤发布日日新5.0,暴打GPT-4_图5

而且它还是一个端侧大模型,采用了端云联动的MoE(Mixture of Experts)框架,“以小博大”,已经在多项测试中击败了Llama2-7B(另一个模型),甚至是13B(另一个模型),在同等尺度上性能已经达到了SOTA(State-of-the-Art)水平。在中等性能手机上,商量轻量版可以达到18.3字/秒的推理速度,而人眼一般的阅读速度为20字/秒。而在高端旗舰手机上,它的推理速度更是可以达到78.3字/秒。

大版本升级,全面对标GPT-4 Turbo

大版本升级,全面对标GPT-4 Turbo

除了展示端侧大模型,商汤在此次发布会上还在“大基座”方面进行了升级,推出了日日新SenseNova 5.0版本,该版本全面对标GPT-4 Turbo!

股价暴涨30%!商汤发布日日新5.0,暴打GPT-4_图6

从评测榜单的数据上来看,商量5.0在常规客观评测已经达到或超越了GPT-4 Turbo。其主要依靠两点做到了这一点,一是数据,二是算力。首先,商汤采用了超过10T的tokens,让日日新5.0具备了高质量数据的完备性,此外,商汤还合成构造了高达数千亿tokens的思维链数据,以激活大模型推理的能力。

在算力方面,商汤公司通过联合优化算法设计和算力设施,实现了更高效的计算能力。他们利用算力设施的拓扑极限来定义下一阶段的算法,并且算法的新进展又指导了算力设施的建设。

股价暴涨30%!商汤发布日日新5.0,暴打GPT-4_图7

整体上来说,日日新5.0的亮点可以总结为:①采用MoE架构;②基于超过10TB tokens训练,拥有大量合成数据;③推理上下文窗口达到200K;④知识、推理、数学和代码等能力全面对标GPT-4 Turbo。

股价暴涨30%!商汤发布日日新5.0,暴打GPT-4_图8

在多模态能力方面,日日新5.0也有整体的提升,在识图、生成图像以及代码能力等方面均可与行业领先模型媲美,可以说是相当全面了,这也是商汤一直强调的“大模型+大装置”的打法。

股价暴涨之后,商汤科技能否摆脱亏损的困境?

作为“AI四小龙”之首的商汤,不久前,刚发布了2023年年度业绩公告,公司实现营收34亿元,同比下滑10.6%;年度亏损64.95亿元,较2022年同期的60.93亿元增加了6.6%,自2018年以来,商汤已经累计亏损了近500亿。

但与此同时,根据年报显示,商汤公司的生成式AI业务成为了其业绩的亮点。生成式AI的收入在过去一年突破了11.84亿元,实现了199.9%的快速增长,占据了公司总收入的比例从2022年的10.4%提升到了34.8%。因此,在商汤公司2024年的战略目标中提到,他们将集中资源于生成式AI业务,以改善现金流和减少亏损,从而推动核心业务的盈利。

股价暴涨30%!商汤发布日日新5.0,暴打GPT-4_图9

可见,商汤正在践行这一目标,在日日新5.0的发布会上,商汤也收到了一份客户的使用反馈。华为、WPS、小米、阅文、海通证券,从办公到文娱,从金融到终端,都分享了他们使用商汤日日新大模型体系后,给自身业务带来的奖杯呢增效,也因此,商汤股价在发布会之后迎来了大涨。

股价暴涨30%!商汤发布日日新5.0,暴打GPT-4_图10

可见,商汤具备了先进的技术、强大的算力、完善的方法论以及广泛的使用场景。这些因素使得商汤有望成功转型为生成式AI领域的龙头企业。在人工智能与图像计算时代,商汤有着良好的发展前景。