聪明大脑如何匹配现实需求?

来自版块 深度
688
0
    近两年,无论你身处什么行业,处于何种生活状态,相信大家对AIGC、大模型等热词并不陌生,从之前大火的AI作图、AI脚本、到AI恋爱,人工智能正在一步步地改变我们的生活方式。

    与此同时,大模型行业也在不断地进行迭代升级。近日,随着阿里云一则直降97%定价策略的“横空问世”,成功地将大模型行业的竞争格局,从“百花齐放”推向了更为激烈的“百家争鸣”阶段。

    据了解,阿里云把旗下通义千问GPT-4级主力模型——Qwen-Long的API输入价格,从0.02元/千tokens降至0.0005元/千tokens,相当于OpenAI——GPT-4的400分之一,而此举也被行业称为“击穿全球底价”的重磅“炸弹”。

    紧接着,百度、科大讯飞、腾讯云等企业纷纷响应“号召”,宣布旗下部分大模型免费开放,进一步为这次“降价潮”注入了动力。

    “烧钱”的大模型为何会集体降价?越来越多大模型免费开放后,能否替代搜索引擎?以及目前国内大模型中“谁”最聪明?又是如何实现商业化落地的?

    “烧钱”的大模型为什么进入降价时代了?

    “便宜到不需要犹豫”OR“羊毛出在猪身上”

    “我们希望不断降低情报成本,让这些东西变得非常便宜,便宜到你根本不需要犹豫。”OpenAI首席执行官SamAltman在新加坡管理大学演讲时,曾回答过关于大模型降价的问题。

    他还进一步表示:OpenAI每三个月左右就能将推理成本降低90%。从去年开始,OpenAI一直在频繁降价。比如,在去年6月,OpenAI把当时最先进、用户最多的嵌入模型Text-embedding-ada-002降价75%,把当时用户最多的聊天模型gpt-3.5-turbo降价25%,还推出了gpt4-16k平替版——gpt-3.5-turbo-16k,降价95%。

    今年5月,国内大模型纷纷跟进降价,加速了行业降价潮。5月6日,私募基金幻方量化旗下公司深度求索推出了DeepSeek-V2模型。据介绍,该模型在性能上比肩GPT-4Turbo,但API价格只有GPT-4-Turbo的近百分之一,引发行业高度关注。

    之后,智谱AI、字节豆包大模型跟进降价。其中,智谱AI宣布将其GLM-3Turbo模型的调用价格下调80%;字节豆包大模型首次对外开放,就把价格单位从元变为了厘。以豆包通用大模型pro-32k版为例,其推理输入价格为0.0008元/千tokens,较行业价格低了99.3%。

    从目前参与降价或免费的大模型来看,大多都是各家公司的入门模型,并且降幅较大的都是有云服务的公司,而企业级的模型仍维持原价。因此,对企业用户影响有限。一般而言,企业对大模型的需求更加定制化、私有化,而要想实现这些需求,势必是需要花钱的。

    据媒体不完全统计,截至今年4月底,国内共推出了约305个大模型。由此来看,国内大模型迎来“降价潮”是行业的必然趋势,这不仅仅是要从上百个模型中“优胜劣汰”,更重要的是要建立用户心智,也就是“教用户如何玩大模型”。

    比如,除了对大模型的常规提问之外,用户还可以在大模型上创建自己的AI应用。

    此前,OpenAI上线GPT商店曾引发行业热议,在GPT商店里可以搜索到各种各样的AI相关应用,像是图标设计神器——LogoCreator、学术助手Consensus等等,还可以按需自主创建GPT。现在,国内大模型也可以实现这一“玩法”,比如智谱清言GLM-4、字节的豆包、百度文心一言等,都在大模型界面设置了“智能体中心”窗口,不仅可以按类型搜索已有热门智能体应用,还可以自主创建新的智能体,通过复刻APP业态,大模型让用户和开发者实现了无缝切换。

11.jpg


    而这种现象也为大模型公司提供了另一种生存路径,即转型成为应用公司。顺福资本创始人李明顺对此也持相同态度,他进一步表示,“有一些大模型公司的创始人有PlanA和PlanB的双计划,就是一旦我的模型实在是拼不过前面的5家之后,就要被迫在一些垂直领域里面找到生存之地,它就会转型为一家应用公司。”

    另外,此次降价也对大模型创业公司有一定的冲击。5月,跟进降价的大模型创业公司只有智谱AI,而零一万物、MiniMax、月之暗面等大模型创业公司并没有跟进。这主要是因为,这些大模型创业公司其主要模型的定价从一开始就维持在行业较低水平,所他们的降价空间相对有限。

    这也是大模型初创公司和大体量模型公司之间的一个重要差异表现。猎豹移动董事长兼CEO、猎户星空董事长傅盛表示:“大公司通过大模型来获取云客户,羊毛出在猪身上。但大模型创业公司没有“云”这样的生态,必须另寻商业模式。”

    与此同时,此次降价潮还会吸引更多开发者参与进来,尤其是中小团队的开发者,他们往往不缺想法,缺的就是“烧钱”的算力资源,甚至还有可能促成一些小团队之间的“强强联合”。这种合作不仅能够推动创新,加速大模型的开发和优化,还可能产生全新的应用和解决方案,为市场带来新的活力和机会。

    聪明的大模型,

    如何匹配现实中的日常需求?

    在科技日益融入我们生活的当下,大模型技术已“随处可见”。而马斯克关于AI可能在两年内超越人类的预测,更是为这一领域注入了更多的期待和关注。

    那么,在当前一众竞相“超越GPT”的大模型浪潮中,哪个国产大模型可以让用户实现“科技改变生活”呢?据大模型开源开放评测体系司南(OpenCompass2.0)数据,在2024年4月大语言模型最新评测中,智谱AI的GLM-4排名行业第4,位居国产大模型第一,紧随其后的是MiniMax的abab6.5。值得一提的是,在4月的大模型榜单中,前十名里有6位都是国产大模型选手,这充分证明了我国在大模型技术领域的迅猛发展态势。像是私募基金幻方量化旗下公司深度求索的DeepSeek-V2-Chat、阿里云qwen1.5-110b-chat和百度的旗舰级ERNIE-4.0-8K-0329等优秀模型均位列其中。那么,这些大模型在我们日常生活中到底好不好“用”呢?为了回答这个问题,我们选取了五个(豆包、通义前问、智谱清言、Kimi、文心一言)业内口碑较好的免费大模型,进行日常测评。接下来,我们将从用户的角度出发,基于实际使用场景,深入体验并评估这些大模型在实际应用中的表现。

    以克劳锐编辑部为例,我们的工作场景是不停的和内容“打交道”,包括但不限于找选题、写文章等等。目前我们获取选题的方式来自于行业资讯、报告等,而找资料的方式则来自各种搜索引擎。

全部评论 0

您需要登录后才可以回帖 立即登录
说说你的想法......
0
0
0
返回顶部