|
OpenAI的劲敌Anthropic发布Claude 4系列模型,称Opus 4为“全球最佳编程模型”,对AI投资者而言标志着模型能力的新纪元,可能重塑软件开发行业格局。
Anthropic的新发布加剧了与OpenAI、Google在顶级模型领域的竞争,为投资者提供了重新评估AI领域竞争格局的机会。
一、Anthropic迄今为止最强大的模型
Anthropic正式发布Claude4模型系列,包括Claude Opus4和Claude Sonnet4两款新模型。
根据Anthropic内部测试,Opus4在编程能力评估SWE-bench Verified测试中超越了谷歌Gemini2.5Pro以及OpenAI的o3和GPT-4.1。不过,在多模态评估MMMU和博士级别科学问题测试GPQA Diamond中,该模型仍未能超越OpenAI的o3。
两款模型均采用混合架构,既能快速响应,又能进行深度推理。启用推理模式后,模型会在回答前花更多时间思考解决方案,并展示用户友好型思维过程摘要。模型还支持并行使用多种工具,能够提取事实并保存至记忆中,逐步构建隐性知识库。
其中,旗舰版本Claude 4 Opus在编码能力方面取得了显著突破。据Rakuten测试数据,通过Opus 4开发的编程智能体可独立稳定连续工作7小时,超过了之前OpenAI创造的纪录。
Claude 4 Opus不仅在编码任务中表现突出,其在推理、规划和长期记忆方面也有更多进展。也因此,有声音认为其很可能取代部分软件工程师以及从事简单代码编写和维护的初级程序员、代码审查员等。
二、Anthropic公司的前世今生
Anthropic由前OpenAI研究副总裁Dario Amodei和其妹妹Daniela Amodei于2021年创立。两人曾参与OpenAI GPT-2和GPT-3模型的开发。由于对AI安全性和发展方向的分歧,他们选择离开OpenAI,创办了Anthropic,希望开发安全、可靠且符合人类价值观的人工智能系统。
过去几年中,Anthropic获得了包括亚马逊和谷歌在内的多家科技巨头的支持。今年3月,该公司宣布完成总额达35 亿美元的E轮融资,公司投后估值升至615亿美元。同在3月,OpenAI在软银集团领投的新一轮融资中筹集400亿美元,投资后估值达到3000亿美元,仍高出Anthropic不少。
三、AI巨头竞赛加剧:行业格局再洗牌
Anthropic的新模型面世正逢AI领域的巨头们频传消息“上头条”。
本周稍早,微软宣布了新的编码智能体,并与马斯克旗下xAI的Grok模型合作,将Grok纳入微软云平台;谷歌加速将AI智能体融入公司服务,推出AI模式的新型搜索功能;OpenAI宣布了65亿美元的交易,降收购由“iPhone之父”、前苹果设计总监Jony Ive创立的AI硬件初创公司io。
这表明Anthropic、Google和OpenAI之间的"最佳前沿模型"竞争正在升温,同时对这些公司能否将当前AI技术推向新高度的疑问依然存在。
四、中国AI编程发展现状
据《2024年中国AI代码生成市场观测报告》预测,到2028年,中国AI代码生成市场规模将增长至330亿元人民币,年复合增长率高达38%。这一数据无疑为AI编程的未来发展注入了强大的信心。
在中国,AI编程领域呈现出百花齐放的态势。阿里Qwen2.5-Max在数学和编程等单项能力上表现出色,稳居国内AI编程领域榜首。百度Comate则深度融入开发流程,编写了百度内部四分之一的代码,展现了AI编程在大型企业内部的广泛应用潜力。此外,字节的豆包MarsCode也凭借其在开发者中的高覆盖率,成为AI编程领域的一股重要力量。这些优秀的产品和技术,不仅推动了AI编程在国内的发展,也为整个行业树立了标杆。
|
|