对标 or 颠覆?Anthropic 让创业者狠狠共情

2024
03/08
19:05
分享
评论

 

如何看待 Claude3?" 超越 "" 震撼 "" 吊打 " 已成为它最深入人心的标签……

当地时间 3 月 4 日,Anthropic 发布 Claude 3 系列模型,该公司称这是迄今为止速度最快、功能最强大的人工智能模型。Claude 3 模型系列包括三个模型,分别是:Claude 3 Haiku、Claude 3 Sonnet、 Claude 3 Opus。

Claude3 的发布一时间引得行业内外群情鼎沸,很多人都将其与 GPT4 进行比较,认为 Claude3 将是最有可能超越 OpenAI 在人工智能主导地位的大模型。

对此大模型之家也延伸出了一些思考——为什么 Claude3 一出场就如此 " 炸裂 "?

GPT-4" 最强劲对手 " 的缔造者同样来自于 OpenAI

就像 360 公司董事长周鸿祎说的 "在硅谷,秘密是保不住的,他们有一个非常强大的人际关系网。"Anthropic 联合创始人兼首席执行官 Dario Amodei,早在 2016 年便加入了 OpenAI。

作为 OpenAI 的前副总裁,他本可以与公司一起享受 GPT 带来的荣耀,但在 2021 年 Amodei 选择出走 OpenAI 并创立了现在的 Anthropic。

据了解,Dario Amodei 的出走原因,主要与 OpenAI 在 2021 年获得微软的投资后的下一步发展路径这一层面产生了较大分歧。作为一家非营利组织,Dario Amodei 认为企业应该坚持自己的愿景和计划,而另一部分高管认为未来企业将在与微软的合资企业方面开展营利业务。

并且,彼时的 OpenAI 正面临着安全问题还未解决的困扰,Dario Amodei 认为在没有解决大模型安全问题就上线 GPT-3 将会带来很多问题,并且这也是一种不负责任的表现。事实上直到 2023 年 ChatGPT 爆火后,OpenAI 现任 CEO 山姆 · 阿尔特曼依然会经常出现在有关人工智能安全问题的听证会上。

虽然安全问题可能会影响决策,但也只是推动此类重大变化的考虑因素之一。他也认为在产品开发与研究重点方面,自己与 OpenAI 不再契合,在种种条件的驱使下 Dario Amodei 选择创办一家公司来追求他对人工智能发展的愿景。Dario Amodei 的出走更像是一个战略选择,目的是在一个新的环境中实施他的人工智能开发哲学,这也是为什么他可以带走 OpenAI 其他具有战略价值成员,包括 Tom Brown(GPT-3 首席工程师)。

据可查数据显示,截至 2023 年 7 月,Anthropic 已经筹集了 15 亿美元的资金。这包括亚马逊和谷歌的重大投资,亚马逊在 2023 年 9 月宣布投资高达 40 亿美元。

值得一提的是,2023 年年底 OpenAI 深陷离职风波时,OpenAI 董事会就潜在的合并事宜与 Dario Amodei 接洽,并取代阿尔特曼担任首席执行官。只不过Dario Amodei 并没有接受 OpenAI 的报价,这也从侧面说明 Dario Amodei 有着一个企业家或开发者自己的信仰。

与理想背道而驰,Amodei 憋了一股劲

并没有想着对标谁,Claude3 就是要走一条不一样的路径。在调研的过程当中,大模型之家发现 Claude3 在任务处理的过程中通常会给予使用者更精准、更原创的答案。由于 Claude 系列模型对外公布的信息较少,所以业界一直有声音表示 Claude 的训练方式源自 Anthropic 提出的 Constitutional AI 概念。

其核心就是通过 RLAIF(Reinforcement Learning from AI Feedback)来对模型进行训练,通过使用一个强大的现成的语言模型来生成偏好标签,代替传统依赖人类反馈的方法。这种方法在文本摘要、有益对话生成和无害对话生成等任务上,已经显示出与人类反馈训练相当或更优的性能。

在解决文本理解和生成中的长期依赖性问题下足功夫。Claude 作为以长文本能力为优势的大模型,Claude3 Opus 版本支持了 200K Tokens 的上下文窗口,并且可以处理 100 万 Tokens 的输入。

对于许多自然语言处理任务来说,例如机器翻译、摘要生成、问答系统等,长期依赖性是一个关键挑战,因为文本的含义通常需要考虑到较远的上下文联系。

用户通常期望大模型能够理解和生成与其提供的文本相关的广泛信息。通过训练模型处理更长的上下文,模型将学习到更广泛的语言模式,并且能够更好地适应于不同领域和风格的文本数据。这将增强模型的泛化能力,使其在各种任务和场景下表现更加稳健。

同时,Anthropic 采用了大量复杂的实际问题,以应对当前模型中已知的弱点,并将答案分类为正确答案、错误答案(或虚假答案)以及承认不确定性。

克劳德启示录,人工智能离边界还远

毫无疑问,Claude 3 的成功,也向全世界释放着强烈的信号,OpenAI 的地位并不像想象中那样不可撼动。或许 Claude 的表现并未像官方数据那样抢眼,但其带来的影响和产品的商业价值都将成为创业者最好 " 教科书 "。

特别是对于一些中国的初创团队,甚至是拥有雄厚资源的科技大厂,Anthropic 团队的成果证实了想在人工智能领域抢占高地靠的不一定是最顶级的资源,更是要有自身清晰的认知和明确的发展路径。

有传言称 GPT-5 的发布时机,已经不取决于企业本身,更是在迎合目前复杂的国际局势。无论真实与否,在国际竞争中,人工智能都已经成为新的竞争高地,这也为我国人工智能科研单位、企业带来了更多动力。

在教育、交通、通信、能源等基建领域、我国人工智能技术发展都在实质性地帮助社会和企业实现降本增效。在两会政府工作报告中对于新质生产力、人工智能 +、数字经济、强化企业科技创新主体地位等内容,也引发了在场以及众多科技从业者的共鸣。

小米董事长雷军也表示:" 人工智能是现在最热门的科技创新的话题,最近一系列的技术突破,都是美国最先突破的,我觉得中国在追赶阶段,我建议在今天的基础教育里面普及人工智能的知识,加大国内的人工智能人才的供给。"

大模型之家认为加大对人工智能技术研发的投入势在必行。同时,加强与国际合作,并制定更加明晰的政策和法规,以推动人工智能技术的创新与应用。此外,还需加强人才培养,培养更多的人工智能专业人才,提升国家在人工智能领域的核心竞争力。

Anthropic 等故事虽然无法复刻,但人工智能领域的发展还有着更为广阔的天地。在我国,实现技术自主才能避免在国际竞争中被 " 卡脖子 " 的现象,并且基于各行业广袤的数据积累,也为我国人工智能领域带来先天优势。在实现技术自主的过程中,可以借鉴国外的先进经验,同时结合本土实际,积极推动技术自主创新。这不仅可以提高中国在人工智能领域的国际地位,还可以为中国经济的高质量发展提供强有力的支撑。

来源:大模型之家

THE END
广告、内容合作请点击这里 寻求合作
免责声明:本文系转载,版权归原作者所有;旨在传递信息,不代表 的观点和立场。

相关热点

相关推荐

1
3
Baidu
map