Cogito v2引发AI新“直觉”:为什么更聪明地思考比更长时间思考更重要

Deep Cogito的Cogito v2模型引入了一种新方法,可能改变AI开发的未来。Cogito v2并非依赖更多处理能力或延长推理时间,而是发展出内在的“直觉”,引导模型在搜索开始前就识别正确路径。这种范式转变聚焦于更聪明地思考,而非更长时间思考。

人工智能(AI)的进步长期以来依赖于一种信念:增加数据和计算能力可以提升性能。这种“暴力破解”方法催生了令人印象深刻的AI系统,例如GPT-3,多年来表现出色。然而,这一范式正逐渐触及极限。随着AI问题变得更加复杂,简单地增加处理能力已不再是长期进步的可持续或有效解决方案。这一认识促使研究人员重新思考AI开发方式。在此背景下,Deep Cogito的模型引入了一种新方法,可能改变AI开发的未来。这一方法并非依赖更多处理能力或延长推理时间,而是发展出内在的“直觉”,引导模型在搜索开始前就识别正确路径。这种范式转变聚焦于更聪明地思考,而非更长时间思考。

Cogito v2引发AI新“直觉”:为什么更聪明地思考比更长时间思考更重要

AI开发的转变

多年来,AI进步的核心理念是“越多越好”。这种方法催生了生成冗长推理链以解决复杂问题的AI模型。OpenAI的模型(如GPT-3)是这一方法的典型代表,其较长的推理链在复杂任务中取得了令人瞩目的成果。然而,这种方法有明显弊端:冗长的推理链需要更多计算资源,导致推理时间延长和运营成本上升。此外,研究表明,过长的推理过程往往导致收益递减,带来更大的偏差和更低的效率。根本问题是,依赖长推理链和增加计算能力已无法有效应对复杂的AI问题。这些方法受限于巨大的处理时间和内存需求。


为什么“直觉”对AI至关重要

与依赖冗长推理的现有AI系统不同,人类在解决问题时常依赖“直觉”(一种快速、直观的判断)。虽然直觉看似抽象,但它往往是多年经验、学习和上下文处理的结晶,使人类无需全面分析每个细节即可快速决策。这种直觉将原始计算与类人推理区分开来。人类通过模式识别和经验积累构建直觉,从而无需穷尽所有选项即可做出决策。AI的新“直觉”旨在复制这一过程。

这一理念,也称为“智能先验”(intelligence prior),可能是赋予AI类人推理能力和更高效率的关键。具备强大智能先验的AI模型无需大量计算即可预测哪些解决方案可能成功。直觉使AI系统能够利用先前知识,聚焦于最有效的解决方案路径,而非依赖穷尽搜索。


Cogito v2如何融入“直觉”

在其最新发布的模型中,Cogito融入了“直觉”(更技术化的术语为智能先验),通过一种名为迭代提炼与放大(Iterated Distillation and Amplification,IDA)的机制实现。IDA使模型能够从自身推理过程中学习,并随时间优化其问题解决能力。不同于依赖静态提示或固定教师,IDA让AI将成功的推理路径提炼回核心模型参数。这种自我改进过程不断优化模型的推理能力,不仅追求准确答案,还追求最高效的思考方式。

迭代提炼与放大(IDA)

为理解IDA的工作原理,可参考双过程理论(dual-process theory),该理论将人类思维分为两个系统:系统1(快速、直观的决策)和系统2(较慢、深思熟虑的推理)。人类通常依赖系统1处理大多数任务,但在面对复杂决策时切换到系统2。

IDA是一个两步循环:放大和提炼。在放大阶段,模型使用密集计算方法生成高质量解决方案或推理轨迹,类似系统2的深思熟虑推理。在提炼阶段,模型将放大阶段的洞察内化,将推理过程从系统2转化为系统1。就像人类司机通过经验变得更直觉化,应用IDA的AI模型随时间能做出更快、更高效的决策。

IDA的核心理念是在放大阶段使用高计算强度的推理,然后将优化后的推理策略提炼回模型参数。这一过程使模型内化有效推理策略,增强其在解决问题时的直觉能力。通过重复这一循环,AI系统持续提升其以更少计算资源决策的能力。


融入“直觉”的AI优势

AI直觉的主要优势是效率。Cogito v2的推理链比竞争模型短60%,意味着它能以更少的内部步骤得出答案,降低推理时间和资源需求。例如,DeepSeek R1可能需要200多个令牌解决的问题,Cogito v2可在不到100个令牌内完成。

通过更智能的推理和优化策略,AI系统的效率得到了显著提高,这将促进各个行业的进一步发展。

此外,Cogito v2的训练成本远低于传统AI模型。其全参数范围的训练成本不到350万美元,远低于GPT-4等大型模型的典型开支。

Cogito v2还在未明确训练的领域展现了涌现能力。例如,尽管主要在文本上训练,Cogito v2能推理图像,分析图像构图和栖息地。这种跨模态推理能力是迈向通用智能(AGI)的重要里程碑。


重新思考AI开发

智能先验的成功表明,AI开发策略需要根本性转变。与其简单增加模型规模或计算资源,AI开发应聚焦于构建能发展和优化自身认知策略的系统。这一转变类似于人类认知发展,智能并非源自更大的大脑或更长的思考时间,而是更好的心理模型和推理策略。这种方法可能带来长期影响。通过强调更聪明的推理而非原始计算能力,AI将变得更灵活、适应性更强,能应对新挑战。这将加速AI在医疗、cybersecurity和自动驾驶等行业的应用,使AI系统更高效、成本效益更高且影响力更大。


结论

成功的案例表明,AI的未来不在于扩大模型规模或增加计算能力,而在于优化推理架构和更聪明的问题解决方式。这一转变为AI提供了一个更可持续、更易获取的未来,系统能以更少计算资源持续改进和适应。通过聚焦智能推理而非暴力计算,AI将更能应对复杂的现实世界问题,特别是在像Cogito v2这样的模型中得以体现。

AI前沿文章

人工智能如何重塑建筑行业:从前期设计到预测性维护

2025-8-10 2:19:44

AI工具测评文章

智谱深夜再“炸场”,国产多模态GLM-4.5v几乎横扫所有榜单!

2025-8-12 10:07:26

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索