1ffb8
新智元报道 编辑:英智 犀牛 【新智元导读】AI编程智能体的能力正在飞速增添,最新研究展现了这一「新摩尔定律」,若是AI智能体的使命时长继续以每4个月翻倍的速率增添,到2027年它们可能完生长达167小时的月级使命! 编程智能体能完成的使命量,正以爆炸式的速率增添! 并且,这一趋势还在加速。 2024到2025年,它们的使命处置惩罚能力每4个月翻一倍;而在2019到2025年,这个翻倍周期则是7个月。 22号,AI研究网站AI Digest揭晓了上述看法,展现了一个AI智能体的新摩尔定律。 博客地点:https://theaidigest.org/time-horizons 从图表中可以清晰地看到这一趋势,使命时长的增添轨迹险些是一条险要的指数曲线。 2019年,GPT-2只能处置惩罚不到1秒的简朴使命;2022年ChatGPT宣布时,AI已经可以完成30秒的编程使命。 现在,智能体可以自主完成人类需要一小时才华完成的编程使命。 顶尖的AI系统可以完成的使命长度正在呈指数级增添——每7个月翻一番。 这个趋势是METR的研究职员发明的。 他们选取了2019到2025年间最强的AI模子,测试了它们在约莫200个使命上的体现。主要是编程使命,也有一些逻辑推理使命。 然后,他们把AI的乐成率和每个使命的长度做了比照——使命长度指的是专业人士完成这些使命需要的时间,从不到30秒到凌驾8小时不等。 测试过所有模子后,泛起了两个显着的纪律: 使命长度和AI乐成率高度相关(相关系数R?=0.83)。 AI乐成率抵达50%的使命长度——即「时间跨度」——正在呈指数增添。 接下来是什么? 这个指数增添的趋势看起来很稳健,没有停下来的意思。 若是凭证这个趋势推算下去,AI智能体将能够完成: 2026年 :2小时的使命; 2027年 :1个事情日(8小时)的使命; 2028年 :1个事情周(40小时)的使命; 2029年 :1个事情月(167小时)的使命。 最近,这一趋势还在加速。 2024-2025年间,时间跨度是每4个月使命长度翻一番,而2019-2025年间则是每7个月翻一番。 若是凭证2024-2025年加速的趋势(每4个月翻倍)推算,AI智能体可能在2027年就能完成月级使命(167小时)。 然而,仅视察一年的数据给出展望可能会不太稳固,现实的前进速率也可能会放缓。 不过,思量到这个趋势已经最先加速,它很可能处于一个比指数增添还要快的增添轨道上。 这也很切合直觉:随着增添轨道直线上升,1周和2周使命之间所需手艺的差别,可能比1年和2年使命之间的差别更大。 别的,随着AI能力的提升,它们在开发更强盛AI方面的作用会越来越大,可能导致超指数级增添。 智能爆炸 AI智能体的能力提升会反过来加速更强盛AI的研发,形成飞轮效应:更强盛的AI智能体能够更快地开发出更先进的AI系统,从而进一步提升能力。 这种正反响循环可能导致超指数增添,甚至触发「软件智能爆炸」(software intelligence explosion),即AI能力在短时间内急剧提升,远远凌驾人类的水平。 别的,算法前进也在推动这一趋势。 METR的研究批注,近年来AI在算法效率上的提升,显著降低了盘算资源需求。 通过更高效的预训练和后训练要领,纵然硬件资源不增添,AI智能体的能力也能快速提升。 AI智能体使命时长的指数增添,可能成为人类历史上最具厘革性的趋势之一。 它能在短时间内完成重大使命,将彻底改变软件开发、科学研究、医疗诊断等多个领域。 例如,一个能够自主完成月级使命的AI智能体,可以完全自动化软件工程项目,甚至自力举行科学研究,从而大幅提高生产效率。 这一趋势也带来了潜在的社会挑战。随着AI智能体能力的快速提升,人类社会可能难以顺应这种转变。 许多古板职业可能面临自动化,人类可能需要转向更具创立性和战略性的角色。 参考资料: https://theaidigest.org/time-horizons https://x.com/AiDigest_/status/1914710297157493173