CopyRight©2021 139GAME.COM.CN All Right Reserved
AI编程能力升级:持续PUA大模型可提高代码质量
近年来,人工智能(AI)在编程能力方面持续取得进步,不过还未能达到尽善尽美的程度。近期,BuzzFeed的资深数据科学家Max Woolf经过实验发现,要是持续给大型语言模型(LLM)提供诸如“写出更优质代码”这类的提示,AI确实能够创造出质量更高的代码。
在 Woolf 的实验中,他利用 Claude3.5Sonnet 这一版本的 AI 模型进行了一系列编程任务。起初,他给模型提出了一个简单的编程问题:如何找出一百万个随机整数中,各位数之和为30的最小值与最大值之间的差。Claude 在接到这个任务后,生成了符合要求的代码,但 Woolf 认为该代码还有优化空间。
接着,Woolf 决定在每次生成代码后,都通过 “写更好代码” 的提示,要求 Claude 进行迭代优化。第一次迭代后,Claude 将代码重构为一个面向对象的 Python 类,并实现了两项显著的优化,运行速度提高了2.7倍。第二次迭代中,Claude 又加入了多线程处理和向量化计算,最终使得代码运行速度达到了基础版本的5.1倍。
然而,随着迭代次数的增加,代码质量的提升开始减缓。经过几轮优化后,尽管模型尝试使用一些更复杂的技术,例如 JIT 编译和异步编程,但有些迭代反而导致了性能的下降。最终,Woolf 的实验揭示了迭代提示的潜力与局限性,让人们对 AI 编程的未来有了新的思考。
这项研究不仅展示了 AI 在编程领域的应用潜力,也提醒我们,尽管 AI 能够通过不断迭代来提升代码质量,但在实际应用中,如何合理设计提示词、平衡性能与复杂性仍然是一个值得深入探讨的话题。
2024大模型年终盘点:GPT-4垄断不再,服务价格跳水式下跌
近日消息,在2024年这个人工智能蓬勃发展的时期,大模型技术迎来了具有革命意义的发展。OpenAI推出的Sora惊艳亮相,与此同时,多家科技大佬也纷纷拿出自家的重磅产品。这一系列事件致使GPT - 4在市场上一枝独秀的局面被打破,并且在产品性能提升的同时,价格方面也有了重大突破。
这一年,AI赛道竞争异常激烈,18家公司密集发布超70款模型,其中不乏超越GPT-4性能的佳作。谷歌Gemini1.5Pro凭借突破性的长文本处理能力和视频理解能力,开创了多模态交互的新时代。同时,Claude3系列和Meta的Llama3.3等产品也因其卓越表现获得用户青睐,特别是Claude3.5Sonnet在多项评测中展现出惊人实力。
技术门槛的降低是今年另一个重要突破。过去需要庞大算力支持的GPT-4级别模型,现已实现在普通笔记本电脑上运行的重大突破。以Qwen2.5-Coder-32B为例,其在M2MacBook Pro上的流畅运行,为开发者和普通用户带来前所未有的便利性。
在定价方面,市场竞争的加剧推动了服务成本的显著下降。谷歌Gemini1.5Flash每百万token仅需0.075美元的定价策略,不仅反映了市场竞争的白热化,也得益于模型能效的显著提升。与此同时,单次调用的能耗大幅降低,在提供高效服务的同时也减轻了环境负担。
2024年的大模型发展呈现出性能提升与成本降低的双重突破,不仅拓展了应用边界,更让普通用户得以低门槛接触到顶级AI技术。这一系列进展预示着AI技术正在进入一个更加开放、普惠的新时代。