苹果发布 AI 框架 LaDiR:突破单一思维,并行探索多条推理路径 2026/4/30 7:41:02 来源:IT之家 作者:故渊 责编:故渊评论:5 IT之家 4 月 30 日消息,苹果公司携手加

释放双眼,带上耳机,听听看~!
苹果公司携手加州大学圣迭戈分校团队,在新版论文《LaDiR:潜在扩散增强 LLM 文本推理》中提出新框架,让大语言模型(LLM)在回答前并行探索多条推理路径,再用自回归方式输出提高结果质量。

IT之家 4 月 30 日消息,苹果公司携手加州大学圣迭戈分校团队,在新版论文《LaDiR:潜在扩散增强 LLM 文本推理》中提出新框架,让大语言模型(LLM)在回答前并行探索多条推理路径,再用自回归方式输出提高结果质量。

微信图片_20260430101612_201_2.png

IT之家援引博文介绍,该框架并非新模型,而是叠加在现有模型之上的通用框架,重点改变模型思考问题的方式。LaDiR 结合扩散(Diffusion)和自回归(Autoregression)两种主流生成范式,在推理阶段采用扩散模型,在最终输出阶段使用自回归模型。

这种混合架构有效提升了模型处理复杂问题的能力,既保留了扩散模型并行处理的优势,又延续了自回归模型生成的连贯性。

LaDiR 的独特之处在于其并行推理机制。系统在推理时会同时启动多条独立的推理路径,每条路径从随机噪声开始,通过扩散过程逐步优化成连贯的推理步骤。为防止所有路径过早收敛于同一结论,框架引入了特殊的多样性鼓励机制,确保每条路径能探索不同的解题思路,从而生成多样化的候选答案池。

微信图片_20260430101619_202_2.png研究团队在 Meta 的 LLaMA 3.1 8B 和 Qwen3-8B-Base 上部署测试。在数学基准测试中,LaDiR 取得了比现有方法更高的准确率,在面对更困难的分布外任务时表现尤为突出。在代码生成测试 HumanEval 中,该框架生成的代码更加可靠,在难题上的表现明显优于标准微调方法。微信图片_20260430101624_203_2.png

在谜题规划任务中,LaDiR 能探索更广泛的解空间,找到正确解的概率高于所有通用基准模型。不过,在单次尝试准确率上,它仍略逊于专门针对特定任务优化的专用模型。这表明通用框架在追求广泛适用性的同时,在极致专精领域仍有提升空间。

温馨提示:本站提供的一切软件、教程和内容信息都来自网络收集整理,仅限用于学习和研究目的;不得将上述内容用于商业或者非法用途,否则,一切后果请用户自负,版权争议与本站无关。用户必须在下载后的24个小时之内,从您的电脑或手机中彻底删除上述内容。如果您喜欢该程序和内容,请支持正版,购买注册,得到更好的正版服务。我们非常重视版权问题,如有侵权请邮件与我们联系处理。敬请谅解!

给TA打赏
共{{data.count}}人
人已打赏
热点资讯

谷歌相册推出衣橱规划功能:AI 提取服装图像整理到数字衣橱,支持虚拟试穿

2026-4-30 11:25:12

热点资讯

欧盟推出官方年龄验证应用,敦促各成员国尽快采用以保护未成年人

2026-4-30 11:25:18

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索