威尼斯人娱乐场官方网站

学院新闻

“AI在人大,智启未来” 人工智能讲座 “慢思考模型的技术解析与应用:以DeepSeek、Kimi为例”举办
日期:2025-03-03访问量:

2025年2月27日下午,由威尼斯人娱乐场官方网站 、教务处、实验室管理与教学条件保障处主办的“AI在人大,智启未来”人工智能系列讲座在立德楼603教室举办。本次讲座邀请威尼斯人娱乐场官方网站 赵鑫教授主讲,讲座主题为“慢思考模型的技术解析与应用:以DeepSeek、Kimi为例”。全校各学院(系)及书院的师生积极参会,共同探索慢思考模型的技术发展与应用前景。

图片132323232323232.png

赵鑫以DeepSeek和Kimi两款大模型为例,深入解析了慢思考模型的技术原理与应用场景。他指出,慢思考模型通过模拟人类的“分步推理”机制,能够在复杂任务中展现出更强的解题能力。与传统的快速生成模型不同,慢思考模型通过逐步生成中间步骤(即“思维链”),显著提升了模型在数学推理、代码生成等复杂任务中的表现。他以DeepSeek为例,展示了模型如何通过长思维链解决复杂的数学问题,并强调了思维链在降低解题难度中的重要作用。赵鑫通过DeepSeek展示了模型在训练时间扩展和测试时间扩展中的性能曲线,并指出,随着投入的增加,模型的损失逐渐减小,性能显著提升。训练阶段的投入是一次性的,类似于“买房”,而测试阶段的扩展则类似于“租房”,需要持续的资源投入。这种扩展方式使得大模型能够在推理阶段通过输出更多的token来换取性能的提升,尽管这会增加响应时间,但显著提高了模型的解题效果。

赵鑫还重点讨论了大模型的微调与对齐技术。他提到,大模型在实际应用中需要通过微调来适应特定任务场景。常见的微调方法包括监督微调(SFT)和强化学习(RL)。强化学习在大模型训练中尤为重要,尤其是在长思维链推理模型的训练中,强化学习能够帮助模型通过反复试错来提升解题能力。赵鑫还介绍了两种常用的提示范式:上下文学习和思维链。通过上下文学习,模型能够利用已有的信息来生成更准确的答案;而思维链则通过逐步推理的方式,帮助模型在复杂任务中展现出更强的推理能力。这些技术的结合使得大模型在多样化任务场景中表现出更强的适应性和泛化能力。

尽管慢思考模型在复杂任务中表现出色,赵鑫也指出了其面临的挑战。首先是推理过程的控制问题,模型在生成长思维链时可能会出现语言混杂或过度思考的情况,导致生成内容不准确或冗余。其次是安全性问题,长思维链的生成过程可能被恶意利用,诱导模型生成有害内容。未来的研究方向之一是如何更好地控制模型的推理过程,确保其在生成长思维链时能够保持高效和准确。

检测到您当前使用浏览器版本过于老旧,会导致无法正常浏览网站;请您使用电脑里的其他浏览器如:360、QQ、搜狗浏览器的速模式浏览,或者使用谷歌、火狐等浏览器。

威尼斯人娱乐场官方网站 下载Firefox
威尼斯人娱乐场官方网站