Agent 三大构建范式解析
今年年初Manus引爆了Agent概念,随着越来越多的厂商开发发布自己的Agent,Agent逐渐的走进了大众的视野,今年可谓是Agent元年。而对于我们想要尝试构建自己的Agent,除开从Coze、Dify、星辰智能体平台等平台构建,还可以通过调用API通过提示词来进行进行构建。(微调不起了...)为了让大家更好的做出自己的Agent,本文主要讲解构建Agent 的经典三大范式:ReAct、Plan-and-Solve和Relection。
今年年初Manus引爆了Agent概念,随着越来越多的厂商开发发布自己的Agent,Agent逐渐的走进了大众的视野,今年可谓是Agent元年。而对于我们想要尝试构建自己的Agent,除开从Coze、Dify、星辰智能体平台等平台构建,还可以通过调用API通过提示词来进行进行构建。(微调不起了...)为了让大家更好的做出自己的Agent,本文主要讲解构建Agent 的经典三大范式:ReAct、Plan-and-Solve和Relection。
RAG(Retrieval-Augmented Generation,检索增强生成)是一种结合信息检索技术的方法,旨在提升大模型输出的稳定性,减少幻觉现象
RoPE(旋转位置编码)是一种结合了绝对位置编码和相对位置编码的一种编码方法,出自苏剑林老师提出的RoFormer,现如今已经作为LLM结构的标配了,可见其效果强大。这篇文章就来具体解析一下,RoPE的原理和优势到底是什么。
MOE(Mixture of Experts)也就是混合专家系统,已经在LLM(Large Language Model)的结构中成为标配了。最近看到一篇手写MOE教程,所学下来,受益颇多。
想要大模型在通用性上获得更好的效果,就需要让大模型对更多的领域知识进行“补充”。
《Do Large Language Models Need a Content Delivery Network》论文提出了 KDN(Knowledge Delivery Network),简单来说就是对输入进行“缓存”,从而提升模型首个 Token 响应时间,并将 KDN 开源为 LMCache