Files
obsidian_note/各种项目/AI/字节-火山/学习笔记/2026-03-30.md

37 lines
1.8 KiB
Markdown
Raw Normal View History

2026-04-01 10:15:00 +08:00
## 框架、架构
1. 主流模型架构:
* transformer 大语言模型LLM几乎都是
* encoder-only 理解类,分类,语义匹配
* decoder-only 生成类。对话、写作、代码
* encoder-decoder 翻译、摘要
* MOE混合专家比transeformer块
* 传统机器学习、画画、视觉cv都是其他架构
2. 推理框架:运行模型
* vLLM
* llama.cpp
* transformers
* ...
3. 开发框架LangChain、ADK
4. 系统架构:
* Chain固定流程、工作流、流水线
* RAG带知识库的Chain检索-》生成
* Agent智能体会自己思考、自己决定用工具
* Multi-Agent 多智能体,协作
* 主流开发架构 融合! 智能体+工作流RAG当做工具知识补充
## AI 提示词
1. 系统提示词
系统级提示词整体约束智能体。平时的那种你是一个xxxx
2. 用户提示词
具体要做的事,怎么做,结果
## 检索增强 RAG
1. 知识库切片
解决问题a.太长的知识容易出现幻觉丢失精度细节。比如某本书里面相关的内容出现很多处匹配精度困难b.上下文会有限制也节省tokenc.为后续向量化做准备,更友好
2. 策略:
* 按照固定长度,容易破坏语义,适合代码、日志、无结构文本
* 语义切根据NLP自然语言处理分句分词效果好文档、说明书、知识库等
* 层级切,书籍、技术文档,有章、小结、段落
* 递归切片(主流框架默认),先分句 -》 再组合成块
3. 进阶 RAG需要LLM一般的语义切靠 规则 + 词法,标点、换行等
4. langchain、adk都是属于开发框架。LangChain 是通用型全栈框架ADK **更聚焦 Agent 与工程化的框架**