汀的知识碎片
Search
Search
Dark mode
Light mode
文章导航
Tag: LLM
21 items with this tag.
Mar 05, 2026
Milvus 在 RAG 场景中的应用
中间件
Milvus
RAG
LLM
Embedding
检索增强生成
LangChain
LlamaIndex
向量数据库
Mar 04, 2026
Agent 开发技术 专栏导览
LLM
Agent
RAG
MCP
A2A
多Agent
LangGraph
Prompt工程
工具调用
Skills
Mar 04, 2026
Prompt 工程——从零样本到思维链
LLM
Prompt工程
Chain-of-Thought
Few-Shot
Zero-Shot
System-Prompt
思维链
思维树
Prompt注入
Mar 04, 2026
RAG 架构——核心原理与工程实践
LLM
RAG
向量数据库
Embedding
检索增强生成
知识库
语义搜索
Chunk
Rerank
Mar 04, 2026
高级 RAG——查询改写、图谱检索与多跳推理
LLM
RAG
高级RAG
HyDE
查询改写
GraphRAG
Self-RAG
多跳推理
知识图谱
Agentic-RAG
Mar 04, 2026
MCP 协议深度解析——Agent 与工具的标准化连接
LLM
MCP
Agent
工具调用
协议
Anthropic
标准化
Function-Calling
Resources
Prompts
Mar 04, 2026
Agent 核心能力——推理、规划与工具调用
LLM
Agent
ReAct
推理
规划
工具调用
Function-Calling
Plan-and-Execute
Reflexion
自我反思
Mar 04, 2026
Agent 记忆体系——从短期缓冲到长期知识
LLM
Agent
记忆
上下文管理
向量记忆
情节记忆
语义记忆
程序记忆
对话历史
知识图谱记忆
Mar 04, 2026
Agent 框架选型——LangChain、LlamaIndex 与 LangGraph
LLM
Agent
LangChain
LlamaIndex
LangGraph
CrewAI
AutoGen
框架选型
LCEL
状态图
Mar 04, 2026
多 Agent 系统与 A2A 协议——协作、通信与特化
LLM
Agent
多Agent
A2A
协作
特化
Orchestrator
Sub-Agent
Google
通信协议
Mar 04, 2026
Agent 应用实战——从零构建生产级 Agent
LLM
Agent
实战
生产级
代码助手
客服Agent
数据分析Agent
架构设计
部署
监控
Mar 04, 2026
Agent 评估与可靠性工程
LLM
Agent
评估
可靠性
Benchmark
LLM-as-Judge
Guardrails
测试
回归测试
红队测试
Mar 04, 2026
LLM 原理 专栏导览
LLM
Transformer
注意力机制
预训练
RLHF
推理优化
大语言模型
Mar 04, 2026
从 RNN 到 Transformer——注意力机制的革命
LLM
Transformer
注意力机制
Self-Attention
RNN
LSTM
位置编码
深度学习
Mar 04, 2026
GPT 架构——Decoder-Only 的自回归语言模型
LLM
GPT
Decoder-Only
自回归
Tokenizer
BPE
RoPE
Embedding
Causal-Mask
Mar 04, 2026
预训练——数据、算力与 Scaling Law
LLM
预训练
Scaling-Law
分布式训练
数据并行
张量并行
流水线并行
ZeRO
混合精度
Mar 04, 2026
指令微调与 RLHF——从基座模型到对话助手
LLM
SFT
RLHF
DPO
指令微调
对齐
Reward-Model
PPO
人类反馈
Mar 04, 2026
参数高效微调——LoRA、QLoRA 与 Adapter
LLM
LoRA
QLoRA
PEFT
Adapter
微调
低秩分解
量化
P-Tuning
Mar 04, 2026
推理优化——KV Cache、量化与投机解码
LLM
推理优化
KV-Cache
量化
GPTQ
AWQ
投机解码
Continuous-Batching
PagedAttention
Mar 04, 2026
模型部署与 Serving——vLLM、TensorRT-LLM 与 Triton
LLM
部署
vLLM
TensorRT-LLM
Triton
Serving
模型服务
GPU
推理服务
Mar 04, 2026
长上下文与多模态——技术前沿
LLM
长上下文
多模态
RoPE
Flash-Attention
稀疏注意力
Vision-Transformer
CLIP
技术前沿