常见的LLM微调方式与应用场景

type

Post

status

Published

date

Mar 3, 2025

slug

summary

category

知行合一

icon

password

😀

本系列文章将从「实战」出发，系统解析LLM微调（Fine-tuning）、检索增强生成（Retrieval-Augmented Generation, RAG）、智能体（AI Agent）、模型上下文协议（Model Context Protocol, MCP）等热门技术，深入探讨LangChain、ReAct、CoT（Chain of Thought）、LoRA、PEFT（Parameter-Efficient Fine-Tuning）、向量数据库、提示词工程（Prompt Engineering）、知识库构建、工具调用（Tool Use）、多模态融合、智能体编排（Agent Orchestration）等关键概念。

📝 主旨内容

常见的微调方法

全量微调（Full Fine-tuning）

参数高效微调（Parameter-Efficient Fine-Tuning）

指令微调（Instruction Tuning）

持续微调（Continual Fine-tuning）

微调方式	参数更新量	资源消耗	典型方法	场景举例
全量微调	★★★★★	★★★★★	Full FT	医疗QA、法律文书生成
PEFT（如LoRA）	★★☆☆☆	★★☆☆☆	LoRA、Adapter	客服机器人、行业问答、语义搜索
指令微调	★★★☆☆	★★★☆☆	SFT + RLHF	聊天助手、智能交互、多轮对话
持续微调	★★★☆☆	★★☆☆☆	Incremental	舆情追踪、新闻摘要、金融预警