跳到主要内容

术语表

版本:v3.1(2026年5月)
面向场景:工程学习、方案评审、技术选型、架构设计、MLOps/LLMOps、项目文档撰写
定位:帮助团队快速对齐术语、理解核心概念、提升评审效率的实用手册。

重要免责声明
本手册不是学术论文词典,也不替代任何官方文档。API 接口、模型能力(上下文窗口、速率限制)、定价、安全合规要求等变化极快,请始终以最新官方文档为准(OpenAI、Anthropic、Google、AWS、Meta、Hugging Face 等)。本手册聚焦工程实践中高频、相对稳定的核心术语。


1. 基础概念

English Term中文翻译工程解释(方案评审重点)
Artificial Intelligence (AI)人工智能模拟人类感知、推理、决策的广义领域
Artificial General Intelligence (AGI)通用人工智能能胜任任意人类智力任务的 AI(目标状态)
Machine Learning (ML)机器学习数据驱动自动改进性能的核心方法
Deep Learning (DL)深度学习使用多层神经网络的 ML 分支
Neural Network神经网络由人工神经元层级连接构成的模型
Supervised Learning监督学习使用带标签数据训练
Unsupervised Learning无监督学习无标签数据发现模式(聚类、降维)
Self-Supervised Learning自监督学习数据自身生成监督信号的预训练方式
Semi-Supervised Learning半监督学习少量标签 + 大量无标签数据
Reinforcement Learning (RL)强化学习奖励驱动策略优化
Transfer Learning迁移学习知识跨任务迁移
Fine-Tuning / SFT微调 / 监督微调在基础模型上用领域数据继续训练
Foundation Model / Base Model基础模型海量预训练、可适配多任务的大模型
Large Language Model (LLM)大语言模型参数规模巨大(10B+)的 Transformer 语言模型
Large Vision Model (LVM)大视觉模型视觉领域的基础模型
Multimodal Model多模态模型同时处理文本、图像、音频、视频等
Generative AI (GenAI)生成式 AI能创造新内容(文本、图像、代码、视频)的 AI

2. 模型架构与关键组件

English Term中文翻译工程解释(方案评审重点)
TransformerTransformer(变换器)现代 LLM 核心架构
Attention Mechanism注意力机制Self / Multi-Head / Cross Attention
Embedding嵌入(向量表示)将 Token/文本转为稠密向量
Token / TokenizationToken / 分词模型最小处理单元(BPE / WordPiece)
Vocabulary词表模型支持的所有 Token 集合
Context Window上下文窗口单次最大处理 Token 数(关键能力与成本指标)
Parameter参数模型可学习权重数量(7B/70B/405B 等)
Hidden Dimension / FFN / MLP隐藏维度 / 前馈网络模型宽度与非线性变换
LoRA / QLoRA / DoRA低秩适配 / 量化低秩适配参数高效微调主流技术
PEFT参数高效微调LoRA 等系列方法的统称
Mixture of Experts (MoE)专家混合模型动态激活部分专家子网络,提升效率与性价比
Rotary Positional Embedding (RoPE)旋转位置编码当前主流长上下文位置编码
KV Cache / PagedAttentionKV 缓存自回归生成加速核心技术
FlashAttention / FlashAttention-2/3FlashAttention显存高效注意力实现
Grouped Query Attention (GQA)分组查询注意力推理加速常用技术

3. 训练与优化

English Term中文翻译工程解释(方案评审重点)
Pre-training预训练海量无标签数据上训练通用能力
Instruction Tuning指令微调提升模型遵循指令的能力
RLHF / PPO基于人类反馈的强化学习主流对齐技术
DPO / ORPO / KTO直接偏好优化RLHF 的高效替代方案
Parameter-Efficient Fine-Tuning (PEFT)参数高效微调降低显存与计算成本
Quantization (GPTQ / AWQ / GGUF)量化低精度表示,减少显存加速推理
Knowledge Distillation知识蒸馏大模型压缩为小模型
Overfitting / Underfitting过拟合 / 欠拟合模型泛化能力判断核心
Hyperparameter / Learning Rate Scheduler超参数 / 学习率调度器训练稳定性关键
Batch Size / Gradient Accumulation批大小 / 梯度累积显存管理技术

4. 生成与推理(Inference)

English Term中文翻译工程解释(方案评审重点)
Prompt Engineering / Context Engineering提示工程 / 上下文工程引导模型输出的核心技巧
System Prompt / User Prompt系统提示 / 用户提示定义角色、规则与任务
Chain of Thought (CoT) / ToT思维链 / 思维树显著提升复杂推理能力
Zero-Shot / Few-Shot零样本 / 少样本示例数量对性能的影响
ReAct / ReWOO / Plan-and-ExecuteReAct推理与行动交替框架
Function Calling / Tool Use函数调用 / 工具使用模型自主调用外部 API/工具
Temperature / Top-p / Top-k / Min-p温度 / 核采样 / Top-k生成随机性与多样性控制
Hallucination / Grounding幻觉 / 事实 grounding虚假内容控制
Streaming Output流式输出Token 逐个返回,提升用户体验
Speculative Decoding推测解码加速生成技术
Continuous Batching / Dynamic Batching连续批处理大幅提升吞吐量

5. 检索增强生成(RAG)

English Term中文翻译工程解释(方案评审重点)
RAG (Retrieval-Augmented Generation)检索增强生成注入外部知识,减少幻觉、提升时效性
Naive RAG / Advanced RAG / Agentic RAG / Graph RAG朴素RAG / 高级RAG / 智能体RAG / 图RAG不同成熟度实现方案
Embedding Model嵌入模型bge、e5、voyage、text-embedding-3 等
Vector Database / Vector Store向量数据库Pinecone、Milvus、Weaviate、Chroma、PGVector
Chunking Strategy / Semantic Chunking文档分块策略直接影响检索质量
Hybrid Search混合搜索向量语义 + 关键词 BM25
Re-ranking / Cross-Encoder重排序二次精排提升相关性
Metadata Filtering元数据过滤按时间、来源、权限过滤
Context Compression上下文压缩减少 Token 消耗
Parent-Child / Multi-Query Retrieval父子检索 / 多查询检索结构化检索优化

6. Agent 与高级应用

English Term中文翻译工程解释(方案评审重点)
Agent / LLM Agent智能体具备规划、工具使用、记忆的自主系统
Multi-Agent System多智能体系统多个 Agent 角色分工协作
Memory (Short-term / Vector / Graph)记忆系统对话历史与长期知识存储
Orchestration / Workflow编排 / 工作流LangGraph、CrewAI 等
Tool Integration工具集成API、数据库、浏览器、代码执行器
Autonomous Agent自主智能体可长时间独立运行

7. 部署与运维(MLOps / LLMOps)

English Term中文翻译工程解释(方案评审重点)
Model Serving / Inference Server模型服务将模型部署为可调用 API
Latency (TTFT / TPOT / E2E)延迟Time To First Token / 输出 Token 耗时
Throughput (Tokens Per Second)吞吐量系统每秒处理 Token 数
vLLM / TGI / TensorRT-LLM / SGLang / Ollama高效推理引擎生产级高性能服务框架
A/B Testing / Canary / Shadow DeploymentA/B 测试 / 金丝雀 / 影子部署在线实验验证方法
Model Drift / Data Drift模型漂移 / 数据漂移性能衰退监控重点
Cost per 1M Tokens每百万 Token 成本商业方案核心经济指标
Guardrails / Safety Layer防护栏输入输出安全过滤机制
Observability / Tracing可观测性LangSmith、Phoenix 等工具

8. 评估指标与基准

English Term中文翻译工程解释(方案评审重点)
MMLU / GPQA / MMMU综合能力基准知识、多模态评估
HumanEval / SWE-Bench代码生成基准编程能力
GSM8K / MATH数学推理基准数学能力
Perplexity (PPL)困惑度语言模型不确定性
BLEU / ROUGE / BERTScore文本生成评估指标翻译、摘要质量
Faithfulness / Relevance忠实度 / 相关性RAG 核心指标
RAGAS / ARES / TruLensRAG 评估框架端到端 RAG 质量评估
Toxicity / Bias / Fairness Metrics毒性 / 偏差 / 公平性指标安全与伦理评估

9. 安全、对齐与合规

English Term中文翻译工程解释(方案评审重点)
AI AlignmentAI 对齐使模型行为符合人类意图与价值观
Red Teaming红队测试对抗性安全漏洞挖掘
Prompt Injection / Jailbreak提示注入 / 越狱常见攻击方式
Adversarial Attack / Data Poisoning对抗攻击 / 数据投毒训练与推理威胁
PII Leakage个人可识别信息泄露隐私保护重点
Guardrails / Constitutional AI防护栏 / 宪法 AI规则化安全约束
Responsible AI / AI Governance / AI Act负责任 AI / AI 治理整体合规框架

10. 计算机视觉与多模态及其他

English Term中文翻译工程解释
CNN / Vision Transformer (ViT)卷积神经网络 / ViT视觉骨干网络
Object Detection / Segmentation / SAM目标检测 / 分割 / SAM视觉任务
OCR / Diffusion ModelOCR / 扩散模型文档解析与生成
CLIP / SigLIPCLIP图像-文本对齐模型
Edge AI / On-Device Inference边缘 AI / 设备端推理低延迟本地部署
Federated Learning联邦学习隐私保护分布式训练

11. 常用框架与工具

English Term中文翻译工程解释
PyTorch / JAX / TensorFlowPyTorch / JAX / TensorFlow主流训练框架
Hugging Face Transformers / PEFT / DatasetsHugging Face模型生态标准库
LangChain / LlamaIndex / LangGraphLangChain / LlamaIndexLLM 应用开发框架
CrewAI / AutoGenCrewAI / AutoGen多 Agent 框架
Docker / Kubernetes / HelmDocker / Kubernetes容器化与编排
CUDA / ROCm / TensorRTCUDA / TensorRTGPU 加速

12. 量化技术对比

English Term中文翻译量化位宽 / 类型优点缺点适用场景(方案评审推荐)
FP16 / BF16FP16 / BF1616-bit 浮点精度高,训练稳定显存占用大训练、部分推理
INT8INT8 量化8-bit 整数显存减半,速度提升精度略有下降中型模型部署
INT4 / GPTQINT4 / GPTQ4-bit显存大幅降低(约 1/4)需要校准数据,精度损失明显大模型本地部署
AWQAWQ4-bit / 混合激活值感知,精度优于 GPTQ量化时间较长性能敏感生产环境
GGUFGGUF动态多精度(Q4/Q5/Q8)生态好(llama.cpp),支持 CPU/GPU需特定引擎本地 / 边缘部署
FP8FP8 量化8-bit 浮点精度优于 INT8硬件支持要求高(Hopper+)新一代 GPU 高性能推理
BitsAndBytesBitsAndBytes8/4-bitHugging Face 原生支持,易用速度不如 vLLM + AWQ快速原型开发
Quantization-Aware Training (QAT)量化感知训练-精度损失最小训练成本高对精度要求极高的场景

13. Agent 框架对比

Framework中文名称核心优势缺点适用场景(方案评审推荐)
LangGraphLangGraph状态机编排、可视化、持久化强学习曲线较陡复杂、生产级可控 Agent
CrewAICrewAI角色分工清晰、易上手灵活性稍弱业务流程自动化、多角色协作
AutoGenAutoGen多 Agent 对话能力强配置复杂,调试难度高研究型、动态多 Agent
LlamaIndex WorkflowsLlamaIndex 工作流与 RAG 深度集成Agent 能力相对较弱RAG 增强型 Agent
LangChainLangChain生态最完善、组件丰富抽象层过多,生产性能易出问题快速原型
Semantic KernelSemantic Kernel.NET 支持好,企业集成佳社区相对较小企业级 .NET 项目

14. 垂直行业常用术语

English Term中文翻译所属行业工程解释(方案评审重点)
HIPAAHIPAA医疗美国医疗数据隐私合规
Medical LLM / Clinical LLM医疗大模型医疗专为临床、病历设计的 LLM
DICOMDICOM医疗影像医学图像标准格式
RegTech监管科技金融AI 辅助金融合规
Fraud Detection欺诈检测金融实时交易反欺诈
KYC / AMLKYC / AML金融客户身份验证 / 反洗钱
ESG ScoringESG 评分金融环境、社会、治理评估
Legal LLM / Contract Review法律大模型 / 合同审查法律合同风险识别
eDiscovery电子取证法律电子文档检索分析
Predictive Maintenance预测性维护工业设备故障预测
Digital Twin数字孪生工业物理实体实时数字映射
Domain-Specific Model垂直领域模型多行业针对特定行业微调的模型

工程方案评审 Checklist(推荐)

  1. 模型选型(闭源 vs 开源、上下文窗口、量化策略)
  2. 知识注入方式(RAG 分块策略、Embedding 模型、Agent 编排)
  3. 性能与成本(Latency、Throughput、推理引擎、每百万 Token 成本)
  4. 安全合规(Guardrails、Red Teaming、行业法规如 HIPAA)
  5. 垂直领域适配(是否需要 Domain-Specific Fine-Tuning)
  6. 运维计划(漂移检测、可观测性、A/B 测试)