AIEng Hub - 最新文章 https://ai-engineering.cn AI工程化实战进阶指南 - 涵盖AI Agent、RAG系统、LLM Ops、Prompt工程和MCP协议 zh-cn Mon, 18 May 2026 06:53:20 GMT - LLM缓存策略设计:从语义缓存到分层缓存体系 https://ai-engineering.cn/knowledge/llm-ops/caching-strategy
https://ai-engineering.cn/knowledge/llm-ops/caching-strategy
系统讲解LLM应用中的缓存策略设计,涵盖语义缓存、结果缓存、KV Cache前缀缓存和分层缓存体系的生产实践
Mon, 11 May 2026 00:00:00 GMT
llm-ops
AIEng Hub- 内容安全审核:构建负责任的LLM应用 https://ai-engineering.cn/knowledge/llm-ops/content-safety-audit
https://ai-engineering.cn/knowledge/llm-ops/content-safety-audit
系统讲解LLM应用内容安全审核的完整体系,涵盖安全策略制定、审核流程设计、审核技术实现和应急响应机制的实践指南
Mon, 11 May 2026 00:00:00 GMT
llm-ops
AIEng Hub- Continuous Batching与PagedAttention:LLM推理引擎的核心技术 https://ai-engineering.cn/knowledge/llm-ops/continuous-batching-pagedattention
https://ai-engineering.cn/knowledge/llm-ops/continuous-batching-pagedattention
深入剖析Continuous Batching和PagedAttention两种现代LLM推理引擎核心技术的原理、实现对比和性能影响,配合vLLM/TGI等主流框架的实际部署策略
Mon, 11 May 2026 00:00:00 GMT
llm-ops
AIEng Hub- LLM可观测性:构建生产级大模型监控体系 https://ai-engineering.cn/knowledge/llm-ops/llm-observability
https://ai-engineering.cn/knowledge/llm-ops/llm-observability
系统讲解LLM应用的日志、指标、追踪和告警体系构建,涵盖Token成本、延迟、质量评估等核心监控维度的生产实践
Mon, 11 May 2026 00:00:00 GMT
llm-ops
AIEng Hub- 模型路由策略:智能调度降低LLM成本的核心技术 https://ai-engineering.cn/knowledge/llm-ops/model-routing-strategy
https://ai-engineering.cn/knowledge/llm-ops/model-routing-strategy
系统讲解模型路由(Model Routing)的核心原理、路由策略对比、生产级实现方案和最佳实践,帮助企业平衡成本与效果
Mon, 11 May 2026 00:00:00 GMT
llm-ops
AIEng Hub- LLM性能指标监控:从吞吐量到响应延迟的完整指南 https://ai-engineering.cn/knowledge/llm-ops/performance-metrics-monitoring
https://ai-engineering.cn/knowledge/llm-ops/performance-metrics-monitoring
系统讲解LLM推理服务的核心性能指标体系,涵盖吞吐量、延迟、GPU利用率和成本效率等关键维度的监控方法与实践
Mon, 11 May 2026 00:00:00 GMT
llm-ops
AIEng Hub- Prompt注入防护:构建安全的LLM应用 https://ai-engineering.cn/knowledge/llm-ops/prompt-injection-defense
https://ai-engineering.cn/knowledge/llm-ops/prompt-injection-defense
系统讲解Prompt注入攻击的原理、主流攻击手法和防护策略,涵盖输入过滤、输出检测、权限隔离和持续监控的生产级安全实践
Mon, 11 May 2026 00:00:00 GMT
llm-ops
AIEng Hub- 投机采样(Speculative Decoding):LLM推理加速的新范式 https://ai-engineering.cn/knowledge/llm-ops/speculative-decoding
https://ai-engineering.cn/knowledge/llm-ops/speculative-decoding
系统讲解投机采样的核心原理、实现方式、优势与局限,包含draft模型选择策略、性能收益评估和生产环境部署建议
Mon, 11 May 2026 00:00:00 GMT
llm-ops
AIEng Hub- Token成本分析与管理:从定价模型到优化策略 https://ai-engineering.cn/knowledge/llm-ops/token-cost-analysis
https://ai-engineering.cn/knowledge/llm-ops/token-cost-analysis
全面分析LLM API的Token定价模型、成本构成因素,提供系统化的成本优化策略、模型选择建议和预算管理方案
Mon, 11 May 2026 00:00:00 GMT
llm-ops
AIEng Hub- 上下文压缩策略:突破LLM窗口限制的实战方法 https://ai-engineering.cn/knowledge/prompt/context-compression
https://ai-engineering.cn/knowledge/prompt/context-compression
系统讲解LLM上下文压缩的核心策略,涵盖摘要压缩、结构化压缩、滑动窗口、检索增强等方法,帮助在有限上下文窗口内高效管理信息
Mon, 11 May 2026 00:00:00 GMT
prompt
AIEng Hub- 越狱攻击防范:抵御LLM Prompt越狱的系统化方法 https://ai-engineering.cn/knowledge/prompt/jailbreak-prevention
https://ai-engineering.cn/knowledge/prompt/jailbreak-prevention
系统讲解LLM越狱攻击(Jailbreak)的原理、常见攻击模式(DAN、角色扮演、编码绕过等)和系统化的防御策略
Mon, 11 May 2026 00:00:00 GMT
prompt
AIEng Hub- 输出格式控制:让LLM输出精准的结构化内容 https://ai-engineering.cn/knowledge/prompt/output-format-control
https://ai-engineering.cn/knowledge/prompt/output-format-control
系统讲解Prompt工程中的输出格式控制技术,涵盖JSON、表格、Markdown等格式的约束方法,以及高级输出控制模式和常见问题解决方案
Mon, 11 May 2026 00:00:00 GMT
prompt
AIEng Hub- Prompt A/B测试:数据驱动的Prompt优化方法 https://ai-engineering.cn/knowledge/prompt/prompt-ab-testing
https://ai-engineering.cn/knowledge/prompt/prompt-ab-testing
系统讲解Prompt A/B测试的完整方法论,涵盖实验设计、评估指标、统计分析和自动化测试框架的实践指南
Mon, 11 May 2026 00:00:00 GMT
prompt
AIEng Hub- Prompt注入防护:保护你的LLM应用不被操纵 https://ai-engineering.cn/knowledge/prompt/prompt-injection-defense
https://ai-engineering.cn/knowledge/prompt/prompt-injection-defense
从Prompt工程师视角讲解Prompt注入攻击原理、攻击手法分类和防护策略,涵盖输入过滤、Prompt加固、权限隔离等实战技术
Mon, 11 May 2026 00:00:00 GMT
prompt
AIEng Hub- Prompt迭代优化方法论:从模糊到精准的系统化方法 https://ai-engineering.cn/knowledge/prompt/prompt-iteration-optimization
https://ai-engineering.cn/knowledge/prompt/prompt-iteration-optimization
系统讲解Prompt迭代优化的工程方法论,涵盖评估指标、迭代流程、A/B测试框架、版本管理和自动化优化工具
Mon, 11 May 2026 00:00:00 GMT
prompt
AIEng Hub- Prompt模板引擎设计:从硬编码到工程化 https://ai-engineering.cn/knowledge/prompt/prompt-template-engineering
https://ai-engineering.cn/knowledge/prompt/prompt-template-engineering
系统讲解Prompt模板引擎的设计原则、实现方案和最佳实践,涵盖变量注入、条件逻辑、多语言支持、版本管理等生产级特性
Mon, 11 May 2026 00:00:00 GMT
prompt
AIEng Hub- ReAct模式:推理与行动的协同框架 https://ai-engineering.cn/knowledge/prompt/react-pattern-guide
https://ai-engineering.cn/knowledge/prompt/react-pattern-guide
系统讲解ReAct(Reasoning + Acting)模式的核心原理、实现方式、与CoT/ToT的区别对比,以及在生产级Agent中的实际应用
Mon, 11 May 2026 00:00:00 GMT
prompt
AIEng Hub- 角色设定与Persona:让LLM精准匹配业务场景 https://ai-engineering.cn/knowledge/prompt/role-persona-design
https://ai-engineering.cn/knowledge/prompt/role-persona-design
系统讲解Prompt工程中的角色设定技术和Persona设计方法,涵盖角色分类、Persona卡片、多角色系统和实战案例
Mon, 11 May 2026 00:00:00 GMT
prompt
AIEng Hub- 敏感信息过滤:保护LLM应用中的数据安全 https://ai-engineering.cn/knowledge/prompt/sensitive-content-filtering
https://ai-engineering.cn/knowledge/prompt/sensitive-content-filtering
系统讲解LLM应用中的敏感信息过滤技术,涵盖PII检测、数据脱敏、合规审查和生产级过滤框架的实践指南
Mon, 11 May 2026 00:00:00 GMT
prompt
AIEng Hub- Tree-of-Thoughts思维树:探索式推理的前沿方法 https://ai-engineering.cn/knowledge/prompt/tree-of-thoughts
https://ai-engineering.cn/knowledge/prompt/tree-of-thoughts
系统讲解Tree-of-Thoughts(ToT)思维树的核心原理、实现方式与主流变体,涵盖BFS/DFS搜索策略、评估函数设计和实际应用场景
Mon, 11 May 2026 00:00:00 GMT
prompt
AIEng Hub