AIEng Hub - 最新文章

AIEng Hub - 最新文章 https://ai-engineering.cn AI工程化实战进阶指南 - 涵盖AI Agent、RAG系统、LLM Ops、Prompt工程和MCP协议 zh-cn Mon, 18 May 2026 06:53:20 GMT LLM缓存策略设计：从语义缓存到分层缓存体系 https://ai-engineering.cn/knowledge/llm-ops/caching-strategy https://ai-engineering.cn/knowledge/llm-ops/caching-strategy 系统讲解LLM应用中的缓存策略设计，涵盖语义缓存、结果缓存、KV Cache前缀缓存和分层缓存体系的生产实践 Mon, 11 May 2026 00:00:00 GMT llm-ops AIEng Hub 内容安全审核：构建负责任的LLM应用 https://ai-engineering.cn/knowledge/llm-ops/content-safety-audit https://ai-engineering.cn/knowledge/llm-ops/content-safety-audit 系统讲解LLM应用内容安全审核的完整体系，涵盖安全策略制定、审核流程设计、审核技术实现和应急响应机制的实践指南 Mon, 11 May 2026 00:00:00 GMT llm-ops AIEng Hub Continuous Batching与PagedAttention：LLM推理引擎的核心技术 https://ai-engineering.cn/knowledge/llm-ops/continuous-batching-pagedattention https://ai-engineering.cn/knowledge/llm-ops/continuous-batching-pagedattention 深入剖析Continuous Batching和PagedAttention两种现代LLM推理引擎核心技术的原理、实现对比和性能影响，配合vLLM/TGI等主流框架的实际部署策略 Mon, 11 May 2026 00:00:00 GMT llm-ops AIEng Hub LLM可观测性：构建生产级大模型监控体系 https://ai-engineering.cn/knowledge/llm-ops/llm-observability https://ai-engineering.cn/knowledge/llm-ops/llm-observability 系统讲解LLM应用的日志、指标、追踪和告警体系构建，涵盖Token成本、延迟、质量评估等核心监控维度的生产实践 Mon, 11 May 2026 00:00:00 GMT llm-ops AIEng Hub 模型路由策略：智能调度降低LLM成本的核心技术 https://ai-engineering.cn/knowledge/llm-ops/model-routing-strategy https://ai-engineering.cn/knowledge/llm-ops/model-routing-strategy 系统讲解模型路由（Model Routing）的核心原理、路由策略对比、生产级实现方案和最佳实践，帮助企业平衡成本与效果 Mon, 11 May 2026 00:00:00 GMT llm-ops AIEng Hub LLM性能指标监控：从吞吐量到响应延迟的完整指南 https://ai-engineering.cn/knowledge/llm-ops/performance-metrics-monitoring https://ai-engineering.cn/knowledge/llm-ops/performance-metrics-monitoring 系统讲解LLM推理服务的核心性能指标体系，涵盖吞吐量、延迟、GPU利用率和成本效率等关键维度的监控方法与实践 Mon, 11 May 2026 00:00:00 GMT llm-ops AIEng Hub Prompt注入防护：构建安全的LLM应用 https://ai-engineering.cn/knowledge/llm-ops/prompt-injection-defense https://ai-engineering.cn/knowledge/llm-ops/prompt-injection-defense 系统讲解Prompt注入攻击的原理、主流攻击手法和防护策略，涵盖输入过滤、输出检测、权限隔离和持续监控的生产级安全实践 Mon, 11 May 2026 00:00:00 GMT llm-ops AIEng Hub 投机采样（Speculative Decoding）：LLM推理加速的新范式 https://ai-engineering.cn/knowledge/llm-ops/speculative-decoding https://ai-engineering.cn/knowledge/llm-ops/speculative-decoding 系统讲解投机采样的核心原理、实现方式、优势与局限，包含draft模型选择策略、性能收益评估和生产环境部署建议 Mon, 11 May 2026 00:00:00 GMT llm-ops AIEng Hub Token成本分析与管理：从定价模型到优化策略 https://ai-engineering.cn/knowledge/llm-ops/token-cost-analysis https://ai-engineering.cn/knowledge/llm-ops/token-cost-analysis 全面分析LLM API的Token定价模型、成本构成因素，提供系统化的成本优化策略、模型选择建议和预算管理方案 Mon, 11 May 2026 00:00:00 GMT llm-ops AIEng Hub 上下文压缩策略：突破LLM窗口限制的实战方法 https://ai-engineering.cn/knowledge/prompt/context-compression https://ai-engineering.cn/knowledge/prompt/context-compression 系统讲解LLM上下文压缩的核心策略，涵盖摘要压缩、结构化压缩、滑动窗口、检索增强等方法，帮助在有限上下文窗口内高效管理信息 Mon, 11 May 2026 00:00:00 GMT prompt AIEng Hub 越狱攻击防范：抵御LLM Prompt越狱的系统化方法 https://ai-engineering.cn/knowledge/prompt/jailbreak-prevention https://ai-engineering.cn/knowledge/prompt/jailbreak-prevention 系统讲解LLM越狱攻击（Jailbreak）的原理、常见攻击模式（DAN、角色扮演、编码绕过等）和系统化的防御策略 Mon, 11 May 2026 00:00:00 GMT prompt AIEng Hub 输出格式控制：让LLM输出精准的结构化内容 https://ai-engineering.cn/knowledge/prompt/output-format-control https://ai-engineering.cn/knowledge/prompt/output-format-control 系统讲解Prompt工程中的输出格式控制技术，涵盖JSON、表格、Markdown等格式的约束方法，以及高级输出控制模式和常见问题解决方案 Mon, 11 May 2026 00:00:00 GMT prompt AIEng Hub Prompt A/B测试：数据驱动的Prompt优化方法 https://ai-engineering.cn/knowledge/prompt/prompt-ab-testing https://ai-engineering.cn/knowledge/prompt/prompt-ab-testing 系统讲解Prompt A/B测试的完整方法论，涵盖实验设计、评估指标、统计分析和自动化测试框架的实践指南 Mon, 11 May 2026 00:00:00 GMT prompt AIEng Hub Prompt注入防护：保护你的LLM应用不被操纵 https://ai-engineering.cn/knowledge/prompt/prompt-injection-defense https://ai-engineering.cn/knowledge/prompt/prompt-injection-defense 从Prompt工程师视角讲解Prompt注入攻击原理、攻击手法分类和防护策略，涵盖输入过滤、Prompt加固、权限隔离等实战技术 Mon, 11 May 2026 00:00:00 GMT prompt AIEng Hub Prompt迭代优化方法论：从模糊到精准的系统化方法 https://ai-engineering.cn/knowledge/prompt/prompt-iteration-optimization https://ai-engineering.cn/knowledge/prompt/prompt-iteration-optimization 系统讲解Prompt迭代优化的工程方法论，涵盖评估指标、迭代流程、A/B测试框架、版本管理和自动化优化工具 Mon, 11 May 2026 00:00:00 GMT prompt AIEng Hub Prompt模板引擎设计：从硬编码到工程化 https://ai-engineering.cn/knowledge/prompt/prompt-template-engineering https://ai-engineering.cn/knowledge/prompt/prompt-template-engineering 系统讲解Prompt模板引擎的设计原则、实现方案和最佳实践，涵盖变量注入、条件逻辑、多语言支持、版本管理等生产级特性 Mon, 11 May 2026 00:00:00 GMT prompt AIEng Hub ReAct模式：推理与行动的协同框架 https://ai-engineering.cn/knowledge/prompt/react-pattern-guide https://ai-engineering.cn/knowledge/prompt/react-pattern-guide 系统讲解ReAct（Reasoning + Acting）模式的核心原理、实现方式、与CoT/ToT的区别对比，以及在生产级Agent中的实际应用 Mon, 11 May 2026 00:00:00 GMT prompt AIEng Hub 角色设定与Persona：让LLM精准匹配业务场景 https://ai-engineering.cn/knowledge/prompt/role-persona-design https://ai-engineering.cn/knowledge/prompt/role-persona-design 系统讲解Prompt工程中的角色设定技术和Persona设计方法，涵盖角色分类、Persona卡片、多角色系统和实战案例 Mon, 11 May 2026 00:00:00 GMT prompt AIEng Hub 敏感信息过滤：保护LLM应用中的数据安全 https://ai-engineering.cn/knowledge/prompt/sensitive-content-filtering https://ai-engineering.cn/knowledge/prompt/sensitive-content-filtering 系统讲解LLM应用中的敏感信息过滤技术，涵盖PII检测、数据脱敏、合规审查和生产级过滤框架的实践指南 Mon, 11 May 2026 00:00:00 GMT prompt AIEng Hub Tree-of-Thoughts思维树：探索式推理的前沿方法 https://ai-engineering.cn/knowledge/prompt/tree-of-thoughts https://ai-engineering.cn/knowledge/prompt/tree-of-thoughts 系统讲解Tree-of-Thoughts（ToT）思维树的核心原理、实现方式与主流变体，涵盖BFS/DFS搜索策略、评估函数设计和实际应用场景 Mon, 11 May 2026 00:00:00 GMT prompt AIEng Hub