社区讨论

与AI工程化从业者交流,分享经验与见解

排序:
张工
技术讨论 热门

RAG系统在生产环境的性能优化经验分享

最近我们在生产环境部署了一套RAG系统,处理日均10万+的查询请求。分享一些我们在向量数据库选型、检索策略优化、以及缓存机制上的经验...

#RAG #向量数据库 #性能优化
张工 资深工程师 · 2小时前
1234 45 89
李明
项目展示 热门

【项目展示】基于MCP协议的智能客服系统

开源了我们团队开发的智能客服系统,完全基于MCP协议实现,支持多轮对话、知识库检索、工单自动创建等功能...

#MCP #开源项目 #智能客服
李明 全栈开发者 · 4小时前
892 32 156
王芳
问答求助

求助:LLM微调时loss不收敛的问题

在使用LoRA微调Llama2-7B时,发现loss在几个epoch后就不再下降了,目前卡在2.5左右。数据集是自定义的中文问答对,大约5万条...

#微调 #LoRA #Llama
王芳 AI研究员 · 6小时前
567 18 23
陈博士
技术讨论 热门

AI Agent任务规划的几种主流方案对比

梳理了目前AI Agent任务规划的几种主流方案:ReAct、Plan-and-Solve、Tree of Thoughts、以及最新的DSPy框架。从实现复杂度、效果、适用场景等维度进行对比...

#AI Agent #ReAct #DSPy
陈博士 技术负责人 · 昨天
2103 67 234
刘洋
资源分享 热门

【资源分享】大模型推理优化技术资料合集

整理了关于大模型推理优化的技术资料,包括vLLM、TensorRT-LLM、DeepSpeed-Inference等框架的官方文档、论文解读和最佳实践...

#vLLM #推理优化 #资料
刘洋 算法工程师 · 昨天
3456 28 412
赵敏
行业动态

OpenAI发布GPT-4o多模态能力实测

第一时间测试了GPT-4o的多模态能力,包括图像理解、音频处理、以及实时对话功能。分享一些实测结果和个人看法...

#OpenAI #GPT-4o #多模态
赵敏 产品经理 · 2天前
1567 89 178
孙伟
技术讨论

Prompt Engineering在业务场景中的落地实践

分享我们在电商、金融、教育三个业务场景中应用Prompt Engineering的经验,包括模板设计、动态组装、A/B测试等方法论...

#Prompt #落地实践 #业务应用
孙伟 技术专家 · 2天前
789 34 67
周杰
技术讨论 热门

向量数据库选型:Milvus vs Pinecone vs pgvector

对比了目前主流的向量数据库方案,从功能特性、性能表现、运维成本、生态支持等维度进行分析,供大家在选型时参考...

#向量数据库 #Milvus #架构
周杰 架构师 · 3天前
2341 56 189
...