RAG系统在生产环境的性能优化经验分享
最近我们在生产环境部署了一套RAG系统,处理日均10万+的查询请求。分享一些我们在向量数据库选型、检索策略优化、以及缓存机制上的经验...
与AI工程化从业者交流,分享经验与见解
最近我们在生产环境部署了一套RAG系统,处理日均10万+的查询请求。分享一些我们在向量数据库选型、检索策略优化、以及缓存机制上的经验...
开源了我们团队开发的智能客服系统,完全基于MCP协议实现,支持多轮对话、知识库检索、工单自动创建等功能...
在使用LoRA微调Llama2-7B时,发现loss在几个epoch后就不再下降了,目前卡在2.5左右。数据集是自定义的中文问答对,大约5万条...
梳理了目前AI Agent任务规划的几种主流方案:ReAct、Plan-and-Solve、Tree of Thoughts、以及最新的DSPy框架。从实现复杂度、效果、适用场景等维度进行对比...
整理了关于大模型推理优化的技术资料,包括vLLM、TensorRT-LLM、DeepSpeed-Inference等框架的官方文档、论文解读和最佳实践...
第一时间测试了GPT-4o的多模态能力,包括图像理解、音频处理、以及实时对话功能。分享一些实测结果和个人看法...
分享我们在电商、金融、教育三个业务场景中应用Prompt Engineering的经验,包括模板设计、动态组装、A/B测试等方法论...
对比了目前主流的向量数据库方案,从功能特性、性能表现、运维成本、生态支持等维度进行分析,供大家在选型时参考...
陈博士
156 篇帖子
张工
134 篇帖子
李明
98 篇帖子
刘洋
87 篇帖子
周杰
76 篇帖子