技术博客
文章
标签
分类
关于
Optimization
📄
LLM大模型推理优化:一套系统化的全栈工程方法
Aug 1, 2025
LLM大模型推理优化:一套系统化的全栈工程方法 引言:从全功能AI平台到LLM推理优化的深度聚焦 本文的探讨,源于我对研发的AI机器学习平台的工作总结和持续迭代的工作思考以及业界对于LLM模型推理的诉求重视程度越来越高:一个基于GPU集群、 …
📄
15个在真实后端项目中必用的Java性能优化技巧
Jul 31, 2025
分享15个在真实生产环境中经过反复验证的Java性能优化技巧,覆盖网络、内存、并发和数据库等多个维度,帮助构建高性能的后端服务。
📄
面向AI推理的Serverless平台冷启动优化技术方案
Jul 28, 2025
云原生架构
面向AI推理的Serverless平台冷启动优化技术方案 文档版本: 1.0 作者: Gemini 日期: 2025年7月28日 1. 背景与核心挑战 1.1 背景 在我们的企业级AI平台架构中,采用基于Knative/KServe …