性能优化

📄

容器化应用性能优化核心实践:从应用到内核的全景指南

技术实践
本文提供一个系统性的性能优化框架,从应用层到内核层,逐层剖析容器化应用可能遇到的性能瓶颈,并提供包含代码、配置示例在内的具体最佳实践和技术建议。
📄

GPU集群在AI模型训练与推理中的核心作用与技术深度解析

一份AI机器学习平台研发的深度总结,系统性地梳理和对比GPU集群在模型训练和模型推理这两个核心阶段所扮演的截然不同的角色、挑战及性能优化策略。
📄

PyTorch与AI工程优化技术栈的关系深度解析

系统性地解析PyTorch作为核心框架,如何与算子优化、算法优化、框架优化以及GPU集群这四大AI工程技术栈进行分层协作,共同构建和加速现代大规模AI模型。
📄

vLLM革命性LLM推理加速引擎技术深度解析

深度解析vLLM如何通过其两大核心创新PagedAttention和Continuous Batching,从根本上解决KV Cache的内存瓶颈,革命性地提升大语言模型推理的吞吐量和效率。
📄

AWS Lambda 函数计算在实际应用落地过程中的生产实践经验

云原生
AWS Lambda 函数计算在实际应用落地过程中的生产实践经验 引言 AWS Lambda 是一种无服务器计算服务,允许开发者运行代码而无需管理服务器。它被广泛用于构建可扩展的事件驱动应用程序。然而,在使用 AWS Lambda 时,需要 …
📄

Java应用在函数计算(Serverless)环境中的冷启动优化实践

云计算
Java应用在函数计算(Serverless)环境中的冷启动优化实践-以 AWS Lambda 为示范 前言 由于我之前在云计算公司工作多年,深刻体会到Serverless技术对于某些应用场景在成本、效率、运维复杂度的优势,因此在目前就职的 …
📄

Kubernetes中的CPU Burst机制:容器性能调优指南

云原生
Kubernetes中的CPU Burst机制:容器性能调优指南 在我的工作经历里,多次进行了容器化应用在Kubernetes部署环境的性能诊断与优化,本文是对 CPU Burst在应对容器化应用的 CPU 节流问题的技术总结。 1. …