LLM

📄

在 Amazon SageMaker 上进行LLM大语言模型训练

本文档为在 Amazon SageMaker 平台进行大规模语言模型(LLM)训练提供了一套全面的最佳实践指南,内容涵盖技术原理、应用场景、计算、存储、网络、弹性等关键环节。
📄

Agentic AI 架构与生产实践指南

Agentic AI 架构与生产实践指南 摘要 Agentic AI,即AI代理或智能体,正迅速成为继大型语言模型(LLM)之后,推动人工智能应用走向深入的又一核心技术。与传统的机器学习或简单的LLM调用不同,Agentic AI系统能够自 …
📄

Agentic RAG 技术详解:从基本检索到智能代理

Agentic RAG 技术详解:从基本检索到智能代理 1. 背景:传统 RAG 的局限性 检索增强生成 (Retrieval-Augmented Generation, RAG) 是一种通过从外部知识库检索相关信息,来增强大型语言模 …
📄

GPU云服务解决方案架构师核心能力深度解析

深度解析AI训推GPU云服务解决方案架构师所需的核心能力,覆盖从核心理论、训推框架、平台能力到工程实践的全面技术栈。
📄

PyTorch与AI工程优化技术栈的关系深度解析

系统性地解析PyTorch作为核心框架,如何与算子优化、算法优化、框架优化以及GPU集群这四大AI工程技术栈进行分层协作,共同构建和加速现代大规模AI模型。
📄

vLLM革命性LLM推理加速引擎技术深度解析

深度解析vLLM如何通过其两大核心创新PagedAttention和Continuous Batching,从根本上解决KV Cache的内存瓶颈,革命性地提升大语言模型推理的吞吐量和效率。
📄

LLM大模型推理优化:一套系统化的全栈工程方法

LLM大模型推理优化:一套系统化的全栈工程方法 引言:从全功能AI平台到LLM推理优化的深度聚焦 本文的探讨,源于我对研发的AI机器学习平台的工作总结和持续迭代的工作思考以及业界对于LLM模型推理的诉求重视程度越来越高:一个基于GPU集群、 …