LLM

在 Amazon SageMaker 上进行LLM大语言模型训练

本文档为在 Amazon SageMaker 平台进行大规模语言模型（LLM）训练提供了一套全面的最佳实践指南，内容涵盖技术原理、应用场景、计算、存储、网络、弹性等关键环节。

Agentic AI 架构与生产实践指南

Agentic AI 架构与生产实践指南摘要 Agentic AI，即AI代理或智能体，正迅速成为继大型语言模型（LLM）之后，推动人工智能应用走向深入的又一核心技术。与传统的机器学习或简单的LLM调用不同，Agentic AI系统能够自 …

Agentic RAG 技术详解：从基本检索到智能代理

Agentic RAG 技术详解：从基本检索到智能代理 1. 背景：传统 RAG 的局限性检索增强生成 (Retrieval-Augmented Generation, RAG) 是一种通过从外部知识库检索相关信息，来增强大型语言模 …

GPU云服务解决方案架构师核心能力深度解析

深度解析AI训推GPU云服务解决方案架构师所需的核心能力，覆盖从核心理论、训推框架、平台能力到工程实践的全面技术栈。

PyTorch与AI工程优化技术栈的关系深度解析

系统性地解析PyTorch作为核心框架，如何与算子优化、算法优化、框架优化以及GPU集群这四大AI工程技术栈进行分层协作，共同构建和加速现代大规模AI模型。

vLLM革命性LLM推理加速引擎技术深度解析

深度解析vLLM如何通过其两大核心创新PagedAttention和Continuous Batching，从根本上解决KV Cache的内存瓶颈，革命性地提升大语言模型推理的吞吐量和效率。

LLM大模型推理优化：一套系统化的全栈工程方法

LLM大模型推理优化：一套系统化的全栈工程方法引言：从全功能AI平台到LLM推理优化的深度聚焦本文的探讨，源于我对研发的AI机器学习平台的工作总结和持续迭代的工作思考以及业界对于LLM模型推理的诉求重视程度越来越高：一个基于GPU集群、 …