<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>AI Infra 学习路线 on XyStart | AI Infra 博客</title><link>https://xystart.github.io/series/ai-infra-%E5%AD%A6%E4%B9%A0%E8%B7%AF%E7%BA%BF/</link><description>Recent content in AI Infra 学习路线 on XyStart | AI Infra 博客</description><generator>Hugo -- gohugo.io</generator><language>zh-cn</language><lastBuildDate>Tue, 07 Apr 2026 00:00:00 +0800</lastBuildDate><atom:link href="https://xystart.github.io/series/ai-infra-%E5%AD%A6%E4%B9%A0%E8%B7%AF%E7%BA%BF/index.xml" rel="self" type="application/rss+xml"/><item><title>AI Infra 学习记录</title><link>https://xystart.github.io/p/getting-started/</link><pubDate>Tue, 07 Apr 2026 00:00:00 +0800</pubDate><guid>https://xystart.github.io/p/getting-started/</guid><description>&lt;p&gt;这个博客主要记录我在 &lt;strong&gt;AI Infra&lt;/strong&gt; 方向的学习与实践过程。&lt;/p&gt;
&lt;h2 id="学习路线"&gt;学习路线
&lt;/h2&gt;&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;Transformer 基础&lt;/strong&gt;：prefill/decode、KV cache、指标（TTFT/TPOT）怎么落到系统观测&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;推理引擎拆解&lt;/strong&gt;：调度与 batching、KV/显存管理、多卡通信、可观测与调试闭环&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;CUDA / Triton 实战&lt;/strong&gt;：从推理瓶颈出发写/改算子（例如 RMSNorm、RoPE、attention 相关）&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;由于自己是初学，更新博客内容可能会有误解，如有发现，欢迎沟通：&lt;code&gt;https://github.com/xystart&lt;/code&gt;&lt;/p&gt;</description></item></channel></rss>