两年的 Rust 使用感悟

我最近结束了一份工作，在过去两年里我用 Rust 编写了一个 B2B SaaS 产品的后台，所以现在是反思这段经历并写下来的理想时机。

我学习 Rust 的方式并不常见：阅读教程、书籍或编写小项目。恰恰相反，我把学习 Rust 作为构建 Austral 的研究工作的一部分。我会阅读有关 Rust 的论文和规范，有时我还会去 Rust playground 写一个小程序，以了解借用检查器在特定边缘情况下是如何工作的。

因此，当我开始使用 Rust 时，我的知识非常片面：我对借用检查器的细枝末节有着百科全书式的了解，却无法告诉你如何编写 “Hello, world!”。我写过的最大的 Rust 程序大概只有 60 行代码，是用来实证测试特质解析是如何工作的。

元素周期表

结果还不错。一两天之内，我就提交了修改。问题是，当人们向我打听学习 Rust 的资源时，我却一无所知。

优点

我对 Rust 的总结是：它是更好的 Go，或者更快的 Python。它速度快，静态类型多，拥有 SOTA 工具和一个伟大的生态系统。它不难学。它是一门工业语言，而非学术语言，你可以用它提高工作效率。它是一种通用语言，因此可以构建后端、CLI、TUI、GUI 和嵌入式固件。它还不太适合的两个领域是网络前端（尽管你可以尝试）和本地 macOS 应用程序。

性能

Rust 速度很快。

你可以用任何语言编写慢代码：四元循环、n+1 查询和糟糕的缓存使用。但这些都是离散瓶颈。在 Rust 中，当你解决了瓶颈问题，程序就会很快。

而在其他语言中，性能问题往往是普遍存在的，因此在 Python 中，经常会出现这样的情况：你已经解决了所有的瓶颈问题，但一切仍然慢得令人无法接受。为什么？因为 Python 中的基元比 Rust 中的要慢 10 倍到 100 倍，而慢速基元的组合就是慢速程序。无论你如何优化程序，性能上限都是由语言本身设定的。

当你发现自己处于这种情况时，该怎么办呢？你可以纵向扩展硬件，结果就像那些每月在 AWS 上花费五位数来获得每秒四次请求的人一样。你可以不断更新你的依赖关系，并希望社区正在努力提高性能。你可以尽可能多地使用 async，因为你相信你的代码是 I/O 绑定的，但当发现你的代码实际上是 CPU 绑定的时，你就会失望了。

Rust 有很高的性能上限，这让你在编写默认速度很快的程序时无需过多考虑优化问题，而当你需要提高性能时，在触及性能上限之前，你有很大的优化空间。

工具

在我使用过的所有构建系统+软件包管理器中，Cargo 的 DX 是最好的。通常情况下，你会称赞程序的功能，而使用 Cargo，你会称赞它的缺失：没有麻烦，没有脚枪，没有你必须在愤怒中学习的传说，没有怪异，没有需要配置的环境变量，没有忘记激活的 virtualenvs。当你从文档中复制一条命令并运行它时，它能正常工作，而不会吐出一条无用的错误信息，这条信息只能作为一个唯一的标识符，用来查找相关的 StackOverflow/Discourse 线程。

DX 的许多优点都源于这样一个事实，即货物完全是声明性的，而非状态性的。举个例子：我在使用 npm 时总是会遇到这样的问题：当我更新 package.json 中的依赖关系时，运行类型检查器/构建工具/其他工具并不能发现变化。我得到了一个意想不到的错误，然后我就会想，哦，对了，我得先运行 npm install。有了 cargo，如果你更新了 Cargo.toml 文件中的依赖关系，任何后续命令（cargo check、build 或 run）都会首先解析依赖关系、更新 Cargo.lock、下载任何缺失的依赖关系，然后运行命令。Cargo.toml、Cargo.lock、本地依赖库）的状态始终是同步的。

类型安全

Rust 拥有良好的类型系统：带穷尽性检查的总和类型、选项类型而非 null、没有令人惊讶的类型转换。同样，就像工具一样，类型系统的好坏取决于少量的特性和无数的缺失，以及没有犯过的错误。

这样做的实际结果是，你对代码的健壮性有很高的信心。而在 Python 等语言中，你对代码的健壮性毫无信心，因此你需要花时间编写测试（以弥补类型系统的不足）并等待测试完成 CI（因为 Python 慢得要命）。在 Rust 中，你只需编写代码，只要能编译，几乎总能运行。因为很少会出现缺陷，所以写测试会让人觉得是件苦差事。

举个例子：我其实不知道如何调试 Rust 程序，因为我从来没有调试过。我唯一需要调试的代码部分是 SQL 查询，因为 SQL 有很多不足之处。但 Rust 代码本身绝大多数都很扎实。出现错误时，通常都是概念性错误，即对规范的误解。这种错误在任何语言中都可能出现，但测试却会漏掉。

错误处理

有两种方法可以处理错误：传统的异常处理（如 Java 或 Python 中的异常处理）可以让错误处理代码保持畅通无阻，但却很难知道在特定程序点可能引发的错误集。在 Go 中，“错误即值”（Errors-as-values）使得错误处理更加明确，但代价是非常冗长。

Rust 有一个非常不错的解决方案，它将错误表示为普通值，但有语法糖，这意味着你不必慢吞吞地写上一千遍 if err != nil。

在 Rust 中，错误是任何实现 Error trait 的类型。然后是Result类型：

enum Result<T, E: Error> {
    Ok(T),
    Err(E)
}

易错函数只返回一个Result，例如

enum DbError {
    InvalidPath,
    Timeout,
    // ...
}

fn open_database(path: String) -> Result<Database, DbError>

通过问号运算符 ?，可以编写简洁的代码来处理错误。像这样的代码：

fn foo() -> Result<(), DbError> {
    let db = open_database(path)?;
    let tx = begin(db)?;
    let data = query(tx, "...")?;
    rollback(tx)?;
    Ok(())
}

被转换为更为冗长的版本：

fn foo() -> Result<(), DbError> {
    let db = match open_database(path) {
        Ok(db) => db,
        Err(e) => {
            // Rethrow.
            return Err(e);
        }
    };
    let tx = match begin(db) {
        Ok(tx) => tx,
        Err(e) => {
            return Err(e);
        }
    };
    let data = match query(tx, "...") {
        Ok(data) => data,
        Err(e) => {
            return Err(e);
        }
    };
    match rollback(tx) {
        Ok(_) => (),
        Err(e) => {
            return Err(e);
        }
    };
    Ok(())
}

当需要明确处理错误时，可以省略问号操作符，直接使用Result值。

借用检查器

借用检查器是 Rust 的头号功能：它让你在没有垃圾回收的情况下也能保证内存安全，它让 “无畏并发 ”成为可能。对大多数人来说，它也是学习和使用 Rust 过程中最令人沮丧的部分。

就我个人而言，我没有遇到过借用检查器的问题，但那是因为在我开始使用 Rust 工作之前，我已经设计并构建了自己的借用检查器。我不知道这是否是一种可扩展的教学方法。很多人说，他们必须经历一段与借用检查器斗争的漫长时间，慢慢地，他们的大脑会发现隐含的规则集，最终，他们可以在编写代码时不会触发难以理解的借用检查器错误。但这意味着很多人因为不喜欢与借用检查器对抗而放弃了学习 Rust。

那么，如何才能更有效地学习 Rust，而不需要构建自己的编译器，也不需要与借用检查器搏斗呢？

首先，了解借用检查器背后的概念、“别名 XOR 可变 ”规则、线性类型背后的动机等是非常有用的。遗憾的是，我并没有从头开始解释的经典资源。

其次，改变思维模式也很有用：很多人对借用检查器的思维模式是将其作为 Rust 的 “顶部”，就像在 C/C++ 代码库中运行的静态分析器，而编译器恰好内置了该分析器。这种思维方式会导致与系统对抗，因为你会想：我的代码是合法的，它进行了类型检查，所有类型都在那里，只有最后一层，即借用检查器，才会有问题。最好把借用检查器看作是语言语义的内在组成部分。借用检查必然发生在类型检查之后（因为它需要知道术语的类型），但借用检查失败的程序与未进行类型检查的程序一样无效。与其在头脑中用 C/C++ 实现一些东西，然后思考 “如何以满足借用检查器的方式将其转换到 Rust 中？”，不如思考 “如何在 Rust 的语义中，以线性和生命周期的方式实现目标？”。但这很难，因为这需要高度的流畅性。

当你对借用检查器驾轻就熟时，生活就会变得非常美好。与借款检查器 “作斗争 ”是不会发生的。当借用检查器抱怨时，要么是因为你正在做的事情有多个正交特性相互影响（如 async + 闭包 + 借用），要么是因为你正在做的事情太复杂，而错误是你必须简化的信号。通常情况下，借用检查器会将你引向具有机械共鸣、符合硬件工作原理的设计。当你设计出一种利用生命周期来实现完全无clone()数据流的设计时，你会感到非常满意。当你设计出一个线性类型的应用程序接口时，线性使其很难被误用，你会对借用检查器心存感激。

异步

每个人都在抱怨异步。他们会抱怨它太复杂，或者引用 “有色函数 ”的陈词滥调。当把某件事情与某种模糊、抽象、理想的状态相比较时，抱怨它是很容易的；但是，async 的具体和现存的替代方案究竟是什么呢？

操作系统线程速度慢是一个约束条件。这不是偶然的，而是内在的，因为有内核，每次上下文切换时都要交换 CPU 状态和堆栈。操作系统线程永远不会快。如果你想构建高性能的网络服务，那么并发连接的数量和每个 CPU 的吞吐量就非常重要。因此，你需要一种能最大限度利用硬件资源的并发方式。

基本上有两种选择。

绿色线程，它为程序员提供了与操作系统线程相同的语义（好！），但往往会降低性能（坏！），因为你需要为每个线程的堆栈分配内存，还需要运行时调度程序来进行抢占式多任务处理。
如 Rust 中的无栈线程（stackless coroutines），它增加了语言语义和实现的复杂性（坏！），但性能上限却很高（好！）。

从语言实现者或关心编程语言语义的人的角度来看，async 并不是一个微不足道的特性。async 和生命周期的交叉点很难理解。从库实现者的角度来看，即从编写服务构件的角度来看，以及从在战壕里与 Pin/Poll/Future 打交道的角度来看，async 都很难理解。

但从用户的角度来看，异步 Rust 还算不错。它大多 “就是能用”。从用户的角度来看，你可以在执行 IO 的函数定义前面加上 async，并在调用位置加上 await，仅此而已。唯一不符合人体工程学的地方是在迭代器内部调用 async 函数。

重构

重构是用数字作画。类型错误让重构变得异常简单和安全。

招聘

Rust 程序员难招吗？不难。

首先，像 Python 和 TypeScript 这样的主流语言太容易招聘了，以至于招聘起来非常困难。要找到一个真正有才华的 Python 程序员，你必须从成千上万份简历中筛选。

其次，质量也有选择效应。“使用过 Rust“、”用 Rust 写过开源代码 “或 ”想在专业领域使用 Rust “都是对应聘者巨大的积极信号，因为这说明他们很有好奇心，也很在意提高自己的技能。

就我个人而言，我从不认为自己是 “Python 程序员 ”或 “Rust 程序员”。我只是一个程序员！当你学习了足够多的语言后，你就能形成一套正交的编程概念基础，并在不同语言间进行转换。我认为真正有天赋的程序员也是如此：他们能够快速学习语言。

影响

技术谈够了。我们来谈谈感受。

当我使用 Python+Django 时，最大的感受就是焦虑。写 Python 就像用树枝堆城堡，越往上，风越大。我预料到事情会出错，我预料到代码会很慢，我预料到事情会因为最荒谬的原因而爆炸。我不得不防御性地编写代码，在代码中处处加入类型断言。

Rust 感觉很好。你可以充满信心地构建代码。你可以构建出不仅能按预期运行，而且还很美观的东西。你可以为自己所做的工作感到骄傲，因为它不是泔水。

缺点

本节将介绍我不喜欢的地方。

模块系统

在 Rust 中，有两个层次的代码组织：

Modules是具有可见性规则的命名空间。
Crates是模块的集合，它们可以依赖于其他crates。crates可以是可执行文件，也可以是库。

一个项目或工作区可以由多个crates组成。例如，一个网络应用程序的每个正交功能都可以有库板块，而可执行板块则将它们连接在一起并启动服务器。

让我感到惊讶的是，模块并不是编译单元，当我注意到同一crate 1 中的模块之间可能存在循环依赖关系时，我无意中了解到了这一点。相反，crate 才是编译单元。当你更改板条箱中的任何模块时，整个crate 都必须重新编译。这意味着编译大型板块的速度会很慢，因此大型项目应分解成许多小型板块，并安排它们的依赖 DAG，以最大限度地实现并行编译。

这是一个问题，因为创建一个模块很便宜，但创建一个板条箱却很慢。创建一个新模块只需创建一个新文件，并在同级的 mod.rs 文件中为其添加一个条目。创建新crate 需要运行 cargo new，别忘了在 Cargo.toml 中设置 publish = false，并在工作区范围内的 Cargo.toml 中添加crate 名称，以便从其他crate 中导入。在crate 中导入符号很简单：输入名称后，LSP 就会自动插入使用声明，但这并不能跨crate 使用，你必须手动打开你正在处理的crate的 Cargo.toml 文件，并手动为你想导入代码的crate 添加依赖关系。这非常耗时。

板块拆分的另一个问题是，rustc 有一个非常不错的功能，可以在代码未使用时发出警告。这个功能非常全面，我很喜欢，因为它有助于保持代码库的整洁。但它只在一个crate 中起作用。在多板块工作区中，在板块中公开导出但未被其他兄弟板块导入的声明不会被报告为未使用2。

因此，如果你想让构建速度更快，就必须重新整理架构，手动调整依赖 DAG，并完成创建和更新crate 元数据的所有工作。这样做的结果是……模块内部循环导入，这是一种可怕的反模式，会让理解代码库变得更加困难。我更希望模块是不相连的编译单元。

我还认为模块系统有点过于复杂，需要重新导出，导入符号的方式也太多了。它可以精简很多。

构建性能

Rust 体验中最糟糕的是编译时间。这通常被归咎于 LLVM，这很公平，但我认为部分原因在于该语言的固有特性，例如模块并非独立的编译单元，当然还有单态化。

有各种技巧可以加快构建速度：缓存、cargo chef、调整配置。但这些都是技巧，而技巧是脆弱的。当你发现编译性能下降时，原因可能有很多：

代码确实变大了，需要更长的时间来构建。
你使用的语言特性拖慢了前端（例如复杂的类型级代码）。
使用了会拖慢后端速度的语言特性（例如过度的单态化）。
一个 proc 宏耗时过长（尤其是 tracing::instrument 非常慢）。
crate DAG 变了形，以前并行构建的crate 现在要串行构建。
以上任何一种情况，但都是在依赖关系的传递闭包中。
您添加/更新了一个直接依赖关系，而这个直接依赖关系会带来大量的传递依赖关系。
缓存太少，导致依赖项被下载。
缓存过多，导致缓存膨胀，下载时间延长。
缓存最近失效了（例如通过更新 Cargo.lock），尚未稳定下来。
今天的 CI 运行速度很慢，原因不明。
以上所有情况的集合。
(插入罗素悖论笑话）

不值得琢磨。花钱买更大的 CI 运行程序就好了。四核或八核应该足够了。并行太多是浪费：使用 --timings 标志运行 cargo build，在浏览器中打开报告，查看 “最大并发 ”的值。这将告诉你可以并行构建多少个箱子，从而告诉你在收益递减之前可以购买多少个内核。

提高构建性能的主要方法是将工作区分割成多个板条箱，并安排板条箱的依赖关系，以便并行构建尽可能多的工作区。这在项目开始时很容易做到，但之后就非常耗时了。

模拟

也许这是一个技能问题，但我还没有找到一种好的方法来编写代码，让组件具有可交换的依赖关系，并能独立于它们的依赖关系进行测试。核心问题是生命周期会影响后期绑定。

考虑一个在网络应用程序中创建新用户的工作流程。三个外部效应是：在数据库中为用户创建记录、向用户发送验证电子邮件以及在审计日志中记录事件：

fn create_user(
    tx: &Transaction,
    email: Email,
    password: Password
) -> Result<(), CustomError>  {
    insert_user_record(tx, &email, &password)?;
    send_verification_email(&email)?;
    log_user_created_event(tx, &email)?;
    Ok(())
}

测试该功能需要启动数据库和电子邮件服务器。这可不行！我们希望将工作流与其依赖关系分离，这样就可以在不测试其依赖关系的情况下对其进行测试。有三种方法可以做到这一点：

使用 traits 定义接口，并在编译时进行传递。
使用 traits 定义接口，并在运行时使用动态分派来传递信息。
使用函数类型定义接口，并以闭包的形式传递依赖关系。

所有这些方法都行之有效。但它们需要大量的工作。而在 TypeScript、Java 或 Python 中，这将是轻而易举的事，因为这些语言没有生命周期，所以动态分派或闭包 “就是能用”。

例如，我们使用 traits，并在编译时完成所有工作。为了减少工作量，让我们只关注将用户的电子邮件和密码写入数据库的依赖关系。我们可以为它定义一个特质：

trait InsertUser<T> {
    fn execute(
        &mut self,
        tx: &T,
        email: &Email,
        password: &Password
    ) -> Result<(), CustomError>;
}

(我们将数据库事务的类型参数化，是因为 mock 不会使用真实的数据库，因此我们无法在测试中构建Transaction 类型）。

真正的实现需要定义一个占位符类型，并为其实现 InsertUser 特性：

struct InsertUserAdapter {}

impl InsertUser<Transaction> for InsertUserAdapter {
    fn execute(
        &mut self,
        tx: &Transaction,
        email: &Email,
        password: &Password
    ) -> Result<(), CustomError> {
        insert_user_record(tx, email, password)?;
        Ok(())
    }
}

模拟实现使用单位类型（）作为事务类型：

struct InsertUserMock {
    email: Email,
    password: Password,
}

impl InsertUser<()> for InsertUserMock {
    fn execute(
        &mut self,
        tx: &(),
        email: &Email,
        password: &Password
    ) -> Result<(), CustomError> {
        // Store the email and password in the mock object, so
        // we can afterwards assert the right values were passed
        // in.
        self.email = email.clone();
        self.password = password.clone();
        Ok(())
    }
}

最后，我们可以这样定义 create_user 工作流程：

fn create_user<T, I: InsertUser<T>>(
    tx: &T,
    insert_user: &mut I,
    email: Email,
    password: Password,
) -> Result<(), CustomError> {
    insert_user.execute(tx, &email, &password)?;
    // Todo: the rest of the dependencies.
    Ok(())
}

实际生产执行情况如下：

fn create_user_for_real(
    tx: &Transaction,
    email: Email,
    password: Password,
) -> Result<(), CustomError> {
    let mut insert_user = InsertUserAdapter {};
    create_user(tx, &mut insert_user, email, password)?;
    Ok(())
}

而在单元测试中，我们将创建 InsertUserMock 并将其传入：

#[test]
fn test_create_user() -> Result<(), CustomError> {
    let mut insert_user = InsertUserMock {
        email: "".to_string(),
        password: "".to_string()
    };
    let email = "foo@example.com".to_string();;
    let password = "hunter2".to_string();

    create_user(&(), &mut insert_user, email, password)?;

    // Assert `insert_user` was called with the right values.
    assert_eq!(insert_user.email, "foo@example.com");
    assert_eq!(insert_user.password, "hunter2");

    Ok(())
}

显然，这需要大量的键入。使用特质和动态分派可能会让代码稍微短一些。使用闭包可能是最简单的方法（带有类型参数的函数类型在某种意义上就是带有单个方法的特质），但这样就会遇到闭包和生命周期的人体工程学问题。

同样，这也可能是一个技能问题，也许有一种优雅而习以为常的方法可以做到这一点。

或者，你可以完全否认模拟的必要性，编写没有可交换实现的代码，但这样做也有自己的问题：测试会变得更慢，因为你必须启动服务器来模拟 API 调用等；测试需要大量代码来设置和拆卸这些依赖关系；测试必须是端到端的，而你的测试越是端到端，由于输入的组合爆炸，你需要检查每条路径的测试用例就越多。

表现力

使用 proc 宏和 trait 魔术很容易让人发疯，从而构建出一个难以理解的代码库，让人无法跟踪控制流或调试任何东西。你必须加以控制。

脚注

如果模块是独立的编译单元，这就行不通了。如果模块 A 依赖于 B，要编译 A，首先需要编译 B，才能知道它导出了哪些声明以及它们的类型。但如果 B 也依赖于 A，就会出现无限回归。

解决这个问题的方法之一是制作粒度极细的板条箱，并依靠 cargo-machete 在依赖级别识别未使用的代码。但这会耗费太多时间。

本文文字及图片出自 Two Years of Rust

阅读余下内容

rust| 2025-04-21