深入理解 Rust 所有权机制

2025年1月15日星期三 · simons · 本文共 2712 个字，预计需要阅读 6 分钟

从一个常见问题说起

看这段在其他语言中很普通的代码：

fn main() {
    let data = vec![1, 2, 3];
    process_data(data);
    println!("{:?}", data);  // 编译错误！
}

fn process_data(v: Vec<i32>) {
    println!("Processing: {:?}", v);
}

为什么这段代码在Rust中会报错？这就涉及到 Rust 最独特的特性：所有权系统。

所有权的三条核心规则

每个值只能有一个所有者
所有者离开作用域，值将被丢弃
一个值同一时刻只能有一个所有者

让我们通过代码详细理解这些规则：

规则1：单一所有权

let s1 = String::from("hello");
let s2 = s1;  // 所有权从s1转移到s2
// println!("{}", s1);  // 编译错误：s1已经失效

内存布局变化：

s1              s2
ptr ----------> "hello"    // 移动前

s2
ptr ----------> "hello"    // 移动后，s1不再有效

规则2：作用域规则

{
    let s = String::from("hello");  // s获得所有权
    // 使用 s
}  // s 离开作用域，内存被释放

规则3：独占访问

let mut v = vec![1, 2, 3];
let r1 = &mut v;  // 可以获取可变引用
// let r2 = &mut v;  // 错误：不能同时有两个可变引用
r1.push(4);

引用与借用：共享但不转移所有权

借用规则

同一时刻，要么有一个可变引用，要么有任意多个不可变引用
引用必须始终有效

fn calculate_length(s: &String) -> usize {  // 借用 String
    s.len()
}  // 这里不会释放 String，因为只是借用

let s1 = String::from("hello");
let len = calculate_length(&s1);  // 传递引用
println!("Length of '{}' is {}", s1, len);  // s1 仍然可用

可变引用的限制

let mut s = String::from("hello");

let r1 = &s;     // 没问题
let r2 = &s;     // 没问题
// let r3 = &mut s;  // 错误：已经有了不可变引用
println!("{} and {}", r1, r2);

let r3 = &mut s;  // 现在可以了，因为 r1 和 r2 不再使用

深入理解所有权转移

在函数调用中

fn take_ownership(s: String) {
    println!("{}", s);
}  // s被释放

fn give_ownership() -> String {
    String::from("hello")
}  // 返回值的所有权转移给调用者

let s1 = give_ownership();  // s1获得所有权
take_ownership(s1);         // s1的所有权转移入函数

在赋值中

let v1 = vec![1, 2, 3];
let v2 = v1.clone();  // 深拷贝，v1和v2都有效
let v3 = v1;          // 移动，v1不再有效

实际应用中的最佳实践

1. 使用引用来避免所有权转移

// 不好的做法
fn process(s: String) {
    println!("{}", s);
}

// 好的做法
fn process(s: &String) {
    println!("{}", s);
}

2. 合理使用生命周期标注

struct Cache<'a> {
    data: &'a [u8],
}

impl<'a> Cache<'a> {
    fn new(data: &'a [u8]) -> Self {
        Cache { data }
    }
}

3. 使用克隆的时机

// 需要克隆的情况
let original = String::from("hello");
let backup = original.clone();  // 确实需要两份数据

// 不需要克隆的情况
fn print_string(s: &String) {  // 使用引用代替克隆
    println!("{}", s);
}

常见陷阱和解决方案

1. 循环引用问题

use std::rc::Rc;
use std::cell::RefCell;

// 可能导致内存泄露的代码
struct Node {
    next: Option<Rc<RefCell<Node>>>,
}

// 解决方案：使用Weak
use std::rc::Weak;
struct BetterNode {
    next: Option<Weak<RefCell<BetterNode>>>,
}

2. 可变性与借用冲突

let mut v = vec![1, 2, 3];
let first = &v[0];  // 不可变借用
v.push(4);          // 错误：不能同时有可变和不可变借用
println!("{}", first);

3. 生命周期约束

struct StrHolder<'a> {
    s: &'a str,
}

impl<'a> StrHolder<'a> {
    fn get_str(&self) -> &str {
        self.s
    }
}

性能影响

所有权系统的设计带来了：

零开销抽象
编译时内存管理
无需垃圾回收
可预测的资源释放

深入理解

一个常见的内存问题：

fn main() {
    let v = vec![1, 2, 3];  // v 拥有这个 vector
    let v2 = v;             // 所有权转移到 v2
    println!("{:?}", v);    // 编译错误！v 已经不再有效
}

这个简单的例子揭示了Rust所有权系统的核心。让我们深入分析为什么会这样。

内存安全问题：
- 如果两个变量同时拥有堆内存的所有权，谁负责释放？
- 如果重复释放会怎样？
- 如果忘记释放会怎样？
系统设计权衡：

// 选择 1: 深拷贝（像 Python）
let s2 = s1.clone(); // 性能开销大

// 选择 2: 引用计数（像 Python 的内部实现）
use std::rc::Rc;
let s2 = Rc::clone(&s1); // 运行时开销

// 选择 3: 所有权系统（Rust 的选择）
let s2 = s1; // 零开销抽象

试错

// 尝试 1：直接使用
let s1 = String::from("hello");
let s2 = s1;
println!("{}", s1); // 错误：s1已被移动

// 尝试 2：使用引用
let s1 = String::from("hello");
let s2 = &s1;
println!("{}", s1); // 成功！

// 尝试 3：克隆
let s1 = String::from("hello");
let s2 = s1.clone();
println!("{}", s1); // 成功！

// 尝试 4：理解作用域
{
    let s1 = String::from("hello");
    let s2 = s1;
} // s2 离开作用域，内存被释放

结论

主要规则：

// 1. 每个值只能有一个所有者
let s1 = String::from("hello");
let s2 = s1;  // s1 的所有权移动到 s2

// 2. 引用（借用）不转移所有权
let s1 = String::from("hello");
let s2 = &s1;  // s2 借用 s1

// 3. 作用域结束时自动释放
{
    let s = String::from("hello");
} // s 被释放

// 4. Copy 类型例外（栈上的值）
let x = 5;
let y = x; // x 仍然可用，因为 i32 是 Copy 类型

所有权的三个核心规则

每个值在Rust中只有一个所有者
当所有者离开作用域，值会被丢弃
一个值可以被借用，但借用必须遵循特定规则

让我们通过实际案例来理解这些规则：

1. 单一所有权原则

// 栈上数据的Copy语义
let x = 5;
let y = x;     // x的值被复制到y
println!("x: {}, y: {}", x, y);  // 正常工作

// 堆上数据的Move语义
let s1 = String::from("hello");
let s2 = s1;   // s1的所有权移动到s2
// println!("{}", s1);  // 编译错误！s1已失效

为什么会这样？让我们看看内存布局：

栈数据(x = 5):    堆数据(s1 = "hello"):
+---+             +----------+
| 5 |             | ptr      |---> +---+---+---+---+---+
+---+             | len      |     | h | e | l | l | o |
                  | capacity |     +---+---+---+---+---+
                  +----------+

2. 作用域规则

fn main() {
    {
        let s = String::from("hello");  // s 进入作用域
        // 使用 s
    }  // s 离开作用域，String 被清理

    // println!("{}", s);  // 错误：s 已经不存在
}

3. 借用规则

fn main() {
    let mut s = String::from("hello");

    // 不可变借用
    let r1 = &s;
    let r2 = &s;  // 多个不可变借用是允许的
    println!("{}, {}", r1, r2);

    // 可变借用
    let r3 = &mut s;  // 同一时间只能有一个可变借用
    r3.push_str(" world");

    // println!("{}", r1);  // 错误：不能同时存在可变和不可变借用
}

深入理解借用检查器

借用检查器是编译器的一个组件，它确保所有的借用都遵循以下规则：

同一时间，你只能有：
- 一个可变引用，或者
- 任意数量的不可变引用
引用必须总是有效的

示例：

fn main() {
    let mut data = vec![1, 2, 3];

    // 错误案例
    let ref1 = &data;
    data.push(4);  // 错误：不能在存在不可变借用时修改
    println!("{:?}", ref1);

    // 正确使用
    {
        let ref2 = &data;
        println!("{:?}", ref2);
    }  // ref2 的借用在这里结束
    data.push(4);  // 现在可以修改了
}

所有权在函数中的应用

fn process_string(s: String) {  // s 获得所有权
    println!("{}", s);
}  // s 被释放

fn borrow_string(s: &String) {  // s 仅借用引用
    println!("{}", s);
}  // 原 String 保持不变

fn main() {
    let s = String::from("hello");

    borrow_string(&s);  // s 仅借出引用
    println!("{}", s);  // s 仍然可用

    process_string(s);  // s 的所有权被移动
    // println!("{}", s);  // 错误：s 已经无效
}

常见的所有权模式

1. 返回所有权

fn create_and_process() -> String {
    let s = String::from("hello");
    // 处理 s
    s  // 返回所有权
}

2. 多个返回值

fn split_at_char(s: &str, c: char) -> (&str, &str) {
    match s.find(c) {
        Some(i) => (&s[..i], &s[i+1..]),
        None => (s, ""),
    }
}

3. 使用Clone避免移动

let s1 = String::from("hello");
let s2 = s1.clone();  // 创建深拷贝
println!("s1 = {}, s2 = {}", s1, s2);  // 两者都可用

高级所有权概念

1. 生命周期

struct Excerpt<'a> {
    part: &'a str,
}

fn main() {
    let novel = String::from("Call me Ishmael...");
    let excerpt = Excerpt {
        part: &novel[..],
    };
}

2. 智能指针

use std::rc::Rc;

let data = Rc::new(vec![1, 2, 3]);
let data2 = data.clone();  // 增加引用计数，不是深拷贝

常见陷阱和解决方案

可变借用与迭代

let mut vec = vec![1, 2, 3];
for i in &vec {
    vec.push(*i);  // 错误：不能在迭代时修改
}

自引用结构

struct SelfRef {
    value: String,
    pointer: *const String,  // 需要特殊处理
}

闭包捕获

let value = String::from("hello");
let closure = || println!("{}", value);  // 闭包捕获value的引用

Rust的所有权系统是其最独特的特性之一，虽然初学时可能觉得受限，但它确保了内存安全和线程安全，同时避免了运行时开销。掌握所有权，就掌握了Rust编程的核心。

你在使用其他语言时是否遇到过内存相关的问题？Rust的所有权系统是否能帮助解决这些问题？

最佳实践

// 1. 优先使用引用，除非需要所有权
fn process(s: &String) { /* ... */ }

// 2. 需要修改时使用可变引用
fn modify(s: &mut String) { /* ... */ }

// 3. 只在必要时使用 clone()
let s2 = s1.clone(); // 当真的需要副本时

// 4. 理解并利用 RAII
struct MyResource { /* ... */ }
impl Drop for MyResource {
    fn drop(&mut self) {
        // 清理代码
    }
}

这个系统虽然初看很严格，但它实现了：

零成本抽象的内存安全
无需垃圾回收的自动内存管理
并发安全的保证
高效的资源管理

这就是为什么 Rust 能在保证内存安全的同时达到接近 C++ 的性能。

思考题

为什么 Rust 选择所有权而不是垃圾回收？
所有权系统如何影响并发编程？
如何在复杂系统中管理所有权关系？

这些概念可能初看较难，但掌握后会极大提升代码质量和系统可靠性。你觉得相比其他语言的内存管理方式，Rust 的所有权系统有什么优势和挑战？

深入理解 Rust 所有权机制

从一个常见问题说起

所有权的三条核心规则

规则1：单一所有权

规则2：作用域规则

规则3：独占访问

引用与借用：共享但不转移所有权

借用规则

可变引用的限制

深入理解所有权转移

在函数调用中

在赋值中

实际应用中的最佳实践

1. 使用引用来避免所有权转移

2. 合理使用生命周期标注

3. 使用克隆的时机

常见陷阱和解决方案

1. 循环引用问题

2. 可变性与借用冲突

3. 生命周期约束

性能影响

深入理解

所有权的三个核心规则

1. 单一所有权原则

2. 作用域规则

3. 借用规则

深入理解借用检查器

所有权在函数中的应用

常见的所有权模式

1. 返回所有权

2. 多个返回值

3. 使用Clone避免移动

高级所有权概念

1. 生命周期

2. 智能指针

常见陷阱和解决方案

最佳实践

思考题

快速分享

分享卡片

深入理解 Rust 所有权机制

创作活跃度