今天就跟大家聊聊有关Rust中怎么实现闭包,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。
闭包的基本语法
闭包,又称为lambda表达式,可以像函数一样被调用,但具有使用外部环境中的变量的能力,其中外部环境是指闭包定义时所在的作用域。一个典型的闭包如下所示:
let x = 1; let add = |a: i32| -> i32 { return a + x; }; println!("{}", add(2)); // 输出:3
可以看到,add
是一个闭包,它有一个参数,用两个|
包围,执行语句包含在{}
中,闭包的参数和返回值类型的指定与普通函数的语法相同,但可以省略。若{}
中只包含一条语句,{}
也可以省略。也就是说,add
可以简写为如下形式:
let add = |a| a + x;
在闭包add
中,它可以使用外部环境中的变量x
,这是和普通函数最大的不同。需要注意的是,对于普通函数fn
来说,其无需前向声明,但闭包需要先定义后使用,从这个角度讲闭包更像是一个变量,而且它具有和变量同样的“生命周期”。
下面我们来看一下闭包是如何使用外部环境中的变量的。
对每一个闭包,编译器会自动生成一个匿名struct类型,并通过分析闭包的内部逻辑来决定该结构体包括哪些数据以及数据该如何初始化,如果闭包中使用了外部环境变量,则结构体中会包括该变量。从这个层面讲,闭包其实是一种语法糖。对于上面提到的闭包add
,编译器会将其自动转化为如下形式(只是举个例子,并非真正的编译器处理闭包的方式):
struct Closure { x: i32, } impl Closure { fn call(&self, a: i32) -> i32 { self.x + a } } fn main() { let x = 1; let add = Closure { x: x }; println!("{}", add.call(2)); // 输出:3 }
可以看到,若想在闭包中使用一个外部环境中的变量,需要分两步:第一步是构造相应的结构体并捕获外部环境变量,就如let add = Closure { x: x };
所示;第二步是构造结构体的成员函数并使用外部环境变量,就如fn call(&self, a: i32) -> i32
所示。在这两个步骤中,还需要考虑两个问题:
第一个问题关心的是闭包如何捕获外部变量:结构体内部的成员应当使用什么类型呢,是T
、&T
还是&mut T
呢?
第二个问题关心的是闭包如何使用外部变量:函数调用的self
应当使用什么类型呢,是self
、&self
还是&mut self
呢?
对于闭包如何捕获外部变量,编译器的原则是“按需捕获”:在保证能编译通过的情况下,结构体内部的成员优先选择&T
,其次是&mut T
,最后选择T
。这个原则的核心就是“选择对结构体外部影响最小的存储类型”,具体来说就是:
如果一个外部变量在闭包中只通过借用指针&
使用,那么这个变量就可使用&
捕获;
如果一个外部变量在闭包中通过可变借用指针&mut
使用,那么这个变量就需要使用&mut
捕获;
如果一个外部变量在闭包中通过所有权转移方式使用过,那么这个变量就需要使用T
捕获;
看下面这个例子:
struct T(i32); fn by_move(_: T) {} fn by_ref(_: &T) {} fn by_mut(_: &mut T) {} fn main() { let x = T(1); let y = T(2); let mut z = T(3); let closure = || { by_move(x); by_ref(&y); by_mut(&mut z); }; closure(); }
以上闭包分别以T
、&T
还是&mut T
的方式捕获了外部的变量x
,y
,z
,所以编译器会自动生成类似于下面这样的结构体:
struct Closure { x: T, y: &T, z: &mut T, }
需要注意的是,如果承载闭包的变量不再是局部变量,而是被传递出了当前作用域,则该闭包必须选择传递所有权的方式才能保证编译通过,这时可以使用move
关键字修饰闭包,强制将闭包中变量的捕获全部使用所有权转移的方式。例如:
fn make_adder(x: i32) -> Box<Fn(i32) -> i32> { Box::new(move |y| x + y) }
可以看到,局部变量x
被传递出了函数外,如果不加move
关键字,编译器会提示:
error[E0373]: closure may outlive the current function, but it borrows `x`, which is owned by the current function
闭包使用外部变量的方式将影响相应的结构体成员函数的第一个参数self
的类型,对于self
、&self
和&mut self
三种类型,Rust提供了三个trait对其进行抽象。这三个trait是Fn
、FnMut
和FnOnce
,它们的定义如下:
pub trait FnOnce<Args> { type Output; extern "rust-call" fn call_once(self, args: Args) -> Self::Output; } pub trait FnMut<Args>: FnOnce<Args> { extern "rust-call" fn call_mut(&mut self, args: Args) -> Self::Output; } pub trait Fn<Args>: FnMut<Args> { extern "rust-call" fn call(&self, args: Args) -> Self::Output; }
可以看到,这三个trait的区别就在于self
的类型不同:
FnOnce
的调用参数为self
,表示闭包通过转移所有权的方式来使用外部环境中的变量,所以该闭包只能调用一次;
FnMut
的调用参数是&mut self
,表示闭包通过可变借用的方式来使用外部环境中的变量;
Fn
的调用参数是&self
,表示闭包通过不可变借用的方式来使用外部环境中的变量;
需要注意的是,Fn
继承自FnMut
,FnMut
继承自FnOnce
,这意味着,如果要实现Fn
,就必须实现FnMut
和FnOnce
;如果要实现FnMut
,就必须实现FnOnce
。这里面蕴含的逻辑是,如果该闭包能够以Fn
方式调用,那么它也一定能以FnMut
和FnOnce
方式调用。
看下面这个例子:
fn main() { let s = "hello".to_string(); let use_by_ref = move || { println!("{}", s); }; use_by_ref(); // Fn use_by_ref(); let mut s = "hello".to_string(); let mut use_by_mut = || { s.push_str(" world"); println!("{}", s); }; use_by_mut(); // FnMut use_by_mut(); let s = "hello".to_string(); let use_by_move = || { drop(s); }; use_by_move(); // FnOnce // use_by_move(); // error[E0382]: use of moved value: `use_by_move` }
可以看到,闭包use_by_ref
是只读方式使用了外部变量s
,如果不使用move
关键字,它的捕获方式是&T
,使用方式是Fn
,这里为了演示,强制使用move
关键字将捕获方式改为T
,但由于闭包中对变量s
的使用仍然是只读,所以使用方式仍然是Fn
,而不是FnOnce
;闭包use_by_mut
是可变方式使用了外部变量s
,它的捕获方式是&mut T
,使用方式是FnMut
;闭包use_bu_move
是所有权转移方式使用了外部变量s
,它的捕获方式是T
,使用方式是FnOnce
,所以在第二次调用use_by_move
时会报错。
闭包一定会实现Fn
、FnMut
和FnOnce
三种trait之一,所以可以将闭包作为函数参数和返回类型,但需要注意的是,不要忘记trait是一种DST类型,它的大小在编译阶段是不固定的,从而不能直接作为参数类型或者返回值类型,这也是Rust中的trait和其他语言中的接口的重大区别之一。请看下面的例子,在函数tset
中不可以直接使用Bird
作为类型,编译器会报错。
trait Bird { fn fly(&self); } struct Duck; struct Swan; impl Bird for Duck { fn fly(&self) { println!("duck duck"); } } impl Bird for Swan { fn fly(&self) { println!("swan swan"); } } // error[E0277]: the size for values of type `(dyn Bird + 'static)` cannot // be known at compilation time fn test(arg: Bird) {}
难道我们在Rust中就不能拥有多态了吗?那是不可能的,我们有两种选择:
静态分派:通过泛型的方式,为不同的泛型类型参数生成不同版本的函数,实现编译期静态分派。
fn test<T: Bird>(arg: T) { arg.fly(); }
动态分派,通过trait objetc的方式,将闭包装箱进入堆内存中,函数传递的是一个胖指针,从实现运行期动态分派。
fn test(arg: Box<dyn Bird>) { arg.fly(); }
下面我们来具体介绍一下静态分派和动态分派。
对于闭包,其泛型参数的写法有一些特殊之处,如下面代码所示:
fn call_with_closure<F>(closure: F) -> i32 where F: Fn(i32) -> i32, { closure(1) }
其中泛型参数F
的约束条件是F: Fn(i32) -> i32
,这使得看起来和普通函数类型更相似从而更易阅读。
使用泛型的方式在函数参数中可以正常使用,但却无法将一个闭包作为函数值返回,因为Rust中只支持函数返回具体类型,而闭包是一个匿名类型,这使得编译器无法自动推断且程序员也无法手动指定。这时,可以使用impl trait
语法糖,看下面的例子:
fn multiply(m: i32) -> impl Fn(i32) -> i32 { move |x| x * m }
这里的impl Fn(i32) -> i32
表示,这个返回类型,虽然我们不知道它的具体名字,但是知道它满足Fn(i32) -> i32
这个trait的约束。这个功能目前还不是特别稳定,建议不要激进使用,推荐使用下面介绍的动态分派的方式来解决返回值的问题。
动态分派是通过指针的方式来实现多态,虽然trait是的DST,但指向trait的指针不是DST。如果我们把trait隐藏到指针的后面,那么就称它是一个trait object,而trait object是可以作为参数和返回类型的。
指向trait的指针就是trait object。假如Bird
是一个trait的名称,那么dyn Bird
就是一个DST动态大小类型,则&dyn Bird
、Box<dyn Bird>
以及Rc<dyn Bird>
等都是trait object。当指针指向trait的时候,它就变成一个胖指针了,比如Box<dyn Bird>
可以理解为:
pub struct TraitObject { pub data: *mut(), pub vtable: *mut(), }
它里面包含了两个指针,第一个表示地址,第二个指向“虚函数表”,里面有我们需要调用的具体函数的地址。这和C++中的虚函数表内存布局有所不同。在C++中,如果一个类型里面有虚函数,则每一个这种类型的变量内部都包含一个指向虚函数表的地址。而在Rust中,对象本身不包含指向虚函数表的指针,这个指针是存在于trait object指针里面的,如果一个类型实现了多个trait,那么不同的trait object指向的虚函数表也不一样。
需要注意的是,并不是所有的trait都可以构造trait object,trait objetc的构造是受到许多约束的。满足以下条件的trait不能构造trait object:
当trait有Self: Sized
约束时
当函数除了第一个参数外,有Self
类型作为参数或返回类型时
当函数的第一个参数不是Self
时
当函数有泛型参数时
对于后三种情况,如果想把不满足条件的函数剔除在外,可以为该函数加上Self: Sized
约束,例如fn foo(&self) where Self: Sized
。
看完上述内容,你们对Rust中怎么实现闭包有进一步的了解吗?如果还想了解更多知识或者相关内容,请关注亿速云行业资讯频道,感谢大家的支持。
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。