GCC铁锈月报,2022年2月

2022-02-26 08:55:37

再次感谢开源安全公司和Embecosm对该项目的持续支持。

2月对GCC来说是一个重要的月份;我们之前的谷歌代码暑期学生阿瑟·科恩(Arthur Cohen)在德国的Embecosm加入我们,全职从事编译器的工作。有了额外的资源,我们可以拆分工作并委派任务,从而允许进行多个复杂的工作流,这将使Philip能够处理类型系统中的切片和bug。

关于我们的宏扩展里程碑,我们已经准备好了构建块,并且支持大多数声明性宏,尽管仍然有一些怪癖和错误需要解决。这个里程碑的剩余时间将用于设置内置宏和修复bug。

除了宏之外,2月份的工作重点是代码清理和bug修复,这是富有成效的。

是我们下一个社区电话的时候了,欢迎加入!🙂

添加对索引和范围项目的支持,以及用于切片类型检查PR974的锅炉板

我们已经改进了我们的规范路径跟踪,以便我们可以为遗留的损坏方案建立路径。例如,嵌套在模块下的impl块在其路径中被赋予一个impl前缀。

struct Foo(i32);mod A{impl Foo{fn test(&;self)->i32{self.0}}}fn test(){let A=Foo(123);let b:i32=A.test();}

如您所见,我们有示例的板条箱名称->;结构A->;impl块例如::A->;函数名测试。

i32示例::A::<;impl示例::Foo>;::test(const struct example::Foo&;const self){i32 D.85;D.85=self->;0;返回D.85;}void example::test(){const struct example::Foo a;const i32 b;try{a.0=123;b=example::a:<;impl example::Foo>;::test(&;a);}最后{a={CLOBBER};}

我们在cfg扩展中添加了对any、all和not谓词的支持,因此在本例中,这确保了为all谓词指定A和B。

struct Foo;impl Foo{#[cfg(all(A,B))]fn test(&;self){}fn main(){let A=Foo;A.test()}

Rust允许我们为配置扩展指定键值对,这主要与主机/os/cpu选项有关,例如os=“linux”,但下面是一个示例,您可以在编译器资源管理器中尝试。

struct Foo;impl Foo{#[cfg(A=";B";)]fn test(&;self){}fn main(){let a=Foo;a.test();}

不带任何选项的Inline类似于C风格的Inline关键字,它向编译器提示此函数是内联的良好候选函数。Inline always可以通过GCC的Inline always属性实现:https://gcc.gnu.org/onlinedocs/gcc/Inline.html.最后,我们永远不能将函数标记为DECL_不可线性。一个区别是,内联优化需要启用优化。因此,当在-O0编译时,不会发生内联,任何级别大于此级别,都将强制执行内联传递。

方法解析方面的工作一直在稳步进行,我们现在支持deref_mut lang项目,因此对于需要a&;我们尝试从任何相关的接收者处获取所需的间接引用。

外部人员";C";{fn printf(s:*const i8,…);}#[lang=";deref";]pub trait Deref{type Target;fn Deref(&;self)->self::Target;}#[lang=";deref#mut";]pub trait DerefMut:Deref{fn Deref_mut(&;mut self)>;&;mut self::Target;}impl<;T>;德雷夫;T{type Target=T;fn-deref(&;self)>;&;T{*self}impl<;T>;德雷夫;mut T{type Target=T;fn deref(&;self)>;&;T{*self}发布结构条(i32);impl Bar{pub fn foobar(&;mut self)->i32{self.0}pub struct Foo<;T>;(T) );impl<;T>;为Foo<;T>;{type Target=T;fn deref(&;self)>;&;self::Target{&;self.0}}impl<;T>;对Foo<;T>;{fn deref_mut(&;mut self)>;&;mut self::Target{safe{let a=&#34;mut_deref\n\0";;let b=a as*const str;let c=b as*const i8;printf(c);}&;莫特·赛尔夫。0}pub fn main()->;i32{let bar=bar(123);let mut foo:foo<;bar>;=foo(bar);let foobar=foo.foobar();foobar-123}

我们已经合并了我们的第一个宏观扩张通道。这里采用的方法是,我们重用现有的解析器来调用作为MacroFragmentType枚举的一部分指定的适当函数。如果解析器在解析该项时没有错误,那么它必须是匹配的。然后,一旦我们匹配了一个规则,我们就有了每个片段匹配的令牌开始/结束偏移的映射,然后用它来调整和创建宏规则定义的新令牌流,这样当我们将其提供给解析器时,令牌就已经被替换了。生成的表达式或项随后附加到相应的宏调用,然后解析名称并用于hir降低。

在这个例子中,宏有两个规则,所以我们证明我们匹配了适当的规则,并分别转录了它。

宏规则!添加{($a:expr,$b:expr)=>;{$a+$b};($a:expr)=>;{$a};}fn main()->;i32{let mut x=add!(1);x+=add!(2,3);x-6}

宏规则!测试{($a:ident,$b:ty)=>;{struct$a($b);};}测验(富,i32);fn main()->;i32{let a=Foo(123);a.0-123}

这里我们考虑宏调用的上下文,并将其解析为AST::Items。如果未能匹配规则,编译器错误如下所示:

<;来源>;:11:17:错误:未能匹配宏1 |宏|规则中的任何规则!加{| ~..11 |让mut x=add!(1,2,3)|^

当转录规则实际上没有完全使用时,添加了更多错误处理,例如:

在rust中,范围被转换为结构,因此,指定某种约束的语法片段实际上是可以赋值和操作的。这是我们支持切片过程中的一个组成部分。

#[lang=";RangeFull";]pub struct RangeFull#[lang=";范围";]pub struct Range<;Idx>;{pub start:Idx,pub end:Idx,}#[lang=";RangeFrom";]pub struct RangeFrom<;Idx>;{pub start:Idx,}#[lang=";RangeTo";]酒吧结构RangeTo<;Idx>;{pub end:Idx,}#[lang=";range inclusive";]pub struct range inclusive<;Idx>;{pub start:Idx,pub end:Idx,}fn test(){let a=1..2;//range let b=1..;//range from let c=..3;//range to let d=0..=2;//range inclusive}

支持切片的另一个构建块是支持索引lang item core::ops::index的能力,这样一个范围就可以作为参数,core::slice::index中的代码实际上可以成为从数组中获取切片的起点。

#[lang=";索引";]特质指数<;Idx>;{type Output;fn index(&;self,index:Idx)->;&;self::Output;}struct Foo(i32,i32);impl索引<;isize>;对于Foo{type Output=i32;fn index(&;self,index:isize)->;i32{let a=Foo(1,2);let b=a[0];let c=a[1];c-b-1}

宏匹配臂可以包含重复运算符,它指示传递单个标记或元变量的多个实例的可能性。

您可以使用Kleene运算符表示此类重复:有三种变体可用,?,+及*。每一个都对应于与运算符关联的标记数量的不同界限,类似于正则表达式。

宏规则!kleene{($a:ident$(,)?)=>;{{};($($i:literal tok)+)=>;{{ }}; ($($e:expr)*)=>;{{ }};}

单数标识符,带有零个或一个逗号(模式:<;逗号>;,kleene运算符:?(0->;1))

一个或多个文本后跟分隔符tok(模式$i:literal tok,kleene运算符:+(1->;+inf))

实现宏重复的第一步是匹配给定给用户的实际模式。我们现在能够匹配简单的重复,但仍有一些限制和缺陷。例如,Rust引用指定了在片段说明符之后使用的有效分隔符,我们还没有检查这些分隔符。例如,禁止在$<>;:expr说明符,因为这可能会导致歧义:表达式后唯一允许的分隔符是=>&书信电报;逗号>;或

一旦匹配了这些重复模式,就很容易计算出用户给出了多少重复模式。我们将这些数据与片段的其余部分一起存储,以确保在转录时将所述模式扩展正确的次数。

我们将匹配重复3次,并将重复量3归因于$e元变量。

在匹配这些重复之后,我们可以递归地扩展模式中包含的所有标记。

再次考虑前面的声明和调用,我们可以将以下模式解析为要展开的模式:

然后,该模式被递归地扩展,就好像它是一个常规的宏调用一样。为了确保每个元变量得到正确的扩展,我们只给新的替代上下文提供匹配片段的子集。

宏规则!lit_plus_tok{($($e:literal tok)*)=>;{}lit_plus_tok!(";rustc";tok';v';tok 1.59 tok);//原始匹配片段:{";lit";:[";rustc";,';v';,1.59]}//然后我们用{";lit";:[";rustc";]曾经与{";lit";:[';v';]},//最后一次是{";lit";:[1.59]},

同样,我们还没有实现某些限制:一些说明符急切地得到扩展,而一些保留在用户输入的表单下。

同样,并不是所有的重复模式都被恰当地覆盖。为了全面、正确地实施,有些问题仍有待解决。

为了实现某些特定的行为,rust标准库需要在编译器中内置一些宏。你可以在这里找到完整的清单。

GCCR的实施应考虑到标准rust库的编译,因为core和std都依赖于它们。

这些宏在核心库中定义为空,它们的转录器在编译器中作为一个简单函数提供。我们在GCCR中实现这些内置函数,作为返回抽象语法树片段的函数,这些片段在宏扩展阶段插入,然后与用户代码的其余部分一起降低到中间表示形式。

我们面前有一长串宏,其中一些应该可以轻松实现。如果你有兴趣参与进来,我们已经打开了关于内置宏的3个好的第一个问题,以及如何解决它们的详细指南。

非常感谢bjorn3对内置宏及其实现细节的帮助。