NetBSD代码研究

2020-06-15 20:22:51

了解引导过程如何工作以及NetBSD如何处理引导过程的有用手册页如下：

fdisk(8)：包含有关MBR如何工作、NetBSD如何处理它以及NetBSD采取的不同引导阶段的说明。

引导(8)：关于引导过程如何工作的概述。特别是最后几个阶段(比如由/boot程序完成的阶段)以及如何修改引导参数。

在期望具有MBR分区的磁盘的系统上(请参见fdisk(8))，disklabel将在类型为169(NetBSD)的MBR标签的前8k和物理磁盘的前8k中查找标签，并在请求时更新标签。在其他系统上，磁盘标签将只查看磁盘的开头。写入标签的偏移量也取决于系统。

这些手册页介绍了NetBSD的引导程序。与FreeBSD(上面的链接)类似，NetBSD也将其划分为不同的程序：

第一个程序是一个非常小的程序，必须适合MBR(请记住，我们谈论的是i386)。它是/usr/mdec/mbr。然后，它将加载并将控制权传递给第二个程序，即bootxx。

因此，第二个程序是bootxx，位于/usr/mdec/bootxx_FSTYPE.TODO：它安装在哪里？第三个是一个大得多的程序(这里是52kb)/usr/mdec/boot，并复制到/。TODO：这是加载/boot.cfg文件的程序吗？

不过，NetBSD对此的理解略有不同，它从代码区占用了一些空间来填充引导信息。以下是NetBSD对MBR的详细理解：

/**MBR引导扇区。*这由磁盘扇区0中的MBR(主引导记录)和MBR分区的扇区0中的PBR(分区引导记录)使用。*/struct MBR_SECTOR{/*跳转到引导代码的指令。*//*通常为0xE9nnnn或0xEBnn90*/uint8_t MBR_jmpboot[3]；/*OEM名称和版本*/uint8_t MBR_oemname[8]；Union{/*BIOS参数块*/struct MBR_bpbFAT12 bpb12；struct MBR_bpbFAT16 bpb16；struct MBR_bpbFAT32 bpb32；}。/*MBR_BOOTSEL MAGIC*/uint16_t MBR_BOOTSEL_MAGIC；/*MBR分区表*/struct MBR_PARTITION MBR_PARTS[MBR_PART_COUNT]；/*MBR MAGIC(0xaa55)*/uint16_t MBR_MAGIC；}__PACKED；

您会意识到，在结构上，留给bootstrap程序的空间比我们刚才预测的要小得多。这是因为在结构的顶部，就在MBR_BOOTCODE参数之前声明了其他字段。在对MBR进行编程时，这些字段的区别实际上是无关紧要的，它们实际上用于引导程序。我们了解，通过查看结构顶部的注释，该结构也可以用于MBR和PBR。这些奇怪的区域对于我们稍后将要看到的PBR非常重要。

它有一些参数，比如将有效分区更改为引导之前的超时，最后是mbrbs_nametab数组，该数组允许命名最多四个分区(MBR_PART_COUNT=4)、9个字符宽度(MBR_BS_PARTNAMESIZE=8，+1表示空字符)。这些常量在同一文件中定义。

状态(位7设置，即0x40，表示激活或可引导。一些旧的MBR支持0x80。

这就是所有魔力开始的地方。mbr.S程序是稍后汇编并存储在磁盘的前512字节的汇编代码。MBR读取并执行它。该程序找到NetBSD分区，读取其中的第一个扇区(保存下一个引导程序)，然后执行它。

第一个程序位于src/sys/arch/i386/stand/mbr/mbr.S。这是稍后将在/usr/mdec/mbr和/usr/mdec/mbr生成二进制程序和变体的代码，但我们现在将学习最基本的版本。即是说，我们认为：

BOOTSEL是未定义的：我们对研究让用户更改要从哪个驱动器加载的代码不感兴趣。暗示第一个硬盘。

BOOT_EXTENDED未定义：我们对研究允许从扩展分区引导的代码不感兴趣。

COM_PORT未定义：我们对研究允许我们从串行线启动的代码不感兴趣。

定义了NO_BANNER：我们对研究向用户显示消息的代码不感兴趣。

NO_CHS未定义：因此所有读取都处于CHS模式。尽管它使事情变得更加困难，但是default/usr/mdec/mbr并不具备这一点(我相信它保持了向后兼容性)。

有关第一个程序及其不同风格的信息，建议查看MBR(8)手册页。

您可能希望从mbr.S源代码编译MBR程序。为此，首先使用顶级build.sh脚本编译工具：

它将首先编译一组构建NetBSD所需的工具。然后，cd到MBR Makefile所在的目录：

在我的例子中，有必要设置MACHINE_GNU_ARCH=i486，因为Make查找的是以i386为前缀的二进制文件。

这将创建mbr.o中间文件和mbrinal文件，这是可以在/usr/mdec/mbr中找到的最终文件。

MBR通常不会更新。如果用户想要更改MBR程序，则需要手动完成(sysinst也会这样做)。但是有一个非常有用的fdisk(8)实用程序仅用于更新分区表。

回到mbr.S程序，第一行有与程序一起使用的常量。稍后，我们开始节目(刚进入(开始))。entry()只不过是一个宏，在src/sys/arch/i386/include/asm.h中声明。

因此，我们看到entry()只是一个用于插入一些GNU Assembler指令的宏，包括一个指定程序入口点(Start)的标签。

让我们先解释一下MBR代码。BIOS将MBR的前512个字节读入地址0x7c00并执行。但以下代码实际上将这512个字节复制到别处(地址0x8800)并跳转到该地址。为什么？这是因为稍后将在0x7c00[3]中加载引导程序的第二阶段。如果您想了解更多关于MBR部门的信息，以及操作系统是如何处理这一问题和BIOS的，请参阅[BLU2010]。

地址0x8800没有出现在当前程序中的任何地方，但我们知道它，因为所有地址都以引用0x8800为起点，因为这是当前二进制文件将链接到的加载地址。如果您经常了解MBR代码是如何编译的，请看下面的代码片段。确保加载地址已传递给链接器。

LOADADDR=0x8800AFLAGS.mbr.S=${${ACTIVE_CC}=="；clang"；：？-no-integrated-as：}AFLAGS.gpt.S=${${ACTIVE_CC}=="；CLANG"；：？-无集成-AS：}${prog}：${objs}${_MKTARGET_LINK}${cc}-o${prog}.tmp${LDFLAGS}-wl，-ttext，${LOADDR}${objs}@set--$$(${NM}-t d${prog}.tmp|grep'；\<；MBR_SPACE\&。\ECHO"；#${prog}"；${OBJCOPY}-O二进制${prog}.tmp${prog}rm-f${prog}.tmp中有$$1个可用字节。

因此，回到我们的ASM程序，它实际上是从下面的代码进入(开始)开始的。这段代码的作用是复制所有内容。

条目(START)xor%ax、%ax mov%ax、%ss movw$BOOTADDR、%sp mov%ax、%es mov%ax、%ds movw$MBr、%di mov$BOOTADDR+(MBR-START)、%si PUSH%AX/*对于%cs的Lret*/PUSH%di MOVW$(BSS_START-MBR)、%CX REP MOVsb/*重定位代码*/mor

这里使用的汇编程序语法来自GNU汇编程序，因为这是NetBSD项目使用的汇编程序。因此，目标寄存器位于操作的右侧。(http://stackoverflow.com/questions/2397528/mov-src-dest-or-mov-dest-src)。

4.下一行将%sp(堆栈指针)设置为地址0x7c00。BOOTADDR是在当前文件的第77行中使用此值定义的常量。根据[BLU2010](第15页)，第#34；(.)。BIOS喜欢总是将引导扇区加载到地址0x7c00(.)"；，因此我们必须告诉MBR程序我们在哪里：-)。然后，地址0x7c00至0x7e00(512字节)被保留用于该第一个程序。请记住，堆栈是向下增长的([BLU2010]，第17页)，因此到低于0x7c00的地址，从此不会触及我们的代码。

现代操作系统通常将所有这些寄存器指向同一位置，从而有效地禁止了它们的使用。这就是这里正在发生的事情(待办事项：确认)(http://en.wikibooks.org/wiki/X86_Assembly/X86_Architecture#Segment_Registers)。

7.将MBR程序地址移动到%di[7][8]。MBR程序就是我们正在分析的当前块编写的。

movw移动一个16位整数(可以是地址)，即一个字，还有movb、movl和movq操作码。它们分别移动BYTE、DWORD和QWORD。(http://www.programmingforums.org/post119574-5.html)。

一个字节代表8位；一个字代表16位；一个DWORD32位和一个QWORD64位(http://en.wikipedia.org/wiki/Word_%28computer_architecture%29).。

8.$BOOTADDR+(MBR-START)是加载到主存储器中时MBR程序的地址。将此地址移动到%si。记住：它不仅仅是0x7c00+(MBR-0)，而是类似于0x7c00+(MBR-0x8800)，因为这段代码是用加载地址0x8800编译的(正如我们刚才解释的)，所以更改了当前程序中所有地址的偏移量。

11.bss_start在文件末尾定义，包含此程序末尾的地址[9][10]。因此，%cx将具有MBR&34；程序和当前程序结束之间的字节数，并将其用作计数器。

bss_off=0bss_start=.#定义bss(name，size)name=bss_start+bss_off；bss_off=bss_off+size bss(ptn_list，256*4)/*long[]：引导扇区号*/bss(dump_eax_buff，16)bss(bss_end，0)。

我们看到"；bss"；是紧跟在引导程序之后启动的位置，包含以下组件：

13.我们只设置了上面的%di，%si和%cx来调用此操作。我们调用movsb[11]，它将复制地址%sito%di开始的所有字节(每次迭代都会递增)，%cx倍[12][13]。也就是说，它会将所有程序(从MBR标签正下方到程序末尾)复制到当前块之后的地址(就在MBR标签或程序之前)。

14.在步骤11中，我们解释了bss_start具有当前程序结束的地址。bss_end在文件末尾定义。

我们可以看到，bss()是一个用于定义与bss_start相关的变量的宏。因此，bss_end是这个区域的末端，称为bss(TODO：它代表什么？它的目的是什么？)。最后，我们意识到，如果有一个未完成的块，%ch将保存512字节块的数量+1。即向上舍入的512字节块的数量。因此，举几个例子：

bss_end-bss_start+511=511->；511/512=0.998->；%ch=1。

bss_end-bss_start+511=512->；512/512=1.000->；%ch=1。

bss_end-bss_start+511=513->；513/512=1.001->；%ch=2

让我们记住，%ch存储%cx的8个最高有效位，即%cx=%ch*256+%cl。

16.将紧接在当前节目之后的存储区清零，即，将BSS清零。stosw将%ax(零)中的数量复制到从%di开始的内存区域。如果与rep操作码一起使用(这正是我们的情况)，它使用%cx来了解需要重复[14]的次数，但请记住，由于stosw移动字(16位)，%cx将有一半的字节需要写入。例如：假设我们要写入字节0x0 100次。如果我们要使用stosw(而不是stosb)，%ax将为0x0，%cx将仅为50。

这解释了步骤14中的代码。"；bss"；大小是1040字节，(bss_end-bss_start+511)/512是3。但是因为它存储在%ch和%cx=%ch*256+%cl中，所以%cx=3*256+%cl，即%cx=768+%cl。它将是一个小于"；bss&34；大小的数字，但是如果stosw复制的是字而不是字节，它将遍历双倍字节[15]，因此将该区域清零。

17.最后，跳转到MBR地址，我们在步骤10将其值推送到堆栈。

我们将所有剩余的MBR代码移到地址0x8800，将BSS&34；部分(紧跟在当前地址之后)置零，并跳转到MBR代码所在的位置。现在，让我们在MBR所在的地方重新开始！在源代码中，它的编码恰好在我们刚刚研究的代码下面。根据[MBRX86]，这正是典型的引导代码首先要做的。

我们将自己移到一边，因为我们将在地址0x7c00加载下一个程序pbr.s。有些人可能会想：为什么不直接执行这个程序并将pbr.s复制到其他地方呢？我们稍后将看到，在某些情况下可以直接加载pbr.Scan，而不需要像mbr.S这样的前一个程序，因此BIOS会将其加载到0x7c00。我们还需要在那里下载，因为它有所有的地址链接。

/**检查BIOS传递的驱动器号是否正常。一些BIOS可能不会*这样做并传递垃圾。*/mbr：cmpb$MAXDRV，%dl/*依赖于MINDRV为0x80*/jle 1f movb$MINDRV，%dl/*垃圾输入，启动盘0*/1：PUSH%dx/*保存驱动器号*/PUSH%DX/*两次-for err_msg循环*/。

关于这段代码，重要的一点是它使用了本地标签，它们只是由数字组成，跳转到它们是使用后缀f(向前)或b(向后)。http://www.nongnu.org/avr-libc/user-manual/FAQ.html#faq_asmstabs

我们应该注意%dl寄存器。这是加载MBR的驱动器号，根据[MBRX86]，这是BIOS传递给MBR的唯一重要编号。软盘驱动器为0x0、0x1等，硬盘驱动器为0x80、0x81等[18]。

1.如果首先开始比较%dl和$MAXDRV(0x8f)，则可能的最大值(TODO：REFERENCES？)。如果数字小于或等于0x8f，则跳到下一个1标签。如果不是，将0x80(第一个硬盘)强制赋值为%dl。

2.将%dx的值压入堆栈两次。记住%dl存储%dx寄存器的最低位。

当前代码的其余部分是关于串口和打印给用户的消息，我们对此并不感兴趣。

在这段代码的末尾，我们的重要寄存器看起来是一样的，但是堆栈发生了变化。

它只检查%dl寄存器。这是BIOS存储我们从其引导的驱动器号(硬盘、软盘等)的位置。如果它是无效值，则强制0x80(第一个硬盘)。

/**浏览选择器(名称)表，打印用过的条目。**注册用法：*%ax temp*%bx namettab[]引导选择器菜单*%ecx base of'；Extended'；PARTITION*%edX下一个扩展分区*%si消息PTR(ETC)*%此分区的EDI扇区号*%BP parttab[]MBR分区表*/bootsel_menu：movw$nametab，%bx#ifdef boot_Extended xorl%ecx，%ecx/*扩展分区的BASE*/NEXT_EXTENDED：xorl%edX，%edX/*用于下一个扩展分区*/#endif Lea parttab-nametab(%bx)。%al/*分区类型*/#ifdef no_CHS movl 8(%bp)，%edi/*分区扇区号*/#ifdef boot_Extended CMPB$MBR_PTYPE_EXT，%al/*扩展分区*/je 1f CMPB$MBR_PTYPE_EXT_LBA，%al/*扩展LBA分区*/je 1f CMPB$MBR_PTYPE_EXT_LNX，%al/*Linux扩展。%edi/*添加扩展的PTN base*/#endif test%al，%al/*未定义分区*/je 4f CMPB$0x80，(%bp)/*检查活动分区*/jne 3f/*如果没有.。*/#定义活动(4*((KEY_ACTIVE-KEY_DISK1)&；0xff))#ifdef NO_CHS movl%edi，PTN_LIST+ACTIVE/*保存活动PTN的位置*/#ELSE MOV%BP，PTN_LIST+ACTIVE#undef ACTIVE3：#ifdef BOOTSEL CMPB$0，(%bx)/*查看提示*/JZ 4f/*。：'；<；<；8|'；1'；+count*/shl$2，%si/*const+count*4*/#定义const(4*('；：'；<；<；8)+'；1'；-((KEY_PTN1-KEY_DISK1)&；0xff)#ifdef no_chs movl%edi，ptn_list-const(%si)/*要读取的扇区*/#Else mov%bp，ptn_list-const(%si)/*分区信息*/#endif#undef const mov%bx，%si call message_crlf/*PROMPT*/#endif4：add$0x10，%bp add$TABENTRYSIZE，%。

乍一看，这段程序似乎非常令人困惑，但事实并非如此：有些块我们只是打算忽略，因为我们在本节开始时认为有些宏是未定义或定义的。

1.第一行将nametab字符串的地址移动到%bxregister。代码顶部的注释显示nametab[]store"；bootselector Menu"；。让我们来看看姓名标签的定义。

此.ill指令将重复字节0x0，其大小为0x01，n次[19](其中n是MBR_PART_COUNT*(MBR_BS_PARTNAMESIZE+1))。MBR_PART_COUNT和MBR_BS_PARTNAMESIZE在src/sys/sys/bootlock.h中定义。通过BootIntroduction一节我们已经知道，namettab指的是最多4个分区的8个字符宽度的名称，即.full指令保留36个字节。

Fill指令的工作方式类似于循环，方式如下：它的语法是.Fill Count、Size、Value。即重复具有SIZE_SIZE、COUNT次的字节值。有关更多信息，请访问http://web.mit.edu/gnu/doc/html/as_7.html。

有关namettab和bootsel内容如何与MBR相关的更多信息，请查看MBR结构。

根据MBR(8)，bootsel部分(包括namettab字符串)允许一些人选择从哪个分区引导，但是，为了理解该程序的基础知识，我们假设bootsel被禁用，从而生成一个简单得多的MBR程序。

我们还将在下一步使用parttab。它的定义就在下面。

我们看到空字节被重复64次(十六进制0x40)，正好在幻数[20]之前的分区表的大小。

2.下一行以LEA操作码开始。要理解这一行，就足以理解Lea指令与Mov指令相似，但又有一些重要且众多的不同之处。对于此示例，只需知道，在mov地址、寄存器的形式中，当mov将源操作数的存储器地址的内容移动到目标时，lea本身也会移动地址。[21][22]。

此页面提供了有关创建LEA的原因以及如何使用它来循环访问数组条目(获取其地址)的更多详细信息：http://stackoverflow.com/questions/1658294/whats-the-purpose-of-the-lea-instruction。

它还使用相对地址模式。寻址模式在第35页的[BARTLETT2009]中有很好的说明。翻译，下面的表达式：

(请注意，减法是在编译时完成的。因此，在执行代码时，它将类似于x(%bx)，其中x=parttab-nametab。)。

为什么程序员要编写如此复杂的行来将parttab的地址存储在%bp中？如果用户遍历其他分区，则这是循环的第一行。稍后，%bx被更改，程序执行从上面的标签NEXT_EXTENDED返回。由于我们对此不感兴趣，因此在我们的示例中，当前指令等同于：

在继续下一步之前，请注意，从当前块开头的注释来看，%bx存储nametab[]--boot选择器菜单的地址，%bp存储parttab[]--mbrartition菜单的地址。

3.与前面的指令一样，此指令也使用位移来指定地址。4(%bp)部分表示"；采用%bp和4字节的地址，并将结果地址的内容存储在%bp"；中。因为%bp具有分区表的地址，所以%bp+4将指向存储第一个分区的分区类型的字节(请参见Partition Structure表和MBR_SECTOR)。

4.由于no_chs为un.。

http://silas.net.br/codereading/netbsd-code.html

基于随机代码执行的Monero工作证明算法

2020-6-15 15:35

Piranha：一个自动删除陈旧代码的开源工具

2020-6-15 7:34

用封闭图说服经理解决技术债务问题

2020-6-15 5:46

人们是如何使用ed的？

2020-6-14 15:41

tags users