重定位已关闭评论
94 次浏览

A+

所属分类：linux技术

摘要

链接脚本的输出段格式描述：解析：
一个输出段有两个地址：VA和LMA，分别是虚拟地址和加载器地址
虚拟存储地址，是运行时段所在的地址，可以理解为运行地址。
加载存储器地址是加载时段所在的地址，可以理解为加载地址。

便宜好用的国外VPS推荐

重定位相关的几个重要概念：

加载地址：存储代码的物理地址，在GNU链接脚本里称为LMA。例如，ARM64处理器上电复位后是从异常向量表开始取第一条指令的，所以通常这个地方存放代码最开始的部分，如异常向量表的处理代码
运行地址：程序运行时的地址，在GNU链接脚本里，称为VMA，即虚拟地址
链接地址：在编译，链接时指定的地址，程序员设想将来程序要运行的地址。程序中所有的标号的地址在链接后就确定了，不管程序在哪里运行都不会改变。objdump工具可以进行反汇编，查看的就是链接地址。

链接脚本的输出段格式描述：

链接脚本输出段格式

section [address] [(type)] : 	[AT(lma)] 	[ALIGN(section_align)] 	[constraint] 	{ 		output-section-command 		output-section-command 		... 	} [>region] [AT>lam_regin] [:phdr :phdr ...] [=fillexp]

解析：

section: 段的名字，例如代码段.text，数据段.data等
address: 虚拟地址
type: 输出段的属性
lma：加载地址
ALIGN：对齐要求
output-section-command：描述输入端如何映射到输出段
region：特定的内存区域
phdr：特定的程序段

一个输出段有两个地址：VA和LMA，分别是虚拟地址和加载器地址
虚拟存储地址，是运行时段所在的地址，可以理解为运行地址。
加载存储器地址是加载时段所在的地址，可以理解为加载地址。

如果没有用AT显式指定LMA，那么LMA=VA，加载地址等于虚拟地址。
嵌入式系统中，加载地址经常与虚拟地址不一致，比如映像文件载入到开发板的flash存储中，而bootloader又会将flash中的映像文件复制到SDRAM中（由VA指定）

例子：
通常，为了构建一个基于ROM的映像文件，要设置输出段的虚拟地址和加载地址不一致。映像文件存储在ROM中，运行时需要把映像文件拷贝到RAM中，此时，ROM中的地址就是加载地址，而RAM中的地址就是虚拟地址，即运行地址

一段实例链接脚本

SECTIONS { 	.text 0x1000:  	{ 		*(.text) _etext = .; 	} 	.mdata 0x2000: 	AT (ADDR (.text) + SIZEOF(.text) ) 	{ 		_data = .; 		*(.data); 		_edata = .; 	} 	.bss 0x3000: 	{ 		_bstart = .; 		*(.bss) *(COMMON); 		_bend = .; 	} }

这里创建了三个段：
代码段的虚拟地址和加载地址都是0x1000
mdata段为用户自定义的数据段，虚拟地址为0x2000，而加载地址为代码段的结尾位置的地址
符号_data的值为0x2000
bss段的虚拟地址为0x3000，加载地址没有指定，所以和加载地址一致。

由于mdata段的虚拟地址和加载地址不一致，所以程序的初始化代码应该把.mdata段从ROM中加载地址处复制到SDRAM中的虚拟地址处。

点击查看代码

#include <stdio.h> #include <sys/types.h> #include <unistd.h>  extern unsigned long _etext; extern unsigned long _data; extern unsigned long _edata; extern unsigned long _bstart; extern unsigned long _bend;  unsigned long *src = &_etext; unsigned long *dst = &_data; unsigned long *src_end = &_edata;  unsigned long *bss_start = &_bstart; unsigned long *bss_end = &_bend;  /*  * @brief: copy mdata contain from rom space to sdram space  * @args: none  * @ret:  *      non-zero if work abnormally  *      zero if work successfully  *  * */ int load_mdata_from_rom_to_sdram() {   if (src == NULL || dst == NULL) {     return -1;   }    if (src == dst) {     return 0;   }    while (dst < src_end)     *dst++ = *src++;    return 0; }  /*  * @brief: init bss section by fill this area with 0  * @args: none  * @ret:  *       non-zero if init failed  *       zero if init ok  */ int bss_init() {   for (unsigned long *cur = bss_start; cur < bss_end; cur++) {     *cur = 0;   }    return 0; }  int main() {   load_mdata_from_rom_to_sdram();   bss_init();    return 0; }

链接地址和运行地址何时不同，何时相同

链接地址等于运行地址和加载地址

树莓派4B上电以后，首先运行芯片内部的固件(引导程序bootcode.bin和GPU的固件start4.elf)，然后把os.bin加载到0x80000地址处，并且跳转过去执行。

点击查看代码

SECTIONS { 	. = 0x80000; 	.text.boot : { *(text.boot) } 	.text : { *(.text) } 	.rodata : { *(.rodata) } 	.data : { *(.data) } 	. = ALIGH(0x8) 	bss_begin = .; 	.bss : { *(.bss) } 	bss_end = .; }

在这个案例中，链接地址是0x80000开始，此时加载地址也是0x80000, 运行地址也是从0x80000开始的。

链接地址不等于加载地址

点击查看代码

TEXT_ROM = 0x90000;  SECTIONS { 	. = 0x80000, 	 	_text_boot = .; 	.text.boot : { *(.text.boot) } 	_etext_boot = .; 	 	_text = .; 	.text : AT(TEXT_ROM) 	{ 		*(.text) 	} 	_etext = .; }

在13行使用AT表面代码段的加载地址为0x90000，这样代码段的加载地址和链接地址就不一样。，但是链接地址和运行地址一样(都是_text符号表示的地址)。如果通过objdump查询链接地址，可能发现text所在位置为0x80088, 但是load address在0x90000

这种情况下，如果想要正常运行os.bin的代码，需要把代码段从加载地址复制到链接地址

链接地址不等于运行地址

使能OS的MMU之后，可以将DDR内存，映射到操作系统内核空间。
案例脚本：

点击查看代码

OUTPUT_ARCH(aarch64) ENTRY(_start)  SECTIONS  { 	. = 0xffff000010080000; 	_text_boot = .; 	.text.boot : { 		*(.text.boot) 	} 	 	_etext_boot = .; 	_text = .; 	.text : { 	*(.text)  	} 	_etext = .; 	... }

第六行首先使用位置计数器，把代码段的链接地址设置为0xffff000010080000，这是内核空间的一个地址(真实DDR可能没有这么大的地址空间，通过MMU提供了一个4G大小的虚拟地址空间)。树莓派4B上电后，首先会让os.bin加载到0x80000地址处。此时运行地址和加载地址都是0x80000，但是链接地址是0xffff000010080000。

在初始化代码中，需要初始化MMU，建立页表映射，把DDR内存映射到内核地址空间，然后做一次重定位操作，让CPU的运行地址重定位到链接地址上，这样就可以用链接地址，经过页表的映射，找到真实的DDR地址。这在uboot和linux中是很常见的操作。

重定位

假设有一块开发板，芯片内部有SRAM，其实地址为0x0，DDR地址为0x40000000。
一般来说代码会存储在Nor Flash或Nand Flash中，芯片内部的bootrom会把开始的小部分代码，load到SRAM中，然后从SRAM中取值执行。由于Uboot镜像太大，SRAM不够存，所以Uboot镜像必须放在DDR内存里。
通常来说编译Uboot时链接地址都会设置到DDR内存中，也就是0x40000000地址处。运行地址和链接地址就不一样了，运行地址是SRAM的0X0，而链接地址是DDR的0x40000000，程序还能运行吗？
可以运行，只不过需要位置无关码的支持。

位置无关码和位置有关码，是指一部分是否和内存地址有关的代码。位置无关码是与内存地址无关的代码，无论运行地址是否与链接地址相等，这种代码都可以正常执行。汇编指令BL, B, MOV等指令，就是位置无关指令，无论加载到哪个位置，都可以正常运行
位置有关码是和内存地址有关的代码，这种代码一般涉及的地址，都是决定地址，和当前的PC值无关。ARM汇编里面通过绝对跳转指令修改PC值为当前的链接地址的值：

ldr pc, =on_sram @跳转到SDRAM上继续执行

这种通过LDR指令跳转到链接地址并执行的操作，让运行地址等于链接地址，就被叫做重定位。程序被重定位之前只能执行一些位置无关码。

为什么要刻意地设置加载地址，运行地址，以及链接地址不一样？

如果所有的代码都在ROM中执行，那么运行地址和链接地址与加载地址都是同一个地址。但现实是很多硬件上，都会把程序加载到DDR内存中运行，DDR的访问速度比ROM快得多，而且容量也很大，所以设置链接地址在DDR内存中，而程序的加载地址在ROM中，这两个地址是不相同的。

如何让程序能在链接地址上运行呢？

程序的加载地址等于ROM的基地址（或者在SRAM上），而链接地址等于DDR内存中某一处的起始地址（暂且称为ram_start）。
程序先从ROM或者SRAM启动，这块代码中要实现程序复制功能（把整个rom代码段复制到ddr上），然后通过LDR指令跳转到DDR内存上，也就是在链接地址上执行了（B指令无法实现这个跳转，因为它是PC相关的）。

上述重定位过程在uboot中实现，以下是概览图

Uboot需要引导linux内核，则需要把Linux内核Image复制到DDR内存中，然后跳转到内核入口地址处(stext)。
当跳转到内核入口地址stext函数时，程序运行在运行地址上，即DDR内存的地址。但是我们从vmlinux中看到stext函数的链接地址是虚拟地址。内核启动汇编代码也需要一个重定位过程。这个重定位过程在__primarty_switch函数中完成，__primay_switch汇编函数的主要功能是初始化MMU和实现重定位。

启动MMU之后，通过LDR指令把__primary_switched函数的链接地址加载到x8寄存器中，通过BR指令跳转到__primary_switched函数的链接地址处，从而实现重定位。

点击查看代码

// <linux5.0/arch/arm64/kernel/head.S>   __primary_switch: 	adrp	x1, init_pg_dir 	bl		__enable_mmu	//开启MMU后，CPU用的是虚拟地址，所以需要重定位 	 	ldr		x8, =__primary_switched		//重定位 	adrp	x0,	__PHYS_OFFSET 	br		x8

重定位

便宜好用的国外VPS推荐

重定位相关的几个重要概念：

链接地址和运行地址何时不同，何时相同

链接地址等于运行地址和加载地址

链接地址 不等于 加载地址

链接地址 不等于 运行地址

重定位

为什么要刻意地设置加载地址，运行地址，以及链接地址不一样？

如何让程序能在链接地址上运行呢？

链接地址不等于加载地址

链接地址不等于运行地址