XIP(eXecute In Place)

1.什么是XIP

eXecute In Place,即芯片内执行、就地执行,是指CPU直接从存储器中读取程序代码执行,而不用再读到内存中。应用程序可以直接在flash闪存内运行,不必再把代码读到系统RAM中。

​ flash内执行是指nor flash不需要初始化,可以直接在flash内执行代码。但往往只执行部分代码,比如初始化RAM。好处即是程序代码无需占用内存,减少内存的要求。

​ XIP是复杂性和速度的权衡,而这就意味着XIP通常仅用于Bios或RAM极度短缺的情况。

  • 注意:片内执行不是说程序在存储器内执行!

​ Nor Flash能在芯片内执行,指的是CPU能够直接从Nor flash中取指令,供后面的译码器和执行器来使用。可以理解为:在这一时刻,Nor Flash实现了Memory的功能

2.如何实现XIP

​ 为实现就地执行,必须满足几个条件:

  1. 存储器必须提供与内存相似的接口给CPU。

  2. 该接口必须提供足够快的读取操作,并具有随机访问模式。

  3. 如有文件系统,则需要提供合适的映射功能

  4. 程序链接时需要知道存储器的地址或地址与位置无关。

  5. 程序不能修改已加载映像中的数据。

​ 因为NOR FlashEEPROM通常能满足上述要求,所以其可以XIP。

3.为什么Nor Flash可以实现XIP,Nand flash不行

3.0 注意

​ Nand只是不适合做XIP,但并不是不能做XIP。当解决下列问题时,Nand也可以实现XIP。

3.1.嵌入式中代码的执行方式:

​ 嵌入式系统中代码的执行方式主要有3种:

(1)完全映射:嵌入式系统程序运行时,将所有代码从非易失存储器(Flash、ROM等)复制到RAM中运行。

(2)按需分页:只复制部分代码到RAM中,这种方法对RAM中的页进行导入/导出管理,如果访问位于虚拟内存中但不在物理RAM中会产生页错位,这时才将代码和数据映射到RAM中。

(3)XIP:在系统启动时,不将代码复制到RAM,而是直接在非易失性存储位置执行RAM中只存放需要不断变化的数据部分

  • 如下图所示:

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-7YLryT8H-1655190620885)(11.XIP%EF%BC%88eXecute%20In%20Place%EF%BC%89.assets/image-20220606172624732.png)]

​ Nor flash和rom的读取速度为百ns级别(约100ns),比较适合XIP。而Nand flash的读取操作是基于扇区的,速度相对很慢(us级),因此不适合实现XIP。

​ 不过Nand flash的写入速度比Nor的快,更适合做存储和下载系统。

3.2.芯片的结构不同

​ NOR flash之所以可以片内执行,就是因为他符合CPU去指令译码执行的要求。CPU送一个地址出来,NORflash就能给一个数据让CPU执行,中间不需要额外的处理操作。
​ NAND flash不一样,是因为Nand flash有地址,数据,命令共用IO口的问题,Cpu把地址发出来之后,并不能直接得到数据,还需要控制线的操作才能完成。就是他没有专用的SRAM接口。

​	[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-lcXnxtzg-1655190620886)(11.XIP%EF%BC%88eXecute%20In%20Place%EF%BC%89.assets/image-20220606174123525.png)]

​ 这张图里的很直观。左边是普通的flash,可以理解成是Nand Flash,CPU想要从Nand Flash中读取数据,必须要先通过在RAM中计算地址,各种时序计算,然后通过MMU转换地址,然后给Nand flash发送命令,注意是命令,不是地址Nand Flash根据命令进行相应的操作,如果是读命令,则返回对应地址的数据到RAM中,如果是写命令,则进行写操作。

​ 而右边的图,是针对Nor Flash的,这个很明显,CPU可以像读内存一样,直接跟Nor flash交互,即可以直接从Nor Flash中取指令,然后交给译码模块和执行模块进行执行,可以说,相比较Nand flash,Nor flash的操作对于CPU来说,简直就像是面对面一样。

3.3 其他原因

​ 一段CODE能够正确的运行,要保证它的CODE是连续(至少是逻辑连续的)且正确的。而在读取Flash时候,容易出现位翻转(bitconvert)。NAND的出现几率要比NorFlash大得多。这个问题在Flash存储关键文件时是致命的,所以在使用NandFlash时建议同时使用EDC/ECC等校验算法。

​ 但是,如果能保证不出错,也还是可以进行XIP的。

4.系统引导时的XIP

​ 通常,Bios引导程序是一个XIP程序,它链接时会指定从flash芯片 power on后的映射地址开始运行,完成相关设置后,把后续的引导程序或操作系统内核加载进RAM。

​ 在这初始化期间,可写存储器可能不可用,所有的计算都必须在CPU寄存器中执行。因此,Bios阶段的引导程序通常以汇编编写,提供尽量少的功能。只需要为下一阶段程序的提供正常的执行环境即可。有些处理器也能通过嵌入少量SRAM或者采用CAR方式(将Cache用作RAM)来实现高级语言程序的运行。

​ 对于内核和引导程序,地址空间通常是内部分配的。为了使用XIP,需要指示链接程序,将不可修改的数据可修改数据放在不同的地址区间,并提供将可修改数据复制到可写内存的机制,使任何程序正常访问这些数据。

5.文件系统的XIP

​ 文件系统的XIP通常难以满足。在没有页表的系统中,整个文件必须连续存储,不能碎片化,而基于闪存的文件系统为了延长生命周期,通常会将数据分配到擦除周期最小,磨损最少的扇区。

​ AXFS (高级XIP文件系统,Advanced XIP File System)是Linux系统上一种较新的文件系统,旨在克服与XIP相关的,特别是在XIP用户空间应用程序方面的某些缺点。

​ 例如,可以将可执行的二进制文件拆分为“ XIP区域”,从而避免了上面提到的碎片限制。

Logo

为开发者提供学习成长、分享交流、生态实践、资源工具等服务,帮助开发者快速成长。

更多推荐