如何使用Cortex-M MPU来提高嵌入式设备的安全性

arm cortex-m 架构于 2004 年推出，是目前市场上最流行的 32 位架构，被大多数（如果不是所有）主要 mcu 制造商采用。cortex-m 从一开始就设计为对 rtos 内核友好：专用的 rtos 滴答计时器、上下文切换处理程序、用 c 编写的中断服务例程、尾链、简单的临界区管理等等。许多 cortex-m mcu 实施都辅以浮点单元（fpu）、dsp 扩展、高度通用的调试端口和内存保护单元（mpu）。
在这个四部分系列的第 2 部分中，让我们看看如何使用 cortex-m mpu 来提高嵌入式设备的安全性。在此处阅读其他三个部分：第 1部分、第 3部分和第 4 部分。
arm cortex-m
2004 年，arm 推出了基于精简指令集计算机（risc）架构的新系列 cpu 内核，称为 cortex-m（m 代表微控制器）。第一个 cortex-m 被称为 cortex-m3，该系列已经发展到包括许多衍生内核：cortex-m0/m0+、cortex-m4、高性能 cortex-m7，以及最近推出的 cortex-m23 和m33 采用 trustzone 安全技术。
cortex-m 处理器系列的程序员模型（见图 1）高度一致。例如，r0 到 r15、psr、control 和 primask 可用于所有 cortex-m 处理器。两个特殊寄存器 - faultmask 和 basepri - 仅在 cortex-m3、cortex-m4、cortex-m7 和 cortex-m33 上可用，浮点寄存器组和浮点状态和控制寄存器（fpscr）在可选浮点内的 cortex-m4、cortex-m7 和 cortex-m33。一些 cortex-m 实现还配备了内存保护单元（mpu）。
【图1 | 基于 armv7-m 的 cpu 寄存器模型。］
在上下文切换期间，rtos 会保存和恢复 cpu 寄存器和 fpu 寄存器（假设处理器配备了一个）。因为 mpu 配置是从表格中获取的，所以我们只需要在任务切换时加载 mpu 寄存器。换句话说，不需要为被切换的任务保存mpu配置。详细信息将在下一节中描述。
cortex-m 特权级别
上电时，cortex-m 以特权模式启动，使其能够访问 cpu 的所有功能。它可以访问任何内存或 i/o 位置，启用/禁用中断，设置嵌套向量中断控制器（nvic），以及配置 fpu 和 mpu，等等。
为了保证系统的安全和可靠，特权模式代码必须保留给经过充分测试且已知可信的代码。由于大多数 rtos 都经过了彻底的测试，因此 rtos 通常被认为是受信任的，而大多数应用程序代码则不是。这种做法很少有例外。例如，通常假定 isr 是受信任的，因此也可以在特权模式下运行，只要这些 isr 不被滥用并尽可能短。这是大多数 rtos 供应商的典型建议。
可以使应用程序代码以非特权模式在 cortex-m 上运行，从而限制代码可以执行的操作。具体来说，非特权模式会阻止代码禁用中断、更改嵌套向量中断控制器（nvic）的设置、将模式改回特权模式以及更改 mpu 设置以及其他一些事情。这是一个理想的特性，因为我们不希望不受信任的代码赋予自己特权，从而改变系统设计者实施的保护。
由于 cpu 总是以特权模式启动，因此需要从一开始就创建任务以在非特权模式下运行，或者在启动后不久切换到非特权模式（通过调用 api）。一旦进入非特权模式，cpu 只能在服务中断或异常时切换回特权模式。
svc 处理程序
由于非特权代码无法通过 cpu 或 nvic 禁用中断，因此应用程序代码被迫使用 rtos 服务来访问共享资源。因为 rtos 服务需要在特权模式下运行（在关键部分禁用中断），非特权任务必须通过 cortex-m 上称为 supervisor call （svc）的特殊机制才能切换回特权模式。svc 的行为类似于中断，但由一条名为 svc 的 cpu 指令调用。这也称为软件中断。
在 cortex-m 上，svc 指令使用一个 8 位参数来指定调用者想要执行的 256 个可能的 rtos 函数（或服务）中的哪一个。系统设计者决定哪些 rtos 服务应该对非特权代码可用。例如，您可能不希望允许非特权任务终止另一个任务（或它本身）。此外，这些服务都不允许禁用中断，因为这会破坏在非特权模式下运行代码的原因之一。一旦被调用，svc 指令将引导至称为 svc 处理程序的异常处理程序。
这个过程如图 2 所示。（1）一些非特权代码执行 svc #5 以等待互斥体。（2） svc指令强制svc异常处理程序执行。该行为与生成中断时相同。svc 处理程序提取参数（即值 5）并使用该参数将（3）索引到 svc 跳转表中。（4）执行所需的 rtos 服务（特权模式），完成后，rtos 返回到非特权代码。
svc 处理程序是 rtos 的一部分，因此您不必担心实现它。事实上，无论您的任务是在特权模式还是非特权模式下运行，您的应用程序代码都会调用相同的 rtos api。
通过 svc 处理程序需要付出代价：额外的代码和 cpu 周期。在 cortex-m3 上，svc 处理程序添加了大约 1 kb 的代码并执行 75 到 125 条 cpu 指令来执行。因此，与从特权模式调用相同的 rtos 服务相比，由非特权模式调用的任何 rtos 服务都需要更多的处理时间。
【图2 | 限制来自非特权代码的 cpu、nvic 和 mpu 访问。］
在非特权模式下运行代码还可以防止用户代码禁用中断，从而减少锁定系统的机会。当然，如果用户代码进入无限循环，锁定仍然可能发生，尤其是在高优先级任务或 isr 中发生这种情况时。但是，在这种情况下，可以通过使用看门狗来恢复锁定。
附带说明一下，如果非特权任务尝试通过 nvic 禁用中断，cortex-m 会生成故障（总线故障）。您的应用程序代码需要考虑到这一点。
在非特权模式下运行仍然不会阻止应用程序代码访问任何内存位置和外围设备或阻止代码在 ram 之外执行。这就是 mpu 的用武之地。
armv7-m 架构中的 cortex-m mpu
cortex-m（假设为 armv7-m）上的 mpu 是一种设备，它允许进程访问多达八（8）或十六（16）个内存或外围区域（取决于 mcu 实现）。每个区域的位置和大小是可配置的。每个区域的大小必须是 2 的幂的倍数，但不能小于 32 字节。此外，区域的基地址必须与区域大小的整数倍值对齐。因此，如果该区域为 8k 字节，则该区域必须在 8k 边界上对齐。由于 mpu 中可用的区域相对较少，因此区域通常用于限制对 ram 和外围设备的访问，而不是太多代码。但是，必须使用至少一个区域来提供对代码空间的访问。
组织内存的一种方便方法是将进程所需的 ram 分组到一个连续的块中，如图 3 所示。每个进程都将以类似的方式设置。进程 a 的扩展视图显示它由四个任务组成，每个任务都有自己的堆栈。进程 a 还管理一个外围设备。空白代表可能由于 mpu 的对齐限制而未使用的内存或 i/o 空间。
【图3 | 按进程对区域进行分组。］
f3（1）需要一个 mpu 区域来提供对代码空间的访问。该区域可以设置为只允许访问与进程关联的代码，但是当一个进程与其他进程共享代码（即库）时，有时可能会出现问题。
f3（2）需要一个 mpu 区域来允许进程内的所有任务访问分配给进程的外围设备。例如，如果进程 a 管理一个以太网控制器，则该区域必须允许访问与该设备关联的所有寄存器。
f3（3） mpu 区域用于访问分配给进程的所有 ram。这里假设进程全局变量和进程堆由进程内的所有任务共享。附带说明一下，不可能使用所有进程都可以使用的全局堆，因为您无法设置 mpu 表来将一个进程的动态分配内存与另一个进程的动态分配内存分开。
f3（4） mpu 区域用于 redzone 堆栈检查。事实上，我们只需要一个区域来覆盖一个进程中的所有任务堆栈，因为我们只需要在上下文切换期间移动 redzone。然而，这意味着每个任务将需要一个稍微不同的 mpu 进程表。话虽如此，这在很大程度上取决于 rtos 在上下文切换期间如何管理 mpu。例如，rtos 可能决定只加载 mpu 进程表中的前七个区域，并使用堆栈的基地址加载最后一个区域以设置 redzone。大多数时候，rtos 将任务堆栈的基地址存储在任务的控制块（tcb）中。使用这种方案，一个进程中的所有任务可以共享完全相同的进程表，同时为任务堆栈正确设置 redzone。
f3（5）这表示由于 cortex-m 的 mpu 要求所有区域的大小必须是 2 的二进制幂而导致的未使用 ram。因此，如果进程 a 需要 7 kb 或 ram，则由于进程 a 需要 8 k，因此会丢失 1k。您可能只想增加某些堆栈的大小，而不是浪费该空间在进程中减少堆栈溢出的机会。但是，这样做的缺点是，如果您需要向进程添加功能，那么您可能不记得可以回收多少内存。事实上，从安全关键的角度来看，如果您使用内存配置来限定您的系统，那么您可能无法收回它。因此，最好分配进程所需的堆栈并忍受浪费的空间。
从程序员的角度来看，cortex-m mpu 是一个相当简单的设备，它由 19 个 32 位寄存器组成，如图 4 所示。您会注意到，该模型与图 1 中的模型不同，因为一些寄存器实际上是存储的，因此可以间接寻址，但在内部，它们就是这样出现的。
【图4 | cortex-m mpu 寄存器。］
type寄存器用于决定mpu支持的mpu区域数量，该寄存器的dregion字段会一直读为0、8或16。ctrl寄存器用于配置mpu的某些方面，但实际上，该寄存器用于启用或禁用 mpu。事实上，在更改任何或所有区域的配置之前，应禁用 mpu。rnr编号允许您寻址特定的 mpu 区域。
参考图 4，您会注意到 rbar 的低五位具有固定值。当设置为 1 时，“v 位”表示低 4 位用于指定区域编号。rbar 的高位用于指定区域的基地址。基地址必须在与区域大小匹配的边界上对齐；例如，1 kb 区域必须在 1 kb 边界上对齐。
在大多数情况下，为给定区域设置属性非常简单：
rasr.xn 当区域覆盖 ram 并且您不希望在该区域之外执行代码时，强烈建议您将此位设置为 1。这将捕获来自黑客的代码注入攻击。
rasr.ap：如果该区域覆盖了 ram 区域，那么您将这些位设置为“011”，如果该区域覆盖 rom，则将该字段设置为“110”。
rasr.tex scb 图 4 显示了基于内存区域所在位置的这些位的典型值。
rasr.srd 此字段允许您将区域细分为八个相等的部分。此功能可以大大减少内存浪费。例如，一个 16 kb 的区域有八个 2 kb 的子区域，因此如果一个进程只需要 5 kb（3 个子区域），那么您可以禁用其中的五个子区域并将它们分配给不同的进程。
rasr.size 这个字段设置起来有点复杂，因为它需要一些人工干预，并专门查看链接器映射文件以确定两个大小属性的编码二进制幂。
rasr.en 该位启用（1）或禁用（0）区域。如果您不需要所有八个区域，则必须禁用该区域，以免无意中启用来自不同进程的区域。
清单 1 显示了加载所有八个 mpu 区域的优化函数的汇编语言代码。我将此作为一个示例，说明我们可以如何有效地更改 mpu 配置，但这不是您必须担心的事情。确定管理 mpu 的最佳方式确实是 rtos 的责任。但是，您需要遵循 rtos 指南，了解如何为每个任务设置 mpu 进程表。对于这个特定的实现，您需要创建一个 mpu 进程表来分配所有八个区域，即使使用的区域更少。该函数的原型是：
void os_mpu_processset （arm_mpu_region_t *p_process）;
p_process 是指向包含八对 rbar 和 rasr 值的 mpu 进程表的指针。arm_mpu_region_t 是 arm 的 cortex 微控制器软件接口标准（cmsis） 3定义的数据类型，声明如下：
typedef struct
{
uint32_t rbar; // region base address
uint32_t rasr; // region attributes （type， region size， enable， etc.）
} arm_mpu_region_t;
因此，对于每个任务，您需要声明一个包含八个条目的 arm_mpu_region_t 数组，如下所示：
请注意，最后一个条目包含任务堆栈的基地址，并且还假定 redzone 大小为 32 字节。
［清单 1 | 配置所有 8 个 mpu 区域。］
概括
cortex-m 中的 mpu 是一个相当简单的设备。rtos 负责在每次上下文切换时配置 mpu。但是，为应用程序设置 mpu 进程表是应用程序开发人员的责任。如果 rtos 为每个任务设置了 redzone，则一个进程中的任务可以共享同一个 mpu 进程表。
要让应用程序在 mpu 上运行，仍然需要注意一些事项。具体来说，如何按进程对 ram 进行分组？一个进程如何与另一个进程通信？如果任务访问其分配的内存空间之外的内存或外围设备会发生什么？除了任务栈，内核对象是否应该分配在进程内存空间中？我们将在第 3 部分解决这些问题。

手提式D类扩音器,Handheld class D amplifier
小米手机MIUI12内测全新关机按钮界面
电感耦合等离子体光谱仪的原理和优势
聚合行业数据资源四维图新CIM+智慧交通赋能“双智”建设
多架跟踪面密度测量仪的工作原理是什么
如何使用Cortex-M MPU来提高嵌入式设备的安全性
中国移动以基石投资者身份参与小米IPO
探索GAN的景观，并讨论常见的陷阱和可重复性等问题
直线马达激光打标助力无标签风潮
工业排污口多参数浮标水质在线监测
我国集成电路产业已在核心技术上取得突破，芯片设计水平提升2代
美国国际贸易会对SK Innovation发出10年禁令特斯拉1月在中国销量大跌
iPhone8什么时候上市最新消息：比小米MIX更惊艳这就是苹果iPhone8的真机照
触控板和触摸屏是否为笔记本电脑真的需要的
最逼真玻璃后盖iphone8渲染图曝光，iphone4放大版
闪光的未必都是金子！仔细阅读相关数据手册数据，正确选择部件
ASML扩产EUV与DUV设备
网易有钱 App 已关闭在线充值服务，全面停止运营关闭服务器
常用功率器件MOSFET的基础知识介绍
什么是汽车芯片汽车芯片是做什么的