基于单片机ARM实现TCP/IP协议栈的设计

作者:廖日坤,纪越峰,黄小迅
随着计算机网络技术和电子信息技术的迅猛发展,internet的使用越来越普及,信息家电和智能仪表等能够接入iriternet的非pc设备越来越多,将各类电子设备接入internet的需求也越来越大。
电子设备接入internet。有多种解决方案:在51系列单片机上运行经过裁剪的tcp/ip协议栈;使用一些asic实现tcp/ip的芯片,如analog devices推出的internet modem;也可使用嵌入式操作系统自带的tcp/ip协议栈。在某些对网络速度要求不高的领域,可用单片机实现tcp/ip;在对性能要求高的场合,可选择后两种方案。
1 嵌入式tcp/ip的硬件结构
图1是嵌入式tcp/ip系统的硬件结构。其中cs8900a是cirrus logic的网络控制器,芯片内部已设置帧过滤器自动抛弃无效帧,减轻cpu负荷,提高cpu对网络的访问效率。cs8900a工作机制主要是通过设置好其内部各寄存器的值,然后就可以自动开始工作。在网络接口部分,由于是rj45接口,所以须使用e2023传输线变压器对网络中的信号进行转换。
通常tcp/ip协议栈需要大量的ram来存储需要被应答的tcp包。如果在规定时间内未被应答,则重发该tcp包;被应答以后释放。为了减小ram的使用量,当数据包需要重新发送时,如果能够重新产生数据包所需的数据,则可不存储需要被应答的tcp包。
因为网络中数据非常多,如果把所有的数据都读到内存中再判断是否应丢弃帧,则显然效率不高。所以边读取数据边判断而没有一开始就把整个帧全部读到内存中。在程序里定义了帧中各部分的相对地址,可以方便地对帧的各字节寻址。这样的设计是基于提高访问速度考虑的。
在cpu中帧的存放方式,定义packetram变量为存放帧的首地址。图2给出了cpu中tcp/ip的内存划分,以及内存中帧的各个字节的定义和相对位置。
2 嵌入式tcp/ip的优化设计
tcp/ip一般采用c语言或混合汇编。使用可重入函数和一般指针(gellerc pointer)使得程序代码增大,运行速度降低;使用函数指针时,需要手动重建调用树(calltree),或将函数指针调用的函数设置为可重入函数。
2.1 嵌入式tcp/ip输入输出流程
与pc机tcp/ip协议一样,嵌入式tcp/ip采用协议分层的结构:应用层、tcp层、ip层和网络设备接口层。图3描述了输入和输出数据包的流程以及需要调用的函数。
输出时,tcp层先查看unsend队列,发现非空,将数据包插入队列;发现为空,则查看对方窗口是否够大(能够接收这个数据包)。然后,填写tcp头部信息。ip层选择网络设备接口,目的ip和该接口的子网掩码相“与”是否等于子网掩码,然后调用这个接口的output函数来发送。
输入时,timer()函数调用每个接口的input函数。ip层判断ip版本、ip校验和,以及是否应转发数据包,然后根据ip头部的protocol字段将包传给相应的高层处理。tcp层,须判断tcp校验和,并在现有的套接字中查找,判断是否有套接字可接收这个数据包,判断tcp序号是否为希望的,然后更新这个连接的状态(包括释放被应答的数据包和tcp状态机的转化等),调用该套接字的回调函数recv。
2.2 嵌入式tcp/ip的程序结构
tliner函数功能是调用tcptimer处理tcp数据包的重发等功能,调用每个接口的input函数接收到达的数据包。timer函数必须在短时间(一般为20ms)内被调用一次,否则接收数据包和tcp定时等功能将停止。
如图4所示,程序主流程是一个大循环,在循环中处理发送数据包等应用层协议的同时,查询变量btimeout,在定时中断中将btimerout设置为真。应用层在程序流程中反复查询btimerout是否为真,若为真则调用timer(),然后设置btimerout为假。
在使用嵌入式操作系统时,还要注意网络设备驱动函数被重入的问题。以ne2k的以太网卡为例,拷贝数据包到网卡缓存前要先设置寄存器(如起始地址)。如果设置完寄存器以后中断发生且放重入。则寄存器的设置被修改,中断返回以后拷贝将出错。
2.3 嵌入式tcp/ip运行速度优化
tcp/ip发送过程中主要的运算量集中在3部分:应用程序将数据拷贝到ram;计算tcp校验和;将ram中的数据包拷贝到网络设备的发送缓冲区。对于每个字节数据,两次拷贝大致共使用12×2=24个指令周期;计算tcp校验和使用16个指令周期。采用12mhz晶振,最高网络传输速度为25kb/s。
为了提高速度可以采用快速cpu或提高晶振频率。另外,尽量避免使用reentrant函数。reentrant类型的函数比一般函数速度要慢很多,但某些时候为了程序结构的需要必须使用reentrant,这就需要在速度和结构之间作一个选择。选择的方法有:使用“指定存储类型”的指针(memoryr-specific pointer);精简协议栈去除运算量大但是用处不大的功能,目前tcp定时重发时间是固定的,也没有拥塞窗口控制和ip层路由;防止数据包不必要的拷贝;优化计算校验和与内存拷贝函数。
3 tcp/ip的嵌入式实现
tcp/ip协议实现一般以软件方式嵌人到rom中,然后通过网络通信技术与专用嵌入式网关连接,运行tcp/ip协议,并提供tcp/ip到用户的轻型网络的连接和路由功能。
3.1 内存管理方法和无多余数据包拷贝的实现
嵌入式tcp/ip的内存管理可用链表方法,即根据数据包大小分配相应大小的内存块。如图5所示,链表将内存块链接起来,used字段表示该内存块是否正在使用,pstart和pend表示数据部分有效数据的开始地址和结束地址。
分配时,搜索内存链表找到一个没有分配的比所需空间大的内存块,截取所需的大小。该内存块被截取以后可能还有较多剩余,这时将剩余部分从原内存块中分离出来,成为一个新的内存块,并插入链表。释放时,将used置为假。如果pnext或ppre指向的链表单元也是空闲的,则将其与自己合并。以防止内存分片。在协议层之间传送数据包只要传送内存块的起始地址即可。这种内存管理方法空间浪费小,但运算量相对较大。
3.2 整序、重发与窗口控制的实现
使用队列缓存的方式来实现整序、重发和窗口控制。队列的一个元素指向一个数据包,队列的最大长度没有限制。
对于整序,使用ooseq队列,如果发现接收的tcp包序号并不是希望的,但序号在接收窗口内,此时不能立刻接收这个包也不应丢弃,先将这个包放入ooseq队列。当一个希望的tcp包被接收以后,再查看ooseq队列现在是否有tcp包成为了希望的数据包,如果有则将其取出并处理。
对于重发,使用unacked队列,每个需要被应答的tcp数据包发送以后都要放入unacked队列,直到被应答后才从队列中删除。tcp重发定时只针对unacked队列第一个tcp包。如果定时超出,则重新发送;如果重发次数超出规定值,则报错。
对于窗口控制,使用unsend队列,如果发现对方的窗口过小无法接收这个数据包,则只发送部分数据,将多余部分放入unsend队列,等待对方发来tcp包通知新的窗口大小时,再次判断是否可以发送。在unsend队列不为空的情况下,须发送的数据包都应插入unsend队列。
3.3 捎带应答的实现
捎带应答是指,当对方一个需要应答的tcp包到达时,不马上给予应答,而是等待一段较短的时间。如果在这段时间内有数据发送,则会捎带给予应答,从而减少了包的发送数量。
若暂时没有数据须发给对方或数据还未准备好,则等待一定的时间;如果在该时间内准备好了数据,则可使用捎带应答。使用捎带应答就不可能对每个帧都作确认,可用对某个帧的确认来代替对该帧之前所有帧的确认。
4 总 结
嵌入式系统中大量存在的是8/16位低速处理器,在进行internet接入时,由于本身资源的限制,很难实现完整的tcp/ip协议。本文从既实现相应的功能又节省系统资源角度出发,对协议进行有针对性的模块化裁剪和优化设计,可以在单片机arm上嵌入tcp/ip协议簇实现嵌入式internet接入。
经过优化设计的嵌入式tcp/ip,支持套接字形式的多个tcp连接;支持多个网络设备;支持通过网关发送数据包和数据包转发功能,响应ping命令;支持tcp包的整序、重发和窗口控制流量控制。实践证明,这种设计方式灵活,能按用户需求实现很多复杂的功能。


2005第六届中国国际机电产品博览会暨电子展
智能照明技术研讨会:世强与Silicon Labs推出多协议无线Mesh方案
LFP材料再次迎来市场曙光,但整体竞争压力依然突出
单端反激式开关电源电路
频谱定义及频谱资源的特性
基于单片机ARM实现TCP/IP协议栈的设计
基于RRT算法生成机器人搜索路径的算法
AI驱动爱立信认知软件实现近乎实时的自动化网络优化操作
三星The Wall获2021中国国际显示技术展“DIC AWARD 显示技术推动开拓者”
直击外滩大会:“百模大战”正酣,同质化或构成“硬伤”
雷士照明上半年营收同比微幅增长,达19.74亿
短波/中波/长波红外热像仪助力高温过程监控
科普:VR产品常见名词解析 看懂就能出去吹了
苹果将于今年发布三款新设备:后置三摄并显著优化AR性能
MatePad Pro正式首发 华为平板正式升级
NVIDIA提出Magic3D:高分辨率文本到3D内容创建
凌力尔特聚焦细分市场,打造低功耗电源管理芯片
大画头戴电视到底值不值得买
BTB/FC连接器用大电流弹片微针模组可提高测试效率
化工厂4G+蓝牙+GPS/北斗RTK人员定位系统解决方案