搜尋

會員登入

搜尋

導覽

會員

Microchip Switchtec PCIe® Switches工程人员开发及管理的好帮手

近年因人工智慧、机器学习和深度学习等高算力应用需求带动AI/ML伺服器及储存伺服器等制造商的快速发展,高算力所产生的资料流(data streaming)传输会占用大量的介面传输频宽。针对AI/ML伺服器为使其达到最隹使用效率,工程师在设计具有算力加速卡的系统架构时除了考虑需要扩展的PCIe®装置数量外,亦须思考如何让资料流传输更有效率及降低其延迟(latency)。


伺服器进行远端管理对企业来说相当重要,在常见的伺服器架构中会放置Board Management Controller(BMC)电路。当系统发生非预期的失效时,工程师则可透过远端网路连线至BMC对系统进行管理及修复。


Microchip Switchtec Switches提供了两种硬体管理介面,让架构师或工程师在规划系统架构时,具有相当大的设计弹性。


一、 In-band:PCIe, NVMe-MI


二、 Out-of-band(OOB):TWI(Two-Wire Interface),UART,Ethernet


Microchip DCS技术支援工程师与客户协同开发的过程通常都会建议客户除了in-band外,至少将Switchtec TWI连接至BMC I2C。当硬体介面建立後,工程师就可以将Switchtec-user utility安装於BMC的Linux®作业系统中。


Switchtec-user utility为开源软体(open source),并存放於GitHub平台。虽然是开源软体,但Microchip DCS应用工程团队仍会针对非RC版本在验证板 (evaluation board)上进行测试,以确保所有的Switchtec Switches能够正确地被识别。如此,不仅让客户能保有自行修改程式的弹性,针对Release版本具有相当的可信度。


Switchtec Switches提供多种用於管理PCIe Switches的连接管道。此PCIe Switches的架构包括一个名称为Global Address Space(GAS)的统一实体(图一),用於执行对PCIe Switches USP和DSP的PCIe配置暂存器(PCIe configuration space)的读取和写入作业。



透过此架构,无论连接类型是In-band或是Out-of-band,都为使用者提供了与装置管理功能进行通讯的通用方式。同时,Switchtec Switches提供精细的安全框架,以基於每个连接类型限制对PCIe Switches管理功能的访问,而实现灵活的安全方案。


●Switchtec-kernel系将软体应用层及Switchtec硬体连结。


注:Switchtec技术在Linux OS中使用的是in-box driver,而与Switchtec-kernel无关。


●Switchtec-user为Switchtec Switches的管理指令集。



以下笔者将透过PCIe in-band的方式对Switchtec PCIe Gen5 Switches查看韧体(Firmware)版本及PCIe Switches的温度,展示如何透过Switchtec-user对PCIe Switches进行访问操作


1.使用者须先透过Microchip专属的ChipLink应用程式开启PCIe Switches的Management EP功能。



2.透过PCIe in-band方式对Switchtec Switches进行管理


在Linux中输入lspci命令查看Switchtec Switches,此时可以发现PCIe bus列出一个名为”Memory controller: PMC-Sierra Inc. Device 5000”的装置(图四)。



3.使用者在Linux中将Switchtec-kernel安装成功後,查看/dev目录下会挂载一个名称为switchtec0的装置。



4.切换至/switchtec-usr目录下,使用root权限输入./switchtec list查看所有在板上且有开启Management EP的Switchtec PCIe Switches(图六)。



5.让我们来读取PCIe Switches的die温度(die temperature),使用者可使用 ./switchtec temp命令进行操作(图七)。



但此时却发现无法正确被执行。为什麽呢?原来是因为系统有可能会设计多个PCIe Switches在板上。因此,每一个PCIe Switch都会被挂载为一个装置,所以使用者要记得加上装置的路径。若忘记也别担心,Microchip Switchtec-user会提示正确的语法及其他相关的功能叁数。


现在,我们依照语法建议修正为 ./switchtec temp /dev/switchtec0 即可得到正确的die温度资讯(图八)。



6.接下来,我们再利用一个简单的语法查看目前PCIe Switches的韧体(firmware)版本(图九),使用者只要输入 ./switchtec fw-info /dev/switchtec0



者用以上两个非常简单且实用的命令快速地让读者了解如何在Linux系统中操作Switchtec-user, 当然,Switchtec-user的功能绝不仅於此,使用者可以使用 ./switchtec /help 查看所有可以使用的命令(图十),有经验的使用者可以发现Switchtec-user就像是一个文字介面版本的ChipLink吧!



使用者在将Switchtec-kernel及Switchtec-user嵌入至BMC前,可以PCIe in-band方式或是透过外部USB-to-TWI/I2C Master方式(USB-to-UART/I2C控制器可叁考Microchip MCP2221A与Switchtec Switches进行连线并)使用Switchtec-user utility进行前期验证。以下示意使用外部I2C TWI/ Master控制器对Switchtec-user utility的连接方式(图十一),以及需备妥的软硬体项目。


●安装Linux的主机系统(Host)


●TWI/I2C Master控制板


●具有Switchtec Switches的硬体电路板



那使用者要怎麽应用於BMC的连接呢? 下图紫色虚线区块就是由BMC控制器代替的部分(图十二),最终使用者只需要将BMC I2C连接到Switchtec Switches的TWI0(预设)即可。



碍於篇幅,笔者无法将Switchtec-user所有强大的功能详细地向读者们详述,若尚未使用Switchtec Switches的读者也可访问以下Microchip产品网页或扫瞄QR码,或直接洽询您的Microchip业务窗囗,以获得您系统需求的最隹解决方案。


https://www.microchip.com/en-us/solutions/data-centers-and-computing/data-center-solutions


本文作者为:Microchip主任应用工程师 徐恺骏


Card Image

定义兆瓦级AI工厂 英飞凌以固态电力技术 驱动直流微电网革命

在代理式AI发展如火如荼的新时代,全球对算力的需求正以倍速增加,这股力量也直接拉升了资料中心的能耗基准,传统的电力架构已难以支撑未来的AI算力需求。 英飞凌(Infineon)...

在代理式AI发展如火如荼的新时代,全球对算力的需求正以倍速增加...