1.本技术涉及联邦学习技术领域,具体地,涉及一种基于区块链无线联邦学习的可信管理方法。
背景技术:
2.在无线物联网环境中,由于物联网设备通过无线信道进行网络连接,此时参与联邦学习的设备通过无线信道交换模型参数(包括本地模型的上行传输和全局模型的下行传输),以此训练出好的模型使处于网络边缘的物联网设备更好地提供服务。物联网网络容易受到内部的威胁,一些设备被破坏者破坏或者由攻击者假扮,这些设备被称为恶意设备,恶意设备大部分的目的都是来传播虚假信息,因此无线物联网网络的拓扑结构既是灵活的,也是脆弱的。为了减轻恶意设备的影响,信任的概念被引入物联网领域来解释设备之间的关系,信任管理被认为是评估和监测物联网设备行为的有效方法。
3.从信任管理系统的部署方式来看,可以分为中心化、半中心化和完全分布式的信任管理。中心化的信任管理中,部署在安全位置的中央受信任实体或服务器负责信任管理,例如部署在车辆网络基于公开密钥基础设施的安全框架中的受信任第三方,理论上来说其具有简单方便的特点,但由于物联网设备的分散较广且可能具有动态性,使用一个中央服务器对一个物联网环境下所有的设备进行信任管理是不切实际的,并且单点故障是中心化管理的最大弊端,除此之外其处理可扩展性的能力以及安全相关问题有待研究。完全分布式的架构是为了解决中心化管理存在的问题而提出的,不过其没有认识和考虑到异构物联网设备的存储空间和通信能力都存在瓶颈,这会导致具有不同特点的物联网设备在处理信任管理数据时具有不同的效率。
技术实现要素:
4.为了克服现有技术中的至少一个不足,本技术提供一种基于区块链无线联邦学习的可信管理方法。
5.第一方面,提供一种基于区块链无线联邦学习的可信管理方法,包括:
6.确定基站i相对于用户终端设备n的直接信任值;基站i为基站集合中任意一个基站,用户终端设备n为用户终端设备集合中任意一个用户终端设备;
7.确定基站i相对于用户终端设备n的间接信任值;
8.根据直接信任值和间接信任值,确定基站i相对于用户终端设备n的总信任值;
9.构建无线联邦学习通信资源分配的优化问题,并将基站i相对于用户终端设备n的总信任值作为优化问题的约束条件;
10.求解无线联邦学习通信资源分配的优化问题,得到最优解,最优解包括用户终端设备n的cpu频率最优解、分配给用户终端设备n的通信时延最优解、本地精度最优解、超学习率最优解、一轮联邦学习的通信时延最优解、一轮联邦学习的本地计算时延最优解以及一轮联邦学习的区块链时延最优解。
11.在一个实施例中,确定基站i相对于用户终端设备n的直接信任值,采用以下公式计算:
[0012][0013]
其中,为t时刻基站i相对于用户终端设备n的直接信任值,为用户终端设备n在t时刻对基站i的响应信任值,为t时刻基站i相对于用户终端设备n的可信度。
[0014]
在一个实施例中,确定基站i相对于用户终端设备n的间接信任值,采用以下公式计算:
[0015][0016]
其中,为t时刻基站i相对于用户终端设备n的间接信任值,k为直接连接基站i的基站,φ为直接连接基站i的基站集合,为t时刻基站k相对于用户终端设备n的直接信任值,为基站i在基站k中的推荐可信度。
[0017]
在一个实施例中,基站i在基站k中的推荐可信度
[0018][0019][0020]
其中,为t
′
时刻基站i对基站k的推荐评级,为每个推荐评级的衰减函数,χi为与应用场景相关的常量参数,为直接连接基站i的基站数量,t
′
为过去一段时间[t-τ,t]中的时刻,τ为时长。
[0021]
在一个实施例中,根据直接信任值和间接信任值,确定基站i相对于用户终端设备n的总信任值,采用以下公式计算:
[0022][0023]
其中,为t时刻基站i相对于用户终端设备n的总信任值,为t时刻基站i相对于用户终端设备n的直接信任值,为t时刻基站i相对于用户终端设备n的间接信任值,α为直接信任的权重参数,β为间接信任的权重参数。
[0024]
在一个实施例中,无线联邦学习通信资源分配的优化问题的目标函数采用以下公式表示:
[0025][0026]
其中,fn为用户终端设备n的cpu频率,τn为分配给用户终端设备n的通信时间,θ为本地精度,η为超学习率,t
co
为一轮联邦学习的通信时延,t
cp
为一轮联邦学习的本地计算时
延,t
bp
为一轮联邦学习的区块链时延;kg为联邦学习全局轮数,e
fl
为一个联邦学习全局轮的总能量消耗,λ为统一量纲;t
fl
为一个联邦学习全局轮的计算时延;
[0027]
约束条件如下:
[0028][0029][0030]fnmin
≤fn≤f
nmax
,
[0031]
p
nmin
≤pn≤p
nmax
,
[0032]
0≤θ≤1,
[0033]fibmin
≤f
ib
≤f
ibmax
,
[0034][0035]
其中,n为用户终端设备集合中的用户终端设备的个数,cn为用户终端设备n执行一个数据样本所需要的cpu轮数,dn为用户终端设备n中本地数据的大小,f
nmin
为fn的最小值,f
nmax
为fn的最大值,pn为用户终端设备n的发射功率,p
nmin
为pn的最小值,p
nmax
为pn的最大值,f
ib
为基站i对应的区块链的cpu频率,f
ibmin
为f
ib
的最小值,f
ibmax
为f
ib
的最大值,为t时刻基站i相对于用户终端设备n的总信任值,reth为信誉阈值。
[0036]
在一个实施例中,求解无线联邦学习通信资源分配的优化问题,得到最优解,包括:
[0037]
将目标函数分解为子问题1和子问题2,采用以下公式表示:
[0038]
子问题1:
[0039]
约束条件为:
[0040][0041]fnmin
≤fn≤f
nmax
[0042][0043]
子问题2:
[0044]
约束条件为:
[0045][0046]
p
nmin
≤pn(n/n)≤p
nmax
[0047][0048]
其中,e
n,cp
为用户终端设备n一轮联邦学习的计算能量消耗,e
n,co
为用户终端设备n一轮联邦学习的通信能量消耗,k
l
为本地轮数,tc′
p
为子问题1和子问题2在不添加设备可信度约束时,得到的t
cp
的最优解,tc′o子问题1和子问题2在不添加设备可信度约束时,得到的
t
co
的最优解,upper为一轮联邦学习的时间上限;
[0049]
求解子问题1和子问题2,得到用户终端设备n的cpu频率最优解f
n*
、分配给用户终端设备n的通信时间最优解τ
n*
、一轮联邦学习的通信时延最优解t
co*
、一轮联邦学习的本地计算时延最优解t
cp*
以及、用户终端设备n一轮联邦学习的计算能量消耗最优解e
m,cp*
、用户终端设备n一轮联邦学习的通信能量消耗最优解e
n,co*
;
[0050]
构建子问题3,采用以下公式表示:
[0051][0052]
约束条件为:
[0053]
0≤θ≤1,
[0054]
0《θ《1,
[0055]
其中,θ为全局精度;t
bp*
为一轮联邦学习的区块链时延最优解,为设定值;
[0056]
求解子问题3,得到全局精度θ的最优解;
[0057]
根据全局精度θ与本地精度和超学习率的对应关系,基于全局精度θ的最优解得到本地精度最优解θ
*
和超学习率最优解η
*
。
[0058]
第二方面,提供一种基于区块链无线联邦学习的可信管理装置,包括:
[0059]
直接信任值确定模块,用于确定基站i相对于用户终端设备n的直接信任值;基站i为基站集合中任意一个基站,用户终端设备n为用户终端设备集合中任意一个用户终端设备;
[0060]
间接信任值确定模块,用于确定基站i相对于用户终端设备n的间接信任值;
[0061]
总信任值确定模块,用于根据直接信任值和间接信任值,确定基站i相对于所述用户终端设备n的总信任值;
[0062]
优化问题构建模块,用于构建无线联邦学习通信资源分配的优化问题,并将基站i相对于用户终端设备n的总信任值作为优化问题的约束条件;
[0063]
求解模块,用于求解无线联邦学习通信资源分配的优化问题,得到最优解,最优解包括用户终端设备n的cpu频率最优解、分配给用户终端设备n的通信时延最优解、本地精度最优解、超学习率最优解、一轮联邦学习的通信时延最优解、一轮联邦学习的本地计算时延最优解以及一轮联邦学习的区块链时延最优解。
[0064]
第三方面,提供一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时,以实现上述的基于区块链无线联邦学习的可信管理方法。
[0065]
第四方面,提供一种计算机程序产品,包括计算机程序/指令,计算机程序/指令被处理器执行时,以实现上述的基于区块链无线联邦学习的可信管理方法。
[0066]
相对于现有技术而言,本技术具有以下有益效果:本技术针对无线物联网环境下用户的移动性和联邦学习中用户的不确定性的特征,将可信管理模型引入区块链无线联邦学习框架,并对其进行了公式化的表征;在加入可信管理模型后的区块链无线联邦学习仍然考虑资源分配问题,将可信模型作为约束放入优化问题中进行优化求解得到最优资源分配方案,得到的最优资源分配方案具有更低的总能量消耗和能量时延积。
附图说明
[0067]
本技术可以通过参考下文中结合附图所给出的描述而得到更好的理解,附图连同下面的详细说明一起包含在本说明书中并且形成本说明书的一部分。在附图中:
[0068]
图1示出了根据本技术实施例的基于区块链无线联邦学习的可信管理方法的流程框图;
[0069]
图2示出了根据本技术实施例的基于区块链无线联邦学习的可信管理装置的结构框图;
[0070]
图3示出了在优化前后进行600轮联邦学习的总消耗和能量时延积对比图;其中,(a)为总消耗对比图,(b)为能量时延积对比图;
[0071]
图4示出了在加入可信约束前后的联邦学习能量时延积对比图;
[0072]
图5示出了不同算法在femnist数据集上存在不同占比的恶意设备时的准确率变化对比图,其中(a)为fedl算法在femnist数据集上存在不同占比的恶意设备时的准确率变化图,(b)为fedavg算法在femnist数据集上存在不同占比的恶意设备时的准确率变化图。
具体实施方式
[0073]
在下文中将结合附图对本技术的示例性实施例进行描述。为了清楚和简明起见,在说明书中并未描述实际实施例的所有特征。然而,应该了解,在开发任何这种实际实施例的过程中可以做出很多特定于实施例的决定,以便实现开发人员的具体目标,并且这些决定可能会随着实施例的不同而有所改变。
[0074]
在此,还需要说明的一点是,为了避免因不必要的细节而模糊了本技术,在附图中仅仅示出了与根据本技术的方案密切相关的装置结构,而省略了与本技术关系不大的其他细节。
[0075]
应理解的是,本技术并不会由于如下参照附图的描述而只限于所描述的实施形式。在本文中,在可行的情况下,实施例可以相互组合、不同实施例之间的特征替换或借用、在一个实施例中省略一个或多个特征。
[0076]
本技术提供一种基于区块链无线联邦学习的可信管理方法,将更多的信息纳入对“恶意设备”的考量,并且将设备可信度纳入资源优化的内容。一方面,联邦学习性能的好坏很大程度上取决于聚合参数的质量,合理地考核设备的可信度有利于提升对恶意设备判断的准确性。另一方面,无线物联网环境下对于资源分配有着更高的要求,能够得到一个资源分配在联邦学习计算、通信和可信度层面上的最优解对于联邦学习在无线物联网环境下的应用更有意义。
[0077]
现有的利用区块链进行声誉管理的可信模型在无线物联网环境下面临新的挑战。首先是在物联网网络中,信任信息是单向和不对称的,例如两个节点之间其中一方对另一方提供的信息有很高的信任度,这并不表明对方节点对该节点提供的信息具有同样高的信任度;其次,如果存在三个节点连续信任的情况,则第一个节点可以根据第二个节点的建议间接评估第三个节点的可信度,不过推荐的可靠性和准确性会随着信任传播的跳数增多而降低;并且由于物联网设备的异质性,不同设备对其他设备提供的性能和信息有不同的偏好,因此设备对同一服务以及同一设备提供的相同性能的信任程度可能大不相同;最后,信任受到设备行为的影响,该行为不是一成不变的,节点的行为可能会随着时间的推移而改
变,因此历史观测结果可能并不总是可靠的,当其在不同时间点进行汇总时,应具有不同的解释。这些对信任信息的影响因素同样影响联邦学习对于参与设备的信任考量,因为联邦学习中的参与设备不仅在加入和退出学习方面具有动态性,设备的移动可能发生在多个基站域之间,因此本技术将多个因素纳入对设备信任值的考量,来解决对设备可信值计算考量太过单一、没有考虑真实物联网场景的问题。
[0078]
本技术考虑物联网真实场景,提出一个基于区块链无线联邦学习的计算信任模型。一方面,着力于边缘侧联邦学习参与设备的本地计算和通信的时延和能耗,同时加入通过综合考虑各种因素得到的设备可信值,共同作用于无线物联网联邦学习场景,以联邦学习总消耗为评价标准,力求在给定可信阈值的前提下能耗最小;另一方面,以联邦学习收敛性恢复速度为评价标准,力求恢复时延更低。
[0079]
本技术实施例提供的基于区块链无线联邦学习的可信管理方法,其模型架构包括物理层、区块链层和信任管理层,在物理层,存在物联网设备、移动设备共n个终端用户设备,以及多个基站,这里,2个基站可以直接连接,或者不直接连接,所有的基站构成基站集合,所有的终端用户设备构成终端用户设备集合。终端用户设备负责收集或生成运行数据,区块链层由运行在各个基站上的区块链组成,信任管理层将联邦学习过程中设备的信任值进行建模计算。
[0080]
在联邦学习过程中,如果终端用户设备参与了某轮学习却无法提供数据或提供恶意数据,就会被视为不可信的,由于联邦学习本身允许边缘设备随时进入或者退出学习过程,再加上物联网环境的复杂性,设备的可信度不是静态属性,而是动态属性。通过现有研究,在物联网环境中设备的信任值可以由过去交互中两者的历史行为来预测的。
[0081]
图1示出了根据本技术实施例的基于区块链无线联邦学习的可信管理方法的流程框图,参见图1,基于区块链无线联邦学习的可信管理方法包括:
[0082]
步骤s1,确定基站i相对于用户终端设备n的直接信任值;基站i为基站集合中任意一个基站,用户终端设备n为用户终端设备集合中任意一个用户终端设备。
[0083]
步骤s2,确定基站i相对于用户终端设备n的间接信任值。
[0084]
步骤s3,根据直接信任值和间接信任值,确定基站i相对于用户终端设备n的总信任值。
[0085]
步骤s4,构建无线联邦学习通信资源分配的优化问题,并将基站i相对于用户终端设备n的总信任值作为优化问题的约束条件,即信任模型的公式化表示。
[0086]
步骤s5,求解无线联邦学习通信资源分配的优化问题,得到最优解,最优解包括用户终端设备n的cpu频率最优解、分配给用户终端设备n的通信时延最优解、本地精度最优解、超学习率最优解、一轮联邦学习的通信时延最优解、一轮联邦学习的本地计算时延最优解以及一轮联邦学习的区块链时延最优解。
[0087]
在一个实施例中,步骤s1中确定基站i相对于用户终端设备n的直接信任值,可以采用以下公式计算:
[0088][0089]
其中,为t时刻基站i相对于用户终端设备n的直接信任值,为用户终端设备n在t时刻对基站i的响应信任值,为t时刻基站i相对于用户终端设备n的可信
度。
[0090][0091]
其中,为过去一段时间[t-τ,t]中用户终端设备n的响应次数,τ为时长,为过去一段时间[t-τ,t]中用户终端设备n与基站i的交互总数。
[0092][0093]
其中,t
′
为过去一段时间[t-τ,t]中的时刻,为用户终端设备n在时刻t
′
提供的模型参数在基站i的质量评分,为的衰减程度。
[0094]
在一个实施例中,步骤s2中确定基站i相对于用户终端设备n的间接信任值,可以采用以下公式计算:
[0095][0096]
其中,为t时刻基站i相对于用户终端设备n的间接信任值,k为直接连接基站i的基站,φ为直接连接基站i的基站集合,为t时刻基站k相对于用户终端设备n的直接信任值,为基站i在基站k中的推荐可信度。
[0097][0098][0099]
其中,为t
′
时刻基站i对基站k的推荐评级,为每个推荐评级的衰减函数,χi为与应用场景相关的常量参数,为直接连接基站i的基站数量。
[0100]
在一个实施例中,步骤s3中根据直接信任值和间接信任值,确定基站i相对于用户终端设备n的总信任值,采用以下公式计算:
[0101][0102]
其中,为t时刻基站i相对于用户终端设备n的总信任值,为t时刻基站i相对于用户终端设备n的直接信任值,为t时刻基站i相对于用户终端设备n的间接信任值,α为直接信任的权重参数,β为间接信任的权重参数。
[0103]
在一个实施例中,无线联邦学习通信资源分配的优化问题的目标函数采用以下公式表示:
[0104]
[0105]
其中,fn为用户终端设备n的cpu频率,τn为分配给用户终端设备n的通信时间,θ为本地精度,η为超学习率,t
co
为一轮联邦学习的通信时延,t
cp
为一轮联邦学习的本地计算时延,t
bp
为一轮联邦学习的区块链时延;kg为联邦学习全局轮数,e
fl
为一个联邦学习全局轮的总能量消耗,λ为统一量纲;t
fl
为一个联邦学习全局轮的计算时延;
[0106]
约束条件如下:
[0107][0108][0109]fnmin
≤fn≤f
nmax
,
[0110]
p
nmin
≤pn≤p
nmax
,
[0111]
0≤θ≤1,
[0112]fibmin
≤f
ib
≤f
ibmax
,
[0113][0114]
其中,n为用户终端设备集合中的用户终端设备的个数,cn为用户终端设备n执行一个数据样本所需要的cpu轮数,dn为用户终端设备n中本地数据的大小,f
nmin
为fn的最小值,f
nmax
为fn的最大值,pn为用户终端设备n的发射功率,p
nmin
为pn的最小值,p
nmax
为pn的最大值,f
ib
为基站i对应的区块链的cpu频率,f
ibmin
为f
ib
的最小值,f
ibmax
为f
ib
的最大值,为t时刻基站i相对于用户终端设备n的总信任值,reth为信誉阈值。
[0115]
在一个实施例中,步骤s5中求解无线联邦学习通信资源分配的优化问题,得到最优解,包括:
[0116]
步骤s51,将目标函数分解为子问题1和子问题2,采用以下公式表示:
[0117]
子问题1:
[0118]
约束条件为:
[0119][0120]fnmin
≤fn≤f
nmax
[0121][0122]
子问题2:
[0123]
约束条件为:
[0124][0125]
p
nmin
≤pn(n/n)≤p
nmax
[0126][0127]
其中,e
n,cp
为用户终端设备n一轮联邦学习的计算能量消耗,e
n,co
为用户终端设备n
一轮联邦学习的通信能量消耗,k
l
为本地轮数,tc′
p
为子问题1和子问题2在不添加设备可信度约束时,得到的t
cp
的最优解,tc′o子问题1和子问题2在不添加设备可信度约束时,得到的t
co
的最优解,upper为一轮联邦学习的时间上限;
[0128]
步骤s52,求解子问题1和子问题2,得到用户终端设备n的cpu频率最优解f
n*
、分配给用户终端设备n的通信时间最优解τ
n*
、一轮联邦学习的通信时延最优解t
co*
、一轮联邦学习的本地计算时延最优解t
cp*
以及、用户终端设备n一轮联邦学习的计算能量消耗最优解e
n,cp*
、用户终端设备n一轮联邦学习的通信能量消耗最优解e
n,co*
;
[0129]
步骤s53,构建子问题3,采用以下公式表示:
[0130][0131]
约束条件为:
[0132]
0≤θ≤1,
[0133]
0《θ《1,
[0134]
其中,θ为全局精度;t
bp*
为一轮联邦学习的区块链时延最优解,为设定值;
[0135]
步骤s54,求解子问题3,得到全局精度θ的最优解;
[0136]
步骤s55,根据全局精度θ与本地精度和超学习率的对应关系,基于全局精度θ的最优解得到本地精度最优解θ
*
和超学习率最优解η
*
。
[0137]
该实施例中,子问题1是一个cpu周期控制问题,用于本地计算时间和能量最小化,而子问题2可以被视为上行功率控制,以确定终端的时间共享比例,以最小化终端的能量和通信时间,并且可以看出子问题1和子问题2都是凸问题,可以迅速得到子问题1和子问题2的最优解。利用不加入子问题1和子问题2在不添加设备可信度约束时,得到的t
cp
的最优解tc′
p
和t
co
的最优解tc′o,构造设备可信度约束,即以及重新求解子问题1和子问题2,得到部分参数的最优解。然后,根据部分参数的最优解构建子问题3,进而求解,得到全局精度θ的最优解,因为全局精度θ与本地精度和超学习率之间存在对应关系,因此,可以得到本地精度最优解θ
*
和超学习率最优解η
*
。
[0138]
采用与基于区块链无线联邦学习的可信管理方法相同的发明构思,本实施例还提供与之对应的基于区块链无线联邦学习的可信管理装置,图2示出了根据本技术实施例的基于区块链无线联邦学习的可信管理装置的结构框图,包括:
[0139]
直接信任值确定模块21,用于确定基站i相对于用户终端设备n的直接信任值;基站i为基站集合中任意一个基站,用户终端设备n为用户终端设备集合中任意一个用户终端设备;
[0140]
间接信任值确定模块22,用于确定基站i相对于用户终端设备n的间接信任值;
[0141]
总信任值确定模块23,用于根据直接信任值和间接信任值,确定基站i相对于用户终端设备n的总信任值;
[0142]
优化问题构建模块24,用于构建无线联邦学习通信资源分配的优化问题,并将基
站i相对于用户终端设备n的总信任值作为优化问题的约束条件;
[0143]
求解模块25,用于求解无线联邦学习通信资源分配的优化问题,得到最优解,最优解包括用户终端设备n的cpu频率最优解、分配给用户终端设备n的通信时延最优解、本地精度最优解、超学习率最优解、一轮联邦学习的通信时延最优解、一轮联邦学习的本地计算时延最优解以及一轮联邦学习的区块链时延最优解。
[0144]
本实施例的基于区块链无线联邦学习的可信管理装置与上文的基于区块链无线联邦学习的可信管理方法具有相同的发明构思,因此该装置的具体实施方式可见前文中的基于区块链无线联邦学习的可信管理方法的实施例部分,且其技术效果与上述方法的技术效果相对应,这里不再赘述。
[0145]
本技术实施例提供一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时,以实现上述的基于区块链无线联邦学习的可信管理方法。
[0146]
本技术实施例提供一种计算机程序产品,包括计算机程序/指令,计算机程序/指令被处理器执行时实现上述的基于区块链无线联邦学习的可信管理方法。
[0147]
为了进一步验证本技术方法的有效性,通过对比优化前后的计算和通信能量消耗以及能量时延积来说明本技术的方法在扩展加入可信条件后的方法有效性。
[0148]
图3示出了在优化前后进行600轮联邦学习的总消耗和能量时延积对比图;其中,(a)为总消耗对比图,(b)为能量时延积对比图。(a)图中带三角形的直线表示当最小化时间消耗时的情况,此时用户终端设备采用最高的计算频率和最大发射功率;而带有圆圈的直线表示当最小化功率能量消耗时的情况,此时用户终端设备采用最低的计算频率和最小发射功率;带有星号的直线代表计算频率和发射功率随机的情况;而带有正方形的线是采用本技术优化后的结果。可以看出本技术进行的优化对于所提出问题较于其它情况均具有更低的总消耗,即本技术优化的有效性得到证明。
[0149]
同时,本技术也通过对比能量时延积(edp)来评估本技术进行的优化对于高性能和低功耗的有效性。如图3中的(b)所示,本技术所优化的方案的edp相较于最小化时间成本、最小化能耗成本、随机分配计算和发射功率时的edp更低。
[0150]
此外,本技术还对比了未加入可信约束和加入可信约束时的能量时延积,图4示出了在加入可信约束前后的联邦学习能量时延积对比图。根据图4可知,对于最小化时间的情况,由于此时的联邦学习时间可以满足设备可信度的要求,因此加入可信约束后该数值大小不变;对于随机情况,即使其不受控,但仍然会在最小化时间和最小化能耗的数值范围之间波动;对于最小化功率能量消耗的情况,由于可信约束的条件中存在一个随时间衰减的函数来衡量可信信息的可靠程度,以最低功率运行的设备存在高的时延从而无法达到最低可信度的标准,因此必须提高功率来减少时延进而提高设备可信度,导致了edp的增加;同样对于本技术的最优解,由于之前的最优解中时延无法满足设备可信度约束的要求,edp的数值也被迫增加,不过与其它情况相比本技术的最优解仍然具有更低的edp,由此可得本技术采取的优化可以在性能方面获得很大的增益。
[0151]
为了评估本技术方法的有效性,特别是当物联网设备节点突然改变其行为时的情况下,本技术进行了以下三项实验:
[0152]
实验一:主要关注评估本技术的方法对恶意物联网设备数量的弹性;实验二,评估
了衰减函数的影响;实验三,从联邦学习受到中毒攻击的角度,将本技术提出的信任模型与两个信任模型进行了对比。
[0153]
实验一
[0154]
将恶意物联网设备的百分比设置为10%、25%和50%,分别使用fedl算法和fedavg算法在femnist数据集上进行联邦学习过程,以评估所提出的方法在捕获物联网设备行为变化方面的性能。一开始先保持所有物联网设备节点的诚实行为不变,并观察联邦学习过程中的准确率和训练损失,在120轮时,恶意物联网设备开始改变其行为,提供受到中毒攻击的模型参数,其余节点继续提供诚实的模型参数。图5示出了不同算法在femnist数据集上存在不同占比的恶意设备时的准确率变化对比图,其中(a)为fedl算法在femnist数据集上存在不同占比的恶意设备时的准确率变化图,(b)为fedavg算法在femnist数据集上存在不同占比的恶意设备时的准确率变化图。
[0155]
根据图5可知,当有10%的恶意物联网设备时,准确率大约下降到本身的0.5倍,有25%的恶意物联网设备时准确率则下降到0.4倍左右,而当有50%的恶意物联网设备时几乎表明联邦学习进程需要重新开始,这体现出恶意物联网设备越多联邦学习受到的影响越大。这背后有两个原因,首先,其它诚实的设备在和恶意设备交互之前不知道它们的行为变化,其次,恶意设备的占比越大越容易误导服务器选择恶意服务节点进行聚合,不过在短时间内,大约有20个全局轮次后,联邦学习的准确率几乎开始收敛,并且逐渐向之前没有受到攻击时的水平接近,这表明本技术提出的方法可以有效地帮助联邦学习进程减轻恶意物联网设备产生的影响。
[0156]
因此,在图5中,准确率下降的差异和损失值上升的差异源于恶意物联网节点数量的差异,由此可以推导出120轮到200轮发生的准确率下降情况主要由恶意物联网设备提供了中毒攻击参数引起,服务器节点将在识别出恶意服务后调整更改服务节点的信任值,当服务节点的信任值降低时,服务器不再选择恶意服务节点,这表明本技术方法可以有效地捕获服务节点的行为变化。
[0157]
实验二
[0158]
使用与前一个实验相同的设置,即在120轮时,恶意物联网设备开始改变其行为,提供受到中毒攻击的模型参数,同时,恶意物联网设备的百分比设置为10%,通过对比信任模型的性能来评估衰减函数的效果。
[0159]
在服务节点改变其行为后,具有衰减函数的信任模型的全局准确率下降的更少,并且比不考虑衰减函数更早、更快地达到稳定状态。而训练损失也有相似的变化,这是由于在没有衰减函数时,最近发生的基于行为的评分变化的权重与信任计算过程中的历史评分相同,表明需要更长的时间和更慢的速度来捕获更改的行为。同时,可以看到具有衰减函数的信任模型中的信任值衰减速度快于没有衰减函数的信任模型中的信任值。在具有衰减函数的信任模型中,新的恶意行为在很大程度上在信任计算中加权,信任值将迅速下降。因此,与没有衰减函数的信任模型相比,具有衰减函数的信任模型中恶意服务设备不太可能被选择为这一轮参与聚合的设备。
[0160]
实验三
[0161]
将采用fedl算法在femnist数据集上进行联邦学习过程,并且在第120轮时,恶意物联网设备开始改变其行为,提供受到中毒攻击的模型参数,同时,恶意物联网设备的百分
比设置为10%。将本技术提出的信任模型与其他两个信任模型进行对比:typical reputation信任模型和peertrust信任模型。在typical reputation模型中,物联网设备的信任值计算为其所有信任值的平均值;在peertrust信任模型中,使用peertrust tvm/dtc方法来计算设备的信任值,并使用提出的基于自适应时间窗口的算法,通过将最近的时间窗口设置为与本技术提出的模型相同的3个联邦学习轮次来反映节点的最新动态行为。与之前实验类似,在fedl算法分别加入三个信任模型后服务器中全局准确率和训练损失值的变化情况。
[0162]
本技术所提出的模型比peertrust模型表现更好,而peertrust模型优于typical reputation模型。在恶意物联网设备更改诚实行为之前,这三个模型会在联邦学习过程中体现出相似的曲线,但行为改变后,本技术提出的模型受到中毒攻击的影响将少于peertrust模型或typical reputation模型。并且与其他两种模型相比,本技术提出的模型可以更快地察觉到中毒攻击的产生。与typical reputation模型相比,peertrust中基于自适应时间窗口的算法的设计可以更有效地识别物联网设备的动态行为,但不如本技术提出的模型。因此,对比结果表明,本技术提出的模型可以从信任衰减函数的设计和动态权重调整中受益,从而获得性能优势。
[0163]
综上,本技术具有以下技术效果:
[0164]
本技术针对无线物联网环境下用户的移动性和联邦学习中用户的不确定性的特征,将可信管理模型引入区块链无线联邦学习框架,并对其进行了公式化的表征;在加入可信管理模型后的区块链无线联邦学习仍然考虑资源分配问题,将可信模型作为约束放入优化问题中进行优化求解得到最优资源分配方案,得到的最优资源分配方案具有更低的总能量消耗和能量时延积。
[0165]
以上所述,仅为本技术的各种实施方式,但本技术的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本技术揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本技术的保护范围之内。因此,本技术的保护范围应以所述权利要求的保护范围为准。