首页 女生 都市言情 我当顽主那几年

第1207章 轻量化模型

我当顽主那几年 丑皮匠 2288 2025-09-01 13:49

  周正阳看完乔一盛的操作之后,也明白了纪无凡为什么会这么主动要进行本地练模型了。

  “从一盛提供的实时操作和技术支持就能看到这模型内置了很多‘干货’。从图文步骤的说明到使用‘教程’等一些常见问题的指引确实都很便捷。”周正阳颇为满意。

  费世杰好奇的询问乔一盛:“除了周总提到的那些,我还有个疑问,之前你说联邦学习法本的地练模型就类似于QQline,那是不是也可以提供远程的技术支持,比如远程查看相关的文件等。”

  “费老,你问的太及时了,我正要给你们介绍呢。”乔一盛笑着继续操作示范起来:“喏,这部分的模块就像QQline的视频连线,支持语音消息的同时,也可以提供远程技术支持的。”

  看完乔一盛的示范操作,周正阳连连点头:“远程进行指导调整参数确实方便快捷不少。”

  “这就是配件适配后,进行轻量化的设计,毕竟优化模型对硬件的要求很高,因此让普通硬件的电脑或者参与方的服务器也可以运行,不止是依赖高端的CPU处理器,在降低硬件门槛的同时,也要减少繁冗的操作复杂度。”

  乔一盛的这番话详细的剖析了‘联邦’学习法的参与方即使技术能力比较弱,也能够通过以上介绍的那些技术弥补,从而完成本地的模块训练。

  “对于如何选择适合的本地训练模型才是关键的一点。”费世杰也说出了自己的观点。

  除了方才提到的硬件能力之外,还有数据规模,尤其是数据量和数据多样性。

  “为了避免出现‘杀鸡用牛刀’和‘小马拉大车’的现象,所以我才会提出‘轻量化’模型的想法,就是为了适配本地的硬件。”乔一盛解答费世杰方才提出的问题。

  其实从‘轻量化’三个字来解释的话,无非就是关键指标的比较。

  “参与训练的模型的大小其实就包含了参数的数量多少,这就代表计算的复杂度,比如训练时候的算力需求。”乔一盛举例进行说明:“本地的硬件肯定不如专业技术的服务器,不具备高端的GPU,因此在选择中要以结构简单为主。”

  纪无凡团队运用的医疗模型中,就以轻量级模型为主,并不是参数过亿数量的大型模型,因此在普通的电脑上就可以运行使用,避免出现硬件不够导致卡顿或者崩盘的现象。

  “再者要匹配本地的数据规模,避免提供的模型过于复杂化,而数据不够的情况。”周正阳提醒道:“目前的模型训练通常都是聚焦单一的任务,所以这种情况下就会以‘专而精’的模型为主,达到轻量化的标准。”

  费世杰赞同的点头:“没错,如此一来本地很多中小企业也会融入‘联邦’学习法的提倡中,有限选择我们训练好的基础模型,即使需要调整也只是‘微调’导入的相关参数而已,这样就可以降低训练的难度,还可以利用好模型。”

  直白点来说‘本地练模型’就是模型训练中在自己拥有的设备上完成,如此很多数据都可以保证不泄密不泄露,训练者也可以直接在企业内进行学习和培训,通过模型的运用,更精准的识别和做出分析。

  整个过程中,即使是‘微调’的数据也都会保留在训练者的系统中,完美做到了‘保密’的专业性。

  “联邦学习法的本质是‘数据不动模型动’这意味着大家在不分享原始数据的情况下,一起参与训练一个更强大的模型。”周正阳说道:“核心是保护数据和技术的隐私,同时还能够集合多方的数据力量来提升模型的效果。”

  参与方目前除了医疗方面的纪无凡团队外,鹏城产业园也有不少中小型企业参与到客户端,用自己的数据在本地训练模型,之需要把训练后的一些模型传导出去。

  周正阳就属于协调方的角色,充当了‘服务器’,负责接收各个客户端参与方传来的模型参数,然后通过关键参与者‘模型’进行迭代优化展开,把所有传导在模型的参数进行汇总与整合。

  在完成以上的环节之后,行程了‘全局’模型参数再返回给客户端的参与方那个,从而让其用这些新生成的参数进行训练。

  作为中间协调方,周正阳团队就是等于是‘中间人’不会触及到参与方的原始数据,只是处理模型参数而已。这样大家把模型打磨得更强悍的同时,重要的数据,无论是原始数据还是微调后的数据都在参与的客户端手里。

  “我们通过‘联邦’学习把鹏城产业园参与的客户端和咱们的服务器建立连接,最重要的核心是通过网络通信。”周正阳强调:“因此在安全性和隐私性这两个部分要做特殊设计,一盛你来给我和费老操作演示下这特殊的设计。”

  乔一盛点头如捣蒜:“好咧,周总、费老,你们看这儿,在连接之前,参与方的客户端和服务器是要进行身份确认的,除了最常见的密码之外,还可以是密钥和数字证书进行确认,避免有恶意的客户混入其中。”

  “其次就是在确认身份之后,会有模型的加密技术建立一个安全通道,用来传输模型的相关参数,当然这些都是要进行加密的。”

  之所以要进行加密,就是为了避免被窃听和篡改,从而影响到参与方的企业核心数据。

  费世杰好奇的追问:“那能不能详细介绍一下你提到的‘安全通道’,我理解是为了防止被窃取的,但如何进行加密呢?”

  本着‘活到老学到老’的一股韧劲,费世杰才想要多了解些。

  “这种安全通道无非就是给上传的数据‘上锁’并且只有对应的参与方才有‘开锁’的钥匙,一旦有恶意窃取的强行撬锁就会触发警报系统的。”

  乔一盛生动形象的解释并补充:“最常见的‘上锁’方式就是通信加密中的‘对称’加密。”

目录
设置
手机
书架
书页
评论