灵灵小说

手机浏览器扫描二维码访问

第137章 方案顺利通过验证(第1页)

第137章方案顺利通过验证

“老婆,你先带着女儿玩一会儿,我去书房处理点儿工作,就一会儿!”

思路涌来,郝成回到家不工作的承诺又要食言了。

“十点!”

宁荟能怎么样呢,还不是得由着他。

“用不了,最多一个小时!”

郝成伸出一根手指指着灯:“我保证!”

“德性!”

宁荟笑骂了一句,心里也是感叹:忙点就忙点吧,至少比起去年,这看起来开朗了许多。

……

今天确实不费什么脑筋,因为相关的知识早就在从前整理过了,只是当初没有重视。

来到书房,稍微翻一下之前记录下来的东西,郝成的思如泉涌,一下子就全都冒了出来。

如果说模型的训练提升是在做加法,让模型变得更大更强,那裁切、量化、蒸馏就是在做减法。

很多人可能会有疑问,做减法,那不是让模型变得更弱了吗?

理论确实是这样,但有时候,弱不弱的其实不是特别重要,只要使对了劲儿,一样能造的嗷嗷叫,发挥很大的作用。

比如,有些神经元节点的权重非常小,对模型加载信息的影响微乎其微,切掉它们,精度不会降太多,但却能大大的减少资源消耗。

还有,像小沙这样全量全知全能的模型,其部署和每一次的相应运算推理,都需要消耗较大的算力资源。

但事实上,每一次都是确有必要的吗?

显然并不是!

就拿小沙现在应用最广的软件开发能力来说,它就只需要精准需求的理解以及代码编写能力就够了,至于慢慢在增强的情感映射、主观判断等能力映射这些,那就完全没有必要!

不仅消耗了更多的算力,还拖慢了相应速度。

而且即便是需要的部分,也可以分层去处置:

还是拿软件开发能力来说,最粗略的,那就可以分为两部分:一部分是需求理解,另一部分是根据需求去做开发。

而这第二部分,那就只需要一个“软件开发”

的行业模型就够了。

所以,先在输入端就将用户需求分解,然后将小沙按需裁切为软件开发、法律服务、安全服务等小模型,根据分解的需求去调用其中一个,或者几个。

就比如之前被视为经典案例的小沙第一次庭审,那次的应对也不过是需要三个基础能力:语义理解、法律服务、软件开发能力。

只有极少数的情况,才需要去动用小沙的全量模型。

即便需要全量模型,全程调用全量模型,和只在有需要的步骤去调用全量模型,消耗的资源也是大相径庭的,但结果可能是一模一样。

……

“训练提升难住我了,裁切蒸馏还不是手拿把掐!”

深夜课堂学了这么久,郝成还是有几把刷子的,微意识体的模型训练力有未逮,但压缩郝成还是有办法的。

更何况,郝成还有小沙这个绝佳的辅助工具。

太子妃位被夺我转身嫁太子他爹陆凌瑶免费阅读无错版  裁员后我成了科技教父郝成免费阅读无错版  主角叫陆凌瑶的小说  蝴蝶效应  折腰无防盗章节  淼淼  魏劭小乔折腰笔趣阁未删减版  蝴蝶效应(兆壹北)无删减番外篇  杨悠悠笔趣阁免费阅读  折腰魏劭小乔免费阅读无错版  陆凌瑶太子妃位被夺我转身嫁太子他爹笔趣阁未删减版  裁员后我成了科技教父无防盗章节  蝴蝶效应by杨悠悠翠微居  主角叫郝成的小说  淼淼海棠文无删减  太子妃位被夺我转身嫁太子他爹无防盗章节  主角叫魏劭小乔的小说  绝尘烟客原创新书太子妃位被夺我转身嫁太子他爹  辰小序原创新书裁员后我成了科技教父  杨悠悠小说完整版  

热门小说推荐
武林店小二

武林店小二

江湖日报讯肯麦郎连锁客栈享誉大明各府,其总部却是京城一家名为来福的小客栈。来福客栈在江湖上大名鼎鼎,即便费用高昂,上到各派掌门下到江湖游侠,都挤破脑袋想去来福客栈吃顿饭。记者有幸请到武林盟主,揭开来福客栈的秘密!来福客栈日常一幕少林方丈,你怎么吃饭不给钱啊?偶弥陀佛,出家人身无分文,这顿饭可否算作化缘?不行!武当掌门没钱吃饭,还在后院洗碗呢!你若不给钱,就去洗茅房!来福客栈日常二幕丐帮长老,瞧你样子就没钱吃饭,你来客栈干啥?听闻来福客栈可以拿东西抵押,我这里有本上乘的秘...

大话之神

大话之神

一个热爱网络游戏的痴孩子,二不垃及的真神祝愿下进入了游戏的世界。。。。。。...

大国工程

大国工程

余庆阳一个搬砖二十年的老工程,梦回世纪之交,海河大学毕业,接老爸的班继续搬砖。用两辈子的行动告诉老师,搬砖不是因为我学习不好!是我命中注定要搬砖已有两本百万字完本书超级村主任最强退伍兵,可以放心入坑!大国工程书友群,群聊号码492691021新书重生之大国工匠...

每日热搜小说推荐