即便没有今天的这个能力+0.1,他事实上也已经有了一些相关的思路和想法。
毕竟之前已经做过gpu流处理核心的ai智慧调度,大规模显卡的算力均衡调度算法与其是有共通之处的。
纪弘甚至都已经做了好几套的算法方案,就等实施验证,而对此,他本来就是信心十足的。
而今天又得到了相关能力+0.1,思路那是更加的广阔和清晰了。
“类思考模型,这算是根。”趁着程荟在厨房忙活的功夫,纪弘坐在沙发上整理了一下思路,发现了问题的根本所在:
“其实如果我这几天的思路多往这上边靠靠,甚至都不用这个能力+0.1,我也能想出同样的方案!”纪弘愤愤想道,他本来就是有实力的。
……
“老婆,你知道什么叫类思考模型吗?”饭桌上,纪弘准备给程荟说一说类思考模型的事儿:“上一次跟你说ai训练强化学习的相关东西你还记得吧?”
“当然记得。”如果说技术,程荟可能还真记不住,但当时纪弘说了打小孩儿,她就记住了一部分:
“就像教小孩儿一样,可以设定一个奖赏规则,做的好了给个奖励,做不好就给一巴掌。模型的话,就是在这种不断地反馈与调节中去寻找能获得最大奖赏的最佳选择。大约是这样吧?”
纪弘点了点头,程荟虽然不是相关专业的,但是对理念的理解还是非常到位的,所谓奖赏规则,在强化学习中就是一个预先设定的奖赏函数。
“这种说的就是现在的普通强化学习,它的学习能力很差,就像学校里的差等生,不开窍,不管你怎么教,他就是学不会。