强引用、弱引用、软引用、虚引用
|
在工艺上,十一代酷睿采用增强的10nm制程工艺,首次加入全新的SuperFin晶体管技术,官方表示它甚至重新定义了FinFET工艺,号称可带来堪比完全节点转换的性能提升,要知道10nm工艺的晶体管密度就有1亿/mm2,达到了其他家7nm工艺的水平。 得益于先进的工艺,十一代酷睿CPU的加速频率从上代的3.9GHz一下子提升到4.8GHz,功耗没涨的情况就提升了20%的性能。
CPU方面,十一代酷睿升级到了Willow Cove架构,最多4核心8线程,大幅提升频率、能效,重新设计缓存体系,频率可以达到4.8GHz。 用电脑这么多年,大家现在能分清CPU和处理器的关系吗?很多年中,大家默认处理器就等于CPU,后者全称是中央处理器,一个人就能演完整场戏,不过现在的处理器可要复杂得多了,不只是有CPU的份儿了。 以Intel为例,他们对自家酷睿的叫法是“智能处理器”,多年来不断地丰富处理器的内涵,从单纯的CPU开始,之后增加了核显GPU,最近几代则是增加了AI核心,成为名副其实的智能处理器,特别是在Tiger Lake十一代酷睿处理器上。 目前在x86处理器中,只有Intel的酷睿处理器是做到了CPU、GPU、AI三位一体的,这也是未来处理器发展的三大核心方向。 十一代酷睿处理器升级:CPU、GPU、AI三位一体 2020年9月初,Intel正式发布了十一代酷睿智能处理器,代号Tiger Lake,首批产品主要用于笔记本电脑,号称近年来处理器史上一次巨大飞跃。
之所以这么说,是因为十一代酷睿中从工艺到架构都有极大变化,升级力度在这几代酷睿中是非常明显的,10nm工艺、CPU、GPU及AI全都变了。 基于价值VS 基于政策 RL算法的另一种分类方法是考虑算法优化了价值函数还是策略。在深入了解之前,我们先了解策略和价值功能。 (1) 策略 策略π是从状态s到动作a的映射,其中π(a | s)是在状态s时采取动作a的概率。策略可以是确定的,也可以是随机的。 假设我们在玩剪刀石头布这个非常简单的游戏,两个人通过同时执行三个动作(石头/剪刀/布)中的一个来比输赢。规则很简单:
把策略看作是迭代的剪刀石头布
(2) 价值函数
价值函数是根据对未来回报(返回值)的预测来衡量状态良好程度的函数。返回值(Gt)基本等于“折扣”回报的总和(自t时起)。 (编辑:唐山站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |


