多选题
发布日期:2021-09-22
监督式学习
非监督式学习
半监督式学习
强化学习
非监督学习是指在没有类别信息情况下,通过对所研究对象的大量样本的数据分析实现对样本分类的一种数据处理方法。
监督式学习(英语:Supervised learning),是一个机器学习中的方法,可以由训练资料中学到或建立一个模式(函数 / learning model),并依此模式推测新的实例。训练资料是由输入物件(通常是向量)和预期输出所组成。函数的输出可以是一个连续的值(称为回归分析),或是预测一个分类标签(称作分类)。
强化学习(Reinforcement Learning, RL),又称再励学习、评价学习或增强学习,是机器学习的范式和方法论之一,用于描述和解决智能体(agent)在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题。强化学习的常见模型是标准的马尔可夫决策过程(Markov Decision Process, MDP)。按给定条件,强化学习可分为基于模式的强化学习(model-based RL)和无模式强化学习(model-free RL),以及主动强化学习(active RL)和被动强化学习(passive RL)。强化学习的变体包括逆向强化学习、阶层强化学习和部分可观测系统的强化学习。求解强化学习问题所使用的算法可分为策略搜索算法和值函数(value function)算法两类。深度学习模型可以在强化学习中得到使用,形成深度强化学习。强化学习理论受到行为主义心理学启发,
题王网让考试变得更简单
扫码关注题王,更多免费功能准备上线!
此试题出现在
其他考试
以突然昏仆,不省人事,半身不遂,口舌歪斜,言语蹇涩或不语,偏身麻木为主症的病证是:()
甲公司董事会确定实施风险管理,并推行了一段时间,但由于风险管理会涉及到方方面面,遇到了一些阻碍,于是专门召开会议研究这个问题。会上,风险管理小组组长钱某列举了以下几点,其中不属于实施风险管理阻碍因素的是( )
下列关于火灾自动报警系统设备检测数量要求的叙述中,正确的是()。
满膛撑板的头挡铁撑柱距地面不大于()m。
在沉积岩性纵向变化大、不易找到标准层的情况下,利用岩石的颜色、矿物成分、结构、构造等的差异来划分和对比地层的方法属于岩性组合法。()
企业获取利润的黄金季节是()。
清代颇有影响的《芥子园画传》把中国美术教学传统的基于师承关系的()推向高峰。
简述知识产权法律规范的渊源。
3月初,某轮胎企业为了防止天然橡胶原料价格进一步上涨,买人7月份天然橡胶期货合约100手(每手10吨),成交价格为24000元/吨,对其未来生产需要的1000吨天然橡胶进行套期保值。当时现货市场天然橡胶价格为23000元/吨。之后天然橡胶未涨反跌。至6月初,天然橡胶现货价格跌至20000元/吨。该企业按此价格购入天然橡胶现货1000吨,与此同时,将天然橡胶期货合约对冲平仓,成交价格为21000元/吨。该轮胎企业的盈亏状况为()。
下列对喉麻痹的描述,不正确的是()