点击切换搜索课件文库搜索结果(8164)
文档格式:PDF 文档大小:3.33MB 文档页数:99
背景 MDPs 强化学习问题 蒙特卡洛方法 (Monte Carlo Methods) 蒙特卡洛预测(Monte Carlo Prediction) 蒙特卡洛控制(Monte Carlo Control) 时序差分学习 (Temporal-Difference Learning) 时序差分预测(TD Prediction) 时序差分控制(TD Control) Sarsa:on-policy Q-learning : off-policy 策略梯度 (Policy Gradient) Monte-Carlo Policy Gradient Actor-Critic Policy Gradient 深度强化学习 Deep Q-Networks (DQN) Policy Gradients for Deep Reinforcement Learning
文档格式:DOC 文档大小:415.5KB 文档页数:6
一、单项选择题(本大题共 25 小题,每小题 1 分,共 25 分) 在每小题列出的四个备选项中只有一个是符合题目要求的,请将其代码填写在题后的括号内。错选、多选或未选 均无分。 1.作为 XML 文件,其必要条件是( D ) A.可索引化 B.能够描述一定的信息 C.以 XML 为第一个标记开头 D.符合“结构良好的”标准
文档格式:DOC 文档大小:183KB 文档页数:6
一、单项选择题(本大题共 25 小题,每小题 1 分,共 25 分) 在每小题列出的四个备选项中只有一个是符合题目要求的,请将其代码填写在题后的 括号内。错选、多选或未选均无分。 1.在 CSS 中文本垂直对齐属性 vertical-align 的取值 top 表示( D ) A.写在其它元素中线的上方 B.写在其它元素基线的上方 C.以其它文本元素的顶线作为被定义元素的底线 D.以其它普通元素的顶线作为被定义元素的顶线
文档格式:DOC 文档大小:760.5KB 文档页数:9
一、单项选择题(本大题共 20 小题,每小题 1 分,共 20 分) 在每小题列出的四个备选项中只有一个是符合题目要求的,请将其代码填写在题后的括号内。错选、多选或未选均无分。 1.域名系统能够将( D ) A.域名转换成主机名 B.主机名转换成域名 C.主机名转换成 IP 地址 D.域名转换成 IP 地址
文档格式:PPT 文档大小:424.5KB 文档页数:68
一、成本概念 二、成本函数 三、贡献分析法及其应用 四、 盈亏平衡点分析法及其应用 五、成本函数的估计
文档格式:PDF 文档大小:387.93KB 文档页数:23
6.1 统计量 6.2 由正态分布导出的几个重要分布 6.3 样本均值的分布与中心极限定理
文档格式:PDF 文档大小:805.28KB 文档页数:60
5.1 随机事件及其概率 5.2 离散型随机变量及其分布 5.3 连续型随机变量的概率分布
文档格式:PPT 文档大小:633.5KB 文档页数:15
一:案例回顾 二:本案涉及问题 三:案例分析 四:责任认定 五:结论 六:看法和建议
文档格式:PPT 文档大小:393KB 文档页数:43
13.1产业关联的内涵 13.2产业关联分析工具 13.3产业间的结构分析 13.4产业间的波及效果分析
文档格式:PPT 文档大小:6.64MB 文档页数:51
一、 应力状态概述 二、二向应力状态(解析法) 三、二向应力状态分析(图解法) 四、三向应力状态和最大剪应力 五、位移与应变分量 六、平面应变状态分析 七、广义虎克定律
首页上页508509510511512513514515下页末页
热门关键字
搜索一下,找到相关课件或文库资源 8164 个  
©2008-现在 cucdc.com 高等教育资讯网 版权所有