全球招募 | 北京大学AI研究院多智能体中心学术冬令营
-
北京大学人工智能研究院多智能体中心学术冬令营开始招募啦~
在这里,你不仅可以跟随中心的老师们进行项目的研究与学习,增加你的科研实践经历;更能丰富人生体验,提高你的独立自主能力和创新精神。
2022~就让北京大学人工智能研究院多智能体中心学术冬令营陪伴你开启新的一年吧~项目方向:
基于合作型多智能体强化学习技术的双灵巧手控制
合作老师:杨耀东
课题:该课题将探索如何控制两只灵巧手进行的合作任务,例如端盘子,揉圆子,转魔方等。我们将探索如何使用多智能体强化学习技术进行对双灵巧手控制的建模,并且从合作博弈的角度出发设计算法。
参考文献:https://openreview.net/pdf?id=7uSBJDoP7tY https://openreview.net/pdf?id=EcGGFkNTxdJ
技能要求:熟悉强化学习基本概念,有调试强化学习算法相关经验。编程能力出众可破格。
周期:6-12个月。带有安全约束的多智能体强化学习算法设计与应用
合作老师:杨耀东
课题:符合安全性的强化学习技术具有着重要应用,例如无人驾驶,机械制造等等。本课题将研究如何在一个多智能体系统中设计具有安全性约束的强化学习过程。我们将探索满足安全性约束的强化学习框架, 并探索如何针对一个多智能体系统进行安全性的学习。
参考文献:https://arxiv.org/abs/2110.02793
技能要求:熟悉强化学习基本概念,有调试强化学习算法相关经验。编程能力出众可破格。
时期:6-12个月。基于强化学习算法的供应链管理实践
合作教师:彭一杰
研究内容:强化学习任务通常使用马尔科夫决策过程(Markov Decision Process,简称MDP)来描述,其包含两种最基本的元素:状态与动作,而在某个状态下执行某种动作,这便是一种策略。库存管理和物流交通管理是供应链管理中至关重要的两个部分,在库存管理中,因为库存量大,库存需求波动较大,库存补货速度缓慢等问题使得对其管理存在严峻挑战,现有研究表示:通过灵活设定状态、动作等要素,基于合理的强化学习算法选取最优策略,可以达到减少库存周转时间,降低库存成本等目的[1]。物流交通管理直观上是一个动态连续的过程,但通过合适的离散化处理以及函数逼近方法也能够使其适应强化学习的框架。本课题拟从上述两方面出发,研究设计出在大规模状态空间中,比现存算法更优的强化学习算法,并提炼出统一性的框架,使其成为解决该类问题的通用方法,从而提高问题解决能力,减少为类似大规模问题逐一精确设计启发式算法的时间。
课题要求:熟悉运筹学、动态规划和强化学习算法;熟练使用Python/Matlab编程。
参考文献
[1] Gijsbrechts, Joren, et al. “Can deep reinforcement learning improve inventory management? performance on dual sourcing, lost sales and multi-echelon problems.” Manufacturing & Service Operations Management (2021).
[2] Boute, Robert N., et al. “Deep reinforcement learning for inventory control: a roadmap.” European Journal of Operational Research (2021).合作教师:彭一杰
研究内容:金融作为现代经济的核心,在乡村振兴多元投入格局中具有基础地位和支撑杠杆作用,其风险治理水平直接影响着新时期农业农村高质量发展的稳定性。十八大以来,中央政府多次强调防范化解重大风险,尤其是金融风险,并相继颁布了系列治理措施。近些年,农村金融产品与服务的创新步伐不断加快,农村金融改革创新进程中的潜在风险问题值得高度重视。作为农地“三权分置”制度框架下我国农村金融改革的重要创新,农地经营权抵押融资在解决农户贷款抵押难、担保难问题,盘活农村存量资产、活跃农村经济方面发挥了显著作用。与此同时,不容忽视的是,因受限于土地产权交易市场发展滞后、农业经营主体信用体系不完善、抵押物价值不稳定以及风险管理体系不健全等多重因素,农地经营权抵押贷款业务开展面临着风险与收益不对等的困境。前期试点地区的部分银行或信用社农地经营权抵押贷款供给存在规模收缩或基本停滞现象。在此背景下,系统开展农地经营权抵押融资风险评估,尤其是农地抵押贷款业务的核心风险——信用风险评价研究,对于破解农地经营权抵押贷款症结、提高农地金融市场有效性具有重要现实意义。梳理已有研究看,已有研究集中于农地抵押贷款风险分类、引致因素及防控措施的定性分析,仅有少量学者对农地抵押贷款的风险因素进行了识别和评价,另有个别研究运用Logistic回归分析农地抵押贷款信用风险影响因素并预测违约概率,同时依据CreditRisk+模型,对信用风险衡量进行了研究。然而,已有研究存在两方面的不足:一是农地抵押贷款信用风险的关键参数估计方法存在不足,运用Logistic回归预测违约概率往往存在“信用得分很高,但违约率较高”的悖论;二是现有的个体信用风险研究大多只是得出个体信用评分,尚不能实现在估算出金融消费者的信用得分基础上,进一步计算出贷与不贷的临界值。而这个临界值才是真正可以为金融机构提供贷款决策参考的依据。
研究目标:
(1)利用机器学习相关方法(如随机森林、深度森林等)优化信用风险的关键参数估计,以提高信用得分评价有效性;
(2)可以在信用评分基础上,估算出贷与不贷的临界值(可以用系统仿真进行模拟)。
课题要求:
(1)具有金融风险相关的研究基础
(2)会运用机器学习、系统仿真相关方法
参考文献:
[1]吕德宏,张无坷.农地经营权抵押贷款信用风险影响因素及其衡量研究——基于CreditRisk+模型的估计,华中农业大学学报(社会科学版),2018(4):137-147.
[2] Milad Malekipirbazari, Vural Aksakalli. Risk assessment in social lending via random forests. Expert Systems with Application,2015,42:4621-4631.
[3] X. Ma, J. Sha, D. Wang, Y. Yu, Q. Yang, X. Niu, Study on A Prediction of P2P Network Loan Default Based on the Machine Learning LightGBM and XGboost Algorithms according to Different High Dimensional Data Cleaning, Electronic Commerce Research and Applications (2018), doi: https://doi.org/10.1016/j.elerap.2018.08.002等等…欢迎去官网查询
请将简历发送至:cmar@pku.edu.cn
邮件标题:AI院多智能体中心学术冬令营+项目名称+合作教师姓名