Blog

无痛的机器学习系统入门指南(二)- 模型部署

张怀政 论文题目:MLModelCI: An Automatic Cloud Platform for Efficient MLaaS 开源代码:https://github.com/cap-ntu/ML-Model-CI 深度学习正在改变生活中的方方面面。手中的APP,快递仓储物流的优化,蛋白质的预测,游戏的AI敌人等等,所谓“见面不谈人工智能,遍读诗书也枉然”。

Read More

深度强化学习的智能训练器

周昕 背景 基于模型的强化学习(Model-based Reinforcement Learning,MBRL)通过利用系统行为模型合成用于策略训练的的数据,被认为是解决强化学习中的高采样成本问题的一种有效方案。然而,MBRL框架受到优化控制策略、复杂目标系统的行为学习、以及复杂超参数控制等方面的限制。因此,在训练过程中往往需要大量的人工调整,成本极高。为了应对这一挑战,我们提出了一种“强化-强化学习”(Reinforcement on Reinforcement, RoR)的结构,将复杂的MBRL任务分解成两个相互耦合的强化学习“层”。其中,内层是标准的MBRL训练过程,属于标准的马尔科夫决策过程(Markov Decision Process, MDP),被称为“训练环境”(Training Process Environment, TPE)。外层则作为强化学习的智能体,用于学习内层TPE的最佳超参数配置,被称作“智能训练器”(Intelligent Trainer),如图1所示。该方法可以灵活的为不同的MBRL训练提供优化超参数和配置服务,我们称之为“Train the trainer”,意为使用强化学习来优化强化学习的训练过程。

Read More

FedReID: 联邦学习在行人重识别上的首次深入实践

庄伟铭 论文题目:Performance Optimization for Federated Person Re-identification via Benchmark Analysis 开源代码:https://github.com/cap-ntu/FedReID 行人重识别的训练需要收集大量的人体数据到一个中心服务器上,这些数据包含了个人敏感信息,因此会造成隐私泄露问题。联邦学习是一种保护隐私的分布式训练方法,可以应用到行人重识别上,以解决这个问题。但是在现实场景中,将联邦学习应用到行人重识别上因为数据异构性,会导致精度下降和收敛的问题。

Read More

MLModelCI – 自动化机器学习服务构建平台

黄以正 前不久,南洋理工大学的科研人员发布了一项最新的机器学习系统工作: MLModelCI — 一站式机器学习模型部署推理服务平台,该工作现在已经成功被接收为 ACM Multimedia 2020 的Open Source Competition Paper,欢迎访问开源地址:https://github.com/cap-ntu/ML-Model-CI 试用、反馈、贡献代码、参与到我们的开源工作中!

Read More

数字孪生: 点亮工业4.0的平行世界

王睿航 文 周昕 审阅 引言 随着工业4.0步伐的加速,产品生命周期管理(PLM)显得愈发重要。PLM是从产品需求开始到产品淘汰报废的全部生命历程,旨在提供有效的手段为企业创造收入,降低成本。目前,常规的技术包括数据管理,信息建模,信息追踪,知识管理以及集成化管理等模式[1]-[3]。传统的管理模式大多仅针对产品的单个信息维度或多个信息维度进行建模仿真,存在信息反映不全面,实时交互性差以及管理低效等问题。如何构建与实际产品完整且有效的交互体系已成为工业4.0发展的关键。

Read More