通知公告

生物成像中心计算组召开用户座谈会

发布时间:2018-01-17

  会议时间 :2018年1月16日下午15:30-17:30

  会议地点:9407

  参会人员 :生物成像中心主任孙飞研究员,高性能计算集群管理员牛彤欣助理工程师,中科院网络中心代表:信息化资源推广与服务部刘利萍老师、赵芸卿老师,业务发展处孙治川老师,高性能部副主任王彦棡老师,以及牛铁老师,张岩老师,杨二豪老师和生物物理所所内课题组用户代表

  本次座谈会由孙飞研究员主持,会议主旨为针对高性能计算集群管理、收费标准及用户服务等多方面内容听取用户的意见和建议。座谈会上,孙飞研究员就2017年高性能计算集群的发展规划、运行情况及此次座谈会召开的目的做了简单描述,之后牛彤欣助理工程师就高性能计算集群,包括所内集群与院超算集群“元”的2017年度运行服务情况做了详细介绍。 

\


  随后用户讨论环节中,用户就作业提交、资源需求、个性化需求等方面提出了意见和建议,具体讨论内容及反馈如下:

  一、 作业提交问题 :

  用户偶尔提交作业会出现资源空闲但作业排队得情况。

  发生原因:部分用户利用脚本提交作业,同一时间提交几十个作业,导致任务调度系统瘫痪

  解决方案:

  1. 针对批量提交作业的用户,协助或建议修改程序,间隔一两分钟提交作业。

  2. 发生任务排队时,管理员及时手动调度作用。

  二、 用户资源需求

  不同研究方向的课题组对于计算资源需求不尽相同,唯一相同的是大家都以尽快计算出结果为目的。

  解决方案:改变“元”的节点租用策略,未来从2月份开始实行

  1. 继续保持独享队列,包含40个独享节点。

  2. 申请开通非独享队列使用权限,鼓励有特殊计算需求,如计算资源需求两大等情况的用户使用非独享队列资源。

  3. 有特殊需求的用户,可单独申请队列,单独提出内存、硬盘等方面的需求,任务结束后,取消该队列,单独申请队列无cpu使用上限。

  4. 独享队列1.2元/cpu节点/小时;单独申请的特殊队列1.6元/cpu节点/小时。

  5. 网络中心GPU集群部署完成,GPU节点配置为每节点8块P100,256G内存,24个cpu,有GPU使用需求的用户可通过牛彤欣向网络中心申请开通GPU队列账户,2018年1、2月份为免费试用阶段,欢迎大家申请账户进行测试。

  三、 用户个性化需求

  1. 在“元”上,对于计算需求大的任务,经常在计算最后一步,由于磁盘存储空间限制导致任务被kill掉,但整个任务实际丢磁盘需求只有这一步比较大,计算完成中间结果会自动删除

  解决方案:不再按照用户申请的存储上限收费,按照年度用户实际占用存储空间平均值进行收费,使用户安新申请足够的存储空间。

  2. “元”上收费软件Gaussian09使用权限问题

  解决方案:有需求的用户单独开通该软件使用权限,院内用户免费。

  3. “元”上R包最新版本安装问题

  解决方案:用户将下载好的最新版R包传到“元”,由网络中心的老师帮助安装,网络中心可定期更新R包。

  4. “元”上同样的任务,同时提交多个任务时消耗的时间越来越长

  解决方案:用管理员帮助用户检查是否多个任务提交在同一节点,同时检查节点问题。

  四、 交流反馈

  计划每年召开用户用户交流会,了解用户需求,广泛听取用户意见和建议,分析高性能计算集群的使用效率及用户情况,酌情改变用户队列设置。增加用户培训的次数,进一步完善高性能计算平台建设及服务。

/>

联系我们

  • 地址:北京市朝阳区大屯路15号
  • 电话:010-64888419