Bohrium(玻尔)
综合介绍
Bohrium是由深势科技开发的一个云端科研平台,它为科学研究(AI for Science)提供了强大的支持。这个平台集成了大量开箱即用的科学计算软件和开发环境,让研究人员可以通过网页浏览器直接访问和使用高性能的计算资源。Bohrium的核心是提供一个便捷、高效的计算工作区(Workspace),用户无需在本地配置复杂的环境,就可以运行包括分子动力学、第一性原理计算、深度学习等多种类型的科研任务。平台还提供了类似于Jupyter Notebook的在线交互式开发功能,方便用户编写代码、进行数据分析和分享研究成果。同时,Bohrium支持团队协作,成员可以共享计算环境和项目文件,并通过精细的权限和预算管理,让合作研究更加顺畅。
功能列表
- Bohrium Workspace(计算工作区):提供一个预装了大量科学计算软件的云端环境,例如LAMMPS、GROMACS、Quantum Espresso、VASP、TensorFlow等,用户无需本地安装即可使用。
- Bohrium Notebooks:提供在线的交互式代码开发环境,兼容Jupyter Notebook。它让代码和环境可以一键分享,方便研究成果的复现和学习。
- 高性能计算资源:整合并调度了庞大的CPU和GPU计算集群,用户可以按需付费使用,无需排队等待计算资源。
- 团队协作功能:支持多人项目,可以共享环境镜像,统一团队成员的计算环境。同时提供预算分配和监控功能,方便项目负责人管理开支。
- 命令行工具:为高级用户提供了命令行工具(Lebesgue Utility),可以通过命令行管理和提交计算任务,操作文件和项目。
- Bohrium Apps:允许研究者将算法代码快速打包成易于使用的在线应用,加速科研想法的验证和分享。
- 学术资源搜索:内置了强大的学术搜索引擎,整合了海量的论文、专利和学者数据,辅助研究人员进行文献调研。
使用帮助
Bohrium平台致力于简化科学计算的流程,让研究人员能将更多精力投入到研究本身,而非复杂的环境配置和资源管理。以下是上手使用Bohrium平台的主要功能操作流程。
第一步:注册与登录首先,用户需要访问Bohrium的官方网站并完成注册。平台通常支持机构邮箱或公开的邮箱服务进行注册。对于高校和研究机构的用户,Bohrium可能提供通过机构认证的专属登录通道,以实现对学术资源的无缝访问。
第二步:熟悉仪表盘和项目管理登录后,用户会进入个人仪表盘或工作区。这里是管理所有科研项目的中心。
- 创建项目:在仪表盘中,你可以创建一个新项目。每个项目都是一个独立的工作空间,拥有自己的文件存储、计算任务和成员。创建时,你可以为项目命名,并添加项目描述。
- 管理文件:每个项目都包含一个文件管理器。你可以通过网页界面直接上传本地数据文件、代码脚本或输入文件,也可以从URL下载文件到项目中。文件管理系统让你能够方便地组织和调用研究数据。
第三步:使用Bohrium Notebooks进行交互式计算对于需要编写代码、进行数据分析和可视化的任务,Bohrium Notebooks是首选工具。
- 启动Notebook实例:在你的项目中,选择“Notebooks”功能,然后新建一个Notebook。启动时,你需要选择一个计算节点规格(例如CPU或GPU的配置)和一个预设的环境镜像。这些镜像已经安装了常用的Python库(如PyTorch, TensorFlow)和科学计算包(如DeePMD-kit, RDKit)。
- 编写和运行代码:启动后,你会进入一个熟悉的Jupyter Notebook界面。在这里,你可以像在本地一样编写Python代码,进行数据处理、模型训练和结果可视化。因为计算在云端执行,所以你可以轻松处理大规模数据和复杂的计算任务,而无需担心本地计算机的性能瓶颈。
- 分享与协作:完成的Notebook可以一键分享给同事或合作伙伴。接收者可以在完全相同的环境下打开并运行你的代码,极大地提升了科研成果的可复现性。
第四步:提交和管理批量计算任务对于需要长时间运行的、大规模的计算任务(如分子动力学模拟或第一性原理计算),可以通过任务提交系统来执行。
- 准备输入文件:首先,将计算所需的输入文件(例如LAMMPS的
in
文件或VASP的POSCAR
、INCAR
等)上传到项目的文件区。 - 提交任务:进入“任务(Jobs)”管理页面,点击“提交新任务”。你需要填写以下信息:
- 任务名称:为你的任务起一个识别名。
- 计算节点:选择执行任务所需的计算资源,如CPU核数、GPU卡数和内存大小。
- 软件环境:选择一个预置了所需软件(如LAMMPS, VASP)的镜像。
- 执行命令:填写任务执行的命令,例如
lmp -in run.in
或vasp_std
。
- 监控任务和查看结果:提交后,任务会进入调度系统排队执行。你可以在任务页面实时查看任务状态(排队中、运行中、已完成、失败)。计算过程中产生的输出文件和日志会实时同步回项目的文件区,你可以随时在线预览或下载这些结果,而无需等待整个任务结束。
第五步:使用命令行工具(高级功能)对于习惯使用命令行的用户,Bohrium提供了名为 lebesgue
的命令行工具。
- 安装与配置:根据官方文档的指引,在你的本地计算机上安装该工具,并使用你的账户凭证进行配置。
- 管理任务与文件:配置完成后,你可以直接在本地终端中通过命令管理云端的资源。例如,使用
lebesgue job submit
提交任务,lebesgue file upload
上传文件,以及lebesgue node ssh
直接登录到正在运行的计算节点进行调试。这为自动化工作流和高级用户提供了极大的灵活性。
应用场景
- 计算材料学研究研究人员可以利用Bohrium平台进行材料属性的模拟计算。例如,使用预装的Quantum Espresso或VASP软件,进行第一性原理计算,分析晶体结构、电子能带和磁性。整个过程无需在本地安装复杂的软件和依赖库。
- 生物信息学与药物设计在药物研发领域,研究者可以使用GROMACS或LAMMPS进行分子动力学模拟,研究蛋白质与小分子的相互作用。 此外,可以借助Bohrium Notebooks运行集成了Uni-Mol等AI模型的代码,进行分子属性预测或虚拟筛选,加速新药发现进程。
- 人工智能与深度学习AI研究者或学生可以在Bohrium上快速搭建深度学习实验环境。平台预装了TensorFlow和PyTorch等主流框架,用户可以直接在Notebook中加载数据、构建和训练模型,并利用平台提供的GPU资源加速训练过程。
- 科研教学与培训教师可以创建一个Bohrium项目,将课程所需的软件、代码和数据集预置在共享的环境镜像中。学生们只需通过浏览器登录,就能获得完全一致的实验环境,从而专注于学习课程内容,而非耗时在环境配置上。
QA
- Bohrium平台是免费的吗?平台通常会提供一定的免费使用额度,供用户体验和进行小规模的计算。对于超出免费额度的大规模计算需求,平台会采用按量计费的模式,根据所使用的计算资源(如CPU核时、GPU卡时)进行收费。
- 在Bohrium上运行计算,我的数据安全吗?根据官方说明,Bohrium非常重视用户数据的安全和保密。平台承诺不会将用户的个人数据或研究数据用于任何模型训练目的,确保研究的机密性。
- 我需要学习新的软件或编程语言才能使用Bohrium吗?不需要。Bohrium旨在与研究人员现有的工作流程兼容。它支持标准的命令行操作和Jupyter Notebook环境,如果你已经熟悉Linux命令行和Python,就可以轻松上手。平台的核心价值在于免去了环境配置和硬件管理的麻烦,而非改变你的研究方式。
- 相比于本地工作站或学校的超算中心,使用Bohrium有什么优势?Bohrium的主要优势在于便捷性和弹性。它开箱即用,省去了软件安装和维护的时间。计算资源弹性伸缩,可以按需使用,避免了本地工作站性能不足或超算中心需要排长队的限制。同时,它的协作功能也比传统计算方式更加高效。