admin 管理员组

文章数量: 887021

文章目录

  • 前言
  • 一、选择合适的分子范围
  • 二、数据集下载
  • 三、Windows安装Wget
  • 四、准备就绪,傻瓜式下载分子集!
  • 总结


前言

使用Windows环境,在进行分子对接或者人工智能分子筛选时需要从ZINC数据库中下载小分子数据集可参考以下步骤。


一、选择合适的分子范围

  1. 进入ZINC15网站 点击这里
  2. 点击Tranches
  3. 可按条件根据个人需求选择合适的分子范围

二、数据集下载

  1. 选好合适分子范围后点击下载

  2. 下载界面我们可以选择时间、下载文件类型和下载方法,这里由于我只需要获取smiles分子式因此选择smi文件,下载方法选WGET

  3. 下载完成后你会获得一个.wget文件,其中包含了多个wget指令对应下载多个分块子集中的分子(可用记事本打开查看)

三、Windows安装Wget

  1. Windows环境需要手动安装Wget指令,点击这里下载Wget,下载ZIP或EXE都可以(ZIP解压后包含EXE文件),然后将下载下来的wget.exe执行文件放入C:\Windows\System32
  2. 完成上步之后可以管理员打开cmd输入wget -help查看是否安装成功,如果显示了一串指令帮助说明安装成功

四、准备就绪,傻瓜式下载分子集!

  1. 将前面下载的.wget文件后缀改成.bat
  2. 将修改后的.bat文件放入你想要下载数据集的目录下(比如这里我建立了一个datasets文件夹用来存放数据),然后直接双击运行.bat文件!(注意 !不要!以管理员身份运行
  3. 然后系统会自动执行里面的wget指令进行下载,耐心等待下载完成即可!

总结

本文写于2022.6.17,ZINC网站使用方法和分子范围可能会随时间进行更新变化,请以网站说明为准

本文标签: 批量 库中 分子 简单 环境