批量通过 SMILES 计算分子指纹的步骤如下:

  1. 准备一个包含多个 SMILES 字符串的文件,比如 txt 或 csv 格式的文件。

  2. 使用 Python 或其他编程语言,读取文件中的 SMILES 字符串并转换为分子对象。

  3. 利用分子指纹计算工具,比如 RDKit,OpenBabel 或 Chemopy 等,对每个分子对象计算指纹。

  4. 将计算出的指纹保存到一个新的文件中,比如 txt 或 csv 格式的文件。

下面是一个 Python 示例代码,使用 RDKit 计算 Morgan 指纹:

from rdkit import Chem
from rdkit.Chem import AllChem
import pandas as pd

# 读取 SMILES 文件
df = pd.read_csv('smiles.csv')

# 定义计算指纹函数
def get_morgan_fp(smiles):
    mol = Chem.MolFromSmiles(smiles)
    fp = AllChem.GetMorganFingerprintAsBitVect(mol, 2, nBits=1024)
    return fp.ToBitString()

# 对每个 SMILES 计算指纹并保存到新文件
df['fingerprints'] = df['smiles'].apply(get_morgan_fp)
df.to_csv('fingerprints.csv', index=False)

在上面的代码中,我们首先读取了一个包含 SMILES 字符串的 csv 文件,然后定义了一个函数get_morgan_fp,该函数使用 RDKit 计算每个分子的 Morgan 指纹。最后,我们对每个 SMILES 字符串应用该函数,并将计算出的指纹保存到一个新的 csv 文件中。

请注意,上述代码仅提供了一个示例,实际情况中可能需要根据具体的需求进行修改。

批量计算分子指纹:SMILES 到指纹的 Python 指南

原文地址: https://www.cveoy.top/t/topic/lUQP 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录