1 分•作者: mireklzicar•12 个月前
输入一个SMILES字符串(或从示例中选择一个分子),它将返回与该分子在三维形状或静电相似性上最接近的,来自超过100亿规模数据库的最多10万个分子——通常在5-10秒内完成。<p>*它可能引起HN关注的原因*<p>* 整个索引存储在<i>磁盘</i>上——查询时无需GPU,总共占用RAM不到10 GB。
* 从头开始构建(未使用FAISS索引 / Milvus / Pinecone)。
* 索引构建成本:一个Nvidia T4卡(约300美元)用于一个55亿的数据库。
* 任何人都可以使用,预测ADMET性质,并将结果导出为CSV/SDF格式。<p>完整的论文和基准测试(DUD-E, LIT-PCBA, SVS)见预印本:
<a href="https://chemrxiv.org/engage/chemrxiv/article-details/67250915f9980725cfcd1f6f" rel="nofollow">https://chemrxiv.org/engage/chemrxiv/article-details/6725091...</a>