崩溃!别人质粒秒到,我苦等半年发现序列全错……这些公益平台早该用起来

崩溃!别人质粒秒到,我苦等半年发现序列全错……这些公益平台早该用起来

图片来源:自媒体平台网友分享

这个效率如此之高的西湖实验室,到底是个什么来头呢?

2020 年 7 月,西湖大学牵头,联合浙江大学药学院和杭州市第一医院集团,共同建设成立了「生命科学和生物医学浙江省实验室」,它的「小名」叫西湖实验室。

图片来源:西湖大学官网

截止今年 4 月,实验室已在高水平期刊上发文超过 200 篇,在Cell、Nature 等国际顶刊上发表论文 18 篇。而作为经浙江省政府批准设立的首批省级实验室之一,西湖实验室致力于打通从基础研究到产业转化的全链条,构建「前沿研究-技术攻关-成果转化-产业培育」的一体化创新体系,五年时间里孵化出的 42 家企业中,已有 8 家达到准独角兽规模。

2023 年 12 月,西湖实验室建设并发布了「WeKwikGene 质粒库」,为国内科研人员提供速度快、质量高、经过验证且随时可用的质粒资源,满足国内科研人员对质粒等分子生物学操作工具的共享需求。

图片来源:WeKwikGene 质粒库官网

WeKwikGene 质粒库由西湖实验室 Kiryl D. Piatkevich 团队发起,免费存储和分发质粒,缩短从国外获取需 4-6 个月的等待期,极大提高科研创新效率。

截至今年年中,已有包括西湖大学、北京大学、浙江大学、复旦大学、清华大学、中国科学院等188 个科研机构的 364 个实验室接入 WeKwikGene 质粒库。共有 49 个实验室累计在平台储存质粒 1200 余个。已有916个质粒通过 WeKwikGene 免费共享到全国 50 个城市的科研实验室。

*官网网址:https://wekwikgene.wllsb.edu.cn/

还有哪些科研平台值得用呢?

除了西湖实验室的 WeKwikGene 质粒库,能帮助科研人的公益性平台还真不少,学霸君在这就挑几个代表性的说说(以下排名不分先后)。

1. PubScholar

图片来源:PubScholar 官网

平台资源每日持续更新。目前平台可检索的元数据资源量约 1.8 亿条,包括科技论文元数据约 1 亿条,科技专利元数据约 8,364 万条,科学数据元数据约 58 万条。

除此之外,平台还嵌入了 AI 大模型技术,提供 AI 检索、智能综述、多语种翻译等功能,还能主动推送高价值文献。截至目前,访问量已超 10 亿次,注册用户 37 万+,覆盖 158 个国家/地区。

*官方网址:https://pubscholar.cn/ 或 https://openscholar.las.ac.cn/

2. OpenSign

清华大学图书馆推出的 OpenSign 公益性学术资源服务平台于 2024 年 11 月已正式上线,整合超过 1000 万篇全球优质 OA 论文,为社会公众提供从资源检索到全文获取的一站式资源服务,面向国内外合作机构提供深度数据服务,并面向学者提供学者主页服务。

图片来源:OpenSign 官网

OpenSign 平台主要是推广开放获取的学术资源,并开设了开放科学微信公众号,追踪开放科学与开放获取各领域的最新实践,为学者和机构提供开放科学相关的新闻动态、政策研究、出版支持等资讯。

*官方网址:

https://opensign.lib.tsinghua.edu.cn 或 https://opens.lib.tsinghua.edu.cn

3. SDBS

SDBS 是日本产业技术综合研究所(National Institute of Advanced Industrial Science and Technology,AIST)旗下 National Institute of Materials and Chemical Research(NIMS)开发的有机化合物的光谱综合性数据库。

图片来源:SDBS 官网

数据库收录质谱近 2 万张,1H NMR 约 13500 张,13C NMR 约 11000 张,IR 约 47300 张,拉曼光谱约 3500 张,电子自旋共振谱约 2000 张。

但非常可惜的是,自 2018 年 6 月 14 日之后,数据库就没有再更新过新的谱图。

*官方网址:https://sdbs.db.aist.go.jp/

4. PDB 蛋白质结构数据库

国际上最著名、最完整的蛋白质三维结构数据库是 1971 年美国纽约布鲁克海文国家实验室创建的 Prorein Data Bank(PDB),收录通过 X 射线单晶衍射、核磁共振、电子衍射等实验手段确定的蛋白质、多糖、核酸、病毒等生物大分子的三维结构。数据库目前收录近 24 万个蛋白质结构,以及近 107 万蛋白计算结构。

图片来源:PDB 官网

2003 年,PDB 走向世界,与英国和日本的研究者联合成立 Worldwide PDB,让更多人能够免费使用该数据库。

*官方网址:https://www.rcsb.org/

5. UniProt 蛋白质序列数据库

Uniprot(The Universal Protein Resource)是一个免费开放的综合性蛋白质数据库,整合了EBI(European Bioinformatics Institute),SIB(the Swiss Institute of Bioinformatics),PIR(Protein Information Resource)三大数据库的资源,是当前国际上序列数据较完整、注释信息较丰富的蛋白质序列数据库。

图片来源:UniProt 官网

UniProt 目前包括四个子库:

UniProt Knowledgebase(UniProtKB)数据库由Swiss-Prot和TrEMBL两个数据库构成;

Proteomes 数据库收录已经完成全基因组测序的物种、序列翻译已有注释的蛋白质信息,信息相对全面详细;

UniRef 通过聚类序列隐藏冗余序列以缩减数据库大小,可加快搜索的速度,包含UniRef100、UniRef90 以及 UniRef50 三个数据集;

UniParc 是非常全面的非冗余数据库,包含了世界上大多数公开的蛋白质序列。

此外,UniProt 还有提供数据支撑和不同索引方式的辅助数据,以及多种分析工具。

*官方网址:https://www.uniprot.org

6. Biomni

Biomni 是斯坦福 SNAP 团队开发的一款通用型生物医学 AI Agent,本周刚刚开源。结合大语言模型推理能力、信息检索、代码执行三大引擎,Biomini 的目标是让科学家只用一句自然语言就能完成复杂的科研任务。

图片来源:Biomni 官网

Biomni 包含了从基因编辑到蛋白质结构预测的 150 个专业工具,59 个核心数据库,能够总结文献,对基因测序的结果进行解读,还能够根据用户需求和参考文献设计实验方案并提示标志物和样本量,还能给出实验每个阶段的预期目标。

如果一般的通用大模型是通才,那么 Biomini 则是专门针对生物医学领域的 AI 专才。开源后的 Biomni 将源代码放在 Github,感兴趣的伙伴可以直接下载后使用。

*官方网址:https://biomni.stanford.edu/

7. 全球科技文献数据平台

今年 7 月 2 日,我国发布了具有完全自主知识产权的东壁全球科技文献数据平台,共收录全世界范围内近 9000 万条高质量科技文献元数据。

图片来源:全球科技文献数据平台官网

该平台基于 AI 算法提供高效的文献检索、引文分析和数据追踪等服务,其基础功能对全球用户免费开放。

目前,该平台仅支持英文关键词检索,但平台引入的「学者成果解读」和「综述自动生成」两大 AI 功能,相当于给每个用户都配备了「AI助手」,用户可以用通俗的语言向 AI 助手询问每一个学者的研究方向、研究特色、突出贡献,甚至可以进行不同学者之间的研究对比。

*官方网址:https://www.dbdata.com/search/

使用公益平台的几点建议

作为科研人员,能有各种公益性科研平台助力自己的科研,提高实验效率,缩短成果周期,这可真是大好事儿。可咱用归用,有些规矩还是要知道的。

首先,要注意访问时的规范使用

首先,要注意访问时的规范使用

即便是公益资源,通常也禁止商业用途。例如,贵安超算中心就明确要求,免费计算资源仅限科研项目,不得用于盈利活动,违者将终止服务并追责。另外,有些平台在用户使用其资源时,会要求使用者遵守材料转移协议,明确使用范围,以及禁止泄露未公开数据。

其次,合理访问,避免系统过载

其次,合理访问,避免系统过载

正常使用,千万不要用插件或者外挂抢夺资源。比如,PubScholar 刚发布的时候,就曾因访问量骤增,服务器过载导致瘫痪。值得一提的是,很多平台都禁止使用类似爬虫程序的高并发工具,并且禁止批量下载文献或数据。

图片来源:PubScholar 官网

其三,严格遵守平台的制度

其三,严格遵守平台的制度

在使用公共实验平台设备与资源时,如果有要求,请先接受培训考核,并严格执行预约制度。

第四,尽可能多地引用平台信息到论文

第四,尽可能多地引用平台信息到论文

如果能在发表的论文里引用一下使用过的科研平台,增加平台的曝光,那一定是极好的。引用方式一般都由平台给范例,直接复制就好。比如 UniProt 就有专门页面介绍如何引用,还给出了最新的例子。

图片来源:UniProt 官网

SDBS 平台也专门在主页上呼吁研究者在致谢中提一下自己,同样也给出范例。

图片来源:SDBS 官网

另外,主动参与平台优化,更新现有工具,通过官方渠道反馈系统漏洞或建议什么的,也非常不错。比如 Biomini 就在 Github 主页上邀请全球的研究者共同建设,欢迎提供新工具、数据集、软件、评估基准及其他诸如教程、示例和用例的所有资源。

图片来源:Biomni 官网

当然,这些都不是强制的。

结尾

最后,还要强调一点,公益科研平台未必就一定是免费的,搭建运行都需要成本,但相比费用更高的营利性机构,这些公益科研平台已经在为每个科研人提供最大的便利。

咱们用的时候,一定合理使用,即便不为平台做贡献,也要积极去维护。

资料来源:

1.各数据库、超算中心等科研平台官网

2.自媒体平台网友分享资讯

4.https://mp.weixin.qq.com/s/OSf1-Mr-c1drYTufHh5Jlg

题图来源:图虫创意返回搜狐,查看更多

🔍 相关推荐