文章摘要
茉灵智库
AI正在彻底改变科学研究——从药物发现和材料设计到气候建模和天体物理学。本资源库汇集了最佳资源,帮助研究人员在工作中利用AI技术
🧪 AI 科研工具
文献与知识管理
- Semantic Scholar - AI驱动的学术搜索引擎 (Allen AI)
- arXiv - 开放获取的电子预印本和后印本存储库
- OpenAlex - 开放的学术论文和作者目录
- CORE - 开放获取研究论文聚合平台
数据分析与可视化
- PandasAI - 使用自然语言进行对话式数据分析
- AutoViz - 以最少代码实现自动化数据可视化
- Chat2Plot - 通过标准化图表规范实现安全的文本到可视化转换
数据标注与注释
- Label Studio - 多类型数据标注与注释工具
- Snorkel - 程序化数据标注与弱监督
📄 论文→海报/幻灯片/图形摘要
海报生成
- Paper2Poster - 采用解析器-规划器-绘制器架构的多智能体系统,将
paper.pdf
转换为可编辑的poster.pptx
,以87%更少的token消耗超越GPT-4o表现
- mPLUG-PaperOwl - 用于科学图表理解与生成的多模态大语言模型
幻灯片与演示生成
- Auto-Slides - 基于多智能体系统将学术论文转化为高质量演示文稿,支持交互式优化
- PPTAgent - 超越文本转幻灯片生成,提供PPTEval多维度评估框架(EMNLP 2025)
- paper2slides - 使用大语言模型将arXiv论文转换为Beamer幻灯片
- PaperToSlides - 基于AI的自动化工具,可将学术论文(PDF格式)转换为演示文稿
- pdf2slides - 仅需三行代码即可将PDF文件转换为可编辑幻灯片
- SlideDeck AI - 基于生成式AI,从文档或主题协同创建PowerPoint演示文稿
- AI Multi-Agent Presentation Builder - Azure Semantic Kernel多智能体PPT生成参考实现
视频与媒体生成
- Paper2Video - 首个从科研论文自动生成视频的基准框架(NeurIPS 2025)
- paper2video - 将arXiv研究论文转化为引人入胜的演示文稿和YouTube适配视频
图表与可视化生成
注:关于全面的图表理解和代码生成工具,请参阅📊 图表理解与生成章节
📊 图表理解与生成
图表转代码与可复现性
- ChartCoder (ACL 2025) - 用于图表转代码生成的多模态大语言模型,7B模型性能超越更大的开源MLLMs
- ChartAssistant / ChartAst (ACL 2024) - 通用图表理解与推理模型
- Chart-to-Text Datasets - 大规模图表摘要数据集,用于训练图表描述能力
科学可视化工具
- Chat2Plot - 通过标准化图表规范实现安全的文本到可视化转换
- AutoViz - 以最少代码实现自动化数据可视化
- PlotlyAI - 基于AI的数据可视化和仪表板创建
🔄 论文到代码与可复现性
自动化代码生成
- AutoP2C - 从学术论文生成可运行代码库的LLM智能体框架
- ResearchCodeAgent - 用于研究方法自动编码化的多智能体系统
- ToolMaker - 将含代码的论文转换为可调用智能体工具
实验自动化
- BioProBench - 用于LLM在生物实验方案和流程理解上自动评估的综合基准
- Alhazen - 从科学文档中提取实验元数据和方案信息
📋 科学文档处理与解析
高性能文档处理
- MinerU (2024/2025) - 拥有12亿参数的SOTA多模态文档解析工具,性能超越GPT-4o,可将PDF转换为LLM就绪的Markdown/JSON格式
- PDF-Extract-Kit (2024) - 高质量PDF内容提取综合工具包,具备版式检测、公式识别和OCR功能
- Docling (IBM, AAAI 2025) - 多格式文档(PDF/DOCX/PPTX/HTML/图像) → 结构化数据(Markdown/JSON)转换工具,支持版式重建、表格/公式恢复
- Nougat (Meta AI) - 面向学术文档的神经光学理解系统,将科学PDF转换为支持数学公式的Markdown格式
- PaddleOCR 3.0 (2024/2025) - 搭载PP-StructureV3文档解析的先进OCR系统,准确率提升13%,支持80+种语言
- Unstructured - 生产级ETL工具,将复杂文档转换为结构化格式,提供开源API
- Marker - 高精度PDF→Markdown/JSON/HTML转换工具,专精表格/公式/代码块处理,附带基准测试脚本
- S2ORC doc2json (AllenAI) - 大规模PDF/LaTeX/JATS解析工具,为数百万论文生成标准化JSON格式
- GROBID - 从学术文档中提取结构化元数据的机器学习软件
- Science-Parse / SPv2 (AllenAI) - 将科学论文解析为结构化字段(标题/作者/章节/参考文献)
生产级流水线与数据准备
- IBM Data Prep Kit: PDF→Parquet - 具备优化配置的大规模科学文档摄取流水线
- Mozilla document-to-markdown - 基于Docling的解析工具,提供UI/CLI演示用于快速原型开发
图表提取
- PDFFigures2 - 从学术PDF中提取图表、表格、标题和章节标题
- TableBank - 大规模表格检测与识别数据集,包含预训练模型
科学文献RAG与分析
- PaperQA2 - 面向科学PDF的高精度RAG系统,支持引用追踪、智能RAG和矛盾检测
- paper-reviewer - 从arXiv论文生成全面评审并转换为博客文章
🧰 研究工作台与插件
交互式研究环境
- Jupyter AI (JupyterLab 扩展) - 官方 Jupyter 扩展,提供
%%ai
魔法命令和侧边栏聊天助手,支持连接多个模型提供商和本地推理
- Notebook Intelligence (NBI) - 面向 JupyterLab 的 AI 编程助手,具备代理模式,支持任意 LLM 提供商 (2025+)
- Google Colab AI 功能 - 为数据科学和研究笔记本集成的 AI 辅助功能
文献管理插件
- PapersGPT for Zotero - 在 Zotero 中实现多 PDF 对话、检索和引用功能,支持商业/本地模型 (Ollama) 和 MCP
- Zotero-GPT (MuiseDestiny) - 经典开源插件,用于 Zotero 内的文档问答和摘要生成
- Better BibTeX for Zotero - 增强的引用键管理和 LaTeX 集成
科研写作与协作
- Notion AI - 基于 AI 的研究笔记和知识管理
- Obsidian Smart Connections - 基于 AI 的笔记链接和研究图谱导航
- Research Rabbit - 基于 AI 的文献发现和研究网络图谱
🕸️ 知识提取与学术知识图谱
知识图谱构建
- iText2KG - 使用LLM进行增量知识图谱构建,支持实体提取和Neo4j可视化
- KoPA - 面向LLM与知识图谱融合的结构感知前缀适配方法 (ACM MM 2024)
- Scholarly KGQA - 基于LLM的学术知识图谱问答系统 (ArXiv论文)
知识图谱资源
- Awesome-LLM-KG - LLM与知识图谱融合研究的论文资源大全
🤖 研究智能体与自主工作流
自主研究系统 (2024-2025年突破)
- The AI Scientist v1 (2024) - 首个全自动研究系统:假设→实验→写作→评审模拟
- The AI Scientist v2 (2025) - 增强版配备智能树搜索,减少模板依赖,首篇获研讨会级别接收论文
- AI-Researcher - 从文献综述→假设→算法实现→发表级写作的自主流程,配备Scientist-Bench评估体系
- Agent Laboratory - 支持完整研究周期的多智能体工作流,通过AgentRxiv实现累积发现
- Curie - 利用AI智能体进行自动化严格实验以推动科学发现
- POPPER - 通过智能序贯证伪实现自动化假设检验
评估与基准测试
- ScienceAgentBench (ICLR 2025) - 涵盖4个学科领域44篇同行评审论文的102项可执行任务,支持容器化评估
- SciTrust (2024) - 面向科学领域大语言模型的可信度评估框架(真实性、幻觉问题、谄媚倾向)
- SciBench - 跨多学科领域的大学层级科学问题解决能力评估
学术评审与评估
- AgentReview - 模拟学术同行评审生态的LLM智能体系统
- LLM-Peer-Review - 支持LLM辅助论文评审与标注的Web应用
领域专用研究智能体
- BioDiscoveryAgent - 用于生物发现与研究自动化的AI智能体
- ChemCrow - 集成工具的化学研究LLM智能体
- Coscientist - 自动化化学实验规划与执行
🏷️ 数据标注与整理
弱监督与自动标注
- Snorkel - 面向科学数据集的程序化数据标注与弱监督工具
- PandasAI - 使用自然语言进行对话式数据分析和可视化
⚗️ 科学机器学习
神经微分方程
- torchdiffeq - 神经常微分方程的 PyTorch 实现
- torchdyn - PyTorch 中的神经微分方程
- diffrax - JAX 中的数值微分方程求解
- DifferentialEquations.jl - Julia 微分方程套件
- DiffEqFlux.jl - Julia 中的神经微分方程
物理信息神经网络
- DeepXDE - 用于求解偏微分方程的深度学习库
- PINNs - 物理信息神经网络
- SciANN - 基于 Keras 的科学神经网络
- NeuralPDE.jl - Julia 中的物理信息神经网络
神经算子与模型发现
- DeepONet - 学习非线性算子
- PySINDy - 非线性动力学的稀疏识别
- Fourier Neural Operator - 傅里叶空间中的算子学习
📖 论文与综述
基础论文
- 科学计量分析的机器学习 (2021.09) - 全面综述
- 科学人工智能:进展与挑战 (2023.03) - 领域现状
- 科学基础模型 (2022.05) - 研究中的大模型
- 神经常微分方程 (2018.06) - 神经ODE领域的突破
- 物理信息神经网络 (2017.11) - 物理约束深度学习
- 人工智能时代的科学发现 - Nature关于AI在科学中作用的综述
📊 全面调研与综述 (2024-2025)
科学研究人工智能
- AI4Research: 科学研究中的人工智能综述 (2025.07) - 人工智能在科研中的系统分类法
- 从自动化到自主化:大语言模型在科学发现中的综述 (2025.05) - 三级分类法(工具、分析师、科学家)
- 从科学AI到能动科学:自主科学发现综述 (2025.08) - 涵盖生命科学、化学、材料和物理领域的能动科学全面综述
- 用于科学发现的能动AI:进展、挑战与未来方向综述 (2025.03) - 科学领域AI智能体的全面评述
- 迈向科学智能:基于LLM的科学智能体综述 (2025.03) - 科学AI智能体系统
科学大语言模型
- 科学大语言模型及其应用全面综述 (2024.06) - 涵盖260+个跨领域科学LLM
- 科学大语言模型综述:从数据基础到智能体前沿 (2025.08) - 以数据为中心的科学LLM视角
- 科学大语言模型:生物与化学领域综述 (2024.01) - 领域特定科学LLM
科学机器学习
- 基于物理信息神经网络的科学机器学习:现状与未来展望 (2022.01) - 全面综述PINN方法
- 物理信息神经网络及其扩展 (2024.08) - 最新PINN进展与变体
- 环境科学基础模型:综述 (2025.04) - 环境科学应用
- 生物信息学中的基础模型 - 生物学基础模型
- 材料发现基础模型 (2025) - 材料AI发展展望
🚀 AI科学家与自主研究 (2024-2025突破进展)
- The AI Scientist: Towards Fully Automated Open-Ended Scientific Discovery (2024.08) - 首个完全自主的科研系统
- The AI Scientist-v2: Workshop-Level Automated Scientific Discovery via Agentic Tree Search (2025.04) - 通过智能体树搜索增强的自主科研能力
- AI-Researcher: Autonomous Scientific Innovation (2025.05) - 从文献到发表的自主研究流程,配备Scientist-Bench评估框架
- Autonomous Scientific Discovery Through Hierarchical AI Scientist Systems (2025.07) - 自我进化的多智能体研究系统
- ChemCrow: Augmenting large-language models with chemistry tools (2023.04) - 用于化学研究的大语言模型智能体
最新进展与领域应用
- 化学领域的大型语言模型 (2024.02)
- Galactica:面向科学的大型语言模型 (2022.11)
📈 评估与基准测试
- ScienceAgentBench (ICLR 2025) - 涵盖4个学科44篇同行评审论文的102个可执行任务,支持容器化评估
- Scientist-Bench - 全面评估LLM智能体生成研究成果与高质量科学工作对比的基准测试
- SciTrust:评估科学领域大型语言模型的可信度 (2024) - 科学LLM可信度评估框架
- SciBench:评估大学层次科学问题解决能力 (2023) - 科学推理基准测试
- ChartCoder评估 - 图表到代码生成的基准测试
🔬 领域特定应用
🧬 生物学与医学
蛋白质与药物发现
- AlphaFold - 蛋白质结构预测
- ColabFold (2025 更新版) - 支持 AF3 JSON 导出和数据库更新的 AlphaFold/ESMFold 可访问实现
- Protenix - 可训练的 AlphaFold 3 PyTorch 复现版本
- Graphormer - 用于分子建模的通用深度学习主干网络
- targetdiff - 面向靶点感知分子生成的三维等变扩散模型 (ICLR2023)
- DrugAssist - 基于大语言模型的分子优化工具
- mint - 学习蛋白质-蛋白质相互作用语言
- Mol-Instructions - 面向化学/生物领域大语言模型的大规模生物分子指令数据集 (ICLR2024)
- ChemBERTa - 化学语言模型
- DeepChem - 化学机器学习工具库
- RDKit - 化学信息学工具包
- ESMFold - 基于 ESM 模型的蛋白质结构预测
基因组学与生物信息学
- scGPT - 基于Transformer的单细胞分析
- Enformer - 基因表达预测
- DNABERT - DNA序列分析
- scBERT - 用于基因表达的单细胞BERT
- GenePT - 基因组学生成式预训练
⚛️ 化学与材料
材料发现
- MACE - 机器学习原子间势能
- MatterSim - 跨元素/温度/压力的深度学习原子尺度模型
- Crystal Graph CNNs - 晶体性质预测
- MatBench - 材料信息学基准测试
- Best of Atomistic Machine Learning - 材料科学原子尺度机器学习项目精选集
化学合成
- Molecular Transformers - 用于化学反应预测与合成规划的人工智能
🌌 物理学与天文学
物理学中的机器学习
- JAX-MD - 基于JAX的分子动力学模拟
- Neural ODEs - 神经网络微分方程求解
- Physics-Informed Neural Networks - 物理约束机器学习
- EquiformerV2 - 改进的3D原子图等变Transformer (ICLR2024)
- Equiformer - 等变图注意力Transformer (ICLR2023)
天文学与天体物理学
- AstroPy - Python 天文学工具集
- Gaia Archive - 用于机器学习的恒星数据
- DeepSphere - 面向天文学的球面卷积神经网络
🌍 地球与气候科学
气候建模
- ClimateBench - 面向机器学习模型的气候数据基准
- WeatherBench - 天气预报基准
- WeatherGFT - 面向精细化天气预报的物理-AI混合建模(NeurIPS'24)
- Awesome Large Weather Models - 面向AI地球科学的大型天气模型精选列表
- TerraTorch - 用于微调地理空间基础模型的Python工具包
- AI for Earth - 微软环境人工智能
🌾 农业与生态学
农业人工智能
- PlantNet - 基于人工智能与公众科学的植物识别平台
- AgML - 农业机器学习平台
生态建模
- BioSimulators - 生物模拟工具集
- EcoNet - 生态建模与保护人工智能
🤖 科学基础模型
通用科学模型
- Galactica - 面向科学领域的大语言模型
- MinervaAI - 数学推理模型
- PaLM-2 - 科学推理能力模型
领域专用模型
- ESM - 蛋白质语言模型
- ChemGPT - 化学领域专用语言模型
- BioGPT - 生物医学文本生成模型
📈 数据集与基准测试
多学科领域
- Hugging Face Datasets - 全面的机器学习研究数据集与科学数据集合
- Google Dataset Search - 查找科学数据集
生物与医学
- Protein Data Bank - 蛋白质结构数据库
- ChEMBL - 化学生物活性数据
- Human Protein Atlas - 蛋白质表达数据
- Chinese Medical Dataset - 面向AI研究的中文医疗数据集综合收集
化学与材料
- Materials Project - 计算材料数据库
- QM9 - 小分子性质数据集
- Open Catalyst Project - 催化剂发现项目
物理学
- LIGO Open Science Center - 引力波数据
- Particle Data Group - 粒子物理数据
- OpenQuantumMaterials - 量子材料数据
💻 计算框架
机器学习
- PyTorch - 深度学习框架
- JAX - 高性能机器学习研究
- TensorFlow - 端到端机器学习平台
科学计算
- NumPy - 数值计算
- SciPy - 科学计算
- Scikit-learn - 机器学习库
科学机器学习框架
- SciML - 科学机器学习生态系统
- SciMLBenchmarks.jl - 科学机器学习基准测试与微分方程求解器
- PaddleScience - 面向AI驱动科学计算应用的SDK与库
- DiffEqFlux.jl - Julia中的神经微分方程
- NeuralPDE.jl - Julia中的物理信息神经网络
- Flux.jl - Julia中的机器学习框架
专业框架
- MDAnalysis - 分子动力学分析
- ASE - 用于材料建模的原子模拟环境
- PyMC - 概率编程
- OpenMM - 高性能分子模拟工具包
🎓 教育资源
课程与教程
- AI for Everyone (Coursera) - 基础AI概念
- CS229 Machine Learning - 斯坦福机器学习课程
- MIT 6.034 Artificial Intelligence - 人工智能基础
开放获取教育资源
- Dive into Deep Learning - 含代码实现的交互式深度学习书籍
- The Elements of Statistical Learning - 免费提供的经典机器学习教材
- Neural Networks and Deep Learning - Michael Nielsen 的免费在线书籍
📋 论文合集与资源库
- Awesome Scientific Language Models - 精选科学大语言模型论文(260+ 模型)
- Awesome LLM Scientific Discovery - 面向科学发现的大语言模型论文
- AI4Research Papers - 面向科学研究的LLM论文
- Physics-Informed Neural Networks Papers - 物理信息神经网络研究合集
- Scientific Computing with ML Papers - 科学机器学习论文库
- Awesome AI Scientist Papers - 自主AI科学家研究
- Awesome Agents for Science - 跨科学领域的LLM智能体
YouTube 频道
- Two Minute Papers - AI研究综述
- 3Blue1Brown - 数学概念解析
- AI Coffee Break - AI论文评析
- Steve Brunton - 数据驱动方法
- Nathan Kutz - 应用数学
- Physics Informed Machine Learning - SciML教程
🏛 研究社区
学术会议
- NeurIPS - 机器学习会议
- ICML - 国际机器学习大会
- AI for Science Workshop - 专题研讨会
研究机构
- Partnership on AI - AI研究合作组织
- Allen Institute for AI - AI研究院
- OpenAI - AI研究与部署
在线社区
- r/MachineLearning - 机器学习讨论
- AI Alignment Forum - AI安全研究
- Distill - 机器学习可视化解析
📚 相关精选资源列表
本项目基于并补充了多个优质资源:
🎯 专业资源集合
- awesome-ai4s - 200+ 篇 AI for Science 论文附中文解读
- Awesome AI Scientist Papers - 自主 AI 科学家研究
- Awesome Scientific Machine Learning - 物理信息机器学习和科学机器学习
- Awesome Agents for Science - 跨科学领域的 LLM 智能体
- Awesome LLM Agents Scientific Discovery - 生物医学 AI 智能体
📊 论文与研究合集
- Scientific LLM Papers - 260+ 个科学语言模型
- LLM4SR Repository - 用于科学研究的 LLM 调查资料
- PINNs Paper Collection - 物理信息神经网络研究
- SciML Papers - 科学计算与机器学习论文
🌟 核心洞见
- 当前重点: 从工具级辅助转向自主科学智能体
- 新兴趋势: 多模态科学模型、自我优化的研究系统
- 研究空白: 评估框架、伦理治理、人机协作
- 未来方向: 完全自主的发现周期、机器人实验室集成
参考来源:
awesome-ai-for-science
ai-boost • Updated Oct 15, 2025

ai-boost/awesome-ai-for-science | zdoc.app
精选优质AI工具、库、论文、数据集与框架列表,涵盖从物理化学到生物材料等众多科学领域,助力科研加速突破。
- Author:Spring
- URL:https://nuaa.tech/article/26
- Copyright:All articles in this blog, except for special statements, adopt BY-NC-SA agreement. Please indicate the source!