人工智能

🪄科学与人工智能精选资源导航

字数 5160阅读时长≈ 13 分钟2025-10-152026-2-4

文章摘要

茉灵智库

type

Post

status

Published

slug

26

date

Oct 15, 2025

summary

汇总AI工具、库、论文、数据集与框架的权威精选清单，按领域与用途分类，聚焦高质量与可复现资源。助力研究者与工程师快速检索、搭建基线与技术选型，覆盖开源项目与前沿成果，全面提效实验流程，加速跨学科科学发现。

tags

AI工具

软件资源

category

人工智能

icon

password

Author

CreatedAt

Oct 15, 2025 08:04 AM

CreatedBy

Name

科学与人工智能精选资源导航

PublishDate

AISummar

汇总AI工具、库、论文、数据集与框架的权威精选清单，按领域与用途分类，聚焦高质量与可复现资源。助力研究者与工程师快速检索、搭建基线与技术选型，覆盖开源项目与前沿成果，全面提效实验流程，加速跨学科科学发现。

Tags

URL

UpdatedAt

Feb 4, 2026 11:26 AM

UpdatedBy

AI正在彻底改变科学研究——从药物发现和材料设计到气候建模和天体物理学。本资源库汇集了最佳资源，帮助研究人员在工作中利用AI技术

🧪 AI 科研工具

文献与知识管理

Semantic Scholar - AI驱动的学术搜索引擎 (Allen AI)

arXiv - 开放获取的电子预印本和后印本存储库

OpenAlex - 开放的学术论文和作者目录

CORE - 开放获取研究论文聚合平台

数据分析与可视化

PandasAI - 使用自然语言进行对话式数据分析

AutoViz - 以最少代码实现自动化数据可视化

Chat2Plot - 通过标准化图表规范实现安全的文本到可视化转换

数据标注与注释

Label Studio - 多类型数据标注与注释工具

Snorkel - 程序化数据标注与弱监督

📄 论文→海报/幻灯片/图形摘要

海报生成

Paper2Poster - 采用解析器-规划器-绘制器架构的多智能体系统，将paper.pdf转换为可编辑的poster.pptx，以87%更少的token消耗超越 GPT-4o 表现

mPLUG-PaperOwl - 用于科学图表理解与生成的多模态大语言模型

幻灯片与演示生成

Auto-Slides - 基于多智能体系统将学术论文转化为高质量演示文稿，支持交互式优化

PPTAgent - 超越文本转幻灯片生成，提供PPTEval多维度评估框架（EMNLP 2025）

paper2slides - 使用大语言模型将arXiv论文转换为Beamer幻灯片

PaperToSlides - 基于AI的自动化工具，可将学术论文（PDF格式）转换为演示文稿

pdf2slides - 仅需三行代码即可将PDF文件转换为可编辑幻灯片

SlideDeck AI - 基于生成式AI，从文档或主题协同创建PowerPoint演示文稿

AI Multi-Agent Presentation Builder - Azure Semantic Kernel多智能体PPT生成参考实现

视频与媒体生成

Paper2Video - 首个从科研论文自动生成视频的基准框架（NeurIPS 2025）

paper2video - 将arXiv研究论文转化为引人入胜的演示文稿和YouTube适配视频

图表与可视化生成

注：关于全面的图表理解和代码生成工具，请参阅📊 图表理解与生成章节

📊 图表理解与生成

图表转代码与可复现性

ChartCoder (ACL 2025) - 用于图表转代码生成的多模态大语言模型，7B模型性能超越更大的开源MLLMs

ChartAssistant / ChartAst (ACL 2024) - 通用图表理解与推理模型

Chart-to-Text Datasets - 大规模图表摘要数据集，用于训练图表描述能力

科学可视化工具

Chat2Plot - 通过标准化图表规范实现安全的文本到可视化转换

AutoViz - 以最少代码实现自动化数据可视化

PlotlyAI - 基于AI的数据可视化和仪表板创建

🔄 论文到代码与可复现性

自动化代码生成

AutoP2C - 从学术论文生成可运行代码库的LLM智能体框架

ResearchCodeAgent - 用于研究方法自动编码化的多智能体系统

ToolMaker - 将含代码的论文转换为可调用智能体工具

实验自动化

BioProBench - 用于LLM在生物实验方案和流程理解上自动评估的综合基准

Alhazen - 从科学文档中提取实验元数据和方案信息

📋 科学文档处理与解析

高性能文档处理

MinerU (2024/2025) - 拥有12亿参数的SOTA多模态文档解析工具，性能超越GPT-4o，可将PDF转换为LLM就绪的Markdown/JSON格式

PDF-Extract-Kit (2024) - 高质量PDF内容提取综合工具包，具备版式检测、公式识别和OCR功能

Docling (IBM, AAAI 2025) - 多格式文档(PDF/DOCX/PPTX/HTML/图像) → 结构化数据(Markdown/JSON)转换工具，支持版式重建、表格/公式恢复

Nougat (Meta AI) - 面向学术文档的神经光学理解系统，将科学PDF转换为支持数学公式的Markdown格式

PaddleOCR 3.0 (2024/2025) - 搭载PP-StructureV3文档解析的先进OCR系统，准确率提升13%，支持80+种语言

Unstructured - 生产级ETL工具，将复杂文档转换为结构化格式，提供开源API

Marker - 高精度PDF→Markdown/JSON/HTML转换工具，专精表格/公式/代码块处理，附带基准测试脚本

S2ORC doc2json (AllenAI) - 大规模PDF/LaTeX/JATS解析工具，为数百万论文生成标准化JSON格式

GROBID - 从学术文档中提取结构化元数据的机器学习软件

Science-Parse / SPv2 (AllenAI) - 将科学论文解析为结构化字段（标题/作者/章节/参考文献）

生产级流水线与数据准备

IBM Data Prep Kit: PDF→Parquet - 具备优化配置的大规模科学文档摄取流水线

Mozilla document-to-markdown - 基于Docling的解析工具，提供UI/CLI演示用于快速原型开发

图表提取

PDFFigures2 - 从学术PDF中提取图表、表格、标题和章节标题

TableBank - 大规模表格检测与识别数据集，包含预训练模型

科学文献RAG与分析

PaperQA2 - 面向科学PDF的高精度RAG系统，支持引用追踪、智能RAG和矛盾检测

paper-reviewer - 从arXiv论文生成全面评审并转换为博客文章

🧰 研究工作台与插件

交互式研究环境

Jupyter AI (JupyterLab 扩展) - 官方 Jupyter 扩展，提供 %%ai 魔法命令和侧边栏聊天助手，支持连接多个模型提供商和本地推理

Notebook Intelligence (NBI) - 面向 JupyterLab 的 AI 编程助手，具备代理模式，支持任意 LLM 提供商 (2025+)

Google Colab AI 功能 - 为数据科学和研究笔记本集成的 AI 辅助功能

文献管理插件

PapersGPT for Zotero - 在 Zotero 中实现多 PDF 对话、检索和引用功能，支持商业/本地模型 (Ollama) 和 MCP

Zotero-GPT (MuiseDestiny) - 经典开源插件，用于 Zotero 内的文档问答和摘要生成

Better BibTeX for Zotero - 增强的引用键管理和 LaTeX 集成

科研写作与协作

Notion AI - 基于 AI 的研究笔记和知识管理

Obsidian Smart Connections - 基于 AI 的笔记链接和研究图谱导航

Research Rabbit - 基于 AI 的文献发现和研究网络图谱

🕸️ 知识提取与学术知识图谱

知识图谱构建

iText2KG - 使用LLM进行增量知识图谱构建，支持实体提取和Neo4j可视化

KoPA - 面向LLM与知识图谱融合的结构感知前缀适配方法 (ACM MM 2024)

Scholarly KGQA - 基于LLM的学术知识图谱问答系统 (ArXiv论文)

知识图谱资源

Awesome-LLM-KG - LLM与知识图谱融合研究的论文资源大全

🤖 研究智能体与自主工作流

自主研究系统 (2024-2025年突破)

The AI Scientist v1 (2024) - 首个全自动研究系统：假设→实验→写作→评审模拟

The AI Scientist v2 (2025) - 增强版配备智能树搜索，减少模板依赖，首篇获研讨会级别接收论文

AI-Researcher - 从文献综述→假设→算法实现→发表级写作的自主流程，配备Scientist-Bench评估体系

Agent Laboratory - 支持完整研究周期的多智能体工作流，通过AgentRxiv实现累积发现

Curie - 利用AI智能体进行自动化严格实验以推动科学发现

POPPER - 通过智能序贯证伪实现自动化假设检验

评估与基准测试

ScienceAgentBench (ICLR 2025) - 涵盖4个学科领域44篇同行评审论文的102项可执行任务，支持容器化评估

SciTrust (2024) - 面向科学领域大语言模型的可信度评估框架（真实性、幻觉问题、谄媚倾向）

SciBench - 跨多学科领域的大学层级科学问题解决能力评估

学术评审与评估

AgentReview - 模拟学术同行评审生态的LLM智能体系统

LLM-Peer-Review - 支持LLM辅助论文评审与标注的Web应用

领域专用研究智能体

BioDiscoveryAgent - 用于生物发现与研究自动化的AI智能体

ChemCrow - 集成工具的化学研究LLM智能体

Coscientist - 自动化化学实验规划与执行

🏷️ 数据标注与整理

弱监督与自动标注

Snorkel - 面向科学数据集的程序化数据标注与弱监督工具

PandasAI - 使用自然语言进行对话式数据分析和可视化

⚗️ 科学机器学习

神经微分方程

torchdiffeq - 神经常微分方程的 PyTorch 实现

torchdyn - PyTorch 中的神经微分方程

diffrax - JAX 中的数值微分方程求解

DifferentialEquations.jl - Julia 微分方程套件

DiffEqFlux.jl - Julia 中的神经微分方程

物理信息神经网络

DeepXDE - 用于求解偏微分方程的深度学习库

PINNs - 物理信息神经网络

SciANN - 基于 Keras 的科学神经网络

NeuralPDE.jl - Julia 中的物理信息神经网络

神经算子与模型发现

DeepONet - 学习非线性算子

PySINDy - 非线性动力学的稀疏识别

Fourier Neural Operator - 傅里叶空间中的算子学习

📖 论文与综述

基础论文

科学计量分析的机器学习 (2021.09) - 全面综述

科学人工智能：进展与挑战 (2023.03) - 领域现状

科学基础模型 (2022.05) - 研究中的大模型

神经常微分方程 (2018.06) - 神经ODE领域的突破

物理信息神经网络 (2017.11) - 物理约束深度学习

人工智能时代的科学发现 - Nature关于AI在科学中作用的综述

📊 全面调研与综述 (2024-2025)

科学研究人工智能

AI4Research: 科学研究中的人工智能综述 (2025.07) - 人工智能在科研中的系统分类法

从自动化到自主化：大语言模型在科学发现中的综述 (2025.05) - 三级分类法（工具、分析师、科学家）

从科学AI到能动科学：自主科学发现综述 (2025.08) - 涵盖生命科学、化学、材料和物理领域的能动科学全面综述

用于科学发现的能动AI：进展、挑战与未来方向综述 (2025.03) - 科学领域AI智能体的全面评述

迈向科学智能：基于LLM的科学智能体综述 (2025.03) - 科学AI智能体系统

科学大语言模型

科学大语言模型及其应用全面综述 (2024.06) - 涵盖260+个跨领域科学LLM

科学大语言模型综述：从数据基础到智能体前沿 (2025.08) - 以数据为中心的科学LLM视角

科学大语言模型：生物与化学领域综述 (2024.01) - 领域特定科学LLM

科学机器学习

基于物理信息神经网络的科学机器学习：现状与未来展望 (2022.01) - 全面综述PINN方法

物理信息神经网络及其扩展 (2024.08) - 最新PINN进展与变体

环境科学基础模型：综述 (2025.04) - 环境科学应用

生物信息学中的基础模型 - 生物学基础模型

材料发现基础模型 (2025) - 材料AI发展展望

🚀 AI科学家与自主研究 (2024-2025突破进展)

The AI Scientist: Towards Fully Automated Open-Ended Scientific Discovery (2024.08) - 首个完全自主的科研系统

The AI Scientist-v2: Workshop-Level Automated Scientific Discovery via Agentic Tree Search (2025.04) - 通过智能体树搜索增强的自主科研能力

AI-Researcher: Autonomous Scientific Innovation (2025.05) - 从文献到发表的自主研究流程，配备Scientist-Bench评估框架

Autonomous Scientific Discovery Through Hierarchical AI Scientist Systems (2025.07) - 自我进化的多智能体研究系统

ChemCrow: Augmenting large-language models with chemistry tools (2023.04) - 用于化学研究的大语言模型智能体

Autonomous chemical research with large language models - 自动化化学实验研究

Coscientist: Autonomously planning and executing scientific experiments - 机器人实验室自动化

最新进展与领域应用

AlphaFold：蛋白质结构预测

人工智能在材料发现中的应用

化学领域的大型语言模型 (2024.02)

Galactica：面向科学的大型语言模型 (2022.11)

📈 评估与基准测试

ScienceAgentBench (ICLR 2025) - 涵盖4个学科44篇同行评审论文的102个可执行任务，支持容器化评估

Scientist-Bench - 全面评估LLM智能体生成研究成果与高质量科学工作对比的基准测试

SciTrust：评估科学领域大型语言模型的可信度 (2024) - 科学LLM可信度评估框架

SciBench：评估大学层次科学问题解决能力 (2023) - 科学推理基准测试

ChartCoder评估 - 图表到代码生成的基准测试

🔬 领域特定应用

🧬 生物学与医学

蛋白质与药物发现

AlphaFold - 蛋白质结构预测

ColabFold (2025 更新版) - 支持 AF3 JSON 导出和数据库更新的 AlphaFold/ESMFold 可访问实现

Protenix - 可训练的 AlphaFold 3 PyTorch 复现版本

Graphormer - 用于分子建模的通用深度学习主干网络

targetdiff - 面向靶点感知分子生成的三维等变扩散模型 (ICLR2023)

DrugAssist - 基于大语言模型的分子优化工具

mint - 学习蛋白质-蛋白质相互作用语言

Mol-Instructions - 面向化学/生物领域大语言模型的大规模生物分子指令数据集 (ICLR2024)

ChemBERTa - 化学语言模型

DeepChem - 化学机器学习工具库

RDKit - 化学信息学工具包

ESMFold - 基于 ESM 模型的蛋白质结构预测

基因组学与生物信息学

scGPT - 基于Transformer的单细胞分析

Enformer - 基因表达预测

DNABERT - DNA序列分析

scBERT - 用于基因表达的单细胞BERT

GenePT - 基因组学生成式预训练

⚛️ 化学与材料

材料发现

MACE - 机器学习原子间势能

MatterSim - 跨元素/温度/压力的深度学习原子尺度模型

Crystal Graph CNNs - 晶体性质预测

MatBench - 材料信息学基准测试

Best of Atomistic Machine Learning - 材料科学原子尺度机器学习项目精选集

化学合成

Molecular Transformers - 用于化学反应预测与合成规划的人工智能

🌌 物理学与天文学

物理学中的机器学习

JAX-MD - 基于JAX的分子动力学模拟

Neural ODEs - 神经网络微分方程求解

Physics-Informed Neural Networks - 物理约束机器学习

EquiformerV2 - 改进的3D原子图等变Transformer (ICLR2024)

Equiformer - 等变图注意力Transformer (ICLR2023)

天文学与天体物理学

AstroPy - Python 天文学工具集

Gaia Archive - 用于机器学习的恒星数据

DeepSphere - 面向天文学的球面卷积神经网络

🌍 地球与气候科学

气候建模

ClimateBench - 面向机器学习模型的气候数据基准

WeatherBench - 天气预报基准

WeatherGFT - 面向精细化天气预报的物理-AI混合建模（NeurIPS'24）

Awesome Large Weather Models - 面向AI地球科学的大型天气模型精选列表

TerraTorch - 用于微调地理空间基础模型的Python工具包

AI for Earth - 微软环境人工智能

🌾 农业与生态学

农业人工智能

PlantNet - 基于人工智能与公众科学的植物识别平台

AgML - 农业机器学习平台

生态建模

BioSimulators - 生物模拟工具集

EcoNet - 生态建模与保护人工智能

🤖 科学基础模型

通用科学模型

Galactica - 面向科学领域的大语言模型

MinervaAI - 数学推理模型

PaLM-2 - 科学推理能力模型

领域专用模型

ESM - 蛋白质语言模型

ChemGPT - 化学领域专用语言模型

BioGPT - 生物医学文本生成模型

📈 数据集与基准测试

多学科领域

Hugging Face Datasets - 全面的机器学习研究数据集与科学数据集合

Google Dataset Search - 查找科学数据集

生物与医学

Protein Data Bank - 蛋白质结构数据库

ChEMBL - 化学生物活性数据

Human Protein Atlas - 蛋白质表达数据

Chinese Medical Dataset - 面向AI研究的中文医疗数据集综合收集

化学与材料

Materials Project - 计算材料数据库

QM9 - 小分子性质数据集

Open Catalyst Project - 催化剂发现项目

物理学

LIGO Open Science Center - 引力波数据

Particle Data Group - 粒子物理数据

OpenQuantumMaterials - 量子材料数据

💻 计算框架

机器学习

PyTorch - 深度学习框架

JAX - 高性能机器学习研究

TensorFlow - 端到端机器学习平台

科学计算

NumPy - 数值计算

SciPy - 科学计算

Scikit-learn - 机器学习库

科学机器学习框架

SciML - 科学机器学习生态系统

SciMLBenchmarks.jl - 科学机器学习基准测试与微分方程求解器

PaddleScience - 面向AI驱动科学计算应用的SDK与库

DiffEqFlux.jl - Julia中的神经微分方程

NeuralPDE.jl - Julia中的物理信息神经网络

Flux.jl - Julia中的机器学习框架

专业框架

MDAnalysis - 分子动力学分析

ASE - 用于材料建模的原子模拟环境

PyMC - 概率编程

OpenMM - 高性能分子模拟工具包

🎓 教育资源

课程与教程

AI for Everyone (Coursera) - 基础AI概念

CS229 Machine Learning - 斯坦福机器学习课程

MIT 6.034 Artificial Intelligence - 人工智能基础

开放获取教育资源

Dive into Deep Learning - 含代码实现的交互式深度学习书籍

The Elements of Statistical Learning - 免费提供的经典机器学习教材

Neural Networks and Deep Learning - Michael Nielsen 的免费在线书籍

📋 论文合集与资源库

Awesome Scientific Language Models - 精选科学大语言模型论文（260+ 模型）

Awesome LLM Scientific Discovery - 面向科学发现的大语言模型论文

AI4Research Papers - 面向科学研究的LLM论文

Physics-Informed Neural Networks Papers - 物理信息神经网络研究合集

Scientific Computing with ML Papers - 科学机器学习论文库

Awesome AI Scientist Papers - 自主AI科学家研究

Awesome Agents for Science - 跨科学领域的LLM智能体

YouTube 频道

Two Minute Papers - AI研究综述

3Blue1Brown - 数学概念解析

AI Coffee Break - AI论文评析

Steve Brunton - 数据驱动方法

Nathan Kutz - 应用数学

Physics Informed Machine Learning - SciML教程

🏛 研究社区

学术会议

NeurIPS - 机器学习会议

ICML - 国际机器学习大会

AI for Science Workshop - 专题研讨会

研究机构

Partnership on AI - AI研究合作组织

Allen Institute for AI - AI研究院

OpenAI - AI研究与部署

在线社区

r/MachineLearning - 机器学习讨论

AI Alignment Forum - AI安全研究

Distill - 机器学习可视化解析

📚 相关精选资源列表

本项目基于并补充了多个优质资源：

🎯 专业资源集合

awesome-ai4s - 200+ 篇 AI for Science 论文附中文解读

Awesome AI Scientist Papers - 自主 AI 科学家研究

Awesome Scientific Machine Learning - 物理信息机器学习和科学机器学习

Awesome Agents for Science - 跨科学领域的 LLM 智能体

Awesome LLM Agents Scientific Discovery - 生物医学 AI 智能体

📊 论文与研究合集

Scientific LLM Papers - 260+ 个科学语言模型

LLM4SR Repository - 用于科学研究的 LLM 调查资料

PINNs Paper Collection - 物理信息神经网络研究

SciML Papers - 科学计算与机器学习论文

🌟 核心洞见

当前重点: 从工具级辅助转向自主科学智能体

新兴趋势: 多模态科学模型、自我优化的研究系统

研究空白: 评估框架、伦理治理、人机协作

未来方向: 完全自主的发现周期、机器人实验室集成

参考来源：

awesome-ai-for-science

ai-boost • Updated Jan 12, 2026

ai-boost/awesome-ai-for-science | zdoc.app

ai-boost/awesome-ai-for-science | zdoc.app

ai-boost/awesome-ai-for-science | zdoc.app

精选优质AI工具、库、论文、数据集与框架列表，涵盖从物理化学到生物材料等众多科学领域，助力科研加速突破。

学术论文电子书资源大全：科研文献免费下载工具

艾宾浩斯遗忘曲线记忆法：高效背诵全攻略

艾宾浩斯遗忘曲线记忆法：高效背诵全攻略

作者:茉灵智库
链接:https://easys.cc.cd/article/26
声明:本文采用 CC BY-NC-SA 4.0 许可协议，转载请注明出处。

相关文章

Adobe全家桶不限速下载指南

Adobe全家桶不限速下载指南

C盘清理详细教程：Windows系统一键瘦身

C盘清理详细教程：Windows系统一键瘦身

彻底卸载360和2345等流氓软件！

彻底卸载360和2345等流氓软件！

免费AI大模型网站汇总

北大ChatExcel：用文字指令自动处理表格神器

北大ChatExcel：用文字指令自动处理表格神器

一键屏蔽流氓软件：Windows 防火墙/Hosts/DNS 组合屏蔽教程

一键屏蔽流氓软件：Windows 防火墙/Hosts/DNS 组合屏蔽教程

评论

Loading...

目录

✨ 追求简单幸福的日子

茉灵智库

👋 欢迎来访！

防失联关注微信公众号

notion image

✨本站不定期更换域名

🪄公众号获取最新域名

目录

公众号

防失联关注微信公众号

点击扫码关注公众号

最新发布

全网VIP视频免费看教程：短剧电视剧白嫖指南

Windows实用教程：常见问题解决与系统优化指南

人体系统调优指南：健康长寿的生活与学习习惯

35个实用省钱技巧：餐饮购物全攻略

免费性格与恋爱测试 | 茉灵智库

文章数:

53

建站天数:

1612 天