Lazy loaded image
🪄科学人工智能精选资源
516013 min
Oct 15, 2025
Oct 15, 2025
机器人
文章摘要
茉灵智库
type
status
slug
date
summary
tags
category
icon
password
Author
CreatedAt
Oct 15, 2025 08:04 AM
CreatedBy
Name
PublishDate
AISummar
Tags
URL
UpdatedAt
Oct 15, 2025 08:18 AM
UpdatedBy
AI正在彻底改变科学研究——从药物发现和材料设计到气候建模和天体物理学。本资源库汇集了最佳资源,帮助研究人员在工作中利用AI技术

🧪 AI 科研工具

文献与知识管理

  • arXiv - 开放获取的电子预印本和后印本存储库
  • OpenAlex - 开放的学术论文和作者目录
  • CORE - 开放获取研究论文聚合平台

数据分析与可视化

  • PandasAI - 使用自然语言进行对话式数据分析
  • AutoViz - 以最少代码实现自动化数据可视化
  • Chat2Plot - 通过标准化图表规范实现安全的文本到可视化转换

数据标注与注释

  • Snorkel - 程序化数据标注与弱监督

📄 论文→海报/幻灯片/图形摘要

海报生成

  • Paper2Poster - 采用解析器-规划器-绘制器架构的多智能体系统,将paper.pdf转换为可编辑的poster.pptx,以87%更少的token消耗超越GPT-4o表现
  • mPLUG-PaperOwl - 用于科学图表理解与生成的多模态大语言模型

幻灯片与演示生成

  • Auto-Slides - 基于多智能体系统将学术论文转化为高质量演示文稿,支持交互式优化
  • PPTAgent - 超越文本转幻灯片生成,提供PPTEval多维度评估框架(EMNLP 2025)
  • paper2slides - 使用大语言模型将arXiv论文转换为Beamer幻灯片
  • PaperToSlides - 基于AI的自动化工具,可将学术论文(PDF格式)转换为演示文稿
  • pdf2slides - 仅需三行代码即可将PDF文件转换为可编辑幻灯片
  • SlideDeck AI - 基于生成式AI,从文档或主题协同创建PowerPoint演示文稿

视频与媒体生成

  • Paper2Video - 首个从科研论文自动生成视频的基准框架(NeurIPS 2025)
  • paper2video - 将arXiv研究论文转化为引人入胜的演示文稿和YouTube适配视频

图表与可视化生成

注:关于全面的图表理解和代码生成工具,请参阅📊 图表理解与生成章节

📊 图表理解与生成

图表转代码与可复现性

  • ChartCoder (ACL 2025) - 用于图表转代码生成的多模态大语言模型,7B模型性能超越更大的开源MLLMs

科学可视化工具

  • Chat2Plot - 通过标准化图表规范实现安全的文本到可视化转换
  • AutoViz - 以最少代码实现自动化数据可视化
  • PlotlyAI - 基于AI的数据可视化和仪表板创建

🔄 论文到代码与可复现性

自动化代码生成

  • AutoP2C - 从学术论文生成可运行代码库的LLM智能体框架
  • ToolMaker - 将含代码的论文转换为可调用智能体工具

实验自动化

  • BioProBench - 用于LLM在生物实验方案和流程理解上自动评估的综合基准
  • Alhazen - 从科学文档中提取实验元数据和方案信息

📋 科学文档处理与解析

高性能文档处理

  • MinerU (2024/2025) - 拥有12亿参数的SOTA多模态文档解析工具,性能超越GPT-4o,可将PDF转换为LLM就绪的Markdown/JSON格式
  • PDF-Extract-Kit (2024) - 高质量PDF内容提取综合工具包,具备版式检测、公式识别和OCR功能
  • Docling (IBM, AAAI 2025) - 多格式文档(PDF/DOCX/PPTX/HTML/图像) → 结构化数据(Markdown/JSON)转换工具,支持版式重建、表格/公式恢复
  • Nougat (Meta AI) - 面向学术文档的神经光学理解系统,将科学PDF转换为支持数学公式的Markdown格式
  • Unstructured - 生产级ETL工具,将复杂文档转换为结构化格式,提供开源API
  • Marker - 高精度PDF→Markdown/JSON/HTML转换工具,专精表格/公式/代码块处理,附带基准测试脚本
  • GROBID - 从学术文档中提取结构化元数据的机器学习软件

生产级流水线与数据准备

图表提取

  • PDFFigures2 - 从学术PDF中提取图表、表格、标题和章节标题
  • TableBank - 大规模表格检测与识别数据集,包含预训练模型

科学文献RAG与分析

  • PaperQA2 - 面向科学PDF的高精度RAG系统,支持引用追踪、智能RAG和矛盾检测
  • paper-reviewer - 从arXiv论文生成全面评审并转换为博客文章

🧰 研究工作台与插件

交互式研究环境

  • Jupyter AI (JupyterLab 扩展) - 官方 Jupyter 扩展,提供 %%ai 魔法命令和侧边栏聊天助手,支持连接多个模型提供商和本地推理

文献管理插件

  • PapersGPT for Zotero - 在 Zotero 中实现多 PDF 对话、检索和引用功能,支持商业/本地模型 (Ollama) 和 MCP

科研写作与协作

  • Notion AI - 基于 AI 的研究笔记和知识管理

🕸️ 知识提取与学术知识图谱

知识图谱构建

  • iText2KG - 使用LLM进行增量知识图谱构建,支持实体提取和Neo4j可视化
  • KoPA - 面向LLM与知识图谱融合的结构感知前缀适配方法 (ACM MM 2024)
  • Scholarly KGQA - 基于LLM的学术知识图谱问答系统 (ArXiv论文)

知识图谱资源


🤖 研究智能体与自主工作流

自主研究系统 (2024-2025年突破)

  • AI-Researcher - 从文献综述→假设→算法实现→发表级写作的自主流程,配备Scientist-Bench评估体系
  • Agent Laboratory - 支持完整研究周期的多智能体工作流,通过AgentRxiv实现累积发现
  • Curie - 利用AI智能体进行自动化严格实验以推动科学发现
  • POPPER - 通过智能序贯证伪实现自动化假设检验

评估与基准测试

  • SciTrust (2024) - 面向科学领域大语言模型的可信度评估框架(真实性、幻觉问题、谄媚倾向)
  • SciBench - 跨多学科领域的大学层级科学问题解决能力评估

学术评审与评估

  • AgentReview - 模拟学术同行评审生态的LLM智能体系统

领域专用研究智能体

  • ChemCrow - 集成工具的化学研究LLM智能体

🏷️ 数据标注与整理

弱监督与自动标注

  • Snorkel - 面向科学数据集的程序化数据标注与弱监督工具
  • PandasAI - 使用自然语言进行对话式数据分析和可视化

⚗️ 科学机器学习

神经微分方程

  • torchdyn - PyTorch 中的神经微分方程
  • diffrax - JAX 中的数值微分方程求解

物理信息神经网络

  • DeepXDE - 用于求解偏微分方程的深度学习库
  • PINNs - 物理信息神经网络
  • SciANN - 基于 Keras 的科学神经网络

神经算子与模型发现

  • PySINDy - 非线性动力学的稀疏识别

📖 论文与综述

基础论文

📊 全面调研与综述 (2024-2025)

科学研究人工智能

科学大语言模型

科学机器学习

🚀 AI科学家与自主研究 (2024-2025突破进展)

最新进展与领域应用

📈 评估与基准测试

  • Scientist-Bench - 全面评估LLM智能体生成研究成果与高质量科学工作对比的基准测试

🔬 领域特定应用

🧬 生物学与医学

蛋白质与药物发现

  • Protenix - 可训练的 AlphaFold 3 PyTorch 复现版本
  • Graphormer - 用于分子建模的通用深度学习主干网络
  • targetdiff - 面向靶点感知分子生成的三维等变扩散模型 (ICLR2023)
  • DrugAssist - 基于大语言模型的分子优化工具
  • mint - 学习蛋白质-蛋白质相互作用语言
  • Mol-Instructions - 面向化学/生物领域大语言模型的大规模生物分子指令数据集 (ICLR2024)
  • RDKit - 化学信息学工具包
  • ESMFold - 基于 ESM 模型的蛋白质结构预测

基因组学与生物信息学

  • scGPT - 基于Transformer的单细胞分析
  • scBERT - 用于基因表达的单细胞BERT
  • GenePT - 基因组学生成式预训练

⚛️ 化学与材料

材料发现

  • MACE - 机器学习原子间势能
  • MatterSim - 跨元素/温度/压力的深度学习原子尺度模型

化学合成

🌌 物理学与天文学

物理学中的机器学习

  • JAX-MD - 基于JAX的分子动力学模拟
  • EquiformerV2 - 改进的3D原子图等变Transformer (ICLR2024)
  • Equiformer - 等变图注意力Transformer (ICLR2023)

天文学与天体物理学

  • AstroPy - Python 天文学工具集
  • DeepSphere - 面向天文学的球面卷积神经网络

🌍 地球与气候科学

气候建模

  • ClimateBench - 面向机器学习模型的气候数据基准
  • WeatherGFT - 面向精细化天气预报的物理-AI混合建模(NeurIPS'24)
  • TerraTorch - 用于微调地理空间基础模型的Python工具包

🌾 农业与生态学

农业人工智能

  • PlantNet - 基于人工智能与公众科学的植物识别平台
  • AgML - 农业机器学习平台

生态建模

  • EcoNet - 生态建模与保护人工智能

🤖 科学基础模型

通用科学模型

  • Galactica - 面向科学领域的大语言模型
  • PaLM-2 - 科学推理能力模型

领域专用模型

  • ESM - 蛋白质语言模型
  • ChemGPT - 化学领域专用语言模型
  • BioGPT - 生物医学文本生成模型

📈 数据集与基准测试

多学科领域

生物与医学

  • ChEMBL - 化学生物活性数据

化学与材料

  • QM9 - 小分子性质数据集

物理学


💻 计算框架

机器学习

  • JAX - 高性能机器学习研究

科学计算

科学机器学习框架

  • SciML - 科学机器学习生态系统
  • Flux.jl - Julia中的机器学习框架

专业框架

  • ASE - 用于材料建模的原子模拟环境
  • PyMC - 概率编程
  • OpenMM - 高性能分子模拟工具包

🎓 教育资源

课程与教程

开放获取教育资源

📋 论文合集与资源库

YouTube 频道


🏛 研究社区

学术会议

  • ICML - 国际机器学习大会

研究机构

在线社区

  • Distill - 机器学习可视化解析

📚 相关精选资源列表

本项目基于并补充了多个优质资源:

🎯 专业资源集合

  • awesome-ai4s - 200+ 篇 AI for Science 论文附中文解读

📊 论文与研究合集

🌟 核心洞见

  • 当前重点: 从工具级辅助转向自主科学智能体
  • 新兴趋势: 多模态科学模型、自我优化的研究系统
  • 研究空白: 评估框架、伦理治理、人机协作
  • 未来方向: 完全自主的发现周期、机器人实验室集成
参考来源:
awesome-ai-for-science
ai-boostUpdated Oct 15, 2025
ai-boost/awesome-ai-for-science | zdoc.app
上一篇
免费下载学术论文与电子书资源 | 科研与文献解析工具
下一篇
考研国考四六级资源汇总

Comments
Loading...
Catalog