中国科学院东莞材料科学与技术研究所 — 联合研发

面向材料科学的
智能研究助手

MatChat 整合 80 万余篇学术论文、分层式智能体架构、以及多层次 Anti-Hallucination 机制,为材料科学研究提供可溯源、带引用的知识综合服务。

0 学术论文
4 层 协同架构
3 级 Anti-Hallucination

通用大模型的三大困境

LLM 有潜力辅助科学文献综合,但在材料科学领域面临根本性障碍。

幻觉问题

主流通用模型在被要求引用材料科学文献时,虚构引用比例超过 70%。材料科学知识属于 LLM 训练数据的长尾区间。

>70% 虚构引用率

知识时效性

LLM 参数化知识固定于预训练截止时间。钙钛矿电池效率纪录每年刷新数次,过时信息可能导致关键技术突破的遗漏。

滞后 数月至数年

领域深度不足

通用模型难以建立"缺陷钝化"与"载流子寿命提升"的因果关系链,无法对 J-V 特性曲线给出超越表面描述的机理解读。

缺失 深层语义关联

四层协同架构

借鉴认知科学"感知-理解-决策-执行"模型,每一层可独立迭代优化。

MatChat 四层协同架构图:知识数据库、上下文管理层、意图识别与路由、推理执行层
01

知识数据库

80 万余篇结构化论文,覆盖能源材料、电子信息材料、结构材料、生物医用材料。采用稠密检索 + 关键词检索 + 交叉编码器重排序的多源检索策略。

稠密检索 关键词检索 交叉编码器重排序 查询重写
02

上下文管理层

支持跨会话状态恢复与动态压缩。双重触发压缩策略(12 轮或 60,000 字符),以 5%–15% 的压缩比保留核心信息。

跨会话记忆 动态压缩 双轨制一致性
03

意图识别与路由

基于 LLM 的分类器将用户输入路由至四个通道:科研相关、身份询问、非科研问题、违规内容,同时执行安全预过滤。

四通道路由 安全预过滤 可信边界
04

推理执行层

双模式自适应切换:Deep Research 模式支持至多 6 次工具调用、16K tokens 输出、多模态分析;Basic 模式以 0–1 次检索最小化延迟。

Deep Research Basic 模式 自适应切换 多模态分析

三层 Anti-Hallucination 机制

科研场景下,信息准确性是不可妥协的底线。

第一道防线

知识锚定

检索结果中未出现的信息不予生成。

  • 空值检测 — 检索为空时明确声明知识边界
  • 来源强制绑定 — 每条论断关联至原始文献具体段落
  • 多源交叉验证 — 跨文献共同支持的观点赋予更高置信度
  • 时效性标注 — 标注引用文献发表时间
第二道防线

透明性协议

让系统的每一步决策对用户可见。

  • 调用前宣示 — 输出检索意图
  • 推理过程可视化 — 展示中间步骤
第三道防线

引用规范

结构化引用形成论证闭环。

  • 单次查询关联数十篇文献
  • 完整元数据(标题、作者、期刊、年份)
  • DOI 链接 + 相关性评分

深入材料科学研究的每一个维度

从能源材料到生物医用,从光电性能到化学分析,MatChat 具备深度的实验数据解读能力。

能源材料

钙钛矿太阳能电池、锂/钠离子电池

J-V 曲线 · 效率-稳定性权衡 · 离子传输机理

电子信息材料

量子点、石墨烯、二维材料、拓扑绝缘体

能带结构 · 载流子传输 · 量子限域效应

结构材料

高温合金、金属/陶瓷基复合材料

力学性能关联 · 失效机理 · 相变行为

生物医用材料

生物相容性材料、组织工程支架、药物递送

生物响应 · 降解行为 · 免疫原性评估

实验数据解读

光电性能

  • J-V 特性曲线:Voc · Jsc · FF · PCE · 迟滞检测
  • EQE 外量子效率光谱分析
  • S-Q 极限分析与评估

结构表征

  • XRD 物相鉴定 · 晶格参数 · 结晶度 · 应力
  • SEM/TEM 微观结构 · 粒径分布 · 缺陷判定
  • AFM 表面拓扑 · 粗糙度量化

化学分析

  • XPS 元素定量 · 化学态 · 能级偏移
  • FTIR/Raman 官能团 · 化学键 · 晶格振动

从数周到数小时

以钙钛矿太阳能电池效率瓶颈分析为例。

MatChat 研究流程图:从传统路径到 AI 增强路径的对比
传统路径

在 Web of Science、Google Scholar 等平台检索数百篇文献 → 人工筛选 → 手动整理 → 综合分析

总耗时:数周
MatChat 路径

系统自动启动 Deep Research → 并行检索多子主题 → 综合 20+ 篇文献 → 逐句溯源

总耗时:数小时

发展路线

近期 6 个月内

个人知识库

上传私有研究资料,实现私有资料与公共知识库的联合检索。

图表精准检索

基于多模态模型的论文图表语义检索,自然语言查找实验图表。

API 开放服务

标准化 API 接口,支持程序化知识查询与批量文献分析。

中期 12 个月内

实验设计辅助

合成路径推荐、参数敏感性分析、失败模式预警。

系统评估基准

构建面向材料科学的评估基准数据集和多维度自动评估管线。

跨语言知识整合

支持中英日德等多语言文献的统一检索与问答。

长期 远景规划

产业知识辐射

缩短从实验室到产业化的知识传递链条。

协作研究空间

课题组级别知识共享与研究进度协同追踪。

开始使用 MatChat

科学知识系统的输出必须可溯源、可验证。
MatChat 是材料科学研究者的信息获取工具。

立即开始