MatChat 整合 80 万余篇学术论文、分层式智能体架构、以及多层次 Anti-Hallucination 机制,为材料科学研究提供可溯源、带引用的知识综合服务。
LLM 有潜力辅助科学文献综合,但在材料科学领域面临根本性障碍。
主流通用模型在被要求引用材料科学文献时,虚构引用比例超过 70%。材料科学知识属于 LLM 训练数据的长尾区间。
LLM 参数化知识固定于预训练截止时间。钙钛矿电池效率纪录每年刷新数次,过时信息可能导致关键技术突破的遗漏。
通用模型难以建立"缺陷钝化"与"载流子寿命提升"的因果关系链,无法对 J-V 特性曲线给出超越表面描述的机理解读。
借鉴认知科学"感知-理解-决策-执行"模型,每一层可独立迭代优化。
80 万余篇结构化论文,覆盖能源材料、电子信息材料、结构材料、生物医用材料。采用稠密检索 + 关键词检索 + 交叉编码器重排序的多源检索策略。
支持跨会话状态恢复与动态压缩。双重触发压缩策略(12 轮或 60,000 字符),以 5%–15% 的压缩比保留核心信息。
基于 LLM 的分类器将用户输入路由至四个通道:科研相关、身份询问、非科研问题、违规内容,同时执行安全预过滤。
双模式自适应切换:Deep Research 模式支持至多 6 次工具调用、16K tokens 输出、多模态分析;Basic 模式以 0–1 次检索最小化延迟。
科研场景下,信息准确性是不可妥协的底线。
检索结果中未出现的信息不予生成。
让系统的每一步决策对用户可见。
结构化引用形成论证闭环。
从能源材料到生物医用,从光电性能到化学分析,MatChat 具备深度的实验数据解读能力。
钙钛矿太阳能电池、锂/钠离子电池
J-V 曲线 · 效率-稳定性权衡 · 离子传输机理量子点、石墨烯、二维材料、拓扑绝缘体
能带结构 · 载流子传输 · 量子限域效应高温合金、金属/陶瓷基复合材料
力学性能关联 · 失效机理 · 相变行为生物相容性材料、组织工程支架、药物递送
生物响应 · 降解行为 · 免疫原性评估以钙钛矿太阳能电池效率瓶颈分析为例。
在 Web of Science、Google Scholar 等平台检索数百篇文献 → 人工筛选 → 手动整理 → 综合分析
系统自动启动 Deep Research → 并行检索多子主题 → 综合 20+ 篇文献 → 逐句溯源
上传私有研究资料,实现私有资料与公共知识库的联合检索。
基于多模态模型的论文图表语义检索,自然语言查找实验图表。
标准化 API 接口,支持程序化知识查询与批量文献分析。
合成路径推荐、参数敏感性分析、失败模式预警。
构建面向材料科学的评估基准数据集和多维度自动评估管线。
支持中英日德等多语言文献的统一检索与问答。
缩短从实验室到产业化的知识传递链条。
课题组级别知识共享与研究进度协同追踪。