上海大学学报(自然科学版) ›› 2022, Vol. 28 ›› Issue (3): 399-412.doi: 10.12066/j.issn.1007-2861.2388
岳溪朝1, 冯燕1, 刘健1, 于烨泳1, 席慷杰2, 钱权1,3,4(
)
收稿日期:2022-03-30
出版日期:2022-06-30
发布日期:2022-05-27
通讯作者:
钱权
E-mail:qqian@shu.edu.cn
作者简介:钱权(1972—), 男, 研究员, 博士生导师, 博士, 研究方向为材料信息学、机器学习、网络安全等. E-mail: qqian@shu.edu.cn基金资助:
YUE Xichao1, FENG Yan1, LIU Jian1, YU Yeyong1, XI Kangjie2, QIAN Quan1,3,4(
)
Received:2022-03-30
Online:2022-06-30
Published:2022-05-27
Contact:
QIAN Quan
E-mail:qqian@shu.edu.cn
摘要:
材料数据具有多源、异构、高维等特点, 收集纷繁复杂的材料数据, 建立材料基因工程专用数据库, 是实现数据驱动的新材料研发的基础. 以材料数据的规范化表示、机器学习建模及模型跨域部署、材料数据隐私保护下的机器学习、利用知识图谱从材料数据库到知识库等材料基因专用数据库的若干核心技术为基础, 介绍了材料基因数据库平台的系统架构及实现、平台超算部署及运行. 最后以反钙钛矿负膨胀材料为例, 介绍了材料基因工程数据库平台从数据归档到机器学习建模, 再到逆向设计, 以及最终实验验证的整个流程.
中图分类号:
岳溪朝, 冯燕, 刘健, 于烨泳, 席慷杰, 钱权. 材料基因组工程专用数据库[J]. 上海大学学报(自然科学版), 2022, 28(3): 399-412.
YUE Xichao, FENG Yan, LIU Jian, YU Yeyong, XI Kangjie, QIAN Quan. Database for materials genome engineering[J]. Journal of Shanghai University(Natural Science Edition), 2022, 28(3): 399-412.
| [1] |
Hey T, Tansley S, Tolle K. The fourth paradigm: data-intensive scientific discovery[J]. Proceedings of the IEEE, 2011, 99(8): 1334-1337.
doi: 10.1109/JPROC.2011.2155130 |
| [2] |
Pratt M J. Introduction to ISO 10303: the step standard for product data exchange[J]. Journal of Computing and Information Science in Engineering, 2001, 1(1):102-103.
doi: 10.1115/1.1354995 |
| [3] |
Hill J, Mulholland G, Persson K, et al. Materials science with large-scale data and informatics: unlocking new opportunities[J]. MRS Bulletin, 2016, 41(5): 399-409.
doi: 10.1557/mrs.2016.93 |
| [4] |
Zhang X, Hu C, Li H. Semantic query on materials data based on mapping MatML to an OWL ontology[J]. Data Science Journal, 2009, 8: 1-17.
doi: 10.2481/dsj.8.1 |
| [5] | Liu S L, Su Y J, Yin H Q, et al. An infrastructure with user-centered presentation data model for integrated management of materials data and services[J]. npj Computational Materials, 2021, 7(1): 779-786. |
| [6] | Wilkinson M D, Dumontier M, Aalbersberg I J, et al. The FAIR guiding principles for scientific data management and stewardship[J]. Scientific Data, 2016, 3: 167-172. |
| [7] |
Bray T, Paoli J, Sperberg-McQueen C M, et al. Extensible markup language (XML) 1.0[J]. World Wide Web Journal, 1997, 2(4): 29-66.
doi: 10.1023/A:1019288403823 |
| [8] | Sperberg-McQueen C M, Thompson H S. W3C XML schema definition language (XSD) 1.1 part 1: structures[EB/OL]. (2012-04-15)[2022-03-20]. https://www.w3.org/TR/xmlschema11-1/. |
| [9] | Saxonica M K. XSL transformations (XSLT) version 2.0 (second edition)[EB/OL]. (2007-01-23)[2022-03-30]. https://www.w3.org/TR/2021/REC-xslt20-20210330/. |
| [10] |
Butler K T, Davies D W, Cartwright H, et al. Machine learning for molecular and materials science[J]. Nature, 2018, 559(7715): 547-555.
doi: 10.1038/s41586-018-0337-2 |
| [11] | Bai J, Lu F, Zhang K, et al. ONNX: open neural network exchange, Github[EB/OL]. (2022-03-18) [2022-03-20] https://github.com/onnx/onnx. |
| [12] |
Guazzelli A, Zeller M, Lin W C, et al. PMML: an open standard for sharing models[J]. The R Journal, 2009, 1(1): 60-65.
doi: 10.32614/RJ-2009-010 |
| [13] | Kosba A, Miller A, Shi E, et al. Hawk: the blockchain model of cryptography and privacy-preserving smart contracts[C]// 2016 IEEE Symposium on Security and Privacy. 2016: 839-858. |
| [14] | Yang Q, Liu Y, Chen T, et al. Federated machine learning: concept and applications[EB/OL]. (2019-02-13)[2022-03-20]. http://arxiv.org/abs/1902.04885. |
| [15] | Dwork C, McSherry F, Nissim K, et al. Calibrating noise to sensitivity in private data analysis[C]// Proceeding of Theory of Cryptography Conference. 2006: 1-20. |
| [16] | Rivest R L, Adleman L, Dertouzos M L, et al. On data banks and privacy homomorphisms[J]. Foundations of Secure Computation, 1978, 4(11): 169-180. |
| [17] | Mohassel P, Zhang Y. SecureML: a system for scalable privacy-preserving machine learning[C]// 2017 IEEE Symposium on Security and Privacy. 2017: 19-38. |
| [18] | Yamazaki M, Xu Y. Current status of NIMS structural materials database[C]// ASME Pressure Vessels & Piping Conference. 2009: 1561-1568. |
| [19] | Bordes A, Usunier N, Garcia-Duran A, et al. Translating embeddings for modeling multi-relational data[C]// Advances in Neural Information Processing Systems. 2013: 2787-2795. |
| [20] | Wang Z, Zhang J, Feng J, et al. Knowledge graph embedding by translating on hyperplanes[C]// Proceedings of the Twenty-Eighth AAAI Conference on Artificial Intelligence. 2014: 1112-1119. |
| [21] | Hu A, Chen H. Data visualization analysis of knowledge graph application[C]// 2021 2nd International Conference on Artificial Intelligence and Information Systems. 2021: 1-10. |
| [22] | Gonçalves R S, Horridge M, Li R, et al. Use of OWL and semantic Web technologies at Pinterest[C]// The Semantic Web-ISWC 2019. 2019: 418-435. |
| [23] |
Bienvenu M, Bourgaux C, Goasdoué F, et al. Computing and explaining query answers over inconsistent DL-Lite knowledge bases[J]. Journal of Artificial Intelligence Research, 2019, 64: 563-644.
doi: 10.1613/jair.1.11395 |
| [24] |
Zhang X M, Liu X, Li X, et al. MMKG: an approach to generate metallic materials knowledge graph based on DBpedia and Wikipedia[J]. Computer Physics Communications, 2017, 211: 98-112.
doi: 10.1016/j.cpc.2016.07.005 |
| [1] | 许浩, 石晨昕, 何文福, 赵慧玲, 詹浩南. 交通荷载下场地振动响应及衰减预测模型[J]. 上海大学学报(自然科学版), 2025, 31(6): 1007-1022. |
| [2] | 王伟冠, 丁 静, 刘 鑫. 基于线性回归和神经网络的期权对冲方法: 以 SSE 50 ETF 期权为例[J]. 上海大学学报(自然科学版), 2024, 30(6): 1067-1079. |
| [3] | 赵浩然1, 沈 强2, 王 鹏2. 经典与机器学习原子间相互作用势的发展及应用进展[J]. 上海大学学报(自然科学版), 2024, 30(5): 802-812. |
| [4] | 程 锋, 万卫兵, 王雨萱, 胡继米. 融合专业知识的意图抽取联合模型[J]. 上海大学学报(自然科学版), 2024, 30(4): 655-668. |
| [5] | 宗宇杨, 李俊辉, 朱向东, 单光存, 马汝广. 机器学习在高熵电催化材料中的研究进展 [J]. 上海大学学报(自然科学版), 2023, 29(5): 859-885. |
| [6] | 杨 提, 李 珊, 邓生琼. 补骨脂乙素治疗溃疡性结肠炎的分子作用机制[J]. 上海大学学报(自然科学版), 2023, 29(2): 253-. |
| [7] | 夏瑞玲, 李国平, 王国中, 滕国伟. 基于改进蚁群算法的个性化学习路径推荐[J]. 上海大学学报(自然科学版), 2023, 29(1): 129-139. |
| [8] | 张涵, 陈龙龙, 张建华, 蒋海珍. 耐高温透明聚酰亚胺的结构设计与性能预测[J]. 上海大学学报(自然科学版), 2022, 28(5): 794-812. |
| [9] | 陈水洲, 王晓书, 欧阳求保, 张瑞. 数据驱动的铝基复合材料性能预测和逆向设计[J]. 上海大学学报(自然科学版), 2022, 28(3): 512-522. |
| [10] | 武星, 胡明涛, 丁鹏. 陶瓷涂层材料多模态数据表征学习[J]. 上海大学学报(自然科学版), 2022, 28(3): 492-503. |
| [11] | 麦嘉琪, 徐鹏程, 丁松, 孙阳庭, 陆文聪. 支持向量回归预测不锈钢的点蚀电位[J]. 上海大学学报(自然科学版), 2022, 28(3): 485-491. |
| [12] | 胡瑞, 刘庆, 张光捷, 李俊杰, 陈晓玉, 魏晓, 戴东波. 基于特征工程和机器学习的铝基高熵合金稳定性预测[J]. 上海大学学报(自然科学版), 2022, 28(3): 476-484. |
| [13] | 魏晓, 王晓鑫, 陈永琪, 张惠然. 基于自然语言处理的材料领域知识图谱构建方法[J]. 上海大学学报(自然科学版), 2022, 28(3): 386-398. |
| [14] | 陶立, 朱杰江, 蔡洪浩. 基于经典机器学习的墙柱施工图图像识别[J]. 上海大学学报(自然科学版), 2021, 27(5): 940-949. |
| [15] | 李一航, 肖斌, 唐宇超, 刘馥, 王小梦, 刘轶. 尖晶石氧化物能量和结构的第一性原理计算和机器学习[J]. 上海大学学报(自然科学版), 2021, 27(4): 635-649. |
| 阅读次数 | ||||||
|
全文 |
|
|||||
|
摘要 |
|
|||||