上海大学学报(自然科学版) ›› 2018, Vol. 24 ›› Issue (5): 730-744.doi: 10.12066/j.issn.1007-2861.1843
收稿日期:2016-09-23
出版日期:2018-10-30
发布日期:2018-10-26
通讯作者:
梁意文
E-mail:ywliang@whu.edu.cn
基金资助:
CHEN Yue1, DONG Hongbin2, TAN Chengyu1, LIANG Yiwen1(
)
Received:2016-09-23
Online:2018-10-30
Published:2018-10-26
Contact:
LIANG Yiwen
E-mail:ywliang@whu.edu.cn
摘要:
随着计算机的普及和大数据时代的来临, 个人计算机中文档的版本数急剧增加, 用户想要迅速找到所需的文档绝非易事. 相关研究表明, 文件的起源信息可以为用户提供快速定位目标文档的线索. 已有的一些基于数据起源的检索方式, 其起源粒度多数是文件级的. 但对于内容相关性较高的文档来说, 文件级的起源信息无法清晰地描述内容间的关联关系, 也就无法给予用户充分的帮助. 基于 PROV 模型, 针对文档版本的变化建立内容级的起源概念模型, 并给出了起源词汇表. 在资源描述框架 (resource description framework, RDF) 语言的基础上建立了起源信息的查询访问机制, 并给出了可视化方案, 为用户提供直观的信息表达. 结果表明, 该方法通过对文档检索结果的扩展和解释, 可以为用户提供更有价值的帮助信息, 从而达到快速锁定目标文件的目的, 提高工作效率.
中图分类号:
陈悦, 董红斌, 谭成予, 梁意文. 数据起源在多版本文档检索中的应用[J]. 上海大学学报(自然科学版), 2018, 24(5): 730-744.
CHEN Yue, DONG Hongbin, TAN Chengyu, LIANG Yiwen. Application of data provenance in multi-version documents retrieval[J]. Journal of Shanghai University(Natural Science Edition), 2018, 24(5): 730-744.
| [1] | Lyman P, Varian H R. How much information 2003 [EB/OL]. (2003-10-27)[2016-10-05]. http://www2.sims.berkeley.edu/research/projects/how-much-info. |
| [2] | Blanc-Brude T, Scapin D L. What do people recall about their documents: implications for desktop search tools[C]// Proceedings of the 12th International Conference on Intelligent User Interfaces, ACM. 2007: 102-111. |
| [3] | Shah S, Soules C A N, Ganger G R, et al. Using provenance to aid in personal file search[C]// USENIX Annual Technical Conference. 2007: 171-184. |
| [4] |
Soules C A N, Ganger G R. Connections: using context to enhance file search[J]. ACM SIGOPS Operating Systems Review, 2005,39(5):119-132.
doi: 10.1145/1095809.1095822 |
| [5] | Stumpf S, Fitzhenry E, Dietterich T G. The use of provenance in information retrieval[C]// Workshop on Principles of Provenance. 2007: 20. |
| [6] | Chau D H, Myers B, Faulring A. Feldspar: a system for finding information by association[C]// Proceedings of Personal Information Management. 2008: 131-138. |
| [7] | 戴超凡, 王涛, 张鹏程. 数据起源技术发展研究综述[J]. 计算机应用研究, 2010,27(9):3215-3221. |
| [8] | Rinck M, Hinze A, Bainbridge D, et al. Document DNA: content centric provenance data tracking in documents[C]// Proceedings of the 37th Australasian Computer Science Conference. 2014: 57-66. |
| [9] | Lu C T, Shukla M, Subramanya S H, et al. Performance evaluation of desktop search engines[C]// IEEE International Conference Information Reuse and Integration. 2007: 110-115. |
| [10] | Jensen C, Lonsdale H, Wynn E, et al. The life and times of files and information: a study of desktop provenance[C]// Proceedings of the SIGCHI Conference on Human Factors in Computing Systems, ACM. 2010: 767-776. |
| [11] | Muniswamy-Reddy K K, Holland D A, Braun U, et al. Provenance-aware storage systems[C]// USENIX Annual Technical Conference, General Track. 2006: 43-56. |
| [12] | Dragunov A N, Dietterich T G, Johnsrude K, et al. TaskTracer: a desktop environment to support multi-tasking knowledge workers[C]// Proceedings of the 10th International Conference on Intelligent User Interfaces, ACM. 2005: 75-82. |
| [13] | Yamamoto K, Kuriyama T, Shigemori H, et al. Provenance based retrieval: file retrieval system using history of moving and editing in user experience[C]// Computer Software and Applications Conference. 2011: 618-625. |
| [14] |
Ball R. Don't search, just show me what I did: visualizing provenance of documents and applications[J]. International Journal of Human-Computer Interaction, 2013,29(3):156-168.
doi: 10.1080/10447318.2012.701569 |
| [15] | Luc M, Paolo M. PROV-DM: the PROV data model [EB/OL]. [2016-10-05]. https://www.w3.org/TR/2013/REC-prov-dm-20130430/. |
| [16] | Paul G, Luc M. PROV-overview: an overview of the PROV family of docu- ments [EB/OL]. [2016-10-05]. https://www.w3.org/TR/2013/NOTE-prov-overview-20130430/. |
| [17] | Moreau L, Freire J, Futrelle J, et al. The open provenance model: an over- view[C]// International Provenance and Annotation Workshop. 2008: 323-326. |
| [18] | 倪静, 孟宪学. PROV数据溯源模型及Web应用[J]. 图书情报工作, 2014,58(3):13-19. |
| [19] | Tom D N, James C, Paolo M, et al. Constraints of the PROV data model [EB/OL]. [2016-10-05]. https://www.w3.org/TR/2013/REC-prov-constraints-20130430/. |
| [20] | Eric P, Andy S. SPARQL query language for RDF [EB/OL]. [2016-10-05]. https://www.w3.org/TR/rdf-sparql-query/. |
| [1] | 赵静, 王驰, 俞朱恺, 许婧靓. 基于优化生成对抗网络的OCT图像去噪和超分辨率重建[J]. 上海大学学报(自然科学版), 2026, 32(2): 251-260. |
| [2] | 朱兆迪, 彭亚新. GNN谱视角下的跨网络节点分类[J]. 上海大学学报(自然科学版), 2026, 32(2): 295-311. |
| [3] | 朱硕, 王永芳, 李子萱, 陈伟. 基于YOLO模型的作业环境实时反光背心检测[J]. 上海大学学报(自然科学版), 2025, 31(4): 691-703. |
| [4] | 王云亭, 张金艺. 复杂天气条件下道路场景目标检测的域泛化[J]. 上海大学学报(自然科学版), 2025, 31(4): 704-718. |
| [5] | 么新鹏, 栗剑, 孟祥龙, 解冬东, 阚欣, 孟强. 基于固定时间观测器的网络化控制系统事件触发控制[J]. 上海大学学报(自然科学版), 2025, 31(4): 746-756. |
| [6] | 黄东晋, 俞乐洋, 石永生, 郑楚, 钱纪宇. 基于情绪一致性的三维人脸重建[J]. 上海大学学报(自然科学版), 2025, 31(3): 475-486. |
| [7] | 韩大专, 张金艺, 姜玉稀. 面向数字孪生的深层特征融合低照度图像去雨线[J]. 上海大学学报(自然科学版), 2025, 31(3): 543-560. |
| [8] | 金彦亮1, 2, 高至锋1, 2, 高塬1, 2. 基于预训练特征中心的古汉语翻译模型[J]. 上海大学学报(自然科学版), 0, (): 0-. |
| [9] | 杨彤彤, 杨紫云, 王子驰. 以神经网络模型为载体的鲁棒隐写方法[J]. 上海大学学报(自然科学版), 0, (): 0-. |
| [10] | 窦立云, 冯国瑞, 钱振兴, 张新鹏. 抗深度取证的多粒度融合图像修复网络[J]. 上海大学学报(自然科学版), 2023, 29(1): 10-23. |
| [11] | 李忠雨, 孙浩东, 李娇. 基于损失加权的实时篮球裁判手势识别系统[J]. 上海大学学报(自然科学版), 2023, 29(1): 68-81. |
| [12] | 马一鸣, 石志东, 赵康, 贡常磊, 单联海. 基于改进樽海鞘群算法的到达时间差定位[J]. 上海大学学报(自然科学版), 2022, 28(2): 238-249. |
| [13] | 王榕榕, 徐树公, 黄剑波. 基于深度学习的图像抠图技术[J]. 上海大学学报(自然科学版), 2022, 28(2): 261-269. |
| [14] | 金彦亮, 谢晋飞, 吴迪嘉. 基于分层标注的中文嵌套命名实体识别[J]. 上海大学学报(自然科学版), 2022, 28(2): 270-280. |
| [15] | 杨一璞, 朱永华, 高海燕, 高文靖. 一种结合文章信息的新闻评论情感分析方法[J]. 上海大学学报(自然科学版), 2022, 28(1): 170-178. |
| 阅读次数 | ||||||
|
全文 |
|
|||||
|
摘要 |
|
|||||