欢迎您来到 数字平台。 您尚未登录。[登录] [注册新用户]
当前位置: 论坛首页 / 栏目 产品与服务 / 文章 87

点击:1670

[顶层访客留言] [回复顶层(需要先登录)] [表状] [简明]


头衔: 总工
文章数: 539
积分: 5390
注册时间: 2005/9/5
[回复留言] [回复(需要先登录)] [引用(需要先登录)]普通文章跟帖
文章id: 87
编目查重

作者: xietao


查重是编目和采购等业务环节的一个重要功能。

dp2编目系统提供了一个查重窗口,专用于进行查重。这个窗口作为一个组件,也可以在数据加工的二次开发C#脚本中调用。

下图是查重的场景: 

dp2编目系统查重的操作原理,是将查重发起的记录,按照该记录所从属的书目库的检索点配置策略,创建检索点,然后利用这些检索点,针对若干查重目标库进行检索。

这里所指的创建检索点,是模拟保存记录到数据库的那种规则,创建检索点,哪怕是尚未保存的新记录,也可以这样运作。

对目标库进行检索后,软件将按照预先配置的权重指标,对命中进行评估,测算出一个权值的和,如果某项命中记录的权值和超过预先配置的“阈值”,界面上就会把这项加亮显示,权值左边也会着重标出一个星号,表示这项就算和发起记录“重”了。

===

下面是服务器全局cfgs/dup配置文件的片断:

...

    <project name="采购查重" comment="示例方案">
        <database name="测试书目库" threshold="60">
            <accessPoint name="著者" weight="50" searchStyle="" />
            <accessPoint name="题名" weight="70" searchStyle="" />
            <accessPoint name="索书类号" weight="10" searchStyle="" />
        </database>
        <database name="编目库" threshold="60">
            <accessPoint name="著者" weight="50" searchStyle="" />
            <accessPoint name="题名" weight="70" searchStyle="" />
            <accessPoint name="索书类号" weight="10" searchStyle="" />
        </database>
    </project>
    <project name="编目查重" comment="这是编目查重示例方案">
        <database name="中文图书" threshold="100">
            <accessPoint name="责任者" weight="50" searchStyle="" />
            <accessPoint name="ISBN" weight="80" searchStyle="" />
            <accessPoint name="题名" weight="20" searchStyle="" />
        </database>
        <database name="图书测试" threshold="100">
            <accessPoint name="责任者" weight="50" searchStyle="" />
            <accessPoint name="ISBN" weight="80" searchStyle="" />
            <accessPoint name="题名" weight="20" searchStyle="" />
        </database>
    </project>
    <default origin="中文图书" project="编目查重" />
    <default origin="图书测试" project="编目查重" />

...

这里定义了两种查重方案(<project>元素),其中一种“编目查重”缺省和“中文图书”和“图书测试”关联了起来。

===

值得一提的是,在dp2batch模块中,某些“批处理方案”通过脚本调用上述查重窗口,实现了外部数据批处理一边转入一边查重的功能。经查重表明重了的记录,就被跳过不会转入了。很典型的例子是,对外部采购数据批处理装入“征订数据库”,就需要有这样的查重能力。



发表时间: 2006-05-30 15:54:04
最后修改时间: 2006-05-31 15:43:21



  • 精品 图解dp2编目系统 xietao 2006-05-30 15:03:14[点击:142523]
  • 普通文章 什么叫dp2 ? xietao 2006-05-30 15:15:07 (ID:76) [点击:1960]
  • 普通文章 框架窗口,检索窗 xietao 2006-05-30 15:20:10 (ID:77) [点击:1612]
  • 普通文章 详细窗 xietao 2006-05-30 15:24:14 (ID:78) [点击:1850]
  • 普通文章 定长模板 xietao 2006-05-30 15:27:00 (ID:79) [点击:1720]
  • 普通文章 值列表 xietao 2006-05-30 15:30:23 (ID:80) [点击:1610]
  • 普通文章 缺省值 xietao 2006-05-30 15:34:05 (ID:81) [点击:1597]
  • 普通文章 一些编辑功能 xietao 2006-05-30 15:36:49 (ID:82) [点击:1702]
  • 普通文章 自动创建数据 xietao 2006-05-30 15:40:48 (ID:83) [点击:1712]
  • 普通文章 种次号 xietao 2006-05-30 15:44:14 (ID:84) [点击:1641]
  • 普通文章 分类主题对照 xietao 2006-05-30 15:47:14 (ID:85) [点击:2163]
  • 普通文章 使用中的一些顾虑 liujp 2006-07-02 21:43:28 (ID:98) [点击:2356]
  • 普通文章 回复: 使用中的一些顾虑 xietao 2006-07-03 10:30:21 (ID:102) [点击:1945]
  • 普通文章 服务器端不能创建根下的cfgs目录 liujp 2006-07-02 21:46:26 (ID:99) [点击:2221]
  • 普通文章 回复: 服务器端不能创建根下的cfgs目录 xietao 2006-07-03 10:37:31 (ID:103) [点击:1706]
  • 普通文章 典藏册登录 xietao 2006-05-30 15:49:50 (ID:86) [点击:1967]
  • 普通文章 编目查重 xietao 2006-05-30 15:54:04 (ID:87) [点击:1670]
  • 普通文章 观察检索点 xietao 2006-05-30 15:56:06 (ID:88) [点击:2014]
  • 普通文章 著者号码 xietao 2006-06-01 15:07:35 (ID:89) [点击:1902]
  • 普通文章 繁简体汉字归一化检索点技术 xietao 2006-06-01 15:36:43 (ID:90) [点击:1755]
  • 普通文章 追记 xietao 2012-04-02 12:02:14 (ID:724) [点击:1475]
  •  

    在线用户
    访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客 (我自己)   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客   访客访客
    当前栏目在线用户数 112, 总在线用户数 119