欢迎您来到 数字平台。 您尚未登录。[登录] [注册新用户]
当前位置: 论坛首页 / 栏目 数字图书馆 / 文章 41

点击:3957[回复顶层] [树状] [详细]
[回复(需要先登录)] [引用(需要先登录)]普通文章第 1 楼
文章id: 40
DC中汉语拼音描述及其元素间关系的编码探讨



      DC元数据各元素兼可重复,对于中文资源,多个题名与其汉语拼音的关联如何编码表达,目前我尚未见有合理的应用。
      我的理解是:汉语拼音是采用“汉语拼音方案"对题名描述的编码,所以应该仍采用title元素,通过编码方案限定。其实,对于西文资料也类似,只不过其可能有“国际音标"这种编码方案限定而已。
      因为元素重复,要想准确表现元素之间的关系,必须考虑在元数据编码中对每个元素标识一个唯一标识符,这个可用xml:id实现。那么,对于某个题名的汉语拼音,通过编码中扩展的XML元素属性IDREF(单引用)或IDREFS(多引用)这些元素id即可准确体现元素间的关系,比如:
<dc:title xml:id="T0001">(正题名1)</dc:title>
<dc:title xml:id="T0002">(正题名2)</dc:title>
<dc:title refinement="bopomofo" IDREF="T0001">(正题名1的拼音)</dc:title>
<dc:title refinement="bopomofo" IDREF="T0002">(正题名2的拼音)</dc:title>

      但这有点点小的不足:从常见语意理解来看,IDREF这是一种引用概念,似与被引用者有单向而非双向关系。如果这样理解,似有主从之感。那么,为了体现它们间平等关系,又不得不放弃现成的xml:id这个标准的定义——即考虑增加一个绑定属性,为想绑定的元素提供一个相同的值,类似MARC现在某些字段中的$5子字段,如:
<dc:title bind="T0001">(正题名1)</dc:title>
<dc:title bind="T0002">(正题名2)</dc:title>
<dc:title refinement="bopomofo" bind="T0001">(正题名1的拼音)</dc:title>
<dc:title refinement="bopomofo" bind="T0002">(正题名2的拼音)</dc:title>

      以上我的心得,希望得到更多的建议和指点。也许通过我们的实际工作可以来改变一下当前国内不重视元数据编码方案的现状吧。

题外话:其实,MARC时代,又有多少人在研究ISO2709这个MARC元数据的编码方案呢?



发表时间: 2007-08-12 21:14:33
最后修改时间: 2007-08-12 21:16:09



[回复(需要先登录)] [引用(需要先登录)]普通文章第 2 楼
文章id: 41
求助

作者: ynpan


您好,我听说您有中国主题分类词表的HTML文件,我目前做的研究也需要用到这个,请问能否发一份给我?不胜感激!我的邮箱是ynpan@zju.edu.cn



发表时间: 2007-11-14 22:44:57
页 1 / 1
 

在线用户
访客访客 (我自己)
当前栏目在线用户数 1, 总在线用户数 1