DC元数据各元素兼可重复,对于中文资源,多个题名与其汉语拼音的关联如何编码表达,目前我尚未见有合理的应用。
我的理解是:汉语拼音是采用“汉语拼音方案"对题名描述的编码,所以应该仍采用title元素,通过编码方案限定。其实,对于西文资料也类似,只不过其可能有“国际音标"这种编码方案限定而已。
因为元素重复,要想准确表现元素之间的关系,必须考虑在元数据编码中对每个元素标识一个唯一标识符,这个可用xml:id实现。那么,对于某个题名的汉语拼音,通过编码中扩展的XML元素属性IDREF(单引用)或IDREFS(多引用)这些元素id即可准确体现元素间的关系,比如:
<dc:title xml:id="T0001">(正题名1)</dc:title>
<dc:title xml:id="T0002">(正题名2)</dc:title>
<dc:title refinement="bopomofo" IDREF="T0001">(正题名1的拼音)</dc:title>
<dc:title refinement="bopomofo" IDREF="T0002">(正题名2的拼音)</dc:title>
但这有点点小的不足:从常见语意理解来看,IDREF这是一种引用概念,似与被引用者有单向而非双向关系。如果这样理解,似有主从之感。那么,为了体现它们间平等关系,又不得不放弃现成的xml:id这个标准的定义——即考虑增加一个绑定属性,为想绑定的元素提供一个相同的值,类似MARC现在某些字段中的$5子字段,如:
<dc:title bind="T0001">(正题名1)</dc:title>
<dc:title bind="T0002">(正题名2)</dc:title>
<dc:title refinement="bopomofo" bind="T0001">(正题名1的拼音)</dc:title>
<dc:title refinement="bopomofo" bind="T0002">(正题名2的拼音)</dc:title>
以上我的心得,希望得到更多的建议和指点。也许通过我们的实际工作可以来改变一下当前国内不重视元数据编码方案的现状吧。
题外话:其实,MARC时代,又有多少人在研究ISO2709这个MARC元数据的编码方案呢?