3. メタデータの収集
装置のDOIを作成するためには、その装置を説明しかつDOIレコードに含めたいと思うすべてのメタデータを収集する必要があります。 PIDINSTホワイトペーパーのセクション PIDINSTメタデータスキーマ では、DOIレコードに含むことを検討すべきメタデータを説明しています。
Persistent Identification of Instruments WGは、PIDINST Metadata Schemaを開発しました。 しかし、DataCite DOIを作成しようとすると、DataCite Metadata Schema を使用しなければならない制約があります。DataCite はバージョン4.5からは装置向けのサポートを大きく改善し、Mapping of PIDINST Schema onto the DataCite Schema の提供を始めています。
3.1. PIDINST メタデータから DataCite へのマッピング
DataCite から提供されたマッピングに基づき、装置を記述するメタデータがDataCite Schemaでどのように表現されるのが最適かを以下に説明します。
- Identifier
The DOI that you are going to create. Add as DataCite property Identifier with identifierType=DOI.
- LandingPage
このPIDが解決するランディングページのURL。DataCite スキーマにはこのためのプロパティがありませんが、DOIを作成したときにこのメタデータをとともにURLを登録します。
- Name
The name by which this instrument is known. Add as DataCite property Title. The DataCite schema allows for multiple kinds of titles that are distinguished by the titleType subproperty. A title without a specified type is assumed to be the main title.
Many instruments are commonly refered to with acronyms. Use Title with titleType=AlternateTitle to include the acronym for the instrument.
- Owner
The organization or individual that manages the instrument. Add as DataCite property Contributor with contributorType=HostingInstitution. An identifier, typically a ROR, can be used to unambiguously identify the owner in the nameIdentifier subproperty of Contributor.
- Manufacturer
The organization or individual that built the instrument. Add as DataCite property Creator. Consider also to add an identifier, typically a ROR, for the manufacturer in the nameIdentifier subproperty of Creator.
- Model
装置のモデル名。 DataCite スキーマには、このための特定のプロパティが存在しません。 DataCite によるマッピングガイドでは、 descriptionType=TechnicalInfo とともに Description プロパティを追加することを提案しています。 次節の注釈を参照してください。
Description DataCite プロパティは、 modelIdentifier を包含する方法を提供しません。 もしモデルがPIDを持ち、これを(DataCiteメタデータに)含みたいならば、 relationType=References とともに RelatedIdentifier プロパティとして追加することも選択肢となりえます。
- Description
A textual description of the device and its capabilities. Add as DataCite property Description with descriptionType=Abstract. A description with descriptionType=TechnicalInfo can also be used to provide additional technical details (see Model, InstrumentType, and MeasuredVariable).
- InstrumentType
装置の形式の分類。 DataCite スキーマにはこのための特定のプロパティが存在しません。 DataCite によるマッピングガイドでは、 descriptionType=TechnicalInfo とともに Description プロパティとして追加することを提案しています。 次節の注釈を参照してください。代替案としては、 Subject プロパティにこのような分類を表すキーワードを追加することも考えられます。後者の方法は装置の形式を統制語彙に基づく用語により記述しなければならない場合に特に有用です。なぜなら、 Subject プロパティは subjectScheme, schemeURI, valueURI サブプロパティを用いてこれらの用語へのリンクを持つことができるからです。
- MeasuredVariable
装置が測定、観測する値や物理量。 DataCite スキーマには、このための特定のプロパティが存在しません。 DataCite によるマッピングガイドでは、 descriptionType=TechnicalInfo とともに Description プロパティを追加することを提案しています。 次節の注釈を参照してください。
- Date
Relevant events pertaining to this instrument instance. Add as DataCite property Date. Use dateType=Available to indicate the date that the instrument is or was in operation. Use a single date if the instrument is still in operation, to indicate a start date. Use a date interval to indicate a start and an end date, if the instrument has already been decommissioned.
- RelatedIdentifier
This can be used to establish links to related resources with identifiers. The DataCite Schema has a property with the same name, having very similar subproperties and semantics as the PIDINST Schema.
The type of the relation is described using the relationType property. The DataCite schema has a list of valid relation types. Several relation types can be used to connect to more detailed instrument metadata:
IsDescribedBy can be used to link to a more detailed description of the instrument.
HasMetadata can be used to link to metadata records that describe the instrument in more detail.
HasVersion, IsVersionOf, IsNewVersionOf, and IsPreviousVersionOf can be used to link to other versions of the instrument.
HasPart and IsPartOf can be used to define parts of instruments or instruments with parts.
Collects (added in Version 4.5 of the schema) can be used for describing the relation between an instrument and a dataset, i.e. instrument A collects dataset B.
IsCollectedBy (also added in Version 4.5 of the schema) can be used for the complimentary relationship (dataset B is collected by instrument A).
- AlternateIdentifier
To be used if this instrument is also registered elsewhere. Add as DataCite property AlternateIdentifier. Use alternateIdentifierType=SerialNumber for a serial number attributed by the manufacturer. Use alternateIdentifierType=InventoryNumber for an inventory number used by the owner.
PIDINSTスキーマとは対照的に、DataCiteスキーマでは alternateIdentifierType はフリーテキストであることに注意してください。したがって、シリアル番号や装置管理番号ではない代替識別子を追加する場合、強制的に alternateIdentifierType=Other を使用する必要はなく、すぐに alternateIdentifierType に適切な型を設定することができます。
3.2. DetaCite スキーマでの記述に関する注釈
The mapping of PIDINST metadata onto DataCite ガイドでは、 Model, InstrumentType, MeasuredVariable プロパティは、 descriptionType=TechnicalInfo とともに Description として追加することを提案しています。 Description の持つ値はフリーテキストになります。 modelIdentifier の様に、サブプロパティを含んだ構造的な形式を持つことができません。
Description は複数の値を持つことができますので、 あなたは同じ descriptionType を使ったとしても必要な分だけインスタンスを追加できます。なので、Model, InstrumentType, MeasuredVariable それぞれ別の Description インスタンスを用いることを提案します。
3.3. DataCite スキーマでの追加プロパティ
DataCiteスキーマには、PIDINSTスキーマに対応するものがなく、DataCiteで必須であるため設定する必要があるか、検討する価値のあるプロパティがさらにいくつかあります。もちろん、ここに記載されていない他のDataCiteプロパティも、特定のユースケースで意味をなすのであれば、同様に考慮されるかもしれません。
- Publisher
"リソースを保有、アーカイブ、出版、印刷、配布、リリース、発行、または生産している主体の名前" (DataCite スキーマの定義からの引用)。装置の場合、これがさす内容は不明瞭なことが多く、また PIDINST Schema の Owner と少し重複しているように思えます。しかし、DataCite Schemaでは必須ですので、設定する必要があります。 DOIを作成し、DOIのメタデータを管理する責任がある主体に設定することをお勧めします。
In Version 4.5 of the schema several sub-properties were added to DataCite property Publisher:
publisherIdentifier: Identifier for publisher. Use a ROR ID if available.
publisherIdentifierScheme: Scheme for publisher identifier (e.g. ROR).
schemeURI: The URI of the identifier scheme (e.g. https://ror.org).
- PublicationYear
DataCite スキーマでは必須です。DOIを発行した年を設定することを勧めます。
- ResourceType
DataCite DOIs are for many different types of objects, so there is a need to indicate the type. Therefore, the DataCite property ResourceType is mandatory. The subproperty resourceTypeGeneral is needs to be selected from a controlled vocabulary. Set resourceTypeGeneral=Instrument for DataCite instrument metadata records.
ResourceType itself is a free text field that can be used to provide a more specific resource type.
- FundingReference
This optional element can be used to acknowledge external funding that supported the purchase or the creation of the instrument. See DataCite property FundingReference for details.