Veri tanımlama

Verilerin başka sistemlerce anlaşılabilir/okunabilir olması üst veri (metadata) standartları sayesinde mümkündür. Üst veri “veri hakkında veri” anlamına gelmektedir. Üst verinin önemini en iyi anlatan görsel Şekil 1’de sunulmaktadır.

Şekil 1. Üst verinin önemi [1, 2]

Şekil 1. Üst verinin önemi [12]

Yukarıdaki şekilde yer alan ilk görselde hiçbir bilgi bulunmazken, ikinci görselde ise çok az bilgi tutulmaktadır. Öte yandan üçüncü görselde zengin ve tutarlı bir şekilde yapılandırılmış bilgileri görmek mümkündür. Üzerinde herhangi bir şey yazmayan bir kutuyu açıp tüketmek ne kadar zor ise üzerinde tüm ilgili verinin bulunduğu bir kutuyu açıp tüketmek bir o kadar kolaydır. Bu sebeple verinin ne hakkında olduğuna ilişkin bilgilerin hazırlanması ve erişilebilir hale getirilmesi önemlidir.

Verilerin doğru bir şekilde tanımlanması ve belgelenmesi, kullanıcıların (veri sahibi dahil) çalışmanın önemli ayrıntılarını anlamalarını ve etkili bir şekilde izlemelerini sağlar. Verilerle ilgili üst verilere sahip olmak aynı zamanda bir veri havuzunda verilere daha kolay ulaşılmasını olanaklı hale getirir [3]. Her üst veri kaydı veri kümesi hakkında kontrollü bir bilgi listesi içerir. Sıkı bir şekilde tanımlanmış kayıt yapısı çok sayıda üst veri kaydında daha kolay arama yapılmasını ve böylece daha fazla sayıda veri kümesinin aranmasını sağlar [4].

Kapsamlı ve doğru üst veri nasıl hazırlanır?
Hangi üst veri standardı kullanılıyor olursa olsun araştırma verilerine ait kapsamlı ve doğru hazırlanmış üst verinin aşağıdaki unsurlara ait tanımlayıcı bilgiler içermesi beklenir [4]. Bu tanımlayıcıları detaylı olarak açıklayan veriler verilerin keşfedilebilirliğini sağlamalarının yanında verinin etkili tanımlanmasını ve veri birliğinin oluşturulmasını da mümkün hale getirmektedir.

Araştırma verilerine ait üst verilerin içermesi beklenen tanımlayıcılar [4]
Şekil 2. Araştırma verilerine ait üst verilerin içermesi beklenen tanımlayıcılar [4]

Üst veri türleri

Ulusal Bilgi Standartları Enstitüsü (NISO) üst veriyi dört temel sınıfa ayırmıştır [5]. Buna göre ilk tür tanımlayıcı üst veridir. Tanımlayıcı üst veride bir kaynağı bulmak veya anlamak hedeflenir. Yönetimsel üst veri sınıfında ise teknik, koruma ve haklar üst verisi olmak üzere üç alt kategori bulunmaktadır. Teknik üst veri dosyaların kodunu çözmek ve oluşturmak için; koruma üst verisi verilerin uzun süreli yönetimini sağlamak için; haklar üst verisi ise içeriğe iliştirilmiş entelektüel mülkiyet haklarına ait bilgilerin sağlanması için kullanılmaktadır. Verilerin veya kaynakların diğer kaynaklarla ilişkisini sağlamak için kullanılan üst veri türü yapısal üst veri olarak adlandırılmaktadır. Son olarak işaretleme dili (markup language) olarak adlandırılan son sınıfta ise içeriğin yapısal veya anlamsal özellikleri kullanılarak işaretler ve üst verilerin bütünleştirilmesi hedeflenmektedir. Her bir tür ile ilgili örnekler Tablo 1’de sunulmaktadır.

Tablo 1. Üst veri türleri ve özellikleri [5]

Tablo 1. Üst veri türleri ve özellikleri [5]

Üst veri standartları

Üst verilerin belirli bir düzende toplanması ve sunulması için çeşitli standartlar geliştirilmiştir. En çok bilinen ve en sık kullanılan üst veri standartları Dublin Core Metadata Initiative (DC) ve Data Documentation Intiative (DDI) olsa da pek çok disipline özel geliştirilmiş üst veri standartları da vardır. Amaca en uygun üst veri standardına karar vermek için http://rd-alliance.github.io/metadata-directory/standards/ adresinde yer alan liste kullanılabilir. Aşağıda her bir konu alanı için kullanılabilecek üst veri standartları listelenmektedir [6].

Üst verilerin oluşturulması

Günümüzde Zenodo ve Aperta gibi sistemler veriye ait üst veri bilgisini verinin sisteme girilmesi sürecinde tamamlanan formlar aracılığı ile otomatik olarak oluşturmakta ve sisteme tanımlanan üst veri standartlarına dönüştürme yapabilmektedir. Bu bölümde Aperta TÜBİTAK Kurumsal Arşivi’ne veri yükleme aşamasında veri ile ilgili tanımlayıcı alanlar tanıtılmaktadır. Aşağıdaki videoda Aperta'ya veri yükleme işlemi gösterilmektedir. 

  

 

Verinin yüklenmesinin ardından veriye ilişkin tüm üst veri bilgilerinin sisteme önceden tanımlanmış farklı standartlarla (BibTeX, CSL, DataCite, Dublin Core, JSON, Mark XML ve Mendeley gibi) dışa aktarılması mümkündür. 

Kaynakça

[1] Hines, K.C. (2013). Metadata management and tools August 1, 2013 data curation course. Erişim adresi: https://slideplayer.com/slide/8266173/

[2] Johns Hopkins Libraries Data Management Services. Metadata for effective research data management. Erişim adresi: http://dms.data.jhu.edu/data-management-resources/manage-and-analyze/documentation-and-metadata/metadata-for-effective-research-data-management/

[3] Cornell University Research Data Management Service Group. Metadata and describing data. Erişim adresi: https://data.research.cornell.edu/content/writing-metadata

[4] The University of Western Australia. (2018). Research data management toolkit: Metadata standards. Erişim adresi: https://guides.library.uwa.edu.au/RDMtoolkit/documentation

[5] Riley, J. (2017). Understanding metadata: What is metadata, and what is it for? A Primer Publication of National Information Standards Organization. Erişim adresi: https://groups.niso.org/apps/group_public/download.php/17443/understanding-metadata

[6] Chen, S., Alderete, K.A. & Ball, A. RDA Metadata Directory. Erişim adresi: http://rd-alliance.github.io/metadata-directory/standards/


En son değiştirme: 21 October 2021, Thursday, 15:48