* Bu bölüm FutureTDM projesinde tavsiye edilen politika çerçevesinin çevirisidir [1].

Engellerin genel özeti

  • Veri setleri 
    • Verinin heterojenliği
    • Düşük kaliteli veriler, ek açıklamalar ve üst veriler
  • Araçlar ve altyapı
    • Kullanıcı dostu olmayan arayüzler
    • Mimari uyumsuzluklar
  • Diller
    • Dil kaynaklarının bulunamaması
    • Dil kaynaklarının kullanılabilirliğinin kısıtlı olması
  • Dokümantasyon
    • Belirsiz dokümantasyon
    • Sürümler arasındaki uyumsuzluk
    • Belge eksikliği

Farkındalık ve açıklık ilkeleri

İlke 1: Diğer geliştiriciler için metin ve veri madenciliği araçları, teknolojileri ve veri kümeleri için net belgeler ve kullanıcı kılavuzları sağlayın.

  • Geliştiriciler
    • Başkalarının kullanımına yardımcı olmak için net ve iyi yazılmış spesifikasyonlar hazırlayın.
    • Belgeleri güncel ve bulması kolay tek bir erişim noktasından erişilebilir durumda tutun.
  • Veri kümelerinin yaratıcıları ve üst veri küratörleri 
    • İçerik sahiplerinin tutarlı üst veriler kullanmasına yardımcı olmak için ek açıklamaların ve diğer üst veri şemalarının kullanımına yönelik açık/güncel spesifikasyonlar ile rehberlik sağlayın. 

İlke 2: Tutarlı ve eksiksiz veri setleri hazırlayın.

  • Veri tabanı üreticileri
    • Mümkün olduğunca temiz veri kümeleri sağlayın. Yani metin ve veri madenciliği faaliyetleri için gerekli işleme ve normalleştirme miktarını en aza indiren veri kümeleri yaratın.
  • Geliştiriciler, araştırma kurumları, kütüphaneler veya onları temsil eden kuruluşlar
    • Birlikte çalışabilir ve yeniden kullanılabilir veriler oluşturmaya yardımcı olmak için veri kümelerine açıklama eklemek, değiştirmek ve normalleştirmek üzere uygun platformlar geliştirin. 
    • Ek açıklamalar için kesin ve net yönergeler hazırlayın.
  • Geliştiriciler ve araştırmacılar
    • Veri kümelerinin içeriklerini ve bağlamını doğru bir şekilde tanımlamayı ve anlamayı kolaylaştırmak için üst verileri yeniden kullanıma ve düzeltmeye açık olarak paylaşın.

İlke 3: Meslekten olmayanlar veya sınırlı hesaplama becerisine sahip olanlar tarafından metin ve veri madenciliği kullanımına giriş engellerini en aza indirin. 

  • Geliştiriciler
    • Kullanıcı dostu metin ve veri madenciliği araçları, iş akışları ve altyapıları oluşturun. 
  • Araştırma altyapıları
    • Çeşitli kaynaklardan veri kümelerini birbirine bağlamak için birlikte çalışabilirlik standartlarını benimseyin ve bunlara açık, kullanıcı dostu API'ler aracılığıyla erişim sağlayın. 

Sınır tanımayan metin ve veri madenciliği

İlke 1: Standartların kullanımında tutarlılığı teşvik edin

  • Veri depoları, kayıtlar ve endüstri
    • Birlikte çalışabilirliği geliştirmek ve çeşitli kaynaklardan gelen verileri bağlamayı ve kullanmayı kolaylaştırmak için bir sistemin farklı bileşenleri tarafından kullanılan veri biçimlerini, iletişim protokollerini ve ara katman yazılımlarını standart hale getirin. 
İlke 2:  Açık standartlar kullanın.

  • İçerik oluşturucular ve sağlayıcılar
    • Veri kümelerini kullanmak isteyen herkesin ilgili standartlara erişimini sağlamak için özel standartlar yerine açık standartlarda veri kümeleri sağlayın. 
  • Fon sağlayıcılar
    • Verilerin mümkün olduğunca erişilebilir olmasını sağlamak için araçlar ve veri kümesi biçimlendirmesini sağlamak üzere kamu tarafından finanse edilen araştırmalarda açık standartları kullanmayı zorunlu kılın. 

İlke 3: Metin ve veri madenciliğini tüm diller için güçlü hale getirin. 

  • Geliştiriciler
    • Mümkün olduğu kadar çok sayıda kullanıcının bu araçlara erişimini sağlamak için mevcut araçları daha fazla Avrupa dilini destekleyecek şekilde ayarlayın ve uygulayın.
  • Hükümetler
    • Geliştiriciler tarafından yapılan bu çabaları ödüllendiren finansman, yarışmalar veya diğer araçlarla daha fazla Avrupa dili için dil desteği teşvik edin.

İlke 4: Standartların çok çeşitli metin ve veri madenciliği araçlarını ve uygulamalarını yansıtmasını sağlayın. 

  • Geliştiriciler
    • Standartları geliştirmek için birlikte çalışırken, standartların metin ve veri madenciliği ortamının genişliğine gerçekten uygulanabilir olmasını sağlamak için kullanıcı ve uygulama çeşitliliğini dikkate alın. 
İlke 5: Tüm bilim dalları için ortak bir altyapı oluşturun. 

  • Avrupa hükümeti
    • Araştırmacıların yanı sıra diğerlerinin de metin ve veri madenciliği amaçları için araştırma çıktılarını ve verilerini paylaşabileceği, depolayabileceği ve erişebileceği ortak bir altyapıyı finanse edin, etkinleştirin, teşvik edin veya başlatın. Mevcut girişimlerin başarılı olduğundan emin olun. 
Adil erişim

İlke 1: Açık kaynak lisansları altında kullanılabilir hale getirerek metin ve veri madenciliği araçlarına erişimi artırın.

  • Fon sağlayıcılar
    • Topluma sundukları değeri en üst düzeye çıkarmak için, kamu tarafından finanse edilen araştırmalar yoluyla geliştirilen metin ve veri madenciliği araçlarının ve teknolojilerinin açık kaynak lisansı altında sunulmasını zorunlu kılın. 

Kaynakça

[1] FutureTDM. (2016). Technical and infrastructure. Erişim adresi: https://www.futuretdm.eu/policy-framework/#1489141531878-091d7439-bc8d


En son değiştirme: Pazar, 23 Ekim 2022, 1:54 AM