Araştırmaları gerçekleştirme süreçlerinde tekrarlanabilirliğin sağlanması
2017 yılında tekrarlanabilir bilim için yayınlanan manifestoda [1] bilimsel araştırmaların sürdürülebilirliğini sağlamak için araştırmaların gerçekleştirilmesi süreçlerinde araştırma tasarımı, yöntemlerin seçimi ve uygulanması, istatistik testler ve işbirliği konusunda bazı gerekliliklerin altı çizilmiştir. Buna göre dikkat edilmesi gereken temel unsurlar şunlardır:
Bilişsel önyargılara karşı koruma: Bilişsel önyargılardan kaçınmanın zorluğu ile ilgili önemli bir literatür vardır. Kendi kendini aldatmayı ve istenmeyen önyargıları azaltmayı sağlamak için etkili olabilecek bir yöntem körleme (blinding) sistemidir. Bazı araştırma bağlamlarında, katılımcılar ve veri toplayıcılar katılımcıların atandığı deneysel koşula ve araştırma hipotezlerine karşı kör olabilirlerken, veri analisti de verilerin önemli bir kısmına karşı kör hale getirilebilir. Örneğin, veri hazırlama ve temizleme sırasında, çıktının araştırma hipotezi açısından yorumlanmasını engellenmek için deneysel koşulların kimliği veya değişken etiketleri maskelenebilir. Örneğin fizik alanında bu yaklaşım, analistin sonuçları görmeden veri hazırlamaya devam etmesine (örneğin aykırı değerlerin tanımlanması) izin vermek için verilerdeki kasıtlı bozulmasını veya verilerin maskelenmesini içerecek şekilde genişletilmiştir [2]. Çalışma tasarımının ön kaydı (pre-registration), birincil sonuç(lar) ve analiz planı, körlemenin oldukça etkili bir şeklidir. Çünkü veriler mevcut değildir ve sonuçlar henüz bilinmemektedir.
Metodolojik eğitimin iyileştirilmesi: Araştırma tasarımı ve istatistiksel analiz karşılıklı olarak birbirine bağımlıdır. p değerinin yorumlanması [3], boş hipotez anlamlılık testinin sınırlamaları [4], istatistiksel gücün anlamı ve önemi [5], rapor edilen etki büyüklüklerinin doğruluğu [6] ve istatistiksel olarak anlamlı bir bulgu oluşturan bir örneklem büyüklüğünün gerçek bir bulguyu tekrarlamak için yeterli olma olasılığı [7] gibi yaygın yanlış anlaşılmalar vardır. Bu yaygın yanlış anlaşılmalar iyileştirilmiş istatistiksel eğitim yoluyla ele alınabilir.
Benzer şekilde, deneyci yanlılığını azaltmak için körleme, bozulmayı kontrol etmek için rastgeleleştirme veya dengeleme ve mümkün olduğunda gücü en üst düzeye çıkarmak için denek-içi tasarımların kullanılması gibi temel tasarım ilkeleri önemlidir. Ancak, kendini bilişsel önyargılara ve çarpıtılmış teşviklerin etkilerine karşı koruyabilecek araştırma uygulamalarında bütünleştirici eğitim kuşkusuz daha önemlidir. Ayrıca istatistiksel ve metodolojik en iyi uygulamalar sürekli revizyon ve iyileştirme altındadır, bu nedenle hem kıdemli, hem de genç araştırmacıların sürekli metodolojik eğitime ihtiyaçları vardır. Çünkü özellikle erken kariyer araştırmacılarının eğitimi gayri resmidir ve amirlerinden/danışmanlarından gelir. Metodolojideki ilerlemelerin benimsenmemesi kısmen sürekli bir mesleki eğitim ve gelişim etiği aşılamamanın sonucu olabilir.
Sürekli eğitim için resmi gereklilikler olmaksızın, en etkili çözümler; erişilebilir, sindirimi kolay ve araştırmaya hemen ve etkili bir şekilde uygulanabilir eğitim kaynakları geliştirmek olabilir. Modüler bir yaklaşım, bu malzemelerin yinelemeli güncelleme süreçlerini basitleştirir. Sunum yazılımı ve uygulamalı örnekler dersleri ve sonuçları özellikle herhangi bir kariyer aşamasındaki araştırmacılar için somut hale getirebilir.
Bağımsız metodolojik destek uygulama: Bazı alanlarda bağımsız metodolojik desteğe duyulan ihtiyaç iyi bilinmektedir. Örneğin, birçok klinik çalışmada tavsiye sağlamak ve araştırmanın tasarımını/yürütülmesini denetlemek için çok disiplinli araştırma yönlendirme komiteleri bulunmaktadır. Bu komitelere duyulan ihtiyaç, birçok klinik araştırmada var olan iyi anlaşılmış finansal çıkar çatışmalarından doğmuştur. Bir deneyin sponsoru, ürünü üreten şirket olabilir ve herhangi bir kasıtlı veya kasıtsız etki, bilimin ve sağlığın doğruluğu pahasına üreticinin nihai finansal yararı için araştırma tasarımını, sonuçların analizini ve yorumlanmasını bozabilir [8, 9]. Bireysel bilim insanlarının inançları, ön yargıları ve araştırmacıların kariyerlerini ilerletmek için yayınlanabilir sonuçlar elde etmeye yönelik çıkarları gibi finansal olmayan çıkar çatışmaları da söz konusudur [10, 11]. Araştırma sonuçlarının tasarımına, izlenmesine, analizine veya yorumlanmasına bağımsız araştırmacıların (özellikle bir araştırma konusuna kişisel yatırımı olmayan metodolojistlerin) dahil edilmesi, bu etkilerin bir kısmını azaltabilir veya bireysel araştırma projesi düzeyinde ya da bir araştırma projesi aracılığıyla, fonlayıcı kuruluş tarafndan kolaylaştırılan süreçlerle gerçekleştirilebilir.
İşbirliğini ve ekip bilimini teşvik etmek: İstatistiksel güç çalışmaları, hem zaman hem de incelenen farklı disiplinler genelinde sürekli olarak %50'nin altında (bazen çok altında) gerçekleşiyor [5, 12, 13]. Düşük istatistiksel güç, hem yanlış-pozitif, hem yanlış-negatif sonuçlar elde etme şansını artırıyor [5]. Yani, amaç bilgi biriktirmek olarak tanımlanıyorsa hiçbir avantaj sağlamaz. Buna rağmen düşük güçlü araştırmalar; işlevsiz teşvikler, düşük gücün sonuçlarının yetersiz anlaşılması ve gücü geliştirmek için kaynak eksikliği nedeniyle gerçekleştirilmeye devam ediyor. Ekip bilimi, ikinci soruna bir çözüm sunar. Tek araştırmacının sınırlı kaynaklarına güvenmek yerine, birçok çalışma sahasında dağıtılmış işbirliği, yüksek güçlü tasarımları kolaylaştırır ve örneklenen ortamlar ve popülasyonlar arasında genelleştirilebilirliği test etmek için daha fazla potansiyel sağlar. Bu aynı zamanda, bir araştırma projesine dahil edilecek çok sayıda teorik ve disipliner bakış açısı ile çeşitli araştırma kültürleri/deneyimleri için daha fazla kapsam sağlar.
Kaynakça
[1] Bu bölüm manifestodan doğrudan çevrilmiştir. Manifesto CC BY 4.0 Lisansı ile korunmaktadır.Munafò, M. R., Nosek, B. A., Bishop, D. V. M., Button, K. S., Chambers, C. D., Percie du Sert, N., Simonsohn, U., Wagenmakers, E.-J., Ware, J. J., & Ioannidis, J. P. A. (2017). A manifesto for reproducible science. Nature Human Behaviour, 1(1), Article 1. https://doi.org/10.1038/s41562-016-0021
[2] MacCoun, R. & Perlmutter, S. Blind analysis: hide results to seek the truth. Nature 526, 187–189 (2015). https://www.nature.com/articles/526187a
[3] Greenland, S. et al. Statistical tests, P values, confidence intervals, and power: a guide to misinterpretations. Eur. J. Epidemiol. 31, 337–350 (2016). https://doi.org/10.1007%2Fs10654-016-0149-3
[4] Sterne, J. A. & Davey Smith, G. Sifting the evidence—what's wrong with significance tests? BMJ 322, 226–231 (2001). https://doi.org/10.1136%2Fbmj.322.7280.226
[5] Button, K. S. et al. Power failure: why small sample size undermines the reliability of neuroscience. Nat. Rev. Neurosci. 14, 365–376 (2013). https://doi.org/10.1038%2Fnrn3475
[6] Brand, A., Bradley, M. T., Best, L. A. & Stoica, G. Accuracy of effect size estimates from published psychological research. Percept. Motor Skill. 106, 645–649 (2008). https://doi.org/10.2466%2Fpms.106.2.645-649
[7] Vankov, I., Bowers, J. & Munafò, M. R. On the persistence of low power in psychological science. Q. J. Exp. Psychol. 67, 1037–1040 (2014). https://doi.org/10.1080%2F17470218.2014.885986
[8] Etter, J. F., Burri, M. & Stapleton, J. The impact of pharmaceutical company funding on results of randomized trials of nicotine replacement therapy for smoking cessation: a meta-analysis. Addiction 102, 815–822 (2007). https://doi.org/10.1111%2Fj.1360-0443.2007.01822.x
[9] Etter, J. F. & Stapleton, J. Citations to trials of nicotine replacement therapy were biased toward positive results and high-impact-factor journals. J. Clin. Epidemiol. 62, 831–837 (2009). https://doi.org/10.1016%2Fj.jclinepi.2008.09.015
[10] Panagiotou, O. A. & Ioannidis, J. P. Primary study authors of significant studies are more likely to believe that a strong association exists in a heterogeneous meta-analysis compared with methodologists. J. Clin. Epidemiol. 65, 740–747 (2012). https://doi.org/10.1016%2Fj.jclinepi.2012.01.008
[11] Nosek, B. A., Spies, J. R. & Motyl, M. Scientific utopia: II. Restructuring incentives and practices to promote truth over publishability. Perspect. Psychol. Sci. 7, 615–631 (2012). https://doi.org/10.1177%2F1745691612459058
[12] Sedlmeier, P. & Gigerenzer, G. Do studies of statistical power have an effect on the power of studies? Psychol. Bull. 105, 309–316 (1989). https://doi.org/10.1037%2F0033-2909.105.2.309
[13] Cohen, J. The statistical power of abnormal-social psychological research: a review. J. Abnorm. Soc. Psychol. 65, 145–153 (1962). https://doi.org/10.1037%2Fh0045186