Spis treści | |
2 Otwarte dane i ich wymiana Dane surowe, obok publikacji relacjonujących wyniki badań, są kluczowym rezultatem procesu badawczego. Znaczenie dostępności danych wzrosło w ostatnich latach, wraz z gwałtownym wzrostem liczby zbieranych danych oraz z zaistnieniem możliwości ich efektywnego udostępnienia z pomocą technologii bazodanowych. Ponadto niektóre dyscypliny naukowe – takie jak bioinformatyka – w całości opierają się na wykorzystaniu danych badawczych. Zdaniem dra Rufusa Pollocka, założyciela Open Knowledge Foundation, organizacji promującej dostęp do informacji i danych - „dostępność danych to papierek lakmusowy, test na prawdziwą otwartość projektu badawczego" [16].
Dostępność danych badawczych zapewnia pełną przejrzystość procesu naukowego. Jednocześnie uprzednio zebrane dane stanowią podwaliny dalszej pracy naukowej – skuteczne prowadzenie badań coraz częściej wymaga łatwego dostępu i możliwości wykorzystania istniejących danych. Przykładem znaczenia dostępności danych jest układ okresowy pierwiastków, opracowany przez Dmitrija Mendelejewa na podstawie już opublikowanych, i powszechnie dostępnych, wyników wcześniejszych badań.
W niektórych dyscyplinach istnieje tradycja udostępniania i wymiany danych. W astronomii, fizyce czy naukach o ziemi funkcjonują instytucje zbierające i udostępniające, dzisiaj w skali globalnej dane stanowiące wyniki badań. Już w latach 1957–1958, podczas Międzynarodowego Roku Geofizycznego, założono kilka światowych centrów danych oraz ustalono standardy metadanych stosowanych dla opisu zbieranych wyników. Dwa podobne centra danych działają w astronomii: NASA/IPAC Extragalactic Database (NED) oraz Centre de Données Astronomiques de Strasbourg (CDS). Oba zapewniają dostęp do danych publikowanych w czasopismach i zbieranych w ramach przeglądów astronomicznych, łącznie z możliwością wyszukiwania informacji o określonych obiektach astronomicznych.
Ponadto wiele ośrodków prowadzi wyspecjalizowane bazy danych oraz istnieją czasopisma, które w wersjach elektronicznych publikują dane badawcze jako uzupełnienie publikacji. Astronomia jest dyscypliną o długiej tradycji publicznego udostępniania danych czy informacji – normą jest nie tylko publikowanie preprintów w archiwum ArXiv, ale także prowadzenie wspólnych pomiarów kosmosu z radioteleskopów rozrzuconych po świecie ale tworzących sieć. Wszystkie publikacje z dziedziny astronomii, astrofizyki i pokrewnych dyscyplin są od lat 80. XX wieku katalogowane przez Smithsonian NASA Astrophysics Data System (ADS). Baza danych ADS zawiera ponad 7 milionów obiektów, w tym opisy nie tylko publikacji z czasopism naukowych, ale także prezentacji konferencyjnych, tekstów umieszczanych na serwerach preprintów czy instytucjonalnych raportów technicznych – jeżeli zostały one publicznie udostępnione.
Dobrym przykładem jest też Human Genome Project , międzynarodowy otwarty projekt badawczy w dużej mierze finansowany ze środków publicznych, w ramach którego stworzono mapę ludzkiego genomu. Jest to jeden z pierwszych tego typu globalnych projektów, który wniósł bardzo wymierne rezultaty do praktyki medycznej, a w którym wzięło udział setki badaczy z całego świata. |