Nauka se ne zasniva i ne može se samo zasnivati na posmatranju i deskripciji. Da bismo došli do nekog zaključka, on mora imati neke mjerljive parametre. Nauka su brojevi, nauka je statistika. Kako naučnici znaju da su otkrili nešto? Tu nam je važna p-vrijednost, mada i za nju ima kritika.

Bitno je da se upoznamo sa činjenicom da naučnici koriste statističku vrijednost, mjerljivu vrijednost (broj) da bi utvrdili da su neki fenomeni povezani i imaju utjecaja jedan na drugi. Ideja p-vrijednosti zapravo je pokazatelj statističke signifikantnosti dokaza. Nije dovoljno da postoji dokaz, nego on mora imati statističku signifikantnost.

Dakle, mora postojati neki statistički pokazatelj da je ono što je neki eksepriment pokazao neobično, da je to novo znanje. Međutim, kakvi su to brojevi?

p-vrijednost

 Suštinski, nauka koristi p-vrijednosti kako bi opisala da je neki rezultat “ekstremniji” od onoga što se obično izmjeri. Da bi se izmjerila p-vrijednost, moraju se stavoriti dvije hipoteze – nulta i radna hipoteza. Recimo, “A i B ne stoje u korelaciji” bi bila nulta hipoteza, nešto što bismo mogli očekivati, dok bi “A i B su u korelaciji” bila istraživačka hipoteza, odnosno, nešto neobično (u prevodu, vrijedno pisanja naučnog rada). To je centralni zadatak moderne naučne prakse, mada danas ima sve više mišljenja kako se p-vrijednost pogrešno interpretira.

Uzima se da je prag p-vrijednosti p≤ 0.05  i svaka velika p-vrijednost veća od ovog praga znači da ima malo argumenata protiv nulte hipoteze. Nasuprot toga, p vrijednost < 0.05 govori protiv nulte hipoteze, a u korist radne hipoteze (tj. govori da je otkriće ima statistički signifikantne vrijednosti i da je u pitanju neko novo “zrnce znanja”). Ovaj prag, pa čak i sama p-vrijednost su na udaru kritike u posljednje vrijeme, pa se predlaže ili povećanje praga ili primjena drugih metoda određivanja probabilnosti nulte hipoteze.

Danas se izračunava uglavnom preko softvera, preko određenih testova i tablica kritičnih vrijednosti za te testove. Recimo, neki od statističkih testova su t-test, hi-kvadrat test, z test za normalnu distribuciju.

 

Sigma vrijednost

Kada govorimo o p-vrijednosti, nemoguće je zaobići standardnu devijaciju, odnosno, sigma vrijednost. To je mjera kojom se kvantificira disperzija seta podataka, odnosno, količina varijacije. Kako bismo iole shvatili šta je to, treba nam grafik normalne distribucije:

 

 

 

A, ne to, ovo:

 
 

Ako ste ikada radili mjerenje IQ online, dobili biste rezultate u otprilike obliku ovakvog grafikona. Većina vrijednosti za neku mjerenu pojavu bi potpadalo od -1σ do 1σ i to je približno 68% (na grafikonu 68.2%). Što pojava više odstupa od “normalnog”, to se distribucija podataka nalazi više lijevo ili više desno, a manje je zastupljena. Pravilo normalne distribucije je 68-95 (95.4)-99.7. Kada biste sabrali postotke od -2σ do 2σ , dobili biste 95.4, a kada biste sabrali ovo od -3σ do 3σ, dobili biste 99.6. Od tačke koja pokazuje 0.1% na lijevoj do tačke koja pokazuje 0.1% na desnoj strani, to je 99.8%

Sigma vrijednost 3 bi značila da 99.6% posmatranog fenomena leži u okviru normalne distribucije (1σ znači da je u pitanju 68.2%, a 2σ znači da je u pitanju 95.45%). Sigma vrijednost od 4 ili 5 bi značila vjerovatnoću veću od 99.73%

U većini polja nauke, sigma od 3 znači da je nešto vrijedno objavljivanja rada, ali u fizici visokih energija to, primjerice, nije dovoljno.

Otkriće Higgsovog bozona je bilo u nivou standardne devijacije 5 sigmi, tj. 99.9% nečega što baš i nije vjerovatnost, niti govori o tome da Higgsov bozon postoji ili ne, već govori to da, ako Higgsov bozon ne postojii, podaci koje je CERN dobio bili bi vrlo neobični. Tj. ti podaci bi bili neobični ako to nije u pitanju pretpostavljena čestica i jedino se mogu objasniti detekcijom te čestice. Dakle, u svijetu fizike elementarnih čestica 99.73% (3 sigma) je rubna veličina i traži dalja istraživanja – potvrdu ili odbacivanje.