„De câți oameni am nevoie ca sondajul meu să fie credibil?” este probabil cea mai frecventă întrebare în cercetarea prin sondaj. Răspunsul surprinde adesea: pentru o populație mare, câteva sute până la o mie de respondenți bine aleși sunt suficienți. Ceea ce contează nu este atât mărimea brută, cât precizia dorită și calitatea selecției.
De ce nu chestionezi pe toată lumea
Un sondaj există tocmai pentru că este imposibil sau prea costisitor să întrebi întreaga populație. Ideea de bază este că un eșantion bine ales poate estima destul de precis ce gândește un grup mult mai mare. Cheia este expresia „bine ales”: un eșantion mic și reprezentativ bate un eșantion uriaș, dar înclinat. Înainte de a stabili un număr, merită citit ghidul despre metodologie, care explică pe larg eșantionarea și reprezentativitatea.
Cei trei factori care decid numărul
Marja de eroare
Cât de aproape de valoarea reală vrei să fii. O marjă de ±3% înseamnă că un rezultat de 50% acoperă, foarte probabil, intervalul real 47%–53%. Cu cât vrei o marjă mai mică, cu atât ai nevoie de mai mulți respondenți.
Nivelul de încredere
Cât de des, la repetarea sondajului, valoarea reală ar cădea în acel interval. Standardul este 95%. Un nivel mai înalt, de 99%, cere un eșantion mai mare.
Mărimea populației
Contează surprinzător de puțin când populația este mare. Diferența dintre o populație de 100.000 și una de 10 milioane este aproape neglijabilă pentru mărimea necesară a eșantionului.
Intuiția din spatele formulei
Nu ai nevoie de derivări complicate pentru a înțelege logica. Precizia unui sondaj crește cu rădăcina pătrată a numărului de respondenți, nu liniar. Concret: ca să înjumătățești marja de eroare, nu dublezi eșantionul — îl împătrești. De aceea, drumul de la 100 la 400 de respondenți aduce un câștig mare de precizie, dar drumul de la 2.000 la 4.000 aduce un câștig mult mai mic pentru un cost dublu. Există un punct de la care fiecare respondent în plus contribuie tot mai puțin.
Exemple numerice
Pentru o populație mare, la 95% nivel de încredere și pentru proporția cea mai prudentă (50/50, care cere cel mai mare eșantion), mărimile orientative sunt:
| Marja de eroare (±) | Respondenți necesari | Tip de utilizare |
|---|---|---|
| ±10% | ≈ 96 | Explorare rapidă, orientativă |
| ±5% | ≈ 385 | Pragul uzual al unui sondaj credibil |
| ±4% | ≈ 600 | Precizie bună, analiză pe subgrupuri |
| ±3% | ≈ 1.067 | Standardul sondajelor de opinie |
| ±2% | ≈ 2.401 | Diferențe mici de măsurat |
Observă că trecerea de la ±5% la ±3% aproape triplează numărul necesar, iar de la ±3% la ±2% îl mai dublează. Aceasta este aceeași logică a rădăcinii pătrate, văzută în cifre.
Populație finită vs populație mare
Tabelul de mai sus presupune o populație foarte mare. Când populația este mică, intervine corecția pentru populații finite, care reduce eșantionul necesar — la limită, nu are sens să chestionezi 385 din 400 de oameni, fiindcă te apropii de a-i întreba pe toți. Câteva exemple pentru ±5% la 95% încredere:
| Mărimea populației | Respondenți necesari (±5%) |
|---|---|
| 100 | ≈ 80 |
| 500 | ≈ 218 |
| 1.000 | ≈ 278 |
| 10.000 | ≈ 370 |
| 100.000 sau mai mult | ≈ 385 |
Pe măsură ce populația crește, numărul necesar se stabilizează în jurul valorii pentru o populație infinită. Acesta este motivul pentru care un sondaj național serios funcționează adesea cu aproximativ 1.000 de respondenți: este suficient pentru o marjă în jur de ±3%, indiferent de mărimea exactă a țării.
Numărul nu e singura grijă
Mărimea eșantionului controlează marja de eroare aleatorie, dar nu și biasul. Un eșantion de 5.000 colectat doar de la o singură categorie de oameni va avea o marjă de eroare mică și calculată — și totuși va fi greșit, fiindcă nu este reprezentativ. La fel, o rată de răspuns mică poate introduce bias de non-răspuns, oricât de mulți ai contacta. De aceea numărul țintă trebuie planificat împreună cu metoda de selecție și cu strategia de colectare; pentru partea aplicată, este util ghidul despre sondaje online.
Pe scurt: stabilește întâi marja de eroare acceptabilă și nivelul de încredere, verifică dacă populația este mică sau mare, apoi citește numărul din tabel — și asigură-te că modul de selecție produce un eșantion reprezentativ. Termenii folosiți aici sunt definiți în glosar.
Întrebări frecvente
Câți respondenți sunt suficienți pentru un sondaj credibil?
Pentru o populație mare, aproximativ 385 dau o marjă de ±5%, iar circa 1.067 dau ±3%, la 95% încredere. Sub aceste praguri, rezultatele devin doar orientative.
Contează mărimea populației?
Foarte puțin când populația este mare. Diferența dintre 100.000 și 10 milioane este aproape neglijabilă. Contează vizibil doar pentru populații mici, prin corecția pentru populații finite.
De ce un sondaj național are doar 1.000 de oameni?
Pentru că aproximativ 1.000 de respondenți reprezentativi dau o marjă în jur de ±3% la 95% încredere, suficientă pentru estimări de încredere, indiferent de mărimea țării.
Dacă dublez eșantionul, înjumătățesc marja?
Nu. Marja scade cu rădăcina pătrată a numărului de respondenți, deci pentru a o înjumătăți trebuie să împătrești eșantionul.
Un eșantion mare compensează un eșantion neechilibrat?
Nu. Mărimea reduce doar eroarea aleatorie, nu biasul. Un eșantion mare, dar nereprezentativ, dă rezultate greșite cu o falsă precizie.
Cum aleg marja de eroare țintă?
Pornește de la cât de mici sunt diferențele pe care vrei să le detectezi. Dacă te interesează diferențe de câteva puncte procentuale, ai nevoie de o marjă mică (±2–3%) și deci de un eșantion mai mare.
