Post on 07-Aug-2018
8/21/2019 Suport Curs Informatica Juridica an IV Sem II 2014
1/78
INFORMATICĂ JURIDICĂ
Conf. univ. dr. Silvia LUCHIAN
SUPORT CURS
8/21/2019 Suport Curs Informatica Juridica an IV Sem II 2014
2/78
8/21/2019 Suport Curs Informatica Juridica an IV Sem II 2014
3/78
UNIVERSITATEA „ALEXANDRU IOAN CUZA” IAŞI
FACULTATEA DE DREPT
INFORMATICĂ JURIDICĂ
Conf. univ. dr. Silvia LUCHIAN
SUPORT DE CURS
Anul IV
Semestrul II
2014-2015
8/21/2019 Suport Curs Informatica Juridica an IV Sem II 2014
4/78
8/21/2019 Suport Curs Informatica Juridica an IV Sem II 2014
5/78
Cuprins
I. ROLUL STATISTICII ÎN CUNOAŞTERE........................................................................................................1
1. EVOLUŢIA TERMENULUI DE STATISTIC Ă.............................................................................................1 2. FENOMENE TIPICE VS FENOMENE COLECTIVE. ..................................................................................3 3. SEMNIFICAŢII ALE TERMENULUI DE STATISTIC Ǎ ..................................................................................5
II. ELEMENTELE DEFINITORII ALE UNUI STUDIU STATISTIC ................................................................ 8
1. POPULAŢIE.....................................................................................................................................8 2. C ARACTERISTICA STATISTIC Ă...........................................................................................................9 3. EŞ ANTIONUL ................................................................................................................................12 4. OBSERVAŢIILE ..............................................................................................................................14
Observaţ iile................................................................................................................................14 Prelucrarea statistic ǎ primar ă ...................................................................................................15 Serii statistice.............................................................................................................................18
1. Serii cronologice ...............................................................................................................................................18 2. Serii teritoriale...................................................................................................................................................18 3. Serii de distribuţie de frecvenţe pentru o variabilă atributiv ă ..........................................................................19
Reprezentarea grafic ǎ a distribuţ iei frecvenţ elor........................................................................20
III. TIPURI DE DIAGRAME ÎN MICROSOFT OFFICE EXCEL...................................................................23
1. DIAGRAMA COLOAN Ǎ ....................................................................................................................23 2. DIAGRAM Ă COLOAN Ă STRATIFICAT Ă ............................................................................................... 24 3. DIAGRAM Ă STRUCTUR Ǎ RADIAL Ă....................................................................................................26 4. DIAGRAM Ă LINIE ...........................................................................................................................27 5. DIAGRAMELE RADAR .....................................................................................................................31
6. DIAGRAMELE ZON Ă .......................................................................................................................31
IV. STATISTICA DESCRIPTIVĂ........................................................................................................................33
1. ANALIZA SERIILOR STATISTICE .......................................................................................................33
2. STATISTICI DESCRIPTIVE PENTRU UN ATRIBUT CANTITATIV ................................................................33
2.1. Indicatorii tendinţ ei centrale ................................................................................................ 33 2.2. Indicatorii variaţ iei ...............................................................................................................37 2.3. Indicatori de asimetrie si aplatizare(Skewness şi kurtosis)..................................................41
V. LEGǍTURILE DINTRE FENOMENELE COLECTIVE .............................................................................54
1. SERIILE INTERDEPENDENTE.................................................................................................. 56
1.1. Tipuri de leg ǎturi .................................................................................................................56 1.2. Metode elementare de verificare a existenţ ei leg ǎturilor .....................................................58
2. CORELAŢIA STATISTIC Ă .................................................................................................................59 3. DREAPTA DE REGRESIE. ................................................................................................................64
4. COEFICIENT DE DETERMINARE .......................................................................................................65
MODELE DE TESTE DE VERIFICARE A CUNOŞTINŢELOR………………………………………….69
BIBLIOGRAFIE .....................................................................................................................................................70
8/21/2019 Suport Curs Informatica Juridica an IV Sem II 2014
6/78
8/21/2019 Suport Curs Informatica Juridica an IV Sem II 2014
7/78
1
I. ROLUL STATISTICII ÎN CUNOAŞTERE
Chiar dacă v-a ţi dat sau nu seama, cu siguranţă c ă majoritatea dintre dumneavoastr ă a ţi
f ăcut o analiză “statistic ă “ la un moment dat. Situa ţia dumneavoastr ă bancar ă lunar ă, notele
dumneavoastr ă de la sfâr şitul unui semestru, factura de telefon sunt exemple de date ce pot fi
colectate, în cursul a diferite perioade de timp, formând seturi de date.
Deseori, în viaţa de zi cu zi, folosim sau auzim expresii cum ar fi: "statisticile arată
că ….", "o statistic ă simpl ă sugereaza c ă ….." etc.. De multe ori, oamenii asociaz ă
statistica cu o simplă "colec ţie" de date.
1. Evoluţia termenului de statistică
Faza descriptivă a statisticii echivala cu descrierea “statului” (de aici şi denumirea
de statistică). , expunerea situaţiei geografice, economice şi politice. Se cunosc lucr ări din
antichitate în care sunt informaţii privind resursele umane, materiale militare, comerciale, etc.
In evul mediu existau deja şcoli de statistică ( înc ă din sec. XIII - XIV în Republica Vene ţia
se elaborau diferite rapoarte care conţineau informaţii privitoare la partenerii săi comerciali şi
au fost utilizate în politica comercială oficial ă ) care elaborau tratate în care toate aceste
informaţii erau susţinute cu cifre. In această perioada statistica devine un puternic instrument
în conducerea statală. Acest gen de statistică a fost cultivat mai întâi de italieni. Curentul
"descrierea statului" a atins apogeul în sec. XVII- XVII când, în Germania, s-a constituit oadevărată şcoală cunoscut ă sub denumirea de şcoala descriptivă german ă. Descrierea statului
a devenit disciplină de predare acadamic ă, încadrată într-un sistem construit dup ă norme
teoretice şi practice, care s-au elaborat şi dezvoltat în universităţile germane. Noua disciplină
a primit numele de statistică (Statistik).
Faza aritmeticii politice s-a dezvoltat în Anglia secolului XVI. Reprezentan ţii
acestei şcoli au pus accentul mai ales pe cercetarea fenomenelor demografice, recurgând la
instrumentul matematic în căutarea legităţilor unor fenomene. Studiile demografice lăsau să
se întrevadă c ă previziunea fenomenelor colective putea avea o însemn ătate practică
deosebită (de altfel tabelele de mortalitate şi natalitate întocmite în secolul XVIII au constituit
punctul de plecare al societăţilor de asigurare).
Faza probabilistică – începând cu secolul XVII statistica descriptiv ă devine obiect al
instituţiilor publice iar domeniul conceptual al aritmeticii politice capătă o nou ă dimensiune
odată cu introducerea calculului probabilit ăţilor. Promotorii calculului probabilităţilor:
8/21/2019 Suport Curs Informatica Juridica an IV Sem II 2014
8/78
2
Jacob Bernoulli (1645-1705)- în lucrarea “Ars conjectandi” formulează “legea numerelor
mari”, defineşte probabilitatea apriori (deductivă), probabilitatea aposteriori (statistica
inductivă) şi a schiţat posibilitatea aplicării calculului probabilităţilor în economie.
Pierre-Simon Laplace (1749-1827)- în lucrarea “Theorie analytique des probabilites” a
evidenţiat avantajele calculului probabilităţilor în studiul fenomenelor dependente de cauze
complexe.
Karl Friderick Gauss (1775-1855) defineşte legea de repartiţie normală.
Simon Denis Poisson (1781-1840) – descoper ă legea de reparti ţie a evenimentelor rare şi
dezvoltă aplica ţii ale calculului probabilităţilor în demografie
Faza modernă a teoriei probabilit ăţ ilor este marcat ă de A.N. Kolmogorov (1903) care, prin
axiomatizarea noţiunii de probabilitate, a transformat teoria probabilităţii într-o ramur ă a
ştiinţei matematice, logic construită, asemenea geometriei, pe baza unor axiome. Kolmogorov
este reprezentantul şcolii ruse din care mai fac parte Lyapunov, Hincin, Smirnov, Gnedenko
şi alţii. Datorită unor teoreme demonstrate de Kolmogorov se face conexiunea mai strâns ă
între teoria probabilităţilor şi statistica experimentală punându-se bazele statisticii moderne.
Karl Pearson (1857-1936) şi Ronald Fisher (1890-1962) extind preocupările statisticii la trei
categorii de probleme, specificarea legii de repartiţie, estimarea parametrilor, repartiţia
estimatorilor şi introduc noţiunea de ipoteză statistic ă.
Etapa informaţională a statisticii se dezvolt ă dup ă apari ţia teoriei informaţiei
(Shannon- 1948), considerată drept ramur ă a matematicii înrudit ă cu calculul probabilit ăţilor,
care se ocupă cu problemele matematice ale ob ţinerii, transmiterii şi stocării informaţiei,
modelul lui Shannon fiind statistico-probabilistic.
Etapa sistemică a gândirii statistice este o explicitare a ceea ce s-a realizat de-a lungul
timpului într-o nouă terminologie impus ă de teoria general ă a sistemelor (L. von Bertalanffy)
şi de cibernetică (N. Wiener).
Pe terenul statisticii au apărut şi s-au dezvoltat numeroase discipline şi teorii noi (biometria,
econometria, sociometria, jurimetria, cercetarea operaţională, teoria deciziilor, etc.). Această explozie de noi teorii justifică afirma ţia lui M. G. Kendall; “Statistica în sensul cel mai larg
este baza oricărei ştiinţe experimentale, adică o disciplin ă metodologic ă care ar trebui s ă fie
familiar ă tuturor cercet ătorilor ca şi logica de altfel”. Statistica, ca principal furnizor de
informaţii, este indispensabilă în activitatea de conducere, fie ea a unor procese economice,
politice, sociale etc. fie în conducerea unor procese tehnologice (de producţie).
Dacă c ăutăm în Dicţionarul explicativ găsim următoarea definiţie pentru statistică:
8/21/2019 Suport Curs Informatica Juridica an IV Sem II 2014
9/78
3
Ştiinţă care culege, sintetizează, descrie şi interpretează date referitoare la
fenomene generale(fenomene colective)
2. Fenomene tipice vs fenomene colective.
Fenomenele naturale, pe care diferitele discipline caută s ă le studieze izolat sau în
raporturile dintre ele se împart , din punct de vedere al metodei de studiu în două grupe distincte:
fenomene tipice şi fenomene colective.
Înainte de apariţia ştiinţei, toate fenomenele păreau atipice , graniţa dintre fenomenele
considerate tipice şi cele considerate colective s-a modificat mereu prin identificarea,
observarea şi măsurarea a noi factori ce influenţează respectivele fenomene.
Fenomene tipice sunt caracteristice pentru anumite niveluri ale lumii anorganice care:
1. în condi ţ ii identice sau similare, se produc în aceea şi formă.; au număr restrîns şi precis
de cauze ;
2. experienţele f ăcute în domeniul castor fennomane bonduc , prion repaitre , la acelaşi
rezultat, deci au legi rigide de guvernare, explicate prin formule matematice; exemple: P
= U*I, S=V*t
3. pentru studiu se foloseşte experien ţ a de laborator unit ă cu modelarea matematică
Fenomene colective: (“generale”) sau de masă spre deosebire de cele tipice, sunt fenomene
complexe, atipice, rezultate din acţiunea combinată şi reperată a unui număr mare de
factori de influenţă.
Fenomenelecolective, prin definiţie, se caracterizează prin mai multe elemente specifice:
1. nu se pot reproduce identic aproape niciodat ă:
fenomene sociale , fenomene biologice, unele fenomene anorganice (meteorologie) ;
exemple: variaţia preţului petrolului, rate de schimb, variaţia incidenţei unei boli etc Astfel ,
pentru ca, din punct de vedere statistic, esenţa lor să fie pus ă în eviden ţă este nevoie de un
număr mare de cazuri individuale. De exemplu, pentru formarea preţului petrolului este
necesar un număr mare de producători şi consumatori;
a. cauze foarte numeroase şi foarte variate ;
b. caracterul esen ţ ial al variabilit ăţ ii efectului unei cauze asupra manifest ării
fenomenului, adic ă o aceea şi cauză ,adesea de minim ă importan ţă, poate avea
cînd un efect neglijabil , cînd un efect de preponderenţă capital ă ;acest fapt d ă
fenomenelor colective înf ăţişarea întîmplării ,a hazardului ;
2. fenomenele de masă prin defini ţie - se caracterizează prin variabilitate. Variabilitatea
este un concept cheie în statistică. Indivizii în aparenţă asem ănători prezintă, de fapt,
numeroase tr ăsături distinctive.Astfel de diferenţe, mai mult sau mai puţin
8/21/2019 Suport Curs Informatica Juridica an IV Sem II 2014
10/78
4
semnificative, pot fi înregistrate prin observa ţ ii sau măsur ători . Această particularitate
se observă din faptul c ă fenomenele de mas ă sunt rezultate ale ac ţiunii unui număr mare
de factori de influenţă cu esen ţialitate şi natur ă diferit ă, asociaţi cu sensuri, direcţii şi
intensităţi multiple. Acţiunile unor factori de influenţă se pot compensa reciproc
deoarece ei se manifestă în sensuri diferite;
- fenomenele de masă sunt fenomene deterministe, de tip stohastic, produse încondiţii de incertitudine;
- forma individuală de manifestare a fenomenelor de mas ă este diferit ă.
Legitatea de manifestare a acestor fenomene nu poate fi cunoscută şi verificată
în fiecare caz în parte ci numai la nivelul întregului ansamblu de cazuri
individuale.
- propriu statisticii este faptul că de şi acceptă variabilitatea ca pe un dat natural,
nu încetează nici o clip ă s ă studieze sistemul de cauze (legile de probabilitate)
care o generează,în scopul de a institui asupra lor un control cât mai strict. „În
viaţa reală nu exist ă constant ă ve şnică. Rezultate produse de un sistem
constant de cauze variază şi, de fapt, ele pot varia între limite largi sau înguste.
Ele variază, dar pun în evidenţă o caracteristic ă important ă numit ă stabilitate.
De ce aplicăm termenii de constan ţă şi stabilitate unui sistem de cauze ce
generează rezultate care variaz ă? Deoarece o aceeaşi propor ţie a acestor
rezultate ce variază continu ă s ă cad ă între dou ă limite bine stabilite, or ă de or ă,
zi de zi,atâta timp cât sistemul constant de cauze continuă s ă opereze. Deci, se
comportă ca un sistem controlat de cauze, iar rezultatele lui pun în eviden ţă
stabilitatea, se spune că acest proces este într-o stare de control statistic”.
3. conceptul de fenomen de masă presupune luarea în considerare a raportului dintre
necesitate şi întâmplare, dintre legea statistică (stohastică) şi legea dinamică, dintre modelul
stohastic şi modelul determinist.
Legea statistică (lege stochastica) nu poate fi cunoscută decât dac ă se ia în studiu un num ăr
mare de cazuri individuale care sunt legate între ele datorită ac ţiunii diferite a aceloraşi
factori de influenţă.
Legile statistice, spre deosebire de cele dinamice, se manifestă sub form ă de tendinţă şi sunt
valabile pentru un ansamblu de unităţi individuale.
În esenţă, rolul statisticii este de a determina, pe baza datelor empirice, informaţii cât mai
precise asupra legii statistice de repartiţie a formelor individuale ,ale fenomenelor de masă
care ne interesează.
8/21/2019 Suport Curs Informatica Juridica an IV Sem II 2014
11/78
5
Legităţile statistice, tendinţele obiective de dezvoltare a fenomenelor de masă necesită
depistarea tuturor cazurilor individuale, abstractizarea succesivă şi eliminarea a tot ce
este neesenţial şi întâmplător în producerea fenomenelor. Aceasta înseamnă c ă statistica
studiază fenomenele de mas ă din punct de vedere cantitativ şi le interpretează ca fenomene
probabile. Ele au un grad mare de variaţie de la o unitate la alta chiar dacă apar ţin aceleiaşi
esenţe. Prin urmare, în cercetarea statistică este necesar s ă se ţină seama în mod obiectiv de principiile teoriei probabilit ăţ ilor , de cerinţele legii numerelor mari (formulată de J.
Bernoulli în 1713). Această lege a statisticii arat ă c ă într-un număr suficient de mare de
cazuri individuale influen ţ ele factorilor se pot compensa în a şa fel încât să
ajung ă la o anumit ă valoare tipică pentru întreg ansamblul. O alt ă particularitate a
obiectului de studiu al statisticii este aceea că aceasta studiaz ă fenomenele de mas ă din punct
de vedere cantitativ în condiţii specifice de timp, spaţiu şi organizare.
Prin abordarea statistică a fenomenelor de mas ă se realizeaz ă trecerea de la dateleindividuale numeroase, amorfe, la un sistem de indicatori specifici unui ansamblu.
Prin urmare, obiectul statisticii îl reprezintă studiul cantitativ al fenomenelor de masă în
scopul cunoa şterii legit ăţ ilor lor de manifestare la nivelul întregului ansamblu. Pentru
atingerea acestui obiectiv statistica apelează atât la metodele generale de abordare, cât şi la
numeroase metode specifice, pe care ea însăşi le-a elaborat.
Definindu-se ca ştiinţa fenomenelor de masă, statistica privilegiază raţionamente de tip
inductiv. Ea utilizează detaliul individual doar pentru a propune caracteriz ări de ansamblu.
“Metodele statistice sunt inductive prin natura lor, deoarece generalizările rezultă dinobservaţii individuale. În plus, generalizările deduse dintr-o investigaţie statistică sunt
adevărate doar în medie. Ele pun în evidenţă numai comportamentul tipic al tuturor
obiectelor luate în studiu,dar nu descriu comportamentul elementelor luate separat, deoarece
există o stabilitate mai mare în colectivitate decât în individ” 1.
3. Semnificaţii ale termenului de statisticǎ
Obiectul activităţii de cercetare statistică presupune ac ţiuni de proiectare şiorganizare, de culegere, prelucrare, analiză şi interpretare a datelor statistice. În urma
acestor operaţii se obţin informaţiile necesare cunoaşterii fenomenelor colective ce se
manifestă în diferite forme de manifestare. Activitatea statistic ă este structurat ă nu numai în
1 B. N. Gupta în AnIntroduction to Modern Statistics, Brokland Private Ltd.,Calcutta,1962,p.10.
8/21/2019 Suport Curs Informatica Juridica an IV Sem II 2014
12/78
6
funcţie de etapele demersului statistic, ci şi în funcţie de diviziunea socială a muncii, de
dezvoltarea sistemului informatic, de alte criterii. Din această cauz ă statistica se întâlne şte ca
disciplină ştiinţifică şi ca domeniu de activitate: statistica teoretică, statistica matematică,
statistici de ramur ă (industrie, comer ţ, agricultur ă, transporturietc.), statistica economiei
naţionale, statistica financiar ă şi actuarială, statistica muncii , etc. În funcţie de obiectivul
urmărit, gradul de generalitate al concluziilor şi de mijloacele utilizate, cercetarea statistică presupune două faze:
• o fază descriptivă (exploratorie) = statistica descriptivă şi
• o fază inferenţială (decizională) = statistica inferenţială (statistica matematică)
ambele faze având scop subordonat cunoaşterii.
Scopul principal şi specific statisticii descriptive este acela de a sintetiza şi
structur a într-o manier ă cât mai direct ă şi mai intuitivă, datele de observaţie şi informaţia
conţinută în acestea. În acest sens utilizeaz ă, de regulă, tabele, grafice, indicatori numerici
etc. Atunci când observarea s-a f ăcut prin cercetare selectivă ( eşantionare) statisticii
descriptive îi revine rolul de a pune în evidenţă propriet ăţile eşantionului şi, pe această baz ă,
de a sugera diverse ipoteze cu privire la o posibilă extindere a concluziilor la nivelul întregii
populaţii. Statistica descriptivă nu- şi asumă, însă, şi rolul de a verifica „valoarea de adevăr” a
acestei ipoteze. Un asemenea studiu reclamă explicit apelul la modelele probabilistice şi, în
consecinţă, face obiectul fazei inferenţiale a cercetării statistice.
Dacă statistica descriptiv ă, din punctul de vedere menţionat anterior,mai este
denumită de unii autori „statistica f ăr ă modele aleatoare”, statisticii inferen ţ iale îi revine rolul
de a extinde rezultatele ob ţ inute pe baza datelor din e şantion la nivelul popula ţ iei generale şi
de a confirma sau invalida ipotezele emise a priori sau formulate după faza exploratorie.
Metodologia statisticii inferenţiale se bazează pe teoria probabilităţilor şi prezintă
caracteristici specifice cum ar fi:
• caracterul aleator al eşantionării;
• generalizarea concluziilor de la eşantion la populaţia statistică total ă prin
marje specifice de incertitudine;
•
recunoaşterea explicită a nesiguran ţei predicţiilor, deoarece incertitudineaimplicată este m ăsurată în mod obiectiv şi este supusă unui control statistic în
limite cât mai strânse cu putinţă
.Considerentele privitoare la raportul statistică descriptivă – statistică
inferenţială prezentat anterior, sunt eviden ţiate şi în figura 1.
8/21/2019 Suport Curs Informatica Juridica an IV Sem II 2014
13/78
7
Figura 1.Raportul descriptiv –inferen ţ ial în cercetarea statisticǎ
8/21/2019 Suport Curs Informatica Juridica an IV Sem II 2014
14/78
8
II. ELEMENTELE DEFINITORII ALE UNUI STUDIU STATISTIC
1. Populaţie
Populaţie sau colectivitate statisticǎ este o colec ţie de obiecte (entităţi elementare,
indivizi), posedând toate o anumit ă caracteristică comunǎ şi care sunt supuse unui studiustatistic( reprezintă totalitatea elementelor de aceea şi natur ă, care au tr ăsături esenţiale
comune )
Colectivitatea statistică (sau popula ţia statistică) este o noţiune fundamentală a statisticii şi
reprezintă principala form ă sub care se delimiteaz ă şi se definesc fenomenele
colective.Colectivitatea statistică este întâlnit ă şi sub denumirea de popula ţ ie statistică sau
pur şi simplu popula ţ ie.
Ea desemnează totalitatea elementelor de aceea şi natur ă care sunt supuse studiului statistic.
Aceasta înseamnă c ă o mul ţime de elemente formează o colectivitate statistic ă numai dac ă au
aceeaşi natur ă, sunt asemănătoare sau sunt omogene din punctul de vedere al anumitor
criterii. Populaţiile pot fi finite sau infinite; concrete sau abstracte
Colectivitatea statistică se prezint ă într-o varietate de forme. Din acest motiv, una din
problemele esenţiale ale unei cercetări statistice o reprezintă delimitarea colectivit ăţii
statistice în timp şi spaţiu, din punctul de vedere al conţinutului şi al formei de organizare.
În funcţie de natura unităţilor, colectivităţile statistice sunt alcătuite dintr-un ansamblu de:
• persoane (populaţia României la recensământul din 2011),
• obiecte (parcul de maşini din unităţile de turism din România la o anumită dat ă),
• evenimente (căsătoriile în cursul unei perioade; intr ările în contul unei societăţi
comerciale într-un trimestru etc.),
• idei sau opinii (opiniile consumatorilor despre calitatea unor tipuri de mobilă, maşini de
uz casnic etc.).
De exemplu, dacă dorim s ă studiem problema neparticip ării şcolare, atunci populaţia va
consta din totalitatea copiilor de vârstă şcolar ă din România. Dac ă îns ă obiectul studiului este
gradul de poluare a localitaţilor urbane, atunci populaţia va consta din toate oraşele
României. În statistică a şadar, când ne referim la populaţie avem în vedere mulţimea
unitaţilor de analiză, indiferent ce reprezintă acestea ( şcoli, oraşe,întreprinderi, ţări, oameni
sau chiar procese, fenomene şi acţiuni).
Aceste exemple pun în evidenţă faptul c ă în statistic ă colectivit ăţile statistice pot fi privite:
• static (când exprimă o stare, un nivel la un moment dat ) şi
• dinamic (când exprimă un proces sau o devenire în timp).
8/21/2019 Suport Curs Informatica Juridica an IV Sem II 2014
15/78
9
Unităţile colectivităţii statistice sunt purtătoare de informaţii sau sunt subiectele logice ale
informaţiei statistice deoarece asupra lor se efectuează nemijlocit observarea. Unităţile
colectivităţii statistice există la un moment dat. Unit ăţile colectivităţilor dinamice
desemnează evenimente, procese sau fluxuri şi se produc în decursul timpului, se refer ă la
perioada sau intervalul de timp în care se produc evenimente statistice.
Unităţile statistice sunt simple şi complexe. Unit ăţ ile simple reprezint ă elementele constitutive specifice naturii fenomenelor (de
exemplu, persoana fizică, angajatul, produsul etc.) şi care formează aceea şi
colectivitate.
Unit ăţ ile complexe sunt formate din mai multe unit ăţi simple, organizate în funcţie de
criterii social-economice (de exemplu, ţara,familie, echipa de lucru, grupe de studenţi,
unitatea economică etc.). „inteligenta” unui student, poate fi exprimat ă printr-un
ansamblu de variabile.
2. Caracteristica statistică
Caracteristica statistică sau atributul variabil: desemnează însu şirea, proprietatea,
tr ă sătura comună unit ăţilor unei colectivităţi statistice, reţinută în programul statistic pentru a
fi înregistrată şi care capătă accep ţiuni sau valori diferite de la o unitate la alta sau de la un
grup de unităţi la altul.
Exemple de caracteristici statistice pot fi: vârsta, greutatea, sexul, culoarea ochilor,numărulde infracţiuni , statutul matrimonial, naţionalitatea, ocupaţia, cifra de afaceri, nivelul
extrasului de cont etc.
Caracteristicile statistice se mai numesc variabile statistice sau variabile aleatoare ,
deoarece au proprietatea de a-şi modifica valoarea în timp şi spaţiu de la o unitate la alta.
Asadar, o caracteristica studiata (de exemplu gradul de corupţie ) ar putea fi reprezentată,
direct sau indirect, prin mai multe variabile statistice
Caracteristicile (variabilele) statistice pot fi clasificate în func ţie de diferite criterii
a) În funcţie de varia ţ ia manifestat ă de caracteristici acestea pot fi cu varia ţie continuă saucu variaţie discretă (discontinu ă).
Variabila discretă ia numai valori întregi (numărul persoanelor dintr-o familie,
numărul de cauze soluţionate de un judecător , numărul de piese rebut dintr-un lot;
numărul de turişti la o staţiune de turism montan etc.).
8/21/2019 Suport Curs Informatica Juridica an IV Sem II 2014
16/78
10
Variabila continuă poate lua orice valoare într-un interval finit sau infinit. ,adică ,
între două valori succesive ale variabilei pot exista o infinitate de valori
(greutatea,tonajul unui vas,cifra de afaceri).
Datele discrete sunt r ă spunsuri numerice care apar în urma unui proces de
numărare, în timp ce datele continue sunt r ă spunsuri numerice care apar în urma
unui proces de mă surare.
b) Nivelul de măsurare al variabilelor este un alt criteriu de clasificare a acestora,
. Putem distinge între patru niveluri de măsurare (nominal, ordinal, de interval şi de raport ),
în funcţie de trei criterii:
• posibilitatea de a ordona valorile variabilei,
• egalitatea intervalelor dintre valorile variabilei (sau altfel spus existenţa unei unităţi de
măsur ă),
• existenţa unei "origini" a variabilei sau, cu alte cuvinte, a unui "zero absolut".
1. Nivelul de măsurare nominal (de clasificare ) presupune clasificarea valorilor
posibile ale caracteristicii în categorii care trebuie să fie distincte, mutual exclusive
şi exhaustive.
Acest tip de variabile (respectiv scalele folosite în măsurare) indică numai faptul c ă
există o diferen ţă calitativ ă între categoriile studiate, nu şi magnitudinea acestei
diferenţe. La limită, putem privi aceste variabile ca pe ni şte tipologii. Câteva
exemple de variabile măsurate la nivel nominal sunt:
• statutul ocupaţional al indivizilor (agricultor, salariat, mic
întreprinzator, şomer etc.),
• religia (ortodox, romano-catolic, greco-catolic etc.)
• apartenenţa etnică (român, maghiar, rrom etc.),
• mediul de rezidenţă (rural, urban) ,
• tip de infracţiune economică,juridică,de altă natur ă ş.a.m.d.).
Valorile acestui tip de variabile nu pot fi ordonate, sau cu alte cuvinte nu există o
ierarhie (decât eventual conform unor criterii extrinseci) şi în consecinţă problema
"distanţei" sau a intervalelor dintre valori nici nu poate fi pusă. Numerele sunt atribuite observaţiilor pentru a face doar judecăţi despre identităţi sau
diferenţieri de categorie. Cu ajutorul scalei nominale numerele repartizate unor
observaţii servesc drept numele lor. Numerele sunt atribuite fiecărei categorii doar
pentru a identifica unităţi similare din interiorul unei categorii şi pentru a diferenţia
aceste unităţi similare de elementele unei alte categorii diferite.
Se face, astfel, o diferenţiere de specie, dar nu şi de grad.
8/21/2019 Suport Curs Informatica Juridica an IV Sem II 2014
17/78
11
2. Nivelul de masurare ordinal implică nu numai clasificarea elementelor în categorii ci
şi posibilitatea ordonării acestora de la minim la maxim (existen ţa tranzitivităţii:
dacă a>b şi b>c, atunci a>c). Totuşi, la acest nivel de măsurare nu este oferită nici o
informaţie cu privire la "distanţa" dintre valorile scalei de măsur ă. Cu alte cuvinte,
diferenţa dintre prima valoare şi cea de-a doua poate fi diferită de diferen ţa dintre a
patra şi a cincea.Exemple de variabile măsurate la nivel ordinal sunt calificativele şcolare (cu
valorile "insuficient", "suficient", "bine" şi "foarte bine"), satisfacţia faţă de anumite
aspecte ce apar în chestionare (cu valorile "foarte nesatisf ăcut", "nesatisf ăcut",
"satisf ăcut )
Unităţile pot fi înşiruite una relativ cu cealaltă şi se poate realiza astfel, o
ierarhizare, dar distanţa între numerele acordate nu este obligatoriu egală.
Numerele pe scala ordinală nu reprezint ă intervale egale pe scala de m ăsurare.
3. Măsurarea la nivel de interval, ofer ă în plus fa ţă de nivelul anterior (cel ordinal) şi
informaţie referitoare la distanţa dintre valorile scalei şi este caracterizată de
existenţa unor intervale egale. Totuşi, la acest nivel de măsurare nu există un zero
absolut, ci mai degrabă unul conven ţional. Exemple de astfel de scale de măsurare
sunt temperatura mǎsurată în grade Celsius (intervalele dintre valori sunt egale, dar
punctul 0 este convenţional ales ca fiind temperatura la care apa ingheaţă),
coeficientul de inteligenţă - IQ - (dac ǎ dou ă persoane au scoruri de 100 şi respectiv
150, putem spune ca diferenţa dintre cei doi este de 50 de puncte, dar nu putem
spune că cel de-al doilea este cu 1/2 mai inteligent decât primul sau c ă scorul 0
semnifică absen ţa inteligenţei).
Se face astfel posibilă nu numai interpretarea ordinii not ărilor pe scală, dar şi a
diferenţelor dintre ele.
4. Măsurarea la nivel de raport include toate caracteristicile nivelurilor anterioare
(ordonare şi intervale egale), plus existenţa unei "origini" sau zero absolut. Acest
lucru permite formularea unor afirmaţii în termeni de propor ţii (raporturi) între
valori. De exemplu, vitezele de raspuns a doi subiecţi la un acelaşi stimul pot fi
comparate în termeni de "timpul de r ăspuns a fost de două ori mai mare" etc..
Exemple de variabile masurate la acest nivel sunt vârsta, greutatea, înălţimea,
distanţa, numărul de copii )
Corecta identificare a nivelului de măsurare utilizat este foarte importantă în alegerea
procedurilor statistice de analiză. După cum se poate observa din descrierea de mai sus,
pentru fiecare nivel exista operaţii matematice permise şi operaţii interzise. Astfel, la primul
8/21/2019 Suport Curs Informatica Juridica an IV Sem II 2014
18/78
12
nivel, cel nominal nu sunt permise nici ordonarea, nici operaţii aritmetice (adunarea/scăderea
,înmulţirea/împăr ţirea.) La nivelul ordinal este permisă numai ordonarea, la cel de interval
sunt permise în plus şi operaţiile de adunare/scădere, iar la ultimul nivel, cel de raport sunt
permise toate operaţiile.
În funcţie de nivelul de măsurare, vom vorbi despre variabile măsurate la nivel nominal,
variabile măsurate la nivel ordinal etc., sau, mai pe scurt, variabile nominale,ordinale, de interval şi de raport.
c) în func ţ ie de modul de exprimare
variabile calitative (nivelurile nominal şi ordinal ) şi
variabile cantitative (interval şi raport ) Sunt caracteristici măsurabile..
d) în func ţ ie de numărul variantelor/valorilor de r ăspuns pe care le pot lua,
caracteristici alternative (binare sau dihotomice), acelea care pot lua doar
două variante de r ăspuns, după modelul adev ărat/fals din logică: sex (M/F),
stagiul militar (efectuat/neefectuat), starea civilă (c ăsătorit/necăsătorit);
caracteristici nealternative — cele care pot lua mai multe valori/variante de
r ăspuns: salariu, profesie, cifr ă de afaceri, localitate de domiciliu etc.
3. Eşantionul
Eşantionul este o submulţime a populaţiei analizate. Cu cât este mai numeroasă o colectivitate, cu atât devine mai dificil ă cercetarea tuturor
elementelor ei.. Soluţia poate să fie, atunci, s ă extragem o subcolectivitate din colectivitatea
generală (numit ă şi colectivitate par ţială, eşantion sau colectivitate de selec ţ ie).
Extragerea unui eşantion din populaţie este utilă şi chiar necesar ă în condi ţiile în care
resursele (financiare, de timp etc.) de care dispun iniţiatorii studiului nu sunt suficiente pentru
a asigura investigarea întregii populaţii.
E şantionul reprezint ă un subset de elemente selectate aleatoriu dintr-o colectivitate
statistică .
În felul acesta, se vor estima parametrii colectivităţii totale pe baza rezultatelor obţinute în
colectivitatea de selecţie, iar ceea ce a fost determinat ca fiind tipic, esen ţial şi caracteristic în
eşantion, se presupune că ar fi fost g ăsit dacă s-ar fi cercetat colectivitatea general ă.
Soliditatea acestei presupuneri depinde de modul cum a fost extras eşantionul, iar de
acurateţea acestui proces depinde succesul demersului statistic. Reprezentativitatea
8/21/2019 Suport Curs Informatica Juridica an IV Sem II 2014
19/78
13
eşantionului este, aşadar, aspectul crucial al oricărui proces de cercetare pe bază de sondaj
statistic.
Exemplu :Dacă s-ar dori s ă se studieze problema s ăr ăciei în România.
În absenţa unui eşantion, trebuie investigate peste 7 milioane de gospodării, ceea ce ar duce la
costuri financiare mari şi la o extindere a timpului rezervat culegerii de informa ţii. În acelaşitimp, un subset din populaţia analizată, extras conform unei scheme de eşantionare riguroase,
poate furniza toată informa ţia necesar ă la un nivel de acurate ţe foarte ridicat.
Ratiunea eşantionarii este limpede: prin efectuarea de studii asupra unei par ţi relativ „mici”
din populatie să strângem suficient ă informatie care sa ne permita sa inferam la nivelul
întregii populaţii asupra caracteristicilor studiate. Statistica ne permite prin tratamentul
datelor obţinute din grupuri „mici” de indivizi să extindem rezultatele la populatii „mari”.
Numarul indivizilor din esantionul ales este numit volumul eşantionului si este notat de
obicei, atunci când ne referim la un esantion potential (esantionul nu a fost
precizat) prin litera n.
Eşantionare subiectivă (exemple: selec ţia rocilor, pacienţi pentru tratamente diferite)
Un eşantion simplu aleator este a şadar selectat astfel încât:
— fiecare unitate statistică are o probabilitate egal ă de a fi aleas ă în e şantion şi
— unităţile sunt alese independent, f ăr ă leg ătur ă una cu cealalt ă.
Extragerea întâmplătoare a unităţilor şi alcătuirea eşantioanelor aleatoare se poate realiza prin
unul din următoarele procedee de selecţie:
1. metoda selecţiei aleatoare(etichetarea tuturor indivizilor)
Procedeul urnei cu bile (procedeul loteriei), este un procedeu de selecţie aleatoare care
poate fi realizat în varianta cu revenire sau f ăr ă revenire.
Se stabileşte un cadru de identificare, astfel încât fiecare unitate din colectivitatea generală
este numerotată de la 1 la N. Numerele sunt notate pe cartona şe, bileţele sau bile iar acestea
sunt amestecate atent. Se extrage apoi, la întâmplare, un cartonaş (bil ă) iar numărul citit
identifică unitatea ce este considerat ă ca f ăcând parte din eşantion. Pentru această unitate se
înregistrează toate caracteristicile ce fac parte din programul cercet ării.În continuare, în varianta cu revenire (sondaj repetat), cartonaşul (bila) este reintrodus în
urnă, se repetă amestecarea iar extragerea se repet ă pân ă când se ob ţine eşantionul de volum
n.
În varianta sondajului f ără revenire (sondaj nerepetat), cartonaşul (bila) nu este
reintrodusă în urn ă, ceea ce înseamnă c ă o unitate statistic ă, o dată extras ă în e şantion nu mai
are şanse să mai reintre în colectivitatea de origine şi să fie extras ă din nou.
8/21/2019 Suport Curs Informatica Juridica an IV Sem II 2014
20/78
14
2. selecţia sistematică (din k în k; periodicit ăţi?)
Procedeul mecanic de selecţie a eşantionului presupune prelevarea unităţilor din
colectivitatea generală dup ă un interval predeterminat, denumit frecvent pas de num ărare
aplicat bazei de sondaj.
Pasul de numărare se calculează ca N/n=k
Numărul iniţial de la care se începe citirea se alege aleator între 1 şi k, după care se cite şte tot
a k-a unitate până la completarea e şantionului de n unităţi statistice.
3. selecţia stratificată (propor ţiile straturilor)
Stratificarea constă în divizarea colectivit ăţii generale de studiat în„straturi“, clase tipice cât
mai omogene, cu caracteristici cât mai asemănătoare, astfel încât unităţile statistice din
interiorul fiecărui strat să prezinte, cel pu ţin din punct de vedere teoretic, caracteristici
comune specifice fiecărei clase. Straturile pot fi constituite din regiuni, judeţe, localităţi,
medii, sexe, subdiviziuni economice, grupe de vârstă etc. Cel mai frecvent, stratificarea se
foloseşte în studiul populaţiei care se separ ă folosind clasific ările
oficiale sau, în funcţie de scop, cercetătorul îşi va face propria sa grupare, ca
de exemplu, după profesie sau vechimea în produc ţie.
4. selecţia pe grupe: str ăzi, careuri de teren, circumscripţii
5. selecţia ierarhică: aleator judeţe .> comune > str ăzi > persoane.
4. Observaţiile
Observaţiile
Valorile înregistrate de aceeaşi caracteristică la unit ăţile colectivităţii statistice (populaţie sau
eşantion ) se numesc observaţii.
• Varianta/valoarea reprezintă nivelul concret pe care îl poate lua o variabil ă la
nivelul unei unităţi sau grup de unităţi statistice.
• Frecven ţ a de apari ţ ie a unei variante/valori reprezintă num ărul de apariţii al acesteivariante/valori în colectivitate.
• Datele statistice reprezintă caracterizarea numeric ă ob ţinută de statistic ă în leg ătur ă
cu unităţile, grupele sau colectivitatea studiată.Datele statistice sunt mărimi
concrete, rezultate din studiile efectuate prin numărare, măsurare sau calcul
statistic. Ele pot fi primare, prelucrate, publicate sau stocate în baze sau bănci de
date. Mesajul datelor statistice este informaţia statistică.
8/21/2019 Suport Curs Informatica Juridica an IV Sem II 2014
21/78
15
• Indicatorul statistic reprezintă expresia numeric ă a unor fenomene, procese,
activităţi sau categorii economice şi sociale, definite în timp, spaţiu şi structur ă
organizatorică.
Procesul cunoaşterii statistice presupune organizarea şi parcurgerea unor etape distincte şi
succesive care includ operaţiile de observare sau culegere a datelor, de sistematizare şi
prelucrare, de analiză şi interpretare a rezultatelor.
Etapele cercetării statistice sunt:
⎯ observarea statistică — etapă în care se culeg date şi informaţii statistice de la unităţile
colectivităţii, pentru toate caracteristicile urmărite;
⎯ prelucrarea statistică — etapă în care datele sunt sistematizate şi sunt calculaţi
indicatorii statistici primari şi derivaţi, absoluţi şi sintetici ce caracterizează fenomenul
studiat;
⎯ analiza şi interpretarea rezultatelor — etapă în care sunt verificate ipotezele, formulate
concluziile şi fundamentate procesele decizionale.
Prelucrarea statistic ǎ primar ă
După ce datele statistice au fost colectate din surse de date publicate, din observ ări totale sau din
observări par ţiale – ele trebuie organizate, în scopul de a avea o formă care s ă permit ă prelucrarea
lor statistică divers ă. Cel mai bun mod de a le examina este să le sistematiz ăm şi apoi să le
prezentăm în tabele şi grafice. Putem atunci, să extragem cele mai importante tr ăsături, prin
analiza seriilor şi graficelor statistice.
Principiile grupării/clasificării
Sistematizarea datelor se realizează prin gruparea şi clasificarea
datelor statistice, adică prin împ ăr ţirea lor în grupe/clase omogene, după unul sau mai multe
criterii de grupare/clasificare.
O grupă/clasă este omogenă dacă unit ăţile din interiorul ei tind să se asemene cât mai mult între
ele din punctul de vedere al criteriului utilizat, adică dac ă între unit ăţile din aceeaşi grupă/clasă
există varia ţii cât mai mici, date de prezenţa factorilor aleatori, întâmplători. Criteriul de
grupare/clasificare reprezintă variabila (caracteristica) statistic ă în func ţie de care sistematizăm
datele.
Dacă sistematizarea datelor se face dup ă o variabil ă nenumeric ă, procesul se numeşte
clasificare.
Gruparea reprezintă sistematizarea datelor dup ă o variabil ă (caracteristic ă) numerică. În
funcţie de tipul acesteia, gruparea se poate face după o variabil ă discret ă sau continu ă.
8/21/2019 Suport Curs Informatica Juridica an IV Sem II 2014
22/78
16
2.2. Prelucrarea primar ă cuprinde operaţii de clasificări, de grupări, de comparări, de
prezentare sub formă de tabele, grafice sau serii statistice.
Datorită caracterului "ierarhic" şi cumulativ al nivelurilor de măsurare (de la multe restricţii
către nici o restricţie în ceea ce priveşte operaţiile permise, sau de la "calitativ" la
"cantitativ"), vom putea întotdeauna trata o variabilă aflat ă la un nivel "superior" de m ăsurare
ca şi cum ar fi fost măsurată la un nivel "inferior". Atunci când avem de-a face cu un esantion„mare” (adică are un num ăr „mare"de indivizi), de obicei variabilele numerice sunt înlocuite
prin variabile calitative, ordinale (care reprezintă aceeasi caracteristica). Mai precis, datele
numerice sunt grupate într-un numar „mic” de clase. De exemplu, vârsta masurata în ani de
viaţă va putea oricând fi tratat ă ca o variabil ă ordinal ă, dacă îi grup ăm valorile (sub 20, 21-
30, 31-50, peste 50). Niciodată îns ă nu vom putea trata o variabil ă aflat ă la un nivel "inferior"
ca pe una aflată "mai sus" în ierarhie. (Câteodat ă, cercetătorii fac excepţie de la această
regulă, tratând variabilele ordinale ca şi cum ar fi măsurate la nivel de interval. Totuşi, o dată
cu dezvoltarea unor noi tehnici de analiză, dedicate special nivelelor de măsurare "calitativă",
aceste practici devin din ce în ce mai rare.)
Gruparea pe intervale de variaţie
Intervalul de variaţie reprezintă un şir de valori ale variabilei studiate, delimitat de intervalele
vecine prin limita inferioară şi limita superioară. Intervalele de variaţie pot fi de mărime egală
sau neegală.
• Pentru gruparea pe intervale de variaţie se recomandă utilizarea unui număr moderat de
grupe. Deseori, un număr de 4 până la 10 grupe este arbitrar recomandat, dar felul datelor poate
necesita un alt număr de grupe.
Numarul K deintervale este ales în strânsă dependen ţă de problema studiat ă. Un număr prea
mic de intervale are dezavantajul că „ascunde” particularit ăţile grupelor; din contra, un număr
mare de intervale face dificilă reprezentarea grafic ă a rezultatelor. şi deducerea modelului
probabilistic se face eronat
. Pentru structurarea colectivităţii, pentru evidenţierea grupelor (straturilor) tipice din
colectivitate, se pot forma grupări pe intervale egale de variaţie sau pe intervale neegale.
Gruparea datelor pe intervale de variaţie necesită stabilirea numărului k de
grupe(intervale) şi a mărimii intervalelor.
Nu există o regul ă general ă valabil ă de determinare a num ărului de grupe care trebuie să se
formeze. Cu toate acestea, alegerea numărului de grupe nu se face mecanic, ci presupune
cunoaşterea variaţiei caracteristicii numerice, elaborarea mai multor variante de grupe până
se ajunge la soluţia cea mai potrivită, conformă cu forma concret ă de manifestare a
fenomenului urmărit. Scopul operaţiei de grupare necesită formarea unui num ăr de grupe care
8/21/2019 Suport Curs Informatica Juridica an IV Sem II 2014
23/78
17
să nu fie nici prea mare, dar nici prea mic. Cert este faptul c ă num ărul de grupe (k) trebuie să
fie direct propor ţional cu amplitudinea variaţiei.
A = xmax - xmin , unde:
xmin = min (x1, x2, ..., xn) şi xmax = max (x1, x2, ..., xn).
Pe baza amplitudinii şi a numărului de grupe =k , se determină mărimea intervalelor de
variaţie (h) dup ă rela ţia
h = A / k
În literatura de specialitate se recomandă, în ipoteza repartiţiei aproximativ normale a
unităţilor colectivităţii după caracteristica urm ărită, utilizarea relaţiei lui Sturges pentru
determinarea mărimii intervalelor de variaţie.
h =(xmax – xmin)/(1+3,322 log10n)
După determinarea m ărimii intervalelor de variaţie este necesar să se determine limitele
inferioare şi superioare ale intervalelor de grupare.Stabilirea limitelor se poate face astfel:
- limita superioară a fiecărui interval să se preia ca limit ă inferioar ă a intervalului urm ător.
În felul acesta se obţin intervale cu limită repetabil ă
- limitele inferioare şi superioare ale intervalelor de grupare distincte, diferenţiate printr-o
unitate
La repartizarea amplitudinii variaţiei pe intervale de grupare trebuie să se ţină seama de
următoarele recomandări:
- limitele de interval să se exprime prin numere întregi;- să se formeze un astfel de număr de intervale de grupare pentru a se obţine informaţii,
suficient de analitice, în vederea caracterizării colectivităţii;
- intervalele de grupare formate trebuie să permit ă, la nevoie, regruparea datelor f ăr ă s ă se
reia operaţia de grupare sau de divizare a intervalelor;
- fiecare interval de grupare trebuie să cuprind ă un număr suficient de mare de valori
individuale care să faciliteze analiza statistică a frecvenţelor.
În cazul în care se urmăreşte structura colectivităţii (populaţiei) simultan după două sau
mai multe caracteristici numerice, sau în cazul în care se urmăreşte analiza modului de
manifestare a interdependenţelor dintre două variabile, se elaboreaz ă gruparea combinată.
Pentru elaborarea grupării combinate este necesar ca intervalele de variaţie fixate pentru o
primă caracteristic ă (x) - de regul ă, caracteristica factorială, cauzală - s ă se divid ă în subgrupe
după o a doua caracteristic ă rezultativ ă (efect). Aceasta din urm ă la rândul lor sunt divizate în
subsubgrupe după o a treia caracteristic ă ş.a.m.d. Această caracterizare ierarhic ă adânce şte
analiza structurii colectivităţii, ea reprezentându-se sub forma unui graf arborescent.
8/21/2019 Suport Curs Informatica Juridica an IV Sem II 2014
24/78
18
Serii statistice
Seriile statistice reprezintă o alt ă modalitate de prezentare a datelor. Rezultatul sistematiz ării
datelor prin grupare/clasificare se constituie sub forma seriilor statistice.
Seria statistică este prezentarea ordonată a datelor referitoare la manifest ările unui fenomen
colectiv sub forma a două şiruri de date: unul priveşte variabila şi modul cum a fost sistematizată,
iar al doilea frecvenţa de apariţie sau nivelul unei variabile în raport cu primul şir. Seria statistică, ca rezultat al sistematizării şi/sau grupării, defineşte corespondenţa dintre
două şiruri de date statistice în care primul reprezintă varia ţia caracteristicii urmărite, iar al
doilea şir cuprinde frecvenţele de apariţie a variantelor caracterisiticii.
1. Serii cronologice
Seriile cronologice (de timp sau dinamice) prezintă evolu ţ ia în timp a unui fenomen sau
descriu un anumit proces;
Seriile cronologice reprezintă seriile statistice ce se ob ţin prin sistematizarea datelor după o
variabilă de timp. O serie cronologic ă este alc ătuită din dou ă şiruri de date: unul cu privire launităţile de timp, care pot fi momente sau intervale de timp, iar cel de-al doilea cu privire la
frecvenţa de apariţie sau nivelul unui fenomen, înregistrat în aceste unităţi de timp.
Dacă unit ăţile de timp sunt momente, atunci seria cronologică se nume şte de stoc (de momente),
iar dacă unit ăţile de timp sunt intervale (perioade), seria cronologică se nume şte de flux (de
intervale).
Anul 2002 2003 2004 2005 2006
Infrac iuni la
regimul
circulaţiei
22.998 21.537 22.405 24.904 20.309
Infracţiuni la regimul circulaţiei www.politiaromana.ro
2. Serii teritoriale
Dacă variabila pentru care se sistematizeaz ă datele este o variabil ă de spa ţiu (teritorială), adică elementul ce diferenţiază manifest ările fenomenului analizat este locul unde acestea s-au produs,
atunci rezultatul este o serie teritorială (de spaţiu).
Regiunea de
dezvoltare
Nord -
Est
Sud -
Est
Sud -
Muntenia
Sud -
Vest
Oltenia
VestNord -
VestCentru
Bucureşti -
Ilfov
8/21/2019 Suport Curs Informatica Juridica an IV Sem II 2014
25/78
19
Persoane
condamnate
definitiv
12115 7735 7075 6715 5343 7375 6200 4147
www.insse.ro
3. Serii de distribuţie de frecvenţe pentru o variabilă atributivă
În forma cea mai generală o serie statistic ă cu o singur ă caracteristic ă x se prezint ă astfel:
x1 x2 ... x r …. xn
n1 n2 ... nr ….. nn
Unde: x1, x2, ..., xn sunt variante înregistrate pentru caracteristica x
n1, n2, ..., nr sunt frecvenţele de apariţie ale variantelor caracteristicii x.
Infractiuni
judiciare
Infractiuni
economice
Infractiuni
de alta
natura
75076 74339 82222www.politiaromana.ro
Seriile de distribuţie de frecvenţe alcătuite după o variabil ă cantitativ ă (numeric ă), poartă numele
de distribuţii heterograde.
Seriile de distribuţie de frecvenţe alcătuite după o variabil ă calitativ ă (nenumeric ă) poartă numele
de distribuţii homograde.
FRECVEN ŢĂ
Frecvenţa unei observaţii în eşantion:este numărul de apariţii ale acelei observaţii (valori)în eşantion.
Frecvenţa relativă a unei observaţii în eşantion: raportul dintre numărul de apariţii ale
observaţiei în eşantion şi numărul total de observaţii(dimensiunea e şantionului)
Distribu ţ ia frecven ţ elor
a) Distribuţia frecvenţelor ( pentru un atribut variabil discret): mulţimea tuturor
observaţiilor distincte, împreună cu frecven ţele lor relative în eşantion.
fumat Intens Rar Nu Total
Frecvenţa absolută 7149 2818 6563 16500
Frecvenţa relativă 0.433 0.170 0.397 1.00
b) Distribuţia frecvenţelor ( pentru un atribut variabil continuu )
Clasă interval: un subinterval inclus între valorea minimă şi cea maximă.
Frecvenţa clasei interval: numărul de observaţii ce apar ţin clasei respective.
8/21/2019 Suport Curs Informatica Juridica an IV Sem II 2014
26/78
20
Distribuţia frecvenţelor unui atribut variabil continuu: mulţimea claselor interval împreună
cu frecvenţa fiecăreia.
Numar
amînări
mijlocul
intervalului
Frecven ţ a
absolut ă
frecvente
relative
frecvente
cumulate
0 0.5 1 0.03 1
1 1.5 4 0.14 5
2 2.5 7 0.24 12
3 3.5 3 0.10 15
4 4.5 4 0.14 19
5 5.5 3 0.10 22
6 6.5 2 0.07 24
7 7.5 1 0.03 25
8 8.5 1 0.03 26
9 9.5 2 0.07 28
10 10.5 1 0.03 29
total 29 1.00
Forma generală a seriei statistice con ţine informaţii cu privire la succesiunea, mărimeavalorilor înregistrate şi a frecvenţelor (absolute sau relative )corespunzătoare;
- între cele două şiruri de date există o legătură univocă, în sensul că unei valori individuale
oarecare îi corespunde o anumită frecven ţă, respectiv un număr care arată de câte ori se
repetă valoarea individual ă respectiv ă.
Elaborarea seriilor şi tabelelor statistice reprezintă nu numai un mijloc eficient de prezentare
a datelor statistice dar şi o operaţie premergătoare pentru reprezentarea grafică.
Reprezentarea grafic ǎ a distribu ţ iei frecvenţ elor
• Histograme:
– X – axa valorilor;
– Y – axa frecvenţelor(absolute sau relative);
8/21/2019 Suport Curs Informatica Juridica an IV Sem II 2014
27/78
21
– aria fiecărui dreptunghi – propor ţională cu frecven ţa relativă respectiv ă.
histograma nr.aminari
0.00
0.05
0.10
0.15
0.20
0.25
0.30
0 1 2 3 4 5 6 7 8 9 10
nr.aminari
f r e c v e n t e r e l a t i v e
frecvente relative
Figura 2. Histograma
• Poligonul frecvenţelor: se unesc centrele laturilor superioare ale dreptunghiurilor din
histogramă.
poligonul frecventelor nr. aminari
0.00
0.05
0.10
0.15
0.20
0.25
0.30
0.5 1.5 2.5 3.5 4.5 5.5 6.5 7.5 8.5 9.5 10.5
nr aminari
f r e c v e n t e
r e l a t i v e
histograma
poligonul frecventelor
Figura 3. Histograma şi poligonul frecvenţelor
• Frecvenţe cumulate (ogiva): suma frecvenţelor valorilor mai mici decât o valoare
dată
se aplică în special pentru variabile continue.
8/21/2019 Suport Curs Informatica Juridica an IV Sem II 2014
28/78
22
frecvente cumulate nr.aminari
0
5
10
15
20
25
30
35
0 1 2 3 4 5 6 7 8 9 10
nr aminari
f r e c v e n t e
a b s o l u t e
frecvente cumulate
Figura 4. Ogiva
8/21/2019 Suport Curs Informatica Juridica an IV Sem II 2014
29/78
23
III. TIPURI DE DIAGRAME în Microsoft Office Excel
Diagramele transformă datele în imagini. Diversele tipuri de diagrame pot transmite
mesaje diferite pornind de la aceleaşi date.
Serie de date: puncte de date înrudite care sunt reprezentate grafic într-o diagramă.
Fiecare serie de date dintr-o diagramă are o culoare sau un model unic şi este reprezentat ă
în legenda diagramei. Într-o diagramă se pot reprezenta grafic una sau mai multe serii de
date.
2004 2005 2006 2007 2008
Infracţiuni
judiciare 75.076 70.344 82.359 122.903 124.815Infracţiuni
economice 74.339 56.492 59.85 56.356 55.871
Infracţiuni de
altă natură 82.222 81.403 90.45 102.198 108.645
volumul
criminalitatii
=infracţiuni la
100.000
locuitori 1.006 961 1.077 1.305 1.344
http://www.politiaromana.ro/infractiuni_2002_2008.htm
Prin selectarea celui mai eficient tip de diagramă datele vor deveni mai clare, mai puternice şi
mai informative. Microsoft Office Excel ofer ă o varietate larg ă de tipuri de diagrame şi de
metode simple pentru selectarea şi examinarea acestora.
1. Diagrama Coloanǎ O diagramă Coloană compar ă direct valorile
Începeţi prin selectarea datelor pe care le reprezentaţi pe diagramă, precum şi titlurile
coloanelor şi ale rândurilor. Apoi, pentru a deschide Expert diagramă, faceţi clic pe butonul
Expert diagramă de pe bara de instrumente Standard.
Când se deschide expertul, aveţi selectat tipul de diagramă Coloană. O diagram ă Coloan ă
este un tip de diagramă bun pentru compararea direct ă a valorilor. Când selecta ţi un tip de
diagramă, este bine să o men ţineţi simplă, astfel încât mesajul redat să fie clar.
8/21/2019 Suport Curs Informatica Juridica an IV Sem II 2014
30/78
24
Compararea tipurilor de infractiuni
0
20
40
60
80
100
120
140
2004 2005 2006 2007 2008
anii
n u m a r i n f r a c t i u
n i
Infracţiuni judiciare
Infracţiuni economice
Infracţiuni de altă natur ă
Figura 5. Diagramă Coloană(datele pe coloanǎ)
Compararea anilor pentru fiecare tip de infractiune
0
20
40
60
80
100
120
140
Infracţiuni judiciare Infracţiuni economice Infracţiuni de altă natur ă
n u m a r i n f r a c t i u n i
2004
2005
2006
2007
2008
Figura 6. Diagramă Coloană(datele pe linie)
2. Diagramă Coloană stratificată O diagramă Coloană stratificat ă compar ă componente din mai multe totaluri
Ce se întâmplă dac ă dori ţi să compara ţi contribuţiile fiecărui tip de infracţiune, la totalul
anului? Aveţi posibilitatea să scoate ţi în evidenţă în mod diferit acelea şi date prin crearea
unui alt tip de diagramă, Coloană stratificată.
8/21/2019 Suport Curs Informatica Juridica an IV Sem II 2014
31/78
25
Pentru a modifica din Coloană în Coloan ă stratificat ă, faceţi clic cu butonul din dreapta al
mousului pe bordura diagramei pentru a o selecta, apoi faceţi clic pe Tip de diagramă din
meniul de comenzi rapide. (Alegem diagrama din figura 5)Se va deschide caseta de dialog
Tip de diagramă în care este selectat tipul de diagram ă Coloan ă. În partea dreaptă a casetei
de dialog, selectaţi din diferitele forme de diagrame Coloană prezentate în zona Subtip de
diagramă. Tipul de diagramă se modific ă atunci când face ţi clic pe un subtip, apoi pe OK .
Compararea anilor dupa total infractiuni/an
0
50
100
150
200
250
300
350
2004 2005 2006 2007 2008
n u m a r i n f r a c t i u n i
Infracţiuni de altă natur ă
Infracţiuni economice
Infracţiuni judiciare
Figura 7. Diagramă Coloană stratificatǎ
O diagramă Coloană stratificat ă compar ă participările diferitelor valori la un total , afişând
unităţi sau procente.
Compararea anilor dupa evolutia fiecarui tip de infractiune
0%
20%
40%
60%
80%
100%
2004 2005 2006 2007 2008
n u m
a r i n f r a c t i u n i
Infracţiuni de altă natur ă
Infracţiuni economice
Infracţiuni judiciare
Figura 8. Diagramă Coloană stratificatǎ procentual
.
8/21/2019 Suport Curs Informatica Juridica an IV Sem II 2014
32/78
26
Diagrama de aici este o diagramă Coloan ă stratificat ă 100%, care afi şează particip ările sub
formă de procente.
Utilizarea subtipului Coloană stratificat ă sau a subtipului de baz ă Coloan ă grupat ă depinde de
mesajul pe care doriţi să-l clarificaţi; probabil că le-a ţi utiliza pe ambele. Făr ă s ă modifica ţi
diagrama, aveţi posibilitatea să încerca ţi caseta de dialog Tip de diagramă pentru a vedeamodul în care vor ar ăta datele în diferite tipuri şi subtipuri de diagrame. Selectaţi un tip şi
examinaţi-l executând clic şi menţinând apăsat butonul Apăsaţi şi ţineţi apăsat pt.
vizualizare eşantion. Când ştiţi exact ceea ce doriţi, apăsând pe OK face ţi modificarea.
3. Diagramă Structur ǎ radială O Diagramă de structur ă radial ă compar ă p ăr ţile dintr-un total
Ce se întâmplă dac ă dori ţi imaginea mare? Aveţi posibilitatea să crea ţi o Diagramă de
structur ă radial ă. Aceasta este destinată prezent ării comparaţiilor din cadrul unui singur set de
valori şi prezentării modului în care componentele contribuie la întreg.. Spre deosebire de o
diagramă Coloan ă, care poate să reprezinte un num ăr mare de valori, o Diagramă de
structură radială nu poate să afi şeze decât un singur set de valori
Cum se obţine o asemenea structur ă? În primul rând, trebuie să selecta ţi titlurile şi totalurile
coloanelor de pe foaia de lucru . Apoi faceţi clic pe butonul Expert diagramă de pe bara
de instrumente Standard pentru a deschide expertul, în care trebuie s ă selecta ţi tipul
Diagramei de structur ă radial ă.
2002
33%
36%
31%
Infracţiuni judiciare
Infracţiunieconomice
Infracţiuni de altănatur ă
Figura 9. Diagramă structură radială
8/21/2019 Suport Curs Informatica Juridica an IV Sem II 2014
33/78
27
Diagramele de structur ă radial ă sunt disponibile în numeroase subtipuri, precum 3-D,
care are aspect vizual atractiv dar poate să fie mai dificil de în ţeles dacă are multe sec ţiuni.
Din nou, selectaţi forma de diagramă care este cea mai eficient ă pentru reprezentare.
4. Diagramă Linie
O diagramă linie compar ă datele în timp
Diagrama linie este un tip de diagramă corespunz ător pentru prezentarea modificărilor şi a
tendinţelor în timp. Pentru aceasta, faceţi clic cu butonul din dreapta al mousului pe bordura
diagramei pentru a o selecta, apoi faceţi clic pe Tip de diagramă din meniul de comenzi
rapide. După deschiderea casetei de dialog Tip de diagramă, selectaţi o Diagramă linie din
lista Tip de diagramă.
Compararea anilor dupa evolutia fiecarui tip de infractiune
0
20
40
60
80
100
120
140
2004 2005 2006 2007 2008
n u m a r i n f r a c t i u n i
Infracţiuni judiciare
Infracţiuni economice
Infracţiuni de altă natur ă
Figura10. Diagramă linie
Selectarea între o Diagramă linie şi o diagramă XY prin puncte
Când deschideţi Expert diagramă sau caseta de dialog Tip de diagramă, diagramele Linie şi
diagramele XY (prin puncte) arată similar în lista Tip de diagramă. Este important să o
selectaţi pe aceea care vă ajut ă. Aici sunt câteva linii de ghidare care să v ă ajute în alegere.
Diagramele Linie sunt bune pentru afişarea tendinţelor în timp ale unor cifre de afaceri
precum vânzări, venituri şi profituri. Utilizaţi o Diagramă linie dac ă dori ţi date în partea
inferioar ă a diagramei, pentru a face dezvolt ările istorice vizibile dintr-o privire. Diagramele
linie au de obicei un singur set de numere, prezentat pe axa vertical ă.
O Diagramă XY (prin puncte) compar ă odat ă dou ă seturi de numere, unul de pe axa
orizontală X, altul de pe axa vertical ă Y. Valorile datelor sunt împr ăştiate în diagramă. Aveţi
opţiunea să conecta ţi valorile prin linii, dar aceste linii nu arată tendin ţele în timp.
8/21/2019 Suport Curs Informatica Juridica an IV Sem II 2014
34/78
28
evolutia in timp a volumului criminalitatii =infracţiuni la 100.000
locuitori
0
0.2
0.4
0.6
0.81
1.2
1.4
1.6
2003 2004 2005 2006 2007 2008 2009
anii
i n f r a c t i u n i l a 1
0 0 0 0 0
l o c u i t o r i
volumul criminalitatii=infracţiuni la 100.000
locuitori
Figura11. Diagramă XY (prin puncte)
Diagramele XY (prin puncte) sunt bune pentru afişarea comparaţiei de numere
precum date ştiinţifice sau statistice, unde mai multe măsur ări trebuie reprezentate grafic pe o
singur ă diagram ă. (de exemplu pentru a prezenta câte cazuri de infracţiuni sunt pentru diferite
grupe de vârstă în func ţie de veniturile medii ).
O diagramă XY (prin puncte)poate s ă fie un tip eficient de reprezentare a datelor.
Pentru a aranja date într-o foaie de lucru pentru o diagramă prin puncte, ar trebui s ă plasa ţi
valorile x într-un rând sau coloană, apoi să introduce ţi valorile y corespondente în rândurile
sau coloanele adiacente.
Figura12. Diagramă XY (prin puncte)
Diagramele prin puncte au următoarele subtipuri de diagrame:
8/21/2019 Suport Curs Informatica Juridica an IV Sem II 2014
35/78
29
Prin puncte doar cu marcaje Acest tip de diagramă compar ă perechi de valori.
Utilizaţi o diagramă prin puncte f ăr ă linii când ave ţi date într-o anumită ordine.
• Prin puncte cu linii fine şi prin puncte cu linii fine şi marcaje Acest tip de
diagramă poate fi afi şat cu sau f ăr ă o curb ă fin ă care conecteaz ă punctele de
date. Aceste linii pot fi afişate cu sau f ăr ă marcaje. Utiliza ţi diagrama prin
puncte f ăr ă marcaje dac ă exist ă multe puncte de date.• Prin puncte cu linii drepte şi prin puncte cu linii drepte şi marcaje Acest tip
de diagramă poate fi afi şat cu sau f ăr ă linii drepte care conecteaz ă punctele de
date. Aceste linii pot fi afişate cu sau f ăr ă marcaje.
Preluarea mai multor informaţii în diagrame
Utilizaţi două tipuri de diagrame în cadrul unei diagrame pentru a crea o diagram ă
combinaţie.
Uneori, un anumit tip de diagramă este cel mai potrivit pentru o parte a datelor, dar
pentru restul datelor este mai potrivit un alt tip de diagramă. Nu trebuie să alege ţi dintre cele
două, deoarece Excel ofer ă posibilitatea combin ării a două sau mai multe tipuri într-o singur ă
diagramă
O diagramă combina ţie este uşor de creat.
În acest exemplu, trebuie să face ţi clic pe o coloană a infrac ţiunilor de altă natur ă
pentru a selecta toate coloanele acelei serii de date. Apoi trebuie să selecta ţi un tip de
Diagramă linie din caseta de dialog Tip de diagram ă.
Compararea anilor dupa evolutia fiecarui tip de infractiune
0
20
40
60
80
100
120
140
2004 2005 2006 2007 2008
n u m a r i n f r a c t i u n i
Infracţiuni judiciare
Infracţiuni economice
Infracţiuni de altă natur ă
Figura 13.Diagramǎ combinaţie (coloanǎ cu linie)
O a doua axă prezint ă valori foarte diferite
8/21/2019 Suport Curs Informatica Juridica an IV Sem II 2014
36/78
30
Uneori diferitele seturi de date dintr-o diagramă combina ţie sunt atât de diferite încât necesită
ceva mai multă clarificare. Chiar dac ă sunt afi şate diferit, nu aveţi posibilitatea să vede ţi
valorile mai mici.
Compararea anilor dupa evolutia fiecarui tip de infractiune si
adaugarea criminalitatii
0
20
40
60
80
100
120
140
2004 2005 2006 2007 2008
n u m a r i n f r a c t i u n i
0
0.2
0.4
0.6
0.8
1
1.2
1.4
1.6 Infracţiuni judiciare
Infracţiuni economice
Infracţiuni de altă natur ă
volumul criminalitatii
=infracţiuni la 100.000
locuitori
Figura 14 Diagram ǎ combinaţie cu douǎ axe Oy
Această problem ă se poate rezolva prin ad ăugarea unei alte axe a diagramei, secundar ă. Prin
reprezentarea valorilor criminalităţii pe propria axă se u şurează în ţelegerea Diagramei linie,
Pentru a crea o axă secundar ă, trebuie să selecta ţi tipul de diagramă pentru care dori ţi axa,
apoi trebuie să efectua ţi câteva selecţii în caseta de dialog Formatare serie de date.
O diagramă care utilizeaz ă datele din list ă adaug ă automat informa ţiile
noi
Există o nou ă modalitate de a men ţine actualitatea diagramelor în Excel.
Când modificaţi datele din foaia de lucru, Excel actualizează automat toate diagramele care
utilizează datele. Dar ce se întâmpl ă dac ă ad ăugaţi un întreg rând de date la o foaie de lucru?
Diagrama nu se modifică. Aceasta dacă nu este o diagram ă care utilizeaz ă datele la care a ţi
aplicat noua caracteristică List ă.
Dacă utiliza ţi comanda Listă din meniul Date din Excel pentru a trece datele într-o list ă,
apoi creaţi o diagramă cu acele date, toate rândurile noi care au fost ad ăugate în parteainferioar ă a listei sunt ad ăugate automat la diagramă.
8/21/2019 Suport Curs Informatica Juridica an IV Sem II 2014
37/78
31
5. Diagramele radar
Datele care sunt aranjate în coloane sau rânduri într-o foaie de lucru pot fi reprezentate într-o
diagramă radar. Diagramele radar compar ă valorile agregate ale unui num ăr de serii de date
care indica evolutia in timp Diagramele de structur ă radial ă au numai o serie de date .
volumul criminalitatii =infracţiuni la 100.000 locuitori
0
0.2
0.4
0.6
0.8
1
1.2
1.42004
2005
20062007
2008
volumul criminalitatii
=infracţiuni la 100.000
locuitori
Figura 15. Diagrama radar
Diagramele radar au următoarele subtipuri de diagrame:
• Radar şi radar cu marcaje Cu sau f ăr ă marcaje pentru punctele de date
individuale, diagramele radar afişează modific ările valorilor relativ la un punct
central.
• Radar plin Într-o diagram ă radar plin, suprafa ţa acoperită de o serie de date
este umplută cu o culoare.
6. Diagramele zonă
Datele care sunt aranjate în coloane sau rânduri pot fi reprezentate într-o diagramă zon ă.
Diagramele zonă accentueaz ă magnitudinea schimb ării în timp şi pot fi utilizate pentru a
atrage atenţia asupra valorii totale în funcţie de o tendinţă. De exemplu, datele care reprezintă
profitul în timp pot fi reprezentate într-o diagramă zon ă pentru a accentua profitul total.
Afişând suma valorilor reprezentate, o diagramă zon ă arat ă şi relaţia păr ţilor cu întregul.
Diagramele zonă au urm ătoarele subtipuri de diagrame:
• Zonă şi zonă în 3-D Diagramele zon ă afi şează tendin ţa valorilor în timp sau în
categorii. O diagramă zon ă în 3-D afi şează în acela şi mod dar prezintă zonele în
8/21/2019 Suport Curs Informatica Juridica an IV Sem II 2014
38/78
32
format 3-D. Pentru a prezenta datele în format 3-D, care utilizează trei axe
(axele orizontală, verticală şi adâncime) ce pot fi modificate, ar trebui să utiliza ţi
subtipul de diagramă zon ă 3-D.
• Zonă stratificată 100% şi zonă stratificată 100% în 3-D Diagramele zon ă
stratificată 100% afi şează tendin ţa procentului cu care contribuie fiecare valoare
în timp sau în categorii. O diagramă zon ă stratificat ă 100% în 3-D afi şează înacelaşi mod dar prezintă zonele în format 3-D;
0
50
100
150
n r . i n f r a c t i u n
i
2004 2005 2006 2007 2008
I n f r a c ţ i u n i
j u d i c i a r e
I n f r a c ţ i u n i
e c o n o m i c e
I n f r a c ţ i u n i d e
a l t ă n
a t u r ă
anii
evolutia tipurilor de infractiuni in timp
Figura 16. Diagrama zonă în 3-D
evolutia tipurilor de infractiuni in timp
0%
20%
40%
60%
80%
100%
2004 2005 2006 2007 2008
anii
n r . i n f r a c t i u n i
Infracţiuni de altă natur ă
Infracţiuni economice
Infracţiuni judiciare
Figura 17. Diagrama zonă stratificată 100%
8/21/2019 Suport Curs Informatica Juridica an IV Sem II 2014
39/78
33
IV. STATISTICA DESCRIPTIVĂ
1. Analiza seriilor statisticeEvaluarea anumitor indicatori (parametri) statistici implică stabilirea caracteristicilor
(proprietăţilor) principale ale seriilor statistice. Acestea sunt: variabilitatea, omogenitatea,
independen ţ a şi concentrarea/împr ăştierea (dispersia) către/fa ţă de un una sau mai multe
valori ale seriei.
Variabilitatea termenilor unei serii statistice este determinat ă de faptul c ă fenomenul
pe care îl reprezintă nu este univoc determinat, ci apare ca un rezultat al ac ţiunii combinate a
mai multor cauze (permanente sau întâmplătoare). Cu cât acţiunea cauzelor întâmplătoare
este mai mare, cu atât variabilitatea este mai mare şi gradul de omogenitate mai mic.
Omogenitatea presupune o variaţie minimă între termeni. Dac ă în urma analizei se
constată c ă o serie nu prezint ă omogenitate, înseamn ă c ă în acest caz colectivitatea este
formată din mai multe tipuri calitative şi seria trebuie descompusă în subserii componente.
Independen ţ a termenilor unei serii provine din faptul că fiecare valoare individual ă
reprezintă un element distinct şi obiectiv al unei populaţii statistice. Termenii ce apar ţin
aceleiaşi colectivităţi se supun aceloraşi legi care se manifestă sub form ă de tendin ţă.
Concentrarea/împr ăştierea (dispersia) c ătre/faţă de un /una sau mai multe valori ale
seriei apare ca rezultat al intensităţii unui efect produs de cauze esenţiale şi întâmplătoare.
Acest lucru determină frecven ţele diferite de apariţie a diferitelor valori din serie. Dacă
intensitatea factorilor este uniformă, frecvenţele de apariţie sunt apropiate. În caz contrar,
frecvenţele de apariţie se concentrează fie la un singur cap ăt al seriei, fie către o valoare
centrală.
2. Statistici descriptive pentru un atribut cantitativ
2.1. Indicatorii tendinţei centrale
În urma observării caracteristicii cantitative X în n probe se ob ţin următoarele date primare:
x1, x2,..., xn (1)
8/21/2019 Suport Curs Informatica Juridica an IV Sem II 2014
40/78
34
Gruparea datelor se face în funcţie de tipul caracteristicii X. Astfel, dacă X este o
variabilă discret ă ce poate lua valorile distincte v1, v2 ,..., vn , atunci în locul datelor ini ţiale se
va reţine repartiţia empirică:
⎟⎟ ⎠
⎞
⎜⎜⎝
⎛
m
m
nnn
vvv
....
....
21
21 (2)
Unde ni, (i=1, m) reprezintă frecven ţa apariţiei (numărul de apariţii) valorii vi, iar n reprezint ă
numărul valorilor din şirul iniţial (1) şi se numeşte frecven ţă absolut ă a valorii v. Valoare m
reprezintă num ărul de clase.
Raportul f j = n j/n dintre frecven ţa absolută şi numărul total de probe se numeşte
frecven ţă relativă. Se observă c ă
f 1 + f 2 +…+ f m =1 întrucât n1 + n2 + ... + nm = n.
Frecvenţele relative, numite impropriu şi probabilităţi de apariţie, stau la baza calculării
densităţii de repartiţie a frecvenţelor şi a indicatorilor care exprimă gradul de concentrare. De
asemenea permit compararea a două reparti ţii construite pe aceeaşi variabilă, care difer ă
numai prin numărul unităţilor pe grupe.
Atenuarea datelor, care accidental sunt prea mari sau prea mici dintr-o popula ţie
statistică se face prin calcularea unor medii, în felul acesta f ăcându-se o compensare a
valorilor individuale. Acest calcul ne arată o anumit ă tendin ţă a fenomenului studiat, media
statistică fiind o valoare ce sintetizeaz ă într-o singur ă expresie numeric ă toate valorile din
seria măsur ători sau observaţii. Termenii seriei difer ă de medie deoarece au fost influen ţaţi de
diferiţi factori.
Media aritmetică
Media aritmetică simpl ă exprim ă un nivel mediu, anihilând abaterile individuale,
netipice. Ea este cuprinsă între valoraea cea mai mare şi cea mai mică.Definiţia 1. Dacă în urma unei selec ţii apar valorile distincte x1, x2,..., xn, atunci media
aritmetică este dat ă de formula:
∑=
=+++
=n
ii
n xnn
x x x x
1
21 1...
8/21/2019 Suport Curs Informatica Juridica an IV Sem II 2014
41/78
35
În cazul datelor centralizate (în care avem repartiţia de frecvenţă (2)):
∑=
=+++
=n
iii
nn vnnn
vnvnvn x
1
2211 1...
care se mai numeşte medie aritmetică ponderat ă. Numărul care arată de câte ori se repet ă fiecare valoare (n j) este "ponderea" valorii respective.
Observaţia 1. Media aritmetică are dezavantajul c ă este sensibil ă la valori extreme,
iar dacă termenii sunt prea "împr ăştiaţi", tinde să devin ă o valoare nereprezentativ ă. Media
aritmetică este o valoare lipsit ă de con ţinut dacă elementele sunt deosebite din punct de
vedere calitativ, caz în care este mai util să se fac ă medii par ţiale pentru fiecare tip de
colectivitate.
Observaţia 2. Dacă avem mai multe medii, fiecare referindu-se la o anumit ă
categorie, fiecare medie va fi ponderată în func ţie de importanţa categoriei sale.
Media geometrică
Media geometrică este mai pu ţin sensibilă la valorile extreme decât celelalte medii,
deci se întrebuinţează când dorim s ă atenu ăm divergenţele mari dintr-o serie de determinări
cu frecvenţe egale, fiind după o expresie "cea mai exact ă medie". Se utilizeaz ă când valorile
au o evoluţie (de creştere sau scădere) permanentă, neîntreruptă, sau o raţie din ce în ce mai
mare, termenii fiind legaţi între ei printr-o relaţie de produs. De asemenea se mai
întrebuinţează când vrem s ă d ăm o importanţă mai mare termenilor mai mici, în valoare
absolută, sau când diferenţele între termeni sunt foarte mari. Are dezavantajul că nu se poate
întrebuinţa când avem valori nule sau negative.
Definiţia 2. Dacă x1, x2,..., xn sunt n valori, media geometric ă se define şte prin
nn g x x x M ...21=
Calculul se face mai uşor cu ajutorul logaritmilor:
∑=
=n
ii g xn
M 1
lg1
lg
8/21/2019 Suport Curs Informatica Juridica an IV Sem II 2014
42/78
36
Datorită faptului c ă se calculeaz ă mai u şor cu ajutorul logarimilor, se mai numeşte
"medie logaritmică". Ea se utilizează şi la calcularea ritmului (de creştere sau descreştere)
numindu-se astfel şi "medie de ritm". În rezumat, se întrebuinţează�