Մի գրաֆիկի պատմություն կամ ինչպես հորինել նվազման միտումներ․ hetq.am (Գրաֆիկներ և լուսանկարներ)
Ապրիլի 6-ին հրապարակել էինք առողջապահության նախարար Արսեն Թորոսյանի պաշտոնական էջում տեղադրված գծապատկերի մասին հոդված, որտեղ ներկայացրել էինք, որ սխալ մեթոդաբանությամբ կազմած այդ գրաֆիկն ապակողմնորոշում է հանրությանը՝ փորձելով ցույց տալ նոր կորոնավիրուսով վարակակիրների տվյալները նկարագրող ինչ-որ կոր, որը շեշտակի նվազում է։ Այս մասին գրել է hetq.am-ը։
«Կորոնավիրուսի ճգնաժամը ժամանակավոր է, իսկ հանրությանն ապակողմնորոշող տեղեկատվության տարածումը չկանխելը կարող է ավելի վնասակար և երկարատև հետևանքներ ունենալ։ Քանի որ հրապարակումը լայնորեն քննարկվեց տեղեկատվական դաշտում, կրկին անդրադառնում եմ նույն գրաֆիկին՝ ավելի մանրամասն։
Գրաֆիկը, որը տարածվել էր Արսեն Թորոսյանի էջով».
Hetq.am-ը պարզաբանում է, թե ինչու է անթույլատրելի նման վիզուալ բովանդակության ստեղծումը և տարածումը։
«1) Այն հրապարակվել է առանց բացատրական տեքստի, տվյալների աղբյուրի և մեթոդաբանության վերաբերյալ տեղեկության։
Տվյալների վիզուալ ներկայացման ստանդարտները սահմանում են, որ յուրաքանչյուր գծապատկեր պետք է ուղեկցվի բացատրական տեքստով, նկարագրությամբ, տվյալների աղբյուրի, ինչպես նաև հաշվարկի մեթոդաբանության վերաբերյալ տեղեկությամբ։ Գրագետ գծապատկեր մատուցելու համար այդ ստանդարտներին հետևելը պարտադիր է՝ մանավանդ պետական և պաշտոնական հարթակներում։ Միավորված ազգերի կազմակերպությունն, օրինակ, մշակել է բացատրական տեքստի ֆորմատ, որի տեղադրումը վիզուալ պատկերների կողքին պարտադիր է։
Այն, որ առողջապահության նախարարն իր պաշտոնական էջում հրապարակել է անհասկանալի վիզուալ բովանդակություն՝ առանց այն մեկնաբանելու, դեռ չի նշանակում, որ զերծ է մնացել հանրությանը շփոթեցնելուց։ Պատկերավոր կերպով շեշտակի նվազման միտում ցույց տալը, բայց այն չբացատրելը նույնպես հանրությանը շփոթեցնել է։
2) Հաշվարկի մեթոդաբանությունը սխալ է։
Քանի որ Թորոսյանը չի բացատրել գծապատկերը, դժվար է վստահաբար իմանալ, թե ինչ են ցանկացել ցույց տալ հաշվարկի մեթոդաբանությունը մշակողները։ Հղում անելով այդ գրաֆիկի թվերին՝ իր ֆեյսբուքյան ուղիղ եթերում առողջապահության նախարարն այդ կորը նկարագրել է որպես «տոկոսային աճը» ցույց տվող գրաֆիկ։ Ֆեյսբուքյան այլ օգտատերեր վստահաբար պնդում են, որ այդ գծապատկերը նկարագրում է «աճի տեմպ»։
Եթե գծապատկերը կազմողի նպատակն աճի տեմպ ցույց տալն է եղել, ապա նա այնպիսի հնարքով է կիրառել նվազող ֆունկցիայի բանաձևը տվյալների վրա, որ ոչ միայն չի նկարագրում իրական դինամիկան, այլև մշտապես ցույց է տալիս տեմպի նվազում՝ նույնիսկ դրական արդյունքով թեստերի էքսպոնենցիալ աճի դեպքում։
Ինչպես բացատրում է մաթեմատիկոս Լիանա Եփրեմյանը, այդ կորը ստանալու համար կիրառվել է հետևյալ բանաձևը՝ y (n) = f (n) / (f (1) +...+ f (n-1)), որտեղ f (n)-ը n-րդ օրվա վարակվածների քանակն է։ Այս բանաձևի միջոցով ստացված գրաֆիկը նվազելու է՝ y (n+1) < y (n), նույնիսկ երբ վարակվածների քանակը էքսպոնենցիալ աճի՝ f (n) ~ e^n։
Վարակակիրների էքսպոնենցիալ աճ գրանցող ցանկացած երկրի տվյալների վրա այս բանաձևը կիրառելիս՝ նվազման միտում է գրանցվելու: Ինչպես հայտնի է, վարակակիրների էքսպոնենցիալ աճն իրավիճակի զարգացման վատագույն սցենարներից է, և այդ դեպքում եզրակացնել, որ վարակի «աճի տեմպը» նվազում է, անտրամաբանական է:
3) Վարակի տարածման ինտենսիվության գործակիցը (basic reproduction number) Թորոսյանի գրաֆիկի հետ կապ չունի
Արսեն Թորոսյանի գրաֆիկը սոցիալական մեդիայում «արդարացվում» էր նաև այն փաստարկով, թե իբր այդ գծապատկերը ցույց է տալիս վարակի տարածման ինտենսիվության գործակիցը՝ R(t)-ն։
R(t)-ն ցույց է տալիս, թե մեկ վարակված անձը որոշակի ժամկետում քանի այլ անձի կարող է վարակել այնպիսի խմբում (բնակչության շրջանում), որտեղ բոլորը ենթակա են վարակվելու։
Այն պնդումը, թե Արսեն Թորոսյանի հրապարակած գրաֆիկը ցույց է տալիս վերոնշյալը, ուղղակի չի կարող համապատասխանել իրականությանը, քանի որ նախ վարակի վերարտադրման տեմպը չի հաշվարկվում տոկոսներով, երկրորդ՝ նման թիվ հաշվարկելու համար անհրաժեշտ է ունենալ առավել համապարփակ տվյալներ, քան միայն վարակակիրների թիվն է։ Հաշվարկի մոդելները մանրամասն նկարագրված են այստեղ»։
Վարակի տարածման ինտենսիվության հաշվարկի գրաֆիկը ապրիլի 5-ին հրապարակել է պարետ Տիգրան Ավինյանը՝ իր պաշտոնական Ֆեյսբուքյան էջի stories բաժնում։ Այստեղ հրապարակված բովանդակությունն, ըստ աղբյուրի, 24 ժամ անց արխիվանում է և դադարում հասանելի լինել հանրությանը։
Տիգրան Ավինյանի հրապարակած գրաֆիկը.
«Ի տարբերություն Թորոսյանի՝ Ավինյանը ֆեյսբուքյան գրառումով բացատրել է գծապատկերի ինֆորմացիան հետևյալ կերպ. «...տարածման ինտենսիվության գործակիցը հաջողվել է նվազեցնել մարտի 25-ից մեկ շաբաթ առաջ գնահատված մոտ 2 արժեքից և հասցնել այն 1,4-ի»:
Վարակի տարածման ինտենսիվության գործակից ասելով՝ Ավինյանը նկատի ունի R(t)-ն։
Ավինյանը նույնպես չի նշել, թե ինչ տվյալների, մեթոդաբանության և մոդելի կիրառման արդյունքում են ստացել նշված գրաֆիկը։
Պարետի հայտարարության, ինչպես նաև հրապարակած գրաֆիկի մեթոդի պրպտումների արդյունքում՝ ի հայտ եկավ մի կայք, որտեղ հրապարակված է գրեթե նույն գրաֆիկը, ինչ Ավինյանի էջում։ Կայքը գործարկող թիմի վերաբերյալ ամբողջական տեղեկատվություն դժվար է գտնել, քանի որ երկու տարբեր անձանց անվան ներքո բառացիորեն գրված է նույն կենսագրությունը, իսկ նրանց LinkedIn էջերի հղումները տանում են նույն օգտատիրոջ հաշիվ»։
Գրաֆիկը՝ covid19-ro.com-ից
«Այս կայքը նույնպես հղում չի տվել հաշվարկի համար աղբյուր հանդիսացած տվյալներին, սակայն նշել է, որ ընտրվել է Բայեսյան ինֆերենցիալ (Bayesian inference) մեթոդը։ Ըստ այդ մեթոդի՝ առաջ է քաշվում վարկած և, օգտագործելով սահմանափակ տվյալներ, փորձ է արվում չափել այդ վարկածի հավանականությունը։ Այս մեթոդաբանությունը վերջերս սկսել են օգտագործել տարբեր երկրների վիճակագրական կենտրոններ՝ զուտ կանխատեսումներ անելու և հավանական սցենարներ փորձարկելու նպատակով»։
Աշխարհում կիրառվող այլ մեթոդներ
«Գրանցվող դեպքերի դինամիկան ուսումնասիրելու համար Worldometers.info կայքը պաշտոնական աղբյուրներից հավաքում, մշակում և հրապարակում է տարբեր երկրներում կորոնավիրուսի իրավիճակի վերաբերյալ տվյալներ։ Կայքը նաև հաշվարկում է տարբեր երկրներում ամենօրյա նոր դեպքերի աճման ֆակտորը։ Հաշվարկի համար կիրառում են հետևյալ բանաձևը. ամենօրյա նոր դեպքեր / նախորդ օրվա նոր դեպքեր։
Այս մեթոդաբանությունը եթե կիրառենք Հայաստանի տվյալների վրա, կստանանք հետևյալ պատկերը.
Տվյալները՝ Հիվանդությունների վերահսկման և կանխարգելման կենտրոնի
Գծապատկերում երևացող կարմիր գիծը 1-ի սահմանն է, որից վերև գտնվող արժեքները վկայում են նախորդ օրվա համեմատ վարակվածների քանակի ավելացման մասին, իսկ 1-ից փոքր արժեքները՝ քանակի նվազման: Մարտի 23-ին գրանցված կտրուկ աճը դրան նախորդող օրը թեստավորում չանցկացնելու արդյունք է։
Ընդհանուր առմամբ, միայն գրանցված դեպքերի թվի հիման վրա արված վերլուծությունները կարող են զուտ մոտավոր պատկեր ցույց տալ։ Ամբողջական պատկեր ստանալու համար, հարկավոր է տիրապետել համապարփակ տվյալների, որոնց հիման վրա հնարավոր է իրականացնել կոմպլեքս վերլուծություններ»։
Կայքը հետգրություն է թողել, որտեղ նշում է, որ ապրիլի 9-ին առողջապահության նախարարությունը «հերթական անգամ մերժեց «Հետքին» տրամադրել վարակակիրների վերաբերյալ մանրամասն ժողովրդագրական տվյալներ՝ պատճառաբանելով. «Հրապարակման ենթակա տվյալները հասանելի են https://ncdc.am/coronavirus/ պաշտոնական էջում»։
Հարցվող տեղեկությունը չի պարունակում անձնական տվյալներ, բայց նաև հրապարակված չէ նշված պաշտոնական էջում։ Նախարարությունը մոտ մեկ ամիս է, ինչ մերժում է այն տրամադրել՝ խախտելով տեղեկատվության ազատության մասին օրենքը», նշել է hetq.am-ը։