Проучвания, анкети и методи за научен анализ в интернет?

Главен източник на информация за младите в Европейския съюз са социалните медии, а 68% от трафика към специализираните новинарски уеб сайтове се пренасочва от социалните мрежи. Затова те играят все по-голяма роля в новинарските организации и доставчиците на новини стават все по-зависими от тях. Ефектът от дигиталната трансформация върху информационната медийна среда се усилва от драматичното пренасочване на реклами от издателите на новини към социалните медии.

От своя страна, социалните медии дават приоритет на горещите новини – количеството пред качеството, навременност пред точност, което създава условия на непроверената и нередактирана информация или такава без потвърждение и препотвърждение.

Нещо повече, социалните медии дават възможност на специалистите по дезинформация от трети страни да ги ползват за пропагандни цели. Феноменът се мултиплицира с използването на софтуер препращащ автоматично съобщенията и сложни аналитични инструменти за Big Data

Колкото по-близо са изборите, толкова повече проучвания и анкети от всички видове се появяват в интернет пространството, за да се опитат да предскажат кой ще бъде евентуалният победител.  

  1. Имайте в предвид, че анкетите в Twitter, Facebook или „въпроси на деня“ поставени в различните новинарски сайтове, абсолютно не се контролират. Много е лесно подобни изследвания да се манипулират и те не показват намеренията на електората.
  2. Проучването на общественото мнение трябва да е проведено с достатъчно голяма представителна извадка от респонденти и в предоставените данни да е посочено каква е тя и допустимата грешка. В противен случай надеждността му може да бъде поставена под въпрос.
  3. Обърнете внимание на начина, по който се задава въпросът. Той не трябва да подвежда отговора.
  4. Не забравяйте, че проучването е само снимка във времето. Кандидат, получил едни резултати предварително три месеца преди изборите, може да се срине.   Колкото по-рано преди изборите е проучването, толкова по-малко надеждно е то.

Безспорно един от традиционните методи за изследване се основава на социологическите проучвания и тяхното тълкуване, но в съвременния свят на високите технологии все повече се търсят „усъвършенствани изчисления на Big Data“, за да ускорят и евентуално да съчетават процеса на проверка.

Усъвършенстваните изчисления се състоят от два основни елемента: машинно изчисление и човешко изчисление.

Първият елемент използва техники от обработка на естествен език (NLP) и машинно обучение (ML), докато последният използва методите за краудсорсинг и микротакинг. Прилагането на разширени изчисления за проверка на генерирано от потребители съдържание е ограничено в момента, защото областта на изследванията все още е нова; описаните платформи и техники за проверка по-долу все още се разработват и тестват.

В резултат на това точно колко стойност ще добавят към процеса на проверка остава да видим в бъдеще, но напредъкът в технологиите вероятно ще продължи в посока на автоматизирането на елементи от процеса на проверка. Това е важен момент в прилагането на усъвършенстваните изчисления за проверка на потребителско съдържание.

В човешките изчисления, наричани също масови изчисления, машината определя задачите пред тълпата. След това машината събира и анализира обработените задачи.

Пример за използване на такива изчисления при извънредни ситуации беше след земетресението в Хаити през 2010 г., където се направи една уеб платформа, на която пострадалите изпращат съобщения за обработване от машината.

Платформата Verily използва човешки изчисления за бързо събиране на източници на доказателства, които потвърждават или дискредитират дадена информация, публикувана в социалните медии. Нейните създатели участват в  едно много известно състезание наречено  „Червеният балон“ през 2009 г.  и лансирано от Агенция DARPA[1].

Условието на играта е било участниците да идентифицират местоположението на 10 червени метеорологични балона, поставени някъде в Съединените щати с помощта на разузнавателни техники. Отборът победител е намерил всичките 10 балона за по-малко от девет часа, без да стане от компютрите си в офиса. Те са се обърнали към социалните медии, като са обявили, че ще споделят награда от 40 000 долара с членове на социалната група, подпомогнала намирането на балоните. По-специално, те стимулират хората да поканят членове на тяхната социална мрежа да се присъединят към търсенето, като са написали следното: „Даваме 2000 долара на първия човек, който ни изпрати правилните координати на намерен балон, но това не е всичко – ние също така даваме 1000 долара на човека, който го е поканил да участва в играта. Освен това даваме 500 долара на този, който е поканил, предишния и 250 долара на следващия и т.н.“[2]

Платформата Verily използва същия механизъм за стимулиране под формата на точки. Вместо да търси балони в цяла държава, обаче, платформата улеснява проверката на доклади в социалните медии, публикувани по време на бедствия, за да обхване далеч по-малка географка зона – обикновено град. Тя работи с табла съдържащи  да или не въпроси.

За пример: „Бруклинският мост е затворен заради урагана Sandy?“ Потребители на Verily могат да споделят тази заявка за потвърждение в Twitter или Facebook и също да изпращат имейли на хора, които познават и живеят наблизо. Тези, които имат доказателства, за да отговорят на въпроса, изпращат информация на Verily в два раздела.  Доказателство за потвърждение и доказателство за отрицание. Типът доказателства, които могат да бъдат публикувани, включва текст, снимки и видеоклипове.

В медийното пространство са известни редица машинни изследвания и анализи на данни от публикувани туитове, благодарение на които може да се докажат фалшиви профили. Например, дължината на туитове, настроението на използваните думи, използваните хештагове и емотикони предоставят показатели за вероятната и достоверност на съобщенията.

Същото важи и за туитове, които включват връзки към изображения и видеоклипове съдържащи се в туитове, които свързват към мултимедийно съдържание, може да се използва за определяне дали това мултимедийно съдържание е достоверно или не. Взети заедно, тези данни предоставят на машините параметрите и интелигентността, които те използват да предвиждат точността на туитове и друго съдържание в социалните медии. Така се отваря вратата към по-голяма роля за автоматизация в процеса на проверка по време на бедствия и други новини от кризисни и спешни ситуации.

По отношение на практическите приложения, тези открития са дали възможност да се разработи плъгин, които оценява туитове по скала от 0 до 100 въз основа на вероятността, че съдържанието на даден туит се счита за достоверно. Основното предимство на това машинно изчислително решение е, че то е напълно автоматично и по този начин по-мащабируеми от човешките възможности.

В изследователските среди са известни и т.н. хибридни изчисления. Такава е например, Платформата от изкуствения интелект за реагиране при бедствия (AIDR). Платформата комбинира изчисляването на човека (микрозадача) с машинните изчисления.

С други думи една голяма задача се разделя на серия от по-малки задачи от хората. Машинното обучение включва обучение на компютър за изпълнение на определена задача. AIDR дава възможност на потребителите да учат алгоритъма за намиране на интересна информация в Twitter.

С помощта на микрозадачите се обучава изкуствения интелект. Например, ако служителите от „Червеният кръст“ проявяват интерес при наблюдение на социалните мрежи за справки за щети в инфраструктурата след бедствие, AIDR им избира и предоставя сортирани отделни туитове, които се отнасят до повреди. Алгоритъмът постепенно ще научи автоматично кои от тях се отнасят за истински щети и кои не.

Този хибриден изчислителен подход може да се използва за автоматично идентифициране на слухове на базата на първоначален набор от туитове, отнасящ се до тези слухове. Бързо установяване на слуховете и техния източник е важен компонент за проверка на генерирано от потребители съдържание и разобличаване на фалшивите новини. Тя дава възможност специалисти да проследяват информацията до източника й и да знаят с кой да се свържат, за да направят следващата съществена стъпка в проверката на информацията. Ето няколко съвета за проверка на информацията в критична ситуация:

1. Изградете и поддържайте мрежа от надеждни източници предварително, още в спокойния период преди кризата. За целта трябва да се състави списък на надеждни източници, които включват както официални, така и неофициални, академични експерти, неправителствени организации, правителствени служби и др. В този списък следва да влизат не само социално медийни акаунти, но също така телефонни номера и имейли в споделена база данни. Следва да организирани в логически групи въз основа на теми или географски признаци и местоположение. Необходимо е да сме подготвили варианти за разширено търсене по подходящи  хаштагове, списъци по интереси в социалните мрежи и създадени плейлисти от канали в YouTube. В тълпата има надеждни източници, които са развили експертиза в отделни области, професионално или непрофесионално. Има и източници от конкретно физическо местоположение. Изградете доверие, като се ангажирате в социалните мрежи с тях и взаимодействайте при нужда.

2. Определете ролята, която вие или вашата организация ще играете в комуникацията в момент на бедствия или криза. Предварително определете как трябва да общувате ефективно, когато възникне спешна ситуация. Помислете с кого искате да общувате на вътре и на вън от организацията, за какво са полезна целевите групи, какъв език трябва да използвате, за да ги съветвате.

3. Обучението и поддръжката на подготвен за целта персонал е абсолютно задължително. Създайте набор от инструменти, работен поток и процедури за комуникация, които да използвате в кризисни ситуации. Дайте възможност на служителите да участват в програми за обучение при бедствия, предлагани от различни служби. Подгответе скриптове, съобщения, които ще се използват в конкретни ситуации на бедствия.

Една от технологиите, които могат да дадат нови решения в проблема за разпространението на информацията и съответно за справяне с фалшивите новини е технологията блокчейн.

Накратко: веднъж попаднала в блокчейн – веригата от блокчета данни, копирани на много компютри в мрежата, информацията остава „окована“ завинаги. Всяка следваща брънка от разрастването и допълва, но и запазва предишните, което значи, че информацията може да бъде проследена. Влязла в блокчейна, тя не може да бъде променяна, а само четена. През последните години по този начин някои учени защитават разработките си, като използват блокчейн технологии, които работят със собствена блокчейн мрежа и криптовалута с подобни технологии. Ако в блокчейн бъдат „оковани“ новините, ще е повече от лесно да се провери дали авторът е опитен или е трол, появил се неясно откъде. В зависимост от това колко е четена една новина и доколко отговаря на заявката си, авторът й е стимулиран от читателите.

Неслучайно блокчейн беше определен от Европейската комисия като технологията, която може да сложи край на фалшивите новини. Според официалното становище на Европейската комисия блокчейн може да промени начина, по който информацията се създава и разпространява. Приложенията, създадени с тази технология, могат да гарантират прозрачността, доверието и проследимостта на информацията.



fakenews; името на файла е fake-instrument.png

[1] DARPA Network Challenge Final Standings. DARPA. 2010.