Semalt: Як Wiki працює на різних мовах?

Олівер Кінг, менеджер з успіху клієнтів Semalt , каже, що у Вікіпедії є широкий спектр даних, статей та вмісту різними мовами, а редакторам рекомендується створювати відсутні статті в цій гігантській енциклопедії. Можна з упевненістю сказати, що Вікіпедія існує більш ніж трьома сотнями мов, але більшість з них є неповними та відносно невеликими. Люди з усіх куточків світу щодня відвідують Вікіпедію та читають її понад 300 мовних видань. Деякі з них шукають конкретні статті та вміст, написаний сотнями до тисяч письменників-добровольців, які відповідають за створення та підтримку цієї відомої та вільної енциклопедії. Відвідувачі Вікіпедії в основному шукають статті англійською мовою, а на інших мовах припадає 30 мільйонів записів Вікі.

Демократизувати доступ до знань

Щоб допомогти письменникам та редакторам різних мовних спільнот оцінити відсутні статті, комп'ютерні експерти з Фонду Вікімедіа та Стенфорда успішно створили деякі інструменти. Один з них допомагає визначити важливі статті, які ще не доступні певною мовою. Потім редактори використовують ці рекомендації для створення нових статей. Якщо редактори та письменники багатомовні, то знайти статті на другій мові та перекласти їх на місцеву мову для читачів Вікіпедії дуже просто.

Отже, ця система спочатку визначить редактора «Мадагаскару», який хоче писати французькою мовою, і попросить редактора заповнити пропущені частини статті та опублікувати її в Малагасійській Вікіпедії. Таким чином, редактори можуть створювати статті для різних людей у світі, що, в свою чергу, може впливати на загальний досвід користувачів.

Дослідники Фонду Вікімедіа Лейла Зія та Еллері Вулчин співпрацювали зі студентом університету Стенфорда Робертом Уестом, щоб представити доповідь на Міжнародній конференції всесвітньої павутини в Монреалі. Згідно з ними, у Вікіпедії є великий обсяг даних, і між її статтями існує міцний зв’язок.

Вчені почали створювати списки статей різними мовами та перехресними посиланнями, щоб з’ясувати, які статті відсутні у яких мовах. Потім вони оцінили значення всіх відсутніх статей на основі географічної та культурної релевантності. Вони мають на меті якомога швидше опублікувати відсутні статті та отримати кращі оцінки.

Підключення прогалин

Дослідники випробували приміщення за допомогою ряду експериментів. Вони розпочали проект із понад 4 мільйонів статей, написаних англійською мовою, та виявили, що у розділі французької Вікіпедії бракує понад 1,5 мільйона статей. Потім експерти відібрали 300 000 важливих статей з англійської мови та перевели її на французьку мову. Статті були розділені на три основні групи з понад 100 000 статей у кожній і були передані найкращим та найдосвідченішим редакторам. Суть експерименту включала дві основні групи з шести тисяч редакторів та письменників, які зробили кілька праць як на французькій, так і англійській мовах протягом дванадцяти місяців до закінчення експерименту. У червні 2015 року всі редактори отримали електронний лист із зазначенням унікальних відсутніх статей, і їм було запропоновано перекласти повний перелік статей з англійської на французьку мову. Через місяць експерти отримали доступ до створення відсутніх статей і виявили, що вони можуть збільшити темпи створення органічних статей. На основі всіх цих результатів Фонд Вікіпедії розробив деякі експериментальні інструменти, де редактори та письменники можуть знайти прогалини на своїй місцевій мові та вказати на конкретні записи.