Един американски написа повечето от шотландската Уикипедия. И всичко им се обърка.

принцеса Мерида го е имала

сезонът на злонамерената вещица

Езикът е сложно нещо. Хората прекарват цялата си кариера в изучаване на други езици и превод от един език на друг, защото преводът никога не е толкова прост, колкото просто включване на думи в търсачка или речник и гледане на това, което излиза. Това важи за широко разпространените езици и още по-вярно за по-слабо използваните и разбираеми езици, като, да речем ... шотландци. Но това не попречи на един безстрашен американски интернет потребител да дефинира шотландци за целия интернет.

О, да наистина. Затегнете коланите.

Първо, нека се ориентираме. За тези, които може да не знаят, Скотс е един от трите родни езика, които се говорят в Шотландия днес, а другите два са английски и шотландски галски. Скотс е колективното име на шотландските диалекти, известни също като „дорически“, „лаланци“ и „шотландски“ или с по-местни имена като „Бучан“, „Дундонски“, „Глеска“ или „Шетландски“. Това според Скотския езиков център, който предполагам е надежден източник тук.Ще разберем защо съм предпазлив след секунда.

Както можете да кажете, шотландският език е много сложен език с много диалекти и вариации и не е супер добре познат, широко изучаван или преподаван по начина, по който другите езици като, да речем, испанският. Но все пак, тъй като интернет е такъв, има инструменти и справки за тези, които се интересуват от шотландците. И трябва да има уебсайтове на езика ... уебсайтове като Уикипедия, където съдържанието и преводите се правят от хора на определен език.

Което ни води до много странния случай на Шотландска Уикипедия . Уики с десетки хиляди записи на предполагаемия шотландски език ... и почти всички бяха написани от един, много плодовит и много американски човек. Човек ... който не говори шотландски. Странността беше открита за първи път по-рано тази седмица от потребител на Reddit, който обясни подозрението и откритието си в публикация, която вече е вирусна. Потребителят Ultach в r / Scotland написа:

Версията на уикипедия на шотландски език е легендарно лоша. Хората, въвлечени в лингвистични дебати за шотландците, често го използват като доказателство, че шотландският език не е език и ако това беше точно представяне, вероятно биха били прави. Той не използва почти никакъв шотландски речник, малкото, което използва, обикновено е неправилно и граматиката винаги отговаря на стандартния английски, а не на шотландски.

Ultach искаше да види кой прави тези лоши записи в шотландската Wiki и разкри нещо, което е доста невероятно.

Проверих историята на редактирането, за да видя дали някой някога се е опитвал да я коригира, но тя някога е била редактирана само от един човек. От любопитство щракнах върху тяхната потребителска страница и установих, че те са създали и редактирали десетки хиляди други статии, и то в Wiki с общо само 60 000 статии! Всяка страница, която са създали, е еднаква. Идентично на английската версия на статията, но с малко модифициран правопис тук и там, и ако сте имали късмет, може би една шотландска дума е хвърлена в средата му.

Сега, подобно на Ultach, няма да излагаме този редактор на Wiki или да ги срамуваме. Изглежда, че наистина са се опитвали да направят нещо, но начинът, по който са го направили, не е бил правилен. И това е така, защото езикът е много по-сложен от един към един преводи. Този потребител не разбра, че шотландците имат своя собствена граматика, не разбраха как се превеждат определени думи и просто пускането на английски през лош онлайн речник на шотландците няма да го намали.

Както лингвистът от Интернет Гретхен Маккулок обясни в отлична тема, това не е начинът, по който работи.

Така че всичко това е някак диво и странно, но това не вреди на никого, нали? Е, всъщност е така.

Тъй като живеем в ерата на интернет и изкуствен интелект, има всякакви алгоритми, програми, ботове и различни технологии, които използват неща като записи в Уикипедия, за които се предполага, че са написани на друг език, за да научат този език. Това е дефиницията за вирусност, в софтуерен смисъл, когато примерите за лош език се интегрират в тези системи, защото когато програмите научат нещо погрешно, е трудно да го изтриете.

Особено тук, където шотландският език е по-малко използван и е, можем да видим от целия този провал, слабо разбран извън Шотландия, този вид неща наистина са вредни. Не само в смисъл на програмиране или изкуствен интелект, но и за истинските хора, които се борят да имат този език по-широко признат и достоен за изучаване и уважение. Хора, за които това е част от тяхната култура и наследство.

Ще оставя Redditor Ultach да обясни:

Това ще звучи невероятно хиперболично и истерично, но мисля, че този човек вероятно е причинил по-голяма вреда на шотландския език от всеки друг в историята. Те се занимаваха с културен вандализъм в безпрецедентен досега мащаб. Уикипедия е един от най-посещаваните уебсайтове в света. Потенциално десетки милиони хора сега мислят, че шотландците са ужасно изкривено изобразяване на английски, а не са сами по себе си език или диалект, всичко това, защото са били изложени на изкривено изобразяване на английски език, наричано от този и само от този човек . Те написаха толкова масивен том на този претендиращ шотландски, че всеки, който пише на истински шотландски, щеше да заглуши работата си от боклуци. Или, още по-лошо, редактиран, за да бъде по-съобразен със споменатия боклук.

време за приключения принцеса дъвка x марселин

Много вероятно ще отнеме много време, докато шотландската Уикипедия бъде поправена, ако това наистина се случи. Просто беше нужен един много отдаден човек, за да го наруши, но може да отнеме много повече, за да го отмените и да преведете нещата правилно. Надявам се. Но в този случай, ако поемем по главния път и този потребител пое по ниския път, той със сигурност е стигнал до шотландската Уикипедия преди нас.

(Чрез: Gretchen McCulloch / Twitter , изображение: Pixar)

Искате още истории като тази? Станете абонат и подкрепете сайта!

- Мери Сю има строга политика на коментари, която забранява, но не се ограничава до лични обиди някой , език на омразата и тролинг.