Home / google / Чому Google не любить українську мову

Чому Google не любить українську мову

Останнім часом часто виникає запитання: чому, якщо вводити запит у Google українською, в пошуковику видає сайти з доменної зони .ru, — у чому проблема?

Оксиметр портативный ProfiLine Oxi 3210 – это портативный первоклассный прибор для измерения растворенного кислорода с интуитивно понятным, дружественным интерфейсом. Измеренные значения отображаются в виде концентрации, насыщенности или парциального давления, отдельные значения можно также сохранить вручную и отобразить на экране. Oxi 3210 позволяет легко заменять датчик на наиболее подходящий для данного образца.

ЧИТАТИ ТАКОЖ: Сотрудники Google начали увольняться в знак протеста против сотрудничества с Пентагоном

Дехто дивується трендам у запитах Google і проводить флешмоби з використанням запитів українською мовою. Але це не приводить до значних результатів.

Спробую пояснити дуже коротко і дуже спрощено.

Алгоритм Google ранжирує сайти здебільшого за поведінковими факторами і масою посилань (зараз уважніше ставиться до трастовості сайтів, звідки йдуть посилання, але накопичені за останні 10 років посилання таки залишаються як фактор ранжирування).

«На рассее» за підтримки держави і спецслужб працюють потужні агрегатори, як посилань так і поведінкових факторів, такі як Yandex, Mail.ru, соціальні мережі і потужні сайти на кшталт сайтів провідних телеканалів, ТАСС, РИА Новости, adme.ru та інших, які дають можливість піднімати в топ сайти доменної зони .ru і необхідні сайти в інших доменних зонах.

Є ще одна дурниця. У процесі навчання алгоритми Google часто сприймають запити кириличними мовами як запит російською й автоматично перекладають запит на російську, навіть якщо він зроблений українською. Зараз Google переучує алгоритми, зважаючи на зростання популярності голосових запитів, а це значить, що закінчується перехід від суворих запитів і ключових слів до запитів за фразами широкої відповідності, близькими до розмовної мови.

Природно, що навчання передусім відбувається найуживанішими мовами — англійською, іспанською та, зокрема, російською. Природно, що запит українською або білоруською сприйматиметься як запит з помилкою російською і автоматично перекладається на російську. Це не зі злоби, а просто через несспівставну кількість фраз у пошуковій базі російською та іншими мовами.

А тепер найгірша новина.

Передбачений Законом про державну мову переклад головної сторінки сайту на українську та обов’язкова норма про те, що обсяг української версії сайту повинен бути більшим за всі інші, просто завалює в пошуковій видачі всі сайти в доменній зоні .ua і повністю відкриває український сегмент інтернету російській експансії.

Те, що ми бачимо зараз — тільки цвіт, бо ще далеко не всі почали перекладати сайти. У разі спроби тотальної українізації сайтів, українські сайти можна буде шукати, у кращому разі, на 5−6 сторінці пошуку. Принаймні, перші років 10. Коли-небудь Google, звичайно, оптимізує пошуковик під українські запити, але це буде не скоро і далеко не в першу чергу.

ЧИТАТИ ТАКОЖ: Apple и Google не хотят удалять Telegram из своих магазинов приложений

Нічого особистого, просто бізнес. [via nv]