Glosbe: различия между версиями

Содержимое удалено Содержимое добавлено
новое
(нет различий)

Версия от 05:26, 18 марта 2021

Glosbe – универсальная международная кроссплатформенная система для создания онлайн-словарей и переводчиков, работающая как на всех компьютерах, так и в виде мобильного приложения с автономным просмотром на всех смартфонах, независимо от управляющих операционных систем. Это многофункциональный многоязычный словарь и тезаурус (т.е. словарь, в котором указаны семантические отношения между лексическими единицами). Проект запущен двумя друзьями-энтузиастами в 2011 г., штаб-квартира находится в г. Варшава[1].

Файл:Glosbe.jpg
Glosbe

На тот момент эта лингвистическая оболочка показалась нам наиболее предпочтительной из всех имеющихся в данном сегменте продуктов. И что самое отрадное – сервис был необычайно дружественен к любым невлиятельным малоресурсным языкам. В справочной информации Glosbe было указано, что поддерживаются все языки из списка ISO 693-3[2], это более 6000 языков. Поддерживаются как трехбуквенные, так и двухбуквенные языковые коды. Если язык настолько мал и неизвестен, что для него не существует никакого кода обозначения, разработчики Glosbe уверяют, что создадут искусственный код для такого языка, чтобы можно было сразу начать работать.

Согласно данным статистики Alexa, glosbe.com – довольно популярный сайт в мире, стоящий на 2410 месте в глобальном интернет-трафике и вовлечении, уступая, например, Reverso (reverso.net – 291 место), WordReference (wordreference.com – 494 место), Викисловарю (wiktionary.org – 816 место).

Большинство словарей являются моно или двуязычными. Многоязычность же, скажем, позволяет увидеть, как представлено и переведено то или иное башкирское слово во всех тюркских языках. В отличие от толкового словаря, тезаурус позволяет выявить смысл не только с помощью определения, но и посредством соотнесения слова с другими понятиями и их группами, благодаря чему может использоваться для наполнения баз знаний систем искусственного интеллекта.

Словарь Glosbe основывается на коллективном принципе вики, т.е. его редактируют и наполняют волонтёры со всего мира, соединяясь в своего рода социальную сеть. На данный момент сообщество насчитывает около 600 тыс. пользователей. Словарь решает проблему и фиксации новой лексики, т.к. ресурс не только интерактивный, но и открытый, т.е. не законченный, доступный всем желающим для обсуждения, исправлений и дополнений. Материалы являются свободными для использования. Для создания и редактирования данных словаря нужен лишь обычный веб-браузер без каких-либо дополнительных расширений. При этом ни один участник не располагает правом единолично контролировать какую бы то ни было словарную статью. Соответственно, все внесённые правки, в свою очередь, могут быть отредактированы и реструктурированы членами сообщества так, как они сочтут нужным. У каждой лексической единицы доступна история всех правок.

В Glosbe для каждого слова в языке предусмотрена подробная информация или атрибуты, как то: часть речи, определение или значение, таблицы склонений по грамматическим категориям числа, рода и падежа, таблицы спряжение глаголов, ударения, грамматический род, этимология, примеры использования и т.д. Некоторые слова сопровождаются графическими иллюстрациями, получается своего рода свловарь в каринках.

Glosbe-словарь, как и любые бумажные версии словарей, по умолчанию показывает каждое слово в его начальной форме: глаголы в инфинитиве, существительные в единственном числе и т.д. В структуру словарной статьи входят сведения о морфологических, синтаксических и грамматических свойствах слов, о произношении, о семантических свойствах (значение, синонимы, антонимы, гиперонимы, гипонимы), приводятся родственные слова, дается этимология.

Для каждого слова есть не только перевод с полноценной словарной статьей, но и примеры из литературы, примеры и перевод словосочетаний. Это очень удобно, ведь по-настоящему смысловое богатство слова раскрывается только в контексте, к тому же с примерами слова лучше запоминаются.

Здесь не лишним будет отметить, что, отыскав нужное слово в словаре, очень полезно не просто прочитать первое попавшееся значение, а дочитать словарную статью до конца. Это нужно для того, чтобы познакомиться с прямыми и переносными значениями слова, с самыми распространенными фразеологизмами, в состав которых оно входит, а также с примерами типичного употребления. Так запоминание будет направлено не на конкретный перевод, а на представление слова в целом, или, иначе говоря, будет запоминаться не перевод слова, а его значение и «образ»; пользователь будет более свободен от конкретных предложенных словарём переводов. Именно в этом случае будет легче припомнить слово, когда речь будет идти о говорении.

Кроме этого, традиционного, способа представления информации, Glosbe умеет показывать также и более близкие слова и указывает гипертекстовые пути на их значения. Итак, если пользователь сделает ошибку, он сможет, тем не менее, прийти к искомому слову. Например, пользователь, ища «CD-ROM», обнаружит, что слово появляется также в связке со словами: «диск», «компактный», «записывающий».

В Glosbe реализована функция интеллектуального ввода, то есть мгновенная подстановка возможных вариантов в процессе наборе слова, что является весьма мощным и удобным инструментом, упрощающим работу пользователя со словарём и ускоряющим процесс перевода. Сопряжение данной функции с подбором возможных вариантов при орфографической ошибке в наборе слова также весьма важно, поскольку пользователь далеко не всегда бывает уверен в том, как пишется то или иное слово на чужом для него языке.

Словарь содержит большое количество башкирских пословиц и поговорок и русских эквивалентов к ним.

Волонтёры – носители языка постоянно пополняют базу образцами звучания и произношения слов и фраз на башкирском языке. Делать это очень легко с помощью простого встроенного инструмента Pronunciation recorder со смартфона или компьютера при наличии микрофона.

В словаре Glosbe имеется своя память или накопитель переводов или, иначе говоря, база параллельных текстов. По сути, это огромная коллекция переведённых предложений, позволяющая пользователям ознакомиться с всевозможными примерами словоупотреблений.

Этот модуль словаря поможет составить предложения с тем или иным словом. Контекст использования слов полезен и тем, что помогает понять слово, не зная его перевода, развить языковую интуицию.

При нахождении большого количества употреблений, становятся доступны переключатели глубины морфологических совпадений: «Основа» и «Совпадение: все/точно/любой». Например, при поиске по словосочетанию «пологий склон», переключатель «все» в памяти переводов покажет найденные предложения, где встречаются основы обоих слов искомого словосочетания (склонах пологих). Переключатель «точно» покажет предложения с ненарушенным порядком следования слов в искомом словосочетании. Переключатель «любой» покажет те предложения, где есть хотя бы одно слово из искомого словосочетания. Найденные слова и их переводы подсвечиваются цветом внутри текста. Возможности такого поиска могут быть использованы, например, для научных исследований. К слову, в переводчиках от Яндекса и Google нет возможности производить поиск слов по корпусам параллельных текстов. А вот популярный среди переводчиков сайт reverso.net специально создан с этой целью, т.е. для ознакомления с переводами слов именно в контексте. Продукт в основном использует тексты из фильмов, книг и правительственных документов, позволяя пользователю получить перевод, учитывающий особенности языка, а также синонимы и голосовую озвучку.


В Glosbe имеется свой машинный переводчик[3], основанный на нейросети MarianNMT[4] c открытым исходным кодом, разрабатываемой в основном командой Microsoft Translator. Он может переводить тексты как с русского на башкирский, так и в обратном направлении[5]. Если использовать смартфон, то можно попросту надиктовать то, что необходимо перевести. Если зайти с компьютера – можно загружать файлы документов для перевода. Переводчик может быть использован, например, в средствах интеграции программных интерфейсов приложений (API).


В середине декабря 2019 г. разработчики Glosbe внедрили новую технологию. PWA или прогрессивное веб-приложение (англ. Progressive Web Apps) – это веб-технология, которая трансформирует сайт в приложение, гибрид сайта и приложения для мобильных устройств, продукт совместной эволюции мобильного сайта и классического нативного приложения.


В перспективе намечен запуск монокорпусного функционала c возможностью морфологического анализа.


  1. https://ru.glosbe.com/about.
  2. Реестр стандартов Международной организации по стандартизации, связанный со стандартизацией названий языков и языковых групп.
  3. https://translate.glosbe.com/.
  4. https://marian-nmt.github.io/.
  5. https://translator-api.glosbe.com/.