Обсуждение:Суффиксный автомат

Последнее сообщение: 3 года назад от Adamant.pwn в теме «DAWG в преамбуле»

Рецензирование статьи Суффиксный автомат править

Здесь находятся завершившиеся обсуждения. Просьба не вносить изменений.

Начал писать летом, да немного заглохло. В общем, планирую рано или поздно довести до ИС, так что выставляю на рецензирование. Думаю, ещё буду понемногу расширять, но основная работа уже сделана и обратная связь была бы полезной. Буду благодарен любым замечаниям и предложениям. adamant.pwn — contrib/talk 18:00, 15 декабря 2019 (UTC)Ответить

  •   Комментарий: был впервые описан Блумером и  — принято перед фамилией персонажа в тексте ставить имя или инициалы. Это всей статьи касается.— Зануда 10:55, 11 февраля 2020 (UTC)Ответить
    • Здесь ведь имеется в виду только первое вхождение фамилии? Или при каждом упоминании? adamant.pwncontrib/talk 21:06, 11 февраля 2020 (UTC)Ответить
      • Думаю, при каждом упоминании. Как-то невежливо людей только по фамилии называть. Зануда 05:57, 12 февраля 2020 (UTC)Ответить
        • Это несколько странное утверждение. Я сейчас прошёлся по нескольким биографическим статьям и в каждой обнаружил, что с какого-то момента предмет статьи называют просто по фамилии. У вас есть примеры статей, где этого не происходит и, желательно, какое-нибудь правило, которое это регулирует? adamant.pwncontrib/talk 06:10, 12 февраля 2020 (UTC)Ответить
  •   Комментарий: Блумер и др., В 2001 г. Иненага и др. — в тексте смотрится ужасно. Вы уверены, что нужно сокращать? — Зануда 10:55, 11 февраля 2020 (UTC)Ответить
    • Это перевод традиционного в науке «Blumer et al», «Inenaga et al» и т.д. Я думаю, что в этом контексте можно перевести как «Блумер с соавторами показали, что...» (чтоб постоянно «другие» не повторялись), если там что-то значительное то «Коллектив исследователей во главе с Иненагой разработал...» [конечно, в том случае если есть некоторые основания полагать, что он действительно руководитель, а не просто первый по алфавиту]. В крайнем случае, можно просто перечислить авторов. Swarrel (обс.) 21:14, 22 марта 2020 (UTC)Ответить
  •   Комментарий: Сноски нужно изменить. Параметр, вызывающий источник, (фамилии авторов) должен быть написан, как в источнике, на языке источника. Аналогично и параметр "пояснение"/"loc". — Зануда 10:55, 11 февраля 2020 (UTC)Ответить

В целом замечания лишь по оформлению. Текст вопросов не вызывает.— Зануда 10:55, 11 февраля 2020 (UTC)Ответить

  • Вроде бы всё поправил, спасибо. adamant.pwncontrib/talk 21:27, 11 февраля 2020 (UTC)Ответить
    • Я думаю, что можно закрывать рецензию и выставлять КХС/КИС. Рецензирование само-по себе мало активно, наверное вы это поняли. Номинируйте, на номинации вам отрецензируют. Я обычно (если планирую ещё расширять но не сейчас) номинирую на КХС. Там статью шлифую по ЦУ/ЦС коллег, а потом можно и до ИС доводить. Зануда 08:16, 12 февраля 2020 (UTC)Ответить

Итог править

Закрываю рецензию и номинирую (пока) на статус ХС. Большое спасибо всем отметившимся! adamant.pwncontrib/talk 16:26, 6 апреля 2020 (UTC)Ответить

DAWG в преамбуле править

@Derise: термин «directed acyclic word graph», как и DAWG, CDAWG, SDAWG, etc в подавляющем большинстве случаев относится именно к суффиксному автомату, а не к DAFSA. Более того, в англоязычных академических источниках это, по всей видимости, даже более распространённое название, чем, собственно, «suffix automaton» (не мудрено, его Blumer и др. именно как DAWG назвали в своей исходной работе), поэтому я считаю очень важным его указать. Я не против уточнить про DAFSA, но тогда хотелось бы:

  1. Перевод DAFSA на русский. Детерминированный ациклический конечный автомат?
  2. Источники на то, что по отношению к DAFSA применяют термин directed acyclic word graph. Хотя на enwiki это утверждается, я не смог найти подтверждения в АИ. Если их нет, то я бы вписал термин без разрешения неоднозначности.

adamant.pwn — contrib/talk 22:18, 16 сентября 2020 (UTC)Ответить

  • @adamant.pwn: перевод такой, да. Изначально предлагалось убрать вообще все переводы из статьи, потому что «суффиксный автомат» — вполне самостоятельная единица, не требующая никаких уточнений для пользователя русскоязычной Википедии. «Suffix automaton» является буквальным переводом и в русскоязычной статье не обязателен, а DAWG, скорее всего, будет только путать читателей. Впрочем, настаивать по этой части не буду. По поводу разночтений. DAWG является синонимом DAFSA в прикладных задачах, связанных с работой со словарями. Для примера можно посмотреть эту статью. Кроме того, ряд библиотек, работающих со словарями с использованием DAFSA, называются соответствующим образом. Derise (обс.) 01:46, 17 сентября 2020 (UTC)Ответить

Расплывчатость термина «СуФфиксный автомат» править

Из преамбулы — «обработчик подстроки»; из определения формальной лингвистики — «суффикс» конец строки, «префикс» — начало строки, поэтому сразу не совсем ясно, может ли этот автомат обрабатывать произвольную подсроку, это надо бы указать в преамбуле, и полезно определение суффикса, префикса, подстроки внести в раздел «Обозначения». Также в начале неплохо было бы привести пример обработки конкретной строки. Д.Ильин (обс.) 19:03, 17 сентября 2020 (UTC).Ответить

  • @Д.Ильин: Но ведь в разделе «обозначения» есть определения суффикса, префикса и подстроки… А ещё в преамбуле нет слова «обработчик», так что я вообще не вполне понимаю ваш вопрос. Суффиксный автомат позволяет обрабатывать некоторую информацию про подстроки — например, число различных подстрок, число вхождений некоторой конкретной подстроки в строку, etc. adamant.pwncontrib/talk 16:09, 18 сентября 2020 (UTC)Ответить