Обсуждение:Выявление плагиата

Последнее сообщение: 11 лет назад от AKA MBG в теме «Рецензирование»

Иллюстрация «методы выявления плагиата» править

 
Методы выявления плагиата (перевод)
 
Plagiarism detection (оригинал)

Замечания к иллюстрации. Мои пожелания к переводу:

  • 'local similarity assessment' = 'оценка локального сходства';
    • соответственно по аналогии будет 'оценка сходства в целом' для 'global similarity assessment';
  • "дактилоскопирование"?, если проще, то "дактилоскопия";
  • 'term occurence analysis' = 'анализ встречаемости термина' (не 'возникновения');
  • 'substring matching' = "соответствие подстроки" ("подстроковое" - не надо);

Чтобы не было грязного муара вокруг букв - сохраняйте изображение в PNG, а не сильно пожатый JPEG.

P.S. Если вы не против, то я указал здесь, что работа основана на иллюстрации File:PDS Classification.png.

Чтобы загрузить исправленную версию картинки - идите на страницу cвоего рисунка [1], нажмите внизу страницу ссылку "Upload a new version of this file" и зааплоадьте новую версию.

Если будут вопросы - пишите здесь или на моей странице обсуждения. Удачи! -- Andrew Krizhanovsky 19:23, 9 октября 2012 (UTC)Ответить

Вопрос по обновлению файла править

Андрей Анатольевич, я исправила схему и пытаюсь ее загрузить. но у меня не получается(

Выдает ошибку "File extension ".jpeg" does not match the detected MIME type of the file (image/png)." я не очень понимаю, в чем проблема.

Когда я начала обновлять файл поле "Destination filename:" уже было заполнено - "Методы_выявления_плагиата.jpeg" , и я не могу исправить на расширение png.

Эту ошибку мне выдает не зависимо от того, какой файл с каким расширением пытаюсь загрузить! Что можно с этим сделать?

Заранее спасибо!)

Вероятно, нельзя загрузить PNG файл, если в первый раз загружали JPEG. Варианты:
  1. сделать новую страницу на Викискладе, т.е. загрузить иллюстрацию заново, но уже PNG;
  2. либо загрузить новую версию JPEG, но не делать сильное сжатие, т.е. оставить качество получше.
P.S. Чтобы подписать своё сообщение, используйте четыре тильды (~~~~) -- Andrew Krizhanovsky 20:31, 9 октября 2012 (UTC)Ответить

Ещё небольшое замечание. Вместо "Анализ сумки слов" поставьте 'Анализ "bag of words"', как-то получше звучит. -- Andrew Krizhanovsky 20:56, 9 октября 2012 (UTC)Ответить

Спасибо, создала новую страничку на Викискладе, надеюсь, все верно. Grishenkova Alena 21:25, 9 октября 2012 (UTC)Ответить

Отлично! Напишите с большой буквы "выявления плагиата, основанное на цитировании", обновите рисунок и это задание будет готово. Ура :) -- Andrew Krizhanovsky 12:12, 10 октября 2012 (UTC)Ответить

Исправила!) Grishenkova Alena 20:49, 10 октября 2012 (UTC)Ответить

Отлично! Задание с добавлением иллюстрации засчитано. -- Andrew Krizhanovsky 11:37, 11 октября 2012 (UTC)Ответить

Ссылки править

Похоже, что я сделала ссылки на литературу в черновик своей статьи. Посмотрите пожалуйста!

И еще я хотела уточнить, на паре Вы показывали последнее задание на примере моей картинки. Мне надо что-то делать по 5 заданию??у меня у картинки есть категории) Grishenkova Alena 22:01, 15 октября 2012 (UTC)Ответить

Ссылки оформлены правильно, молодец Алёна :)
Да, категории у иллюстраций уже проставлены, вам этого делать не надо. Задание выполнено.
Добавьте в свою статью - мою картинку из примера. Что ж я её зря рисовал?
Прошу отвечать о выполненом задании на моей странице обсуждения: Обсуждение участника:AKA MBG. -- Andrew Krizhanovsky 10:19, 17 октября 2012 (UTC)Ответить

Определение плагиата (преамбула) править

Андрей Анатольевич, я не нашла никакого определения "обнаружения плагиата". То определение, которое я давала на паре, было взято из статьи Википедии "Plagiarism detection". Но, как я понимаю, нельзя ссылаться на эту статью, а надо брать какую-то научную работу, правильно? Grishenkova Alena 22:06, 21 октября 2012 (UTC)Ответить

Думаю, что необходимо два определения:
  1. что такое плагиат?
  2. что такое - его обнаружение?
1) Определения для плагиата есть в статьях, которые указаны в вашем списке литературы:
  1. целый спектр определений есть в разделе "The unbearable vagueness of plagiarism" в статье [2]
  2. раздел "What is plagiarism?" в статье [3]

Выберите функциональные определения, т.е. такие, которые позволяют действительно определить, что это плагиат или нет. Определений типа "Плагиат - это грех и преступление", т.е. эмоций, не нужно - не функционально.

2) Совершенно верно, Алёна, Википедия не является авторитертным источником для себя самой. Однако разумно было бы использовать литературу, на которую ссылаются в английской статье ВП "Plagiarism detection". В частности, в статье "Plagiarism Analysis, Authorship Identification, and Near-Duplicate Detection" даётся определение для "Анализа плагиата" (что равно "Определению плагиата").
Из последней статьи также следует, что вам необходимо упомянуть в своей статье о родственной проблеме обнаружении "почти дубликатов" (Near-duplicate detection), конечно, со ссылкой на статью, откуды вы берёте информацию. -- Andrew Krizhanovsky 06:01, 22 октября 2012 (UTC)Ответить

Почему-то как раз ссылка (из Примечаний) с определения "определения плагиата" (Benno S., 2011) и не работает!?.. -- Andrew Krizhanovsky 16:37, 30 октября 2012 (UTC)Ответить

Обзор существующих систем править

Сейчас вместо раздела "Обзор существующих систем" с обсуждением этих систем, с указанием на достоинства и недостатки систем, со сравнением этих систем друг с другом (всё это было в какой-то мере в докладе)... вместо всего этого счастья есть только сухое перечисление систем. Недостаточно. -- Andrew Krizhanovsky 06:28, 14 ноября 2012 (UTC)Ответить

  • Использовать двоеточие для отступа в названиях систем - идея понравилась :)
  • Вы викифицировали текст "[[Критерий|критериями]]". Прочитал эту статью "Критерий". Её чтение действительно что-то добавляет к пониманию вашей статьи? Кажется, это чрезмерная викификация.
  • Зачем использовать шаблон {{нп3}} для ссылки на статью en:Suffix tree, если интервики в статье en:Suffix tree ясно показывают, что уже есть статья в рувики и она называется Суффиксное дерево. Напомните мне, пожалуйста, на лекции, мы ещё раз разберём ВП:интервики, с чем их едят и для чего они, и как ими пользоваться.
  • Поставьте ссылку со слов "сопоставление подстроки" на статью Поиск подстроки, если вы именно об этом говорите.
  • Прочие замечания по статье вручу на лекции. До встречи! Не болейте. -- Andrew Krizhanovsky 19:11, 26 ноября 2012 (UTC)Ответить

Рецензирование править

По данной работе имеется ряд предложений для её улучшения.

  1. Сразу хочется попросить сделать ссылки на все сервисы по выявлению плагиата. Ссылки на них можно сделать прямо в статье при упоминании сервиса, и/или добавить в конец статьи в раздел ссылки. А то ведь интересно попробовать, что они покажут хотя бы на моих горе-курсачах :).
  2. Мне кажется, что как и перечисление сервисов, так и перечисление методов лучше выделить в подразделы (с тремя "="), ввиду того, что некоторые могут получиться достаточно большими, а в будущем может быть и все, а подобное разделение позволит легко редактировать содержание.
  3. Неплохо было бы сделать в статье Плагиат раздел про определение плагиата, и кратко дать инфу об этом с ссылкой на эту страницу. Мне кажется это там было бы к месту.

--Ageev Andrew 22:43, 1 декабря 2012 (UTC)Ответить

  1. Добавила ссылки на каждый сервис, спасибо, отличная идея*)
  2. Посмотрела, как будет выглядеть, если все перечисления (методов и сервисов) выделить в подразделы. Честно говоря, мне совсем не понравилось, тк сейчас их не так много и все выглядит как-то нагружено!
  3. Как только закончу с этой статьей, можно будет добавить подраздел в статье Плагиат. Пока что я просто там сделала ссылку на свою статью)

Grishenkova Alena 13:29, 16 декабря 2012 (UTC)Ответить

Прекрасно. Тогда ждём подраздела в статье Плагиат. -- Andrew Krizhanovsky 19:09, 16 декабря 2012 (UTC)Ответить

Дактилоскопия vs. Стилометрия править

Алёна, меня очень интересует вопрос "Дактилоскопии" в вашей статье.

  1. С этого слова (точнее со следующего предложения) идёт ссылка номер 8 на "Brin S., 2001, pp. 36-41"
  2. C этого "Brin S." меня перекидывает на "Brin S., Davis J., Garcia-Molina H. Plagiarism issues for higher education (англ.) // Vine.. — 2001."
  3. И по последней ссылки с этого Брина я попадаю сюда: [4] (Руководство "Как хорошо писать эссе").

В этом руководстве ни про какого Брина и слыхом не слыхивали и уж точно ничего нет про дактилоскопию, которая нас с вами сейчас интересует. Поэтому большая просьба, проверьте, пожалуйста, 18 ссылок в разделе "Литература" в вашей статье и убедитесь, что название книги или статьи соответствует тому направлению, куда вы посылаете читателя :)

Анализ текстов на основе последовательности частей речи (статья, что я вам дал) - скорее, относится к одному из видов Стилометрии. Кстати, почему вы ссылаетесь на английский вариант статьи "Стилометрии", если есть русский? Думаю, в раздел со стилометрией добавить описание этого алгоритма с частями речи.

Уточните - на какие системы вы затрудняетесь поставить ссылки? -- Andrew Krizhanovsky 11:47, 9 декабря 2012 (UTC)Ответить

Литературу проверила и исправила)

Хорошо, спасибо!)

Теперь только на программу Praide Unique Content Analyser. И еще я не могу найти в английской википедии статьи про шинглы.( Grishenkova Alena 12:54, 9 декабря 2012 (UTC)Ответить

Praide Unique Content Analyser там: [5].
Ссылка на шинглы есть в списке тем: Участник:AKA MBG/Todo2012: w:w-shingling.
Просьба — оформлять внешние ссылки через шаблон «ref», например так.[1]Andrew Krizhanovsky 16:07, 9 декабря 2012 (UTC)Ответить

Примечания править