Википедия:Вики-конференция 2007/Программа/Доклады/Колодин М.Ю. Применение гипертекста в научных исследованиях
Колодин М. Ю. Применение гипертекста в научных исследованиях
правитьМихаил Юрьевич Колодин, Санкт-Петербургский институт информатики и автоматизации Российской Академии наук, myke@mail.ru
Аннотация
правитьВ данной работе рассмотрены направления и способы применения гипертекстов в научных исследованиях, их нынешнее состояние и перспективы.
In English
правитьKolodin M.Y. Using hypertext in scientific research.
The paper studies directions and ways of using documents in hypertext formats for scientific research, their current state and perspectives.
Текст
правитьГипертексты могут и должны широко использоваться в науке:
- для планирования и организации работы и исследований,
- для формулирования промежуточных и окончательных результатов,
- для обмена информацией, мнениями, организации обсуждений, рецензирования статей и т. п. между учёными,
- для представления результатов работы в сетевом и печатном виде.
Отметим, что исторически нынешний веб — побочный (инструментальный) продукт научного исследования (Тим Бернерс-Ли в CERNе), что неслучайно, поскольку человеку вообще свойственно организовывать своё мышление как поэтапное преобразование системы взаимосвязанных наборов информации, то есть фактически гипертекстово, точнее, гипермедийно; для науки это тем более актуально.
Туманные перспективы проектов типа SemanticWeb хотя и дают некоторую надежду, но ждать от них практической пользы в ближайшее время, по-видимому, не приходится.
Скорее всего, технологии, основанные на CMS типа Drupal, движках типа MediaWiki, могли бы существенно помочь как в индивидуальной работе, так и в обмене научными знаниями.
Очень важно найти средства для более-менее универсального представления научной информации, с тем, чтобы, единожды введённая, она могла быть многократно и многоформатно используема в разных целях.
Эксперименты, поиски адекватных, в том числе новых, средств продолжаются, но пока что нет единого удобного инструмента или формата.
- Для внутреннего представления универсально хорош и правилен XML,
- для вывода в сети — сейчас и в обозримом будущем будет (X)HTML,
- для печати — PDF, MSO Word, OOO Writer, графика, и т. п.,
- для передачи информации между пользователями (потребителями, конечными пользователями)
- в неизменном виде — PDF,
- а в редактируемом виде — wiki, plain text, MSO Word, OOO Writer, HTML, XML*,
и т. п.
Отдельный вопрос — работа с библиографией. Форматы BibTeX, специальные библиографические форматы для хранения и протоколы для передачи по сети библиографических данных арзного типа хорошо известны, но работы далеки от благополучного завершения, особенно в России.
Проблема современности — авторские права. Для определённых материалов нужно обеспечить неизменность, защиту прав автора и пользователей. предположительно для этого можно пользоваться ЭЦП, контрольными суммами, шифрованием, документами с встроенной защитой.
Ещё один вопрос — представление формульного материала, особенно сложного, с собственными обозначениями, которые в обычной математической работе в ТеХе выполняются с помощью макросов, иногда весьма сложных. Есть проблемы с переносом этого материала в неТеХовскую печать, интернет-представления. Возможным компромиссом было бы (само)ограничение тем подмножеством, которое поддерживается движком MediaWiki, плюс работы по расширению возможностей этого движка.
Представление данных исследований. Исходные, экспериментальные данные: таблицы, графики, цитаты, пр. Решения могут быть различными, но основной вариант — это XML, а также упрощённые табличные форматы, возможно, на основе XML (с шапкой, содержащей описание документа, и блоком данных без многословной XML-разметки).
Оформление научных работ должно быть выполнено в едином стиле, для чего стоит использовать специально разработанные шаблоны, стили, макросы, пр.
Выход работ должен быть направлен на их немедленное нпосредственное применение, в том числе в дальнейших публикациях, а также в производстве, то есть должен быть оформлен в соответствии с обязательными и рекомендательными российскими и международными стандартами. До сих пор в этом направлении сильные провалы, таких стилей, вообще говоря, нет. Несомненно, все государственные стандарты должны быть открыты, бесплатны, представлены в удобных переносимых форматах. На их основе с учётом современных технических возможностей должны быть разработаны преобразователи между форматами с обеспечением соответствия стандартам.
Важнейшая часть гипертекста — установление ссылок между единицами (блоками) текста. В общем случае сслыки (связи) могут быть различного типа, да и сами информационные единицы могут быть не только простыми текстовыми, но иметь структурную и стилевую разметку (оформление, в том числе цвет, шрифтовые и нешрифтовые выделения, в том числе отчерки, примечания на полях, внизу страницы, в конце главы (раздела), в конце документа, пр., автоматически формируемые индексы (справочники, алфавитные и т. п. указатели), и многое другое), графическими изображениями (различного типа), структурными и т. п. диаграммами, видео, звуком, и т. п., таким образом, можно говорить о гипермедиа.
Здесь нужно иметь в виду, что, как правило, современные документы — это согласованные системы из многих вложенных документов, и их преобразования также должны быть согласованными.
Многоязычность создаёт свои проблемы. Нужно найти средства для параллелизации языковых представлений, частичного автоперевода.
Нужно подумать и реализовать средства для коллективной, в том числе как поочерёдной, так и совместной, интерактивной работы многих участников на гипертекстах.
Мета-представление информации — важная составляющая этого процесса. Сейчас можно использовать такой компромисс. Для первичного ввода и ручного редактирования информации можно использовать упрощённые форматы (типа wiki), а для дальнейшего использования полезно переводить полученную информацию в формат XML, с попутной проверкой и корректировкой, а из него получать документы в остальных форматах.
В любом случае именно гипермедийное представление информации будет главным в современной науке, и нужно работать с ним адекватными средствами.