Обсуждение проекта:Водные объекты/Коллекция ошибок/ГВР

Системные ошибки ГВР

править

Коллеги, я прошу конечно прощения, что влезаю в ваш устоявшийся междусобойчик, но можно полюбопытствовать, каким образом Вы проверяете ГВР? Вручную каждую речку? Сопоставляя данные из ГВР с топокартой? В ГВР есть ряд системных ошибок, позволяющий выделить целые "проблемные" бассейны, если интересно, могу поделиться своими соображениями (Surokk 19:54, 27 января 2013 (UTC))Ответить

Да, вручную. Проставляются координаты и проверяются все аспекты ГВР-местность. К сожалению «проверяют» не всегда опытные участники, из-за чего ошибки остаются. Делитесь, свежий взгляд это полезно. Advisor, 22:48, 27 января 2013 (UTC)Ответить

Самая большая ошибка - отсутствие целых бассейнов из томов изученности, большая часть которых к РФ не относится. То есть в ГВР полностью отсутсвуют российские водотоки, имеющие кода вида 10500хххх и 10620хххх. Реки с кодами 10500хххх - реки Белоруссии и Верхнего Поднепровья, большая часть бассейна белорусские, из речек РФ - верховья Днепра; а с кодами 10620хххх-среднее и нижнее Поднепровье (тут российский бассейн Десны брянской, Сейма). Эти дырки я в ближайшее время закрою, мы свой, альтернативный ГВР разработали, но точно остается проблема с пограничными небольшими реками. Собственно, если бы через недельку (это время на затыкание больших дырок) нашлись бы желающие, которые пройдут по карте, по границе РФ, и проверят наличие водотоков в нашем ГВР, можно было бы получить более полную картину по недостающим рекам. (Surokk 11:06, 28 января 2013 (UTC))Ответить

«Ваш ГВР» это сайт на основе ГИ?--SEA99 12:28, 28 января 2013 (UTC)Ответить

Нет, в основе его лежит ровно тот же информационный массив, который здесь обсуждается, был он скачан с сайта ФАВРа. Просто мы его использовали для создания единой гидрологической базы, вылезло очень большое количество ошибок, которые устранялись системно, а не просмотром карт. Устранялись путем корректировки-добавлением информации из ГИ. (Surokk 13:43, 28 января 2013 (UTC))Ответить

Расскажите немного про неё, про объём дополнительных данных, про то как организована связность внутри базы данных, для каких целей она создаётся и будет ли расширяться. Планируете ли вы её размещать в свободном доступе, как это сделано Zverik'ом, или только для зарегистрированных? --Generous 22:02, 28 января 2013 (UTC)Ответить

Если поподробнее - сайт http://sur-base.ru/water-base/, создаваемая нами гидрологическая база. В основе - ровно тот же информационный массив, что и у Zverik'ома, но с добавлениями. Добавлено более 4 тысяч водных объектов - пропущенные балки (как не крути, но это временные водотоки в большинстве своем, в официальном ГВР их почему-то игнорили), добавлены реки бассейнов Кубани, Днепра, Западной Двины. Данные добавлялись на основе данных справочников ГИ, сейчас начнем по карте причесывать, причем упор больше на приграничные районы - есть мнение, что там самое большое безобразие творится. Так что, глубоко личное мнение, на данный момент наша база http://sur-base.ru/water-base/ наиболее полный перечень российский водотоков. ну а далее на этот списко вешалась определенная гидрологическая информация - данные о постах, о расхода-уровнях, заторах-зажорах, водохранилищный блок сейчас дорабатывается. Какая-то информация в совершенно открытом доступе, какая-то доступна после простейшей регистрации - она нужна, чтобы иметь представление о потребителях нашей информации. Ну вот как-то так, в общих чертах. (Surokk 19:42, 8 февраля 2013 (UTC))Ответить

Реку Нища не нашёл--SEA99 19:56, 8 февраля 2013 (UTC)Ответить
Да, спасибо за подсказку. Тут проблематика следующая - есть 5 и 6 тома ГИ, который включает в себя бассейны рек находящихся и в Белоруссии, Украине, и в РФ. Судя по всему, именно по этой причине, реки из этих тома вообще полностью отсутсвуют в ГВР. Мы несколько крупных водосборов выделили, добавили их - теперь я попробую озадачить людей поиском трансграничных рек. То есть человек будет идти по карте вдоль границы и смотреть наличие/отсутствие рек в базе.Уверен, что таких способом можно определить еще некоторое количество рек, которых сейчас в базе нет (Surokk 21:23, 8 февраля 2013 (UTC))Ответить

В ГВР масса ошибок, самого разного характера, но при правильном использовании источник полезен, в чём-то даже уникален. Для наших задач наиболее чувствительны следующие ошибки и недостатки ГВР (я не думаю, что их в силах решить ваша БД):

  • В некоторых водохозяйственных участках до 99% объектов нужно переименовывать, так как в БД названия очень старые. По моим субъективным оценкам основанным на практике выверки тысяч статей в самых разных регионах в общей сложности около 20-30 % названий даны с ошибками, фактически все названия где есть дефисное написание в названии.
  • Отсутствие привязки реки к конкретному(ым) региону где она протекает. У нас во все заготовки созданные ботом были добавлены регионы на территории которых расположен водохозяйственный участок к которому относится река. К сожалению когда таких регионов больше одного, в статьях проставляется все эти регионы - их приходится удалять, а данные проверять вручную.
  • Встречаются ошибки, когда река полностью протекает по территории соседнего государства. Но даже если она частично протекает по территории соседнего государства - нам это тоже необходимо выверять и дополнять статью.
  • Координаты самих объектов также приходится искать и добавлять вручную, попутно иногда добавляются не просто субъекты федарации, но и районы. Но в этом плане мы уже многое успели сделать. В настоящий момент у нас имеются статьи/заготовки о 24801 реках РФ, в 15561 есть устьевые координаты.

Титаническая конечно работа, но всего в нашей гидрологической базе получается более 150 тысяч водных объектов - и это без озер ряда областей, которых пока в базе нету. Такое вот число речек для ориентира (Surokk 19:48, 8 февраля 2013 (UTC))Ответить

Совокупность ошибок указывает на то, что при создании ГВР копировались старые данные, они толком не проверялись. Зачастую актуальность данных дажене 1960-х годов, а XIX - начало XX века. Это указывает на недостатки допущенные в подготовке ещё самих изданий ГИ.

Есть и другие недостатки ГВР, некоторые из них не связаны с ошибками. Так например они предоставляют лишь часть данных из бывшего ГИ. Нам было бы полезно иметь в открытом доступе данные не только по рекам полностью или частично протекающих по территории РФ, но и все реки из ГИ которые протекает по территории других государств. (но вы добавляете только РФ?).--Generous 22:02, 28 января 2013 (UTC)Ответить

Да, мы занимаемся российскими реками, хотя чисто технологически в базу вполне могли попасть и реки Белоруссии, Украины, Казахстана. (Surokk 19:48, 8 февраля 2013 (UTC))Ответить

Тома ГИ

править

На сколько я понял, у Вас на руках есть собрания томов ГИ? Не могли бы Вы сразу перечислить какие, чтобы мы могли обращаться за подробностями? Advisor, 18:53, 22 января 2013 (UTC)Ответить

Доступ есть ко всем томам Гидрологической изученности. На руках есть тома 2, 8, 10, 11, 14 (части 1,2), 16 (часть 3), 17 (часть 1,2,3,5,7), 18 (часть 1),20 Surokk 19:30, 22 января 2013 (UTC)
Ясно, спасибо. Дискуссию перенёс на СО статьи: Обсуждение:Кормяжка (верхний приток Дёмы). Снимите пожалуйста галочку с «Собственная вики-разметка» в настройках, чтобы отображалась ссылка на Вашу страницу. Advisor, 19:41, 22 января 2013 (UTC)Ответить

Расхождение с изученностью Росгидромета

править

Есть около 500 водотоков (чаще всего - ручьи, каналы), которые в ГВР не попали, в первую очередь из-за своих размеров, менее 10 км они; но на которых велись наблюдения гидометслужбовские, и для целей организации наблюдений эти водотоки также кодировались, по принципу, аналогичному кодированию в ГИ. Информация обо всех постах Росгидрометовских есть на сайте ВНИИГМИ-МЦД, в принципе, представлена она в таком виде, что можно сделать форму, аналогичную представлению данных из ГИ, будет там и название, и длина, единственно - не будет очень нужной информации, куда и где впадает. Собственно, несколько в сомнениях, стоит ли эту информацию в ГИ заносить Surokk 13:05, 12 февраля 2013 (UTC)Ответить