Difference between revisions 74625431 and 78539570 on ruwiki== База данных == Имеется довольно подробная база данных министерства природных ресурсов и экологии Российской Федерации о реках России, в частности подробное описание месторасположения реки. * Пример статьи созданной на основе базы данных — <s>[http://ru.wikipedia.org/w/index.php?title=Московка_(Будуппе)&oldid=29562033 Московка (Будуппе)]</s>, версия2 — [[Московка (Будуппе)]], [[Вика (приток Анграпы)]] (contracted; show full) Что можно считать более верным? [[User:Острог|Острог]] 20:05, 7 октября 2013 (UTC) : Карты. См. [[ПРО:ВОГВР#Расхождения с прочими АИ по истоку, устью и длине]]. При этом следует помнить, что длина и площадь бассейна (не всегда) не будут совпадать с ГВР. [[Обсуждение участника:Мастер теней|Advisor]], 05:23, 8 октября 2013 (UTC) ⏎ ⏎ == [[Проект:Водные объекты/Реки/Россия/Статистика проверки|Статистика проверки]] == А что с ней? С 12 декабря в отключке… --[[User:Andrеs|Andres]] 17:18, 27 декабря 2013 (UTC) : Очевидно это вопрос к ботоводу. А он молчит: [[Обсуждение участника:AeroBot#Проект:Водные объекты/Реки/Россия/Статистика проверки]]. [[Обсуждение участника:Мастер теней|Advisor]], 18:03, 27 декабря 2013 (UTC) : А вообще статистика собиралась левая и смысла в ней нет. [[Обсуждение участника:Мастер теней|Advisor]], 18:28, 27 декабря 2013 (UTC) * К слову, раз уж тема заведена, подниму вопрос снова. Сейчас собираемая статистика абсолютно бесполезна со статистической точки зрения. То есть по факту бот занимается ерундой, красивыми циферками. Объясню: число залитых не является фиксированным к залитым ботом статьям, а непроверенные статьи не является только залитыми. То есть мы имеем общность «Залито», общность «Статьи о реках РФ» и общность «Непроверенные реки»: : текущие отношения: # Реки РФ ## Залитые реки ### Реки РФ с шаблоном водного реестра ## Непроверенные реки ### Реки РФ с шаблоном непроверенности : изначальные отношения: # Реки РФ ## Залитые реки ### Непроверенные реки Вкратце: сейчас любая статья может быть помечена как залитая и любая статья может быть помечена непроверенной. И таких не заливавшихся ботом уже сотни. ;Предложения по коррекции # Считать количество залитых фиксированным. Сейчас количество залитых считается по шаблону, который где-то со статей снимается, а на многих массово проставляется. Это сделает статистику более корректной, но в целом всё равно неточной: общность «Непроверенные реки» не входит в общность «Залитые реки». # Заменить понятие «Число залитых» понятием «Число статей о реках РФ». Таким образом статистика становится полностью корректной, так как все общности («Залитые реки», «Непроверенные реки», «Проверенные реки», «„Ручные“ статьи») входят в общность «Реки РФ». При этом я умалчиваю, что около сотни залитых статей вовсе не реки РФ. [[Обсуждение участника:Мастер теней|Advisor]], 18:28, 27 декабря 2013 (UTC) :: Мне кажется, сейчас нет особого смысла корректировать статистику. Три года эти расхождения мало кого волновали, пусть лучше остаётся как было. Или тогда можно завести список с альтернативной статистикой. --[[User:Andreykor|Andreykor]] 20:31, 27 декабря 2013 (UTC) ::: Ну вот она уже две недели не обновляется. Самое время остановить бота и не гонять впустую. При этом да, лучше либо завести новую страницу либо начать новую таблицу выше текущей. Что до годов, то именно в 2013-м рассинхронизация стала массовой. Новый год лучше начинать с чистого листа. Концепцию «не трогай поломанное, всем пофиг» считаю крайне негативной для проекта. [[Обсуждение участника:Мастер теней|Advisor]], 20:53, 27 декабря 2013 (UTC) <pre> [20:45:55] Generous: [18:18:03] Advisor: а статистика всё равно кривая нисколь не жалко <<< в этом моменте я с тобой не могу согласиться (читал твой комментарий) [20:46:36] Advisor: тогда обоснуй [20:47:08] Advisor: хотя мне абсолютно неясно, как можно собирать статистику по плавающим цифрам [20:47:31] Advisor: ладно бы плавающее число что-то означало [20:47:38] Generous: Любая статистика ложь, но она позволяет оценивать изменения ситуации. Нам нужна была статистика, чтобы наблюдать за продвижением, а продвижение не только в плане доработки статей созданных исключительно ботом. [20:47:57] Advisor: ну так давай возьмём все реки РФ [20:48:22] Advisor: как можно считать исходную массу статей произвольной? [20:48:53] Generous: Всем понятно, что погрешность у той статистики до 10%, но она всё равно позволяет отслеживать примерную скорость нашей работы [20:49:06] Advisor: [20:47:57] Advisor: ну так давай возьмём все реки РФ [20:49:17] Generous: [18:47:57] Advisor: ну так давай возьмём все реки РФ <<< в этом есть свои плюсы и свои минусы. [20:49:20] Advisor: и не будет погрешности вообще [20:49:55] Generous: Будет измерять другое, т. е. ты предлагаешь изменить методологию, а мне и текущая нравится (причём больше чем твоя). [20:50:05] Advisor: ну почти, за исключение залитых иностранных рек [20:50:17] Generous: т. е. измерять можно и от общего количества, но это будет ДРУГАЯ статистика... [20:50:29] Advisor: старая отмерла [20:50:35] Advisor: можно завети новую [20:50:46] Advisor: но вести две смысла уж точно нет [20:50:47] Generous: Лучше продолжить старую и завести новую (для тебя) [20:51:11] Advisor: зачем? Для старой погрешность всё увеличивается [20:51:46] Generous: В оценке от общего количества рек есть свои недостатки, так как статистика бинарная, а статьи очень разные. [20:51:50] Advisor: да и лично мне она не нужна [20:52:01] Generous: а нам нужна... [20:52:30] Generous: этому нашему спору как я помню уже более двух лет (где-то на СО шаблона была обсуждение...) [20:52:43] Advisor: месяца два всего [20:52:52] Generous: [18:51:11] Advisor: зачем? Для старой погрешность всё увеличивается <<< Я не считаю, что это погрешность. [20:54:24] Advisor: а то что "число залитых" постоянно меняется? [20:54:37] Advisor: при этом выверенные идут в одну сторону [20:54:42] Advisor: чаще [20:55:29] Advisor: получается что выверяют в процентах больше чем выверяется реально [20:55:55] Advisor: и даже каждая новая статья (свеженаписанная) считается за выверенную [20:58:05] Generous: Вот берёт кто-то и создаёт статью пропущенную ботом, но не выверяет её, или выверяет, но по формату она ничем не отличается от ботостатьи. С моей точки зрения, такая статья должна учитываться наравне с ботостатьями, так как её создание является следствием нашей работы по доработке этих статей. А ты предлагаешь уравнять Волгу с любой другой статьёй. Если бы, эта статистика была более развёрнутой (в ней было бы несколько типов учёта: по размерам статьи, по размеру реки и т. п.) такая статистика не смешивало бы тёплое с мягким. А так, учёт от общего количества даже ухудшает ситуацию — необоснованно завысит процент проверенных статей, увеличит общее количество статей и т. п. Такая статистика будет измерять совсем не то, что мы измеряли ранее. [20:58:40] Generous: [18:55:55] Advisor: и даже каждая новая статья (свеженаписанная) считается за выверенную <<< Про это никто не говорит. [20:59:16] Generous: Она входит в статистику только в том случае если в статье задействован соответствующий шаблон, а обычные авторы, не связанные с нашей работой, используют их редко. [20:59:32] Advisor: вообще-то Андрес насоздавал сотни статей (выверенных) с плашкой реестра [21:00:14] Advisor: "не связанне с нашей работой используют их редко." — о, да ты редко просматриваешь новые статьи [21:00:28] Generous: Т. е. это просто методологический спор. Мы измеряли одну работу, а ты хочешь измерять другую. Оба типа измерения имеют право на существования, но у каждого из них есть свои недостатки и погрешности. [21:00:30] Advisor: даже в объёмные статьи эту штуку тыкают [21:01:36] Generous: [18:59:32] Advisor: вообще-то Андрес насоздавал сотни статей (выверенных) с плашкой реестра <<< читай выше: [18:58:05] Generous: , так как её создание является следствием нашей работы по доработке этих статей. <<< [21:01:52] Generous: [19:00:14] Advisor: — о, да ты редко просматриваешь новые статьи <<< Мне лучше знать :) [21:02:01] Advisor: он об этом говорил? [21:02:27] Advisor: не видел там навшаблонов реестра [21:02:40] Generous: [19:00:30] Advisor: даже в объёмные статьи эту штуку тыкают <<< Сам иногда тыкаю и считаю, что ВСЕ статьи потом должны содержать этот шаблон, но это тоже РАБОТА. [21:03:04] Advisor: вот, а я их удалял [21:03:14] Advisor: где текст был нормальный [21:03:19] Generous: С какой стати? [21:03:24] Advisor: а зачем оно? [21:03:33] Generous: а ты про какой шаблон? [21:03:41] Generous: (их 3...) [21:03:46] Advisor: {{водный реестр}} [21:03:56] Advisor: текстом который [21:04:33] Generous: [19:03:23] Advisor: а зачем оно? <<< Он свидетельствует о выверенности исходных параметров. [21:04:46] Advisor: нигде это не сказано [21:04:52] Generous: Сколько ошибок выявили в старых реках.... [21:05:06] Advisor: я тебя спрашал, ты ответил, что для соблюдения лицензии в ботостабах [21:05:08] Generous: [19:04:46] Advisor: нигде это не сказано <<< Нигде не сказано, что этот шаблон нужно удалять [21:05:26] Advisor: ВП:ПС [21:05:32] Generous: Это основная его функция [21:05:38] Advisor: [21:05:06] Advisor: я тебя спрашал, ты ответил, что для соблюдения лицензии в ботостабах [21:05:54] Advisor: значит если не ботостаб, то и не нужен [21:06:06] Generous: Но если в ручную статью добавляется информация из реестра (коды, бассейны, или параметры из ГВР) - шаблон не будет лишним. [21:06:10] Advisor: и вообще для этого есть сноски [21:06:25] Generous: Ну сноски я ставлю :) [21:06:32] Advisor: и я тебе даже говорил, что его удаляю [21:06:52] Generous: Правда не там где тебе это нравится, т. е. после км, а не после цифр (по ГОСТу) [21:06:59] Advisor: так а зачем помимо сноски ещё и плашка? [21:07:08] Generous: Хотя мне самому не нравится как этот отображается после площади :( [21:07:26] Generous: [19:06:59] Advisor: так а зачем помимо сноски ещё и плашка? <<< А чем она тебе мешает? [21:07:40] Generous: [19:06:06] Generous: добавляется информация из реестра (коды, бассейны, или параметры из ГВР) <<< [21:07:47] Advisor: тем более, что плашка нифига не подтверждает выверенность, т.к. в ГВР сотни ошибок [21:08:38] Advisor: <<< А чем она тебе мешает? визуально, к примеру, как и прочие плашки [21:09:05] Advisor: ещё бездумностью тыкания [21:09:59] Generous: Но вообще мне больше нравится идея измерения не по шаблону Водный реестр, а по шаблону Водный реестр России [21:10:18] Generous: [19:08:37] Advisor: визуально <<< Вкусовщина -> лесом [21:10:25] Advisor: по нему — согласен [21:10:31] Generous: [19:09:05] Advisor: ещё бездумностью тыкания <<< Такающему виднее. [21:11:05] Advisor: Отползай тыкал, я убрал как бесполезный, он сказал "лады" <..> [21:26:00] Advisor: так статистику на "Водный реестр России" меняем? [21:26:21] Advisor: а то так и не отпишешься [21:26:35] Generous: а я про это уже где-то на СО писал [21:26:39] Generous: (давно ещё) [21:26:43] Advisor: не видел [21:26:53] Advisor: здесь напиши, я опубликую [21:27:01] Generous: Вопрос в том, какой ботовод вообще этим может заниматься [21:27:11] Advisor: это не вопрос [21:27:24] Advisor: это задание для РДБ :) [21:28:36] Generous: А вообще... нужно посмотреть какое количество статей с шаблоном Водный реестр и без Водного реестра России (Может их совместить и удалить первый?) [21:28:49] Advisor: грохнуть, да [21:28:54] Advisor: поддерживаю [21:29:24] Generous: Только нужно подумать, как и куда выводить эту информацию... [21:33:46] Advisor: Водный реестр — 21381 Водный реестр России — 22370 [21:37:59] Generous: это Алекс :) [21:39:46] Advisor: ты уж скажи что-нибудь, подрядим бота на статистику, а то время идёт <...> [21:47:03] Advisor: так ты согласен? [21:47:13] Generous: с чем? [21:47:28] Advisor: с менянием шаблона [21:47:37] Generous: если я его предложил... [21:47:54] Advisor: хорошо, тогда публикую в проекте </pre> Вкратце: [[user:Generous|Generous]] и я договорились о статистике по шаблону {{tl|Водный реестр России}}. Полагаю его включения достаточно точной сущностью.{{кс}}Также прозвучало предложение удалить {{tl|Водный реестр}} в пользу {{tl|Водный реестр России}} как ныне устаревший. [[Обсуждение участника:Мастер теней|Advisor]], 19:07, 7 января 2014 (UTC) <blockquote>В таком подсчёте есть некоторые недостатки, но считать то нужно. {{tl|Водный реестр}} — не самый полезный и показательный шаблон, возможно стоит попробовать с шаблоном {{tl|Водный реестр России}}. По моим наблюдениеям, его чаще заполняют и добавляют в новые/старые статьи (после их переработки), да и смысла в нём больше.--[[User:Generous|Generous]] 21:08, 28 октября 2013 (UTC)</blockquote> Хорошая новость: статистику починили в прежнем виде. Моя оценка полезности и точности текущей статистики отличается от мнения высказанного {{u|Advisor}}'ом. На мой взгляд расхождение носят методологический характер. Я считаю, что базовое количество «Число залитых» — должно меняться динамически (как это делается сейчас), причём как в меньшую, так и в большую сторону, ниже попробую обосновать это утверждение.{{кс}}Статистика, это инструмент косвенно измеряющий активность проекта по доработке однотипных статей, старт которым положили заливки, но на этом создание аналогичных статей не прекратилось полностью. В процессе выверки и доработки, многие участники по образу и подобию создают статьи, которые были пропущены ботом (как парвило, бот не мог выбрать название для статьи). Некоторые участники вне рамок выверки статей, создают статьи по качеству аналогичные заливке или даже хуже, такие статьи так же требуют внимания опытных участников, и последующей выверки (сейчас обсуждается вопрос по установке на них шаблона {{tl|Непроверенная река}}). Но это касалось роста числа статей, а помимо этого, ещё сотни статей из заливки были удалены или заменены на редиректы (дубли существующих статей). Таким образом, число статей по которым ведётся работа, может как рости, так и снижаться, главное что такие статьи объединяет, это работа участников, а именно её мы и пытаемся измерить. И здесь не важно, кто подкинул нам эту работу — участник или бот. {{кс}}Я не говорю, что статистика которую предлагает Advisor не нужна — просто она другая, а ценность статистики именно в длительности её сбора. Если пытаться измерять работу от общего количества статей о реках России, это будет не совсем верно. Хотя в рамках доработки заливки, дорабатываются по общему стандарту и крупные реки, зачастую исправляются существенные ошибки, но такие статьи как [[Волга]], [[Кама]], [[Лена]] — существовали независимо от заливки, включать их «в базу» можно только после существенной доработки. {{кс}} Вместе с тем, я считаю было бы правильно вести учёт от количества использований шаблонов {{tl|Водный реестр России}}, как более информативного, а не от {{tl|Водный реестр}} (как сейчас).--[[User:Generous|Generous]] 15:02, 8 января 2014 (UTC) === Итог === За смену статистики аргументированно высказались два участника проекта. Возражения поступили от одного, однако должным образом аргументированы не были. Сбор статистики меняется с шаблона {{tl|Водный реестр}} в пользу шаблона {{tl|Водный реестр России}}. [[Обсуждение участника:Мастер теней|Advisor]], 20:38, 19 января 2014 (UTC) <blockquote>В таком подсчёте есть некоторые недостатки, но считать то нужно. {{tl|Водный реестр}} — не самый полезный и показательный шаблон, возможно стоит попробовать с шаблоном {{tl|Водный реестр России}}. По моим наблюдениеям, его чаще заполняют и добавляют в новые/старые статьи (после их переработки), да и смысла в нём больше.--[[User:Generous|Generous]] 21:08, 28 октября 2013 (UTC)</blockquote> * Настроил бота. --[[User:Emaus|Emaus]] 21:06, 20 января 2014 (UTC) :: Спасибо. О какая погрешность была, почти тысяча статей, а сколько ещё не учитывается… [[Обсуждение участника:Мастер теней|Advisor]], 17:16, 21 января 2014 (UTC) All content in the above text box is licensed under the Creative Commons Attribution-ShareAlike license Version 4 and was originally sourced from https://ru.wikipedia.org/w/index.php?diff=prev&oldid=78539570.
![]() ![]() This site is not affiliated with or endorsed in any way by the Wikimedia Foundation or any of its affiliates. In fact, we fucking despise them.
|