Сбор и обработка данных

Комплексы данных в Электронном архиве Российской исторической статистики собраны из опубликованных и неопубликованных источников, доступных в библиотеках и архивах Москвы и Санкт-Петербурга. Сведения представлены в региональной разбивке: по областям, губерниям, автономным республикам и т.д.

Метаданные для каждой цифры в базе данных включают дескрипторы, указывающие на источник данных, год и регион, к которым относится соответствующая цифра, ее единицу измерения, а также тематические категории.

Тематические дескрипторы включают две группы: в полях HISTCLASS приводятся оригинальные категории источника, минимально стандартизированные и унифицированные ((только там, где необходимо, исключили вариацию в орфографии, синтаксисе и последовательности категорий). В полях CLASS приводится стандартизированный набор дескрипторов, основанных на современных системах классификаций статистических данных.

Дескрипторы регионов содержат исторические названия регионов, а также код соответствующего региона из списка, доступного на этой странице. Все наборы данных содержат все имеющиеся регионы на соответствующий временной срез. В тех случаях, когда сведения для того или другого региона недоступны, в поле VALUE приводится ".", указывающая на отсутствие данных. Пометка "0", наоборот, соответствует цифровому значению "ноль".

Дескрипторы для указания года, источника и единицы измерения не требуют особых дополнительных комментариев.

База данных не содержит суммы или подсуммы - данные предcтавлены исключительно на самой низкой степени агрегации. Где возможно, перечисляются все составные категории, необходимые для исчисления тех или иных сумм или подсумм, даже если сами данные отсутствуют. Данный подход позволяет пользователям дополнять имеющиеся данные информацией, доступной только им, и исчислять региональные, национальные или тематические (под)суммы самостоятельно.