EventsIndexing: различия между версиями
(→3) |
|||
Строка 34: | Строка 34: | ||
History_02.xlsx | History_02.xlsx | ||
+ | |||
+ | [https://chispa1707.livejournal.com/3014051.html?thread=35271331#t35271331 результаты анализа в 1С. Для каждой пары "год-страна" сформировал список индексов. Результат анализа "Поиск ассоциативных правил". Сначала идёт таблица "Часто встречаемые группы". Например: пара индексов уй(евреи) и ит(репрессии) Встречается 412 раза, что составляет 1,97% от общего количества комбинаций "год-страна" (20 935). Следующая таблица в том же файле: "Ассоциативные правила". Для той же пары уй-ит в ней два правила: 1. Если в какой-то стране в каком-то году были репрессии, то с вероятностью 65% рядом встретится индекс уй(евреи)... Результат анализа "Поиск последовательностей". Ищется, какая последовательность индексов повторяется во многих странах. Например: если поставить "Максимальный интервал:2 года", то обнаружится, что в 24-х странах через год после индекса уй(евреи) встречался индекс ио (Миграции,изгнание,высылка,удалил,удаление). https://t.me/historical_statistics] | ||
+ | *https://t.me/historical_statistics | ||
+ | *:Канал создан для упорядочивания записей по загрузке в 1С и статистической обработке таблицы исторических событий, собранной и проиндексированной Андреем Степаненко. | ||
+ | |||
=== [https://plus.google.com/101874328397827004168 Адольф Берг] === | === [https://plus.google.com/101874328397827004168 Адольф Берг] === | ||
[https://plus.google.com/101874328397827004168 Вы вручную решаете задачи кластерного анализа. А современные методы обработки данных, включая вейвлет-анализ, нечеткие логики и т.п. позволят по-новому оценить массив данных. ] | [https://plus.google.com/101874328397827004168 Вы вручную решаете задачи кластерного анализа. А современные методы обработки данных, включая вейвлет-анализ, нечеткие логики и т.п. позволят по-новому оценить массив данных. ] |
Версия 16:24, 21 октября 2018
Содержание
1[править]
#число совпадений - функция от общего числа (белая линия) регионо-событий. Это крайне важно, поскольку хоронит ВСЕ мои предыдущие методы. То есть, именно на них тратить силы бессмысленно: результата не дадут
число совпадений[править]
- https://my-files.ru/qwyi0r Данные позже 1852 года можно и удалить... установить число совпадений разных индексов год в год. Позже можно опробовать и со сдвижкой в 1-5 лет... пять вариантов: индексы типа события в разных сочетаниях с индексами места. "Штаты" - территории учтены до уровня штатов (областей), там, где они указаны. "Регионы" - территории укрупнены до регионов типа "Западная Сибирь", это тоже имеет свой смысл... рабочий файл здесь: https://my-files.ru/em9hqo
- 00 крайняя попытка 2 (Автосохраненный).xlsx: Исходные две колонки на листе "3 столбца". Я их чуток сократил (до 822-1852 лет) и получил таблицу на листе "Основа". Совпадения вывожу на лист 822-1852. Здесь можно сделать и со сдвижкой на любое число лет. Суммирую итог отдельно на нижней строке. Сумму транспонирую и поочередно вывожу либо на лист СВОДНАЯ, либо (если со сдвигом в год) на лист СВОДНАЯ2
- "Суммирую итог отдельно на нижней строке" значит, что за все годы!
число совпадений со сдвигом[править]
подходы[править]
it4history[править]
алгоритм находится здесьEventtypesByYears.cs
результат для сдвига в 1 год : $, a, b, c, a, 0, 1, 0, b, 1, 1, 1, c, 0, 0, 0, результат для сдвига в 2 года: $, a, b, c, a, 1, 0, 1, b, 1, 0, 1, c, 0, 0, 0,
Любкин Сергей[править]
History_02.xlsx
- https://t.me/historical_statistics
- Канал создан для упорядочивания записей по загрузке в 1С и статистической обработке таблицы исторических событий, собранной и проиндексированной Андреем Степаненко.
Адольф Берг[править]
curiousmole[править]
Andrew Po[править]
некоторый файл https://chispa1707.livejournal.com/3011074.html?thread=35237122#t35237122
2[править]
процент совпадений. Например, если индекс столбца всего встречается 100 раз, а с выбранным индексом строки он встретился 14 раз, то частота совпадений именно с этим индексом - 14 %.
3[править]
индексы, на деле, составят несколько групп с высоким процентом совпадений внутри группы и с малым процентом совпадений с индексами из других групп. Число этих групп отразит число разных этапов развития цивилизации.