EventsIndexing: различия между версиями
(→1) |
(→1) |
||
Строка 11: | Строка 11: | ||
== число совпадений со сдвигом == | == число совпадений со сдвигом == | ||
[https://chispa1707.livejournal.com/3010636.html есть у меня в Экселе табличка: 1-й столбец - год 2-й столбец - двухбуквенный индекс места события 3-й столбец - двухбуквенный индекс типа события ... Первая задача. Требуется выяснить, например, как часто разные события встречаются в одном и том же году году... на пересечении в ячейке - цифра, говорящая, сколько раз индекс столбца встретился в одном году с индексом строки... для тех же 879 индексов сверяем совпадения со сдвигом в год, два, три, четыре и пять. ] | [https://chispa1707.livejournal.com/3010636.html есть у меня в Экселе табличка: 1-й столбец - год 2-й столбец - двухбуквенный индекс места события 3-й столбец - двухбуквенный индекс типа события ... Первая задача. Требуется выяснить, например, как часто разные события встречаются в одном и том же году году... на пересечении в ячейке - цифра, говорящая, сколько раз индекс столбца встретился в одном году с индексом строки... для тех же 879 индексов сверяем совпадения со сдвигом в год, два, три, четыре и пять. ] | ||
− | == | + | == подходы == |
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
=== [[it4history]] === | === [[it4history]] === | ||
[https://chispa1707.livejournal.com/3011074.html?thread=35245058#t35245058 алгоритм находится здесь] {{github|it4history/reconstruction/tree/master/Excel/EventsIndexing/EventtypesByYears.cs}} | [https://chispa1707.livejournal.com/3011074.html?thread=35245058#t35245058 алгоритм находится здесь] {{github|it4history/reconstruction/tree/master/Excel/EventsIndexing/EventtypesByYears.cs}} | ||
Строка 41: | Строка 29: | ||
b, 1, 0, 1, | b, 1, 0, 1, | ||
c, 0, 0, 0,</pre> | c, 0, 0, 0,</pre> | ||
+ | |||
+ | === [[Любкин Сергей]] === | ||
+ | [https://chispa1707.livejournal.com/3010636.html?thread=35242316#t35242316 отчёт, выводящий для каждой пары индексов: - количество годов, в которых они встречаются оба (как у Вас в первом варианте); - количество событий в этих годах, в которых есть индекс строки; - количество событий в этих годах, в которых есть индекс столбца.] | ||
+ | |||
+ | History_02.xlsx | ||
+ | === [https://plus.google.com/101874328397827004168 Адольф Берг] === | ||
+ | [https://plus.google.com/101874328397827004168 Вы вручную решаете задачи кластерного анализа. А современные методы обработки данных, включая вейвлет-анализ, нечеткие логики и т.п. позволят по-новому оценить массив данных. ] | ||
+ | === [[curiousmole]] === | ||
+ | [https://chispa1707.livejournal.com/3011074.html?thread=35236610#t35236610 29548 строк на 873 колонки] | ||
+ | |||
+ | [https://chispa1707.livejournal.com/3011397.html?thread=35248197#t35248197 Это называется граф. В принципе, строится и в экселе (не пробовал)... вообще, пишут, что задача кластеризации очень субъективна.] | ||
+ | === Andrew Po === | ||
+ | некоторый файл https://chispa1707.livejournal.com/3011074.html?thread=35237122#t35237122 | ||
= 2 = | = 2 = |
Версия 11:32, 20 октября 2018
Содержание
1[править]
#число совпадений - функция от общего числа (белая линия) регионо-событий. Это крайне важно, поскольку хоронит ВСЕ мои предыдущие методы. То есть, именно на них тратить силы бессмысленно: результата не дадут
число совпадений[править]
- https://my-files.ru/qwyi0r Данные позже 1852 года можно и удалить... установить число совпадений разных индексов год в год. Позже можно опробовать и со сдвижкой в 1-5 лет... пять вариантов: индексы типа события в разных сочетаниях с индексами места. "Штаты" - территории учтены до уровня штатов (областей), там, где они указаны. "Регионы" - территории укрупнены до регионов типа "Западная Сибирь", это тоже имеет свой смысл... рабочий файл здесь: https://my-files.ru/em9hqo
- 00 крайняя попытка 2 (Автосохраненный).xlsx: Исходные две колонки на листе "3 столбца". Я их чуток сократил (до 822-1852 лет) и получил таблицу на листе "Основа". Совпадения вывожу на лист 822-1852. Здесь можно сделать и со сдвижкой на любое число лет. Суммирую итог отдельно на нижней строке. Сумму транспонирую и поочередно вывожу либо на лист СВОДНАЯ, либо (если со сдвигом в год) на лист СВОДНАЯ2
- "Суммирую итог отдельно на нижней строке" значит, что за все годы!
число совпадений со сдвигом[править]
подходы[править]
it4history[править]
алгоритм находится здесьEventtypesByYears.cs
результат для сдвига в 1 год : $, a, b, c, a, 0, 1, 0, b, 1, 1, 1, c, 0, 0, 0, результат для сдвига в 2 года: $, a, b, c, a, 1, 0, 1, b, 1, 0, 1, c, 0, 0, 0,
Любкин Сергей[править]
History_02.xlsx
Адольф Берг[править]
curiousmole[править]
Andrew Po[править]
некоторый файл https://chispa1707.livejournal.com/3011074.html?thread=35237122#t35237122
2[править]
процент совпадений. Например, если индекс столбца всего встречается 100 раз, а с выбранным индексом строки он встретился 14 раз, то частота совпадений именно с этим индексом - 14 %.
3[править]
индексы, на деле, составят несколько групп с высоким процентом совпадений внутри группы и с малым процентом совпадений с индексами из других групп. Число этих групп отразит число разных этапов развития цивилизации.