EventsIndexing: различия между версиями
(→it4history) |
(→1) |
||
Строка 1: | Строка 1: | ||
[[Category:Task]] | [[Category:Task]] | ||
= 1 = | = 1 = | ||
− | + | [https://chispa1707.livejournal.com/3013430.html [[#число совпадений]] - функция от общего числа (белая линия) регионо-событий. Это крайне важно, поскольку хоронит ВСЕ мои предыдущие методы. То есть, именно на них тратить силы бессмысленно: результата не дадут] | |
+ | == число совпадений == | ||
[https://chispa1707.livejournal.com/3011074.html?thread=35234818#t35234818 в строках слева годы, в столбцах наверху индексы, на пересечении - числовое значение. Очищаю до единицы, - важен сам факт, что в этом году индекс есть. После этого годы не нужны. Имеет значение только то, какие индексы встречаются в одной строке. Строк много, и в итоге я подвел сумму, какой индекс с какими индексами сколько раз встретился в одной строке] за все годы! | [https://chispa1707.livejournal.com/3011074.html?thread=35234818#t35234818 в строках слева годы, в столбцах наверху индексы, на пересечении - числовое значение. Очищаю до единицы, - важен сам факт, что в этом году индекс есть. После этого годы не нужны. Имеет значение только то, какие индексы встречаются в одной строке. Строк много, и в итоге я подвел сумму, какой индекс с какими индексами сколько раз встретился в одной строке] за все годы! | ||
− | |||
* [https://chispa1707.livejournal.com/3011074.html https://my-files.ru/qwyi0r Данные позже 1852 года можно и удалить... установить число совпадений разных индексов год в год. Позже можно опробовать и со сдвижкой в 1-5 лет... пять вариантов: индексы типа события в разных сочетаниях с индексами места. "Штаты" - территории учтены до уровня штатов (областей), там, где они указаны. "Регионы" - территории укрупнены до регионов типа "Западная Сибирь", это тоже имеет свой смысл... рабочий файл здесь: https://my-files.ru/em9hqo] | * [https://chispa1707.livejournal.com/3011074.html https://my-files.ru/qwyi0r Данные позже 1852 года можно и удалить... установить число совпадений разных индексов год в год. Позже можно опробовать и со сдвижкой в 1-5 лет... пять вариантов: индексы типа события в разных сочетаниях с индексами места. "Штаты" - территории учтены до уровня штатов (областей), там, где они указаны. "Регионы" - территории укрупнены до регионов типа "Западная Сибирь", это тоже имеет свой смысл... рабочий файл здесь: https://my-files.ru/em9hqo] | ||
Строка 9: | Строка 9: | ||
*: "Суммирую итог отдельно на нижней строке" значит, что за все годы! | *: "Суммирую итог отдельно на нижней строке" значит, что за все годы! | ||
− | + | == число совпадений со сдвигом == | |
[https://chispa1707.livejournal.com/3010636.html есть у меня в Экселе табличка: 1-й столбец - год 2-й столбец - двухбуквенный индекс места события 3-й столбец - двухбуквенный индекс типа события ... Первая задача. Требуется выяснить, например, как часто разные события встречаются в одном и том же году году... на пересечении в ячейке - цифра, говорящая, сколько раз индекс столбца встретился в одном году с индексом строки... для тех же 879 индексов сверяем совпадения со сдвигом в год, два, три, четыре и пять. ] | [https://chispa1707.livejournal.com/3010636.html есть у меня в Экселе табличка: 1-й столбец - год 2-й столбец - двухбуквенный индекс места события 3-й столбец - двухбуквенный индекс типа события ... Первая задача. Требуется выяснить, например, как часто разные события встречаются в одном и том же году году... на пересечении в ячейке - цифра, говорящая, сколько раз индекс столбца встретился в одном году с индексом строки... для тех же 879 индексов сверяем совпадения со сдвигом в год, два, три, четыре и пять. ] | ||
− | + | == альтернативы == | |
− | == [[Любкин Сергей]] == | + | === [[Любкин Сергей]] === |
[https://chispa1707.livejournal.com/3010636.html?thread=35242316#t35242316 отчёт, выводящий для каждой пары индексов: - количество годов, в которых они встречаются оба (как у Вас в первом варианте); - количество событий в этих годах, в которых есть индекс строки; - количество событий в этих годах, в которых есть индекс столбца.] | [https://chispa1707.livejournal.com/3010636.html?thread=35242316#t35242316 отчёт, выводящий для каждой пары индексов: - количество годов, в которых они встречаются оба (как у Вас в первом варианте); - количество событий в этих годах, в которых есть индекс строки; - количество событий в этих годах, в которых есть индекс столбца.] | ||
History_02.xlsx | History_02.xlsx | ||
− | + | === [https://plus.google.com/101874328397827004168 Адольф Берг] === | |
− | == [https://plus.google.com/101874328397827004168 Адольф Берг] == | ||
[https://plus.google.com/101874328397827004168 Вы вручную решаете задачи кластерного анализа. А современные методы обработки данных, включая вейвлет-анализ, нечеткие логики и т.п. позволят по-новому оценить массив данных. ] | [https://plus.google.com/101874328397827004168 Вы вручную решаете задачи кластерного анализа. А современные методы обработки данных, включая вейвлет-анализ, нечеткие логики и т.п. позволят по-новому оценить массив данных. ] | ||
== [[curiousmole]] == | == [[curiousmole]] == | ||
Строка 23: | Строка 22: | ||
[https://chispa1707.livejournal.com/3011397.html?thread=35248197#t35248197 Это называется граф. В принципе, строится и в экселе (не пробовал)... вообще, пишут, что задача кластеризации очень субъективна.] | [https://chispa1707.livejournal.com/3011397.html?thread=35248197#t35248197 Это называется граф. В принципе, строится и в экселе (не пробовал)... вообще, пишут, что задача кластеризации очень субъективна.] | ||
− | + | === Andrew Po === | |
− | == Andrew Po == | ||
некоторый файл https://chispa1707.livejournal.com/3011074.html?thread=35237122#t35237122 | некоторый файл https://chispa1707.livejournal.com/3011074.html?thread=35237122#t35237122 | ||
− | + | === [[it4history]] === | |
− | == [[it4history]] == | ||
[https://chispa1707.livejournal.com/3011074.html?thread=35245058#t35245058 алгоритм находится здесь] {{github|it4history/reconstruction/tree/master/Excel/EventsIndexing/EventtypesByYears.cs}} | [https://chispa1707.livejournal.com/3011074.html?thread=35245058#t35245058 алгоритм находится здесь] {{github|it4history/reconstruction/tree/master/Excel/EventsIndexing/EventtypesByYears.cs}} | ||
Версия 11:28, 20 октября 2018
Содержание
1[править]
#число совпадений - функция от общего числа (белая линия) регионо-событий. Это крайне важно, поскольку хоронит ВСЕ мои предыдущие методы. То есть, именно на них тратить силы бессмысленно: результата не дадут
число совпадений[править]
- https://my-files.ru/qwyi0r Данные позже 1852 года можно и удалить... установить число совпадений разных индексов год в год. Позже можно опробовать и со сдвижкой в 1-5 лет... пять вариантов: индексы типа события в разных сочетаниях с индексами места. "Штаты" - территории учтены до уровня штатов (областей), там, где они указаны. "Регионы" - территории укрупнены до регионов типа "Западная Сибирь", это тоже имеет свой смысл... рабочий файл здесь: https://my-files.ru/em9hqo
- 00 крайняя попытка 2 (Автосохраненный).xlsx: Исходные две колонки на листе "3 столбца". Я их чуток сократил (до 822-1852 лет) и получил таблицу на листе "Основа". Совпадения вывожу на лист 822-1852. Здесь можно сделать и со сдвижкой на любое число лет. Суммирую итог отдельно на нижней строке. Сумму транспонирую и поочередно вывожу либо на лист СВОДНАЯ, либо (если со сдвигом в год) на лист СВОДНАЯ2
- "Суммирую итог отдельно на нижней строке" значит, что за все годы!
число совпадений со сдвигом[править]
альтернативы[править]
Любкин Сергей[править]
History_02.xlsx
Адольф Берг[править]
curiousmole[править]
Andrew Po[править]
некоторый файл https://chispa1707.livejournal.com/3011074.html?thread=35237122#t35237122
it4history[править]
алгоритм находится здесьEventtypesByYears.cs
результат для сдвига в 1 год : $, a, b, c, a, 0, 1, 0, b, 1, 1, 1, c, 0, 0, 0, результат для сдвига в 2 года: $, a, b, c, a, 1, 0, 1, b, 1, 0, 1, c, 0, 0, 0,
2[править]
процент совпадений. Например, если индекс столбца всего встречается 100 раз, а с выбранным индексом строки он встретился 14 раз, то частота совпадений именно с этим индексом - 14 %.
3[править]
индексы, на деле, составят несколько групп с высоким процентом совпадений внутри группы и с малым процентом совпадений с индексами из других групп. Число этих групп отразит число разных этапов развития цивилизации.