Зачастую при создании скриптов которые в последствии будут запускаться по расписанию нам необходимо определить некий отчётный период. Как правило, таким периодом может быть прошлая неделя, прошлый месяц, либо какое-то количество прошлых дней. Пакет timeperiodsR предоставляет вам набор функций которые автоматически будут вычислять такой период от заданной даты. Все функции пакета возвращают период в виде объекта класса tpr. В этой виньетке мы подробно разберём все функции пакета timeperiodsR
, а также компоненты и методы класса tpr.
Помимо данной виньетки к пакету timeperiodsR
есть видео инструкция, ознакомится с которой можно по этой ссылке.
Как я уже писал выше, основная цель timeperiodsR
упростить процесс определения относительного периода. Если у вас есть скрипт который запускается по рассписанию, и собирает данные за прошлый месяц, то вы можете получить прошлый месяц следующим образом:
library(timeperiodsR)
#>
#> ---------------------
#> Welcome to timeperiodsR version 0.6.2
#>
#> Author: Alexey Seleznev (Head of analytics dept at Netpeak).
#> Telegram channel: https://t.me/R4marketing
#> Email: selesnow@gmail.com
#> Blog: https://alexeyseleznev.wordpress.com
#> Packages: https://selesnow.github.io
#> Facebook: https://facebook.com/selesnown
#> Linkedin: https://www.linkedin.com/in/selesnow
#> YouTube Channel: https://www.youtube.com/channel/UCyHC6R3mCCP8bhD9tPbjnzQ/?sub_confirmation=1
#> YouTube Playlist: https://www.youtube.com/playlist?list=PLD2LDq8edf4qed2KVKfXmKdh0OQcdj9gw
#>
#> Vignettes:
#> vignette('tpr_intro', package = 'timeperiodsR')
#> Type ?timeperiodsR for the main documentation.
#> The github page is: https://github.com/selesnow/timeperiodsR/
#>
#> Suggestions and bug-reports can be submitted at: https://github.com/selesnow/timeperiodsR/issues
#> Or contact: <selesnow@gmail.com>
#>
#> To suppress this message use: suppressPackageStartupMessages(library(timeperiodsR))
#> ---------------------
# получаем прошлый месяц
period <- previous_month()
# получаем начальную и конечную дату прошлого месяца
start <- period$start # первый день прошлого месяца
end <- period$end # последний день прошлого месяца
Код определения временно периода с помощью timeperiodsR
компактен и легко читаем, таким же бразом вы можете определять и любые другие периоды, о чём вы более подробно узнаете из данной статьи.
Текущая версия пакета состоит из 24 функций, по названию каждой из функций можно определить какой временной интервал она возвращает. Название состоит из префикса last
/ previous
/ this
/ next
и временной единицы day
/ week
/ month
/ quarter
/ year
. Нижнее подчёркивание _
является разделителем слов в названиях функций.
last_n_days()
last_n_weeks()
last_n_months()
last_n_quarters()
last_n_years()
previous_week()
previous_month()
previous_quarter()
previous_year()
this_week()
this_month()
this_quarter()
this_year()
next_week()
next_month()
next_quarter()
next_year()
next_n_days()
next_n_weeks()
next_n_months()
next_n_quarters()
next_n_years()
custom_period()
as_timeperiod()
check_dayoffs()
Любая из функций пакета возвращает объект класса tpr
состоящий из следующих компонентов:
Обязательные компоненты
Дополнительные компоненты
Начиная с версии timeperiodsR 0.5.0
в пакет была интегрирована поддержка API производственного календаря isDayOff. Этот API позволяет получить официальные праздничные дни в следующих странах: Россия, Украина, Казахстан и Белоруссия.
Для активации дополнительных компонентов вам необходимо установить пакет httr
.
По умолчанию дополнительные компоненты приведённые выше выключены, т.к. они нужны не всем пользователям пакета, а пакет с использованием API работает значительно медленнее.
Для расширения класса tpr
дополнительными компонентами вы можете воспользоваться опциями или переменными среды.
FALSE
;Пример установки опций:
Опции удобны для работы, но их необходимо задавать при каждом новом сеансе работы с R, если все указанные в опциях параметры в большинстве случаев у вас статичны, то лучше задать их на уровне операционной системы.
О том как создавать переменные среды можно узнать из этого видео.
Задайте следующие переменные среды для того, что бы не указывать опции в каждом сеансе:
После того как вы установите значения для переменных среды пакет автоматически будет считывать их при подключении.
В функциях пакета timeperiodsR присутствуют следующие аргументы:
Пакет timeperiodsR
имеет несколько методов, позволяющих вам извлекать некоторые элементы объектов класса tpr.
seq
- получить последовательность дат из объекта класса tpr;length
- получить длительность объекта класса tpr в днях;start
- получить первую дату из объекта класса tpr;end
- получить последнюю дату из объекта класса tpr;first_workday
- получить первый рабочий день из объекта класса tpr;last_workday
- получить последний рабочий день из объекта класса tpr;first_weekend
- получить первый выходной день из объекта класса tpr;last_weekend
- получить последний выходной из объекта класса tpr;workdays
- получить последовательность рабочих дней из объекта класса tpr;weekends
- получить последовательность выходных из объекта класса tpr;workdays_length
- получить из объекта класса tpr;weekends_length
- получить из объекта класса tpr;print
- вывести в консоль информацию о периоде содержащемся в объекте класса tpr.Функции блока last_n_*()
позволяют вам получить прошлый период с заданным количеством временных единиц.
Вместо *
подставьте один из нужных вам временных интервалов: days, weeks, months, quarters, years
Например, допустим, что сегодня 26 сентября 2019 года и вам необходимо получить 2 прошлые недели то используйте функцию last_n_weeks()
:
Код захватит даты с 9 по 22 сентября включительно.
После чего у вас появится объект last2weeks класса tpr
. Из него вы легко можете получить начальную или конечную дату периода, а так же всю последовательность дат которая вошла в этот период, или количество дней вошедших в период.
# начальная дата
last2weeks$start
#> [1] "2020-03-16"
## или
start(last2weeks)
#> [1] "2020-03-16"
# конечная дата
last2weeks$end
#> [1] "2020-03-29"
## или
end(last2weeks)
#> [1] "2020-03-29"
# первый рабочий день
last2weeks$first_workday
#> [1] "2020-03-16"
## или
first_workday(last2weeks)
#> [1] "2020-03-16"
# последний рабочий день
last2weeks$last_workday
#> [1] "2020-03-27"
## или
last_workday(last2weeks)
#> [1] "2020-03-27"
# первый выходной день
last2weeks$first_weekend
#> [1] "2020-03-21"
## или
first_weekend(last2weeks)
#> [1] "2020-03-21"
# последний выходной день
last2weeks$last_weekend
#> [1] "2020-03-29"
## или
last_weekend(last2weeks)
#> [1] "2020-03-29"
# последовательность дат
last2weeks$sequence
#> [1] "2020-03-16" "2020-03-17" "2020-03-18" "2020-03-19" "2020-03-20"
#> [6] "2020-03-21" "2020-03-22" "2020-03-23" "2020-03-24" "2020-03-25"
#> [11] "2020-03-26" "2020-03-27" "2020-03-28" "2020-03-29"
## или
seq(last2weeks)
#> [1] "2020-03-16" "2020-03-17" "2020-03-18" "2020-03-19" "2020-03-20"
#> [6] "2020-03-21" "2020-03-22" "2020-03-23" "2020-03-24" "2020-03-25"
#> [11] "2020-03-26" "2020-03-27" "2020-03-28" "2020-03-29"
# последовательность будних дней
last2weeks$workdays
#> [1] "2020-03-16" "2020-03-17" "2020-03-18" "2020-03-19" "2020-03-20"
#> [6] "2020-03-23" "2020-03-24" "2020-03-25" "2020-03-26" "2020-03-27"
## или
workdays(last2weeks)
#> [1] "2020-03-16" "2020-03-17" "2020-03-18" "2020-03-19" "2020-03-20"
#> [6] "2020-03-23" "2020-03-24" "2020-03-25" "2020-03-26" "2020-03-27"
# последовательность выходных дней
last2weeks$weekends
#> [1] "2020-03-21" "2020-03-22" "2020-03-28" "2020-03-29"
# или
weekends(last2weeks)
#> [1] "2020-03-21" "2020-03-22" "2020-03-28" "2020-03-29"
# количество дней вошедших в период
last2weeks$length
#> [1] 14
## или
length(last2weeks)
#> [1] 14
# количество будних дней в периоде
last2weeks$workdays_length
#> [1] 10
## или
workdays_length(last2weeks)
#> [1] 10
# количество выходных дней в периоде
last2weeks$weekends_length
#> [1] 4
## или
weekends_length(last2weeks)
#> [1] 4
Во всех функциях предназначенных для работы с неделями т.е. last_n_weeks()
, previous_week()
, this_week()
, next_week()
, next_n_weeks()
присутствует аргумент week_start, с его помощью можно указать день недели который будет являться её началом. По умолчанию неделя начинается с понедельника, т.е. week_start = 1
, но вы можете задать и любой другой день:
Т.е. если вы хотите получить 2 предыдущие недели отталкиваясь от 26 сентября, и при этом необходимо считать началом недели воскресенье то используйте следующий код:
Функции блока previous_*()
позволяют вам получить прошлый период со смещением на заданное количеством временных единиц. Т.е. например получить позапрошлую неделю.
Вместо *
подставьте один из нужных вам временных интервалов: week, month, quarter, year
Допустим нам необходимо получить позапрошлую неделю отталкиваясь от 26 сентября 2019 года, началом недели должен быть понедельник
Функции блока this_*()
позволяют вам получить текущий период.
Вместо *
подставьте один из нужных вам временных интервалов: week, month, quarter, year
Если вам необходимо получить первую и последнюю дату текущего месяца, и всю последовательность дат которые в него входят, то используйте следующий код:
Т.е. если сегодня 26 сентября 2019 года функция this_month()
захватит весь сентябрь 2019 года.
Функции блока next_*()
противоположный функциям блока previous_*()
. Т.е. позволяют вам получить будущий период со смещением на заданное количеством временных единиц. Т.е. например получить следующую неделю от 12 сентября.
Вместо *
подставьте один из нужных вам временных интервалов: week, month, quarter, year
Блок next_n_*
позволяет создать период обратный от того, что создают функции блока last_n_*
, т.е. получить будущий период с заданным количеством временных единиц.
Вместо *
подставьте один из нужных вам временных интервалов: days, weeks, months, quarters, years
Например если вам необходимо получить 5 следующих дней воспользуйтесь следующим кодом.
Данная функция позволяет создавать объект класса tpr с любым произвольным периодом.
В timeperiodsR
есть несколько операторов.
Из представленного описания возможно сложно понять зачем эти операторы нужны, и как именно они работают. Поэтому рассмотрим несколько примеров.
Сначала создадим два объекта tpr класса, относительно 7 ноября 2019 года. Один будет соответствовать текущему месяцу, а второй предыдущей неделе.
period1 <- this_month("2019-11-07")
period2 <- previous_week("2019-11-07")
print(period1)
#>
#> Time period: 2019-11-01 (пятница) - 2019-11-30 (суббота)
print(period2)
#>
#> Time period: 2019-10-28 (понедельник) - 2019-11-03 (воскресенье)
В таком случае первый период содержит даты с 1 по 30 ноября, а второй с 28 октября по 3 ноября. Т.е. частично эти два периода пересекаются и мы можем фильтровать один из используя значения другого.
period1 %left_in% period2 # получить даты из period1 которые входят в period2
#> [1] "2019-11-01" "2019-11-02" "2019-11-03"
period1 %left_out% period2 # получить даты из period1 которые не входят в period2
#> [1] "2019-11-04" "2019-11-05" "2019-11-06" "2019-11-07" "2019-11-08"
#> [6] "2019-11-09" "2019-11-10" "2019-11-11" "2019-11-12" "2019-11-13"
#> [11] "2019-11-14" "2019-11-15" "2019-11-16" "2019-11-17" "2019-11-18"
#> [16] "2019-11-19" "2019-11-20" "2019-11-21" "2019-11-22" "2019-11-23"
#> [21] "2019-11-24" "2019-11-25" "2019-11-26" "2019-11-27" "2019-11-28"
#> [26] "2019-11-29" "2019-11-30"
period1 %right_in% period2 # получить даты из period2 которые входят в period1
#> [1] "2019-11-01" "2019-11-02" "2019-11-03"
period1 %right_out% period2 # получить даты из period2 которые не входят в period2
#> [1] "2019-10-28" "2019-10-29" "2019-10-30" "2019-10-31"
Такие операторы фильтрации удобно использовать например при проверке наличия данных в базе за какой-то период, в тех случаях когда вы наполняете базу данными из внешних источников на ежедневной основе.
К примеру вы каждый день запрашиваете данные из API Google Analytics, и записываете их в базу. При этом API периодически может давать сбой, и за какой-то день в вашей базе будут отсутствовать данные, тогда вы можете определить проверочный период, например предыдущие 30 дней, с помощью команды last_n_days(n = 30)
. Далее запрашивать данные за этот из вашей СУБД. После, с помощью приведённых выше операторов фильтрации убрать из общего 30 дневного периода даты которые присутствуют в базе, и по оставшимся датам подгрузить данные.
Вы можете преобразоватьвектор из дат, или строковый вектор состоящий из дат в формате YYYY-MM-DD в объект класса tpr с помощью функции as_timeperiod()
.
dates <- c("2019-09-11", "2019-09-02", "2019-10-11", "2019-08-30")
dates_tpr <- as_timeperiod(dates)
dates_tpr
#>
#> Time period: 2019-08-30 (пятница) - 2019-10-11 (пятница)
В приведённом выше примере конвертации строкового вектора в объект класса tpr, исходный вектор содержит 4 даты, они идут в произвольном порядке, и в целом между ними много пропущенных дней, т.е. данный вектор не является непрерывной последовательностью дат. В таком случае функция as_timeperiod()
находит в исходном векторе минимальную и максимальную дату, и создаёт объект класса tpr равный временному интервалу между этими двумя датами.
Иногда помимо официальных выходных дней вам может понадобиться выделить собственные дополнительные выходные дни, например ваш отпуск. Пакет timeperiodsR
даёт вам такую возможность с помощью опции или переменной среды.
В опцию timeperiodsR.custom_day_offs
вы можете передать вектор с датами которые будут помечены как дополнительные выходные дни, такие дни в компоненте dayoffs_marks будут помечены значением 3.
Также вы можете задать переменную среды TPR_CUSTOM_DAY_OFFS
, в которой укажите даты в формате ГГГГ-ММ-ДД разделённые запятыми или точками с запятой.
Таким образом вы можете помечать дополнительные выходные дни.
options("timeperiodsR.custom_day_offs" = c("2020-01-14", "2020-01-15", "2020-01-16", "2020-01-17", "2020-02-12"))
tm <- this_month("2020-01-01")
# получить ваши пользовательские выходные которые входят в текущий период
tm$custom_day_offs
#> [1] "2020-01-14" "2020-01-15" "2020-01-16" "2020-01-17"
# пользовательские выходные будут помечены 3
tm$dayoffs_marks
#> 2020-01-01 2020-01-02 2020-01-03 2020-01-04 2020-01-05 2020-01-06 2020-01-07
#> "1" "0" "0" "1" "1" "1" "1"
#> 2020-01-08 2020-01-09 2020-01-10 2020-01-11 2020-01-12 2020-01-13 2020-01-14
#> "0" "0" "0" "0" "1" "0" "3"
#> 2020-01-15 2020-01-16 2020-01-17 2020-01-18 2020-01-19 2020-01-20 2020-01-21
#> "3" "3" "3" "1" "1" "0" "0"
#> 2020-01-22 2020-01-23 2020-01-24 2020-01-25 2020-01-26 2020-01-27 2020-01-28
#> "0" "0" "0" "1" "1" "0" "0"
#> 2020-01-29 2020-01-30 2020-01-31
#> "0" "0" "0"