Skip to content

IRebri/yandex2020-academy-task

 
 

Repository files navigation

Build Status

Описание задания

Интернет-магазин подарков хочет запустить акцию в разных регионах. Чтобы стратегия продаж была эффективной, необходимо произвести анализ рынка.

У магазина есть поставщик, регулярно присылающий выгрузки данных с информацией о жителях. Проанализировав их, можно выявить спрос на подарки в разных городах у жителей разных возрастных групп по месяцам.

Ваша задача - разработать на python REST API сервис, который сохраняет переданные ему наборы данных (выгрузки от поставщика) c жителями, позволяет их просматривать, редактировать информацию об отдельных жителях, а также производить анализ возрастов жителей по городам и анализировать спрос на подарки в разных месяцах для указанного набора данных.

Должна быть реализована возможность загрузить несколько независимых наборов данных с разными идентификаторами, независимо друг от друга изменять и анализировать их.

Сервис необходимо развернуть на предоставленной виртуальной машине на 0.0.0.0:8080.

Реализованные обработчики REST API

1: POST /imports

Принимает на вход набор с данными о жителях в формате json и сохраняет его с уникальным идентификатором import_id .

В наборе данных для каждого жителя должны присутствовать все поля, значения не могут быть null , порядок полей не важен:

Поле Тип Значение
citizen_id1 целое число Уникальный идентификатор жителя, неотрицательное число
town строка Название города. Непустая строка, содержащая хотя бы 1 букву или цифру.
street строка Название улицы. Непустая строка, содержащая хотя бы 1 букву или цифру.
building строка Номер дома, корпус и строение. Непустая строка, содержащая хотя бы 1 букву или цифру.
apartment целое число Номер квартиры, неотрицательное число.
name строка Непустая строка.
birth_date2 строка Дата рождения в формате ДД.ММ.ГГГГ (UTC)
gender строка Значение male, female
relatives3 список из целых чисел Ближайшие родственники, уникальные значения существующих citizen_id жителей из этой же выгрузки.

В случае, если в наборе есть неописанные поля - следует считать такой запрос некорректным и возвращать ошибку 400: Bad Request.

(1) Поставщик предупредил, что в разных выгрузках citizen_id не уникален и может повторяться у разных жителей, не закладывайтесь на то, что citizen_id будут уникальны между выгрузками от поставщика.

(2) помимо проверки на формат ДД.ММ.ГГГГ - дата должна быть существующей ( 31.02.2019 - не является валидной датой). Проверить, что дата является валидной можно с помощью datetime.date .

(3) Родственные связи двусторонние (если у жителя #1 в родственниках указан житель #2, то и у жителя #2 должен быть родственник #1). Родственные связи relatives актуальны только в рамках одной выгрузки.

POST /imports
{
	"citizens": [
		{
			"citizen_id": 1,
			"town": "Москва",
			"street": "Льва Толстого",
			"building": "16к7стр5",
			"apartment": 7,
			"name": "Иванов Иван Иванович",
			"birth_date": " 26.12.1986",
			"gender": "male",
			"relatives": [2] // id родственников
		},
		{
			"citizen_id": 2,
			"town": "Москва",
			"street": "Льва Толстого",
			"building": "16к7стр5",
			"apartment": 7,
			"name": "Иванов Сергей Иванович",
			"birth_date": "17.04.1997",
			"gender": "male",
			"relatives": [1] // id родственников
		},
		{
			"citizen_id": 3,
			"town": "Керчь",
			"street": "Иосифа Бродского"
			"building": "2",
			"apartment": 11,
			"name": "Романова Мария Леонидовна",
			"birth_date": "23.11.1986",
			"gender": "female",
			"relatives": []
		},
		...
	]
}

В случае успеха возвращается ответ с HTTP статусом 201 Created и идентификатором импорта:

HTTP 201
{
	"data": {
		"import_id": 1
	}
}

2: PATCH /imports/$import_id/citizens/$citizen_id

Изменяет информацию о жителе в указанном наборе данных.

На вход подается JSON в котором можно указать любые данные о жителе ( name , gender , birth_date (UTC), relatives , town , street , building , apartment ), кроме citizen_id .

В запросе должно быть указано хотя бы одно поле, значения не могут быть null .

Если в запросе указано поле relatives - изменение родственных связей должно быть двусторонним.

Например, есть два брата - Ивановы Иван ( citizen_id=1 ) и Сергей ( citizen_id=2 ). Мария Леонидовна ( citizen_id=3 ) вышла замуж за Ивана, стала ему ближайшей родственницей и переехала в Москву:

PATCH /imports/1/citizens/3
{
	"name": "Иванова Мария Леонидовна",
	"town": "Москва",
	"street": "Льва Толстого",
	"building": "16к7стр5",
	"apartment": 7,
	"relatives": [1]
}

В результате этого запроса данные о жителях должны прийти в следующее состояние:

  • Житель 1: relatives = [2, 3] (житель #2 брат, житель #3 супруга)
  • Житель 2: relatives = [1] (житель #1 брат)
  • Житель 3: relatives = [1] (житель #1 супруг)

Возвращается актуальная информация об указанном жителе:

HTTP 200
{
	"data": {
		"citizen_id": 3,
		"town": "Москва",
		"street": "Льва Толстого",
		"building": "16к7стр5",
		"apartment": 7,
		"name": "Иванова Мария Леонидовна",
		"birth_date": "23.11.1986",
		"gender": "female",
		"relatives": [1]
	}
}

Если девушка разведется с супругом, необходимо будет выполнить следующий запрос:

PATCH /imports/1/citizens/3
{
    "relatives": []
}

В результате этого запроса данные о жителях должны прийти в следующее состояние:

  • Житель 1: relatives = [2] (житель #2 брат)
  • Житель 2: relatives = [1] (житель #1 брат)
  • Житель 3: relatives = []

И вернется актуальная информация об указанном жителе:

HTTP 200
{
    "data": {
        "citizen_id": 3,
        "town": "Москва",
        "street": "Льва Толстого",
        "building": "16к7стр5",
        "apartment": 7,
        "name": "Иванова Мария Леонидовна",
        "birth_date": "23.11.1986",
        "gender": "female",
        "relatives": []
    }
}

3: GET /imports/$import_id/citizens

Возвращает список всех жителей для указанного набора данных.

HTTP 200
{
	"data": [
		{
			"citizen_id": 1,
			"town": "Москва",
			"street": "Льва Толстого",
			"building": "16к7стр5",
			"apartment": 7,
			"name": "Иванов Иван Иванович",
			"birth_date": " 26.12.1986",
			"gender": "male",
			"relatives": [2,3] // id родственников
		},
		{
			"citizen_id": 2,
			"town": "Москва",
			"street": "Льва Толстого",
			"building": "16к7стр5",
			"apartment": 7,
			"name": "Иванов Сергей Иванович",
			"birth_date": "17.04.1997",
			"gender": "male",
			"relatives": [1] // id родственников
		},
		{
			"citizen_id": 3,
			"town": "Москва",
			"street": "Льва Толстого",
			"building": "16к7стр5",
			"apartment": 7,
			"name": "Иванова Мария Леонидовна",
			"birth_date": "23.11.1986",
			"gender": "female",
			"relatives": [1]
		},
		...
	]
}

4: GET /imports/$import_id/citizens/birthdays

Возвращает жителей и количество подарков, которые они будут покупать своим ближайшим родственникам (1-го порядка), сгруппированных по месяцам из указанного набора данных.

Ключом должен быть месяц (нумерация должна начинаться с единицы, "1" - январь, "2" - февраль и т.п.).

Если в импорте в каком-либо месяце нет ни одного жителя с днями рождения ближайших родственников, значением такого ключа должен быть пустой список.

HTTP 200
{
	"data": {
		"1": [],
		"2": [],
		"3": [],
		"4": [{
			"citizen_id": 1,
			"presents": 1,
		}],
		"5": [],
		"6": [],
		"7": [],
		"8": [],
		"9": [],
		"10": [],
		"11": [{
			"citizen_id": 1,
			"presents": 1
		}],
		"12": [
			{
				"citizen_id": 2,
				"presents": 1
			},
			{
				"citizen_id": 3,
				"presents": 1
			}
		]
	}
}

5: GET /imports/$import_id/towns/stat/percentile/age

Возвращает статистику по городам для указанного набора данных в разрезе возраста (полных лет) жителей: p50, p75, p99, где число - это значение перцентиля.

Расчеты необходимо производить используя текущую дату (UTC). Значения перцентилей необходимо округлять до 2х знаков после запятой.

HTTP 200
{
	"data": [
		{
			"town": "Москва",
			"p50": 20,
			"p75": 45,
			"p99": 100
		},
		{
			"town": "Санкт-Петербург",
			"p50": 17,
			"p75": 35,
			"p99": 80
		}
	]
}

Что означает:

  • "p50": 20, - 50% жителей меньше 20 лет
  • "p75": 45, - 75% жителей меньше 45 лет

Инструкции

Запуск приложения

1: Docker Compose

Находясь в папке с файлом docker-compose.yml выполнить в терминале:

docker-compose build
docker-compose up

2: Вручную

Перед запуском приложения необходимо убедится в наличии запущенного инстанса MongoDB в режиме Replica Set

Следующие команды выполняются в терминале, находясь в корневой папке приложения

2.1: Установить зависимости для python:
pip install -r requirements.txt
2.2: Установить переменные окружения:
export DATABASE_URI=mongodb://localhost
export DATABASE_PORT=27017
export DATABASE_NAME=db
export REPLICA_SET=rs0
  • В DATABASE_NAME устанавливается имя базы данных внутри Mongo, в которую будут записываться данные.
  • В REPLICA_SET устанавливается имя replica set, которое было прописано в конфигурационном файла Mongo или в аргументах запуска mongod
2.3: Запуск приложения
python index.py

или

gunicorn -w 4 -b 0.0.0.0:8080 index:app
  • -w 4 - отвечает за количество дочерних процессов с приложением, которые запустит gunicorn.
  • -b 0.0.0.0:8080 - отвечает за адрес и порт, на котором будет работать приложение

Запуск тестов

Следующие команды выполняются в терминале, находясь в корневой папке приложения

1: Установить зависимости для python:
pip install -r requirements.txt
2: Запуск тестов
python -m unittest discover -s tests/ -p '*_tests.py'

About

Задание для школы бэкэнд-разработки Yandex

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Python 99.9%
  • Dockerfile 0.1%