Skip to content

Muscot/music-server

Repository files navigation

Hur vi uppnår ett restAPi som klarar av hög belastning.

(ett litet projekt på 3-4 dagar)

#Cache

  • Share promises: Vi skapar en promise för att hämta data från databasen och de olika loaders (musicbrainz, coverart, wikipedia etc). Denna promise kan delas mellan request:en, vilket gör att om samma MBID efterfrågas så behöver endast ett request ske till musicbrainz och det andra loaders. Detta gör också att vi hjälper databasen att klara av hög belastning.

  • LRU Cache: Vi skapar en LRU cache för det mest 1500 använda request:en vilket gör att vi får väldigt snabb responstid.

  • Serialized json: Vi skickar och cache:ar redan serialiserade json. Vilket gör att webservern endast behöver skicka strängar, detta gör att vi får väldigt hög prestanda från webservern, och vi inte överbelastar CPU med serialisering.

  • Swagger validation: Vi använder oss av swagger vilket kan validera alla request och response, detta kan konfigureras och slås av eller på beroende på belastning.

Hur vi hanterar Rate limit ifrån externa API:er

  • Throttle: För varje loader så har vi möjlighet att konfigurera hur många request per second som får skickas, resten köas upp med en timeout.

  • Retry: För varje loader så har vi möjlighet att konfigurera hur många gånger som den skall försöka hämta resultatet. Efter varje försök så ökar vi tiden den väntar innan nästa försöka. Detta gör att våra svarstider från vårt RestAPI kan vara långa om vi överstiger våran rate limit. Men endast för nya MBID, de andra finns sparade i databasen.

Example URLS

  • /artists
  • /artists/5eecaf18-02ec-47af-a4f2-7831db373419
  • /artists/ff6e677f-91dd-4986-a174-8db0474b1799
  • /artists/7249b899-8db8-43e7-9e6e-22f1e736024e
  • /artists/5b11f4ce-a62d-471e-81fc-a69a8278c7da
  • /artists/e1f1e33e-2e4c-4d43-b91b-7064068d3283

Installation

#Installera node.js music-server


git clone https://github.com/Muscot/music-server.git music-server
cd music-server
npm install
npm run build

#Installera mysql docker

  • Välj ett root lösenord och byt ut xxx nedan. Vi lägger sen till en www användare i databasen.
  • Vi använder mysql 5.7 som har native stöd för att lagra JSON.
docker run --restart=always --name db-container -e MYSQL_ROOT_PASSWORD=xxx -p 3306:3306 -d mysql/mysql-server:latest

  • Kör sql script nedan, finns även sparat under /database/script.sql
  • Byt gärna ut www lösenord, och konfigurera sen music-server med lösenordet (se Konfiguration nedan)
  • Byt gärna ut 'www'@'%' mot ditt docker ip nummer tex. 'www'@'192.168.10.190' I production skall endast ip nummer från webservern vara tillåten att koppla upp sig mot databasen.
CREATE DATABASE IF NOT EXISTS music;
USE music;
DROP TABLE IF EXISTS `artist`;

CREATE TABLE `artist` (
  `artist_id` int(11) unsigned NOT NULL AUTO_INCREMENT,
  `mbid` char(36) NOT NULL,
  `json` json NOT NULL,
  `created_by` int(11) unsigned DEFAULT NULL,
  `created_at` datetime(6) NOT NULL,
  `updated_by` int(11) DEFAULT NULL,
  `updated_at` datetime(6) DEFAULT NULL,
  PRIMARY KEY (`artist_id`),
  UNIQUE KEY `mbid` (`mbid`)
) ENGINE=InnoDB AUTO_INCREMENT=1 DEFAULT CHARSET=utf8;


CREATE USER 'www'@'%' IDENTIFIED BY 'ADS547TYDFGHER7652LKHS';
GRANT ALL PRIVILEGES ON music . * TO 'www'@'%';
FLUSH PRIVILEGES;

Bygg docker image för music-server (optional)

Det finns en Dockerfile så man kan bygga en node.js docker image. Du behöver ange vilket ip-nummer som du kör mysql på.

docker build -t music-server:latest .
docker run --name app-container -e MYSQL_HOST=172.17.0.1 -p 10010:10010 -d music-server:latest

Kör music-server utan docker

För att starta servern behöver du bara använda dig av npm start.

npm start

Kör npm test för music-server

Under tiden jag kodade har jag skrivet ett par unit test, det är idag inte heltäckande.

npm test

Debug output

Det finns ett antal debug utskrifter som man kan slå på med DEBUG enviroment variable.

  DEBUG=web,database,musicbrainz,coverart,wikipedia npm start

  database SELECT json FROM artist WHERE mbid = "ff6e677f-91dd-4986-a174-8db0474b1799" +60s
  musicbrainz ff6e677f-91dd-4986-a174-8db0474b1799 Start request +10ms
  musicbrainz ff6e677f-91dd-4986-a174-8db0474b1799 Wait and retry (503) +715ms
  musicbrainz ff6e677f-91dd-4986-a174-8db0474b1799 Start request +286ms
  musicbrainz ff6e677f-91dd-4986-a174-8db0474b1799 Got response (Jack Johnson) +3s
  wikipedia Jack_Johnson_(musician) Start request +3ms
  wikipedia Jack_Johnson_(musician) Got response (pageid=494720) +746ms
  coverart 610c34ea-3464-3140-89ae-77188861ab6c Start request +1ms
  coverart 6ace3a24-cb5a-35e8-be3f-0ac577250c92 Start request +55ms
  coverart 98609b6d-a203-3c9a-802f-e0599c4b34b9 Start request +52ms
  coverart 2d941027-7181-47d2-8bef-f2145ddd3b01 Start request +55ms
  coverart 76d2dff8-04c1-38bf-b365-a236e46c39bb Start request +54ms
  coverart 0c09814f-9db3-3f93-90cf-a8845b785c9e Start request +56ms
  coverart 52e83e7f-da6b-309d-a65c-c8cd18deefad Start request +67ms
  coverart 67e93809-bc82-336a-8e9c-a3ca357b9437 Start request +55ms
  coverart e12724f9-779f-3866-938c-392aff583ff6 Start request +51ms
  coverart df1bcf92-b690-38ab-bbc5-487a7dc2b688 Start request +56ms
  coverart a9b88cc0-5ee4-3c28-9b51-2333a8200200 Start request +55ms
  coverart 98609b6d-a203-3c9a-802f-e0599c4b34b9 No image exist (2003-06-13: Bonnaroo Music Festival, Manchester, TN, USA) +45ms
  coverart 610c34ea-3464-3140-89ae-77188861ab6c No image exist (2002-06-22: Bonnaroo Music Festival, Manchester, TN, USA) +1ms
  coverart bcb7cfa5-9908-3816-b640-65e30f129e6b Start request +19ms
  coverart 76d2dff8-04c1-38bf-b365-a236e46c39bb No image exist (Acoustic Mix) +44ms

WebSocket - maintenance page.

Jag använder mig av WebSocket för att skicka upp status information från servern, minne, cpu etc. skickar även upp DEBUG meddelanden om DEBUG enviroment variabel är satt.

I denna första version så lägger jag till meddelanden på swagger-ui sidan (http://95.85.40.103:10010/). Tanken är att det sen skall bli en separat maintenance/admin sida, med inloggning.

Konfiguration

Det finns en konfiguration fil sparad config/index.js där inställningar för databas och loaders finns. på TODO listan finns att skapa en separat konfigurations fil för development och en för production.

export var cache = 
{
    maxSize: 1500 // Number of artists to cache.
};

export var database = 
{
    connectionLimit: 15,
    host: process.env['MYSQL_HOST'] || '192.168.99.100',
    user: 'www',
    password: 'ADS547TYDFGHER7652LKHS',
    database: 'music',
    debug: false,
    dateStrings: true
};

export var musicbrainz = {
        restApi: 'http://musicbrainz.org/ws/2',
        userAgent : 'python-musicbrainz/0.7.3',
        requestsPerSecond: 10, // Up to 10 requests per second
        backOff: 2, // backoff factor if it fails and make a retry, increase the wait time.
        timeOut: 5 * 60 * 1000, // 5 minutes timeout, include alla retries and wait between request.
        maxTries: 10 // try 10 times to retrieve the request if it fails. Increase the time with backoff factor.
    };

export var coverart = {
        restApi: 'http://coverartarchive.org',
        userAgent : 'python-musicbrainz/0.7.3',
        requestsPerSecond: 20, 
        backoff: 2,
        timeout: 5 * 60 * 1000, 
        numberOfTries: 10 
    };

export var wikipedia = {
        restApi: 'https://en.wikipedia.org/w/api.php',
        userAgent : 'Amivono/0.0.1 ( martin@amivono.com )',
        requestsPerSecond: 50, 
        backoff: 2,
        timeout: 5 * 60 * 1000, 
        numberOfTries: 10
    };

Swagger UI

Jag la till swagger ui på rooten för att testa RestAPI:et.

Benchmark

Jag kör 2 docker container på en väldigt liten server, så båda delar på 512MB minne, vilket inte räcker för en större databas, men vi kan ändå se att prestandan ligger runt 1000 request per second.

  • 512MB Memory
  • 1 CoreProcessor
  • 20GB Disk
  • 1TB Transfer
root@docker-music-server:~# ab -k -n100000 -c150 http://95.85.40.103:10010/artists/5b11f4ce-a62d-471e-81fc-a69a8278c7da
This is ApacheBench, Version 2.3 <$Revision: 1528965 $>
Copyright 1996 Adam Twiss, Zeus Technology Ltd, http://www.zeustech.net/
Licensed to The Apache Software Foundation, http://www.apache.org/

Benchmarking 95.85.40.103 (be patient)
Completed 10000 requests
Completed 20000 requests
Completed 30000 requests
Completed 40000 requests
Completed 50000 requests
Completed 60000 requests
Completed 70000 requests
Completed 80000 requests
Completed 90000 requests
Completed 100000 requests
Finished 100000 requests


Server Software:        
Server Hostname:        95.85.40.103
Server Port:            10010

Document Path:          /artists/5b11f4ce-a62d-471e-81fc-a69a8278c7da
Document Length:        9325 bytes

Concurrency Level:      150
Time taken for tests:   96.424 seconds
Complete requests:      100000
Failed requests:        0
Keep-Alive requests:    100000
Total transferred:      956800000 bytes
HTML transferred:       932500000 bytes
Requests per second:    1037.09 [#/sec] (mean)
Time per request:       144.635 [ms] (mean)
Time per request:       0.964 [ms] (mean, across all concurrent requests)
Transfer rate:          9690.32 [Kbytes/sec] received

Connection Times (ms)
              min  mean[+/-sd] median   max
Connect:        0    0   1.1      0      43
Processing:    29  144  49.1    119     324
Waiting:       29  144  49.1    119     323
Total:         73  144  49.1    119     324

Percentage of the requests served within a certain time (ms)
  50%    119
  66%    138
  75%    172
  80%    200
  90%    227
  95%    239
  98%    263
  99%    278
 100%    324 (longest request)

TODO/NOTES

V1.0

  • Skriv mer information om swagger project/swagger ui
  • Lägg upp musicserver på dockerhub.
  • Skapa "Not Implementated message" på PATCH och POST
  • Lägg till benchmark i package.json. (npm run bench1)
  • Lägg till en version i url:en tex. http://musicserver.se/v1/artists
  • Hantera "database down" bättre.
    • bättre felmeddelande till klienten.
  • Change all the require() to es6 import.
  • Döp om artist controller till artists.

V2.0

  • Gör en admin/maintenance sida som man kan övervaka hur servern mår och vad det gör för tillfället.

  • Bryt ut LRU Cache från Artists controller. Så kan flera controllers använda sig av den, och socket/collectStat kan se hur stor cachen är.

  • Lägg till POST, PATCH requesten.

  • Bättre readme och installations guide.

  • Definiera upp “sources” i swagger.

  • Använd query parameters i sql-frågorna.

  • Skapa en album tabell i databasen.

  • Bättre deployment

    • En ide är att använda webpack på serversidan så det skapas en bundle.js.

V3.0 - ideer.

  • Alternativt använda en processmanger (StrongLoop).
  • Kunna konfigurera vilka loaders som skall användas.
  • Kanske använda TypeScript och skapa interface för loaders.
  • Flytta delar av artist controller (shared promise, cache) som express middleware.
  • Gör så du kan söka på musicbrainz och plocka ut vilka MBID som skall laddas ned.
  • Lägg till en news loader (https://www.google.se/#q=nirvana+(band)&tbm=nws)

DOCKER HELPER

Build the image

docker build -t music-server:latest .

Run the image

docker run --restart=always --name app-container -e MYSQL_HOST=172.17.0.1 -e "DEBUG_COLORS=true" -e DEBUG="web,musicbrainz,coverart,wikipedia" -p 10010:10010 -d music-server:latest

Run the mysql docker image

docker run --restart=always --name db-container -e MYSQL_ROOT_PASSWORD=xxx -p 3306:3306 -d mysql/mysql-server:latest

Publish docker image

docker save music-server:latest | bzip2 | pv | ssh root@95.85.40.103 'bunzip2 | docker load'

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published