Utilisation de Grafana chez Wikipedia

Mesure de latence de l'api :

https://grafana.wikimedia.org/dashb...

logins, mot de passe, abuse :

https://grafana.wikimedia.org/dashb...

les stats de mediawiki :

https://grafana.wikimedia.org/dashb...

ssl, spdy, version TLS

https://grafana.wikimedia.org/dashb...

des stats elk.. complexes !

https://grafana.wikimedia.org/dashb...

Utilisation d'etherpad :

https://grafana.wikimedia.org/dashb...

des stats kafka :

https://grafana.wikimedia.org/dashb...

Encore plus précises : https://grafana.wikimedia.org/dashb...

Performance des utilisateurs :

https://grafana.wikimedia.org/dashb...

Varnish

wow !

https://grafana.wikimedia.org/dashb... Une manière intéressant de voir les erreurs varnish :

https://grafana.wikimedia.org/dashb...

Sans doute le plus joli graph :

https://grafana.wikimedia.org/dashb...

Remonter le temps avec l'IGN, quelques exemples

Saint Julien Montdenis, zone babylone :

1.jpg

Superposition :

compare.jpg

Villargondran / Le Bochet

Un ouvrage disparu, un petit tunnel ?

2.jpg

Une chapelle qui n'est plus référencée

chapelle.jpg

Saint Julien de Maurienne, Montdenis :

montdenis.jpg

Saint Jean de Maurienne

Voie ferrée ?

stjean.jpg

Avant les Karellis :

karellis.jpg

Quand la Maurienne n'était pas en France.. :)

maurienne.jpg

Tunnel du Fréjus historique

frejus.jpg

Sur la nouvelle carte IGN, seul le tunnel actuel

frejus1.jpg

Chenalisation du Torrent de Saint Julien de Maurienne

Voici un document intéressant, avec deux photos du RTM :

http://www.regione.piemonte.it/dife...

Le cône de déjection en 1898 avant.jpg

Le cône de déjection en 1911 apres.jpg

Zoomons un peu sur les détails :

Cheminée de ventilation du tunnel de la Voie Ferrée :

tunnel.jpg Voici la cheminée de nos jours

cheminee.jpg

tunnel-sncf-sous-voie-ferree3.jpg

Un article d'époque sur les travaux qui ont permis de dévier le torrent :

tunnel-sncf-sous-voie-ferree1.jpg

tunnel-sncf-sous-voie-ferree2.jpg

Pour en savoir plus sur les torrents du coin, je vous invite à écouter la conférence :

Le Claret, mémoire de paysages :

http://maurienne.tv/index.php?pages...

Concert Fils & TOV à Saint Julien Montdenis - 9 Avril 2016

Grosse news !!! :D

Posté par Fils & Tov sur samedi 26 mars 2016

Quelques notes et recherches sur haproxy et les reverse proxy

Utilisation de backends dynamiques :

Selon la version de l'api dans les headers :

of/etc/haproxy/api.map
  1. X-API value | HAProxy backend
v1.0 be_alpha
v1.1 be_bravo

Un backend différent est choisi

https://www.tekovic.com/dynamic-hap...

Mise à jour de haproxy avec ansible :

Zero downtime upgrade with Ansible and HAProxy

Fabio :

Une alternative à HAproxy : https://github.com/eBay/fabio par Ebay

C'est du go

Récupération des logs haproxy dans ELK :

http://logz.io/blog/monitor-haproxy...

  • on peut aussi le faire avec filebeat si fichier de log haproxy.log
HAproxy: mapping process to CPU core for maximum performance

http://blog.onefellow.com/post/8247...

On peut partager le boulot,dans l'exemple :

  • 3 coeurs font du HTTPS
  • 1 coeur faire du HTTP
Tuning de kernel pour haproxy

http://blog.snapt.net/2012/02/28/si...

Exemple de configuration de la vraie vie : Stackoverflow :

https://gist.github.com/GABeech/eb8...

Le loadbalancer sauce google : Maglev :

https://cloudplatform.googleblog.co...

Sa force, c'est qu'il est multi-serveurs, via ECMP

Nginx supporte le proxy UDP ? !

https://www.nginx.com/blog/announci... via https://twitter.com/jbfavre

Quelques notes sur airbnb

https://github.com/joliva/startup-e...

Quelques stats : airbnb.jpg

La stack (date non déterminée)

airbnb1.jpg

http://cdn.oreillystatic.com/en/ass...

Dashboards & metrics :

  • latence base de données
  • latence ruby
  • Memcache

etc..

Leur approche : airbnb2.jpg

Les logs sont envoyés dans elk airbnb3.jpg

Mesure des métriques applicatives, exemple calendar :

airbnb4.jpg

postmortem

  • pour chaque prob
  • stats
  • documentation

Infrastructure données :

https://medium.com/airbnb-engineeri...

Utilisation de :

pour causer avec Mysql http://www.lemondeinformatique.fr/a...

Langage similaire à SQL https://fr.wikipedia.org/wiki/Apach...

"langage de requête compatible ANSI SQL."

http://www.developpez.com/actu/6393...

Pour administrer toutes ces instances Amazon, utilisation de l'orchestrateur : mesos http://mesos.apache.org/

Détection automatisée des fraudes : https://medium.com/airbnb-engineeri...

Airflow : L'outil de gestion de projet d'airbnb :

https://medium.com/airbnb-engineeri...

Le guide de code Ruby : http://airbnb.io/projects/ruby/

En vrac :

Kafka quelques stats : http://fr.slideshare.net/alexismido...

kafka.jpg

Technos utilisées en 2015 airbnb6.jpg

infra en 2013 ! https://aws.amazon.com/fr/solutions...

Quelques slides Elasticsearch

Et si on regardait quelques slides de la conf ElasticSearch

Conf ici : https://www.elastic.co/elasticon/co...

Slides :

  • Elasticsearch 5
  • Lucene 6
  • Choix des couleurs dans les dashboards
  • Url customisables
  • possibilité d'exporter toute la conf kibana
  • Kibana status page : est-ce que tout est bien connecté à elk ?
  • Possible aussi via l'API status

Plugins Kibana

  • Ecrit en go
  • léger
  • Pas de dépendances

Plusieurs modules :

  • Collecte de logs
  • Collecte de paquets (une sortie de sflow)
  • Collecte de metrics (façon collectd)

Packetbeat :

  • Copy le trafic au niveau "hardware"
  • Passif
  • Aucun impact de latence
  • Ne peut pas impacter les applis

Usages possibles :

  • Sécurité : détection d'intrusions
  • Debug réseau
  • Debug d'applications
  • Analyse de performances

installer packetbeat

wget https://download.elastic.co/beats/packetbeat/packetbeat_1.1.2_amd64.deb
dpkg -i packetbeat_1.1.2_amd64.deb
vi /etc/packetbeat/packetbeat.yml

RTFM : http://elasticsearch.qiniudn.com/gu...

Exemple de la vraie vie :

exemple.jpg

Tout une communauté : nagioscheckbeat

https://github.com/PhaedrusTheGreek...
  • Faire fonctionner des plugins nagios et envoyer tout ça dans elk

FactBeat https://github.com/jarpy/factbeat

  • Récupère des Facts (Puppet) et envoie ça dans elk

Redisbeat

https://github.com/chrsblck/redisbe...

  • Monitoring de redis

Pingbeat

https://github.com/joshuar/pingbeat

  • le tueur de smokeping ?
  • Auto-complétion grâce à lucene

Nouveautés dans logstash :

  • reload rapide de la config (pas 2 minutes)
  • monitoring de la santé de logstatsh
  • configuration centralisée
  • A venir : cluster, haute dispo..etc..

J'ai pas fini de tout regarder.. wow !

L'éco-système elasticsearch semble vraiment vaste

Quelques notes sur StackOverflow 2016 & update Dotnet

update dotnet

http://www.ageofascent.com/asp-net-...

  • 1.15 Million represents a 2300% gain from ASP.NET 4.6!
  • Bear in mind ASP.NET Core beta8 was already 800% faster than ASP.NET 4.6,
stackoverflow 2016

https://nickcraver.com/blog/2016/02...

  • performance is still a feature.
  • redondance à tous les étages
  • Tous les serveurs raccordés via 2 x 10 gb/s
  • Tous les serveurs avec deux alims séparées et deux sources séparées
  • Tous les services sont doublés dans un second datacenter
  • haproxy 1.5
  • haproxy 1.7 soon avec http2 pour avoir http/2
  • 64 Go de ram pour mieux gérer les sessions TLS

Client Redis Dotnet :

Voir : https://github.com/StackExchange/St...

metrics

Collecte de metrics dans http://opentsdb.net/ photo : http://imgur.com/a/X1HoY#7

http://bosun.org/quickstart

hardware

Serveur de logs haproxy pour debug rapide :

un cluster ELK

http://imgur.com/a/X1HoY#192

Quelques lectures de slides

Uber :

Vous avez dit uberisation de l'économie ?

Va falloir monter une stack.. un peu complexe avant !

https://qconlondon.com/system/files...

  • Spark
  • ELK
  • Redis cluster
  • etc.... !

Quand on voit ces outils et la manière de les utiliser on comprends qu'ils peuvent aussi valoriser cette data.. et pas qu'en faisant taxi.

Tendances :

slides

sensdelhistoire.jpg

Evolutions :

Slides

delivry.jpg

Monitoring de Conteneurs

slides

  • avec sysdig
  • csysdig : tiens une interface ncurses !

Voir en vidéo

apt-get install sysdig :)

Sysdig logstash ?

https://gist.github.com/jordansisse...

Voir la conf logstash : https://gist.github.com/jordansisse...

Pas mal !

Unikernels

slides

  • Plutôt que d'avoir un noyau complexe qui fait plein de choses
  • Plusieurs millions de lignes de code

Lisez : http://wiki.xenproject.org/wiki/Uni...

Modèle broken :

Slides

model-broken.jpg

+1 model-broken1.jpg

Concepts intéressants :

model-broken2.jpg

model-broken3.jpg

WIX.com

Slides

wix.jpg

Y a 5 ans : wix1.jpg

La Maurienne : 600 Jours de soleil par an !

Quelques notes sur Grafana

Note un peu en vrac :)

un peu d'histoire
  • le projet a 3 ans
  • inspiré de kibana



Comment ça s'installe ?
  • Simple package debian
  • KISS
  • pas de dépendances
On peut brancher Grafana à quoi ?
  • Graphite
  • ELK
  • InfluxDB
  • OpenTSDB
Sécurité

Accès par mot de passe

admin/admin par défaut
Dashboard

Partage de dashboard :

  • Possible de partager via un lien
  • snapshot possible
  • date d'expiration
Fonctionnalités :

Annotations :

grafana2.jpg

http://play.grafana-zabbix.org/dash...

Pour par exemple dire :

  • A cette heure là : mise à jour
  • A cette heure là : crash etc..

Affichage du SLA

grafana1.jpg

http://play.grafana-zabbix.org/dash...

Graphs avec des points :

http://play.grafana-zabbix.org/dashboard/db/max-data-points

Nginx

grafana3.jpg

http://play.grafana-zabbix.org/dash...

Affichage négatif

grafana.jpg

http://play.grafana-zabbix.org/dashboard/db/scale

Grafana et le mode réel

avec par exemple une sonde :

http://www.yoctopuce.com/FR/article...

Démo

Quelques démos en live :

  • http://play.grafana.org/
  • http://play.grafana-zabbix.org/
Lectures
Lectures Bonus

Le monitoring d'un système de fichiers (LUSTRE)

Monitoring de Mysql :

Sur R-PI :

Ca semble aussi pouvoir s'installer :

Haproxy

Pensez à utiliser haproxy pour ne plus voir le port :)

Elasticsearch notes & un peu de influxdb

Tests ? avec Wikipedia

https://www.elastic.co/blog/loading...

  • récupérer les dumps elk de wikipedia pour faire des tests

Update Logstash https://www.elastic.co/blog/logstas...

winlogbeat https://www.elastic.co/blog/beats-1...

  • Tiens on peut collecter des données d'un windows :
  • de quoi capturer des évenements du journal d'event
  • C'est assez limité..

Donc bof .. Alors que chez InfluxDB, c'est Telegraf qui sait bien faire la chose :

https://github.com/influxdata/teleg...

Ah ben y a un installeur windows : https://new.influxdb.com/blog/2015/...

InfluxDB quelques notes

Regardons de plus près :

https://influxdata.com/blog/announc...

Petit test de l'ensemble :

  • une machine avec collectd pour envoyer des données
  • une machine avec influxdb
wget https://s3.amazonaws.com/influxdb/influxdb_0.10.0-1_amd64.deb
md5sum influxdb_0.10.0-1_amd64.deb 
e57dbd393a815d06669225bea8ea15e9  influxdb_0.10.0-1_amd64.deb

dpkg -i influxdb_0.10.0-1_amd64.deb

maintenant, config du input collectd lire la doc : https://github.com/influxdata/influ...

Ajouter la conf collectd :
/etc/collectd/collectd.conf
<Plugin network>
 Server "192.168.0.111" "25826" 
</Plugin>


Côté serveur InfluxDB : est-ce que les données de collectd arrivent ?

tcpdump -n port 25826
systemctl restart influxdb

regarder le log.. moi j'avais une erreur sur ce fichier manquant :

/usr/share/collectd/types.db

Je l'ai récupéré sur la machine collectd

scp machine:/usr/share/collectd/types.db /tmp/

et je l'ai posé dans :

/usr/share/collectd/types.db
systemctl restart influxdb

regarder le log.. :)

Pour visualiser :

wget https://s3.amazonaws.com/get.influxdb.org/chronograf/chronograf_0.10.0-rc2_amd64.deb
dpkg -i chronograf_0.10.0-rc2_amd64.deb
service chronograf start

Quel port ?

netstat -anp|grep chrono

port 10000 :)

  • http://localhost:10000/settings/servers

Faites votre premier graph :

  • la doc : https://docs.influxdata.com/chronograf/v0.10/introduction/getting_started/

On peut aussi utiliser "telegraf"

 wget http://get.influxdb.org/telegraf/telegraf_0.10.2-1_amd64.deb
 dpkg -i telegraf_0.10.2-1_amd64.deb 
 service telegraf restart

qui est une sorte de "topbeat" pour pousser des metrics d'une machine, vers le influxdb moins lourd et plus 2016 que collectd ! :)

et c'est Fast !

2016/02/04 23:07:30 Gathered metrics, (10s interval), from 6 inputs in 33.362582ms 
2016/02/04 23:07:30 Wrote 30 metrics to output influxdb in 13.452599ms
2016/02/04 23:07:40 Gathered metrics, (10s interval), from 6 inputs in 31.800374ms
2016/02/04 23:07:40 Wrote 30 metrics to output influxdb in 15.026637ms

tester telegraf

telegraf -config /etc/telegraf/telegraf.conf -test

une masse d'input :

https://github.com/influxdata/telegraf/blob/master/README.md

intéressant aussi :

https://influxdata.com/blog/getting-started-with-sending-statsd-metrics-to-telegraf-influxdb/

Voir les bases influxdb

influx
show databases
A lire aussi :

- page 2 de 266 -