#jddug で Datadog をタグごとに権限制御したい → ついにできるようになった、という話をしました!
Data Access Control で実現するより細かい権限制御 speakerdeck.com/fohte/data-access-contro...
#jddug
#jddug で話した資料です!
Datadog Network Monitoring を活用して NAT Gateway 課金を 80 % 削減した話 - Speaker Deck
speakerdeck.com/fohte/datadog-network-mo...
今日話したスライドです! エラーレートとレイテンシーを監視したいけどどうする? => Trace Metrics と Istio Metrics でできたという話をしました speakerdeck.com/fohte/trace-metrics-to-i... #jddug
#JDDUG Meetup 007
開催ちぅ。
また申しこみそこねてた。。しょんぼり。
あかりをつけましょ。。。。。ぼんぼり。
datadog-jp.connpass.com/event/343144/
#jddug 来た! 今回からオンライン配信あったりワイプカメラ用意されていたりでリッチになっていてすごい
#JDDUG Meetup 006
datadog-jp.connpass.com/event/334594/
online視聴 申しこみそこねた。。ぐふっ。(昨晩〆切)
#JDDUG Meetup 005
LT その4は
兒玉さんによる
AWS Summit Japanの #Datadog ブースに立ち寄って得られたAPM活用
ひとまずSLOを策定したが、、、顧客満足度につながる?
AWS SummitでDatadogの方に尋ねてみた
APMで
- N+1問題要因をみつけだす
Domain単位/URL単位のGroup By
- resource_nameによるQuery Group By
- MetricsをDashboardにExport
などなど知見が!
顧客満足度に強い相関のあるMetricsを確認
->より有用なSLOを再策定!
#JDDUG Meetup 005
LT その3は
Matsutaniさんによる
SLO導入と#Datadog SLO Dashboard
SLOを決めるとService改善につながる!
- さまざまな立場の方の共通言語になる
- Log/Metrics取得(準備も)してDatadogで確認
Product teamにもSLOは有用!
#JDDUG Meetup 005
LT その2は
林さんによる
#Datadog でPHP/Laravelアプリケーションを監視する
PHP ログ収集
docs.datadoghq.com/ja/logs/log_...
PHP プロファイラーの有効化
docs.datadoghq.com/ja/profiler/...
#JDDUG Meetup 005
休憩明け!
LT その1は
bgpatさんによる
Kubernetes で #Datadog を飼うならオートディスカバリー機能を使わないと損
オートディスカバリーによるエンドポイントチェック
docs.datadoghq.com/ja/container...
> Cluster Agent は、Kubernetesサービス上のオートディスカバリーアノテーションに基づいてエンドポイントチェック構成を検出します。その後、Cluster Agentはこれらの構成をノードベースのAgentにディスパッチし、個別に実行させます。
#JDDUG Meetup 005
さんにんめ
大木さんによる
Trace Queriesの活用でfreee会計のDB負荷削減のきっかけとした話
課題
10年以上の開発蓄積でDB負荷発生(N+1)箇所(どのAPIなのか?)がわかりずらい
- Trace Queriesでspan間の依存関係を検索/可視化
Trace Queries ソースデータ
docs.datadoghq.com/ja/tracing/g...
布教
- Trace Queriesのつかいかたを文書化して共有
#Datadog
#JDDUG Meetup 005
おふたりめ
Suganoさんによる
DMMの動画SREにおける#Datadog の活用について
当初課題いろいろ
Google CloudのMetricsに梃子摺った
- Google Cloud Integration取得ズレ
- 構成要素のRedisからのMetrics補完で改善
新規ServiceゆえUX改善必要
- RUM導入/Team内布教
ひとつずつ
Metricsを照りながら
Knowledgeを貯めながら解決
- Notebookを活用
#JDDUG Meetup 005
おひとりめ
mopp さんによる
#Datadog APM による性能改善から始める技術的負債解消
Code - Test - Monitor 開発 Flow
- Datadog 育成は開発Flowに組み込もう!
改善には指標が必要
- 計測する = Datadogする
- 指標としてlatencyを選定
- Dashboard整備でGraphをイイ感じに
- APM Generate MetricsでCustom Metricsを生成
スパンからメトリクスを生成する
docs.datadoghq.com/ja/tracing/t...
#JDDUG Meetup 005
Findyさまによる
Sponser LT 〜
- 会場のご説明
- 事業のご説明
そして
- online event やります!
2024/08/27(火) おひる (12:00 - 13:15)
実践事例から学ぶ!あなたの知らない #Datadog の世界
findy.connpass.com/event/326864/
- IPA (Beerのほう) つくりました!
#JDDUG Meetup 005
Japan #Datadog User Group 運営の鹿野さんによる Opening 〜
JDD-UG Community site つくりました!
jdd-ug.github.io
本日2024/08/07(水)はDatadogのEventふたつ!
ひとつめは #Datadog と #AWS とのonline共催(?)で
DatadogでAWS生成AIスタックを監視する
www.datadoghq.com/ja/event/aws...
17:00-18:00予定
ふたつめはJapan Datadog User Group( #JDDUG )のHybrid開催で
Japan Datadog User Group Meetup#5
datadog-jp.connpass.com/event/324770/
19:00-21:00予定
たぶんまだ申込できます〜
#JDDUG Meetup 004
LT そのなな
kichun さん
AWS構成図のパワポ運用はもうやめたい件について
AWS公式Simple iconはPPT・・・
そこで
Cloudcraft つかってみた!
AWS accountと関連づけて
(つかっていないものも含めて)全resourceh表示できた!
構成図から範囲指定でcost算出できた
閲覧のみ可能なLinkの 取得/共有 もできる
-> 構成更新毎のDocument更新も不要
ただし
変更履歴確認はまだイマイチ
#JDDUG Meetup 004
LT そのろく
sheepland さん
Datadogのグラフにデプロイタイミングを表示する
time_between_deployments metrics + Workflow Automation
-> Workflow Automation で Monitor をtrigger にしたEvent 生成可能!
Eventを注視すればよい!
#JDDUG Meetup 004
LT そのご
shin1988 さん
ログラスでのDatadog活用事例の共有
創業当初から
Monitor, APM, Logsを利用
なによりSaaS運用したかったので
現在
Database Monitoring
Syntehetic Monitoring
RUM [Real-time User Monitoring] も!
RUMは顧客からの挙動問合せ解析に有用!!
- 簡単な状況聴取とUserIDから状況解析につながる
新たなTheme
DatadogをSREテームのみの持ち物にしないこと
Terraform化進行中
#JDDUG Meetup 004
LT そのよん
izzii さん
Dadadog Application Seucurity で二重 WAF 運用のすゝめ
背景
お客さま増加!
公共service参入!
だが攻撃もふえた!!
でも
多重防御で安心!
AWS WAF + Datadog ASM
前段のAWS WAFで明らかな攻撃Trafficを弾く
後段の Datadog ASM でキナ臭いものを抽出し低減化
#JDDUG Meetup 004
LT そのさん
custom query で監視が捗った話
akitok さん
今回の目的
非同期処理におけるPerformance指標の取得
処理遅延やEvent滞留の監視
database側準備
Integration設定やDBM設定が済ならOK!
Datadog 側準備
DB毎のconfファイルをDatadog Agentに設定
-> is_published=falseに着目
留意点
tagを効果的に
select結果 0 lineの取扱い
data取得周期(default: 15 sec)
#JDDUG Meetup 004
LT そのに
miya10kei さん
DatadogでAPI毎のSQL発行数を可視化してn+1を改善した話
推測するな、計測せよ!
OpenTelemetoryで metrics 計測し
ECS の resource 情報を属性追加しつつ
datadog-agent container から転送
API毎の平均SQL発行数から対象特定して
performance改善できました!
#JDDUG Meetup 004
LT そのいち
hosh さん
ログから始めるオブザーバビリティ
Observabilityの観点で3 pillarsをみると
- metrics単体では困難
- Logsは構造化が肝要
- Tracesは複数servicesをまたがる俯瞰的な確認には向いている
所感として
Datadog での Observability 実現はまず Log 主体がよさそう
#JDDUG Meetup 004
さんにんめ kuro さん
DatadogのmonitorをTerraform管理に爆速で移行した話
datadog_monitor
datadog_monitor_json
どちらをつかおう?
-> 前者を選定!
Terraformへの移行を考慮すると・・・
ひたすらimportするのは避けたい
そのために
Terraformerつかうか?
terraform plan -generate-config-outコマンドつかうか?
いずれも修正作業は発生するが、、
-> importブロックをきっちり書いて後者が楽そう!
#JDDUG Meetup 004
おふたりめ fohte さん
Datadog Logs を活用して SLO 監視基盤を構築する
(つづき)
custom metrics の課金には注意!
tag の key/value 毎に個別扱い
適切な粒度にしなければ青天井・・・
Logs から pipeline で構造化
Grok Parser で正規表現 matching
自力実装がかなり大変でした・・・
でも
SLOとてもみやすい!
#JDDUG Meetup 004
おふたりめ fohteさん
Datadog Logsを活用してSLO監視基盤を構築する
いままで
BigQuery + Looker 構成で dashboard を人力 check して 人力判断ゆえすぐに気づけない・・・
これから
Datadog Logs + Datadog SLO で構築しました!
Datadog SLO には 3 つの手法
- Metric-based SLO (今回採用)
- monitor-based SLO
- Time slice SLO
#JDDUG Meetup 004
おひとりめ Datadog の木村さん
コンテナで Datadog APM をはじめよう
基本
container 環境でも Datadog Agent + APM Tracer 両方の実装必要!
ハマりどころ
どちらの環境変数を利用するのか意識を!
それから
採用する Architecture (Docker, containerd or k8s or serverless or Managed container などなど) の特性と制約に応じた Deployment も考慮点!
#JDDUG Meetup 004
Opening
鹿野さん 謹製なんちゃってアンケート
Node-RED + Web App + Datadog Integration での real-time metric 集計可視化!
会場みんなで App 連打!