|
【クラウドインフラの設計・構築・運用改善】 ・AWS / Google Cloud / Cloudflare を中心としたクラウドインフラの構築・運用 ・Terraform / AWS CDK などのIaCを用いたインフラ管理 ・ECS、Aurora Serverless v2、Cognito、Cloudflare Workersなどを活用した基盤運用 ・サービス成長に応じたスケーラビリティ、可用性、パフォーマンスの改善 ・属人的な運用を減らすための自動化、標準化、ドキュメント化 【監視・可観測性の設計と信頼性向上】 ・メトリクス、ログ、アラートの設計・運用 ・SLO / SLIの設計、運用改善 ・障害検知、一次切り分け、原因調査、再発防止策の設計 ・開発チームと連携したインシデント対応フローの整備 ・ユーザー影響や事業影響を踏まえた優先度判断と改善推進 【障害対応・運用改善のリード】 ・本番環境で発生した障害の一次切り分け、復旧対応、恒久対応の推進 ・ ポストモーテムの実施、再発防止策の仕組み化 ・運用負荷の高い業務の棚卸し、自動化、改善 ・リリースや変更作業におけるリスク管理、手順整備 ・開発・CS・テクニカルサポートと連携した問い合わせ調査、技術的な原因分析 【データ基盤・コスト・セキュリティ領域の改善】 ・BigQuery / ClickHouse / dbt などのデータ基盤運用・改善 ・RDS、動画変換、ストレージ、CDNなどのコスト最適化 ・Cloudflare Workers / R2 / CDN などの運用改善 ・アカウント権限管理、アクセス制御、セキュリティ運用の整備 ・ISMS等を見据えたインフラ・権限・運用ルールの仕組み化
【クラウドインフラの設計・構築・運用改善】 ・AWS / Google Cloud / Cloudflare を中心としたクラウドインフラの構築・運用 ・Terraform / AWS CDK などのIaCを用いたインフラ管理 ・ECS、Aurora Serverless v2、Cognito、Cloudflare Workersなどを活用した基盤運用 ・サービス成長に応じたスケーラビリティ、可用性、パフォーマンスの改善 ・属人的な運用を減らすための自動化、標準化、ドキュメント化
【監視・可観測性の設計と信頼性向上】 ・メトリクス、ログ、アラートの設計・運用 ・SLO / SLIの設計、運用改善 ・障害検知、一次切り分け、原因調査、再発防止策の設計 ・開発チームと連携したインシデント対応フローの整備 ・ユーザー影響や事業影響を踏まえた優先度判断と改善推進
【障害対応・運用改善のリード】 ・本番環境で発生した障害の一次切り分け、復旧対応、恒久対応の推進 ・ポストモーテムの実施、再発防止策の仕組み化 ・運用負荷の高い業務の棚卸し、自動化、改善 ・リリースや変更作業におけるリスク管理、手順整備 ・開発・CS・テクニカルサポートと連携した問い合わせ調査、技術的な原因分析
【データ基盤・コスト・セキュリティ領域の改善】 ・BigQuery / ClickHouse / dbt などのデータ基盤運用・改善 ・RDS、動画変換、ストレージ、CDNなどのコスト最適化 ・Cloudflare Workers / R2 / CDN などの運用改善 ・アカウント権限管理、アクセス制御、セキュリティ運用の整備 ・ISMS等を見据えたインフラ・権限・運用ルールの仕組み化
変更の範囲:有
会社の定める業務
|